× Αυτή είναι η προαιρετική κεφαλίδα Φόρουμ για το Κουτί Προτάσεων.

Διαχωρισμός μουσικών πηγών με τεχνικές μηχανικής μάθησης (2022)

Περισσότερα
2 Μήνες 3 Εβδομάδες πριν - 2 Μήνες 3 Εβδομάδες πριν #122 από amd
Περίληψη:

Η ανάκτηση μουσικής πληροφορίας (MIR) στοχεύει στην βελτίωση της λειτουργικότητας της αναζήτησης και περιήγησης του χρήστη σε μουσικές συλλογές. Ένα από τα προβλήματα της MIR, το οποίο χρησιμοποιείται σε ποικίλες εφαρμογές της, είναι ο διαχωρισμός μουσικών πηγών (MSS), ο οποίος δέχεται ως είσοδο ένα σήμα μίξης και εξάγει από αυτό τα επιμέρους σήματα πηγών, όπως της φωνής και της συνοδείας. Σε γενικό πλαίσιο, ακολουθείται μία συνήθης διαδικασία διαχωρισμού, αλλά οι προσεγγίσεις γύρω από αυτήν ποικίλουν. Κάτ’ επέκταση, έχουν προταθεί πολλά διαφορετικά μοντέλα διαχωρισμού μουσικών πηγών, τα αποτελέσματα των οποίων μελετώνται και συγκρίνονται βάσει ορισμένων μεθόδων αξιολόγησης. Τα τελευταία χρόνια, μοντέλα νευρωνικών δικτύων (NNs) έχουν εφαρμοστεί για τον διαχωρισμό μουσικών πηγών, συμπεριλαμβανομένων των πλήρως συνδεδεμένων NNs (FNNs), των συνελικτικών NNs (CNNs) και των αναδρομικών NNs (RNNs) καθώς και παραλλαγές αυτών. Ο λόγος είναι ότι σε αντίθεση με άλλες μεθόδους που χρειάζονται σαφή μοντέλα των πηγών για την επεξεργασία, τα νευρωνικά δίκτυα εφαρμόζουν τεχνικές βελτιστοποίησης για να εκπαιδεύσουν τα μοντέλα, χρησιμοποιώντας σύνολα δεδομένων στα οποία είναι διαθέσιμο τόσο το σήμα μίξης όσο και τα απομονωμένα σήματα πηγών. Πιο συγκεκριμένα, τα συνελικτικά νευρωνικά δίκτυα θεωρούνται από τις επικρατέστερες τεχνικές μηχανικής μάθησης που χρησιμοποιούνται στον τομέα των πολυμέσων. Ωστόσο, οι απαιτήσεις για μεγάλο βάθος στο δίκτυο, δυσκολεύουν την εκπαίδευση τους και οδηγούν σε μείωση της απόδοσης. Για την αντιμετώπιση αυτών των προβλημάτων προτάθηκε το μοντέλο DenseNet, το οποίο είναι βασισμένο στα CNNs. Αυτή η εργασία παρουσιάζει μια σύγκριση μεταξύ δύο σύγχρονων επεκτάσεων του DenseNet όσον αφορά το πρόβλημα του διαχωρισμού φωνητικών και συνοδείας, μελετάει την ποιότητα των αποτελεσμάτων τους με τη βοήθεια μετρικών αξιολόγησης, και οδηγεί σε μια αποτίμηση της συνολικής απόδοσής τους.

Πρόλογος:

Η Ανάκτηση μουσικής πληροφορίας (MIR) έχει γνωρίσει ραγδαία ανάπτυξη τα τελευταία χρόνια, καθώς καθίσταται όλο και πιο επιτακτικό, λόγω της εξέλιξης της τεχνολογίας και του διαδικτύου, να καλυφθεί η ανάγκη ύπαρξης και υλοποίησης ενός ευρέως φάσματος τεχνικών μουσικής ανάλυσης. Το ερευνητικό πεδίο της MIR ασχολείται πρωτίστως με την εξαγωγή σημαντικών χαρακτηριστικών από τη μουσική (από το ηχητικό σήμα) και κατ’ επέκταση με την ανάπτυξη διαφόρων συστημάτων αναζήτησης και ανάκτησης. Η MIR χρησιμοποιείται από μια πληθώρα εφαρμογών, από τις οποίες επωφελείται το κοινό της μουσικής βιομηχανίας, των ακροατών/καταναλωτών μουσικής και των επαγγελματιών, όπως οι καλλιτέχνες, οι δάσκαλοι μουσικής και οι μουσικολόγοι. Η MIR ασχολείται με ένα μεγάλο εύρος προβλημάτων, όπως ο διαχωρισμός μουσικών πηγών, που αποτελεί και το θέμα της παρούσας εργασίας. Στο Κεφάλαιο 1 γίνεται μια εισαγωγή στην ανάκτηση μουσικής πληροφορίας, παρατίθενται ενδεικτικά μερικές εφαρμογές των τομέων που έχουν επωφεληθεί από αυτήν και αναφέρονται τα προβλήματα με τα οποία ασχολείται και δυο κριτήρια διαχωρισμού τους. Τέλος, γίνεται μια πρώτη αναφορά στο πρόβλημα του διαχωρισμού μουσικών πηγών και στον τρόπο με τον οποίο προσεγγίζεται το πρόβλημα αυτό από ένα σύστημα MIR.

Συγγραφέας: Γαλάνη Ειρήνη - Επιβλ. Καθηγητής: Κωνσταντίνος Μπερμπερίδης - Πηγή: nemertes.library.upatras.gr - Αρ. Σελίδων: 74

↳ Αρχείο λήψης: pdf - Μέγεθος: 1,04mb ↵

Παρακαλούμε Σύνδεση ή Δημιουργία λογαριασμού για να συμμετάσχετε στη συζήτηση.

Χρόνος δημιουργίας σελίδας: 0.092 δευτερόλεπτα
Επικοινωνήστε μαζί μας στο (+30) 212.213.2730, ή στο (+30) 210.440.2730 για να σας προσφέρουμε αυτό που θα καλύψει απόλυτα τις ανάγκες σας, αλλά και θα σας συμφέρει πραγματικά
  • τα 5 αστέρια είναι λίγα μπροστά στο streaming από την dos. Άριστη υποστήριξη εντός λίγων μόνο λεπτών, μηδενικό downtime. Συνιστώ ανεπιφύλακτα και απαραιτήτως αν ασχολείστε σοβαρά με το streaming...
  • Η πρώτη μας επαφή με την εταιρία ήταν πριν από 15 χρόνια, τότε που οι διαδικτυακές συνδέσεις ήταν τα «ζώα; μου αργά» Υπεύθυνη εταιρία, που σε κάθε πρόβλημα, οποιαδήποτε στιγμή (24/7), σε βοηθούσε ώστε να ανταπεξέλθεις! Εμείς που είμασταν αρχάριοι τότε στο διαδικτυακό ραδιόφωνο, το Dos.gr ήταν ένα Σχολείο!
  • Επαγγελματίας εδώ και πολλά χρόνια! Συνεχώς εξελίσσεται και προσφέρει νέες υπηρεσίες. Μπράβο!!!
  • Πραγματικά άψογοι, είναι διαθέσιμοι 24/7 ακόμη και σε θέματα που δεν αφορούν αποκλειστικά το streaming, ότι και να χρειάστηκα ήταν εκεί...

↳ Αυτήν τη στιγμή υπάρχουν σε όλο τον ιστότοπό μας 290 επισκέπτες ←