Δικτυακός τόπος για τις Τεχνολογίες Audio, Video, HiFi, High End, Home Entertainment
Greek site for Audio Video & Home Entertainment technologies
Tελευταία Ενημερωση/Last Update: Τρίτη, 26/07/2005


english abstract

Πρωτοσέλιδο Aρχείο Νέων Αρθρα Τεχνολογία HowTo Δίσκοι Αναφοράς Links Contact About

LOCATION BAR►ΤΕΧΝΟΛΟΓΙΑ►XΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΤΟ MP3 ΚΑΙ ΑΛΛΟΥΣ PERCEPTUAL CODECS...

AV BLOG 

SITE MAP

Συμπιεσμένος Ηχος:
Χρησιμοποιώντας τo ΜP3 και άλλoυς Perceptual Codecs
1. Eισαγωγή: Γιατί θέλουμε να συμπιέσουμε τον ψηφιακό ήχο;
2. Οι πρώτες προσπάθειες: PASC, ATRAC, MPEG-1 Layer II/ΙΙΙ
3. MPEG-1 Layer III (MP3): Οι τεχνικές κωδικοποίησης κατά MP3 και MP3Plus
4. Aλλοι Codecs: MPEG-2 AAC, MPEG-4 AAC, WMA, Ogg Vorbis, FLAC
5. Στην Πράξη: Κωδικοποίηση/Δημιουργία αρχείων ΜP3 (Ripping/Encoding)
6. Στην Πράξη: Aναπαραγωγή αρχείων MP3 (Playback)
7. Links
ΑΠΟ ΤΗΝ ΣΤΙΓΜΗ ΠΟΥ ΕΝΑ ΗΧΗΤΙΚΟ ΣΗΜΑ ψηφιοποιήται, αποτελείται από μία σειρά ψηφιακών δεδομένων που το περιγράφουν πλήρως (ή έτσι ελπίζουμε...)  Τα δεδομένα αυτά μπορούν να αποθηκευθούν σε διάφορα μέσα (CD, σκληρούς δίσκους, μνήμες, κ.λπ), να μεταδωθούν μέσα από ενσύρματες ή ασύρματες γραμμές μετάδοσης (ειδικές συνδέσεις μεταξύ συσκευών, τοπικά δίκτυα Ethernet, το διαδίκτυο) και να υποστούν επεξεργασία.  Σε όλες αυτές τις εφαρμογές (οι οποίες συνιστούν το σημερινό περιβάλλον των πολυμέσων, μέσα στο οποίο ζούμε -τουλάχιστον σε ό,τι αφορά τον ήχο) αυτό που έχει μεγάλη σημασία είναι ο όγκος της πληροφορίας (δηλαδή ο αριθμός των ψηφίων που απαιτείται για να περιγραφεί το σήμα και ο ρυθμός ροής του σήματος που είναι αναγκαίος για κάθε διαδικασία.
Για παράδειγμα, τα σήματα που αποθηκεύονται στα CD, αποτελούνται από δύο κανάλια, κάθε ένα από τα οποία μεταφέρει 44.100 δείγματα το δευτερόλεπτο, με το κάθε δείγμα να απαιτεί 16 ψηφία για την περιγραφή του:
2x44.100x16=1.411.200bits/s, ή, κατά προσέγγιση, 1.41Μbps
Aυτός είναι ο ρυθμός (bitrate) δεδομένων που θα πρέπει να υποστηρίζει κάθε ψηφιακό σύστημα που διαχειρίζεται σήματα κατάλληλα για CD. (την τυπική αυτή προδιαγραφή, την ονομάζουμε "CD Quality" και την συναντάμε αρκετά συχνά.  Δεν πρέπει να συγχέεται με την έννοια "Ποιότητα αναπαραγωγής του CD" η οποία εξαρτάται βεβαίως από πολλούς άλλους παράγοντες. Προσέξτε επίσης ότι η μέτρηση του bitrate γίνεται πάντοτε σε bits και όχι σε bytes! 1byte=8bits). Στην πραγματικότητα, ο ρυθμός δεδομένων είναι πολύ μεγαλύτερος, επειδή μαζί με το σήμα κωδικοποιούνται και άλλες πληροφορίες.
Aν θέλουμε να αποθηκεύσουμε ένα τέτοιο σήμα χρησιμοποιώντας την συμβατική τεχνολογία του προσωπικού υπολογιστή θα χρειαστούμε:
2x44.100x2(bytes)x60(δευτερόλεπτα)=10.584.000bytes/min, ή, κατά προσέγγιση, 10.1MB χώρου για κάθε λεπτό σήματος. 
Ο χώρος, επομένως που απαιτείται για την αποθήκευση ψηφιακών ηχητικών δεδομένων είναι σημαντικός και σίγουρα όχι εύκολο να εξασφαλισθεί στην πράξη, αν μιλούμε για τις ανάγκες μίας μικρής -έστω- δισκοθήκης ακόμη και με την σημερινή χαμηλή τιμή μνήμης και σκληρών δίσκων.
Αλλά και η μεταφορά του σήματος δεν είναι εύκολη: Το μεγαλύτερο μέρος των συνδέσεων του διαδικτύου χρησιμοποιεί ταχύτητες αισθητά χαμηλότερες από 1Mbps και η μεταφορά τέτοιου όγκου δεδομένων απαιτεί μεγάλο χρόνο ή είναι αδύνατη αν απαιτείται streaming, δηλαδή ταυτόχρονη μεταφορά/χρήση.
Μη Απωλεστική - Απωλεστική κωδικοποίηση, Perceptual Codecs
To τεχνικό πρόβλημα του χώρου και της ανεπάρκειας στην ταχύτητα μεταφοράς έρχονται να λύσουν οι τεχνολογίες συμπίεσης του ηχητικού σήματος.  Οι τεχνολογίες αυτές χρησιμοποιούν διάφορες τεχνικές μείωσης του όγκου και της ροής των δεδομένων (bitrate) που απαιτούνται για την κωδικοποίηση των ηχητικών σημάτων και χωρίζονται γενικώς σε δύο κατηγορίες: Τις μη-απωλεστικές (lossless) και τις απωλεστικές (lossy).  Οι μη-απωλεστικές τεχνικές περιλαμβάνουν μεθόδους κωδικοποίησης οι οποίες μειώνουν μεν την ροή δεδομένων αλλά δεν επιτυγχάνουν τον στόχο τους αλλοιώνοντας τα δεδομένα αυτά,.  Αντίθετα, οι απωλεστικές τεχνικές αλλοιώνουν τα δεδομένα, απορρίπτοντας τα μέρη εκείνα τα οποία δεν είναι χρήσιμα -με κάποιο συγκεκριμένο κριτήριο (irrelevancy).  Οι απωλεστικές τεχνικές είναι περισσότερο αποτελεσματικές, επιτυγχάνοντας συμπιέσεις που φθάνουν το 24:1 (μειώνουν, δηλαδή το bitrate sto 1/24, για παράδειγμα τo 1.41Μbps γίνεται 60kbps) με καλή ποιότητα, ενώ οι μη απωλεστικές σπανίως ξεπερνούν το 4:1.
Στην ορολογία του χώρου, το σύνολο των μηχανισμών που λαμβάνουν μέρος στην διαδικασία κωδικοποίησης-αποκωδικοποίησης ενός ψηφιακού σήματος, χρησιμοποιώντας έναν συγκεκριμένο αλγόριθμο (μία καθορισμένη μαθηματική διαδικασία, δηλαδή) ονομάζεται Codec (από την σύντμηση των λέξεων CΟder-DECoder).  Σήμερα έχουμε στην διάθεσή μας μία ενδιαφέρουσα ποικιλία επιτυχημένων απωλεστικών codecs, με περισσότερο γνωστούς αυτούς της οικογένειας MP3 (ΜP3, MP3Plus, MP3 Surround), της οικογένειας AAC (MPEG-2 AAC, MPEG-4 AAC), τον ανοιχτού πηγαίου κώδικα και ελεύθερο δικαιωμάτων (open source/rights free) Οgg Vorbis, τον ιδιωτικό (proprietary) codec της Microsoft (WMA), ενώ συζητείται αρκετά και ο μη-απωλεστικός (και κατ΄εξαίρεσιν αναφερόμενος, εδώ) FLAC. Ολοι αυτοί ο codecs χρησιμοποιούν ως κριτήριο για την συμπίεση του σήματος την λειτουργία του ανθρώπινου συστήματος ακοής.  Βασίζονται δηλαδή σε ένα ψυχοακουστικό μοντέλο αντίληψης των ήχων από τον άνθρωπο που τους επιτρέπει να αποφασίζουν "τί ακούγεται" και "τι δεν ακούγεται". Οι codecs που χρησιμοποιούν αυτή την προσέγγιση ονομάζονται Perceptual Codecs. Το ψυχοακουστικό μοντέλο αναπτύσσεται μεταξύ άλλων και από στατιστικές μετρήσεις οι οποίες οδηγούν στον προσδιορισμό μίας "μέσης συμπεριφοράς ακροατή".  Για τον λόγο αυτό τα μοντέλα αυτά τα  ονομάζουμε και "Υποκειμενικά Μοντέλα Ακοής".

Πρωτοσέλιδο | Αρχείο Νέων | Αρθρα | Τεχνολογία | HowTo | Δίσκοι | Links | Contact | Αbout


©Δημήτρης Σταματάκος/Ακραίες Εκδόσεις 2005
Σχετικά με το avmentor.gr (προβλήματα, παρατηρήσεις κ.λπ): webmaster@avmentor.gr Eπαφή με την σύνταξη (ύλη, σχόλια, ερωτήσεις κ.λπ): contact@avmentor.gr