Δικτυακός τόπος για τις Τεχνολογίες Audio, Video, HiFi, High End, Home Entertainment
Greek site for Audio Video & Home Entertainment technologies
Tελευταία Ενημερωση/Last Update: Τρίτη, 26/07/2005


english abstract

Πρωτοσέλιδο Aρχείο Νέων Αρθρα Τεχνολογία HowTo Δίσκοι Αναφοράς Links Contact About

LOCATION BAR►ΤΕΧΝΟΛΟΓΙΑ►XΡΗΣΙΜΟΠΟΙΩΝΤΑΣ ΤΟ MP3 ΚΑΙ ΑΛΛΟΥΣ PERCEPTUAL CODECS...

AV BLOG 

SITE MAP

Συμπιεσμένος Ηχος:
Χρησιμοποιώντας τo ΜP3 και άλλoυς Perceptual Codecs
1. Eισαγωγή: Γιατί θέλουμε να συμπιέσουμε τον ψηφιακό ήχο;
2. Οι πρώτες προσπάθειες: PASC, ATRAC, MPEG-1 Layer II/ΙΙΙ
3. MPEG-1 Layer III (MP3): Οι τεχνικές κωδικοποίησης κατά MP3 και MP3Plus
4. Aλλοι Codecs: MPEG-2 AAC, MPEG-4 AAC, WMA, Ogg Vorbis, FLAC
5. Στην Πράξη: Κωδικοποίηση/Δημιουργία αρχείων ΜP3 (Ripping/Encoding)
6. Στην Πράξη: Aναπαραγωγή αρχείων MP3 (Playback)
7. Links
Με εξαίρεση κάποιες λεπτομέρειες οι οποίες γίνονται σαφείς σε κάθε περίπτωση, όλοι οι Perceptual codecs λειτουργούν ως προς την χρήστη με τον ίδιο τρόπο.  Ετσι, αν και τα όσα πρακτικά αναφέρονται αφορούν τον MP3, τα περισσότεροα ισχύουν και για τον AAC, και για τον Ogg Vorbis.
Οσον αφορά τον MP3, αξίζει να αναφέρουμε κατ' αρχήν το εξής: Παρά τον τεράστιο αριθμό προιόντων που κυκλοφορούν (software players, επιτραπέζια και φορητά players, λογισμικό επεξεργασίας και δημιουργίας αρχείων mp3 κ.λπ) στην πράξη οι πραγματικοί codecs, δηλαδή οι πυρήνες επάνω στους οποίους βασίζονται όλα τα προιόντα είναι λίγοι και συγκεκριμένα τέσσερεις: Οι codecs του Fraunhofer IIS (FastEnc, MP3Enc, L3Enc), ο open source codec LAME (παρά το γεγονός ότι το όνομά του σημαίνει ακριβώς το αντίθετο...! Lame Ain't a Mp3 Encoder) o οποίος βασίζεται στο ψυχοακουστικό μοντέλο GPSYCHO, o BladeEnc του Tord Jansson (ο οποίος έχει σταματήσει επισήμως να διανέμεται επειδή παραβιάζει κάποια δικαιώματα του Fraunhofer -όχι ότι δεν μπορείτε να τον βρείτε πάντως...!) και τέλος ο codec της Xing, o πρώτος που επέτρεψε την κωδικοποίηση ΜP3 με μεταβλητή ροή δεδομένων (VBR).  Η ποιότητα της κωδικοποίησης σχετίζεται άμεσα με τον τρόπο που λειτρουργεί ο codec, οπότε είναι σαφές ότι γίνεται πολλή συζήτηση για το ποιός είναι καλύτερος και μπορείτε να βρείτε ολόκληρα fora γύρω από το θέμα αυτό.  Μία περιήγηση θα δείξει ότι ο LAME χαίρει της εκτίμησης όλων, οι Fraunhofer θεωρούνται καλοί αλλά αργοί (κάτι σαν τα γερμανικά αυτοκίνητα, ας πούμε...) με εξαίρεση τον νεώτερο FastEnc, ο BladeEnc είναι για τους φανατικούς που θα αντέξουν το command line interface του, και ο Xing είναι μάλλον ο ταχύτερος (γι' αυτό και τον προτιμούν πολλά consumer προιόντα).  Το ποιόν θα διαλέξει κανείς είναι, βεβαίως προσωπικό θέμα...
To διάγραμμα βαθμίδων που περιγράφει την διαδικασία Ripping/Encoding
Η δημιουργία ενός αρχείου mp3 (η κατάληξη .mp3 υποδηλώνει αρχείο mp3, προφανώς...) ξεκινά από την διαδικασία ripping.  Το ripping επιτρέπει την δημιουργία ενός αρχείου wav που αποθηκεύεται στον υπολογιστή, από το πρωτογενές υλικό.  Αν το υλικό αυτό είναι αναλογικό (βινύλιο, ταινία ή όποιο άλλο σήμα εμφανίζεται σε εξόδους line κάποιας πηγής) θα πρέπει πρώτα να περάσει από έναν μετατροπέα A/D του οποίου η ποιότητα είναι επίσης καθοριστική (οπότε δώστε σημασία την κάρτα ήχου του υπολογιστή σας...).  Αν το υλικό είναι αποθηκευμένο σε CD (η πλέον συνήθης περίπτωση) τότε μπορούμε να χρησιμοποιήσουμε την διαδικασία Digital Audio Extraction (DAE) και να μεταφέρουμε το ψηφιακό περιεχόμενο του δίσκου απ΄ευθείας σε αρχείο wav.  Κάθε ripper που σέβεται τον εαυτό του υποστηρίζει DAE, και το ίδιο συμβαίνει για κάθε CD-ROM drive.  Ωστόσο, αν έχετε κάποιο παλιό drive θα πρέπει να βεβαιωθείτε.  Είναι στατιστικώς πιθανόν αλλά όχι βέβαιο ότι θα το υποστηρίζει.  Το αρχείο wav που προκύπτει από τον ripper έχει προδιαγραφές που εξαρτώνται από την διαδικασία:  Η πλέον συνηθισμένες ονομάζονται συλλήβδην "CD Quality" δηλαδή συχνότητα δειγματοληψίας 44.1kHz, και μήκος λέξης 16bit. (χωρίς να αποκλείονται και άλλες εκδοχές , όπως τα 48kHz ή τα 24bit).  Aυτό το αρχείο είναι η πηγή των δεδομένων που τοποθετείται στην είσοδο του encoder. O encoder πραγματοποιεί resampling (με βάση τις οδηγίες που του δίνουμε), κωδικοποιεί το σήμα με βάση το μοντέλο της απωλεστικής συμπίεσης και δημιουργεί ένα αρχείο mp3.  Το αρχείο αυτό μπορεί να αποθηκευτεί τοπικά (και να αναπαράγεται μέσω του σχετικού player, της κάρτας ήχου και των ηχείων του υπολογιστή) να μεταφερθεί σε κάποια εξωτερική συσκευή μέσω USB (συνήθως, χωρίς να αποκλείεται το Ethernet ή οι ασύρματες ζεύξεις), να μετατραπεί και πάλι σε wav με απώτερο στόχο την εγγραφή του σε CD που είναι συμβατό με απλά CD players (κακή ιδέα...) ή να εγγραφεί απ' ευθείας σε CD ώστε να χρησιμοποιηθεί από συσκευές που είναι συμβατές με CD MP3 (πολλά DVD-Video players και ακόμη περισσότερα CD αυτοκινήτου, προσωπικά CD και φορητά ηχοσυστήματα).
Ενα πρόγραμμα κωδικοποίησης έχει συνήθως ένα μενού επιλογών που μοιάζει (αλλά δεν είναι απαραίτητα όμοιο) με αυτό.
H πρώτη επιλογή είναι ο codec που θα χρησιμοποιηθεί (εδώ υπάρχει επιλογή μεταξύ LAME και Fraunhofer)
Οι διαδικασίες που περιγράφονται ως ripping και encoding μπορεί πράγματι να λάβουν χώρα ξεχωριστά αλλά είναι δυνατόν μία και μόνη εφαρμογή να τις πραγματοποιεί αυτόματα. Μιλάμε τότε για ripper/encoder.  Σε κάθε περίπτωση ο χρήστης έχει να κάνει μία σειρά από επιλογές: Κατ' αρχήν, θα πρέπει να επιλέξει τον codec εφόσον υπάρχει αυτή η δυνατότητα.  Στην συνέχεια, το sample rate (η συχνότητα δειγμτοληψίας) το οποίο είναι διαφορετικό από το bitrate και ίσως περισσότερο καθοριστικό: Με εξαίρεση τις εφαρμογές streaming ή την ύπαρξη μίας πολύ κακής σύνδεσης στο διαδίκτυο, δεν υπάρχει κανένας λόγος να επιλεγεί άλλο sample rate από τα 44.1kHz/16bit.  Χαμηλότερες επιλογές περιορίζουν την ποιότητα σημαντικά.  Η επόμενη παράμετρος είναι η ροή των δεδομένων, το bitrate.  Είναι προφανές ότι όσο μεγαλύτερη ροή δεδομένων επιλέξει κανείς, τόσο μικρότερο λόγο συμπίεσης επιβάλλει, οπότε η ποιότητα είναι καλύτερη, εις βάρος του μεγέθους του αρχείου και της ταχύτητας μεταφοράς. Για "τοπική" χρήση, διαλέξτε 320kbps, για μεταφορά σε δίσκους (οπότε θέλετε πολλά τράκς) διαλέξτε κάτι μεταξύ 128-320kbps) και για μεταφορά μέσω του διαδικτύου (από σύνδεση χαμηλής ταχύτητας) μπορείτε να πέσετε στα 64kbps γνωρίζοντας ότι γίνονται παραχωρήσεις στην ποιότητα.
To επόμενο βήμα είναι η επιλογή του bitrate
Αν υπάρχει η δυνατότητα, ο χρήστης μπορεί να επιλέξει διάφορες στρατηγικές διαχείρισης του bitrate.
Αν ο encoder το επιτρέπει μπορείτε να διαλέξετε την διαχείριση των δύο καναλιών (Joint Stereo -προφανώς για ποιοτικά αποτελέσματα καλό είναι το αποφύγετε), και την ταχύτητα κωδικοποίησης, συνήθως ως συμβιβασμό μεταξύ μικρού χρόνου και καλής ποιότητας.  Εκτός και αν έχετε πραγματικούς λόγους να βιάζεσθε η πιο σοφή επιλογή εδώ είναι το slow.  Aπό κάποια χρονική στιγμή και μετά, οι codecs ΜP3 υποστηρίζουν τρείς στρατηγικές διαχείρισης του Bitrate: Το σταθερό (Constant Bitrate -CBR) όπου η ροή των δεδομένων είναι σταθερή στην προρυθμισμένη τιμή, το μεταβλητό (Variable Bitrate -VBR) όπου η ροή των δεδομένων βελτιστοποιήται με βάση την μορφή του σήματος αλλά δεν ξεπερνά την προρυθμισμένη τιμή και το μέσο (Average Bitrate -ABR) όπου ο codec έχει την δυνατότητα να ταλαντώνεται γύρω από μία μέση τιμή που είναι η προρυθμισμένη.  Οι δύο τελευταίες στρατηγικές επιτρέπουν την δημιουργία αρχείων μικρότερων από αυτά που θεωρητικά επιβάλλει το σταθερό bitrate και ταυτόχρονα επιτρέπουν στον codec να δώσει βαρύτητα σε δύσκολα σήματα, κάνοντας "οικονομία" σε απλούστερα και ίσως είναι μία καλή επιλογή αν ήδη έχει γίνει ένας συμβιβασμός προς μία χαμηλότερη τιμή του bitrate.

Πρωτοσέλιδο | Αρχείο Νέων | Αρθρα | Τεχνολογία | HowTo | Δίσκοι | Links | Contact | Αbout


©Δημήτρης Σταματάκος/Ακραίες Εκδόσεις 2005
Σχετικά με το avmentor.gr (προβλήματα, παρατηρήσεις κ.λπ): webmaster@avmentor.gr Eπαφή με την σύνταξη (ύλη, σχόλια, ερωτήσεις κ.λπ): contact@avmentor.gr