Ο Ηχος στον Οικιακό
κινηματογράφο |
 |
1. Τα πρώτα βήματα
(1926-1941) 2. Τα συστήματα τεσσάρων καναλιών και οι
απαρχές του οικιακού κινηματογράφου 3. Τα
αναλογικά συστήματα της Dolby: Dolby Suround και Dolby Pro
Logic 4. O codec AC-3 και το Dolby
Digital 5.
Eναλλακτικές λύσεις: Τα codecs ΜPEG και o Coherent Acoustics
της DTS 6. Περισσότερα κανάλια: Τα συστήματα
6.1 και 7.1, Dolby EX 6.1/7.1 και DTS-ES/ES Discrete
6.1 7. Surround από το πουθενά: Tα συστήματα
ψευδο-surround, Dolby Pro Logic II/IIx και DTS
Neo:6 8. Η Μυστηριώδης Υπόθεσις
"ΤΗΧ" |
|
Eνα χρόνο μετά από την επίσημη
πρεμιέρα του Dolby Digital στις αίθουσες των κινηματογράφων, το
1993, ένα νέο σύστημα πολυκαναλικού ήχου έκανε την
εμφάνισή του. Η ταινία, ήταν το Jurassic Park και
το σύστημα ονομαζόταν DTS (Digital Theater System). To DTS
χρησιμοποιούσε ένα σύστημα συμπίεσης με τη ονομασία
apt-X100 και παρείχε δυνατότητα 5.1 καναλιών
με προδιαγραφές LPCM 16bit/44.1kHz τα οποία ήταν αποθηκευμένα σε ένα
CD-ROM που συνόδευε την ταινία. Ηταν η πρώτη φορά μετά την
τεχνολογία Vitaphone του 1926 που σε μία κινηματογραφική ταινία, ο
ήχος και η εικόνα χρησιμοποιούσαν διαφορετικούς φορείς. Το
1997, το DTS πέρασε και στον οικιακό χώρο με την παρουσίαση του
Jurassic Park σε δισκο LD. (Eν τω μεταξύ ο Σπήλμπεργκ είχε
αποκτήσει μερίδιο στην DTS) και δύο χρόνια αργότερα, κυκλοφόρησαν τα
πρώτα DVD Video με ήχο DTS ανάμεσά τους και το πολυβραβευμένο
"Xορεύοντας με τους Λύκους". Η οικιακή εκδοχή του DTS
χρησιμοποιούσε και χρησιμοποιεί μέχρι σήμερα έναν διαφορετικό
αλγόριθμο συμπίεσης σε σχέση με εκείνην για τις κινηματογραφικές
αίθουσες. |
 |
 |
To Jurassic
Park ήταν η πρώτη ταινία με ήχο DTS. Ο Σπήλμπεργκ
ενθουσιάστηκε τόσο, που έγινε συνέταιρος. |
Η
πολυβραβευμένη ταινία του Costner έγινε ένα από τα πρώτα
DVD-Video με ήχο DTS. | |
Ο αλγόριθμος
ονομάζεται Coherent Acoustics και έχει σχεδιαστεί
από την Steven Smyth, τον άνθρωπο που είχε σχεδιάσει και τον
apt-X100 και ανήκε στην εταιρία AlgoRhythmic η οποία αργότερα
απορροφήθηκε επίσης από την DTS. Ο Coherent Acoustics είναι
απωλεστικός αλγόριθμος συμπίεσης, ο οποίος μπορεί να προσφέρει
bitrates από 32kbps μέχρι 1.4Μbps και μπορεί να
διαχειριστεί μέχρι οκτώ κανάλια των 24bit. Διαθέτει
δύο επίπεδα λειτουργίας, το επίπεδο όπου δεν
χρησιμοποιήται ένα υποκειμενικό μοντέλο ακοής για την συμπίεση και
ένα όπου γίνεται χρήση ενός τέτοιου μοντέλου (perceptual
coding). Στην βιβλιογραφία η εταιρία κάνει μία μεγάλη
προσπάθεια να προβάλει την ιδέα ότι για τις συμπιέσεις που απαιτούν
τα 5.1 κανάλια ήχου στο DVD δεν ενεργοποιήται το perceptual coding
με αποτέλεσμα η ποιότητα του συμπιεσμένου υλικού να είναι καλύτερη
από "άλλους" codecs (δηλαδή, αντιλαμβανόμαστε όλοι, τον AC-3).
Ο καταναλωτής φυσικά δεν είναι δυνατόν να ελέγξει έναν τέτοιο
ισχυρισμό, μπορεί όμως να κρίνει εκ του αποτελέσματος (και είναι
αλήθεια ότι τα κωδικοποιημένα με DTS soundtracks είναι μερικές φορές
εξαιρετικής ποιότητας). Στην πράξη, ο Coherent Acoustics χωρίζει το
σήμα σε 32 περιοχές (sub-bands) και κωδικοποιεί την
κάθε περιοχή με όσα bit είναι απαραίτητα με βάση την ενέργεια που
περιέχει αυτή κάθε χρονική στιγμή. Επίσης γίνεται πρόβλεψη της
εξέλιξης του σήματος στον χρόνο και κωδικοποιήται μόνον η διαφορά
του πραγματικού σήματος από το προβλεπόμενο, μία τεχνική που
ονομάζεται ΑDPCM (Αdaptive Differential PCM). Στο
perceptual κομμάτι, ο Coherent Acoustics χρησιμοποιεί ψυχοακουστικά
μοντέλα επικάλυψης (masking) σε επίπεδο περιοχής (σε κάθε μία από
τις 32). |
 |
Διάγραμμα
βαθμίδων του κωδικοποιητή Coherent Acoustics της DTS, όπου
φαίνεται η δυνατότητα λειτουργίας σε δύο επίπεδα, το
"Objective" και το "Perceptual". Η εταιρία έχει καταναλώσει
μεγάλη προσπάθεια για να διαφημίσει αυτή την
δυνατότητα. | |
Ενδιαφέρουσα τέλος είναι και η ευελιξία
που προσφέρει η DTS στην πλευρά του αποκωδικοποιητή: Οσον
αφορά στο downmix, την διαδικασία δηλαδή που απαιτείται για την
δημιουργία σήματος συμβατού με λιγότερα κανάλια από το αρχικό, είναι
δυνατόν να χρησιμοποιηθεί είτε η συνήθης διαδικασία κατά την οποία
το downmixing γίνεται με την χρήση σταθερών συντελεστών (που είναι
standard για την επεξεργασία αυτή και ενσωματωμένοι σε κάθε
αποκωδικοποιητή) είτε να γίνει δυναμικό downmixing
με βάση συντελεστές που περιλαμβάνονται στο ίδιο το σήμα και τους
έχει επιλέξει ο μηχανικός ήχου. Μία παρόμοια στρατηγική
ακολουθείται και στο θέμα της συμπίεσης: Η συμπίεση είναι ουσιαστικά
ένας έλεγχος της δυναμικής περιοχής (χονδρικά της απόστασης που
χωρίζει το δυνατότερο από το ασθενέστερο σήμα σε ένα πρόγραμμα) και
μπορεί να γίνει είτε στην διαδικασία της κωδικοποίησης είτε στην
διαδικασία της αποκωδικοποίησης είτε και στις δύο διαδικασίες.
Ενα καλό παράδειγμα είναι το night mode για ακροάσεις σε χαμηλές
στάθμες. Ο Coherent Acoustics ακολουθεί μία audiophile
προσέγγιση οι οποία δεν περιλαμβάνει συμπίεση αλλά απλή
παροχή πληροφοριών για την δυναμική περιοχή που δυνητικά, στην
πλευρά του αποκωδικοποιητή θα μπορούσε να χρησιμοποιηθεί για
"τρέξει" ένα compressor. Πάντως, η σημαντικότερη ιδέα του
Steven Smyth και της ομάδας του ήταν πρόβλεψη για επέκταση των
δεδομένων που κωδικοποιούνται με τον Coherent Acoustics και μάλιστα
με τρόπο συμβατό με τις παλαιότερες συσκευές. Η περιοχή
"Extension Data" είναι ορατή μόνο από
αποκωδικοποιητές που μπορούν να χρησιμοποιήσουν το περιεχόμενό της
και αόρατη από εκείνους που δεν διαθέτουν τις κατάλληλες
δυνατότητες. Αυτή ιδέα επέτρεψε την δημιουργία του DTS-ES
Discrete 6.1 to 2000. |
 |
Διάγραμμα
βαθμίδων του αποκωδικοποιητή DTS/Coherent
Acoustics. | |
Τα MPEG-1 και
MPEG-2 Το MPEG-1 αποτέλεσε μια πρόταση
για την ψηφιακή μετάδοση συμπιεσμένου ηχητικού σήματος την δεκαετία
του 1980. Την εποχή εκείνη βεβαίως δεν υπήρχαν σκέψεις για
πολυκαναλικό ήχο, όπως τον εννoούμε σήμερα και έτσι η πρώτη εκδοχή
του, το Musicam ήταν μια δικάναλη εφαρμογή. Το MPEG-1
"συναγωνίστηκε" με το AC-3 για το πρότυπο πολυκαναλικού ήχου στην
τηλεόραση υψηλής ευκρίνειας, αφού πρώτα απέκτησε πρόσθετα κανάλια
και μετονομάστηκε σε MPEG-2, ώστε να πληροί τις προδιαγραφές 5.1 που
είχαν τεθεί, τελικώς. Η πλήρης ονομασία του είναι
MPEG-2BC με το "BC" να σημαίνει Backwards
Compatible υπονοώντας την δυνατότητα των προγραμμάτων που είχαν
κωδικοποιηθεί σε MPEG-2 να αποκωδικοποιηθούν από συσκευές
MPEG-1. Βεβαίως, ο "1" ήταν δικάναλος, οπότε η προδιαγραφή "2"
περιελάμβανε δύο ομάδες δεδομένων, μία δικάναλη και συμβατή με
MPEG-1 και μία τρικάναλη με τα επιπλέον κανάλια και συμβατή μόνο με
MPEG-2. Η δικάναλη ομάδα αποτελούσε την μείξη (downmix) όλων των
καναλιών ώστε ο ακροατής του MPEG-1 να μην χάνει τίποτε από το
συνολικό πρόγραμμα. Το κάθε κανάλι του MPEG-1 αποτελείται από
ένα κυρίως κανάλι, την πληροφορία του κεντρικού καναλιού και το
αντίστοιχο περιφερειακό κανάλι, έχει δηλαδη την μορφή Lo/Ro, όπου
Lo=L+C+Ls και Ro=R+C+Rs (με το σύμβολο "+" να σημαίνει, βεβαίως,
μείξη και όχι απλή αλγεβρική άθροιση). Το MPEG-2BC έχει δύο
"θεωρητικά" μειονεκτήματα. Πρώτον, το downmix γίνεται
κατά την διάρκεια της κωδικοποίησης και δεν μπορεί να
βελτιστοποιηθεί αργότερα ανάλογα με την εφαρμογή (είναι πιθανόν ότι
απαιτούμε άλλη μείξη για στερεοφωνική απόδοση κι άλλη για dolby pro
logic),ενώ ο AC-3 διατηρεί τα κανάλια ανεξάρτητα, και το downmix
γίνεται στον αποκωδικοποιητή. Δεύτερον η απόδοσή του ως αλγόριθμου
συμπίεσης επηρεάζεται από το γεγονός ότι εγγενώς φέρει δύο φορές την
ίδια πληροφορία για τα τρία κανάλια: Το κεντρικό υπάρχει στις
συνιστώσες "ο" και στο ξεχωριστό κανάλι και το ίδιο συμβαίνει και με
τα δύο περιφερειακά κανάλια. |
| |