www.avmentor.gr: Site for Audio,Video & Home Entertainment Technologies

Ο Ηχος στον Οικιακό κινηματογράφο

1. Τα πρώτα βήματα (1926-1941)
2. Τα συστήματα τεσσάρων καναλιών και οι απαρχές του οικιακού κινηματογράφου
3. Τα αναλογικά συστήματα της Dolby: Dolby Suround και Dolby Pro Logic
4. O codec AC-3 και το Dolby Digital
5. Eναλλακτικές λύσεις: Τα codecs ΜPEG και o Coherent Acoustics της DTS
6. Περισσότερα κανάλια: Τα συστήματα 6.1 και 7.1, Dolby EX 6.1/7.1 και DTS-ES/ES Discrete 6.1
7. Surround από το πουθενά: Tα συστήματα ψευδο-surround, Dolby Pro Logic II/IIx και DTS Neo:6
8. Η Μυστηριώδης Υπόθεσις "ΤΗΧ"

ΚΟΡΥΦΗ...

ΠΡΟΗΓΟΥΜΕΝΗ

ΕΠΟΜΕΝΗ...

ΕΠΙΣΤΡΟΦΗ...►

Eνα χρόνο μετά από την επίσημη πρεμιέρα του Dolby Digital στις αίθουσες των κινηματογράφων, το 1993, ένα νέο σύστημα πολυκαναλικού ήχου έκανε την εμφάνισή του. Η ταινία, ήταν το Jurassic Park και το σύστημα ονομαζόταν DTS (Digital Theater System). To DTS χρησιμοποιούσε ένα σύστημα συμπίεσης με τη ονομασία apt-X100 και παρείχε δυνατότητα 5.1 καναλιών με προδιαγραφές LPCM 16bit/44.1kHz τα οποία ήταν αποθηκευμένα σε ένα CD-ROM που συνόδευε την ταινία. Ηταν η πρώτη φορά μετά την τεχνολογία Vitaphone του 1926 που σε μία κινηματογραφική ταινία, ο ήχος και η εικόνα χρησιμοποιούσαν διαφορετικούς φορείς. Το 1997, το DTS πέρασε και στον οικιακό χώρο με την παρουσίαση του Jurassic Park σε δισκο LD. (Eν τω μεταξύ ο Σπήλμπεργκ είχε αποκτήσει μερίδιο στην DTS) και δύο χρόνια αργότερα, κυκλοφόρησαν τα πρώτα DVD Video με ήχο DTS ανάμεσά τους και το πολυβραβευμένο "Xορεύοντας με τους Λύκους". Η οικιακή εκδοχή του DTS χρησιμοποιούσε και χρησιμοποιεί μέχρι σήμερα έναν διαφορετικό αλγόριθμο συμπίεσης σε σχέση με εκείνην για τις κινηματογραφικές αίθουσες.


To Jurassic Park ήταν η πρώτη ταινία με ήχο DTS. Ο Σπήλμπεργκ ενθουσιάστηκε τόσο, που έγινε συνέταιρος.	Η πολυβραβευμένη ταινία του Costner έγινε ένα από τα πρώτα DVD-Video με ήχο DTS.

Ο αλγόριθμος ονομάζεται Coherent Acoustics και έχει σχεδιαστεί από την Steven Smyth, τον άνθρωπο που είχε σχεδιάσει και τον apt-X100 και ανήκε στην εταιρία AlgoRhythmic η οποία αργότερα απορροφήθηκε επίσης από την DTS. Ο Coherent Acoustics είναι απωλεστικός αλγόριθμος συμπίεσης, ο οποίος μπορεί να προσφέρει bitrates από 32kbps μέχρι 1.4Μbps και μπορεί να διαχειριστεί μέχρι οκτώ κανάλια των 24bit. Διαθέτει δύο επίπεδα λειτουργίας, το επίπεδο όπου δεν χρησιμοποιήται ένα υποκειμενικό μοντέλο ακοής για την συμπίεση και ένα όπου γίνεται χρήση ενός τέτοιου μοντέλου (perceptual coding). Στην βιβλιογραφία η εταιρία κάνει μία μεγάλη προσπάθεια να προβάλει την ιδέα ότι για τις συμπιέσεις που απαιτούν τα 5.1 κανάλια ήχου στο DVD δεν ενεργοποιήται το perceptual coding με αποτέλεσμα η ποιότητα του συμπιεσμένου υλικού να είναι καλύτερη από "άλλους" codecs (δηλαδή, αντιλαμβανόμαστε όλοι, τον AC-3). Ο καταναλωτής φυσικά δεν είναι δυνατόν να ελέγξει έναν τέτοιο ισχυρισμό, μπορεί όμως να κρίνει εκ του αποτελέσματος (και είναι αλήθεια ότι τα κωδικοποιημένα με DTS soundtracks είναι μερικές φορές εξαιρετικής ποιότητας). Στην πράξη, ο Coherent Acoustics χωρίζει το σήμα σε 32 περιοχές (sub-bands) και κωδικοποιεί την κάθε περιοχή με όσα bit είναι απαραίτητα με βάση την ενέργεια που περιέχει αυτή κάθε χρονική στιγμή. Επίσης γίνεται πρόβλεψη της εξέλιξης του σήματος στον χρόνο και κωδικοποιήται μόνον η διαφορά του πραγματικού σήματος από το προβλεπόμενο, μία τεχνική που ονομάζεται ΑDPCM (Αdaptive Differential PCM). Στο perceptual κομμάτι, ο Coherent Acoustics χρησιμοποιεί ψυχοακουστικά μοντέλα επικάλυψης (masking) σε επίπεδο περιοχής (σε κάθε μία από τις 32).

Διάγραμμα βαθμίδων του κωδικοποιητή Coherent Acoustics της DTS, όπου φαίνεται η δυνατότητα λειτουργίας σε δύο επίπεδα, το "Objective" και το "Perceptual". Η εταιρία έχει καταναλώσει μεγάλη προσπάθεια για να διαφημίσει αυτή την δυνατότητα.

Ενδιαφέρουσα τέλος είναι και η ευελιξία που προσφέρει η DTS στην πλευρά του αποκωδικοποιητή: Οσον αφορά στο downmix, την διαδικασία δηλαδή που απαιτείται για την δημιουργία σήματος συμβατού με λιγότερα κανάλια από το αρχικό, είναι δυνατόν να χρησιμοποιηθεί είτε η συνήθης διαδικασία κατά την οποία το downmixing γίνεται με την χρήση σταθερών συντελεστών (που είναι standard για την επεξεργασία αυτή και ενσωματωμένοι σε κάθε αποκωδικοποιητή) είτε να γίνει δυναμικό downmixing με βάση συντελεστές που περιλαμβάνονται στο ίδιο το σήμα και τους έχει επιλέξει ο μηχανικός ήχου. Μία παρόμοια στρατηγική ακολουθείται και στο θέμα της συμπίεσης: Η συμπίεση είναι ουσιαστικά ένας έλεγχος της δυναμικής περιοχής (χονδρικά της απόστασης που χωρίζει το δυνατότερο από το ασθενέστερο σήμα σε ένα πρόγραμμα) και μπορεί να γίνει είτε στην διαδικασία της κωδικοποίησης είτε στην διαδικασία της αποκωδικοποίησης είτε και στις δύο διαδικασίες. Ενα καλό παράδειγμα είναι το night mode για ακροάσεις σε χαμηλές στάθμες. Ο Coherent Acoustics ακολουθεί μία audiophile προσέγγιση οι οποία δεν περιλαμβάνει συμπίεση αλλά απλή παροχή πληροφοριών για την δυναμική περιοχή που δυνητικά, στην πλευρά του αποκωδικοποιητή θα μπορούσε να χρησιμοποιηθεί για "τρέξει" ένα compressor. Πάντως, η σημαντικότερη ιδέα του Steven Smyth και της ομάδας του ήταν πρόβλεψη για επέκταση των δεδομένων που κωδικοποιούνται με τον Coherent Acoustics και μάλιστα με τρόπο συμβατό με τις παλαιότερες συσκευές. Η περιοχή "Extension Data" είναι ορατή μόνο από αποκωδικοποιητές που μπορούν να χρησιμοποιήσουν το περιεχόμενό της και αόρατη από εκείνους που δεν διαθέτουν τις κατάλληλες δυνατότητες. Αυτή ιδέα επέτρεψε την δημιουργία του DTS-ES Discrete 6.1 to 2000.

Διάγραμμα βαθμίδων του αποκωδικοποιητή DTS/Coherent Acoustics.

Τα MPEG-1 και MPEG-2
Το MPEG-1 αποτέλεσε μια πρόταση για την ψηφιακή μετάδοση συμπιεσμένου ηχητικού σήματος την δεκαετία του 1980. Την εποχή εκείνη βεβαίως δεν υπήρχαν σκέψεις για πολυκαναλικό ήχο, όπως τον εννoούμε σήμερα και έτσι η πρώτη εκδοχή του, το Musicam ήταν μια δικάναλη εφαρμογή. Το MPEG-1 "συναγωνίστηκε" με το AC-3 για το πρότυπο πολυκαναλικού ήχου στην τηλεόραση υψηλής ευκρίνειας, αφού πρώτα απέκτησε πρόσθετα κανάλια και μετονομάστηκε σε MPEG-2, ώστε να πληροί τις προδιαγραφές 5.1 που είχαν τεθεί, τελικώς. Η πλήρης ονομασία του είναι MPEG-2BC με το "BC" να σημαίνει Backwards Compatible υπονοώντας την δυνατότητα των προγραμμάτων που είχαν κωδικοποιηθεί σε MPEG-2 να αποκωδικοποιηθούν από συσκευές MPEG-1. Βεβαίως, ο "1" ήταν δικάναλος, οπότε η προδιαγραφή "2" περιελάμβανε δύο ομάδες δεδομένων, μία δικάναλη και συμβατή με MPEG-1 και μία τρικάναλη με τα επιπλέον κανάλια και συμβατή μόνο με MPEG-2. Η δικάναλη ομάδα αποτελούσε την μείξη (downmix) όλων των καναλιών ώστε ο ακροατής του MPEG-1 να μην χάνει τίποτε από το συνολικό πρόγραμμα. Το κάθε κανάλι του MPEG-1 αποτελείται από ένα κυρίως κανάλι, την πληροφορία του κεντρικού καναλιού και το αντίστοιχο περιφερειακό κανάλι, έχει δηλαδη την μορφή Lo/Ro, όπου Lo=L+C+Ls και Ro=R+C+Rs (με το σύμβολο "+" να σημαίνει, βεβαίως, μείξη και όχι απλή αλγεβρική άθροιση). Το MPEG-2BC έχει δύο "θεωρητικά" μειονεκτήματα. Πρώτον, το downmix γίνεται κατά την διάρκεια της κωδικοποίησης και δεν μπορεί να βελτιστοποιηθεί αργότερα ανάλογα με την εφαρμογή (είναι πιθανόν ότι απαιτούμε άλλη μείξη για στερεοφωνική απόδοση κι άλλη για dolby pro logic),ενώ ο AC-3 διατηρεί τα κανάλια ανεξάρτητα, και το downmix γίνεται στον αποκωδικοποιητή. Δεύτερον η απόδοσή του ως αλγόριθμου συμπίεσης επηρεάζεται από το γεγονός ότι εγγενώς φέρει δύο φορές την ίδια πληροφορία για τα τρία κανάλια: Το κεντρικό υπάρχει στις συνιστώσες "ο" και στο ξεχωριστό κανάλι και το ίδιο συμβαίνει και με τα δύο περιφερειακά κανάλια.