|
Τεχνολογίες Εικόνας:
Καλύτερα να Μασάς, παρά να Μιλάς... |
Εισαγωγή Το Φως, τα Χρώματα
και το Μάτι Ο Δείκτης Αντίθεσης και η Οξύτητα σε μια
προβαλλόμενη εικόνα Τί είναι τελικώς η διόρθωση
Gamma; Εγχρωμη εικόνα: Πειράματα, Μοντέλα, Το Διάγραμμα CIE και το
Gamut Βίντεο: Περί Χρονικού και Χωρικού
Δειγματισμού Η Σαρωση και ο Συγχρονισμός των σημάτων
Βίντεο Ti είναι η Ανάλυση; Σήματα
Χρωματοδιαφορών και το Ψηφιακό Βίντεο Φωτεινότητα,
Αντίθεση και άλλες ιστορίες... (δηλαδή, πάλι Φωτεινότητα και
Αντίθεση!) Για περισσότερο
διάβασμα... |
|
Ti
είναι η Ανάλυση; Σήματα Χρωματοδιαφορών και το Ψηφιακό
Βίντεο |
Η έννοια της ανάλυσης είναι συχνά
παρεξηγημένη, καθώς υπάρχει μια τάση να την μπερδεύουμε με την
οξύτητα. Είναι σημαντικό να διευκρινιστεί, επομένως, ότι ενώ η
οξύτητα είναι χαρακτηριστικό της προβαλλόμενης εικόνας (αφορά δηλαδή
το πόσες και πόσο μικρές σε διαστάσεις λεπτομέρειες μπορούμε να
δούμε) η ανάλυση είναι η τεχνική παράμετρος που μας επιτρέπει να
λάβουμε, να αποθηκεύσουμε και να προβάλουμε τις πληροφορίες αυτές. Η
οξύτητα ενός συστήματος μεταβάλλεται μέχρι μια μέγιστη τιμή (που
καθορίζεται από την MTF του συστήματος) ενώ η ανάλυση είναι σταθερή
εκ κατασκευής. Αυτό σημαίνει, πολύ απλά, ότι η μεγάλη ανάλυση δεν
συνεπάγεται κατ΄ανάγκην απεικόνιση μικρών λεπτομερειών, απλώς την
υπόσχεται, σε περίπτωση που αυτές υπάρχουν! Επίσης, σημαίνει ότι δεν
υπάρχει μόνο μια ανάλυση, αλλά τουλάχιστον τρεις: Η ανάλυση
των μηχανών λήψης, η ανάλυση που υποστηρίζεται από
το μέσο εγγραφής και η ανάλυση του συστήματος
προβολής. Ενα απλό παράδειγμα είναι το εξής: Η λήψη με μια
μηχανή υψηλής ανάλυσης (ή υψηλής ευκρίνειας -όπως είναι η
διαδεδομένη ονομασία), παύει να είναι υψηλής ανάλυσης όταν
αποθηκευθεί σε DVD και βεβαίως δεν μπορεί να επανέλθει στην αρχική
της ανάλυση απλώς και μόνον επειδή θα την προβάλουμε upscaled σε μια
HD Ready τηλεόραση. Στο συγκεκριμένο παράδειγμα, μόνο ένα από τα
τρία μέρη "υστερεί" αλλά επαρκεί για να μας στερήσει την δυνατότητα
προβολής όλου του εύρους της οξύτητας που περιλαμβάνεται στην αρχική
λήψη, παρά το γεγονός ότι η προβολή έχει "υψηλή ανάλυση". Εχει
αρκετό ενδιαφέρον να δούμε λίγα από τα μαθηματικά της
ανάλυσης του βίντεο, απαντώντας κατ΄αρχήν σε ένα
θεμελιώδες ερώτημα: Δοθείσης μιας θεωρητική ανάλυσης πόση από αυτήν
μπορούμε να χρησιμοποιήσουμε; Η απάντηση είναι "όχι όλη". Τον ένα
παράγοντα που περιορίζει τις δυνατότητές μας τον έχουμε ήδη γνωρίσει
και είναι η χρόνοι Line και Field Flyback που απαιτούνται για την
σωστή σάρωση. Ενας δεύτερος παράγοντας ακούει στο όνομα Κell
Factor (τον περιέγραψε πρώτος ο Reymond Kell στα εργαστήρια
της RCA, τo 1934, και αφορά όλα τα συστήματα που πραγματοποιούν
χωρικό sampling). Ο παράγοντας Kell, οφείλεται σε διάφορες ατέλειες
ενός συστήματος λήψης διακριτών δειγμάτων, με την σημαντικότερη να
είναι η αδυναμία μας να εξασφαλίσουμε πάντα απόλυτα σωστή
ευθυγράμμιση: Φανταστείτε έναν αισθητήρα που χωρίζει την εικόνα σε
δέκα οριζόντιες γραμμές ο οποίος βρίσκεται μέσα σε μια μηχανή λήψης
που έχει απέναντί της μια κάρτα με δέκα οριζόντιες γραμμές (πέντε
μαύρες και πέντε άσπρες). Ποιά είναι η πιθανότητα να συμπέσουν οι
γραμμές της κάρτας με τους αισθητήρες; Το φαινόμενο αυτό
περιορίζει την ανάλυση κατά έναν συντελεστή ο οποίος (από
ορισμένους) υπολογίζεται στατιστικώς στο 30%. Αλλες βιβλίογραφικές
πηγές είναι περισσότερο "αυστηρές" με το ποσοστό αυτό αλλά είναι
αυτό που χρησιμοποιούμε στους περισσότερους υπολογισμούς μας.
Λαμβάνοντας υπ' όψιν μας ότι αυτοί οι δύο μηχανισμοί μειώνουν τόσο
την κατακόρυφη ανάλυση (δηλαδή τον αριθμό των ορατών γραμμών σε μια
εικόνα) όσο και την οριζόντια (δηλαδή την μέγιστη χωρική συχνότητα)
ας κάνουμε μερικές πράξεις: Ενα τυπικό σύστημα
βίντεο ξεκινάει με μια θεωρητική κατακόρυφη ανάλυση 625
γραμμών. Ο χρόνος του field flyback, δηλαδή ο χρόνος που
απαιτείται για να πραγματοποιηθεί η επιστροφή της σάρωσης στην
κορυφή του επόμενου πεδίου "ξοδεύει" 25 γραμμές οπότε η χρήσιμη
ανάλυσή μας είναι 600 γραμμές. Λαμβάνοντας υπ' όψιν ότι ένας κύκλος
φωτεινότητας (από τελειώς μαύρο σε τελείως λευκό ή το αντίστροφο)
απαιτεί δύο γραμμές για να απεικονισθεί, οι 600 γραμμές μας
προσφέρουν μέγιστη χωρική συχνότητα 300c/ph (κύκλους ανα ύψος
εικόνας). Ο παράγοντας Kell, μειώνει την συχνότητα αυτή στα 210c/ph
(300x0.7=210). Χρησιμοποιώντας, τώρα, τις αναλογίες 4:3 του
συμβατικού κάδρου, οι 300c/ph πρέπει να αντιστοιχηθούν σε μια
οριζόντια χωρική συχνότητα 400c/pw (κύκλοι ανά εύρος γραμμής) αν
θέλουμε να διατηρήσουμε την αναλογία. Γνωρίζουμε, βεβαίως ότι λόγω
του παράγοντα Kell η χρήσιμη ανάλυσή μας είναι περίπου 300c/pw (στην
πραγματικότητα είναι 400x0.7=280, αλλά οι υπολογισμοί στην
βιβλιογραφία χρησιμοποιούν διάφορες αυθαίρετες προσεγγίσεις...). Σε
αυτά τα 300c/pw θα πρέπει να προσθέσουμε 60 περίπου κύκλους οι
οποίοι θα χαθούν λόγω του Line Flyback, φθάνοντας τις απαιτήσεις μας
για πραγματική οριζόντια ανάλυση που θα εξασφαλίζει δυνατότητα
προβολής 360c/pw. (Aν είστε καχύποπτος θα έχετε παρατηρήσει ότι αυτό
το 360c/pw σημαίνει 720 κάθετες γραμμές -αν υπήρχαν κάθετες
γραμμές... Μήπως υπάρχουν; Γραμμές όχι, αλλά υπάρχουν pixels. Θα τα
συναντήσουμε σύντομα!). |
|
|
Η πορεία του σήματος από την μηχανή λήψης
μέχρι την αναλογική η ψηφιακή έξοδο περιλαμβάνει την μετατροπή
του σε σήμα Χρωματοδιαφορών, το Sampling (για την ψηφιοποίησή
του) και την δημιουργία σύνθετων σημάτων (Y/C και
Composite) | |
Από
όλα τα παραπάνω έχουμε μια ιδέα για το ποιές πρέπει να είναι
πραγματικές επιδόσεις ενός συστήματος προβολής: Θα πρέπει να
μπορεί να προβάλει περίπου 210 κύκλους φωτεινότητας στο ύψος της
εικόνας και 300 κύκλους φωτεινότητας στον πλάτος της. Εδώ,
μπαίνει ένα ερώτημα: Ενώ η κατακόρυφη ανάλυση είναι σαφώς ορισμένη
σε γραμμές (ένα πλήρες frame περιλαμβάνει 600 γραμμές, οπότε οι 210
κύκλοι φωτεινότητας που αντιστοιχούν σε 420 γραμμές καλύπτονται μια
χαρά) οι προδιαγραφές του συμβατικού βίντεο δεν αναφέρουν
τίποτε για την οριζόντια ανάλυση! Πόση είναι αυτή;
Στην πράξη, στο αναλογικό βίντεο και στις συμβατικές τηλεοράσεις CRT
δεν υπάρχει οριζόντια ανάλυση αλλά κάτι άλλο: Εύρος
(bandwidth) σάρωσης. Ας δούμε πώς υπολογίζεται αυτό: Μια διαδοχή 25
πλαισίων ανά δευτερόλεπτο τα οποία σαρώνονται καθ' ύψος 625 φορές
(όσες και οι γραμμές τους δηλαδή) απαιτούν από τον μηχανισμό
κατακόρυφης σάρωσης να λειτουργεί με μια συχνότητα 15,6kHz
(625x25=15625), επειδή μέσα σε χρόνο ενός δευτερολέπτου υπάρχουν
15625 γραμμές που πρέπει να σαρωθούν. Κάθε τέτοια γραμμή απαιτούμε
να έχει 360 κύκλους φωτεινότητας με άλλα λόγια, μέσα σε ένα
δευτερόλεπτο, το σύστημά μας θα πρέπει να αποδώσει 5.625.000 κύκλους
φωτεινότητας (15625x360=5.625.000) επομένως, συνολικά, το σύστημα
σάρωσης θα πρέπει να λειτουργεί με μια συχνότητα 5.6ΜΗz περίπου. Η
οριζόντια ανάλυση ενός συμβατικού συστήματος εξαρτάται από το αν
μπορεί να φθάσει στην συχνότητα αυτή. Αν όχι, τότε μειώνεται η
οριζόντια χωρική συχνότητα που μπορεί να αποδωθεί, επομένως χάνουμε
την δυνατότητα να προβάλλουμε πολλές λεπτομέρειες (δηλαδή μεγάλη
οξύτητα) σε κάθε γραμμή. Το πρόβλημα αυτό δεν υπάρχει στα
ψηφιακά συστήματα βίντεο τα οποία έχουν μια συγκεκριμένη
οριζόντια και κατακόρυφη ανάλυση η οποία μετράται σε εικονοστοιχεία
(pixels) και ονομάζεται εγγενής ανάλυση. Ωστόσο,
πριν φθάσουμε στην ψηφιοποίηση του σήματος βίντεο θα πρέπει πρώτα να
δούμε πως μοντελοποιήται αυτό για να το διαχειριστούμε.
Η έξοδος μιας μηχανής λήψης είναι ένα σήμα RGB
το οποίο περιγράφει την ένταση των τριών βασικών χρωμάτων. Με
δεδομένο ότι το ανθρώπινο μάτι είναι εξαιρετικά ευαίσθητο στις
μεταβολές της έντασης και όχι στην συχνότητα των ερεθισμάτων (δηλαδή
στην φωτεινότητα και όχι στα χρώματα) αυτό που μας ενδιαφέρει είναι
να μεταφέρουμε όσο το δυνατόν καλύτερα την πληροφορία της
φωτεινότητας (την οποία συμβολίζουμε με το γράμμα Υ). Το
σήμα φωτεινότητας παράγεται από απλές μαθηματικές πράξεις
μεταξύ των τριών χρωμάτων και μπορούμε είτε να το συνθέσουμε στην
συσκευή προβολής είτε να το παράγουμε κατά την διαδικασία λήψης και
να το διατηρήσουμε σε ένα δικό του, ανεξάρτητο κανάλι. Προτιμούμε
την δεύτερη επιλογή και το αποτέλεσμα είναι η κωδικοποίηση
της έγχρωμης εικόνας με χρωματοδιαφορές. Στην κωδικοποίηση
αυτή παράγονται τρία σήματα, της φωτεινότητας (Y), της διαφοράς
μεταξύ φωτεινότητας και του κόκκινου (Y-R) και της διαφοράς μεταξύ
φωτεινότητας και του μπλέ) Οι συμβολισμοί των τριών αυτών σημάτων
είναι Υ, Cr και Cb αντιστοίχως. Στο αναλογικό βίντεο, μπορούμε είτε
να επιλέξουμε να παραμείνουμε σε αυτό το επίπεδο, των τριών σημάτων,
είτε να δημιουργήσουμε μια αλληλουχία περισσότερο σύνθετων,
παράγοντας ένα σήμα χρώματος από τα Cr/CB (οπότε έχουμε το σύνθετο
σήμα Υ/C που χρησιμοποιήται στο S-Video) ή και ένα σύνθετο σήμα με
πληροφορίες φωτεινότητας και χρώματος που είναι το γνωστό μας
σύνθετο σήμα (Composite). |
|
|
To subsampling 4:2:2 σημαίνει πολύ απλά
ότι στα τέσσερα δείγματα έχουμε πληροφορία χρώματος μόνο για
τα δύο. Και πάλι, ο όγκος των δεδομένων είναι
τεράστιος! | |
To ψηφιακό
βίντεο ξεκινά με την ψηφιοποίηση των σημάτων Y, Cb και Cr. Αφού η
ψηφιοποίηση αφορά τρία σήματα, προφανώς απαιτούνται τρείς συχνότητες
δειγματισμού οι οποίες είναι διαφορετικές. Η προδιαγραφή
(ITU-601) προβλέπει δειγματισμό του σήματος φωτεινότητας
στα 13.5MHz και των σημάτων χρώματος στα 6.25MHz. Πώς προκύπτουν
αυτές οι τιμές; Η θεμελίωδης συχνότητα δειγματισμού που έχει
επιλεγεί (πολλαπλάσια της οποίας είναι οι τιμές που αναφέρονται
παραπάνω) είναι τα 3.375ΜHz, η οποία αποτελεί μια καλή προσέγγιση
κοινού πολλαπλάσιου των δύο διαφορετικών συχνοτήτων σάρωσης των
συστημάτων PAL (15.6kHz) και NTSC (15.7kHz) ώστε η προδιαγραφή να
είναι κοινή και για τα δύο. Πραγματοποιώντας oversampling 4x
για το σήμα φωτεινότητας έχουμε τα 13.5ΜHz ενώ τα σήματα
χρώματος υπο-δειγματοληπτούνται για λόγους οικονομίας!
Χρησιμοποιούμε την μισή συχνότητα, στα 6.25MHz, γεγονός που στην
πράξη, σημαίνει ότι στα τέσσερα δείγματα ενός αναλογικού σήματος
βίντεο που το κάνουμε ψηφιακό, παίρνουμε πληροφορίες για όλα όσον
αφορά την φωτεινότητα αλλά μόνο για τα δύο όσον αφορά στα χρώματα!
(εξ ου και το φορμά 4:2:2) Με την κάθε γραμμή ενός βίντεο 625
γραμμών/25 πλαισίων να διαρκεί 1/15625 του δευτερολέπτου και με
συχνότητα δειγματισμού 13.5ΜHz, τα δείγματα που παίρνουμε ανά γραμμή
σάρωσης είναι 864. Από αυτά χάνονται κάποια λόγω του χρόνου που
απαιτείται για συγχρονισμό (στην πράξη τα σήματα sync δεν
ψηφιοποιούνται αλλά ο χρόνος απαιτείται ούτως ή άλλως) το αποτέλεσμα
είναι να απομένουν 720 δείγματα φωτεινότητας
(δηλαδή 360 κύκλοι χωρικής συχνότητας οριζόντιας σάρωσης -για να μην
ξεχνιόμαστε!). Δώστε προσοχή στο εξής σημείο: Ο μέγιστος αριθμός
δειγμάτων είναι, μεν 720 δείγματα αλλά, βεβαίως 720 δείγματα ανά
ADC. Την στιγμή που πραγματοποιήται η δειγματοληψία του σήματος
φωτεινότητας πραγματοποιούνται και δύο άλλες για τα σήματα Cr και Cb
με 360 δείγματα έκαστη. Το σύνολο των δειγμάτων ανα
γραμμή που "σηκώνουμε" επομένως είναι 1440. Κωδικοποιώντας με λέξεις
μήκους 8-bit κάθε δείγμα έχουμε μια ροή δεδομένων 15520 bits ανα
γραμμή, ή 7.2Mbps ανά πλαίσιο ή (τέλος) 180Mbps συνολικά! Αυτό
εξηγεί γιατί είναι εξαιρετικά δύσκολο να δούμε "ασυμπίεστο" ψηφιακό
βίντεο: Πέραν της δυνατότητας χειρισμού αυτών των 180Mbps, απαιτεί
και 11.2MB ανά δευτερόλεπτο για την αποθήκευσή του! Ανεξάρτητα,
πάντως, από το είδος του βίντεο (αναλογικό ή ψηφιακό), δύο όροι που
θα συναντήσει κανείς συχνά είναι η φωτεινότητα και η αντίθεση, αμφότερες
παρεξηγημένες... |
| |