Τι ειναι το Dithering και γιατί υπάρχει; Πως μπορούμε να το αξιοποιήσουμε στο έπακρό του;

http://guneyozsan.com
Το Dithering ή αλλιώς Πρόσμειξη, σε μία γενική έννοια είναι αυτό που προσθέτει θόρυβο στο ηχητικό σήμα μας. Ναι, προσθέτει θόρυβο επίτηδες, και αυτό είναι ένα καλό πράγμα. Πώς μπορεί η προσθήκη του θορύβου να είναι ένα καλό πράγμα;! 
Θα σας πω, δώστε βάση γιατί θα το αναλύσω αρκετά, με μεγάλη λεπτομέρεια και... πάθος!

Προσθέτουμε το θόρυβο για να κάνουμε μία ανταλλαγή. Ανταλλάσσουμε λίγο χαμηλού επιπέδου σφύριγμα για μια μεγάλη μείωση της παραμόρφωσης. Είναι μία πολύ καλή ανταλλαγή και αυτή είναι μια που τα αυτιά μας αρέσουν αρκετά.


Το πρόβλημα

Το πρόβλημά μας προκύπτει από την κωδικοποίηση της δυναμικής περιοχής του ηχητικού μας σήματος σε bits. Δυστυχώς όμως τα bits αν είναι ορισμένα εξ’ αρχής δεν είναι σε θέση να αναπαραστήσουν πλήρως (ή σωστά) το ηχητικό μας δείγμα.



Μια πρώτη ματιά

Με μία πρώτη ματιά, τα 16 bits (κωδικοποίηση δυναμικής περιοχής Audio CD) ακούγονται αρκετά καλό νούμερο, δηλαδή -96 dB δυναμικής περιοχής, και είναι αρκετά καλά αν τα χρησιμοποιείτε όλη την ώρα, πάρ’  όλα αυτα όμως δεν μπορούμε και δεν ακούμε το πλήρες εύρος μας ("πλήρη κώδικα"). Εάν ρυθμίσετε την εγγραφή σας στα 16bits τότε πρέπει να ξέρετε πως για να καταστεί δυνατή η ηχογράφηση, σημαίνει πως η κορυφές που έπληξαν τα πλήρη δεκαέξι κομμάτια των bit από τα peaks μας, ένα μεγάλο μέρος της μουσικής καταγράφεται σε πολύ χαμηλότερη ένταση-με λιγότερα bits. Στην πραγματικότητα, εάν σκέφτεστε να αναπαράγετε το πιο ήσυχο ημιτονοειδές κύμα ήχου, θα συνειδητοποιήσετε ότι αυτό είναι ένα κομμάτι του πλάτους ενός 1bit και συνεπώς αναπαράγουμε ένα τετραγωνικό κύμα και τίποτα άλλο!
Ας μιλήσουμε εδώ λίγο για την παραμόρφωση. Είναι εύκολο να δούμε ότι όσο χαμηλότερα επίπεδα σήματος έχουμε,  τόσο υψηλότερη είναι η σχετική παραμόρφωση μας.! Τραγικό έτσι; Εξίσου ανησυχητικό και ακόμα πιο τραγικό, είναι το γεγονός πως ότι στοιχεία σήματος έχουμε μικρότερα από το επίπεδο του ενός bit που έχουμε κατά την ηχογράφηση μας, απλά δεν θα καταγραφούν ποτέ.!

Εδώ είναι που έρχεται και παίρνει θέση η πρόσμειξη. Αν προσθέσουμε λίγο θόρυβο στη διαδικασία της ηχογράφησης...συμβαίνουν μαγικά πράγματα! Λοιπόν, πρώτα, ας κάνουμε μια αναλογία ...



Μια αναλογία

Δοκιμάστε τον εαυτό σας σε αυτό το πείραμα, αυτή τη στιγμή. Απλώστε τα δάχτυλά σας και κρατήστε τα μέχρι μερικά εκατοστά μπροστά από το ένα μάτι, και κλείστε το άλλο. Προσπαθήστε να διαβάσετε αυτό το κείμενο. Τα δάχτυλά σας θα εμποδίσουν σίγουρα κάποια τμήματα του κειμένου (όσο μικρότερο είναι το κείμενο, τόσο περισσότερο θα το βλέπουμε και πιο ελλιπές), κάνοντας την ανάγνωση μας αρκετά πιο δύσκολη.
Προσπαθήστε τώρα να πηγαινοέρχεται το χέρι σας μπροστά και πίσω (εμπρός και πίσω!) στα γρήγορα, όσο πιο γρήγορα μπορείτε. Αντιλαμβάνεστε πως είστε σε θέση να διαβάσετε όλο το κείμενο πιο εύκολα από πριν. Θα δείτε ένα θάμπωμα του χεριού σας μπροστά από το κείμενο, αλλά σίγουρα μια βελτίωση σε σχέση με ότι είχαμε πριν θα την έχετε.

Το θάμπωμα αυτό είναι ανάλογο με τον θόρυβο που προσθέτουμε με την πρόσμειξη μας. Στην ουσία αυτό που κάνουμε με τη πρόσμειξη είναι να προσθέτουμε λίγο θόρυβο μέσα στο σήμα μας, για μια πολύ καλύτερη εικόνα του τι κρύβεται από κάτω του.

Επιστροφή στο Ήχο


Για τον ήχο, η πρόσμειξη γίνεται με την προσθήκη θορύβου σε ένα επίπεδο μικρότερο από το λιγότερο σημαντικό bit πριν από τη στρογγυλοποίηση του στα 16 bits. Η προστιθέμενη αξία θορύβου έχει ως αποτέλεσμα την εξάπλωση των πολλών βραχυπρόθεσμων λαθών σε όλο το ηχητικό μας φάσμα, όπως ο θόρυβος ευρείας ζώνης (broadcast). Μπορούμε να κάνουμε μικρές βελτιώσεις σε αυτόν τoν αλγόριθμο της πρόσμειξης (όπως η διαμόρφωση του θορύβου σε περιοχές όπου είναι λιγότερο αντιληπτές στο αυτί μας), αλλά η διαδικασία αυτή παραμένει απλά μία απλή διαδικασία προσθέτοντας το ελάχιστο ποσό του θορύβου για να μας κάνει τη δουλειά.


Ένα πρόσθετο πλεονέκτημα

Εκτός από τη μείωση των θορύβων των χαμηλότερων επιπέδων, η πρόσμειξη μας αφήνει να ακούμε κάποια συστατικά του σήματος μας κάτω από το επίπεδο των λιγότερο σημαντικών bit μας! Πώς; Ο προστιθέμενος θόρυβος ωθεί το ήχο μας πάνω από το σημείο μετάβασης των πραγματικών  του dB σε ένα ποσό ανάλογο προοδευτικά πιο πραγματικό επίπεδο κατά το πλάτος του, τα υπόλοιπα τα κάνουν αυτόματα τα αυτιά και το μυαλό μας, εξειδικευμένα από μικρά παιδιά στο να διαχωρίζουν ένα σήμα από το θόρυβο. Όπως μπορούμε να ακολουθήσουμε μια συνομιλία σε ένα  δωμάτιο με πολύ δυνατή ένταση, έτσι κι εδώ μπορούμε να τραβήξουμε το ασθενές μας σήμα από το θόρυβο.

Πηγαίνοντας πίσω στο παράδειγμα πιο πάνω με το χέρι κουνώντας το, μπορώ να αποδείξω την αρχή αυτή για τον εαυτό σας. Δείτε ένα μεγάλο χαρακτήρα κειμένου (ή ένα αντικείμενο γύρω σας), και να το δείτε κοιτάζοντας μέσα από ένα κενό ανάμεσα στα δάχτυλά σας. Κλείστε το χάσμα, έτσι ώστε να μπορείτε να δείτε μόνο το ένα μέρος του χαρακτήρα. Τώρα κουνήστε το χέρι σας μπροστά και πίσω όσο πιο γρήγορα μπορείτε. Ακόμα κι αν δεν μπορείτε να δείτε ολόκληρο το χαρακτήρα σε οποιαδήποτε στιγμή, ο εγκέφαλός σας κατά μέσο όρο θα συναρμολογήσει την διαφορετικότητα των εικόνων για να δέσει τους χαρακτήρες αυτούς μαζί. Μπορεί να φαίνεται λίγο ασαφές, αλλά μπορείς να το διακρίνεις εύκολα αυτό.
Dithering at 16bit - 24 bit @ 44Khz & 96Khz
Πότε πρέπει να χρησιμοποιούμε την πρόσμιξη;

Στο πιο βασικό της επίπεδο, η πρόσμιξη απαιτείται μόνο κατά τη μείωση του αριθμού των δυαδικών ψηφίων που χρησιμοποιούνται για να αντιπροσωπεύσει ένα σήμα μας. Έτσι, μια προφανής ανάγκη για πρόσμειξη είναι όταν μειωθεί ένα 16-bit αρχείο ήχου σε οκτώ bits είτε ένα 24 σε 16 και ούτω κάθ’ εξής. Αντί για περικοπή ή στρογγυλοποίηση, για να χωρέσουν τα δείγματα στο μειωμένο μέγεθος αυτό, δημιουργούνται αρμονικές και παραμόρφωση δηλαδή ενδοδιαμόρφωση. Ο προστιθέμενος θόρυβος της πρόσμειξης απλώνεται ως σφάλμα στην πάροδο του χρόνου του σήματος μας.
Αλλά υπάρχουν και λιγότερο προφανείς μειώσεις και συμβαίνουν καθ'όλη την ώρα εργασίας μας με ψηφιακό ήχο. 

Ο ένοχος

Ο ένοχος είναι ο πολλαπλασιασμός. Όταν πολλαπλασιάσετε δύο επί 16-bit, παίρνουμε τον αριθμό 32-bit. Δεν μπορούμε απλά να απορρίψουμε ή να ολοκληρώσουμε την στρογγυλοποίηση μας χωρίς κάποια μαθηματικά, οπότε θα πρέπει να  χρησιμοποιήσουμε την πρόσμειξη. Για οποιαδήποτε αλλαγή των bits θα πρέπει να κάνουμε πολλαπλασιασμό, άρα θα πρέπει να χρησιμοποιούμε την πρόσμιξη. Η διαδικασία εξομάλυνσης στην ουσία ρυθμίζει τα επίπεδα peaks ενός αρχείου ήχου, έτσι ώστε κορυφές του  που βρίσκονται σε πλήρες επίπεδο, να είναι μια αλλαγή προς το κέρδος μας. Στην πραγματικότητα, μερικοί άνθρωποι κάνουν εξομάλυνση ένα σήμα, μετά από κάθε ψηφιακή επεξεργασία του, και έτσι λανθασμένα πιστεύουν ότι είναι η μεγιστοποίηση της σήματος ως προς τον θόρυβο, μα όμως στην πραγματικότητα, δεν κάνουν τίποτα, εκτός από την αύξηση του θορύβου και της παραμόρφωσης του, δεδομένου ότι το επίπεδο θορύβου έχει ήδη «ομαλοποιηθεί», μαζί με το σήμα και το σήμα πρέπει να επαναπροσμιχθεί.

Εάν χρησιμοποιούμε αρκετά υψηλή ανάλυση, δηλαδή 96kHz ας πούμε, η πρόσμιξη καθίσταται περιττή. Για τον ήχο, αυτό σημαίνει 24 bits ή 32-bit Floating Point  κοινώς (κινητής υποδιαστολής). Σε εκείνο το σημείο, το δυναμικό εύρος είναι τέτοιο ώστε το λιγότερο σημαντικό ψηφίο των bit να είναι ισοδύναμο με το πλάτος του θορύβου σε ατομικό επίπεδο. Οι επεξεργαστές ψηφιακού σήματος συνήθως εργάζονται σε αυτή την ανάλυση, ώστε να μπορούν να κάνουν τους ενδιάμεσους υπολογισμούς τους χωρίς τον φόβο σφαλμάτων, και κάνουν τους υπολογισμούς της πρόσμιξης μόνο όταν έρθει η ώρα τους να παραδώσουν το αποτέλεσμα αυτό στα 16-bit.


Σχόλια

Δημοφιλείς αναρτήσεις