έκδοση με γραφικά

Θεωρία του ήχου

 

 

 

1. Εισαγωγή

2. Η ακουστική του ήχου

3. Ο ήχος στα λειτουργικά συστήματα

4. Το MIDI

 

 

Εισαγωγή

 

 

Ο ήχος είναι από τα πιο εντυπωσιακά στοιχεία των πολυμεσικών εφαρμογών με την έννοια ότι έχει να πει κάτι σε κάθε γλώσσα, σε κάθε ακροατήριο, με δυνατότητες έκφρασης από τον ψίθυρο ως την κραυγή. Μπορεί να παράσχει ακουστική απόλαυση ως μουσική φόρμα, μπορεί να εντυπωσιάσει ως ηχητικό εφφέ, μπορεί να ξεκουράσει ως υπόκρουση.

 

Το πώς όμως χρησιμοποιούμε τη δύναμη του ήχου κάνει τη διαφορά ανάμεσα σε μια κοινότυπη, ερασιτεχνική παραγωγή και σε μια προσεγμένη επαγγελματική δουλειά.

 

 

 

Η ακουστική του ήχου

 

Ακουστική λέγεται η επιστήμη που ασχολείται με τον ήχο.

Στην σύντομη εισαγωγή στην ακουστική και στη θεωρία της μουσικής που επιχειρούμε ρίχνουμε φως στον κόσμο της μουσικής και στα φυσικά του χαρακτηριστικά. Θα μιλήσουμε επίσης ακόμα και για τις τεχνικές δειγματοληψίας. 

Αν έχετε γνώσεις Φυσικής ή Ακουστικής, τότε όσα θα αναφερθούν θα σας φανούν οικεία. Παρόλαυτα, κι αν ακόμα δεν έχετε αυτές τις γνώσεις δεν είναι δύσκολο να κατανοήσετε τα όσα θα αναφερθούν.

 

1. Τι είναι ο ήχος;

2. Το ηχόχρωμα

 

1. Τι είναι ο ήχος;

Μια απλή απάντηση στο ερώτημα αυτό είναι η εξής: ήχος είναι κάθε τι που ακούμε. Ο ήχος παράγεται από μια πηγή και συλλαμβάνεται από το αυτί μας. Όμως για να φτάσει ο ήχος από την πηγή στο δέκτη, πρέπει να μεσολαβήσει ένα φέρον μέσο. Αυτό συνήθως είναι ο αέρας, αλλά μέσο διάδοσης του ήχου είναι και το νερό ή κάποιο στερεό σώμα. Χωρίς μέσο διάδοσης δεν είναι δυνατή η μεταφορά του ήχου. Έτσι για παράδειγμα δεν είναι δυνατή η συνομιλία στο φεγγάρι. Επίσης, το μέσο διάδοσης καθορίζει και τις ιδιότητες του ήχου. Αλλιώς π.χ. ακούγονται οι ήχοι στο νερό, αλλιώς φιλτράρονται και με άλλες ταχύτητες μεταδίδονται.

Εμάς θα μας απασχολήσουν οι ήχοι που συναντάμε στην καθημερινή μας ζωή, αυτοί που διαδίδονται στον αέρα. Όταν ο αέρας πάλλεται, δημιουργούνται κύματα. Αυτές οι κυμάνσεις συλλαμβάνονται ως ήχος. Το πλάτος και η συχνότητα τους διαμορφώνουν το ποιόν του ήχου που ακούγεται.

Άρα ο ήχος είναι ενέργεια.

Ο απλούστερος τύπος κύμανσης είναι το ημιτονικό σήμα. Αυτό αντιστοιχεί σε μία μόνο συχνότητα, και περισσότερο αποτελεί ιδανική σύλληψη παρά πραγματική κατάσταση. Στο σχήμα φαίνεται η κύμανση που αντιστοιχεί σε τόνο συχνότητας 100 Hz, δηλαδή 100 περιοδικών κυμάνσεων το δευτερόλεπτο.  

 

 

Το ημιτονικό κύμα είναι περιοδικό σήμα. Αυτό σημαίνει πως ο πρώτος παλμός συνοδεύεται από πολλούς ίδιους παλμούς. Τα περιοδικά κύματα δημιουργούν ήχους που λέγονται τόνοι, όπως είναι οι τόνοι που παράγει μια κιθάρα, ένα πιάνο ή ένα διαπασών. Στην πράξη αυτοί οι ήχοι που παράγονται δεν περιέχουν μόνο μια συχνότητα, αλλά και μερικές ακόμα παραπλήσιες συχνότητες, αλλά μπορούμε να θεωρήσουμε με ικανοποιητική προσέγγιση πως έχουμε πράγματι παραγωγή τόνων.

Ο ήχος όμως των κυμάτων που με δύναμη πέφτουν στην ακρογιαλιά θεωρείται ως θόρυβος, παρά ως τόνος ή τόνοι, γιατί αποτελείται από πληθώρα μη-περιοδικών κυμάνσεων.

Το βασικό σημείο της κύμανσης, είναι η έντασή της, δηλαδή το πλάτος της. Όσο μεγαλύτερο το πλάτος, τόσο ισχυρότερα ακούγεται ο ήχος. Φυσική μονάδα μέτρησης του ήχου είναι το decibel (dB). Η κλίμακα μέτρησης των dB είναι λογαριθμική, γιατί το ανθρώπινο αυτί συλλαμβάνει την ένταση του ήχου λογαριθμικά, δηλαδή μπορεί και ακούει ήχους που ποικίλουν σημαντικά σε ένταση, το ίδιο καλά. Δε θα υπεισέλθουμε στις λεπτομέρειες των λογαριθμικών κλιμάκων. Απλώς θα πούμε ότι η κλίμακα αυτή είναι συγκριτική και σήματα που διαφέρουν 3 dB έχουν διπλάσια ένταση το ισχυρότερο σε σχέση με το ασθενέστερο. Επίσης, για τη μέτρηση ισχύος κάθε σήματος λαμβάνεται συγκριτική στάθμη βαθμονόμησης τα 10 ή 12 Watt που αντιστοιχεί σε ηχητικό σήμα μη-αντιληπτό από το αυτί μας. Ένας άλλος λόγος χρήσης λογαριθμικής κλίμακας είναι το γεγονός ότι το ανθρώπινο αυτί αντιλαμβάνεται τεράστιο εύρος έντασης ηχητικών σημάτων και μόνο με τη χρήση λογαριθμικής κλίμακας μπορούμε να έχουμε συνοπτική εικόνα των εντάσεων.

Ο ήχος, όπως τον αντιλαμβανόμαστε καθημερινά, δεν έχει ως άμεσα αντιληπτό μέγεθος μόνο την ένταση. Κάτι άλλο που αντιλαμβανόμαστε ευθύς αμέσως είναι η συχνοτική συμπεριφορά του σήματος που μας επιτρέπει να κατατάξουμε τις φωνές σε μπάσες ή οξείες και τους ήχους σε στριγγλούς ή μουντούς.

Το δεύτερο βασικό λοιπόν γνώρισμά του ηχητικού σήματος είναι η συχνότητά του.

Ο αριθμός των παλμικών δονήσεων το δευτερόλεπτο είναι η συχνότητα του σήματος και μετριέται σε Hertz (Hz).

Για τον μουσικό κόσμο η συχνότητα των 440 Hz είναι πολύ σημαντική. Η συχνότητα αυτή αντιστοιχεί στη νότα Λα1 (Α1). Τα περισσότερα μουσικά όργανα κουρδίζονται με βάση αυτή τη συχνότητα.

Το ανθρώπινο αυτί μπορεί να αντιληφθεί ήχους από 20 Hz ως 20 KHz. Αυτό το συχνοτικό εύρος διαφέρει από άτομο σε άτομο, ειδικά στο πάνω κατώφλι του. Επίσης οι συνεχείς θόρυβοι που βομβίζουν τα αυτιά μας στις πόλεις και η πάροδος του χρόνου αμβλύνουν ακόμα περισσότερο το συχνοτικό εύρος της αντίληψης των ήχων από τα αυτιά μας.

Πάντως οι πιο χρήσιμες συχνότητες βρίσκονται κάτω από τα 10 KHz. Εκεί εντοπίζονται οι συχνότητες που έχουν να κάνουν με την ομιλία, την μουσική ακόμα και με τους διάφορους θορύβους.

Ο παρακάτω πίνακας δίνει μια ιδέα για το συχνοτικό περιεχόμενο διαφόρων ηχητικών πηγών.

 

όργανο

Συχνοτικό εύρος (σε Hz)

Ανθρώπινη φωνή

70-2000

Πιάνο

30-3500

Βιολί

200-3000

Φλάουτο

260-3000

Εκκλησιαστικό όργανο

16-4000

 

Ένας τόνος με συχνότητα 220 Hz και ένας με συχνότητα 880 Hz είναι τόνοι που αντιστοιχούν στη νότα Λα. Αν και αντιστοιχούν στη νότα Λα και οι δύο, εντούτοις ο ένας είναι μια οκτάβα κάτω από την Λα1 και ο άλλος μία οκτάβα παραπάνω.

 

 

 

Αυτή η διάταξη των νότων του παραπάνω σχήματος δείχνει μια βασική μουσική αρχή: κάθε διπλασιαζόμενη συχνότητα αντιστοιχεί στην ίδια ακριβώς νότα, μόνο που αυτή είναι μια οκτάβα υψηλότερη. Συνεπώς ο λόγος συχνοτήτων των βασικών νότων (νότα Ντο) δύο διαδοχικών οκτάβων είναι 1:2.

Μερικές χαρακτηριστικές σχέσεις μεταξύ νότων και οι λόγοι των συχνοτήτων τους, δηλαδή τα διάφορα μουσικά διαστήματα, αναγράφονται στον παρακάτω πίνακα:

 

Διαστήματα

Νότες

παράδειγμα

Βασικές νότες

1:1

Ντο – ντο

Ελάχιστη (μινόρε) τρίτης

5:6

Ντο – μι δίεση

Μέγιστη (ματζόρε) τρίτης

4:5

Ντο – μι

Τετάρτης

3:4

Ντο – φα

Πέμπτης

2:3

Ντο – σολ

Ελάχιστη (μινόρε) έκτης

5:8

Ντο – λα ύφεση

Μέγιστη (ματζόρε) έκτης

3:5

Ντο – λα

Οκτάβα

1:2

Ντο – ντο’

 

 

Οι σύγχρονες μουσικές κλίμακες αποτελούνται από επτά βασικούς τόνους και πέντε ημιτόνια. Οι επτά βασικοί τόνοι σχηματίζουν ή ολόκληρα διαστήματα (ντο-ρε, ρε-μι, φα-σολ, σολ-λα, λα-σι) ή ημιτόνια (μι-φα, σι-ντο).

Κάθε μια από τις νότες αυτές μπορεί να ανέλθει συχνοτικά και να σχηματιστεί η ίδια νότα σε δίεση (#) ή να κατέλθει και να σχηματιστεί η ίδια νότα σε ύφεση (b). Στο πεντάγραμμο πρώτα είναι η νότα σε ύφεση, μετά η ίδια η νότα και μετά η δίεσή της. Θεωρητικά, μια νότα σε δίεση και η επόμενή της σε ύφεση δεν είναι το ίδιο πράγμα. Δηλαδή το Ρε δίεση (D#) και το Μι ύφεση (Eb) έχουν παραπλήσια συχνότητα, αλλά όχι ακριβώς την ίδια.

 

 

Για ευκολία στην μουσική εκτέλεση (ειδικά στα όργανα με πλήκτρα, όπως το πιάνο) χρησιμοποιούνται οι συγκερασμένες κλίμακες, όπου η δίεση μιας νότας και η ύφεση της επόμενής της αποδίδονται στην ίδια συχνότητα και συνεπώς χρειάζεται ένα πλήκτρο γι’ αυτές. Έτσι, τα όργανα αυτά έχουν 12 νότες ανά οκτάβα. Η απώλεια αυτού του συγκερασμού δεν είναι μεγάλη γιατί ακουστικά αυτός ο συμβιβασμός δεν είναι εύκολα αντιληπτός.

Σε μερικά όργανα όπως το βιολί που δεν έχει τάστα, μπορεί κανείς να αποδώσει ξεχωριστά για παράδειγμα το Ρε δίεση (D#) και το Μι ύφεση (Eb).

Όλα αυτά που είπαμε τα βλέπουμε συγκεντρωμένα στο σχήμα που φαίνεται η συγκερασμένη κλίμακα. Για να βρούμε την ακριβή συχνότητα κάθε νότας αρκεί να πολλαπλασιάσουμε τη συχνότητα της θεμελιώδους της οκτάβας (Ντο-C) με το νούμερο που αναγράφεται πάνω από κάθε νότα.

Για παράδειγμα το σολ δίεση έχει συχνότητα:

1.58740 * τη συχνότητα του ντο.

Όλα όσα αναφέρθηκαν μέχρι στιγμής είναι αρκετά για να χειρίζεται κανείς με άνεση εργαλεία προγραμμάτων ήχου που στηρίζουν τη λειτουργία τους σε πεντάγραμμα ή πλήκτρα σαν του πιάνου.

 

2. Το ηχόχρωμα

Η συχνότητα δεν είναι το μόνο χαρακτηριστικό γνώρισμα κάθε ήχου. Για παράδειγμα, μπορούμε να παίξουμε τη νότα Λα1, που αντιστοιχεί στα 440 Hz, με κιθάρα και με φλάουτο. Το άκουσμα της ίδιας νότας είναι εντελώς διαφορετικό σε κάθε μουσικό όργανο. Αυτό οφείλετε στο γεγονός ότι εκτός από τον τόνο των 440 Hz, που είναι καθαρά ημιτονικό σήμα, παράγονται και διαφορετικές αρμονικές αυτής της συχνότητας, διαφορετικές για κάθε όργανο. Σ’ αυτές οφείλετε και το διαφορετικό ηχόχρωμα του κάθε οργάνου.

Έτσι όταν ένα όργανο παράγει των θεμελιώδη τόνο των 440 Hz, παράγονται με μικρότερη ένταση και οι τόνοι των 880 Hz , 1320 Hz, 1760 Hz ...

Παρόλο που οι αρμονικές χαρακτηρίζουν τελικά τον ήχο, η θεμελιώδης συχνότητα καθορίζει το όνομα της νότας που παίζουμε.

Το τι μορφή θα έχει η υπέρθεση ενός τόνου με μία αρμονική το βλέπουμε στο επόμενο σχήμα, όπου ένα ημιτονικό σήμα 100 Hz συνδυάζεται με ένα άλλο διπλάσιας συχνότητας αλλά με πλάτος το μισό του πρώτου.

 

 

Στα πιο πολλά διαγράμματα επεξεργασίας ήχου έχουμε τη δυνατότητα να δημιουργήσουμε ήχους συνδυάζοντας διάφορους τόνους. Συνήθως αυτή η διεργασία ονομάζεται FM σύνθεση και περιέχει και τη δυνατότητα για διαμόρφωση της συχνότητας συν τοις άλλοις. Από εκεί άλλωστε προέρχεται και το όνομά της (frequency modulation).

 

 

 

 

Ο ήχος στα λειτουργικά συστήματα

 

 

1. Η διαδικασία της ψηφιοποίησης

2. Η κωδικοποίηση του ήχου στα λειτουργικά περιβάλλοντα

3. Τα ηχητικά γεγονότα στα λειτουργικά περιβάλλοντα

 

 

 

1. Η διαδικασία της ψηφιοποίησης

 

 

Η μέχρι τώρα περιγραφή του ήχου που κάναμε, είναι η περιγραφή ενός αναλογικού σήματος. Όμως οι υπολογιστές δεν αναγνωρίζουν συνεχή σήματα, αλλά μόνο διακριτά. Πρέπει λοιπόν να βρεθεί κάποιος τρόπος ώστε το αναλογικό σήμα του ήχου να μετατραπεί σε διακριτό ψηφιακό σήμα. Η διαδικασία αυτή ονομάζεται δειγματοληψία και απαιτεί από πλευράς Η/Υ την παρουσία ειδικού υλικού (hardware) και κατάλληλου λογισμικού.

Το υλικό που πρέπει να υπάρχει οπωσδήποτε είναι ο μετατροπέας ADC (Analog to Digital Converter). Ο μετατροπέας αυτός συνήθως είναι τμήμα ενός ολοκληρωμένου κυκλώματος που επιτελεί και άλλες λειτουργίες σχετικά με την επεξεργασία ηχητικού σήματος και ονομάζεται DSP (Digital Signal Processor).

 

Η είσοδος του αναλογικού σήματος στον υπολογιστή γίνεται μέσω μικροφώνου ή αναλογικά ηχογραφημένου σήματος (line) στο ADC. Το ADC σαρώνει το εισαγόμενο σε αυτό αναλογικό τμήμα σε προκαθορισμένα χρονικά διαστήματα, μετράει το πλάτος του σήματος εκείνη τη στιγμή και το αποθηκεύει σε μορφή ψηφιακών δεδομένων. Η διαδικασία αυτή είναι η δειγματοληψία του σήματος και συνήθως γίνεται στις συχνότητες 8000 Hz, 11025 Hz, και 44100 Hz.

 

Αν το DSP ολοκληρωμένο είναι χωρητικότητας 8 bit αυτό σημαίνει πως μπορεί να παίρνει μέχρι 44100 δείγματα το δευτερόλεπτο και να τα αποθηκεύει σε πίνακες των 8 bits. Επειδή με 8 bits μεταβλητές μπορούν να περιγράφουν 255 διαφορετικές στάθμες, η ευκρίνεια του σήματος μας είναι οι παραπάνω 255 στάθμες κβάντωσης.

 

Οι συχνότητες δειγματοληψίας δεν έχουν τυχαίες τιμές. Κριτήριο για τον καθορισμό αυτών των τιμών αποτελεί το θεώρημα του Nyquist σύμφωνα με το οποίο:

 

Η μέγιστη συχνότητα αναλογικού σήματος που μπορεί να αποδοθεί χωρίς αλλοίωση ή παραποίηση (aliasing) πρέπει να είναι το μισό της συχνότητας δειγματοληψίας.

 

Αποδεικνύεται πως αν τα δείγματα μας έχουν παρθεί με μικρή συχνότητα δειγματοληψίας, θα υπάρχει πρόβλημα στην αναπαραγωγή των υψηλών συχνοτήτων και αδυναμία σωστού σχηματισμού του αναλογικού σήματος από τα δείγματα που έχουμε πάρει, άρα δεν θα μπορεί το σήμα να αποδοθεί επακριβώς.

 

Αν θεωρήσουμε πως το ανθρώπινο αυτί ακούει ήχους με μέγιστη φασματική διάταξη τα 20 KHz, τότε η συχνότητα δειγματοληψίας των 44100 Hz με δείγματα των 16 bits είναι αρκετή για να έχουμε ψηφιοποίηση στερεοφωνικής ποιότητας υψηλής πιστότητας. Αυτή η προδιαγραφή τυποποίησης είναι γνωστή ως ISO 10149 ή ως τυποποίηση του Κόκκινου Βιβλίου. Με αυτήν την τυποποίηση είναι ψηφιοποιημένοι οι ήχοι των μουσικών CD που κυκλοφορούν στο εμπόριο.

 

Ακόμα πιο ψηλά σε συχνότητα δειγματοληψίας βρίσκεται η τυποποίηση για τις ηχογραφήσεις ψηφιακών κασετοφώνων (Digital Audio Tape), που θέλει συχνότητα δειγματοληψίας 48000 Hz σε δείγματα των 16 bits.

 

Αυτές οι κωδικοποιήσεις είναι ακριβές σε αποθηκευτικό χώρο. Για παράδειγμα, για να αποθηκεύσουμε 1 λεπτό στερεοφωνικής μουσικής θα χρειαζόμασταν κατά το πρότυπο του Κόκκινου Βιβλίου:

 

(2 * fs * bits ανά δείγμα) / 8 * Τ = 2 * 44100 * 16 / 8 * 60 = 10,1 ΜΒ !

 

Για να περιορίσουμε το μέγεθος του ψηφιοποιημένου σήματος χρησιμοποιούμε όσο το δυνατόν μικρότερες συχνότητες δειγματοληψίας.

 

Για παράδειγμα για τη δειγματοληψία ανθρώπινης φωνής από το τηλεφωνικό δίκτυο, θα αρκούσε συχνότητα δειγματοληψίας των 8000 Hz σε δείγματα των 8 bits, μια και το τηλεφωνικό δίκτυο αποκόπτει τις συχνότητες άνω των 3400 Hz.

 

Όσο για την ψηφιοποίηση της ανθρώπινης φωνής, δειγματοληψία στα 22050 Hz θα κρινόταν ως ικανοποιητική μια και η οξύτερη γυναικεία φωνή δεν ξεπερνά τα 10000 Hz.

   

 

Η διαδικασία της δειγματοληψίας περιγράφεται στο πλαϊνό σχήμα, όπου φαίνεται η αρχική μορφή, η λήψη τιμών του αρχικού σήματος με δειγματοληψία ορισμένης συχνότητας, τα ληφθέντα δείγματα και η ανακατασκευή της κύμανσης από αυτά.

 

 

 

2. Η κωδικοποίηση του ήχου στα λειτουργικά περιβάλλοντα

 

 

Η διαδικασία ψηφιοποίησης αφορά κυρίως το υλικό της κάρτας ήχου ενός υπολογιστή. Η μορφή αποθήκευσης των δειγμάτων και η επεξεργασία τους αφορά το λειτουργικό σύστημα.

Υπάρχουν αρκετοί τρόποι μετάφρασης των ψηφιοποιημένων δειγμάτων σε αρχεία ήχου. Η πιο διαδεδομένη πλέον μορφή είναι η RIFF (Resource Interchange File Format). Σύμφωνα με αυτήν τα δείγματα αποθηκεύονται σε ομάδες (chunks) κατά τη δομή:

 

Typedef unsigned long DWORD;

Typedef unsigned char BYTE;

Typedef DWORD FOURCC;

Typedef struct {

FOURCC ckID;

DWORD ckSize;            // Chunk size

BYTE ckData(ckSize);   // Chunk data array

} CK;

 

Έτσι η Microsoft για παράδειγμα έχει μια δική της κωδικοποίηση κατά το πρότυπο RIFF που ονομάζεται WAVE μορφή και τα αρχεία της φέρουν την επέκταση wav.

Στην WAVE μορφή κωδικοποίησης χρησιμοποιούνται συχνότητες δειγματοληψίας 11025 Hz, 22050 Hz και 44100 Hz με δείγματα των 8 ή 16 bits.

 

 

 

3. Τα ηχητικά γεγονότα στα λειτουργικά περιβάλλοντα

 

 

Όλες οι πλατφόρμες των σύγχρονων λειτουργικών περιβαλλόντων έχουν ενσωματώσει τον ήχο ως στοιχειώδη δυνατότητα του τρόπου λειτουργίας τους. Αυτό σημαίνει πως η αντίδραση του λειτουργικού συστήματος σε κάποιο γεγονός (event) ή σε κάποια δυσλειτουργία, μπορεί να γίνει εκτός από τη συνήθη μέθοδο των οπτικών σημάτων (message boxes) με ήχους που εκφράζουν απορία, αποτροπή, επιδοκιμασία κ.α.

 

  • Στο περισσότερο διαδεδομένο λειτουργικό περιβάλλον, στα Windows έχουμε ήχους με ονομασίες όπως τα Chimes, Chord, Ding και Tada.

  • Στο Ms-Dos περιβάλλον δεν έχουμε υποστήριξη ήχου από το λειτουργικό περιβάλλον και συνεπώς κάθε κατασκευαστής καρτών ήχου έχει το δικό του τρόπο κωδικοποίησης. Αυτό που έχει όμως επικρατήσει ως πρότυπο (industry standard) είναι η συμβατότητα με την Soundblaster  της εταιρίας Creative.

Ας σημειωθεί πως για επαγγελματικές εφαρμογές το περιβάλλον του Dos δεν ενδείκνυται, αλλά η μεγαλύτερη εγκατεστημένη βάση ηχητικών σημάτων σε υπολογιστές αφορά αυτό το περιβάλλον για έναν πολύ απλό λόγο: τα καλύτερα και περισσότερο διαδεδομένα παιχνίδια σε H/Y παραμένουν εγκατεστημένα σε λειτουργικό περιβάλλον του Dos.

 

  • Κάτι ανάλογο ισχύει και στις πλατφόρμες των πολυμέσων στο λειτουργικό σύστημα Unix. Οι διάφορες εταιρίες που πωλούν workstations  με Unix υποστηρίζουν διαφορετικές μορφές αρχείων. Αν και υπάρχουν προγράμματα μετατροπής από το ένα είδος κωδικοποίησης ηχητικών σημάτων στο άλλο, δεν υπάρχει κάποια ενιαία μορφή κωδικοποίησης που να υποστηρίζεται από όλους. Πάντως ξεχωρίζει η πλατφόρμα της Silicon Graphics στα workstations για την πολύ καλή υποστήριξη σε επεξεργασία ήχου για πολυμεσικές εφαρμογές σε επίπεδο λειτουργικού συστήματος.

  • Από την άλλη μεριά στο MacOs των Macintosh έχουμε εδώ και αρκετά χρόνια υποστήριξη ηχητικών σημάτων και ρυθμίσεων. Οι macintosh  άλλωστε πωλούνται με κάρτα ήχου στον βασικό εξοπλισμό τους. Γνωστά ηχητικά σήματα κυκλοφορούν με τα ονόματα Droplet, Indigo, Quack, Simple Beep, Sosumi, Wild Eep.

Η ρύθμισή τους γίνεται από διαλογικά εικονίδια σαν αυτό του πλαϊνού σχήματος. Με τις ρυθμίσεις αυτές μπορούμε να αποδώσουμε γεγονότα του λειτουργικού συστήματος ή του προγράμματός μας. Σ’ αυτήν την περίπτωση ο ήχος αποτελεί στοιχείο του περιβάλλοντος διασύνδεσης του υπολογιστή με τον χρήστη (User Interface).

Στους Macintosh οι ψηφιοποιημένοι ήχοι μπορούν να αποθηκευτούν ως AIFF (Audio Interchange File Format) ή ως SND, αρχεία δηλαδή που υποστηρίζουν τα Sun workstations.

 

Η διαφορά της κωδικοποίησης που χρησιμοποιούν οι Macintosh έγκειται στο ότι ενώ στη μορφή κωδικοποίησης της Microsoft έχουμε παλμοκωδική (PCMPulse Code Modulation) περιγραφή των δειγμάτων, στην κωδικοποίηση των Macintosh τα διαδοχικά σήματα περιγράφονται σε σχέση με τα προηγούμενα κατά τις αρχές της προσαρμοστικής Δ-διαμόρφωσης (Adaptive Delta Pulse Code Modulation).

 

Και στο MacOs και στα Windows υπάρχει υποστήριξη και για MIDI αρχεία.

 

 

 

 

 

Το MIDI

  

1. Εισαγωγικά

2. Βασικές έννοιες του MIDI

3. Ο κώδικας MIDI

 

 

1. Εισαγωγικά

 

Κάθε κάρτα ήχου στις μέρες μας, ακόμα κι αν είναι και από τις πιο απλές, είναι εφοδιασμένη με δυνατότητες διασύνδεσης με αρμόνια και συνθεσάιζερ μέσω του πρωτοκόλλου MIDI. Η λέξη MIDI είναι ακρωνύμιο του Musical Instrument Digital Interface. Μιας και το κεφάλαιο MIDI είναι αρκετά πολύπλοκο εμπλέκοντας διάφορους κατασκευαστές υλικού και λογισμικού, θα αναφέρουμε μόνο τα γενικά γνωρίσματα και χαρακτηριστικά του χωρίς να υπεισέλθουμε σε λεπτομέρειες.

 

Η ιστορία του MIDI είναι σχετικά πρόσφατη. Μέχρι το 1970 τα πιο πολλά συνθεσάιζερ ήταν αναλογικά και η διασύνδεσή τους απαιτούσε πολύ καλές γνώσεις ηλεκτρονικών. Αργότερα, εμφανίστηκαν τα πρώτα ψηφιακά μουσικά όργανα, αλλά χωρίς να απευθύνονται στο μεγάλο πλήθος των ερασιτεχνών μουσικών. Ήταν πιο πολύ κλειστά συστήματα που δεν διέθεταν τρόπους διασύνδεσης, ή αν είχαν κάποιες δυνατότητες ενδοεπικοινωνίας, αυτές προϋπήρχαν μόνο για συσκευές και κονσόλες της ίδιας εταιρίας. Επιπλέον, και οι προσωπικοί υπολογιστές ήταν ακριβοί και οι κάρτες ήχου ακόμα ακριβότερες. Το πιο σημαντικό πρόβλημα, παρόλα αυτά, δεν ήταν το ακριβό υλικό, αλλά η έλλειψη προτύπων που θα καθόριζαν την ενδοεπικοινωνία μεταξύ ηλεκτρονικών μουσικών οργάνων.

 

Το 1983 επώνυμοι κατασκευαστές ηλεκτρονικών μουσικών οργάνων όπως η Kawai, η Korg, η Roland, η Sequential Circuits και η Yamaha, αν και ανταγωνιστές, συμφώνησαν να κωδικοποιήσουν τις νότες και τα εφφέ στα πληκτρολόγια και στα αρμόνιά τους. Έτσι δημιουργήθηκε η τυποποίηση 1.0 του MIDI. Το πρότυπο αυτό δεν είναι το καλύτερο δυνατό. Έχει κάποιες ατέλειες και αρκετοί κατασκευαστές το παραλλάσσουν και δημιουργούν δικά τους πρότυπα. Παρόλα αυτά, όλοι οι κατασκευαστές υποστηρίζουν το γενικό πρότυπο του MIDI.

 

Αυτό έχει σαν συνέπεια τη δυνατότητα ενσωμάτωσης πολλών συνθεσάιζερ διαφορετικών κατασκευαστών σε συστοιχίες. Παλιότερα, για να συνδέσει κανείς διαφορετικά όργανα έπρεπε να προσαρμόσει αντιστάσεις εισόδου με αντιστάσεις εξόδου, να ισορροπήσει διαφορετικές τάσεις, να κολλήσει καλώδια. Τώρα, αρκεί να συνδέσει με κατάλληλο καλώδιο την έξοδο MIDI OUT του πρώτου οργάνου με την είσοδο MIDI IN του δεύτερου και να υλοποιήσει αρχιτεκτονική πελάτη-εξυπηρέτη (client-server), όπου το δεύτερο συνθεσάιζερ παίζει ότι και το πρώτο. Θεωρητικά αυτή η αρχιτεκτονική επεκτείνεται σε άπειρες συνδέσεις.

 

Ακόμα πιο σημαντικό είναι το γεγονός ότι η σύνδεση αυτή μπορεί να υλοποιηθεί ανάμεσα σε υπολογιστή και συνθεσάιζερ. Το πρότυπο MIDI εξασφαλίζει ότι οι νότες και η υπόλοιπη μουσική πληροφορία που πρόκειται να παιχτούν μεταφέρετε σωστά από τον υπολογιστή στο μουσικό όργανο.

 

 

2. Βασικές έννοιες του MIDI

 

Απ’ ότι φαίνεται λοιπόν, το πρότυπο MIDI κωδικοποιεί βασικές λειτουργίες των ηλεκτρονικών μουσικών οργάνων.

 

Μερικές από τις βασικές αυτές λειτουργίες περιγράφονται ευθύς αμέσως.

 

  • Master Device

 

Είναι η βασική μονάδα ελέγχου του συγκροτήματος από συνδεδεμένα μουσικά όργανα. Η συνηθέστερη μονάδα αυτού του τύπου είναι ο ίδιος ο υπολογιστής.

 

  • Keyboard Controllers

 

Πρόκειται για μουσικά όργανα που μπορούν να ανταλλάξουν MIDI σήματα, αλλά συνήθως δεν παράγουν τόνους ή άλλους ήχους. Χρησιμοποιούνται σαν ελεγκτές ομάδων (cluster controllers) άλλων MIDI οργάνων.

 

  • Keyboard Synthesizers

 

Αυτά είναι μουσικά όργανα που παίζουν την μουσική που έχει κωδικοποιηθεί στο πρότυπο MIDI. Διαθέτουν δυνατότητες παραγωγής ήχου και μπορούν να χρησιμοποιηθούν και σαν κύριες συσκευές σε σύνδεση κύριου-υποτελή (master-slave).

 

  • Slave Devices

 

Αυτές είναι οι συσκευές που ελέγχονται από τα συνθεσάιζερ της προηγούμενης κατηγορίας. Συνήθως είναι όργανα που ειδικεύονται στην παραγωγή ειδικών εφφέ ή παράγουν ήχους τύμπανων ή λοιπών κρουστών οργάνων ή είναι οι λεγόμενοι expanders.

 

  • Expanders

 

Τα όργανα αυτά είναι συνθεσάιζερ χωρίς πληκτρολόγια και γι’ αυτό είναι υποτελείς στις master-slave συνδέσεις. Προτιμώνται γιατί είναι φθηνότερα και ελαφρύτερα από τα πλήρη συνθεσάιζερ και χρησιμεύουν για ενδιάμεσες ή τελικές βαθμίδες σε μεγάλες αλυσίδες MIDI συστημάτων.

 

Πολλές φορές η ίδια κάρτα ήχου χρησιμοποιείται ως expander. Δηλαδή μπορεί να παίξει κομμάτια MIDI μουσικής χωρίς να υπάρχει σύνδεση με συνθεσάιζερ χρησιμοποιώντας τις DSP δυνατότητες που έχει.

 

  • Sequencers

 

Οι sequencers είναι συσκευές ή προϊόντα λογισμικού όπου μπορεί να καταγραφεί με όρους MIDI μια μουσική σύνθεση. Σε πολλούς sequencers μπορεί να καταγράψει κανείς και μουσικές φράσεις που παίζει σε συνδεδεμένο συνθεσάιζερ.

 

  • Drum Machines

 

Αποκαλούνται επίσης και drum computers. Πρόκειται για συσκευές που χρησιμεύουν για την παραγωγή των χτυπημάτων του ρυθμού και γενικά για την προσομοιωμένη παραγωγή ήχου κρουστών οργάνων (percussion). Σαν μελωδικά ηλεκτρονικά όργανα επικοινωνούν με το πρότυπο MIDI.

 

  • Velocity

 

Με την έννοια της ταχύτητας προσπαθούμε να καλύψουμε το γεγονός ότι έχει σημασία για την παραγωγή του ήχου ο τόπος και η ταχύτητα που ο εκτελεστής μουσικής φράσης χτυπάει τα πλήκτρα του οργάνου ή του κρουστού ή με ποια ταχύτητα χειρίζεται τις χορδές του έγχορδου οργάνου. Τα πιο πολλά πληκτρολόγια MIDI αναγνωρίζουν την παράμετρο αυτή και συνεπώς μπορούμε να κωδικοποιήσουμε την ένταση της ταχύτητας εκτέλεσης των νότων. Αυτό τελικά μεταφράζεται σε ένταση του ηχητικού σήματος για τις παραγόμενες νότες. Το σύστημα MIDI αναγνωρίζει 128 διαφορετικές στάθμες ταχύτητας. Αυτή η κβάντωση γενικά θεωρείται περιορισμένη σε σχέση με τις λεπτές διαφοροποιήσεις που μπορούν να πετύχουν εμπνευσμένοι μουσικοί με ακουστικά όργανα.

 

  • Aftertouch

 

Το γνώρισμα αυτό αναφέρεται στο βαθμό πίεσης που ασκείται σε ένα πλήκτρο την ώρα που παίζει μια νότα μέχρι ο μουσικός εκτελεστής να το απελευθερώσει. Και πάλι το πρότυπο MIDI διακρίνει 128 διαφορετικές στάθμες κβάντωσης του aftertouch.

 

Έχουμε δύο είδη aftertouch: το μονοφωνικό και το πολυφωνικό. Στο μονοφωνικό το όργανο αισθάνεται την πίεση μόνο του ισχυρότερα πιεζόμενου πλήκτρου της συγχορδίας ενώ στο πολυφωνικό το όργανο ανιχνεύει την πίεση κάθε πλήκτρου της συγχορδίας και τα αποδίδει το καθένα ξεχωριστά.

 

  • Pitch bend

 

Ένα καλό MIDI οφείλει να μην αναγνωρίζει τις νότες ως δεδομένες και άκαμπτες συχνότητες. Καλό θα ήταν να μπορούσε να λυγίσει τις νότες που παίζει, όπως για παράδειγμα μία κιθάρα γλιστράει λίγο πιο πάνω ή λίγο πιο κάτω από τη συχνότητα δεδομένης νότας.

 

  • Τα κανάλια του MIDI

 

Χωρίς να υπάρχει προδιαγραφή για τον αριθμό των καναλιών, τα καλά MIDI συστήματα προσφέρουν τουλάχιστον 11 κανάλια για FM σύνθεση. Αυτό σημαίνει πως μπορεί το σύστημα να αποδώσει ταυτόχρονα 11 ήχους ή μουσικά όργανα παίζοντας ενορχηστρωμένα μουσικά κομμάτια.

 

 

3. Ο κώδικας MIDI

 

Το πρώτο βασικό μήνυμα που πρέπει να κωδικοποιηθεί είναι ο αριθμός των καναλιών και το όργανο το οποίο παίζεται σε κάθε κανάλι. Κάθε ένα λοιπόν κανάλι είναι μονοφωνικό και από τη διαχείριση του MIDI μπορούμε να βλέπουμε ποιο κανάλι παίζεται κάθε φορά. Αν έχουμε δεύτερη ή τρίτη φωνή με το ίδιο όργανο, τότε έχουμε πολλαπλά κανάλια του ίδιου οργάνου.

 

 

Κανάλι MIDI

Ήχος

Αριθμός Φωνών

1

Πιάνο(1)

Μονοφωνική

2

Πιάνο(2)

Μονοφωνική

3

Μπάσο

Μονοφωνική

4

Έγχορδα

Μονοφωνική

5

Κόρνα

Μονοφωνική

...

......

 

8

Χορωδία

Μονοφωνική

 

 

Αφού περιγραφεί σε κάθε κανάλι το όργανο που παίζεται, το MIDI πρωτόκολλο στέλνει πληροφορίες ξεχωριστά για κάθε όργανο των μεγεθών που περιγράψαμε στην προηγούμενη παράγραφο. Για λόγους συντομίας δεν θα επεκταθούμε στην αρκετά πολύπλοκη κωδικοποίησή τους.

 

Κάθε μουσικό γεγονός που περιγράφεται στο πρότυπο MIDI έχει και ένα κωδικό και οι συνδυασμοί των κωδικών σε δυαδική μορφή μεταφέρουν την πλήρη μουσική κωδικοποίηση του πενταγράμμου μέσω του προτύπου.

 

Για παράδειγμα, μερικά από τα μουσικά όργανα που κωδικοποιούνται για το συνθεσάιζερ Roland MT32 και όσα ακολουθούν την κωδικοποίηση αυτού είναι ορατά στο επόμενο σχήμα.

 

 

 

 

Πρέπει να σημειώσουμε σ’ αυτό το σημείο πως το πρότυπο MIDI είναι αρκετά ευέλικτο και πως επιτρέπει την ανακατανομή των τιμών 0 έως 127 που αποδίδονται στα διάφορα μουσικά όργανα με σκοπό τη διασύνδεση οποιουδήποτε συνθεσάιζερ με υπολογιστή, αρκεί αυτό για την ύπαρξη ελάχιστης συμβατότητας να υποστηρίζει το γενικό πρότυπο MIDI. Αυτή τη διαδικασία μπορεί να την κάνει ο κάθε χρήστης MIDI σε επίπεδο λειτουργικού συστήματος.

 

Από τα λίγα εισαγωγικά στοιχεία του MIDI που είδαμε, φαίνεται καθαρά πως το MIDI είναι κάτι περισσότερο από ένα πρωτόκολλο ή ένα σύνολο προτύπων. Θα λέγαμε πως είναι περισσότερο μια νέα μουσική γλώσσα για την ψηφιακή περιγραφή των μουσικών γεγονότων.

 

Μην σχηματίσετε όμως την εντύπωση πως ολόκληρη η κωδικοποίηση του γενικού προτύπου MIDI μπορεί να επαναπροσδιοριστεί. Μόνο ορισμένες λειτουργίες διασύνδεσης επαναπροσδιορίζονται, χωρίς να επιτρέπεται η επέκταση πέρα από αυτές. Αυτή είναι και η μεγαλύτερη αδυναμία της γλώσσας του MIDI.