άποια στιγμη στην εξέλιξη των ηλεκτρονικων υπολογιστων,…

«- Μα, καλα ρε Εργοδότη!», θα φωνάξετε! (Και με το δίκιο σας!) «Εμεις εδω είμαστε όλο αυτια και σε παρακολουθούμε, επειδη μιλούσες για περίεργες πέτρινες πινακίδες! Ξαφνικα ξεκίνησες να μας μιλας για υπολογιστες; Πέσ’ το μας ότι χάζεψες, να πάμε να κάνουμε καμια χρήσιμη δουλεια και να μη χάνουμε το χρόνο μας με σένα!»

Μη σκιάζεστε, ωρε! Ποτέ δεν ξέφυγα απ’ το θέμα μας!

Λοιπον… Κάποια στιγμη στην εξέλιξη των ηλεκτρονικων υπολογιστων, ήθελαν να κάνουν τους υπολογιστες να μιλάνε! (Μέσω της κάρτας ήχου, βεβαίως.) Και κάποια στιγμη, πιο πρόσφατα, ήθελαν να τους κάνουν και ν’ ακούνε! (Μέσω μικροφώνου και κάρτας ήχου, ξαναβεβαίως! Η «αναγνώριση φωνης», που λένε.)
Όλα καλα με τα παραπάνω, αλλα εκτος απ’ την τεχνολογία, χρειάζεται και η θεωρητικη ανάλυση!
Το μίλημα το κατάφεραν σχετικα εύκολα, αλλα την αναγνώριση… Η αναγνώριση φωνης στην Αγγλικη έχει χρόνια στην πιάτσα, θα μου πείτε! Το ξέρω, αλλα τί γίνεται με την αναγνώριση φωνης στην Ελληνικη;

Κοιτάχτε πού βρισκόμαστε γενικως:

Τεχνολογικως:

  • Η αναπαραγωγη φωνης γίνεται πλέον επιτυχως και με κάρτες ήχου των 20 λεπτων του ευρω κόστος εργοστασίου. Έχει γίνει απ’ το 1985.
  • Η αναγνώριση φωνης απαιτει 64-μπιτο προσέσσορα, πλην όμως, όπως είναι τώρα τα πισια με τα Παραθύρια της Ακατονόμαστης, είτε έχουν σκέτους 64-bits Pentiums, είτε 2-πύρηνους, είτε 4-πύρηνους, χαμένοι πάνε! Αυτη η δουλεια πρέπει να γίνεται επάνω στην κάρτα ήχου (πράγμα που σημαίνει 24-bit adc και μια κάρτα ήχου-θηρίο, με ανεμιστηράκια κι έτσι), κι όχι ν’ απασχολείται ο κεντρικος προσέσσορας, διότι με τις καθυστερήσεις που εισάγουν τα διάφορα λειτουργικα συστήματα της πλάκας, είναι σα να μιλας σε …καθυστερημένο παιδι! 🙂 (Επομένως, δώρον-άδωρον το 4-πύρηνο!) Ίσως έχετε ακούσει για εφαρμογες αναγνώρισης φωνης και στα Ελληνικα, αλλα θα σας πω ότι είναι μάλλον μεσοβέζικες λύσεις. Το γιατί, αμέσως παρακάτω.

Σε επίπεδο θεωρητικης ανάλυσης:

  • Τόσο η αναπαραγωγη φωνης, όσο και η αναγνώρισή της, απαιτουν την φωνητικη ανάλυση της γλώσσας που θέλουμε. Αυτη τη δουλεια βασικα την έκανε η Γλωσσολογία, και την πήραν και την επεξέτειναν οι τεχνικοι των υπολογιστων. Η Γλωσσολογία, λοιπον, αναλύει τις γλώσσες σε απλούστατους φθόγγους (μη αναλυόμενους σε παρακάτω επίπεδο), που λέγονται αλλόφωνα (allophones). Έτσι, για να κάνουμε τους υπολογιστες να συνεννοούνται (με τις αφεντομουτσουνάρες μας) σε προφορικα Ελληνικα, πρέπει πρώτα να βρούμε τα ελληνικα αλλόφωνα. Μπορείτε να πάρετε μια ιδέα για το θέμα εδω: http://www.webtopos.gr/eng/languages/greek/gre_ipa_3.htm ‘Ντάξ’ μέχρι εδω; ‘Ντάξ’!

Προσωπικα, και χωρις να είμαι γλωσσολόγος, είχα διαπιστώσει τη σημασία αυτου του θέματος, όταν -πριν χρόνια- διάβαζα για το μυκηναϊκο αλφάβητο. Η γραπτη μυκηναϊκη Ελληνικη έχει έμφυτη ανακρίβεια (δηλ. ασυμφωνία με την προφορικη αντίστοιχη) της τάξης του 40% (σαράντα τοις εκατο)! Η αττικη διάλεκτος του χρυσου αιώνα (με πχ τα ρήματα άλλοτε σε -ει, άλλοτε σε -οι, άλλοτε σε -ηι), έχει ανακρίβεια 5%. και η σημερινη Ελληνικη (σαφως πιο χύμα) έχει περίπου 15%. (Όλα τα ποσοστα απο προσωπικους υπολογισμους.)

Πχ: γράφουμε «πιό πάνω», αλλα αν το προφέρουμε όπως το βλέπουμε, δεν είμαστε Έλληνες. Είμαστε …Ολλανδοι ελληνιστες! 🙂 Κανονικα προφέρουμε «πχιόπάνο»! Ακούγεται ένα βαρβάτο δίγαμμα (στη θέση του πρώτου γιώτα), κι όσοι σκαμπάζουν απο Μουσικη, θα ξέρουν πως ο πρώτος τόνος είναι «δίς ισχυρός», ενω ο δεύτερος «άπαξ ισχυρός». Φυσικα, αν θέλουμε ακριβέστατη περιγραφη του πώς ανεβαίνει και κατεβαίνει η φωνη, θα χρειαστούμε πεντάγραμμο! (Όχι πεντάγραμμο, παλμογράφο θα χρειαστούμε! Και πρόγραμμα υπολογιστη για pattern recognition του φωνογράμματος των ομιλούντων στο μικρόφωνο, να μας βγάλει γενικο κανόνα του πώς προφέρεται το κάθε γράμμα, ανεξάρτητα απο χροια φωνης!)

Η Πληροφορικη, τώρα, δεν είναι -δυστυχως- αγαθο που δίδεται τζάμπα! Είναι δίδυμη αδελφη της Οικονομίας!… (Διότι οι καλύτεροι πελάτες των νέων τεχνολογιων είναι πάντα οι φραγκάτοι: Πανεπιστήμια, μεγάλοι οργανισμοι, τράπεζες, μυστικες «υπερεσίες», στρατος. Μετα -και με καθυστέρηση- ακολουθει η πλέμπα!) Επομένως, έπρεπε πρώτα να βρεθουν χρήματα για τη μελέτη της Ελληνικης…
…η οποία Ελληνικη γίνεται κατανοητη και ομιλείται παγκοσμίως απο περίπου 20 μύρια άτομα. Περίπου 10 οι γηγενεις, συν 5 οι μετανάστες μας, συν άλλα 5 οι λαθρομετανάστες στην Ελλάδα και κάποιοι ελληνίζοντες ξένοι. Δεν είναι παραπάνω! (Να μη μιλήσουμε για αριθμο αντιτύπων σε βιβλία, συγκριτικα με Αγγλικη ή Ισπανικη.)

Η οποιαδήποτε μελέτη σκοπιμότητας, όμως, για αγοραστικο κοινο μάξιμουμ 20 μυρίων ατόμων, λέει πως στην πράξη δεν υπάρχει οικονομικο όφελος να προχωρήσει! Έλα, όμως, που η ένταξή μας στην ΕΕ έχει μερικα καλα!… Τέλος δεκαετίας 1980 – αρχες δεκαετίας 1990 ξεκίνησε στις Βρυξέλλες (ξέρετε: θηρίον 666, οξαποδω, κτλ) το project για τη φωνητικη ανάλυση όλων των γλωσσων της ΕΕ, μεταξυ των οποίων και η Ελληνικη!
Πιστεύω, λοιπον, πως σήμερα αυτο το project έχει τελειώσει, και περιμένουμε την πρακτικη εφαρμογη. (Δυστυχως δεν βρίσκω σχετικο link με αναζήτηση «greek voice recognition». Ίσως έμμεσα, με «european projects»… αλλα ποιος ψάχνει!)

Το «δια ταύτα» όλων των παραπάνω:

Όταν κάποτε (το 1985 περίπου) πρωτο»μίλησαν» Ελληνικα οι υπολογιστες, ανάλυση για τα ελληνικα αλλόφωνα δεν είχε γίνει! Οι κάρτες ήχου είχαν «δανειστει» τα αλλόφωνα της Ιταλικης, τα οποία μοιάζουν με τα δικα μας, και είναι περίπου 150!
Σήμερα, που έχει τελειώσει η ανάλυση της Ελληνικης, οι πληροφορίες μου λένε πως τα ελληνικα αλλόφωνα υπερβαίνουν τα 400!

Καταλαβαίνετε τώρα τα περι πεντακοσίων «γραμμάτων» του προηγούμενου post;

Αφου, λοιπον, πήρατε όλη αυτη την θεωρητικη κατάρτιση ως υπόβαθρο, θα συνεχίσουμε στο επόμενο!

Υγ: Ειρήσθω εν παρόδω ότι η Πληροφορικη κακως, κάκιστα θεωρείται αγαθο για τους νέους. (Πράγμα που σημαίνει υπερπαραγωγη τεχνολογικων σκουπιδιων – άϊποντζ και τέτοιες αρλούμπες.) Τί γίνεται, όμως, όταν ένα γεροντάκι ζει μόνο του, και ασθενήσει και δεν έχει τη δύναμη ούτε να φτάσει μέχρι το τηλέφωνο να καλέσει τον γιατρο (ή βοήθεια); Πόσες και πόσες τέτοιες ιστορίες συνανθρώπων μας, έ; Και μας πιάνει η συμπόνοια, όταν ακούμε ότι ο καύσωνας σκότωσε στην Αθήνα 20 μοναχικους ηλικιωμένους, έ;
Κι όμως! Δεν βρέθηκε ούτε ένας, ούτε ένας απο τους 200,000 (ναι! διακόσιες χιλιάδες!) εγχώριους κατόχους πανεπιστημιακων (και ΤΕΙτζήδικων) τίτλων Πληροφορικης, να φτιάξει ένα ρομποτάκι με αναγνώριση φωνης, να βοηθάει τους ηλικιωμένους (ακόμη και κάνοντας τηλεφωνήματα, και …μιλώντας στον γιατρο) – κι αυτος να θησαυρίσει απο μια παρθένα αγορα! (Διότι οι καλοι άνθρωποι πρέπει και ν’ αμείβονται.) Μόνο να κάνουν φασαρία για διορισμο στο Δημόσιο ξέρουν οι τιτλούχοι!…

Άντε, σας έδωσα μια χρυσοφόρα ιδέα, και δεν θέλω ούτε ποσοστα, ούτε τίποτε!…

Advertisements