Η Microsoft ανακοινώνει ότι η τεχνολογία αναγνώρισης ομιλίας της μειώνει το ποσοστό σφαλμάτων και είναι εξίσου αποτελεσματική με τους ανθρώπους
Είναι ένας από τους πυλώνες στους οποίους πολλοί επιβεβαιώνουν ότι οι διαφορετικές πλατφόρμες θα αναπτυχθούν στο άμεσο μέλλον. Δεν υπάρχει τίποτα που να αλληλεπιδρά με γραπτές εντολές ή χειρονομίες. Το μέλλον βρίσκεται στο να μιλάς με μηχανές αλλά όχι να μιλάς με ρομποτικές εντολές και αφύσικες εντολές. Θα το κάνουμε με φυσική γλώσσα, κάτι που εκτιμούμε όλο και πιο ξεκάθαρα στους προσωπικούς βοηθούς."
Και μία από τις εταιρείες που έχει μια πιο αξιοσημείωτη καριέρα με αυτή την έννοια είναι η Microsoft, μια εταιρεία που έχει μια πορεία ανάπτυξης στην οποία εργάζεται για να βελτιώνει συνεχώς την αναγνώριση φωνής των εργαζομένων στη συνέχεια στις πλατφόρμες τους.Μια τεχνολογία για την οποία έχουμε τώρα νέα από την ομάδα ανάπτυξης, νέα που μιλούν για μια μεγάλη βελτίωση που την τοποθετεί στο ίδιο επίπεδο ακρίβειας με αυτό που χρησιμοποιείται στους ανθρώπους
Με αυτή την έννοια έχουν ανακοινώσει ότι το σύστημα αναγνώρισης φωνής τους έφτασε το 5,1% στο WER, δηλαδή το σφάλμα στο ποσοστό της λέξης που χρησιμοποιείται. Για πολλούς αυτό μπορεί να μην λέει τίποτα, αλλά προκαλεί έκπληξη αν δούμε πώς αφενός αυτό το ποσοστό είναι ίδιο με αυτό που βρίσκουμε στην επικοινωνία μεταξύ των ανθρώπων
Για να γίνει αυτό, από το Redmond επέλεξαν να κάνουν χρήση βελτιωμένων μοντέλων λεκτικής και ακουστικής γλώσσας που βασίζονται στη χρήση νευρωνικών δικτύωνΑυτά είναι Συνδυάζονται με μακροπρόθεσμη αμφίδρομη μνήμη, ώστε να βελτιώνεται η ακουστική μοντελοποίηση, βελτιώνοντας έτσι την αναγνώριση χάρη σε μια πρόβλεψη των λέξεων που μπορούν να χρησιμοποιηθούν με βάση ένα ιστορικό επικοινωνίας.Αυτές οι βελτιώσεις έχουν και την υποστήριξη του cloud χάρη στην προσπάθεια που έχει κάνει η εταιρεία να βελτιώσει την υποδομή υπολογιστών cloud, ειδικά με το Azure.
Επιπλέον, αυτό σημαίνει ότι αυτό το ποσοστό σφάλματος έχει μειωθεί ως προς το περιθώριο αποτυχίας, αφού πριν ήταν στο 5,9%, υποχωρώντας έτσι από 12%, που ήταν το ποσοστό που είχε το σύστημα λιγότερο από ένα χρόνο πριν. Ως εκ τούτου, η Microsoft έχει επιτύχει ένα σύστημα αναγνώρισης ομιλίας τόσο αποτελεσματικό με αυτό των ανθρώπων και, βλέποντας την πρόοδο που ακολουθούν, δεν είναι περίεργο ότι θα το βελτιώσει ακόμη και τους επόμενους μήνες ή χρόνια.
Ποιος ξέρει εάν σε λίγα χρόνια από τώρα η συζήτηση στον υπολογιστή μας με Windows, η αλληλεπίδραση με την Cortana ή εφαρμογές όπως το Office, θα είναι κάτι τόσο φυσικό όσο αυτό που μας έχουν κάνει ήδη να ονειρευόμαστε (ή να έχουμε εφιάλτες, ποιος ξέρει) στον κινηματογράφο.
Στην Ξατάκα | Δεν είναι φωνές πέρα από τον τάφο, είναι κρυφές εντολές που οι βοηθοί φωνής αναγνωρίζουν και οι άνθρωποι όχι