Πώς λειτουργεί το Skype Translator
Πίνακας περιεχομένων:
- Η τεχνολογία που το κάνει δυνατό
- Από μια προφορική γλώσσα σε μια άλλη σε λίγα δευτερόλεπτα
- Το πρόγραμμα δοκιμής ως σημείο εκκίνησης
Η επιστημονική φαντασία είναι γεμάτη αναφορές σε προηγμένες τεχνολογικά συσκευές των οποίων η λειτουργία, για να παραφράσουμε τη μυθική έκφραση, δεν διακρίνεται από τη μαγεία. Προερχόμενοι από το δημιουργικό μυαλό των συγγραφέων τους, είναι δύσκολο να φανταστούμε πότε τέτοιες εφευρέσεις θα μπορούσαν να βρίσκονται στα χέρια μας και καταλήγουμε να αποδεχόμαστε ότι η ύπαρξή τους δεν θα γίνει μέρος του κύκλου ζωής μας. Αλλά κάθε τόσο ένα από αυτά μπαίνει κρυφά στη ζωή μας πρόωρα. Αυτή είναι η περίπτωση της της μετάφρασης σε πραγματικό χρόνο που πρόκειται να καταστήσουν δυνατή η Microsoft και το Skype
"Η εργασία κάθε άλλο παρά απλή είναι.Περιλαμβάνει τη δυνατότητα του Skype για τηλεδιάσκεψη, το τεράστιο δίκτυο διακομιστών cloud του Microsoft Azure, τις τεχνολογικές καινοτομίες της Microsoft Research και τις πρόσφατες εξελίξεις σε πολλούς τομείς όπως τα στατιστικά στοιχεία και η μηχανική μάθηση. Όλα αυτά τίθενται στη διάθεσή σας έτσι ώστε, μόλις προφέρετε μια πρόταση στη γλώσσα σας, το σύστημα αναγνωρίζει αυτό που λέτε, το μεταφράζει και το μεταδίδει στην επαφή σας σε διαφορετική γλώσσα. Πως είναι δυνατόν?"
Η τεχνολογία που το κάνει δυνατό
Skype Translator, το όνομα με το οποίο είναι γνωστή η νέα λειτουργικότητα, δεν είναι ένα φλας στο τηγάνι, ούτε σε ένα χρόνο . Το Skype Translator είναι το αποτέλεσμα δεκαετιών έρευνας στις τεχνικές αναγνώρισης ομιλίας, μηχανικής μετάφρασης και μηχανικής μάθησης. Σε όλους αυτούς τους τομείς στηρίζεται η λειτουργία ενός συστήματος που δεν θα ήταν δυνατή χωρίς τις τελευταίες εξελίξεις σε αυτούς.
Το Skype Translator είναι το αποτέλεσμα δεκαετιών έρευνας στις τεχνικές αναγνώρισης ομιλίας, μηχανικής μετάφρασης και μηχανικής μάθησης.Ξεκινώντας με Αναγνώριση ομιλίας, μια τεχνολογία που ήταν υπό διερεύνηση εδώ και αρκετό καιρό, αλλά η υιοθέτησή της επηρεαζόταν πάντα από τον μεγάλο αριθμό σφαλμάτων και υπερβολικής ευαισθησίας των υπαρχόντων συστημάτων. Ένα δευτερόλεπτο αμφιβολίας, μικρές παραλλαγές στην προφορά ή ένας ελάχιστος θόρυβος ήταν αρκετό για να μπερδέψει τον υπολογιστή και να τον κάνει να καταλάβει τι ήθελε. Έτσι ήταν μέχρι που ξέσπασε η ανάπτυξη τεχνικών «deep learning» και η δημιουργία τεχνητών νευρωνικών δικτύων, για τα οποία η Microsoft Research γνωρίζει κάτι. Χάρη σε αυτά, κατέστη δυνατό να μειωθεί σημαντικά το ποσοστό σφαλμάτων και να βελτιωθεί η αξιοπιστία και η ευρωστία της αναγνώρισης ομιλίας, ένα απαραίτητο πρώτο βήμα για τη λειτουργία του Skype Translator.
μηχανική μετάφραση είναι ο άλλος προφανής πυλώνας στον οποίο στηρίζεται το Skype Translator. Εδώ η Microsoft χρησιμοποιεί για άλλη μια φορά εσωτερική τεχνολογία και χρησιμοποιεί τη μηχανή μετάφρασης Bing για τη μετάφραση κειμένου από τη μια γλώσσα στην άλλη.Το σύστημά του χρησιμοποιεί έναν συνδυασμό τεχνικών αναγνώρισης σύνταξης και στατιστικών μοντέλων για να βελτιώσει το αποτέλεσμα. Επιπλέον, σε αυτήν την περίπτωση, ο κινητήρας έχει εκπαιδευτεί ειδικά για να αναγνωρίζει τον τύπο της γλώσσας που εμφανίζεται στις προφορικές συνομιλίες, μακριά από την ορθότητα και την καθαρότητα που συνήθως υποτίθεται γραπτώς. Έτσι, το σύστημα Skype Translator συνδυάζει την τεράστια γλωσσική βάση του Bing Translator μαζί με ένα εκτεταμένο επίπεδο λέξεων και φράσεων που χρησιμοποιούνται συνήθως στην καθομιλουμένη.
Αλλά ο λόγος και οι γλώσσες είναι περίπλοκα εδάφη. Αλλάζουν συνεχώς, κυκλοφορούν σε πολλές γεύσεις και ποικιλίες, κάθε άτομο έχει το δικό του ιδιαίτερο στυλ κ.λπ. Το Skype Translator πρέπει να συμβαδίζει με όλα αυτά, απαιτώντας συνεχή εκπαίδευση και βελτιστοποίηση τόσο της αναγνώρισης ομιλίας όσο και της αυτόματης μετάφρασης. Για να γίνει αυτό το σύστημα έχει κατασκευαστεί σε μια ισχυρή πλατφόρμα «μηχανικής εκμάθησης», ένας κλάδος της τεχνητής νοημοσύνης που στοχεύει στην ανάπτυξη τεχνικών που επιτρέπουν σε μηχανές και αλγόριθμους να μαθαίνουν με εκπαίδευση με δείγματα δεδομένων.Η χρήση αυτών των τεχνικών, κοινών στον τομέα της στατιστικής, επιτρέπει στην υπηρεσία να βελτιώνεται καθώς χρησιμοποιείται, εκμεταλλευόμενη τα δεδομένα που δημιουργούνται κατά τη χρήση της για να βελτιώσει περαιτέρω την αναγνώριση ομιλίας και την αυτόματη μετάφραση.
Μερικά από αυτά τα δεδομένα δοκιμής δημιουργούνται αυτόματα από μια μεγάλη ποικιλία πηγών, συμπεριλαμβανομένων κοινωνικών δικτύων όπως το Facebook, μεταφρασμένες ιστοσελίδες, βίντεο με υπότιτλους ή ακόμα και συνομιλίες που έχουν δημιουργηθεί για το σκοπό αυτό και μεταγράφονται και μεταφράζονται με μη αυτόματο τρόπο . Αλλά ένα άλλο μέρος των δεδομένων προέρχεται από πραγματικές συνομιλίες που πραγματοποιούνται μέσω της υπηρεσίας. Αυτό είναι σημαντικό γιατί, όπως σας ειδοποιεί η Microsoft με κάθε κλήση, θα πρέπει να γνωρίζετε ότι το Skype Translator μπορεί να καταγράφει συνομιλίες, διατηρώντας τις ανώνυμες, ώστε να μπορούν αργότερα να αναλυθούν με τους αλγόριθμούς του και εισάγονται στη διαδικασία εκπαίδευσης των στατιστικών τους μοντέλων.
Ο μεταφραστής Skype μπορεί να λειτουργήσει σωστά μόνο εάν είναι σε θέση να μάθει μέσω μιας διαδικασίας που βασίζεται στη χρήση του σε πραγματικές ανθρώπινες συνομιλίες
"Το σύστημα δεν θα μπορούσε να λειτουργήσει χωρίς αυτήν τη διαδικασία εκμάθησης. Καθώς οι άνθρωποι μιλούν, σταματάμε και επαναλαμβάνουμε τα πράγματα, κάνουμε λάθη και αλλάζουμε τη σκέψη μας καθώς προχωράμε, εισάγοντας ahs, ehms, uhms>μόνο η εκμάθηση της πραγματικής χρήσης του μπορεί να το κάνει καλύτερο "
Από μια προφορική γλώσσα σε μια άλλη σε λίγα δευτερόλεπτα
Υποστηρίζεται από όλες αυτές τις προόδους, το κλειδί είναι ότι ο Μεταφραστής Skype είναι σε θέση να εκτελέσει ολόκληρη τη διαδικασία αναγνώρισης και μετάφρασης γρήγορα και με διαφάνεια για τον χρήστη Κάθε φορά που μιλάμε, το σύστημα πρέπει να αναγνωρίζει αυτό που λέμε, να το μεταφράζει στη γλώσσα του παραλήπτη και να του το μεταδίδει με τρόπο που να παραμένει πιστός σε αυτό που αρχικά προσπαθούσαμε να επικοινωνήσουμε.Όσο λιγότερο παρατηρούμε τα ενδιάμεσα βήματα τόσο το καλύτερο.
Μόλις το σύστημα εντοπίσει ότι μιλάμε, αρχίζει να καταγράφει αυτό που λέμε και ξεκινά τη διαδικασία αναγνώρισης ομιλίας Αυτό δεν είναι όχι μόνο να αναγνωρίσουμε κάθε λέξη που προφέρουμε, αλλά και να εξαλείψουμε οτιδήποτε περιττό, διαγράφοντας άσκοπες εκφράσεις και θόρυβο, ανιχνεύοντας τη διαίρεση του κειμένου σε προτάσεις, με τη συμπερίληψη σημείων στίξης και κεφαλαίων γραμμάτων και παρέχοντάς του ένα πλαίσιο αυτό βοηθά στην ερμηνεία σας. Όταν το σκέφτεσαι λίγο, συνειδητοποιείς πόσο δύσκολο είναι να τα προσδιορίσεις όλα αυτά από τον προφορικό λόγο.
ΤοSkype Translator χρειάζεται η αναγνώριση ομιλίας να είναι όσο το δυνατόν ακριβέστερη, γιατί αυτό που ακολουθεί είναι προετοιμασία των πληροφοριών που συλλέγονται για να τις συγκρίνει με τα στατιστικά μοντέλα που έχουν βελτιωθεί μέσω του συστήματος «μηχανικής εκμάθησης».Εδώ η διαδικασία συνίσταται στην εύρεση ομοιοτήτων μεταξύ αυτού που το σύστημα έχει καταλάβει ότι λέγαμε και των λέξεων και των συμφραζόμενων που περιέχονται στα μοντέλα, για να εφαρμοστούν στη συνέχεια μετασχηματισμοί που έχουν μάθει προηγουμένως που θα μετατρέψουν τον ήχο σε κείμενο και θα τον μεταφράσουν στην ξένη γλώσσα.
Στο τελευταίο βήμα, το Skype ετοίμασε ένα ζευγάρι bots, με γυναικείες και ανδρικές φωνές, που λειτουργούν ως διερμηνείς στην κλήση Μόλις επιλεγεί ένας από τον χρήστη, θα είναι υπεύθυνος για την επικοινωνία του μεταφρασμένου μηνύματός μας στον παραλήπτη, έτσι ώστε όχι μόνο οι γραπτές μεταγραφές και μεταφράσεις να εμφανίζονται στην οθόνη, αλλά και να μπορεί να τις ακούσει δυνατά σαν να ήταν ένας τρίτος άνθρωπος. μεσολαβεί μεταξύ μας.. Αυτά τα ρομπότ είναι σε θέση να επικοινωνούν γρήγορα το μήνυμα, έτσι ώστε όποιος ακούει στην άλλη πλευρά της οθόνης να λαμβάνει το μήνυμα λίγα δευτερόλεπτα αφού το προφέρουμε.
Το πρόγραμμα δοκιμής ως σημείο εκκίνησης
Ακριβώς η παρουσία ρομπότ ως ομιλητών τρίτων στη συνομιλία είναι μία από τις λεπτομέρειες που μένει ακόμη να γυαλιστεί. Η Microsoft αναγνωρίζει ότι η προσαρμογή σε αυτές είναι εύκολη για άτομα που συνηθίζουν να μιλούν μέσω διερμηνέα, αλλά για άλλους απαιτεί μια περίοδο εκμάθησης. Και είναι ότι η Microsoft και το Skype μπορεί να είναι αποφασισμένοι να δημιουργήσουν την καλύτερη εμπειρία μετάφρασης σε πραγματικό χρόνο που υπάρχει, αλλά για να το κάνουν χρειάζονται να μάθουμε τόσο τον εαυτό μας όσο και τα μηχανήματαΗ προεπισκόπηση του Skype Translator είναι μόνο ένα ακόμη βήμα σε αυτήν τη διαδικασία.
Το δοκιμαστικό πρόγραμμα κυκλοφόρησε στα μέσα Δεκεμβρίου, εισάγοντας την προφορική μετάφραση μεταξύ δύο γλωσσών: αγγλικά και ισπανικά, και γραπτή μετάφραση σε περισσότερες από 40 Για την πρόσβαση σε αυτό είναι απαραίτητη μια πρόσκληση, την οποία μπορούμε να ζητήσουμε κάνοντας εγγραφή στην ιστοσελίδα του προγράμματος. Αν μας χαρίζει, μπορούμε να δοκιμάσουμε το Skype Translator από τις εφαρμογές Skype για Windows 8.1 ή Windows 10 Τεχνική προεπισκόπηση. Διαφορετικά, θα πρέπει να περιμένουμε να επεκταθεί η υπηρεσία και να δημοσιοποιηθεί επίσημα.
"Ούτως ή άλλως, το Skype Translator ξεκίνησε τη στιγμή που πρόκειται να αποχαιρετήσουμε το 2014. Πριν τελειώσετε, σταματήστε εδώ για ένα δευτερόλεπτο και σκεφτείτε τη χρονιά που μόλις διαβάσατε: δύο χιλιάδες δεκατέσσερα>"
Μέσω | Skype Blogs I, II