Bing

Η Microsoft Research δημιουργεί ένα σύστημα ικανό να δημιουργεί αυτόματα «έξυπνους» λεζάντες

Πίνακας περιεχομένων:

Anonim

Σίγουρα έχετε συναντήσει μια λεζάντα που προκαλεί σύγχυση, λανθασμένη ή λέει λίγα για την εικόνα στην οποία αναφέρεται. και είναι ακόμη πιθανό, εάν αφοσιωθείτε στη δημοσίευση των δικών σας άρθρων, να βρείτε το πιο κουραστικό για να συμπληρώσετε αυτήν την ενότητα. Λοιπόν, οι άνθρωποι από το Ρέντμοντ δημιούργησαν ένα εργαλείο που στοχεύει να διευκολύνει τα πράγματα για εσάς.

Ένα έργο που δημοσιεύτηκε από τη Microsoft Research που αυτοχαρακτηρίζεται ως «σύστημα δημιουργίας λεζάντας» ικανό να μιμείται τα αφηγηματικά χαρακτηριστικά της ανθρώπινης γλώσσας, δηλαδή μια τεχνολογία που μπορεί να περιγράψει στιγμιότυπα οθόνης σαν να ήταν ένας από εμάς, με το αντίστοιχο πλαίσιο.Κάτι που εργάζονται εδώ και καιρό εταιρείες όπως το Facebook, η Microsoft και η Google, αλλά αυτή τη φορά ξεπερνά τις προσδοκίες.

Από τι αποτελείται

Πέρασε υπέροχα

Με αυτόν τον τρόπο, το σύστημα έχει τη δυνατότητα ακόμη και να αφηγηθεί μια πλήρη ιστορία από πολλές εικόνες, περιγράφοντάς την και λέγοντάς την σαν να ήταν ένα βιβλίο. Ένα βοηθητικό πρόγραμμα που, σύμφωνα με τους ειδικούς, θα μπορούσε να καταλήξει να γίνει ένα χαρακτηριστικό που παρέχει μια πιο ανθρώπινη επαφή σε ορισμένες εφαρμογές, εφαρμογές αναγνώρισης φωνής, αυτόματη δημιουργία περιγραφών σε άλλες περιοχές και πολλά άλλα.

Και το γεγονός είναι ότι το εργαλείο δεν περιορίζεται στο να λέει, εν συντομία, αυτό που «βλέπει», αλλά μάλλον παρέχει μια ευρύτερη πλαίσιο της κατάστασης που αντικατοπτρίζεται στην εικόνα, επιτυγχάνοντας ένα «αφηγηματικό πλαίσιο και μοναδικό στυλ αφήγησης», εξήγησε ο Frank Ferraro, ένας από τους συγγραφείς αυτού του έργου.Για να βάλουμε τον εαυτό μας σε μια κατάσταση, μας δίνει ένα ξεκάθαρο παράδειγμα

Η μητέρα του ήταν περήφανη για αυτόν

Έτσι, προτείνουμε την ακόλουθη περίπτωση: «Ας φανταστούμε ότι έχουμε ένα φωτογραφικό άλμπουμ μερικών φίλων που έχουν γιορτάσει γενέθλια σε ένα Καπηλειό. Μερικές από τις πρώτες εικόνες δείχνουν ανθρώπους να παραγγέλνουν μπύρα και να την πίνουν, ενώ οι τελευταίες δείχνουν κάποιον να κοιμάται σε έναν καναπέ», σχολιάζει.

Ένα συμβατικό σύστημα «θα μπορούσε απλώς να δείχνει κάτι σαν να υπάρχει ένα άτομο ξαπλωμένο σε έναν καναπέ, ενώ το σύστημά μας θα μπορούσε να περιλαμβάνει ότι πιθανότατα βρίσκεται σε αυτήν την κατάσταση επειδή είναι μεθυσμένος μετά από μερικά ποτά». Μια προσθήκη που παρέχει κατανόηση και μια συγκεκριμένη συναισθηματική φόρτιση που αντικατοπτρίζεται επίσης στις εικόνες και τις λεζάντες φωτογραφιών που περιλαμβάνονται σε αυτό το άρθρο.

Μέσω | Ανασκόπηση τεχνολογίας MIT

Σε Xataka Windows | Η Microsoft κυκλοφορεί μια εφαρμογή που καθορίζει τη φυλή του σκύλου σας

Bing

Η επιλογή των συντακτών

Back to top button