23 Δεκ 2024
READING

Το Amazon ενισχύει την Alexa με περισσότερη τεχνητή νοημοσύνη από ποτέ

4 MIN READ

Το Amazon ενισχύει την Alexa με περισσότερη τεχνητή νοημοσύνη από ποτέ

Το Amazon ενισχύει την Alexa με περισσότερη τεχνητή νοημοσύνη από ποτέ

Η Amazon χρησιμοποιεί νευρικά δίκτυα και μοντέλα φυσικής γλώσσας για να βελτιώσει το ύφος της ομιλίας της Alexa, να της δώσει νέες φωνές και ακόμη και να παρατηρήσει ότι ένας χρήστης είναι δυσαρεστημένος με αυτό.

Η Amazon ανακοίνωσε μια μεγάλη παρτίδα νέων προϊόντων, καθιστώντας σαφές για άλλη μια φορά ότι θέλει να εξαπλωθεί ο ψηφιακός βοηθός της Alexa σε όσο το δυνατόν περισσότερες κατηγορίες καταναλωτικών τεχνολογιών – όχι μόνο έξυπνοι ομιλητές, αλλά και τα πάντα, από τα ακουστικά μέχρι τα γυαλιά.

Αλλά υπήρχε μια άλλη ιστορία που υφαίνεται στις ανακοινώσεις στο Σιάτλ. Περισσότερη τεχνητή νοημοσύνη, ειδικά η φυσική γλώσσα AI, βρίσκει το δρόμο της στην Alexa και με περισσότερους τρόπους.

Για αρχάριους, η Amazon λέει ότι χρησιμοποιούσε νευρικά δίκτυα για να φαίνεται η φωνή της Alexa πιο ανθρώπινη όταν μεταφράζει κείμενο όπως τα μηνύματά σε ομιλία.

Ο Rohit Prasad, ο οποίος είναι επικεφαλής της εκμάθησης μηχανών Alexa και της τεχνητής νοημοσύνης, είπε ότι αυτή η τεχνολογία επέτρεψε στο Amazon να υιοθετήσει μια εντελώς διαφορετική προσέγγιση στη δημιουργία ομιλίας.

Στο παρελθόν, οι αλγόριθμοι της Alexa έσπαζαν τη γλώσσα σε κομμάτια λέξεων ή φωνητικούς ήχους, και στη συνέχεια προσπάθησαν να τους στοιχίσουν όσο το δυνατόν ομαλότερα.

Αλλά πάντα ακούγεται κάπως ασταθής και ρομποτικό. Τώρα, η Amazon χρησιμοποιεί νευρωνικά δίκτυα που μπορούν να δημιουργήσουν ολόκληρες προτάσεις κειμένου σε πραγματικό χρόνο, λέει ο Prasad.

Αυτό δημιουργεί έναν φωνητικό ήχο πιο ρευστό και πιο ανθρώπινο. Το Siri της Apple και ο Βοηθός της Google έχουν επιτύχει επίσης πιο φυσικές φωνές πρόσφατα με παρόμοια μέσα.

Είναι το ίδιο μοντέλο φυσικής γλώσσας που σύντομα θα δώσει στην Alexa εντελώς διαφορετικές φωνές.

Η Amazon λέει ότι θα ξεκινήσει συνεργασία με διασημότητες, όπως με τον Samual L. Jackson που θα είναι ο πρώτος. Η Amazon θα πουλήσει το Jackson-as-Alexa ως πρόσθετη υπηρεσία που θα ξεκινήσει αργότερα φέτος.

Η φωνή του Τζάκσον θα καθοδηγείται τουλάχιστον μερικώς από ένα μοντέλο φυσικής γλώσσας. Το μοντέλο μαθαίνει από τη φωνή του Τζάκσον – καταγράφει μια δέσμη δειγμάτων σε ένα στούντιο – για να δημιουργήσει μια φωνή που μιμείται τον ξεχωριστό τόνο του, παρέχοντας ταυτόχρονα τις απαντήσεις και τις πληροφορίες που θα προσέφερε ο βοηθός.

Αλλά η Amazon επίσης “επιμελήθηκε” μια σειρά από πλήρεις δηλώσεις του Τζάκσον για να τις αναπαράξει η Alexa όταν είναι σωστός ο χρόνος.

Ο Τζάκσον θα είναι πιθανώς μόνο η πρώτη από τις πολλές διασημότητες που θα προσφέρει η Amazon ως εναλλακτικές λύσεις στην τυπική φωνή Alexa.

RingΤο κουδούνι που μιλάει

Σε μια νέα υπηρεσία που η Amazon καλεί “Doorbell Concierge”, οι συσκευές θα είναι σύντομα σε θέση να ανιχνεύσουν διάφορα είδη ανθρώπων που εμφανίζονται στην μπροστινή πόρτα απροειδοποίητα.

Το demo περιλαμβάνει τρία είδη πιθανών επισκεπτών – έναν άντρα που κουβαλάει ένα πακέτο, ένα κορίτσι που πουλάει μπισκότα και έναν άγνωστο άνθρωπο.

Το κουδουνι-Ring κάνει ένα σύντομο διάλογο για να μάθει τι θέλουν και ένα νευρωνικό δίκτυο στο παρασκήνιο χρησιμοποίησε αυτό που είπαν για να καθορίσει τι είδους επισκέπτες είναι.

Το έκαναν με βάση μόνο αυτά που είπαν, όχι σε εικόνες κάμερας. Η κατηγοριοποίηση στη συνέχεια ενημέρωσε τη συσκευή Ring σχετικά με το τι να πει σε κάθε ένα επισκέπτη ξεχωριστά.

Για παράδειγμα, είπε στον άνθρωπο παράδοσης πού να βάλει το πακέτο, αφού ρώτησε αν χρειαζόταν υπογραφή.

Και ζήτησε από τον άγνωστο άνθρωπο που δεν μπορεί να προσδιοριστεί αν θα ήθελε να αφήσει τα στοιχεία επικοινωνίας του.

Η Alexa ακούει


Πέρυσι, η Amazon διεύρυνε την ακοή της Alexa για να ανιχνεύσει κάτι περισσότερο από ανθρώπινες εντολές.

Τώρα, η Amazon έχει προσθέσει την ικανότητα να ακούει τους ήχους που σχετίζονται με τον άνθρωπο στο σπίτι, ενώ ο Guard είναι ρυθμισμένος στη λειτουργία “μακριά”.

Αυτές περιλαμβάνουν τους ήχους των βημάτων, του βήχα και τις πόρτες που κλείνουν όταν υποτίθεται ότι δεν είναι κανείς σπίτι. Η Alexa μπορεί να στείλει μια ειδοποίηση σε έναν χρήστη αν ανιχνεύσει έναν από αυτούς τους ήχους.

Σε όλες αυτές τις περιπτώσεις, ένα μοντέλο βαθιάς μάθησης λαμβάνει την είσοδο ήχου από τα μικρόφωνα και επισημαίνει δυνητικά επικίνδυνους ήχους.

Το Amazon θα μπορούσε να εκπαιδεύσει τον βοηθό για να ακούσει πολλούς άλλους τύπους ήχων.

Για παράδειγμα, οι συσκευές της Alexa θα μπορούσαν να αρχίσουν να ακούν για τους ήχους πτώσεων ή την έντονη αναπνοή σε μέρη όπου ζουν οι ηλικιωμένοι.

Συνδεθείτε παρακάτω
ή αποκτήστε ετήσια συνδρομή εδώ.