Con il prossimo aggiornamento i dispositivi troveranno delle grandi differenze rispetto al passato nell’uso del vocal assistant
Nuovo aggiornamento in arrivo per Alexa. Amazon infatti ha appena annunciato una novità per il suo dispositivo che la renderà molto più naturale e sicuramente più capace di interagire con gli utenti. L’assistente vocale ora sarà in grado di riconoscere le emozioni e il tono di voce di chi gli parla, adattando la sua risposta di conseguenza. Inoltre, avrà anche la possibilità di continuare e portare avanti le conversazioni senza che l’utente debba ripetere la parola d’ordine “Alexa” ogni volta. Il tutto è stato reso possibile grazie ad un avanzato motore “speech-to-speech” basato sull’intelligenza artificiale.
Forte di ciò Alexa sarà in grado di rilevare le emozioni dell’utente e il tono della sua voce. Questo quindi gli consentirà di rispondere in modo più naturale e realistico, creando un’esperienza di interazione più fluida e coinvolgente. L’azienda ha poi anche presentato la nuova voce, che offre un suono meno robotico di Alexa e una maggiore espressività, grazie a grandi trasformatori addestrati per lingue ed accenti diversi. Un esempio concreto potrebbe verificarsi quando un utente chiede all’assistente vocale un aggiornamento sulla sua squadra di calcio preferita. Se la squadra in questione ha vinto l’ultima partita, allora Alexa sarà in grado di rispondere con una voce gioiosa comunicando così l’entusiasmo della vittoria. Al contrario, se la squadra avesse perso, Alexa potrà adottare un tono più triste ed empatico, mostrando comprensione per la delusione del proprietario. In entrambi i casi, Alexa sarà in grado di adattare la sua voce per rendere l’esperienza di interazione emotivamente coinvolgente.
Come ha affermato anche l’SVP di Alexa Rohit Prasad: “Stiamo sviluppando un nuovo modello di conversazione, basato su potenti trasformatori, che chiamiamo speech-to-speech. Questo modello non ha bisogno di trasformare l’audio dell’utente in testo con il riconoscimento vocale, né di usare un LLM (Large Language Model) per generare una risposta testuale o un’azione, né di usare il text-to-speech per produrre l’audio. Questo modello unisce tutti questi passaggi, creando un’esperienza di conversazione più fluida e naturale“.
Secondo quanto dichiarato da Amazon, Alexa sarà in grado di esprimere attributi come la risata, la sorpresa e persino risposte come “uh-huh” per incoraggiare gli utenti a continuare la conversazione. Il tutto grazie alle tecnologie Large Text-to-Speech (LTTS) e Speech-to-Speech (S2S) di Amazon. Grazie a LTTS, l’assistente vocale è in grado di personalizzare le sue risposte utilizzando input testuali come la richiesta dell’utente o l’argomento della conversazione in corso. Mentre S2S consente ad Alexa di integrare input audio insieme al testo, permettendogli di fornire risposte più ricche ed esaustive durante le conversazioni.
Alla ricerca del gelato più buono della capitale? Niente paura, ecco la lista delle 5…
Quella della Vespa Orientalis a Roma sta prendendo sempre più i contorni di una vera…
Quasi sempre, quando si cambia casa e si entra in una nuova abitazione, si sente…
Avete mai visto la casa di Gianni Morandi? Ecco le foto della sua casa in…
Un luogo sul mare, affascinante e conveniente, dove la vita scorre serena e il costo…
Dopo che Meta ha lanciato un nuovo social network, Threads, che sembra dare risultati ottimi,…