Il segreto del riconoscimento vocale di Google: lavora come un cervello

21 Febbraio 201347 commenti
Le tecnologie di riconoscimento vocale come Siri in iOS e Google Voice Search in Android hanno davvero fatto molta strada sin dal primo debutto ufficiale. Tutto è iniziato cercando di dare agli utenti Android ed iPhone 4S (in quel periodo) una nuova tecnologia per poter facilmente interagire con il dispositivo. Anche grandi menti della tecnologia come Steve Wozniak e Bill Gates hanno apprezzato molto le potenzialità di queste tecnologie, capaci di rivoluzionare il modo di interagire con i nostri device. Ma nonostante lo stupore per Siri al lancio di iOS 5 ed iPhone 4S, è stato certamente Google ad alzare la posta in palio.

[ad#antonio]

Il Voice Search di Google è attualmente il migliore del mercato (almeno negli Stati Uniti) secondo gli esperti ma non senza fatica e duro lavoro alle sue spalle.

Ma come funziona e cosa rende Google Voice Search così buono?

L’ispirazione arriverebbe direttamente dalle reti neurali del nostro cervello, secondo le ultime conferme. L’implementazione di queste “reti neurali” partita con Jelly Bean avrebbe permesso di ridurre del 25% gli errori durante il riconoscimento vocale.

“It really is changing the way that people behave…When you talk to Android’s voice recognition software, the spectrogram of what you’ve said is chopped up and sent to eight different computers housed in Google’s vast worldwide army of servers. It’s then processed, using the neural network models built by Vanhoucke and his team.”

In sostanza, con un ampissimo potere di elaborazione cloud, Google è in grado di analizzare un sacco di modelli, che nel caso del riconoscimento vocale vengono chiamati spettrogrammi, ed anche prevedere nuovi modelli proprio come fanno i nostri neuroni, che riescono facilmente a ricollegare i vari modelli, aiutandoci a svolgere semplicemente i nostri compiti.

L’elaborazione procede in vari strati d’elaborazione:

  1. In primo luogo Google cerca i riconoscere le vocali e le consonanti; (livello fondamentale)
  2. Utilizzando quest’ultime riesce a ricomporre intelligentemente le parole per riformulare la frase;
  3. E così via…

Lo stesso approccio viene effettivamente applicato all’analisi delle immagini, in cui si tenta di individuare prima i bordi e poi sempre più verso l’interno.

L’analisi è ovviamente più complessa e difficile da spiegare con semplici parole. Sicuramente è una tecnologia molto affascinante, la quale con lo sviluppo potrebbe presto portare a nuovi orizzonti di interazione con smartphone e tablet.

Vi consiglio la lettura integrale dell’articolo originale su Wired.

 

47 risposte a “Il segreto del riconoscimento vocale di Google: lavora come un cervello”

  1. marko68 ha detto:

    Sinceramente di neuroni dimostra di averne pochi visto come capisce ma soprattutto come risponde………….

    • Gio ha detto:

      Stavo per scriverlo io, a me voice search funziona veramente male, molto meglio s voice. Se parliamo solo di riconoscimento vocale è vero, Android funziona bene, riconosce rapidamente tutto quello che dici, ma per quanto riguarda voice search non ci siamo

    • dgero83 ha detto:

      Ma in italiano non esiste, è solo riconoscimento vocale… Ma sapete di che parlate?

  2. GortTheGolem ha detto:

    con tutto il bene che voglio ad Android e con tutta la stima che ho verso mamma google, paragonare voice search a SIRI è un pò come mettere a confronto il triciclo di mio figlio con la desmosedici dei miei sogni. Ovviamente esagero, ma la morale rimane quella.

    • name ha detto:

      sinceramente mi capisce perfettamente senza errori! cosa vuoi di più? che ti faccia le chiamate e ti apra le app? lo fa già in america… aspetta un po’ e arriverà anche in Italia!

      • geniaccio ha detto:

        Le chiamate le fa anche in italia, se gli dico “Chiama Paola” lui fa partire la telefonata a quel contatto

    • dgero83 ha detto:

      Siri dice cazzatine, fa il simpatico e serve da show. Non c’è un mac user che lo usi davvero se non per dare il cretinetto. Google search è utilizzabile e utilizzato tutti i giorni. Io dettavo SMS e email quando siri non era ancora neanche un’idea.

      • GortTheGolem ha detto:

        rileggetevi l’articolo, qui si parla di google voice SEARCH, non del riconoscimento vocale in sè sul quale non ho nulla da ridire. Per come riesco ad usarlo io la RICERCA vocale è solo una facilitazione che si ha nel non dover digitare sulla tastiera, ma il risultato è tradizionale. SIRI è concettualmente diverso. Se poi vogliamo dire che Android è “più meglio” a tutti i costi, va bene, diciamocelo.

        • mtth20 ha detto:

          esatto. il voice search.

          se io dico: manda una mail a mamma. testo “sto tornando, butta la pasta”

          il cell manda magicamente una mail a mamma con il testo dettato.
          lo stesso per sms.
          altre funzioni che uso spesso sono il calendario e il navigatore.

          • GortTheGolem ha detto:

            allora sarà solo il mio nexus s che non mi riconosce le funzioni, ho fatto più prove ma fa un pò come gli pare…. errata corrige… solo il mio Voice Search non funziona, tutti gli altri vanno da dio.

          • mtth20 ha detto:

            magari hai qualcosa nelle impostazioni della lingua di sbagliato, non saprei.

            io non posso che parlarne bene: lo uso spesso quando sono in macchina.

    • teolinux ha detto:

      Stai scherzando vero?
      Al di là della interazione di Siri che mira ad essere più un cleverbot per divertirsi qualche minuto. Ma se usi Google Voice in inglese le features e la accuratezza delle ricerche sono incredibili.
      Consideriamo poi che Siri è pensato per interagire con il telefono e Google Voice per ora è principalmente pensato per fare ricerche

  3. fede ha detto:

    peccato che il cervello se dice punto e virgola o punto la mano sa cosa scrivere,Google invece le considera solo parole e basta!

    • Marco Gazzola ha detto:

      Il riconoscimento della punteggiatura è stato tolto… Una volta funzionava perfettamente..

      • dgero83 ha detto:

        Sì, non capisco perché, era così comodo!

      • Margalus ha detto:

        Ah ma allora non sono l’unico che se lo ricorda, perché diavolo l’hanno tolto? Siamo sinceri, “punto” e soprattutto “virgola” o “punto esclamativo” nel 99% dei casi, ma direi anche 99,5%, li si intende come punteggiatura e non come parola..quindi nel restante 0,5% dei casi ci si andava a cambiare(tra l’altro mai avuto bisogno, almeno personalmente) manualmente la punteggiatura mettendo la parola.

        Ma ora? Chi è che dice “virgola” e vuole che il suo device scriva la parola?

  4. […] (…)Continua a leggere Il segreto del riconoscimento vocale di Google: lavora come un cervello su Androi… […]

  5. crysis ha detto:

    Io trovo assurdo che il mio telefono da 400 euro per fare una chiamata attraverso il controllo vocale ( in inglese oltretutto) debba usare la rete dati mentre il mio vecchio BlackBerry da meno di cento usava un’ottima riconoscimento completamente off line e quasi infallibile

    • max ha detto:

      Concordo il mio 8900 aveva 1 riconoscimento vocale pressochè infallibile.. io lo usavo senza problemi a100 120Kh con il casco bt in moto

    • FE4R ha detto:

      A me stupisce che ci sia della gente che ha telefoni da 400/700 euro e non abbia una connessione ad internet. Senza internet questi telefoni vengono utilizzati solo per il 30% delle loro potenzialita. Il ció rende la spesa quasi inutile.

      • maseiserio?? ha detto:

        forse non hai letto bene…
        lui trova assurdo usare un’applicazione che sfrutta rete dati se, usando un telefono più vecchio e non topgamma, hai un risultato migliore.
        e come ragionamento mi sembra perfettamente logico.
        poi dove hai letto che invece ha un telefono pazzesco senza un adeguato abbonamento per sfruttarlo, lo sai solo tu.

      • crysis ha detto:

        Tu non hai capito quello che volevo dire

      • crysis ha detto:

        Rileggi bene il mio commento perché non era questo che volevo dite

    • dgero83 ha detto:

      Hai comprato una sola, se fosse aggiornato a jelly bean che è uscito a giugno dell’anno scorso, quindi uhm…7 mesi fa, lo potresti usare offline.

      • crysis ha detto:

        Non è questione di sola è che delle volte ho l’impressione che i cellulari invece di andare avanti vadano indietro

  6. Mr.Anderson ha detto:

    Ma del famoso assistente vocale vero e proprio come il Google Now in lingua inglese??? Arriva o non arriva??

  7. 6630top ha detto:

    si certo…lavora come un cervello…di gallina!!! Basta con questi articoli da fanboy!!!

  8. bob ha detto:

    giusto oggi ho flashato la cm10 e finalmente ho avuto l’onore di provare google now
    vabbè che la mia pronuncia inglese non sia perfetta ma fa molta fatica a capirmi xD
    c’è ancora tanto da migliorare

    • Jeff ha detto:

      No, è soltanto un problema della tua pronuncia. Prova a raffinarla e vedi che è oramai quasi al livello di Siri come perfezione.

    • teolinux ha detto:

      devi avere la pronuncia inglese/americano. Anche a me a volte sbaglia, poi cambio un po’ la pronuncia e lo prende. Per contro in francese mi azzecca tutto al primo colpo (anche siri, provato sul iPhone di un amico)

  9. MICHELE MANFRO ha detto:

    Già che vedo tanti commenti…chi di voi sa dirmi come si data la punteggiatura (virgola, punto, punto di domanda ecc)

  10. o.t ha detto:

    ragazzi sparate tanta m****a come se fosse una cosa semplice e voi foste in grado di far riconoscere una cosa complessa come il linguaggio umano,così variabile nelle sue sfaccettature ad una macchina..10-15 anni fa sarebbe stata fantascienza,portate un po’di rispetto per chi studia queste cose..credete che tutto sia semplice e scontato?io ho un nokia c7,che sfrutta la tecnologia google per il riconoscimento e devo dire che alle volte rimango stupito dalla precisione..

    • maseiserio?? ha detto:

      guarda che nessuno qui sostiene di saper fare meglio e siamo tutti grati agli sviluppatori.
      ma un conto è parlare di una cosa, un altro è incensarla come fosse perfetta quando si trova molto distante dall’esserlo.
      leggi bene, prima di infervorarti!
      :D

    • fede ha detto:

      Ho avuto l’iPhone con Siri e la punteggiatura ha sempre funzionato sin dalla prima versione,ora vogliamo dire che Apple sa come risolvere questo ENORME problema…!?

      • Margalus ha detto:

        Veramente se leggi pochi post sopra, scritti prima del tuo, c’è scritto che una volta c’era e funzionava alla grande. Google ce l’ha già il riconoscimento della punteggiatura e prima era lì di default, ora c’è da capire perché è stato tolto in favore delle parole al posto del “.” “,” o “!”

  11. Un lettore ha detto:

    Reti neurali sono quelle artificiali, reti neuronali quelle del cervello umano :)

  12. […] Il segreto del riconoscimento vocale di Google: lavora come un cervello – Androidiani […]

  13. FedericoBarone ha detto:

    Al prossimo google i/o arriverà robert downey jr con i glass addosso e un nexus 5 in mano e dirà “jarvis che facciamo oggi?” XD
    tornando seri, questo implica che questa cosa qua della simulazione delle reti neurali funziona solo con il riconoscimento online e non con quello offline, giusto?

  14. gjsbe ha detto:

    A me il fatto che debba collegarsi ad internet x lavorare è un grosso problema visto che uso la composizione vocale mentre vado in moto.

  15. […] Le tecnologie di riconoscimento vocale come Siri in iOS e Google Voice Search in Android hanno davvero fatto molta strada sin dal primo debutto uffici.  […]

Social Media Auto Publish Powered By : XYZScripts.com