[ad#antonio]
Il Voice Search di Google è attualmente il migliore del mercato (almeno negli Stati Uniti) secondo gli esperti ma non senza fatica e duro lavoro alle sue spalle.
Ma come funziona e cosa rende Google Voice Search così buono?
L’ispirazione arriverebbe direttamente dalle reti neurali del nostro cervello, secondo le ultime conferme. L’implementazione di queste “reti neurali” partita con Jelly Bean avrebbe permesso di ridurre del 25% gli errori durante il riconoscimento vocale.
“It really is changing the way that people behave…When you talk to Android’s voice recognition software, the spectrogram of what you’ve said is chopped up and sent to eight different computers housed in Google’s vast worldwide army of servers. It’s then processed, using the neural network models built by Vanhoucke and his team.”
In sostanza, con un ampissimo potere di elaborazione cloud, Google è in grado di analizzare un sacco di modelli, che nel caso del riconoscimento vocale vengono chiamati spettrogrammi, ed anche prevedere nuovi modelli proprio come fanno i nostri neuroni, che riescono facilmente a ricollegare i vari modelli, aiutandoci a svolgere semplicemente i nostri compiti.
L’elaborazione procede in vari strati d’elaborazione:
- In primo luogo Google cerca i riconoscere le vocali e le consonanti; (livello fondamentale)
- Utilizzando quest’ultime riesce a ricomporre intelligentemente le parole per riformulare la frase;
- E così via…
Lo stesso approccio viene effettivamente applicato all’analisi delle immagini, in cui si tenta di individuare prima i bordi e poi sempre più verso l’interno.
L’analisi è ovviamente più complessa e difficile da spiegare con semplici parole. Sicuramente è una tecnologia molto affascinante, la quale con lo sviluppo potrebbe presto portare a nuovi orizzonti di interazione con smartphone e tablet.
Vi consiglio la lettura integrale dell’articolo originale su Wired.
Sinceramente di neuroni dimostra di averne pochi visto come capisce ma soprattutto come risponde………….
Stavo per scriverlo io, a me voice search funziona veramente male, molto meglio s voice. Se parliamo solo di riconoscimento vocale è vero, Android funziona bene, riconosce rapidamente tutto quello che dici, ma per quanto riguarda voice search non ci siamo
In italiano fa pena, prova lo in inglese, resterà i stupito…
Finalmente uno che ragiona
ecco esatto. in italiano è ancora 3 gradini indietro.
E poi gli italiani hanno tutti forti accenti regionali ;)
Ma in italiano non esiste, è solo riconoscimento vocale… Ma sapete di che parlate?
con tutto il bene che voglio ad Android e con tutta la stima che ho verso mamma google, paragonare voice search a SIRI è un pò come mettere a confronto il triciclo di mio figlio con la desmosedici dei miei sogni. Ovviamente esagero, ma la morale rimane quella.
sinceramente mi capisce perfettamente senza errori! cosa vuoi di più? che ti faccia le chiamate e ti apra le app? lo fa già in america… aspetta un po’ e arriverà anche in Italia!
Le chiamate le fa anche in italia, se gli dico “Chiama Paola” lui fa partire la telefonata a quel contatto
Siri dice cazzatine, fa il simpatico e serve da show. Non c’è un mac user che lo usi davvero se non per dare il cretinetto. Google search è utilizzabile e utilizzato tutti i giorni. Io dettavo SMS e email quando siri non era ancora neanche un’idea.
rileggetevi l’articolo, qui si parla di google voice SEARCH, non del riconoscimento vocale in sè sul quale non ho nulla da ridire. Per come riesco ad usarlo io la RICERCA vocale è solo una facilitazione che si ha nel non dover digitare sulla tastiera, ma il risultato è tradizionale. SIRI è concettualmente diverso. Se poi vogliamo dire che Android è “più meglio” a tutti i costi, va bene, diciamocelo.
esatto. il voice search.
se io dico: manda una mail a mamma. testo “sto tornando, butta la pasta”
il cell manda magicamente una mail a mamma con il testo dettato.
lo stesso per sms.
altre funzioni che uso spesso sono il calendario e il navigatore.
allora sarà solo il mio nexus s che non mi riconosce le funzioni, ho fatto più prove ma fa un pò come gli pare…. errata corrige… solo il mio Voice Search non funziona, tutti gli altri vanno da dio.
magari hai qualcosa nelle impostazioni della lingua di sbagliato, non saprei.
io non posso che parlarne bene: lo uso spesso quando sono in macchina.
Stai scherzando vero?
Al di là della interazione di Siri che mira ad essere più un cleverbot per divertirsi qualche minuto. Ma se usi Google Voice in inglese le features e la accuratezza delle ricerche sono incredibili.
Consideriamo poi che Siri è pensato per interagire con il telefono e Google Voice per ora è principalmente pensato per fare ricerche
peccato che il cervello se dice punto e virgola o punto la mano sa cosa scrivere,Google invece le considera solo parole e basta!
Il riconoscimento della punteggiatura è stato tolto… Una volta funzionava perfettamente..
Sì, non capisco perché, era così comodo!
Ah ma allora non sono l’unico che se lo ricorda, perché diavolo l’hanno tolto? Siamo sinceri, “punto” e soprattutto “virgola” o “punto esclamativo” nel 99% dei casi, ma direi anche 99,5%, li si intende come punteggiatura e non come parola..quindi nel restante 0,5% dei casi ci si andava a cambiare(tra l’altro mai avuto bisogno, almeno personalmente) manualmente la punteggiatura mettendo la parola.
Ma ora? Chi è che dice “virgola” e vuole che il suo device scriva la parola?
[…] (…)Continua a leggere Il segreto del riconoscimento vocale di Google: lavora come un cervello su Androi… […]
Io trovo assurdo che il mio telefono da 400 euro per fare una chiamata attraverso il controllo vocale ( in inglese oltretutto) debba usare la rete dati mentre il mio vecchio BlackBerry da meno di cento usava un’ottima riconoscimento completamente off line e quasi infallibile
Concordo il mio 8900 aveva 1 riconoscimento vocale pressochè infallibile.. io lo usavo senza problemi a100 120Kh con il casco bt in moto
È la cosa che mi manca di più del mio BlackBerry nonostante fosse un trattore
A me stupisce che ci sia della gente che ha telefoni da 400/700 euro e non abbia una connessione ad internet. Senza internet questi telefoni vengono utilizzati solo per il 30% delle loro potenzialita. Il ció rende la spesa quasi inutile.
forse non hai letto bene…
lui trova assurdo usare un’applicazione che sfrutta rete dati se, usando un telefono più vecchio e non topgamma, hai un risultato migliore.
e come ragionamento mi sembra perfettamente logico.
poi dove hai letto che invece ha un telefono pazzesco senza un adeguato abbonamento per sfruttarlo, lo sai solo tu.
è anche vero che all’estero accendere una rete dati costa. Ok, costa anche la chiamata che si vorrebbe attivare con la voce però ahahahah
Esattamente
Tu non hai capito quello che volevo dire
Rileggi bene il mio commento perché non era questo che volevo dite
Hai comprato una sola, se fosse aggiornato a jelly bean che è uscito a giugno dell’anno scorso, quindi uhm…7 mesi fa, lo potresti usare offline.
Non è questione di sola è che delle volte ho l’impressione che i cellulari invece di andare avanti vadano indietro
Ma del famoso assistente vocale vero e proprio come il Google Now in lingua inglese??? Arriva o non arriva??
si certo…lavora come un cervello…di gallina!!! Basta con questi articoli da fanboy!!!
giusto oggi ho flashato la cm10 e finalmente ho avuto l’onore di provare google now
vabbè che la mia pronuncia inglese non sia perfetta ma fa molta fatica a capirmi xD
c’è ancora tanto da migliorare
No, è soltanto un problema della tua pronuncia. Prova a raffinarla e vedi che è oramai quasi al livello di Siri come perfezione.
devi avere la pronuncia inglese/americano. Anche a me a volte sbaglia, poi cambio un po’ la pronuncia e lo prende. Per contro in francese mi azzecca tutto al primo colpo (anche siri, provato sul iPhone di un amico)
Già che vedo tanti commenti…chi di voi sa dirmi come si data la punteggiatura (virgola, punto, punto di domanda ecc)
Una volta funzionava. Ora non so perchè non più
ragazzi sparate tanta m****a come se fosse una cosa semplice e voi foste in grado di far riconoscere una cosa complessa come il linguaggio umano,così variabile nelle sue sfaccettature ad una macchina..10-15 anni fa sarebbe stata fantascienza,portate un po’di rispetto per chi studia queste cose..credete che tutto sia semplice e scontato?io ho un nokia c7,che sfrutta la tecnologia google per il riconoscimento e devo dire che alle volte rimango stupito dalla precisione..
guarda che nessuno qui sostiene di saper fare meglio e siamo tutti grati agli sviluppatori.
ma un conto è parlare di una cosa, un altro è incensarla come fosse perfetta quando si trova molto distante dall’esserlo.
leggi bene, prima di infervorarti!
:D
Ho avuto l’iPhone con Siri e la punteggiatura ha sempre funzionato sin dalla prima versione,ora vogliamo dire che Apple sa come risolvere questo ENORME problema…!?
Veramente se leggi pochi post sopra, scritti prima del tuo, c’è scritto che una volta c’era e funzionava alla grande. Google ce l’ha già il riconoscimento della punteggiatura e prima era lì di default, ora c’è da capire perché è stato tolto in favore delle parole al posto del “.” “,” o “!”
Reti neurali sono quelle artificiali, reti neuronali quelle del cervello umano :)
[…] Il segreto del riconoscimento vocale di Google: lavora come un cervello – Androidiani […]
Al prossimo google i/o arriverà robert downey jr con i glass addosso e un nexus 5 in mano e dirà “jarvis che facciamo oggi?” XD
tornando seri, questo implica che questa cosa qua della simulazione delle reti neurali funziona solo con il riconoscimento online e non con quello offline, giusto?
A me il fatto che debba collegarsi ad internet x lavorare è un grosso problema visto che uso la composizione vocale mentre vado in moto.
[…] Le tecnologie di riconoscimento vocale come Siri in iOS e Google Voice Search in Android hanno davvero fatto molta strada sin dal primo debutto uffici. […]