Italy
This article was added by the user . TheWorldNews is not responsible for the content of the platform.

Google inaugura l’era della ricerca visiva

Il 30% dei neuroni che si trovano nella corteccia del cervello sono dedicati alla visione, gli esseri umani infatti cercano di capire il mondo che li circonda principalmente partendo da ciò che vedono. Una volta poi che abbiamo osservato le cose che abbiamo davanti agli occhi le raccontiamo usando il linguaggio. Di fatto gli occhi e la voce sono il sistema principale con cui ci relazioniamo e interagiamo ma quando entriamo nella dimensione digitale lo strumento che usiamo maggiormente è il testo.

È per questa ragione che Google da diversi anni sta lavorando intensamente per rendere le ricerche online sempre più semplici e intuitive proprio usando la voce e le immagini. L’obiettivo di Google è infatti quello di rendere sempre più semplice trovare le risposte alle nostre domande anche se non sappiamo bene come porre queste domande in forma scritta.

«Potrete fare domande con meno parole, o addirittura con nessuna, e noi continueremo a capire esattamente cosa intendete. Potrete anche esplorare e organizzare le informazioni in modo che abbiano senso per voi», dice Prabhakar Raghavan, Senior Vice President di Google.

Sempre più immagini e meno testo

La scommessa del colosso del web è quella di rendere il loro motore di ricerca il luogo di partenza per qualsiasi necessità, dalle previsioni meteo alle ricette in cucina, dai risultati sportivi alle traduzioni in tempo reale in altre lingue. Una scommessa tutta tecnologica perché un conto per un computer è leggere e capire un messaggio di testo, un altro è comprendere la nostra voce o riconoscere attraverso le immagini quello che ci serve.

google search

Il prezioso contributo dell’intelligenza artificiale e di nuovi algoritmi sta però rendendo possibile questa magia e Google intende sfruttarla al meglio attraverso delle funzioni evolute come quelle appena annunciate a Search On 2022, la conferenza annuale dedicata proprio al mondo della ricerca online. In occasione di questo evento l’azienda californiana ha infatti annunciato la «ricerca multipla vicino a me» che consente di scattare una foto di un oggetto sconosciuto, come un piatto o una pianta, e di trovarlo in un luogo vicino, come un ristorante o un negozio di giardinaggio.

Esplorare il mondo in modo super realistico

Questa funzione partirà in modo sperimentale negli Stati Uniti ma sarà disponibile presto anche in Italia come presto sarà accessibile anche la nuova visualizzazione immersiva di Google Maps. Si tratta di un altro ambizioso progetto dell’azienda di Mountain View che consente di esplorare in modo sempre più realistico il mondo anche rimanendo a casa, ma soprattutto diventa un prezioso alleato quando si viaggia.

«Grazie ai progressi della computer vision e dei modelli predittivi, stiamo reimmaginando completamente la definizione di “mappa”. Ciò significa che la nostra mappa 2D si evolverà in una visione multidimensionale del mondo reale, che vi permetterà di vivere un luogo come se foste lì», ha detto ancora Raghavan.

Proprio come il traffico in tempo reale nella navigazione ha reso Google Maps molto più utile, Google sta apportando un altro cambiamento significativo nella mappatura, aggiungendo informazioni pratiche come il meteo e l’affollamento di un luogo. Con questa visualizzazione immersiva, il colosso del web vuole aiutare non solo ad avere le informazioni che servono ma anche a farsi un'idea di un luogo prima ancora di andarci, oppure favorendo la scoperta di attrazioni e attività quando ci si trova nei diversi quartieri delle grandi città. 

Traduzioni visive in più di 100 lingue

Infine tra gli elementi tecnologici su cui Google sta innovando maggiormente c’è quello legato alle traduzioni. Uno degli aspetti più potenti della comprensione visiva è infatti la capacità di abbattere le barriere linguistiche. Grazie ai progressi dell’intelligenza artificiale, il colosso del web è passato dalle traduzioni del testo a quelle delle immagini. Con la funzione specifica offerta da Google Lens, questa operazione viene già utilizzata più di 1 miliardo di volte al mese in più di 100 lingue, traducendo facilmente e istantaneamente vetrine, menu, insegne e altro ancora.

In questo senso i progressi riguardano la capacità dell’algoritmo di combinare le immagini al contesto, ad esempio come le immagini di sfondo. Grazie a una te tecnologia di apprendimento automatico chiamata Generative Adversarial Networks (GAN), se si punta la fotocamera su una rivista in un'altra lingua, ad esempio, il testo tradotto si sovrappone in modo realistico alle immagini sottostanti.