Articoli

Verso la visione artificiale

Il sistema visivo umano è uno dei processi cognitivi più straordinari e affascinanti, ma tuttora poco compreso. Lo esplora un giovane ricercatore della SISSA di Trieste

Perché riusciamo con apparente semplicità a identificare e riconoscere le lettere sullo schermo del computer, una tazzina di caffè sul tavolo e una persona che esce dall’ascensore? Alla base del riconoscimento visivo degli oggetti c’è un processo computazionale molto complesso.

Corteccia visivaLo studio dei meccanismi neuronali che ci consentono di interpretare le scene visive ed estrarne informazioni, essenziali per interagire con il mondo circostante e guidare le nostre azioni motorie, è una sfida aperta per le neuroscienze cognitive, la psicofisica, la neurofisiologia e la computer science.

Sulla rivista Neuron Davide Zoccolan, che alla Sissa di Trieste dirige il laboratorio di neuroscienze visive, ha pubblicato insieme ai collaboratori americani James DiCarlo (MIT, Boston) e Nicole Rust (University of Pennsylvania), un articolo che fa il punto sui meccanismi della visione umana. Uno dei processi cognitivi più straordinari e affascinanti compiuti dal cervello. Ma tuttora poco compreso.

«Noi siamo in grado di classificare e identificare gli oggetti, indipendentemente dagli inifiniti modi in cui possono presentarsi davanti ai nostri occhi: per la posizione, l’orientamento, la dimensione, il contesto e le condizioni di illuminazione. E riusciamo a farlo in poche centinaia di millisecondi» spiega Zoccolan, torinese, dal 2009 alla Scuola Internazionale Superiore di Studi Avanzati.

Riconoscimento invarianteIl sistema visivo umano, cioè, è in grado di riconoscere centinaia di migliaia di oggetti diversi, nonostante l’incredibile varietà di pose, dimensioni, posizioni in cui ci appaiono. Siamo in grado, per esempio, di riconoscere istantaneamente una faccia familiare, a prescindere dal fatto che essa sia in luce o in ombra, appaia di fronte o di profilo, sia isolata o circondata da altri oggetti. Questa facoltà è detta riconoscimento invariante. E nonostante tale riconoscimento sia per noi immediato e non richieda alcuno sforzo, nessun sistema di visione artificiale e nessun calcolatore, per quanto potente, sono in grado di eguagliare accuratezza, affidabilità e velocità del riconoscimento visivo umano.

Da un punto di vista evolutivo, questa capacità cognitiva è funzionale alla nostra sopravvivenza: molte delle nostre attività quotidiane - dalla ricerca del cibo alle interazioni sociali, dall’utilizzo di attrezzi al potersi muovere nel traffico - dipendono infatti dalla capacità di estrarre in modo accurato e veloce l’identità degli oggetti tra tutte le informazioni che raggiungono la nostra retina.

Visione artificiale«La comprensione dei meccanismi neuronali che consentono al cervello di interpretare la straordinaria ricchezza di informazioni visive rappresenta non solo una delle maggiori sfide delle neuroscienze sistemiche e computazionali, ma anche un passo fondamentale verso lo sviluppo di sistemi di visione artificiale» commenta il neuroscienziato.

Il riconoscimento visivo è infatti un processo di elaborazione dell'informazione molto complesso, tanto che nei primati non umani metà della corteccia cerebrale è destinata allo svolgimento di compiti visivi. Zoccolan e il suo team hanno scoperto recentemente che anche i ratti riescono a codificare in modo invariante gli oggetti, il loro sistema visivo è in grado cioè di identificare un oggetto nonostante appaia di volta in volta in posizioni, dimensioni e contesti differenti. I risultati della ricerca sono stati pubblicati sul Journal of Neuroscience.

Nel laboratorio alla Sissa, il team di Zoccolan studia le proprietà e i limiti del riconoscimento visivo invariante, effettuando esperimenti di psicosifisica e neurofisiologia, con l’obiettivo di scoprire i meccanismi neuronali della visione per poter sviluppare sistemi artificiali che si ispirano all’architettura cerebrale.

Suggerimenti