I ricercatori dell’Università di Osnabrück e della Freie Universität Berlin hanno introdotto un nuovo approccio per addestrare i modelli di visione artificiale, ispirato allo sviluppo del sistema visivo umano.
I ricercatori dell’Università di Osnabrück e della Freie Universität Berlin hanno introdotto un nuovo approccio per addestrare i modelli di visione artificiale, ispirato allo sviluppo del sistema visivo umano. La loro pipeline, denominata Developmental Visual Diet (DVD), è stata presentata in un articolo pubblicato su Nature Machine Intelligence.
I modelli di visione artificiale sono sistemi capaci di analizzare e classificare rapidamente le immagini, riconoscere oggetti e volti o effettuare altre previsioni accurate. Questi si comportano ormai bene in diversi ambiti, ma in genere elaborano le informazioni visive in modo molto diverso dagli esseri umani. Mentre gli esseri umani si concentrano maggiormente sulla forma e sul contorno degli oggetti, i sistemi di AI privilegiano la texture, come le variazioni di colore o i pattern visivi ripetuti. Questa differenza potrebbe in parte spiegare perché i sistemi di visione artificiale basati sull’IA siano ancora molto più inclini agli errori rispetto alla visione umana.
La nuova dieta visiva evolutiva
Per superare i limiti dei modelli di visione artificiale esistenti, gli scienziati dell’Università di Osnabrück e della Freie Universität Berlin hanno concentrato l’attenzione sulle caratteristiche legate alla texture. Hanno infine sviluppato la struttura DVD, un programma di addestramento per reti neurali profonde che si ispira allo sviluppo umano. L’idea alla base del progetto è che un modello di visione artificiale inizi con capacità visive “scarse” e sviluppi gradualmente una visione ad alta acuità. Proprio come le capacità visive dei neonati si sviluppano nel tempo.
“Lo studente di dottorato Zejin Lu ha analizzato un gran numero di articoli sullo sviluppo per individuare i fattori di interesse. Ha individuato tre potenziali candidati: acuità visiva, sensibilità al contrasto e percezione del colore. Abbiamo cercato di riprodurre il più fedelmente possibile la traiettoria temporale di sviluppo di questi tre fattori” spiega Tim C. Kietzmann.
I ricercatori dell’Università di Osnabrück e della Freie Universität Berlin hanno addestrato reti neurali profonde utilizzando il nuovo approccio da loro sviluppato e ne hanno poi valutato le prestazioni in compiti di elaborazione visiva, confrontandole con quelle di modelli addestrati con approcci standard. In particolare, hanno scoperto che i modelli risultanti si basavano maggiormente su informazioni relative alla forma degli oggetti, piuttosto che su caratteristiche di texture. Inoltre, i modelli sembravano meno soggetti a distorsioni delle immagini e attacchi avversari (ovvero, tentativi deliberati di ingannare i sistemi di intelligenza artificiale alterando le immagini che elaborano): “Erano anche molto più efficaci nel riconoscere forme simboliche/astratte nascoste in scene complesse, un caso in cui persino i nuovi modelli di intelligenza artificiale che operano su larga scala spesso falliscono” sottolinea Kietzmann.
Risultati iniziali e possibilità future
La struttura DVD potrebbe essere ulteriormente perfezionata e utilizzata per addestrare altri modelli di visione artificiale. In futuro, potrebbe contribuire a migliorare i modelli esistenti e a introdurre nuovi sistemi più efficaci nel rilevare oggetti specifici, riconoscere volti o persino generare immagini con caratteristiche specifiche.
“In un’epoca in cui ‘scalare’ è una risposta frequente per risolvere i problemi di intelligenza artificiale, questa rappresenta una valida alternativa su scala ridotta. Poiché DVD è una pipeline di pre-elaborazione, incide minimamente sui tempi di addestramento e l’inferenza viene eseguita su immagini ad alta risoluzione, motivo per cui il modello è veloce quanto quelli originali” conclude Kietzmann.
Il recente lavoro degli scienziati dell’Università di Osnabrück e della Freie Universität Berlin potrebbe presto ispirare lo sviluppo di ulteriori framework di addestramento ispirati allo sviluppo umano. Nel frattempo, i ricercatori stanno pianificando nuovi studi volti a migliorare ulteriormente le prestazioni dei sistemi di visione artificiale.
Foto: Nature Machine Intelligence (2026)
