Introduzione alla ricerca in ambito AI. Una guida su come contribuire a confermare la riproducibilità di alcuni dei documenti più recenti e unirsi alla ricerca aperta.

L’attenzione alla ricerca in ambito AI, Artificial Intelligence, sta crescendo ogni anno sempre di più, in particolare in campi come Deep Learning, Reinforcement Learning e Natural Language Processing (lo dimostrano ad esempio i dati di Scopus, un database di abstract e citazioni di articoli di pubblicazioni inerenti la ricerca scientifica, tra le quali la ricerca in ambito AI – figura 1).

Crescita dei paper di ricerca in ambito AI
Crescita delle pubblicazioni scientifiche annuali relative alla ricerca in ambito AI, comparata alla crescita media dei paper di ricerca

.

La ricerca all’avanguardia nell’intelligenza artificiale viene solitamente svolta nei migliori gruppi di ricerca delle università e aziende focalizzate sulla ricerca come Deep Mind o Open AI, ma cosa succederebbe se volessi dare il tuo contributo nel tuo tempo libero?

In questo articolo, esploreremo diversi possibili approcci che puoi adottare per essere sempre aggiornato con la ricerca in ambito AI e per fornire anche il tuo contributo.

Ricerca in ambito AI, la sfida della riproducibilità

Uno dei principali problemi che hanno interessato il campo della ricerca in ambito AI è l’incapacità di riprodurre in modo efficiente modelli e risultati rivendicati in alcune pubblicazioni (Reproducibility Challenge).

In effetti, molti articoli di ricerca pubblicati ogni anno contengono solo una spiegazione dell’argomento presentato e del modello sviluppato ma nessun codice sorgente per riprodurre i risultati. Alcuni motivi per cui i ricercatori a volte potrebbero omettere questo tipo di informazioni sono: mantenere un vantaggio competitivo nei confronti di altre istituzioni, accordi di non divulgazione, trasformare la loro ricerca in un prodotto, ecc.

Per rendere la ricerca più accessibile e avere un impatto sul mondo reale, sono stati creati diversi concorsi per incoraggiare il pubblico a studiare diverse pubblicazioni e cercare di riprodurne i risultati. Due delle competizioni più conosciute in questo ambito sono le sfide di riproducibilità NeurIPS e ICLR . Nel caso tu stia cercando un esempio pratico, di recente ho avviato un repository GitHub su questo argomento.

Inoltre, siti web come Papers with Code , sono stati recentemente creati per trovare facilmente pubblicazioni di ricerca che contengono il codice e lo rendono disponibile al pubblico. In questo modo, chiunque può utilizzare modelli all’avanguardia per i propri progetti in modo completamente gratuito!

Season of Docs

Season of Docs è un programma annuale organizzato da Google volto a collegare autori tecnici con organizzazioni open-source al fine di migliorare la documentazione delle librerie (sviluppatori ed autori tecnici possono contribuire liberamente allo sviluppo di progetti open-source).

Contributi open source di GitHub

Molte delle librerie di Machine Learning e Deep Learning più popolari al giorno d’oggi sono disponibili su GitHub e la maggior parte di esse accetta volentieri l’aiuto di collaboratori esterni. Alcuni esempi di repository GitHub popolari con molti problemi e richieste pull che accettano contributori sono:

Two Minute Papers

Un altro modo per rimanere sempre aggiornati sulle ultime ricerche è seguire pubblicazioni online come Towards Data Science e canali YouTube focalizzati sulla ricerca come Two Minute Papers. Questo canale YouTube infatti recensisce e riassume settimanalmente alcune delle ultime pubblicazioni più interessanti, fornendo anche demo e applicazioni di esempio.

***

Contatti

Se vuoi tenerti aggiornato con gli ultimi articoli ed i progetti di Pier Paolo,  seguilo su Medium e iscriviti alla sua mailing list

Scritto da: