Un’imponente ricerca a cura della Leavey School of Business della Santa Clara University, a San Francisco, ha dimostrato la validità (e la precisione) degli algoritmi di machine learning nel fare previsioni circa la sorte delle start-up.

TAKEAWAY

  • Un sistema di intelligenza artificiale è in grado di determinare con precisione se una start-up fallirà oppure avrà successo, divenendo così un potenziale strumento per aiutare gli investitori a identificare i loro target?
  • Su questa domanda ha lavorato un team di ricercatori, sviluppando algoritmi di apprendimento automatico a partire dalle prestazioni storiche di oltre un milione di aziende.
  • I dati utilizzati provengono dalla piattaforma CrunchBase e dall’l’Ufficio brevetti e marchi degli Stati Uniti e includono i dettagli di 1.000.886 aziende e di 141.430 società di investitori in 150 paesi a livello globale.

È un fatto dimostrabile l’utilizzo delle tecniche che fanno capo all’ambito di studi dell’intelligenza artificiale per prevedere il successo delle start-up? Più in particolare, un algoritmo di machine learning è in grado di determinare con precisione se una start-up fallirà oppure avrà successo, divenendo così un potenziale strumento per aiutare gli investitori a identificare i prossimi obiettivi?

Su queste domande hanno lavorato i ricercatori della Leavey School of Business della Santa Clara University, a San Francisco (in uno studio i cui risultati sono stati di recente pubblicati su The Journal of Finance and Data Science), sviluppando algoritmi di apprendimento automatico a partire dalle prestazioni storiche di oltre un milione di aziende.

I dati utilizzati dal team di studio provengono dalla piattaforma per la ricerca di informazioni aziendali CrunchBase e dall’l’Ufficio brevetti e marchi degli Stati Uniti (United States Patent and Trademark Office – USPTO).

Per la precisione, il set di dati utilizzato risale all’aprile del 2020 e include i dettagli di 1.000.886 aziende e di 141.430 investitori, comprendenti 1.006.911 persone in 150 paesi a livello globale.

Tra le informazioni contenute nei dataset, i finanziamenti ottenuti dalle singole start-up, gli importi investiti e i titoli di lavoro dei dipendenti e dei fondatori.

Intelligenza artificiale per prevedere il successo delle start-up: l’organizzazione dei dati per l’allenamento degli algoritmi di machine learning

Il processo di sviluppo e addestramento dei sistemi di intelligenza artificiale per prevedere il successo delle start-up – spiega Sanjiv Das, professore di Finance and Data Science presso l’Ateneo USA – ha avuto inizio con l’identificazione puntuale delle fonti dei dati, vale a dire con un’istantanea del CrunchBase e di tutti i brevetti dell’USPTO risalenti all’aprile del 2020.

Questi due set, insieme, rappresentano una vasta mole di dati relativi alla distribuzione delle start-up sul territorio, ai loro settori di appartenenza e alla loro posizione sul mercato.

Il passo successivo ha visto l’estrazione, da questo enorme set di dati, di quegli elementi dai quali attingere per poter sviluppare e addestrare gli algoritmi.

Tale processo è stato scandito in due fasi. Nella prima, i dataset sono stati organizzati in uno schema di “database relazionale”, dove ogni riga della tabella è un record con un ID univoco e ogni colonna contiene gli attributi e dove è facile stabilire “relazioni” tra i primi e i secondi.

Questo database è stato successivamente trasformato utilizzando il linguaggio standardizzato Structured Query Language (SQL), atto a derivare specifiche funzionalità intermedie come – ad esempio – modificare gli schemi del database, inserirvi nuovi dati e interrogarli.

Sfruttando l’organizzazione dei dati mediante un sistema di questo tipo – continua il professor Das – è stato possibile identificare le relazioni tra le informazioni e ottenere funzionalità basate su quelle. E questo insieme di funzionalità ha costituito la base da cui sono derivati due insiemi di funzionalità più raffinate.

Nella seconda fase del processo, invece, sono state prese in considerazione le funzionalità grezze originali insieme a quelle “più raffinate” e, grazie all’elevata versatilità del linguaggio di programmazione Python, sono derivate funzionalità aggiuntive.

Intelligenza artificiale per prevedere il successo delle start-up
La sequenza di fasi che ha scandito lo sviluppo degli algoritmi di machine learning da parte dei ricercatori della Santa Clara University (Credit: Greg Ross).

Explainability dei sistemi AI sviluppati

Ai sistemi di intelligenza artificiale viene spesso rimproverato di essere delle “scatole nere”, il cui meccanismo, proprio come una black box, è descrivibile solo guardando al comportamento esterno, in quanto riamane incomprensibile come, da determinati dati in ingresso, derivi, poi, una determinata decisione in uscita.

In questo specifico caso di utilizzo dell’intelligenza artificiale per prevedere il successo delle start-up, agli investitori è importante “spiegare” – osserva il team di studio – perché, ad esempio, un algoritmo di machine learning è arrivato a previsioni molto diverse relativamente a startup comparabili per valore, mercato e tipologia di settore. Esistono, in particolare, due livelli di “spiegabilità” dei sistemi AI, sottolinea Sanjiv Das:

  • nel primo, è rilevante ciascuna variabile utilizzata per allenare l’algoritmo in tutte le previsioni (global explainability)
  • nel secondo, il focus è su quelle variabili utilizzate per una previsione specifica eseguita dall’algoritmo (instance-level explainability)

Entrambi i livelli di “spiegabilità” sono importanti per fornire una prospettiva comprensibile sul motivo per cui un algoritmo di machine learning produce un certo risultato a partire da un determinato input: ad esempio, ci si potrebbe domandare perché una start-up ha maggiori probabilità di essere acquisita che di diventare pubblica, pur con una probabilità di fallimento ragionevolmente alta, e perché ci si dovrebbe fidare delle probabilità di questi risultati.

Per quanto riguarda, nello specifico, la “spiegabilità globale” – prosegue il docente – il contributo di ciascuna variabile utilizzata nell’ambito dello studio è facilmente comprensibile guardando ai coefficienti ad esse assegnati: a variabili di una certa rilevanza è stata assegnata una statistica significativa e, nel caso specifico delle variabili numeriche, un aumento di una sola unità va ad aumentare la quantità stessa del coefficiente assegnato.

Allo stesso modo, gli alberi decisionali e le loro varianti di insieme possono riferire sull’importanza delle variabili utilizzate, perché tali informazioni sono derivate come parte del processo di addestramento degli algoritmi.

La “spiegabilità a livello di istanza” è, invece, più complessa, ma ha a che vedere con le domande chiave da parte degli investitori, in quanto fornisce informazioni sul motivo per cui viene fatta ogni singola specifica previsione. E il gruppo di lavoro si dice disponibile a fornirle, una per una.

Intelligenza artificiale per prevedere il successo delle start-up: risultati e applicazioni dello studio USA

Il lavoro condotto dai ricercatori della Santa Clara University sull’utilizzo dell’intelligenza artificiale per prevedere il successo delle start-up ha prodotto risultati precisi, dimostrando – si legge nel documento – che gli algoritmi di machine learning messi a punto sono in grado di effettuare previsioni con una precisione fino al 90%. Il che significa che, potenzialmente, nove aziende su dieci sono valutate correttamente.

Ma qual è il supporto concreto, l’aiuto che tali sistemi AI sono potenzialmente capaci di offrire ai venture capitalist, ossia agli investitori che mettono a disposizione un capitale di rischio per finanziare l’avvio o la crescita di un’attività?

Gli investitori di solito eseguono la propria analisi finanziaria delle potenziali aziende target dopo un periodo di indagine qualitativa, che prevede la conoscenza dei fondatori, del team e del mercato di riferimento.

Ebbene, gli algoritmi di apprendimento automatico possono fornire previsioni in tempo reale, insieme a un’analisi incrociata di quelle variabili che identificano gli aspetti dell’azienda e che la rendono un buon investimento o, al contrario, un pessimo investimento.

Il moderno venture capitalist può, così, sbirciare nella “scatola nera” del machine learning e prendere decisioni in modo rapido, potendo prevedere lo scenario di uscita di una start-up con una precisione superiore rispetto ai tradizionali metodi di analisi.

Scritto da:

Paola Cozzi

Giornalista Leggi articoli Guarda il profilo Linkedin