L’impiego delle tecniche di intelligenza artificiale ci aiuta a comprendere sempre più in profondità (e a smontare) il modo in cui strutturiamo i nostri giudizi superficiali sulla base di semplici percezioni visive di persone sconosciute.

TAKEAWAY

  • Uno studio congiunto a cura di tre Atenei USA – emulando la percezione visiva dell’essere umano mediante la creazione di una rete neurale ad hoc – indaga gli stereotipi sociali che inquinano i giudizi sulle persone viste solo in fotografia. Giudizi dal danno enorme, nel momento in cui, ad esempio, si è chiamati a prendere decisioni nell’ambito della selezione di nuovi talenti.
  • Il set di dati utilizzato per addestrare la rete neurale artificiale comprendeva migliaia di giudizi percettivi su mille immagini di visi di persone, suddivise per genere, etnia e attributi, tra cui età, peso corporeo, grado di affidabilità espresso, grado di intelligenza, attrattività e familiarità.
  • I primi dati dello studio parlano di un generale allineamento dei giudizi formulati dalla macchina rispetto a quelli umani. Tuttavia, nel momento in cui si predilige l’analisi qualitativa di tali giudizi, emergono elementi nuovi, non contemplati nel dataset di partenza, tra cui il grado di illuminazione dell’immagine e la presenza della natura alle spalle del soggetto fotografato, aprendo così a ulteriori riflessioni e a futuri approfondimenti su tema.

Quando, al solo osservare la fotografia che ritrae il volto di una persona, questa viene giudicata “affidabile”? E quando, invece, poco meritevole di fiducia? Sono da considerarsi variabili cruciali la curva delle sopracciglia, l’espressione seria o, al contrario, il sorriso aperto oppure la mascella volitiva? Sulla percezione visiva dei volti umani condizionata da stereotipi sociali (classica è l’equazione in base alla quale le persone con occhiali da vista sono “visivamente” percepite come più intelligenti) – che, inevitabilmente, ci inducono a essere poco obiettivi e a esprimere giudizi percettivi che niente hanno a che vedere con la reale personalità, le inclinazioni e le competenze del soggetto in questione – esiste una discreta letteratura.

Un recente articolo dal titolo “Deep models of superficial face judgments” – a cura dello Stevens Institute of Technology (New Jersey), della Princeton University e dell’Università di Chicago – riporta i primi esiti di uno studio congiunto (tuttora in corso) che tenta, invece, di esplorare gli stereotipi sociali avvalendosi di tecniche di machine learning, per mezzo delle quali è possibile prevedere con precisione come verranno percepite le persone solo in base a una fotografia che ritrae il loro viso. Vediamo insieme che cosa ne è emerso.

La generazione del dataset e l’addestramento della rete neurale

Lo studio in tema di percezione visiva e stereotipi sociali ha visto dapprima la generazione di 1.004 immagini sintetiche di volti umani, dalle quali sono stati rimossi tutti quegli elementi contenenti distorsioni quali, ad esempio, macchie, alterazioni nelle forme o nei colori, accessori non pertinenti e artefatti visivi particolarmente vistosi.

Il set di dati finale includeva immagini di visi di persone dell’Asia orientale, di persone di colore, latino americane e di etnia caucasica, equamente suddivisi per genere. Oltre al genere, ogni “identità facciale” presentava volutamente caratteristiche che riflettevano attributi relativi all’età (bambino/giovane/anziano), al peso corporeo, all’essere affidabile, intelligente, attrattiva (memorable) e alla mano (familiar).

Tali identità (1.004 in totale) sono state sottoposte al giudizio di migliaia di partecipanti alla ricerca, le cui risposte sono state poi impiegate per addestrare una rete neurale a formulare giudizi sulle persone, basati esclusivamente sulle fotografie dei loro volti (anch’esse generate sinteticamente).

«Molti dei risultati ottenuti finora dall’algoritmo di intelligenza artificiale sono in linea con stereotipi comuni: ad esempio, le persone che sorridono tendono a essere considerate più affidabili, coloro che indossano un paio di occhiali da vista tendono ad essere ritenute più intelligenti»

spiega il team. «In altri casi – osservano – è un po’ più difficile comprendere perché l’algoritmo AI attribuisce un tratto particolare al viso di una persona».

In ogni caso, esso non fornisce feedback mirati, né spiega perché una determinata immagine evoca un dato giudizio. Non è questo l’obiettivo del lavoro, che si propone, invece, di aiutarci a capire meglio come “funziona” il meccanismo dello stereotipo sociale in presenza di identità facciali. Ma andiamo più in profondità.

Percezione visiva e stereotipi sociali: l’interpretazione dei giudizi

In tema di percezione visiva e stereotipi sociali, i giudizi emessi dalla macchina ricalcano – come già accennato – il ragionamento umano di fronte alle fotografie di volti di soggetti di genere, età ed etnie diverse.

Come mostra la figura sottostante – che riassume solo una parte del dataset utilizzato per allenare la rete neurale – il giudizio percettivo finale è correlato alla quantità (“less” o “more”) di determinati attributi percepiti, che includono caratteristiche fisiche come, ad esempio, il peso corporeo (espresso dalla “dimensione” del volto), caratteristiche estetiche (capelli grigi e rughe), comportamentali (espressione corrucciata, sguardo basso o sorriso aperto) o la presenza di elementi esterni come occhiali da vista o make up accentuato.

Tabella riassuntiva di una parte del set di dati utilizzato dai ricercatori per addestrare la rete neurale artificiale, in cui sono visibili immagini di volti di persone di etnia caucasica, suddivise per genere maschile e femminile e per attributi (età, peso grado di affidabilità, di intelligenza, attrattività e familiarità). Al variare (“less” o “more”) di alcune caratteristiche puramente fisiche (ad esempio, la massa corporea), estetiche (capelli grigi e rughe), comportamentali (espressione corrucciata, sguardo basso o sorriso aperto) oppure relative a elementi esterni (occhiali da vista), varia il giudizio percettivo: le persone con i capelli grigi o con le rughe sono comunque giudicate “vecchie”, indipendentemente dalla loro età anagrafica. E quelle che indossano occhiali da vista sono ritenute “più intelligenti”, senza neppure conoscerle (Fonte: “Deep models of superficial face judgments” - https://www.pnas.org/doi/epdf/10.1073/pnas.2115228119).
Parte del set di dati utilizzato dai ricercatori per addestrare la rete neurale artificiale, in cui sono visibili immagini di volti di persone di etnia caucasica, suddivise per genere e per attributi (età, peso corporeo, grado di affidabilità, di intelligenza, attrattività e familiarità). Al variare (“less” o “more”) di alcune caratteristiche puramente fisiche (ad esempio, la massa corporea), estetiche (capelli grigi e rughe), comportamentali (espressione corrucciata, sguardo basso o sorriso aperto) oppure relative a elementi esterni (occhiali da vista), varia il giudizio percettivo: le persone con i capelli grigi o con le rughe sono comunque giudicate “vecchie”, indipendentemente dalla loro età anagrafica. E quelle che indossano occhiali da vista sono ritenute “più intelligenti”, senza neppure conoscerle (Fonte: “Deep models of superficial face judgments” – https://www.pnas.org/doi/epdf/10.1073/pnas.2115228119).

L’interpretazione dei giudizi diventa, invece, più impegnativa quando, dalla dimensione quantitativa (“less” o “more”) degli attributi, ci si sposta verso quella qualitativa. Ad esempio – si domanda il gruppo di studio – quando la macchina deduce che un viso è meno o più affidabile di un altro? Sarà per le sopracciglia corrugate e la mascella larga (come accaduto nei giudizi umani espressi dai partecipanti) oppure per la luce sul volto del soggetto o la natura alle sue spalle? O per tutti questi elementi presi nel loro insieme?

E in che modo – ad esempio – il colore dei capelli dei soggetti nelle foto incide sul giudizio finale del sistema AI? L’algoritmo, in questo esperimento, ha associato il capello più scuro a determinate caratteristiche della personalità. Da questo punto di vista, lo studio americano – tuttora in corso – apre a ulteriori riflessioni e a futuri approfondimenti.

Un’altra considerazione emersa riguarda la diversità dei volti utilizzati nell’esperimento. Si va dai visi di bambini a quelli di persone anziane. Il che potrebbe «offuscare il significato di alcuni attributi. Ad esempio, la semantica dell’attributo “memorable” può differire quando si valutano le immagini di bambini rispetto agli adulti». Così come quando si tratta dell’attributo “intelligente”.

Le basi per future ricerche

Il contesto dell’esperimento in tema di percezione visiva e stereotipi sociali – notano gli autori – è eterogeneo. Al di là della densa mole di dati utilizzati (migliaia i giudizi percettivi su 1.004 immagini), è la diversità delle categorie rappresentate (età – dall’infanzia alla vecchiaia – e quattro etnie differenti) e degli attributi presi in esame che rende il lavoro alquanto complesso. Il lavoro futuro avrà il compito di strutturare con maggiore precisione il campione dei volti, superandone la casualità.

Inoltre, resta da approfondire anche un altro punto, riguardante gli “stimoli visivi sintetici” generati: sebbene questi riproducano volti realistici, si tratta pur sempre di volti diversi da quelli reali, al punto che potrebbero falsare i giudizi percettivi da parte del sistema di intelligenza artificiale. «Per questo motivo, i ricercatori che utilizzano questi stimoli per trarre conclusioni sulla percezione umana dei volti, dovrebbero sempre avere cura di convalidare i risultati emersi utilizzando fotografie di volti reali».

I futuri studi in materia dovranno, poi, prevedere correlazioni tra attributi su sottoinsiemi di dati con fasce di età limitate. Infatti, l’avere incluso nel dataset un corposo numero di visi di bambini ha portato la macchina a stabilire correlazioni tra giudizi percettivi che rimandano ad attributi, per loro natura, diversi (ad esempio tra quelli relativi all’intelligenza e all’attrattività), alterando la media dei giudizi globali formulati:

«La struttura dei giudizi sui volti dei bambini è diversa dalla struttura dei giudizi sui volti degli adulti. L’inclusione, nel set di dati, di volti di bambini spiega alcune discrepanze, tra cui l’asse intelligente-attrattivo (memorable), in base al quale i visi di bambini percepiti come “smart” sono quelli più buffi e divertenti e, per gli stessi motivi, giudicati “attrattivi”»

Percezione visiva e stereotipi sociali: riflessioni etiche sull’alterazione delle immagini

Un algoritmo di artificial intelligence in grado di simulare i meccanismi umani della percezione visiva e degli stereotipi sociali, attribuendo determinate caratteristiche relative alla personalità, al grado di intelligenza e alle competenze di una persona, solo osservando una fotografia che ne ritrae il viso, impone alcune riflessioni di carattere etico.

In particolare, se sfruttato per fini malevoli, esso potrebbe contribuire ad alimentare – affinandolo – il fenomeno del deepfake, ad esempio attraverso la sottile alterazione di immagini reali per manipolare (in modo negativo) l’opinione del pubblico in merito a determinati personaggi. Emblematica è l’applicazione in ambito politico, in cui:

«… l’algoritmo messo a punto potrebbe essere utilizzato in modo tale da fare apparire un candidato politico come “particolarmente affidabile” e, al contrario, il suo avversario come “poco intelligente”»

Per scongiurare rischi simili, il team di ricercatori ha deciso di definire una serie di misure atte a garantire che il proprio lavoro non venga utilizzato per fini impropri e illeciti.

Ricordiamo che l’obiettivo principe di questa ricerca (non conclusa, ma tuttora in corso) è giungere a comprendere sempre più in profondità il modo in cui si strutturano i giudizi superficiali, particolarmente dannosi nel momento in cui si à chiamati a prendere decisioni di rilievo in merito alle persone, ad esempio nell’ambito delle risorse umane e della selezione e gestione del personale.

Scritto da:

Paola Cozzi

Giornalista Leggi articoli Guarda il profilo Linkedin