Universal Scene Description (USD) è la tecnologia che dovrà costituire per il metaverso ciò che l’html tuttora rappresenta per il web. Creato da Pixar per supportare la pipeline di produzione dei film di animazione in 3D, è stato in seguito reso open source e supportato da moltissime aziende enterprise, che compongono il Metaverse Standards Forum.

TAKEAWAY

  • USD è un formato creato da Pixar per supportare la pipeline di creazione delle scene 3D dei suoi celebri film di animazione.
  • Reso open source nel 2015, USD è entrato nell’orbita di NVIDIA e di decine di aziende impegnate nella costruzione dei mondi virtuali in 3D. USD è stato definito l’html del metaverso per la sua capacità di costruire la “struttura” della scena, in maniera concettualmente simile a quanto l’html fa per le pagine web.
  • Il Metaverse Standards Forum, consorzio che si occupa di definire gli standard tecnologici per sviluppare le applicazioni del metaverso, ha scelto di supportare USD, inserendolo tra le principali tecnologie 3D su cui lavorare in termini di sviluppo

Parlare del formato USD per il metaverso necessita di una puntuale premessa. Innanzitutto, preme ricordare che costruire il metaverso rappresenta una delle principali missioni tecnologiche che l’industria globale si sta preparando ad affrontare. Il tempo dei proclami mediatici presto o tardi è destinato a concludersi.

Accadrà l’inevitabile. Ci si renderà semplicemente conto della realtà dei fatti: la strada che ci separa dalla possibilità di unire in maniera persistente e interattiva il mondo reale con i mondi virtuali in 3D sarà molto lunga.

Tuttavia, il percorso potrebbe risultare più interessante di una destinazione al momento del tutto ignota, se non in termini di potenzialità. Almeno in questa istanza, il metaverso non si prefigura come un unico mondo virtuale in cui saremo tutti indistintamente immersi, ma all’equivalente tridimensionale e immersivo dell’attuale World Wide Web, popolato da tanti siti accessibili utilizzando determinati protocolli, mediante l’infrastruttura della rete internet.

Tra il futuro metaverso e l’attuale web vi sono molte similitudini dal punto di vista concettuale, al punto che i mondi virtuali 3D si configurano anche quali i successori tecnologici degli attuali siti internet e, in generale, delle applicazioni 2D con cui siamo soliti interagire con mouse e tastiera o display touchscreen.

Per usare un’espressione gergale, oggi si sta iniziando a fare sul serio, ponendo le basi tecnologiche che consentiranno a tutti i creatori di asset 3D ed esperienze interattive di parlare la stessa lingua dal punto di vista tecnologico.

Il web tradizionale, che oggi diamo per scontato, si è formato e diffuso utilizzando standard come il linguaggio html e le immagini jpeg, rappresentabili da qualsiasi browser. Si tratta di un percorso di evoluzione che dura ormai da trent’anni e che il metaverso sta iniziando oggi, nel definire i propri standard tecnologici, sulla base di tecnologie esistenti che provengono in gran parte da contesti già noti.

Abbiamo di recente presentato il formato glTF come il jpeg del metaverso, grazie alla sua capacità di rendere interoperabili i singoli asset 3D necessari per popolare le varie applicazioni.

Oltre ai singoli contenuti, ragionando in analogia con i siti internet, occorre però la “struttura di pagina”. A tale proposito entra in gioco il formato USD (Universal Scene Description) per il metaverso.

Durante un talk del GTC 2022, evento di riferimento per le tecnologie interattive per il gaming, USD è stato definito da NVIDIA quale l’html del metaverso, grazie alla sua capacità di «Descrivere, comporre, simulare e rendere possibile la collaborazione nei mondi virtuali 3D».

Originariamente sviluppato da Pixar, e utilizzato prevalentemente nell’industria dell’entertainment, USD è stato successivamente reso open source, guadagnandosi le attenzioni di altri giganti dell’industria del 3D, a cominciare da NVIDIA che, all’atto pratico, è oggi il suo principale sponsor.

USD è sempre più utilizzato in diversi settori: manifattura, automotive, aerospace, architettura, ingegneria, design, retail, simulazioni scientifiche, robotica e molti altri.

Proprio a partire dalla sua storia, cerchiamo di capire cosa rende Universal Scene Description una tecnologia 3D tanto votata all’interoperabilità da essere addirittura definito l’html del metaverso.

Universal Scene Description: la tecnologia di Pixar per realizzare i mondi virtuali 3D dei suoi capolavori in animazione

Prima dell’applicazione del formato USD per il metaverso, la storia di una tecnologia come Universal Scene Description nasce nei primi anni Novanta, quando Pixar Animation Studios ha iniziato a produrre il primo film di animazione realizzato interamente in 3D: Toy Story.

Abbattere la complessità tecnologica dei workflow è diventato sin da subito una delle principali sfide per gli ingegneri del software della società di Emeryville, acquisita nel 2006 dal colosso Disney.

Per rendere davvero scalabile la produzione, occorreva soprattutto una tecnologia dotata di funzioni di reference, layer e gerarchie, in modo da poter razionalizzare la gestione di scene di enorme complessità.

La pipeline lineare di una produzione VFX prevede il contributo dei team di modellazione, animazione, rigging, lookdev e lighting, con un lavoro che si conclude con la fase di compositing, dove tutti gli elementi di una shot vengono tradotti nel visual che arriva nelle sale cinematografiche per essere processati nel rendering finale.

Dopo molti anni di ricerca e sviluppo, Pixar ha finalizzato Presto, una tecnologia utilizzata per la prima volta in occasione di Brave (2012). Le potenzialità di Presto erano molto elevate, ma rimaneva un problema di fondo: la sua complessità d’uso, che condizionava inevitabilmente il lavoro degli artisti.

Dalla volontà di ottimizzare la performance e ottenere qualcosa di più user friendly per i creativi, è nato USD – Universal Scene Description, dove sono confluite molte delle feature originariamente sviluppate per Presto.

Il formato USD descrive tutti i componenti essenziali della scena virtuale 3D, consentendo a tutti i team impegnati lungo la pipeline di sviluppo la possibilità di contribuire con i loro contenuti, che si configurano quali una serie di layer, i cui contenuti rimangono modificabili singolarmente in fase di compositing.

Concettualmente, una struttura a layer consente, infatti, di gestire ogni singolo aspetto indipendentemente dalla complessità generale della scena, mediamente molto elevata.

USD, la svolta open source dell’html del metaverso

Nel 2015, Pixar ha deciso di rendere open source quella che fino a quel momento era rimasta una tecnologia proprietaria. USD è diventata non soltanto disponibile per chiunque, ma anche personalizzabile sulla base delle proprie esigenze, aggiungendo moltissime funzioni che non rientravano logicamente nei presupposti di sviluppo originali di Pixar.

Quella che poteva sembrare una mossa a sorpresa era in realtà il risultato di una strategia molto ben mirata. Se Pixar avesse mantenuto USD un formato chiuso, avrebbe avuto fondamentalmente due problemi non indifferenti.

Da un lato, avrebbe rischiato di dover reingegnerizzare la propria pipeline per supportare un altro formato aperto, come Alembic, molto utilizzato nell’ambito delle produzioni VFX. In secondo luogo, avrebbe dovuto sviluppare internamente i plugin di integrazione per i software di creazione di contenuti 3D, come Maya, Blender, Katana, Houdini ecc.

Rendendo USD aperto, Pixar non ha dovuto modificare la propria pipeline, lasciando agli sviluppatori di terze parti l’onere di rendere la propria tecnologia compatibile con i software di creazione di contenuti 3D, evitando pertanto di impegnare risorse interne.

L’evoluzione di USD nell’industria 3D, dal digital twin al metaverso

Una volta divenuto open source, quello che sarebbe diventato il formato USD per il metaverso ha logicamente attirato l’attenzione di altri player tecnologici. Tra il 2017 e il 2020 ha iniziato inoltre a emergere l’esigenza di applicazioni 3D interattive per supportare le esperienze di molte industrie.

A prescindere dall’applicazione finale nel metaverso, il gap da colmare si posiziona tra il software 3D utilizzato per creare gli asset 3D (Maya, Blender, 3ds Max ecc.) e gli engine real time in grado di assemblare e rendere interattive le scene complete (Unity, Unreal Engine, ecc.). USD funge in sostanza da ponte, per rendere interoperabili i contenuti generati dalle varie applicazioni coinvolte nel workflow di produzione.

Analogamente al glTF, il formato USD risulta piuttosto maturo per quanto riguarda le applicazioni statiche, ma piuttosto acerbo quando entra in gioco l’interattività, e dunque la componente real time, dal momento che Universal Scene Description non è nato per questo genere di esigenza, ma per realizzare contenuti offline come il cinema di animazione 3D.

In tal senso, USD dovrebbe ripercorre, per gli ambienti 3D, la stessa evoluzione a cui abbiamo assistito tra l’html di prima generazione, puramente statico, e l’html 5, dotato di funzionalità dinamiche e interattive evolute.

NVIDIA, leader tecnologico hardware e software nella computer grafica 3D, ha scelto di utilizzare USD come formato di riferimento per la propria piattaforma 3D Omniverse, e lo ha fatto in virtù della sua nativa vocazione all’interoperabilità e del fatto che gode già dell’enorme lavoro di sviluppo effettuato da Pixar.

Omniverse è, al momento, una piattaforma giovane, composta da vari tool proprietari e integrazioni con i principali software 3D presenti sul mercato. Omniverse si sta diffondendo soprattutto nell’ambito del digital twin nel contesto enterprise, a cominciare dalle simulazioni in ambito industriale e dalle applicazioni per la smart city.

NVIDIA è uno dei membri più rappresentativi del neonato Metaverse Standards Forum, consorzio a cui contribuiscono decine di aziende impegnate, a vario titolo, nella creazione del metaverso e dei contenuti digitali in 3D. Persino Apple, che originariamente ha scelto di non entrare nel forum, ha deciso di supportare lo sviluppo di USD.

La standardizzazione e la condivisione dei principi di sviluppo costituiscono la base di lavoro che vedrà impegnato il Metaverse Standards Forum per molti anni. Tra le tecnologie su cui si è deciso di lavorare figurano glTF e USD, rispettivamente il Jpeg e l’html del metaverso.

Formato USD per il metaverso: supportare l’interoperabilità e l’interattività dei mondi virtuali 3D

NVIDIA ha recentemente pubblicato un articolo in cui presenta gli aspetti su cui sta lavorando con i propri partner commerciali e nel Metaverse Standards Forum, distinguendo gli obiettivi a breve e medio termine da quelli a lungo termine.

Per quanto riguarda gli obiettivi a breve e medio termine, sarà importante lavorare sull’integrazione e l’interoperabilità per far si che il formato USD per il metaverso acquisisca una diffusione sempre maggiore come standard per le applicazioni 3D, in particolare:

  • interoperabilità con il glTF, per gestire in maniera sempre più semplice i singoli asset 3D nelle scene complete USD
  • schema geospaziale basato sullo standard WGS84 per il supporto della coerenza tra il mondo reale e i contenuti digitali nel digital twin, fondamentale per le applicazioni industriali
  • supporto al carattere internazionale UTF-8, sulla base di una collaborazione tra NVIDIA e Pixar, finalizzata a rendere USD accessibile in tutto il mondo
  • sviluppo di una piattaforma di testing e certificazione per i contenuti USD, rigorosamente open source, ai fini di agevolare e accelerare il lavoro dei creatori di contenuti, favorendo lo sviluppo complessivo della tecnologia, soprattutto nelle circostanze in cui si rende opportuno personalizzare e sviluppare nuovi componenti

Per quanto riguarda invece gli obiettivi a lungo termine:

  • salvataggi incrementali più veloci per supportare le simulazioni del digital twin, dal momento che il formato USD originale non è stato scritto secondo queste logiche
  • tecnologie procedurali in real time, sulla base dell’engine OmniGraph
  • compatibilità con i browser, dal momento che USD è scritto in C++ e Python, mentre tutti i web browser, la cui grande maggioranza di basa su Chromium, si basano su altri linguaggi, a cominciare da Javascript
  • streaming in real time dei dati IoT, molto importante per supportare le simulazioni virtuali dei digital twins industriali. Le attuali limitazioni verranno risolte mediante specifici connettori
Scritto da:

Francesco La Trofa

Giornalista Leggi articoli Guarda il profilo Linkedin