Japanese
Leave Your Message

Sta arrivando il CAD generativo: Autodesk, azienda da 60 miliardi di dollari, sta internalizzando i grandi modelli CAD.

2025-01-20

Cad Anche il colosso Autodesk sta introducendo l'intelligenza artificiale generativa.
Al momento della stesura di questo articolo, il titolo Autodesk (US:ADSK) è in rialzo di oltre il 20% dall'inizio del 2024, a 293,32 dollari per azione, con una capitalizzazione di mercato totale di 63,064 miliardi di dollari.
'Stiamo sviluppando un modello base di IA generativa diverso da qualsiasi altro modello esistente'. Raji Arasu, vicepresidente esecutivo e direttore tecnologico di Autodesk, ha dichiarato di recente durante un evento pubblico. Il modello base a cui Raji Arasu si riferisce, rivelato nel maggio 2024, si chiama 'Bernin', un progetto di IA generativa che Convertireconvertire testi, schizzi disegnati a mano, ecc. in file 3D.
Per quanto riguarda l'attuale mercato dei modelli di grandi dimensioni, l'implementazione di funzionalità 3D generate da grafi non sembra essere una novità. Genie 2, il software appena rilasciato da Google DeepMind, Hybrid (disponibile negli Stati Uniti) e VoxCraft di BioDigital Technology, per citarne alcuni, offrono tutti funzionalità simili. Tuttavia, in quanto gigante globale del CAD, Bernini riveste una grande importanza pratica per il business di Autodesk.

Alla scoperta di Bernini
Bernini prende il nome da Gian Lorenzo Bernini, il famoso scultore e architetto italiano del XVII secolo. Per quanto riguarda la selezione dei dati di addestramento, il modello è stato addestrato su 10 milioni di forme 3D disponibili pubblicamente da Autodesk AI Labs in collaborazione con l'Università cinese di Hong Kong.
Il motivo per cui Bernini si differenzia dagli altri modelli base di grandi dimensioni è che Bernini possiede tre caratteristiche principali nella generazione di immagini 3D:
1. La struttura dell'immagine 3D generata è una struttura 3D funzionale. Ad esempio, genera bottiglie d'acqua cave che svolgono effettivamente la funzione di contenere acqua, anziché generare semplicemente modelli simili;
2. Separazione di forme e texture. La possibilità di generare forme e texture separatamente offre all'utente la libertà di regolare le variabili, fonderle insieme o creare altri design, evitando il problema di confondere texture e contorni di oggetti 3D;
3. Offre una vasta gamma di varianti. Ottimizzata per i flussi di lavoro di geometria professionale, la possibilità di generare molteplici varianti funzionali di forme 3D da un singolo input offre ai progettisti un'ampia scelta e accelera il loro flusso di lavoro creativo.

news-5.jpg

Schermata dell'interfaccia utente di Autodesk

In questo contesto, il modello di base deve superare un ostacolo naturale al processo di progettazione e produzione per raggiungere tali caratteristiche, ovvero l'IA deve essere pienamente in sintonia con la complessa logica di input e output del lavoro di progettazione. "Accettando input multimodali come testo, schizzi, voxel e nuvole di punti, questi replicano il processo di progettazione del creatore", spiega Raji Arasu.
Inoltre, poiché la generazione di geometrie come quelle generate con il CAD 3D richiede un ragionamento basato sulle leggi della fisica in termini di spazio e struttura, essa esige anche un elevato livello di precisione e accuratezza.
In termini di tempistiche, il lancio di Bernini non sembra essere stato rapido. Da maggio 2024, quando sono stati svelati i progressi di Bernini, è trascorso quasi un anno. All'epoca, Bernini aveva pubblicato solo una parte del video concettuale. E solo in occasione della conferenza utenti di Autodesk a San Diego, in ottobre, l'amministratore delegato Andrew Anagnost ha presentato un'anteprima di Bernini.
Tuttavia, Andrew Anagnost ha affermato che Bernini è addestrato con dati pubblici e non è ancora disponibile per uso commerciale, ma è stato aperto alla comunità dell'IA. Ha però rivelato un possibile piano aziendale per Bernini: "Il metodo di addestramento di Bernini è indipendente dai dati, quindi i clienti possono utilizzare i propri dati, se necessario, per ottimizzare Bernini e migliorare continuamente il modello".

Come è nato Bernini
Anche il processo di addestramento di Bernini utilizza le GPU NVIDIA, ma, al di là delle GPU, Raji Arasu ritiene che l'elaborazione e l'utilizzo dei "dati" siano ancora più importanti nell'addestramento di un modello. Nel suo intervento, Raji Arasu ha approfondito questo processo, suddividendolo in gestione dei dati, preparazione dei dati, addestramento del modello per ottimizzare costi ed efficienza e gestione della complessità per l'inferenza del modello.
"È necessario elaborare miliardi di oggetti e petabyte di dati di diverse dimensioni, forme e carichi di lavoro", ha affermato Raji Arasu.
Autodesk aveva bisogno di creare un'infrastruttura dati nel cloud per gestire l'enorme volume di file di progettazione di grandi dimensioni. Per questo motivo, ha scelto Amazon DynamoDB come database principale e ha creato un modello dati canonico che consente scritture su centinaia di partizioni con elevata velocità di trasmissione e latenza quasi nulla.
Oltre a risolvere il problema delle prestazioni dei dati, Autodesk ha completato facilmente il processo di preparazione dei dati per l'addestramento di base del modello combinando servizi cloud come Amazon EMR, Amazon EKS, Amazon Glue e Amazon SageMaker, che hanno caratterizzato, etichettato e segmentato grandi quantità di dati storici complessi.
Nella fase di addestramento del modello, Autodesk ha dovuto affrontare numerosi problemi, come la scelta della GPU, e alla fine ha optato per Amazon SageMaker per unificare la soluzione, occupandosi di test, gestione dell'infrastruttura e altro ancora. Il team si è concentrato maggiormente sulla preparazione dei dati, sullo sviluppo del modello e sullo sviluppo di funzioni di intelligenza artificiale orientate al cliente.
Latenza, costi e prestazioni devono essere affrontati adeguatamente quando si gestisce l'inferenza dei modelli su larga scala. "Gli endpoint di scalabilità automatica e multi-modello di Amazon SageMaker supportano senza soluzione di continuità l'inferenza in tempo reale e in batch per un throughput elevato, una latenza minima e la massima efficienza in termini di costi", ha affermato Raji Arasu.
Come potete vedere, la versione di Bernini sviluppata da Autodesk fa ampio uso di Amazon SageMaker, il servizio di intelligenza artificiale e machine learning più conosciuto di Amazon Cloud Technologies, che diverse organizzazioni di alto profilo, tra cui Autodesk, utilizzano Amazon SageMaker HyperPod per l'addestramento dei modelli. Amazon SageMaker HyperPod ha recentemente rilasciato diversi importanti aggiornamenti, come i Flexible Training Plans, che consentono di creare processi di addestramento più automatizzati ottimizzando i costi grazie all'utilizzo efficiente di un'ampia gamma di risorse di calcolo più economiche, e la Task Governance, che assegna priorità alle diverse attività di addestramento per massimizzare l'addestramento, la messa a punto e il ragionamento dei modelli durante il processo di utilizzo delle risorse.
Grazie a queste innovazioni, Autodesk è riuscita a dimezzare i tempi di implementazione dei modelli di base. Ciò ha incrementato la produttività dell'IA del 30%, mantenendo stabili i costi operativi. Raji Arasu ha inoltre rivelato che Autodesk ha iniziato a implementare per i clienti le funzionalità di IA basate su questi modelli di base.
"Agiamo come partner di progettazione per i nostri clienti, aiutandoli a bilanciare parametri come la resistenza dei materiali e i costi, in modo che possano individuare la soluzione di design migliore. Tutto ciò al fine di ridurre al minimo le attività ripetitive e massimizzare la creatività", ha affermato Raji Arasu.

Dati corretti, presupposto fondamentale per l'addestramento di modelli di grandi dimensioni.
Dopo ChatGPT, le GPU NVIDIA sono diventate un obiettivo ambito per le principali aziende di intelligenza artificiale, e il numero di GPU NVIDIA ordinate da una grande azienda in un anno può persino finire sulle prime pagine dei giornali. Tuttavia, per riassumere il processo di nascita di Bernini, la GPU è certamente importante, ma sono i dati a determinare la qualità dell'addestramento di modelli di grandi dimensioni.
E addestrare un modello complesso che possa davvero funzionare in ambito aziendale è un problema di sistema end-to-end che coinvolge molti aspetti.
"I modelli di grandi dimensioni sono solo una parte dell'innovazione delle applicazioni di IA generativa. Ci sono altre capacità che devono essere potenziate affinché l'innovazione delle applicazioni di IA generativa abbia successo. Prima di tutto, è necessario assicurarsi che l'IA generativa possa potenziare le capacità dei modelli di grandi dimensioni delle applicazioni di IA generativa con i dati propri dell'organizzazione." Ruisong Chu, vicepresidente globale di Amazon e presidente di Amazon Cloud Technology Greater China, ha espresso opinioni simili in un discorso.
Nel caso del problema dell'illusione, che ora rappresenta una grande preoccupazione per i modelli complessi, esso può essere risolto anche dal punto di vista dei "metadati", ovvero garantendo la qualità dei dati nella base di conoscenza prima di addestrare i modelli complessi. "I metadati nel database, ovvero dati di alta qualità che sono stati esaminati e approvati, contribuiscono a ridurre la latenza e a migliorare la risposta del modello complesso". Mai-Lan Tomsen Bukovec, vicepresidente della tecnologia presso Amazon Cloud Technologies, ha affermato di aver messo in guardia le organizzazioni che addestrano modelli complessi, invitandole a distinguere attentamente tra ciò che è creato dalle persone e ciò che è generato dall'intelligenza artificiale.
È proprio per l'importanza dei dati che i big data stanno accelerando il modo in cui le aziende valorizzano le proprie risorse di dati. Due mesi fa, Qunar Technology, la società madre di Cool Spaces, una piattaforma cinese di progettazione spaziale 3D, ha presentato un nuovo piano aziendale, lanciando una piattaforma di training sui dati per l'intelligenza artificiale e altre applicazioni, con l'obiettivo di rendere disponibile il più grande dataset al mondo per il deep learning sulla consapevolezza degli ambienti interni. L'azienda ha rivelato che la piattaforma conta già oltre 320 milioni di modelli 3D, con una media di 77,8 milioni di visitatori attivi mensili. Qunar Technology renderà disponibili risorse di dati spaziali 3D fisicamente accurate, soluzioni di cognizione spaziale e servizi di training sull'intelligenza spaziale per AIGC, intelligenza artificiale, realtà aumentata/virtuale e altre aziende.
I dati mostrano che circa il 77% delle aziende aumenterà o incrementerà significativamente i propri investimenti in IA e tecnologie emergenti entro 3 anni, e che i 3 ambiti in cui l'IA sarà la prima a registrare miglioramenti in termini di efficienza sono l'automazione, l'analisi e l'aumento (automazione, analisi dei dati e aumento assistito).
"L'intelligenza artificiale sta rimodellando tutti i settori" non è più solo uno slogan. "Sempre più settori stanno diventando attivi nel campo dell'IA generativa". Uwem Ukpon, vicepresidente dei servizi globali di Amazon Cloud Technologies, ha affermato che l'ambito di applicazione industriale dell'IA generativa si è gradualmente ampliato, passando dal settore finanziario, inizialmente predominante, a una vasta gamma di settori, tra cui il settore pubblico, le industrie tradizionali, le organizzazioni governative, nonché settori come le scienze della vita e la sanità. Allo stesso tempo, l'IA generativa offre anche nuove opportunità di business per le imprese; Autodesk, ad esempio, sta puntando sul CAD generativo basato su grandi quantità di dati, un potenziale mercato futuro.