Japanese
Leave Your Message

La CAO générative arrive, Autodesk, valorisé à 60 milliards de dollars, internalise les grands modèles de CAO

2025-01-20

Goujat Le géant Autodesk se lance lui aussi dans l'IA générative.
Au moment de la publication, l'action d'Autodesk (US:ADSK) est en hausse de plus de 20 % sur l'année 2024 à 293,32 $ par action, avec une capitalisation boursière totale de 63,064 milliards de dollars.
« Nous développons un modèle de base d'IA générative unique en son genre », a déclaré récemment Raji Arasu, vice-président exécutif et directeur technique d'Autodesk, lors d'une intervention publique. Le modèle de base auquel Raji Arasu fait référence, dévoilé en mai 2024, s'appelle « Bernini », un projet d'IA générative. Convertirdu texte, des croquis dessinés à la main, etc., transformés en fichiers 3D.
En ce qui concerne le marché actuel des grands logiciels de modélisation, l'intégration de fonctionnalités 3D générées par graphes n'a rien de nouveau. Genie 2 de Google DeepMind, récemment lancé, Hybrid de Tencent (Chine) et VoxCraft de BioDigital Technology, pour n'en citer que quelques-uns, proposent des fonctionnalités similaires. Cependant, en tant que géant mondial de la CAO, Bernini revêt une importance pratique considérable pour les activités d'Autodesk.

Découverte de Bernini
Le modèle Bernini doit son nom à Gian Lorenzo Bernini, célèbre sculpteur et architecte italien du XVIIe siècle. Pour l'entraînement, il a été optimisé grâce à 10 millions de formes 3D accessibles au public, développées par Autodesk AI Labs en collaboration avec l'Université chinoise de Hong Kong.
La raison pour laquelle Bernini se distingue des autres grands modèles de base réside dans ses trois caractéristiques principales en matière de génération d'images 3D :
1. La structure de l'image 3D générée est une structure 3D fonctionnelle. Par exemple, elle génère des bouteilles d'eau creuses qui remplissent réellement la fonction de contenir de l'eau, au lieu de simplement générer des modèles qui se ressemblent ;
2. Séparer les formes et les textures. La possibilité de générer séparément les formes et les textures offre à l'utilisateur la liberté d'ajuster les variables, de les mélanger ou de créer d'autres designs, évitant ainsi le problème de la confusion entre les textures et les contours des objets 3D ;
3. Offre une vaste gamme de variantes. Optimisée pour les flux de travail géométriques professionnels, la possibilité de générer plusieurs variantes de formes 3D fonctionnelles à partir d'une seule entrée offre aux concepteurs un large choix et accélère leur processus créatif.

news-5.jpg

Capture d'écran de l'interface utilisateur d'Autodesk

Pour atteindre ces caractéristiques, le modèle de base doit surmonter un obstacle inhérent au processus de conception et de fabrication : l’IA doit être parfaitement adaptée à la logique complexe des entrées et sorties du travail de conception. « L’acceptation d’entrées multimodales telles que du texte, des croquis, des voxels et des nuages ​​de points permet de reproduire le processus de conception du créateur », explique Raji Arasu.
De plus, comme la génération de géométries telles que la CAO 3D nécessite un raisonnement basé sur les lois de la physique en termes d'espace et de structure, elle exige également un haut niveau de précision et d'exactitude.
Ainsi, en termes de calendrier, le lancement de Bernini n'a pas été des plus rapides. Depuis mai 2024, date à laquelle les progrès de Bernini ont été dévoilés, presque une année s'est écoulée. À ce moment-là, Bernini n'avait diffusé qu'une partie de la vidéo de présentation du concept. Et ce n'est qu'à la conférence utilisateurs d'Autodesk à San Diego, en octobre, que le PDG Andrew Anagnost a présenté un aperçu de Bernini.
Cependant, Andrew Anagnost a précisé que Bernini est entraîné avec des données publiques et n'est pas encore disponible pour un usage commercial, mais qu'il est ouvert à la communauté de l'IA. Il a néanmoins dévoilé un plan d'affaires possible pour Bernini : « La méthode d'entraînement de Bernini est indépendante des données, ce qui permet aux clients d'utiliser leurs propres données, si nécessaire, pour optimiser Bernini et améliorer continuellement le modèle. »

Comment Bernini a été «fait»
Le processus d'entraînement de Bernini utilise également des GPU NVIDIA, mais Raji Arasu estime que, mis à part les GPU, le traitement et l'utilisation des données sont primordiaux pour l'entraînement d'un modèle. Lors de sa présentation, elle a détaillé ce processus, le divisant en plusieurs étapes : la gestion des données, leur préparation, l'entraînement du modèle (pour optimiser les coûts et l'efficacité) et la gestion de la complexité pour l'inférence.
« Des milliards d'objets et des pétaoctets de données de tailles, de formes et de charges de travail différentes doivent être traités », a déclaré Raji Arasu.
Autodesk avait besoin de construire une plateforme de données dans le cloud basée sur son volume massif de fichiers de conception volumineux, pour laquelle elle a choisi Amazon DynamoDB comme base de données principale et a créé un modèle de données canonique qui permet des écritures sur des centaines de partitions avec un débit élevé et une latence quasi nulle.
En plus de résoudre le problème de performance des données, Autodesk a facilement mené à bien le processus de préparation des données pour l'entraînement de base du modèle en combinant des services cloud tels qu'Amazon EMR, Amazon EKS, Amazon Glue et Amazon SageMaker, qui ont permis de mettre en évidence, d'étiqueter et de segmenter de grandes quantités de données historiques complexes.
Lors de la phase d'entraînement du modèle, Autodesk a également rencontré de nombreux problèmes, notamment en matière de sélection du GPU, et a finalement utilisé Amazon SageMaker pour unifier la solution pour les tests d'instances, la gestion de l'infrastructure, etc. L'équipe s'est davantage concentrée sur la préparation des données, le développement du modèle et le développement de fonctions d'IA orientées client.
La latence, le coût et les performances doivent être pris en compte lors de la gestion de l'inférence de modèles à grande échelle. « La mise à l'échelle automatique et les points de terminaison multi-modèles d'Amazon SageMaker prennent en charge de manière transparente l'inférence en temps réel et par lots pour un débit élevé, une latence minimale et une rentabilité maximale », a déclaré Raji Arasu.
Comme vous pouvez le constater, la version de Bernini développée par Autodesk exploite largement Amazon SageMaker, le service d'IA et d'apprentissage automatique le plus connu d'Amazon Cloud Technologies. De nombreuses organisations de renom, dont Autodesk, utilisent Amazon SageMaker HyperPod pour l'entraînement de leurs modèles. Amazon SageMaker HyperPod a récemment déployé plusieurs mises à jour majeures, telles que les plans d'entraînement flexibles. Ces plans permettent de créer davantage de tâches d'entraînement automatisées et d'optimiser les coûts en utilisant efficacement un large éventail de ressources de calcul plus économiques. La gouvernance des tâches, quant à elle, priorise les différentes tâches d'entraînement afin de maximiser l'entraînement, le réglage fin et le raisonnement des modèles lors de l'utilisation des ressources.
Grâce à ces innovations, Autodesk a finalement réduit de moitié le temps de déploiement de ses modèles de base. Cela a permis d'accroître la productivité de l'IA de 30 % tout en maintenant des coûts opérationnels stables. Raji Arasu a également révélé qu'Autodesk a commencé à déployer auprès de ses clients des fonctionnalités d'IA basées sur ces modèles.
« Nous agissons comme un partenaire de conception auprès de nos clients et les aidons à trouver le juste équilibre entre des paramètres tels que la résistance des matériaux et le coût, afin qu'ils puissent déterminer la meilleure conception. Tout cela vise à minimiser les tâches fastidieuses et à maximiser la créativité », a déclaré Raji Arasu.

Des données correctes, condition préalable à l'entraînement de grands modèles
Après ChatGPT, les GPU NVIDIA sont devenus une cible de choix pour les grandes entreprises d'IA, et le nombre de GPU NVIDIA commandés par une grande entreprise en une année peut même faire la une des médias. Cependant, pour résumer le processus de création de Bernini, le GPU est certes important, mais ce sont les données qui déterminent la qualité de l'entraînement des grands modèles.
Et la mise au point d'un modèle complexe capable de fonctionner réellement en entreprise est un problème de système complet qui implique de nombreux aspects.
« Les grands modèles ne représentent qu'une partie de l'innovation dans les applications d'IA générative. D'autres capacités doivent être développées pour une innovation réussie. Il est primordial de s'assurer que l'IA générative puisse enrichir les capacités des grands modèles de ses applications grâce aux données propres à l'organisation. » Ruisong Chu, vice-président monde d'Amazon et président d'Amazon Cloud Technology pour la Grande Chine, a exprimé un point de vue similaire lors d'une allocution.
Dans le cas du problème d'illusion, qui représente aujourd'hui une préoccupation majeure pour les modèles de grande taille, il est possible de le résoudre grâce aux métadonnées. Il s'agit de garantir la qualité des données de la base de connaissances avant l'entraînement de ces modèles. « Des métadonnées dans la base de données, c'est-à-dire des données de haute qualité qui ont été vérifiées et approuvées, contribuent à réduire la latence et à améliorer la réactivité du modèle. » Mai-Lan Tomsen Bukovec, vice-président de la technologie chez Amazon Cloud Technologies, a mis en garde les organisations qui entraînent des modèles de grande taille : il est essentiel de bien distinguer les données créées par l'humain de celles générées par l'IA.
C’est en raison de l’importance croissante des données que les modèles à grande échelle accélèrent la manière dont les entreprises valorisent leurs actifs de données. Il y a deux mois, Qunar Technology, maison mère de Cool Spaces, plateforme chinoise de conception spatiale 3D, a également dévoilé un nouveau plan d’affaires, lançant une plateforme de formation aux données pour l’intelligence incarnée et d’autres domaines, afin d’ouvrir l’accès au plus grand ensemble de données d’apprentissage profond au monde pour la perception des scènes intérieures. L’entreprise a révélé que la plateforme compte déjà plus de 320 millions de modèles 3D, avec une moyenne de 77,8 millions de visiteurs actifs mensuels. Qunar Technology proposera des données spatiales 3D physiquement réalistes, des solutions de cognition spatiale et des services de formation à l’intelligence spatiale pour les entreprises spécialisées dans l’IAGC, l’intelligence incarnée, la RA/RV et d’autres secteurs.
Les données montrent qu'environ 77 % des entreprises augmenteront ou augmenteront considérablement leurs investissements dans l'IA et les technologies émergentes d'ici 3 ans, et que les 3 domaines où l'IA sera la première à générer des gains d'efficacité sont l'automatisation, l'analyse et l'augmentation (automatisation, analyse des données et augmentation assistée).
« L’IA remodèle tous les secteurs » n’est plus un simple slogan. « De plus en plus de secteurs s’investissent dans l’IA générative. » Uwem Ukpon, vice-président des services mondiaux chez Amazon Cloud Technologies, a déclaré que le champ d’application de l’IA générative s’est progressivement étendu du secteur financier à ses débuts à un large éventail d’industries, notamment le secteur public, les industries traditionnelles, les organismes gouvernementaux, ainsi que des secteurs tels que les sciences de la vie et la santé. Parallèlement, l’IA générative offre également de nouvelles opportunités commerciales aux entreprises. Autodesk mise sur la CAO générative basée sur les données à grande échelle, un marché d’avenir prometteur.