El CAD generativo está llegando, Autodesk, valorada en 60.000 millones de dólares, está internalizando grandes modelos CAD.
Canalla El gigante Autodesk también está incursionando en la inteligencia artificial generativa.
Al cierre de esta edición, las acciones de Autodesk (US:ADSK) han subido más del 20% en lo que va del año 2024, situándose en 293,32 dólares por acción, con una capitalización de mercado total de 63.064 millones de dólares.
'Estamos desarrollando un modelo base de IA generativa que no se parece a ningún otro modelo existente'. Raji Arasu, vicepresidente ejecutivo y director de tecnología de Autodesk, dijo recientemente durante una aparición en un evento público. El modelo base al que se refiere Raji Arasu, que se reveló en mayo de 2024, se llama 'Bernini', un proyecto de IA generativa que Convertirconvertir texto, bocetos a mano, etc., en archivos 3D.
En lo que respecta al mercado actual de modelos a gran escala, la implementación de funcionalidades 3D generadas por grafos no parece ser nada nuevo. Genie 2 de Google DeepMind, Tencent Hybrid (de fabricación nacional) y VoxCraft de BioDigital Technology, entre otros, ofrecen funcionalidades similares. Sin embargo, para Bernini, un gigante mundial del CAD, su importancia práctica es crucial para el negocio de Autodesk.
Descubriendo a Bernini
Bernini recibe su nombre en honor a Gian Lorenzo Bernini, el famoso escultor y arquitecto italiano del siglo XVII. En cuanto a la selección de datos de entrenamiento, el modelo fue entrenado con 10 millones de formas 3D disponibles públicamente por Autodesk AI Labs en colaboración con la Universidad China de Hong Kong.
La razón por la que Bernini es diferente de otros modelos básicos de gran tamaño es que Bernini tiene tres características principales en la generación de imágenes 3D:
1. La estructura de la imagen 3D generada es una estructura 3D funcional. Por ejemplo, genera botellas de agua que son huecas y que realmente cumplen la función de contener agua, en lugar de simplemente generar modelos que se parecen;
2. Separar formas y texturas. La capacidad de generar formas y texturas por separado le da al usuario la libertad de ajustar las variables, combinarlas o crear otros diseños, evitando el problema de confundir texturas y contornos de objetos 3D;
3. Ofrece una amplia gama de variantes. Optimizada para flujos de trabajo de geometría profesional, la capacidad de generar múltiples variantes de formas 3D funcionales a partir de una sola entrada brinda a los diseñadores opciones y acelera su flujo de trabajo creativo.

Captura de pantalla de la interfaz de usuario de Autodesk
Para lograr estas características, el modelo base debe superar una barrera natural en el proceso de diseño y fabricación: la IA debe estar completamente adaptada a la lógica compleja de entrada y salida del trabajo de diseño. «Al aceptar entradas multimodales como texto, bocetos, vóxeles y nubes de puntos, se reproduce el proceso de diseño del creador», explica Raji Arasu.
Además, dado que la generación de geometrías como las del CAD 3D requiere un razonamiento basado en las leyes de la física en términos de espacio y estructura, también exige un alto nivel de precisión y exactitud.
En cuanto al tiempo, el lanzamiento de Bernini no parece haber sido rápido. Desde mayo de 2024, cuando se reveló el progreso de Bernini, ha transcurrido casi todo el año. En aquel entonces, Bernini solo publicó una parte del video conceptual. Y no fue hasta octubre, durante la conferencia de usuarios de Autodesk en San Diego, que el CEO Andrew Anagnost presentó una vista previa de Bernini.
Sin embargo, Andrew Anagnost afirmó que Bernini se entrena con datos públicos y aún no está disponible para uso comercial, sino que se ha abierto a la comunidad de IA. No obstante, reveló un posible plan de negocios para Bernini: «El método de entrenamiento de Bernini es independiente de los datos, por lo que los clientes pueden usar sus propios datos, si es necesario, para optimizar Bernini y mejorar continuamente el modelo».
Cómo se "creó" Bernini
El proceso de entrenamiento de Bernini también utiliza GPU de NVIDIA, pero, más allá de las GPU, Raji Arasu considera que el procesamiento y el uso de los datos son fundamentales para entrenar un modelo. En su presentación, Raji Arasu profundizó en este proceso. Dividió el proceso de construcción en manejo de datos, preparación de datos, entrenamiento del modelo para optimizar costos y eficiencia, y gestión de la complejidad para la inferencia del modelo.
«Es necesario procesar miles de millones de objetos y petabytes de datos de diferentes tamaños, formas y cargas de trabajo», dijo Raji Arasu.
Autodesk necesitaba construir una plataforma de datos en la nube basada en su enorme volumen de archivos de diseño de gran tamaño, para lo cual eligió Amazon DynamoDB como base de datos principal y creó un modelo de datos canónico que permite escrituras en cientos de particiones con un alto rendimiento y una latencia casi nula.
Además de solucionar el problema del rendimiento de los datos, Autodesk completó fácilmente el proceso de preparación de datos para el entrenamiento básico del modelo combinando servicios en la nube como Amazon EMR, Amazon EKS, Amazon Glue y Amazon SageMaker, que presentaban, etiquetaban y segmentaban grandes cantidades de datos históricos complejos.
En la fase de entrenamiento del modelo, Autodesk también se enfrentó a muchos problemas, como la selección de la GPU, y finalmente utilizó Amazon SageMaker para unificar la solución para las pruebas de instancias, la gestión de la infraestructura, etc. El equipo se centró más en la preparación de datos, el desarrollo del modelo y el desarrollo de funciones de IA orientadas al cliente.
La latencia, el costo y el rendimiento deben abordarse adecuadamente al gestionar la inferencia de modelos a gran escala. «El escalado automático y los puntos de conexión multimodelo de Amazon SageMaker admiten sin problemas la inferencia en tiempo real y por lotes para lograr un alto rendimiento, una latencia mínima y la máxima eficiencia en costos», afirmó Raji Arasu.
Como puede verse, la versión de Bernini de Autodesk utiliza intensivamente Amazon SageMaker, el servicio de IA y aprendizaje automático más conocido de Amazon Cloud Technologies, del cual varias organizaciones de alto perfil, incluida Autodesk, utilizan Amazon SageMaker HyperPod para el entrenamiento de modelos. Amazon SageMaker HyperPod ha lanzado recientemente varias actualizaciones importantes, como los Planes de Entrenamiento Flexibles para crear trabajos de entrenamiento más automatizados que optimizan los costos mediante el uso eficiente de una amplia gama de recursos informáticos más rentables, y la Gobernanza de Tareas, que prioriza diferentes tareas de entrenamiento para maximizar el entrenamiento, el ajuste fino y el razonamiento del modelo durante el proceso de utilización de recursos.
Gracias a estas innovaciones, Autodesk logró reducir a la mitad el tiempo de implementación del modelo base. Esto aumentó la productividad de la IA en un 30 %, manteniendo estables los costos operativos. Raji Arasu también reveló que Autodesk ha comenzado a implementar capacidades de IA basadas en estos modelos base para sus clientes.
«Actuamos como socios de diseño para nuestros clientes, ayudándoles a equilibrar parámetros como la resistencia del material y el coste para que puedan determinar el mejor diseño. Todo esto se hace para minimizar las tareas tediosas y maximizar la creatividad», afirmó Raji Arasu.
Datos correctos, la premisa para entrenar modelos grandes.
Tras ChatGPT, las GPU de NVIDIA se han convertido en un objetivo codiciado por las principales empresas de IA, y la cantidad de GPU de NVIDIA que una gran empresa encarga anualmente puede incluso ser noticia de primera plana. Sin embargo, en resumen, si bien la GPU es fundamental para el desarrollo de Bernini, los datos son los que determinan la calidad del entrenamiento de modelos complejos.
Y entrenar un modelo complejo que realmente funcione en el ámbito empresarial es un problema de sistema integral que involucra muchos aspectos.
«Los modelos a gran escala son solo una parte de la innovación en aplicaciones de IA generativa. Existen otras capacidades que deben potenciarse para que la innovación en aplicaciones de IA generativa sea eficaz. Ante todo, es fundamental garantizar que la IA generativa pueda complementar las capacidades de los modelos a gran escala con los datos propios de la organización». Ruisong Chu, vicepresidente global de Amazon y presidente de Amazon Cloud Technology Greater China, expresó opiniones similares en un discurso.
En el caso del problema de la ilusión, que ahora preocupa mucho a los grandes modelos, también se puede solucionar desde la perspectiva de los "metadatos", que consisten en garantizar la calidad de los datos en la base de conocimiento antes de entrenar los grandes modelos. "Los metadatos en la base de datos, es decir, los datos de alta calidad que han sido revisados y aprobados, ayudan a reducir la latencia y a mejorar la respuesta del gran modelo", afirmó Mai-Lan Tomsen Bukovec, vicepresidenta de tecnología de Amazon Cloud Technologies. Bukovec advirtió a las organizaciones que entrenan grandes modelos que tengan cuidado de distinguir entre lo que crean las personas y los datos generados por la IA.
Debido a la importancia de los datos, los grandes modelos están acelerando la forma en que las empresas aprovechan sus activos de datos. Hace dos meses, Qunar Technology, la empresa matriz de Cool Spaces, una plataforma de diseño espacial 3D de China, también presentó un nuevo plan de negocios, lanzando una plataforma de entrenamiento de datos para inteligencia incorporada y otros, con el fin de ofrecer el mayor conjunto de datos de aprendizaje profundo de reconocimiento de escenas interiores del mundo. La empresa reveló que la plataforma ya cuenta con más de 320 millones de modelos 3D, con un promedio de 77,8 millones de visitantes activos mensuales. La empresa ofrecerá activos de datos espaciales 3D físicamente correctos, soluciones de cognición espacial y servicios relacionados con el entrenamiento de inteligencia espacial para AIGC, inteligencia incorporada, AR/VR y otras empresas.
Los datos muestran que alrededor del 77% de las empresas aumentarán o incrementarán significativamente su inversión en IA y tecnologías emergentes en los próximos 3 años, y que las 3 áreas donde la IA será la primera en experimentar mejoras de eficiencia son la automatización, el análisis y la mejora (automatización, análisis de datos y mejora asistida).
«La IA está transformando todos los sectores» ya no es un eslogan. «Cada vez más sectores se suman a la IA generativa». Uwem Ukpon, vicepresidente de servicios globales de Amazon Cloud Technologies, afirmó que el ámbito de aplicación de la IA generativa se ha expandido gradualmente desde el sector financiero, inicialmente, hasta abarcar una amplia gama de industrias, incluyendo el sector público, las industrias tradicionales, las organizaciones gubernamentales y sectores como las ciencias de la vida y la atención médica. Al mismo tiempo, la IA generativa también ofrece nuevas oportunidades de negocio para las empresas; Autodesk, por ejemplo, apuesta por el CAD generativo basado en datos a gran escala, un mercado con gran potencial de futuro.
