जेनरेटिव सीएडी का आगमन हो रहा है, 60 अरब डॉलर की ऑटोडस्क कंपनी बड़े सीएडी मॉडल को आंतरिक रूप से एकीकृत कर रही है।
पाजी दिग्गज कंपनी ऑटोडस्क भी जनरेटिव एआई को अपनाने जा रही है।
प्रेस समय पर, ऑटोडस्क (यूएस:ADSK) के शेयर 2024 वर्ष के मुकाबले 20% से अधिक बढ़कर 293.32 डॉलर प्रति शेयर पर पहुंच गए हैं, जिसका कुल बाजार पूंजीकरण 63.064 बिलियन डॉलर है।
'हम एक ऐसा जनरेटिव एआई बेस मॉडल विकसित कर रहे हैं जो बाज़ार में मौजूद किसी भी मॉडल से बिल्कुल अलग है।' ऑटोडेस्क के कार्यकारी उपाध्यक्ष और मुख्य प्रौद्योगिकी अधिकारी, राजी अरसु ने हाल ही में एक सार्वजनिक कार्यक्रम में यह बात कही। राजी अरसु जिस बेस मॉडल का जिक्र कर रहे हैं, जिसका अनावरण मई 2024 में किया गया था, उसे 'बर्निनी' कहा जाता है, जो एक जनरेटिव एआई प्रोजेक्ट है। बदलनाहस्तलिखित सामग्री, हाथ से बनाए गए रेखाचित्र आदि को 3डी फाइलों में परिवर्तित करना।
वर्तमान में बड़े मॉडल बाजार की बात करें तो ग्राफ-जनरेटेड 3D कार्यक्षमता का कार्यान्वयन कोई नई बात नहीं लगती। Google DeepMind का हाल ही में जारी Genie 2, घरेलू Tencent Hybrid और BioDigital Technology का VoxCraft, कुछ उदाहरण हैं, जो समान कार्यक्षमता को लागू कर सकते हैं। लेकिन वैश्विक CAD दिग्गज होने के नाते, Bernini का Autodesk के वास्तविक व्यवसाय के लिए बहुत अधिक व्यावहारिक महत्व है।
बर्निनी के रहस्यों का अनावरण
इस मॉडल का नाम 17वीं सदी के प्रसिद्ध इतालवी मूर्तिकार और वास्तुकार जियान लोरेंजो बर्निनी के नाम पर रखा गया है। प्रशिक्षण डेटा के चयन के संदर्भ में, इस मॉडल को ऑटोडेस्क एआई लैब्स द्वारा हांगकांग के चीनी विश्वविद्यालय के सहयोग से सार्वजनिक रूप से उपलब्ध 10 मिलियन 3डी आकृतियों पर प्रशिक्षित किया गया था।
बर्निनी अन्य बुनियादी बड़े मॉडलों से इसलिए अलग है क्योंकि बर्निनी में 3डी छवियां उत्पन्न करने की तीन मुख्य विशेषताएं हैं:
1. उत्पन्न 3डी छवि की संरचना एक कार्यात्मक 3डी संरचना है। उदाहरण के लिए, यह खोखली पानी की बोतलें उत्पन्न करती है जो वास्तव में पानी रखने का कार्य करती हैं, न कि केवल दिखने में समान मॉडल उत्पन्न करती हैं;
2. आकृतियों और बनावटों को अलग करें। आकृतियों और बनावटों को अलग-अलग उत्पन्न करने की क्षमता उपयोगकर्ता को चरों को समायोजित करने, उन्हें आपस में मिलाने या अन्य डिज़ाइन बनाने की स्वतंत्रता देती है, जिससे 3डी वस्तुओं की बनावट और रूपरेखाओं के भ्रमित होने की समस्या से बचा जा सकता है;
3. यह कई प्रकार के विकल्प प्रदान करता है। पेशेवर ज्यामिति वर्कफ़्लो के लिए अनुकूलित, एक ही इनपुट से कई कार्यात्मक 3डी आकार वेरिएंट उत्पन्न करने की क्षमता डिजाइनरों को विकल्प देती है और उनके रचनात्मक वर्कफ़्लो को गति प्रदान करती है।

ऑटोडस्क यूजर इंटरफेस का स्क्रीनशॉट
इसमें, आधारभूत मॉडल को इन विशेषताओं को प्राप्त करने के लिए डिज़ाइन और निर्माण प्रक्रिया में आने वाली एक स्वाभाविक बाधा को दूर करना होगा, अर्थात्, एआई को डिज़ाइन कार्य के इनपुट और आउटपुट के जटिल तर्क के साथ पूरी तरह से तालमेल बिठाना होगा। 'पाठ, रेखाचित्र, वोक्सेल, पॉइंट क्लाउड जैसे बहुआयामी इनपुट स्वीकार करते हुए, ये निर्माता की डिज़ाइन प्रक्रिया को दोहराते हैं।' राजी अरसु बताते हैं।
इसके अलावा, चूंकि 3डी सीएडी जैसी ज्यामितियों को उत्पन्न करने के लिए स्थान और संरचना के संदर्भ में भौतिकी के नियमों पर आधारित तर्क की आवश्यकता होती है, इसलिए इसमें उच्च स्तर की परिशुद्धता और सटीकता की भी आवश्यकता होती है।
समय के लिहाज़ से देखें तो बर्निनी का लॉन्च जल्दबाज़ी में नहीं हुआ। मई 2024 में जब बर्निनी की प्रगति का खुलासा हुआ, तब से लगभग पूरा साल बीत चुका है। उस समय बर्निनी ने सिर्फ़ कॉन्सेप्ट वीडियो का एक हिस्सा जारी किया था। और अक्टूबर में सैन डिएगो में ऑटोडस्क के यूज़र कॉन्फ्रेंस में ही सीईओ एंड्रयू एनाग्नोस्ट ने बर्निनी का प्रीव्यू जारी किया।
हालांकि, एंड्रयू एनाग्नोस्ट ने कहा कि बर्निनी को सार्वजनिक डेटा से प्रशिक्षित किया गया है और यह अभी व्यावसायिक उपयोग के लिए उपलब्ध नहीं है, और इसे एआई समुदाय के लिए खोल दिया गया है। लेकिन उन्होंने बर्निनी के लिए एक संभावित व्यावसायिक योजना का खुलासा किया: 'बर्निनी को प्रशिक्षित करने की विधि डेटा-स्वतंत्र है, इसलिए ग्राहक आवश्यकता पड़ने पर बर्निनी को अनुकूलित करने और मॉडल में लगातार सुधार करने के लिए अपने स्वयं के डेटा का उपयोग कर सकते हैं।'
बर्निनी को कैसे 'बनाया गया'
बर्निनी की प्रशिक्षण प्रक्रिया में भी एनवीडिया जीपीयू का उपयोग होता है, लेकिन जीपीयू के अलावा, राजी अरसु का मानना है कि मॉडल को प्रशिक्षित करने में 'डेटा' का प्रसंस्करण और उपयोग अधिक महत्वपूर्ण है। अपने व्याख्यान में, राजी अरसु ने इस प्रक्रिया के बारे में विस्तार से बताया। उन्होंने निर्माण प्रक्रिया को डेटा हैंडलिंग, डेटा प्रिपरेशन, लागत और दक्षता के लिए मॉडल प्रशिक्षण और मॉडल इन्फरेंस के लिए जटिलता प्रबंधन में विभाजित किया।
'विभिन्न आकार, आकृति और कार्यभार वाली अरबों वस्तुओं और पेटबाइट डेटा को संसाधित करने की आवश्यकता है।' राजी अरसु ने कहा।
ऑटोडस्क को अपने विशाल डिजाइन फाइलों के संग्रह के आधार पर क्लाउड में एक डेटा प्लेटफॉर्म बनाने की आवश्यकता थी, जिसके लिए उसने अमेज़ॅन डायनेमोडीबी को प्राथमिक डेटाबेस के रूप में चुना और एक मानक डेटा मॉडल बनाया जो उच्च थ्रूपुट और लगभग शून्य विलंबता के साथ सैकड़ों विभाजनों में लेखन को सक्षम बनाता है।
डेटा प्रदर्शन की समस्या को हल करने के अलावा, ऑटोडस्क ने अमेज़ॅन ईएमआर, अमेज़ॅन ईकेएस, अमेज़ॅन ग्लू और अमेज़ॅन सेजमेकर जैसी क्लाउड सेवाओं को मिलाकर बुनियादी मॉडल प्रशिक्षण के लिए डेटा तैयारी प्रक्रिया को आसानी से पूरा किया, जिसमें बड़ी मात्रा में जटिल ऐतिहासिक डेटा को वर्गीकृत, टैग और खंडित किया गया था।
मॉडल प्रशिक्षण चरण में, ऑटोडस्क को जीपीयू चयन जैसी कई समस्याओं का सामना करना पड़ा, और अंततः उसने उदाहरण परीक्षण, अवसंरचना प्रबंधन आदि के लिए समाधान को एकीकृत करने के लिए अमेज़ॅन सेजमेकर का उपयोग किया। टीम ने डेटा तैयारी, मॉडल विकास और ग्राहक-उन्मुख एआई फ़ंक्शन विकास पर अधिक ध्यान केंद्रित किया।
बड़े पैमाने पर मॉडल इन्फरेंस का प्रबंधन करते समय लेटेंसी, लागत और प्रदर्शन जैसे पहलुओं पर उचित ध्यान देना आवश्यक है। राजी अरसु ने कहा, 'अमेज़न सेजमेकर के ऑटो-स्केलिंग और मल्टी-मॉडल एंडपॉइंट्स उच्च थ्रूपुट, न्यूनतम लेटेंसी और अधिकतम लागत दक्षता के लिए रीयल-टाइम और बैच इन्फरेंस को सहजता से सपोर्ट करते हैं।'
जैसा कि आप देख सकते हैं, ऑटोडस्क के बर्निनी संस्करण में अमेज़न सेजमेकर का भरपूर उपयोग किया गया है, जो अमेज़न क्लाउड टेक्नोलॉजीज़ की सबसे प्रसिद्ध एआई और मशीन लर्निंग सेवा है। ऑटोडस्क सहित कई प्रतिष्ठित संगठन मॉडल प्रशिक्षण के लिए अमेज़न सेजमेकर हाइपरपॉड का उपयोग कर रहे हैं। अमेज़न सेजमेकर हाइपरपॉड ने हाल ही में कई महत्वपूर्ण अपडेट जारी किए हैं, जैसे कि फ्लेक्सिबल ट्रेनिंग प्लान, जो अधिक स्वचालित प्रशिक्षण कार्य बनाने में मदद करते हैं और लागत-प्रभावी कंप्यूटिंग संसाधनों का कुशलतापूर्वक उपयोग करके लागत को अनुकूलित करते हैं। साथ ही, टास्क गवर्नेंस, जो संसाधन उपयोग की प्रक्रिया के दौरान मॉडल प्रशिक्षण, फाइन-ट्यूनिंग और रीजनिंग को अधिकतम करने के लिए विभिन्न प्रशिक्षण कार्यों को प्राथमिकता देता है।
इन नवाचारों के आधार पर, ऑटोडस्क ने अंततः बेस मॉडल परिनियोजन समय को आधा कर दिया। इससे परिचालन लागत को स्थिर रखते हुए एआई उत्पादकता में 30 प्रतिशत की वृद्धि हुई। राजी अरसु ने यह भी खुलासा किया कि ऑटोडस्क ने इन बेस मॉडलों पर निर्मित एआई क्षमताओं को ग्राहकों तक पहुंचाना शुरू कर दिया है।
'हम अपने ग्राहकों के लिए एक डिज़ाइन पार्टनर के रूप में काम करते हैं और उन्हें सामग्री की मजबूती, लागत जैसे मापदंडों को संतुलित करने में मदद करते हैं ताकि वे सर्वोत्तम डिज़ाइन का निर्धारण कर सकें। यह सब थकाऊ कार्यों को कम करने और रचनात्मकता को अधिकतम करने के लिए किया जाता है।' राजी अरसु ने कहा।
सही डेटा, बड़े मॉडल को प्रशिक्षित करने का आधार
ChatGPT के बाद, NVIDIA GPU प्रमुख AI कंपनियों के लिए एक लोकप्रिय लक्ष्य बन गए हैं, और एक बड़ी कंपनी एक वर्ष में कितने NVIDIA GPU ऑर्डर करती है, यह खबर मीडिया में सुर्खियों में भी छा जाती है। हालांकि, बर्निनी के विचार को संक्षेप में कहें तो, GPU निश्चित रूप से महत्वपूर्ण है, लेकिन बड़े मॉडल के प्रशिक्षण की गुणवत्ता डेटा पर ही निर्भर करती है।
और एक बड़े मॉडल को प्रशिक्षित करना जो वास्तव में व्यवसाय में काम कर सके, एक पूर्ण-स्टैक सिस्टम समस्या है जिसमें कई पहलू शामिल हैं।
'बड़े मॉडल जनरेटिव एआई एप्लीकेशन इनोवेशन का सिर्फ एक हिस्सा हैं। जनरेटिव एआई एप्लीकेशन इनोवेशन को बेहतर ढंग से करने के लिए अन्य क्षमताओं को भी बढ़ाना आवश्यक है। सबसे पहले और सबसे महत्वपूर्ण बात यह सुनिश्चित करना है कि जनरेटिव एआई, किसी संगठन के अपने डेटा के साथ जनरेटिव एआई एप्लीकेशन की बड़े मॉडल क्षमताओं को बढ़ा सके।' अमेज़न के वैश्विक उपाध्यक्ष और अमेज़न क्लाउड टेक्नोलॉजी ग्रेटर चाइना के अध्यक्ष रुइसोंग चू ने अपने भाषण में इसी तरह के विचार व्यक्त किए।
भ्रम की समस्या, जो अब बड़े मॉडलों के लिए एक बड़ी चिंता का विषय है, को 'मेटाडेटा' के दृष्टिकोण से भी हल किया जा सकता है, जिसका अर्थ है बड़े मॉडलों को प्रशिक्षित करने से पहले ज्ञान आधार में डेटा की गुणवत्ता सुनिश्चित करना। 'डेटाबेस में मेटाडेटा, यानी उच्च-गुणवत्ता वाला डेटा जिसकी समीक्षा और अनुमोदन हो चुका है, विलंबता को कम करने और बड़े मॉडल की प्रतिक्रिया को बेहतर बनाने में मदद करता है।' अमेज़न क्लाउड टेक्नोलॉजीज की प्रौद्योगिकी उपाध्यक्ष माई-लान टॉमसेन बुकोवेक ने बड़े मॉडलों को प्रशिक्षित करने वाले संगठनों को आगाह किया कि वे इस बात का ध्यान रखें कि मानव निर्मित डेटा और कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न डेटा में अंतर स्पष्ट रूप से किया जाए।
डेटा के महत्व के कारण ही बड़ी कंपनियां अपने डेटा संसाधनों का उपयोग करने के तरीके को तेजी से बदल रही हैं। दो महीने पहले, चीन के 3डी स्थानिक डिजाइन प्लेटफॉर्म कूल स्पेसेस की मूल कंपनी, क्वनार टेक्नोलॉजी ने भी एक नई व्यावसायिक योजना का अनावरण किया, जिसके तहत उसने शारीरिक बुद्धिमत्ता और अन्य तकनीकों के लिए एक डेटा प्रशिक्षण प्लेटफॉर्म लॉन्च किया है, ताकि दुनिया के सबसे बड़े इनडोर दृश्य-जागरूकता डीप-लर्निंग डेटासेट को सार्वजनिक किया जा सके। कंपनी ने बताया कि प्लेटफॉर्म पर पहले से ही 32 करोड़ से अधिक 3डी मॉडल मौजूद हैं, जिन पर औसतन 77.8 करोड़ मासिक सक्रिय उपयोगकर्ता आते हैं। कंपनी एआईजीसी, शारीरिक बुद्धिमत्ता, एआर/वीआर और अन्य उद्यमों के लिए भौतिक रूप से सटीक 3डी स्थानिक डेटा संसाधन, स्थानिक अनुभूति समाधान और स्थानिक बुद्धिमत्ता प्रशिक्षण से संबंधित सेवाएं उपलब्ध कराएगी।
आंकड़ों से पता चलता है कि लगभग 77% कंपनियां 3 वर्षों के भीतर एआई और उभरती प्रौद्योगिकियों में अपना निवेश बढ़ाएंगी या काफी हद तक बढ़ाएंगी, और वे 3 क्षेत्र जहां एआई सबसे पहले दक्षता दिखाएगा, वे हैं स्वचालन, विश्लेषण और संवर्धन (स्वचालन, डेटा विश्लेषण और सहायक संवर्धन)।
'एआई सभी उद्योगों को नया आकार दे रहा है' अब सिर्फ एक नारा नहीं रह गया है। 'अधिक से अधिक उद्योग जनरेटिव एआई क्षेत्र में सक्रिय हो रहे हैं।' अमेज़न क्लाउड टेक्नोलॉजीज के वैश्विक सेवाओं के उपाध्यक्ष उवेम उकपन ने कहा कि जनरेटिव एआई का औद्योगिक अनुप्रयोग क्षेत्र शुरुआत में वित्तीय उद्योग से धीरे-धीरे बढ़कर सार्वजनिक क्षेत्र, पारंपरिक उद्योगों, सरकारी संगठनों के साथ-साथ जीवन विज्ञान और स्वास्थ्य सेवा जैसे उद्योगों की एक विस्तृत श्रृंखला तक फैल गया है। साथ ही, जनरेटिव एआई उद्यमों के लिए नए व्यावसायिक अवसर भी प्रदान करता है, ऑटोडेस्क बड़े पैमाने पर डेटा-आधारित जनरेटिव सीएडी पर दांव लगा रहा है, जो भविष्य का एक संभावित बाजार है।
