केंद्रीय विज्ञान एवं प्रौद्योगिकी मंत्री जितेंद्र सिंह ने मंगलवार को आईआईटी बॉम्बे के दौरे के दौरान भारतजेन को भारत का पहला संप्रभु, बहुभाषी और बहुविध एआई वृहद भाषा मॉडल (एलएलएम) बताया, जहां उन्होंने परियोजना की प्रगति की समीक्षा की और मुख्य विकास टीम के साथ बातचीत की।
भारतजेन क्या है?
भारतजेन भारत का पहला संप्रभु बहुभाषी और बहुविध एलएलएम है—एक एआई प्रणाली जिसे देश की भाषाई और सांस्कृतिक विविधता को प्रतिबिंबित करने के लिए डिज़ाइन किया गया है। यह 22 से अधिक भारतीय भाषाओं को सपोर्ट करता है और तीन मुख्य तौर-तरीकों को एकीकृत करता है – टेक्स्ट: भाषा को समझना और उत्पन्न करना; स्पीच: प्राकृतिक स्पीच को पहचानना और उत्पन्न करना; डॉक्यूमेंट विज़न: जटिल भारतीय दस्तावेज़ स्वरूपों की व्याख्या करना
“संप्रभु” डिज़ाइन डेटा, एआई मॉडल और संपूर्ण एआई स्टैक पर पूर्ण राष्ट्रीय स्वामित्व सुनिश्चित करता है। एक डिजिटल सार्वजनिक संपत्ति के रूप में, भारतजेन का उद्देश्य 1.4 अरब नागरिकों को उनकी दैनिक भाषाओं में सेवा प्रदान करना है।
भारतजेन के प्रमुख घटक क्या हैं?
भारतजेन के केंद्र में भारत डेटा सागर है, जो भारत की सबसे महत्वाकांक्षी डेटा पहलों में से एक है। इसका उद्देश्य विभिन्न क्षेत्रों के व्यक्तियों, संस्थानों और संगठनों की भागीदारी से बड़े पैमाने पर, भारत-केंद्रित डेटा संग्रह और संरक्षण के माध्यम से एक पूर्णतः स्वदेशी डेटा भंडार का निर्माण करना है।
इसका उद्देश्य भारत की वास्तविकताओं, क्षेत्रीय विविधता और सांस्कृतिक बारीकियों को समझना है, तथा सटीक एआई प्रदर्शन और दीर्घकालिक डेटा संप्रभुता सुनिश्चित करना है।
भारतजेन ने अब तक कौन से मॉडल विकसित किये हैं?
भारतजेन इकोसिस्टम के अंतर्गत चार मुख्य मॉडल जारी किए गए हैं:
पैराम-1 (पाठ मॉडल)
2.9 बिलियन पैरामीटर वाला आधारभूत भाषा मॉडल
7.5 ट्रिलियन टोकन पर प्रशिक्षित, अब तक उपयोग किए गए सबसे बड़े भारत-केंद्रित डेटासेट में से एक
एक तिहाई से अधिक डेटा भारतीय भाषाओं और संदर्भों से आता है
श्रुतम (स्वचालित वाक् पहचान मॉडल)
30 मिलियन पैरामीटर वाला ASR मॉडल
भारत की भाषाई विविधता, भाषण पैटर्न और लहजे के लिए डिज़ाइन किया गया
विभिन्न राज्यों और बोलियों में सटीक ढंग से काम करने के लिए निर्मित
सूक्तम (टेक्स्ट-टू-स्पीच मॉडल)
150 मिलियन पैरामीटर वाली TTS प्रणाली
नौ भारतीय भाषाओं में स्वाभाविक ध्वनि वाला भाषण उत्पन्न करता है
सुगम्यता उपकरणों, सार्वजनिक सेवाओं और डिजिटल अनुप्रयोगों के लिए उपयुक्त
पत्रम (दस्तावेज़-विज़न मॉडल)
भारत का पहला दस्तावेज़-दृष्टिकोण मॉडल
7 बिलियन पैरामीटर, 2.5 बिलियन टोकन पर प्रशिक्षित
भारतीय दस्तावेजों के लिए अनुकूलित: पहचान पत्र, प्रमाण पत्र, सरकारी फॉर्म, हस्तलिखित प्रविष्टियाँ और स्थानीय प्रशासनिक लेआउट
ये मॉडल मिलकर एक संपूर्ण संप्रभु बहुविध एआई स्टैक (टेक्स्ट + स्पीच + विज़न) बनाते हैं, जो एक ऐसी क्षमता है जो केवल कुछ ही देशों के पास है। यह शासन, शिक्षा, स्वास्थ्य सेवा, कृषि, स्टार्टअप और उद्योग में बड़े पैमाने पर अनुप्रयोगों को सक्षम बनाता है।
भारतजेन ने कौन से अवधारणा-प्रमाण अनुप्रयोग निर्मित किये हैं?
मंत्री के दौरे के दौरान, भारतजेन टीम ने वास्तविक दुनिया में प्रभाव के लिए डिज़ाइन किए गए कई प्रारंभिक अनुप्रयोगों का प्रदर्शन किया:
कृषि साथी
यह एक आवाज-सक्षम व्हाट्सएप सलाहकार उपकरण है जो किसानों को अपनी स्थानीय भाषा में प्रश्न पूछने और क्षेत्रीय कृषि आवश्यकताओं के अनुरूप त्वरित मार्गदर्शन प्राप्त करने की सुविधा देता है।
ई-विक्रएआई
एक एआई उपकरण जो एक ही छवि से उत्पाद विवरण तैयार करता है, जिससे छोटे विक्रेताओं और सूक्ष्म उद्यमियों को तेजी से डिजिटल स्टोरफ्रंट बनाने में मदद मिलती है – विशेष रूप से ग्रामीण और अर्ध-शहरी क्षेत्रों में यह उपयोगी है।
डॉकबोध
पत्रम पर आधारित एक दस्तावेज़ प्रश्नोत्तर प्लेटफ़ॉर्म। यह जटिल दस्तावेज़ों को पढ़ता, समझता और उनकी व्याख्या करता है, जिससे नागरिकों को सरकारी फ़ाइलों, कानूनी नोटिसों, फ़ॉर्म और प्रमाणपत्रों को समझने में मदद मिलती है।
यह टूल सार्वजनिक सेवाओं में पारदर्शिता और अंतिम छोर तक पहुँच को बेहतर बना सकता है।
ये प्रोटोटाइप दर्शाते हैं कि कैसे भारतजेन शासन को मजबूत कर सकता है, नागरिक सेवाओं में सुधार कर सकता है और डिजिटल समावेशन का समर्थन कर सकता है।
भारतजेन को वित्त पोषण कैसे मिलता है, तथा इसके प्रमुख सहयोगी कौन हैं?
भारतजेन को विज्ञान एवं प्रौद्योगिकी विभाग के राष्ट्रीय अंतःविषयी साइबर-भौतिक प्रणाली मिशन (एनएम-आईसीपीएस) के अंतर्गत सहायता प्राप्त है।
आईआईटी बॉम्बे में प्रौद्योगिकी नवाचार हब के माध्यम से 235 करोड़ रुपये आवंटित किए गए हैं।
इस संघ में आईआईटी बॉम्बे (प्रमुख), आईआईटी मद्रास, आईआईटी कानपुर, आईआईआईटी हैदराबाद, आईआईटी मंडी, आईआईटी हैदराबाद, आईआईएम इंदौर, आईआईटी खड़गपुर और आईआईआईटी दिल्ली शामिल हैं।
हाल ही में, इंडियाएआई मिशन के तहत MeitY द्वारा 1,058 करोड़ रुपये स्वीकृत किए गए, जिससे भारतजेन को एक संप्रभु एआई स्टैक बनाने के राष्ट्रव्यापी प्रयास में विस्तारित किया गया।
भारत ने एआई से संबंधित अन्य कौन सी प्रमुख पहल शुरू की हैं?
2024 में, सरकार ने भारत की एआई क्षमताओं को मजबूत करने के लिए पांच वर्षों में ₹10,300 करोड़ के समर्थन से इंडियाएआई मिशन को मंजूरी दी।
इस मिशन के कई घटक हैं जैसे इंडियाएआई कंप्यूट क्षमता, इंडियाएआई इनोवेशन सेंटर (आईएआईसी), इंडियाएआई डेटासेट प्लेटफॉर्म, इंडियाएआई एप्लिकेशन डेवलपमेंट इनिशिएटिव, इंडियाएआई फ्यूचरस्किल्स, इंडियाएआई स्टार्टअप फाइनेंसिंग, सुरक्षित और विश्वसनीय एआई फ्रेमवर्क
इंडियाएआई इनोवेशन सेंटर (आईएआईसी) एज कंप्यूटिंग और वितरित आर्किटेक्चर का उपयोग करके स्वदेशी बड़े मल्टीमॉडल मॉडल (एलएमएम) सहित आधारभूत एआई मॉडल के विकास को आगे बढ़ाएगा।
