गूगल ने अपनी ओपन आर्टिफिशियल इंटेलिजेंस मॉडल सीरीज में एक नया और शक्तिशाली अध्याय जोड़ दिया है। कंपनी ने जेम्मा 4 लॉन्च किया है, जो अब तक का सबसे बुद्धिमान और एडवांस्ड ओपन मॉडल परिवार माना जा रहा है। बेहतर रीजनिंग क्षमता, मल्टीमॉडल फीचर्स और एजेंटिक वर्कफ्लो के पूर्ण समर्थन के साथ यह मॉडल डेवलपर्स के लिए गेम चेंजर साबित होगा। अपाचे 2.0 लाइसेंस के तहत रिलीज किए गए इन मॉडल्स को अब कोई भी फ्री में मॉडिफाई, बिल्ड और डिप्लॉय कर सकता है।
जेम्मा 4 की मुख्य विशेषताएं और उपलब्ध वेरिएंट्स
जेम्मा 4 चार अलग-अलग कॉन्फिगरेशन्स में उपलब्ध है – Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) और 31B Dense। कंपनी के अनुसार, 31B Dense मॉडल वर्तमान में ग्लोबल Arena AI लीडरबोर्ड पर ओपन मॉडल्स में तीसरे स्थान पर है, जबकि 26B MoE मॉडल भी टॉप टियर में शामिल है। छोटे E2B और E4B वेरिएंट्स मोबाइल और एज डिवाइसेज के लिए डिजाइन किए गए हैं, जहां मेमोरी और पावर की बचत जरूरी होती है।
पहली पीढ़ी के जेम्मा मॉडल्स के लॉन्च के बाद अब तक इन्हें 40 करोड़ से ज्यादा बार डाउनलोड किया जा चुका है। डेवलपर्स ने इनके आधार पर 1 लाख से अधिक वैरिएंट्स तैयार किए हैं, जिसे गूगल ‘Gemmaverse’ का नाम दे रहा है। जेम्मा 4 इस इकोसिस्टम को और मजबूत बनाएगा।
एडवांस्ड रीजनिंग और एजेंटिक वर्कफ्लो में नई ऊंचाई
जेम्मा 4 अब साधारण चैटबॉट से कहीं आगे है। यह कॉम्प्लेक्स रीजनिंग, मल्टी-स्टेप प्लानिंग और एजेंटिक वर्कफ्लो को आसानी से हैंडल कर सकता है। मॉडल में नेटिव फंक्शन कॉलिंग, स्ट्रक्चर्ड आउटपुट और सिस्टम-लेवल इंस्ट्रक्शन्स का सपोर्ट है, जो डेवलपर्स को स्वायत्त AI एजेंट्स बनाने में मदद करता है।
कोड जेनरेशन में भी काफी सुधार देखने को मिला है। डेवलपर्स अब अपनी लोकल मशीन पर ऑफलाइन AI कोडिंग असिस्टेंट चला सकते हैं, जिससे प्राइवेसी बनी रहती है और क्लाउड पर निर्भरता कम होती है। 31B Dense मॉडल रॉ परफॉर्मेंस के लिए बेहतर है, जबकि 26B MoE लो लेटेंसी प्रदान करता है क्योंकि यह इंफरेंस के दौरान केवल 3.8 बिलियन पैरामीटर्स को एक्टिवेट करता है।
मल्टीमॉडल क्षमताएं और लंबा कॉन्टेक्स्ट विंडो
जेम्मा 4 में मल्टीमॉडल फीचर्स शामिल हैं, जो इमेज, वीडियो और छोटे मॉडल्स में ऑडियो इनपुट को भी प्रोसेस कर सकते हैं। इससे स्पीच रिकग्निशन और समझने की क्षमता काफी बढ़ गई है। बड़े वेरिएंट्स में 256K टोकन्स तक का लंबा कॉन्टेक्स्ट विंडो उपलब्ध है, जिससे विस्तृत डॉक्यूमेंट्स, बड़े कोडबेस या लंबी बातचीत को एक ही प्रॉम्प्ट में हैंडल किया जा सकता है।
मॉडल को 140 से ज्यादा भाषाओं में ट्रेन किया गया है। इससे वैश्विक स्तर पर एप्लिकेशन डेवलपमेंट और भी आसान हो जाएगा, खासकर उन क्षेत्रों में जहां अंग्रेजी के अलावा स्थानीय भाषाओं की जरूरत होती है।
विभिन्न डिवाइसेज पर हाई एफिशिएंसी और ऑप्टिमाइजेशन
गूगल ने जेम्मा 4 को अलग-अलग हार्डवेयर प्लेटफॉर्म्स के लिए खास तौर पर ऑप्टिमाइज किया है। छोटे E2B और E4B वेरिएंट्स स्मार्टफोन, लैपटॉप और IoT डिवाइसेज पर आसानी से चल सकते हैं, जहां कम लेटेंसी और सीमित मेमोरी होती है। वहीं बड़े 26B और 31B मॉडल्स GPU, वर्कस्टेशन और क्लाउड इंफ्रास्ट्रक्चर पर एडवांस्ड वर्कलोड्स के लिए उपयुक्त हैं।
ये मॉडल्स एक सिंगल Nvidia H100 GPU पर भी अच्छा परफॉर्म कर सकते हैं, जिससे डिप्लॉयमेंट की लागत और जटिलता दोनों कम होती है।
ओपन सोर्स लाइसेंस और रिसर्च में बढ़ता सहयोग
जेम्मा 4 को अपाचे 2.0 लाइसेंस के तहत रिलीज किया गया है। यह पिछली जेम्मा पीढ़ियों से अलग है और डेवलपर्स को पूरी आजादी देता है कि वे मॉडल को मॉडिफाई करें, कमर्शियल प्रोजेक्ट्स में इस्तेमाल करें या आगे विकसित करें। मॉडल्स हगिंग फेस, कaggle, ओल्लामा और गूगल AI स्टूडियो के जरिए आसानी से उपलब्ध हैं।
कंपनी ने INSAIT और येल यूनिवर्सिटी जैसे संस्थानों के साथ शुरुआती सहयोगों का जिक्र किया है, जहां भाषा मॉडलिंग और बायोमेडिकल रिसर्च में जेम्मा 4 का इस्तेमाल हो रहा है। यह ओपन सोर्स एआई को रिसर्च और रियल-वर्ल्ड एप्लिकेशन्स दोनों में आगे बढ़ाएगा।