भारत की आर्टिफिशियल इंटेलिजेंस स्टार्टअप Sarvam AI ने आज अपना सबसे ताक़तवर ओपन-सोर्स लैंग्वेज मॉडल ‘Sarvam-M’ लॉन्च कर दिया है। इस मॉडल में 24 बिलियन पैरामीटर्स हैं और यह खासतौर पर मैथ्स, कोडिंग और भारतीय भाषाओं में बेहतरीन प्रदर्शन करने में सक्षम है।
क्या है Sarvam-M और क्यों है खास?
Sarvam-M को Mistral Small मॉडल के आधार पर तैयार किया गया है और यह एक हाइब्रिड LLM है — यानी इसमें कई तकनीकों का मेल है जो इसे और भी स्मार्ट बनाते हैं। कंपनी के अनुसार, Sarvam-M को इस तरह डिज़ाइन किया गया है कि यह बहुत-से कामों को आसानी से कर सके जैसे:
-
मैथमैटिकल रिज़निंग
-
प्रोग्रामिंग टास्क
-
भारतीय भाषाओं में बातचीत और अनुवाद
-
शिक्षा और कन्वर्सेशनल एआई
तीन स्टेप्स से तैयार हुआ यह मॉडल
Sarvam-M को तीन खास स्टेप्स से ट्रेंड किया गया है, जिससे इसकी परफॉर्मेंस और बेहतर हो गई:
-
Supervised Fine-Tuning (SFT):
-
यहां पर टीम ने मुश्किल और क्वालिटी वाले प्रॉम्प्ट्स तैयार किए।
-
आउटपुट्स को बायस और कल्चरल कंटेंट से फ्री किया गया।
-
मॉडल को ‘think’ (रीज़निंग) और ‘non-think’ (साधारण बातचीत) मोड में काम करने के लिए ट्रेंड किया गया।
-
-
Reinforcement Learning with Verifiable Rewards (RLVR):
-
इसमें प्रोग्रामिंग, इंस्ट्रक्शन फॉलोिंग और मैथ से जुड़े डेटा से मॉडल को और मज़बूत किया गया।
-
खास रिवॉर्ड इंजीनियरिंग और प्रॉम्प्ट सेलेक्शन स्ट्रेटेजी का इस्तेमाल किया गया।
-
India AI Film: भारत की पहली AI फिल्म ‘Maharaja in Denims’ ने Cannes में बटोरी वाहवाही
3. Inference Optimisation:
-
-
ट्रेनिंग के बाद Sarvam-M को FP8 क्वांटाइजेशन पर ऑप्टिमाइज़ किया गया ताकि स्पीड बढ़े और एक्यूरेसी में फर्क न आए।
-
‘Lookahead decoding’ जैसे तकनीकों से इसकी आउटपुट स्पीड और बेहतर हो गई।
-
परफॉर्मेंस में दिखाया दम
-
भारतीय भाषाओं और गणित के कॉम्बिनेशन वाले टास्क जैसे GSM-8K बेंचमार्क में Sarvam-M ने +86% सुधार दिखाया।
-
यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और परफॉर्मेंस के मामले में Llama 3.3 70B और Gemma 3 27B जैसे बड़े मॉडल्स के बराबर है।
-
हालांकि, इंग्लिश ज्ञान वाले टेस्ट (जैसे MMLU) में यह मॉडल करीब 1% पीछे रह गया।
निष्कर्ष: भारत का पहला मेगा LLM जो बना रहा है नई पहचान
Sarvam-M का लॉन्च भारतीय एआई इकोसिस्टम के लिए एक बड़ी उपलब्धि है। यह दिखाता है कि अब भारत भी दुनिया के बड़े एआई मॉडल्स के मुकाबले खड़ा हो सकता है। मैथ, कोड और भारतीय भाषाओं में इसकी ताक़त इसे विशेष बनाती है।
FAQs – Sarvam AI और Sarvam-M के बारे में
Sarvam-M क्या है?
Sarvam-M भारत का एक नया ओपन-सोर्स लैंग्वेज मॉडल (LLM) है, जिसमें 24 बिलियन पैरामीटर्स हैं। इसे Sarvam AI द्वारा लॉन्च किया गया है और यह खासतौर पर मैथ्स, प्रोग्रामिंग और भारतीय भाषाओं में काम करने के लिए डिज़ाइन किया गया है।
Sarvam-M किन कामों में उपयोगी है?
Sarvam-M का उपयोग मैथमैटिकल रिज़निंग, कोडिंग, मशीन ट्रांसलेशन, एजुकेशनल टूल्स और भारतीय भाषाओं में कन्वर्सेशनल AI के लिए किया जा सकता है।
क्या Sarvam-M ओपन-सोर्स है?
हाँ, Sarvam-M एक ओपन-सोर्स LLM है, यानी कोई भी डेवलपर इसे अपने प्रोजेक्ट्स में इस्तेमाल कर सकता है।
Sarvam-M किन तकनीकों से तैयार किया गया है?
इस मॉडल को तीन मुख्य स्टेप्स से ट्रेन किया गया है:
-
Supervised Fine-Tuning (SFT)
-
Reinforcement Learning with Verifiable Rewards (RLVR)
-
Inference Optimization
Sarvam-M की परफॉर्मेंस कितनी बेहतर है?
Sarvam-M ने भारतीय भाषाओं और गणित के टास्क में +86% तक सुधार दिखाया है। यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और कई मामलों में Llama 3.3 70B जैसे बड़े मॉडल्स के बराबर है।
क्या Sarvam-M इंग्लिश में भी अच्छा काम करता है?
हालाँकि Sarvam-M ने इंग्लिश नॉलेज बेंचमार्क (जैसे MMLU) में करीब 1% कम स्कोर किया है, फिर भी इसकी परफॉर्मेंस बाकी कई टास्क में शानदार है।
Sarvam AI क्या भारत का पहला ऐसा मॉडल बना रहा है?
हाँ, Sarvam AI का उद्देश्य है भारत का पहला sovereign LLM बनाना जो न सिर्फ रीज़निंग, बल्कि वॉइस कैपेबिलिटी में भी आगे हो।