Sarvam AI का धमाकेदार डेब्यू: 24-बिलियन पैरामीटर वाला ओपन-सोर्स LLM 'Sarvam-M' हुआ लॉन्च

भारत की आर्टिफिशियल इंटेलिजेंस स्टार्टअप Sarvam AI ने आज अपना सबसे ताक़तवर ओपन-सोर्स लैंग्वेज मॉडल ‘Sarvam-M’ लॉन्च कर दिया है। इस मॉडल में 24 बिलियन पैरामीटर्स हैं और यह खासतौर पर मैथ्स, कोडिंग और भारतीय भाषाओं में बेहतरीन प्रदर्शन करने में सक्षम है।

Table of Contents

क्या है Sarvam-M और क्यों है खास?

Sarvam-M को Mistral Small मॉडल के आधार पर तैयार किया गया है और यह एक हाइब्रिड LLM है — यानी इसमें कई तकनीकों का मेल है जो इसे और भी स्मार्ट बनाते हैं। कंपनी के अनुसार, Sarvam-M को इस तरह डिज़ाइन किया गया है कि यह बहुत-से कामों को आसानी से कर सके जैसे:

मैथमैटिकल रिज़निंग
प्रोग्रामिंग टास्क
भारतीय भाषाओं में बातचीत और अनुवाद
शिक्षा और कन्वर्सेशनल एआई

Microsoft और Qatar की फंडिंग वाली Builder.ai दीवालिया होने की कगार पर, पैसे जब्त होने के बाद बड़ा झटका

तीन स्टेप्स से तैयार हुआ यह मॉडल

Sarvam-M को तीन खास स्टेप्स से ट्रेंड किया गया है, जिससे इसकी परफॉर्मेंस और बेहतर हो गई:

Supervised Fine-Tuning (SFT):
- यहां पर टीम ने मुश्किल और क्वालिटी वाले प्रॉम्प्ट्स तैयार किए।
- आउटपुट्स को बायस और कल्चरल कंटेंट से फ्री किया गया।
- मॉडल को ‘think’ (रीज़निंग) और ‘non-think’ (साधारण बातचीत) मोड में काम करने के लिए ट्रेंड किया गया।
Reinforcement Learning with Verifiable Rewards (RLVR):
- इसमें प्रोग्रामिंग, इंस्ट्रक्शन फॉलोिंग और मैथ से जुड़े डेटा से मॉडल को और मज़बूत किया गया।
- खास रिवॉर्ड इंजीनियरिंग और प्रॉम्प्ट सेलेक्शन स्ट्रेटेजी का इस्तेमाल किया गया।

India AI Film: भारत की पहली AI फिल्म ‘Maharaja in Denims’ ने Cannes में बटोरी वाहवाही

3. Inference Optimisation:

- ट्रेनिंग के बाद Sarvam-M को FP8 क्वांटाइजेशन पर ऑप्टिमाइज़ किया गया ताकि स्पीड बढ़े और एक्यूरेसी में फर्क न आए।
- ‘Lookahead decoding’ जैसे तकनीकों से इसकी आउटपुट स्पीड और बेहतर हो गई।

परफॉर्मेंस में दिखाया दम

भारतीय भाषाओं और गणित के कॉम्बिनेशन वाले टास्क जैसे GSM-8K बेंचमार्क में Sarvam-M ने +86% सुधार दिखाया।
यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और परफॉर्मेंस के मामले में Llama 3.3 70B और Gemma 3 27B जैसे बड़े मॉडल्स के बराबर है।
हालांकि, इंग्लिश ज्ञान वाले टेस्ट (जैसे MMLU) में यह मॉडल करीब 1% पीछे रह गया।

निष्कर्ष: भारत का पहला मेगा LLM जो बना रहा है नई पहचान

Sarvam-M का लॉन्च भारतीय एआई इकोसिस्टम के लिए एक बड़ी उपलब्धि है। यह दिखाता है कि अब भारत भी दुनिया के बड़े एआई मॉडल्स के मुकाबले खड़ा हो सकता है। मैथ, कोड और भारतीय भाषाओं में इसकी ताक़त इसे विशेष बनाती है।

FAQs – Sarvam AI और Sarvam-M के बारे में

Sarvam-M क्या है?

Sarvam-M भारत का एक नया ओपन-सोर्स लैंग्वेज मॉडल (LLM) है, जिसमें 24 बिलियन पैरामीटर्स हैं। इसे Sarvam AI द्वारा लॉन्च किया गया है और यह खासतौर पर मैथ्स, प्रोग्रामिंग और भारतीय भाषाओं में काम करने के लिए डिज़ाइन किया गया है।

Sarvam-M किन कामों में उपयोगी है?

Sarvam-M का उपयोग मैथमैटिकल रिज़निंग, कोडिंग, मशीन ट्रांसलेशन, एजुकेशनल टूल्स और भारतीय भाषाओं में कन्वर्सेशनल AI के लिए किया जा सकता है।

क्या Sarvam-M ओपन-सोर्स है?

हाँ, Sarvam-M एक ओपन-सोर्स LLM है, यानी कोई भी डेवलपर इसे अपने प्रोजेक्ट्स में इस्तेमाल कर सकता है।

Sarvam-M किन तकनीकों से तैयार किया गया है?

इस मॉडल को तीन मुख्य स्टेप्स से ट्रेन किया गया है:

Supervised Fine-Tuning (SFT)
Reinforcement Learning with Verifiable Rewards (RLVR)
Inference Optimization

Sarvam-M की परफॉर्मेंस कितनी बेहतर है?

Sarvam-M ने भारतीय भाषाओं और गणित के टास्क में +86% तक सुधार दिखाया है। यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और कई मामलों में Llama 3.3 70B जैसे बड़े मॉडल्स के बराबर है।

क्या Sarvam-M इंग्लिश में भी अच्छा काम करता है?

हालाँकि Sarvam-M ने इंग्लिश नॉलेज बेंचमार्क (जैसे MMLU) में करीब 1% कम स्कोर किया है, फिर भी इसकी परफॉर्मेंस बाकी कई टास्क में शानदार है।

Sarvam AI क्या भारत का पहला ऐसा मॉडल बना रहा है?

हाँ, Sarvam AI का उद्देश्य है भारत का पहला sovereign LLM बनाना जो न सिर्फ रीज़निंग, बल्कि वॉइस कैपेबिलिटी में भी आगे हो।

AI Mode Shopping: अब कपड़े खरीदना और पहन कर देखना हुआ आसान, जानिए Google की नई टेक्नोलॉजी कैसे करेगी आपकी मदद

Sarvam AI का धमाकेदार डेब्यू: 24-बिलियन पैरामीटर वाला ओपन-सोर्स LLM ‘Sarvam-M’ हुआ लॉन्च

क्या है Sarvam-M और क्यों है खास?

तीन स्टेप्स से तैयार हुआ यह मॉडल

परफॉर्मेंस में दिखाया दम

निष्कर्ष: भारत का पहला मेगा LLM जो बना रहा है नई पहचान

FAQs – Sarvam AI और Sarvam-M के बारे में

Sarvam-M क्या है?

Sarvam-M किन कामों में उपयोगी है?

क्या Sarvam-M ओपन-सोर्स है?

Sarvam-M किन तकनीकों से तैयार किया गया है?

Sarvam-M की परफॉर्मेंस कितनी बेहतर है?

क्या Sarvam-M इंग्लिश में भी अच्छा काम करता है?

Sarvam AI क्या भारत का पहला ऐसा मॉडल बना रहा है?

Leave a Comment Cancel Reply

Category

Company

क्या है Sarvam-M और क्यों है खास?

तीन स्टेप्स से तैयार हुआ यह मॉडल

परफॉर्मेंस में दिखाया दम

निष्कर्ष: भारत का पहला मेगा LLM जो बना रहा है नई पहचान

FAQs – Sarvam AI और Sarvam-M के बारे में

Sarvam-M क्या है?

Sarvam-M किन कामों में उपयोगी है?

क्या Sarvam-M ओपन-सोर्स है?

Sarvam-M किन तकनीकों से तैयार किया गया है?

Sarvam-M की परफॉर्मेंस कितनी बेहतर है?

क्या Sarvam-M इंग्लिश में भी अच्छा काम करता है?

Sarvam AI क्या भारत का पहला ऐसा मॉडल बना रहा है?

Must Read

Leave a Comment Cancel Reply