Sarvam AI Makes a Powerful Debut with 24-Billion Parameter Open-Source LLM

Sarvam AI का धमाकेदार डेब्यू: 24-बिलियन पैरामीटर वाला ओपन-सोर्स LLM ‘Sarvam-M’ हुआ लॉन्च

भारत की आर्टिफिशियल इंटेलिजेंस स्टार्टअप Sarvam AI ने आज अपना सबसे ताक़तवर ओपन-सोर्स लैंग्वेज मॉडल ‘Sarvam-M’ लॉन्च कर दिया है। इस मॉडल में 24 बिलियन पैरामीटर्स हैं और यह खासतौर पर मैथ्स, कोडिंग और भारतीय भाषाओं में बेहतरीन प्रदर्शन करने में सक्षम है।

क्या है Sarvam-M और क्यों है खास?

Sarvam-M को Mistral Small मॉडल के आधार पर तैयार किया गया है और यह एक हाइब्रिड LLM है — यानी इसमें कई तकनीकों का मेल है जो इसे और भी स्मार्ट बनाते हैं। कंपनी के अनुसार, Sarvam-M को इस तरह डिज़ाइन किया गया है कि यह बहुत-से कामों को आसानी से कर सके जैसे:

  • मैथमैटिकल रिज़निंग

  • प्रोग्रामिंग टास्क

  • भारतीय भाषाओं में बातचीत और अनुवाद

  • शिक्षा और कन्वर्सेशनल एआई

Microsoft और Qatar की फंडिंग वाली Builder.ai दीवालिया होने की कगार पर, पैसे जब्त होने के बाद बड़ा झटका

तीन स्टेप्स से तैयार हुआ यह मॉडल

Sarvam-M को तीन खास स्टेप्स से ट्रेंड किया गया है, जिससे इसकी परफॉर्मेंस और बेहतर हो गई:

  1. Supervised Fine-Tuning (SFT):

    • यहां पर टीम ने मुश्किल और क्वालिटी वाले प्रॉम्प्ट्स तैयार किए।

    • आउटपुट्स को बायस और कल्चरल कंटेंट से फ्री किया गया।

    • मॉडल को ‘think’ (रीज़निंग) और ‘non-think’ (साधारण बातचीत) मोड में काम करने के लिए ट्रेंड किया गया।

  2. Reinforcement Learning with Verifiable Rewards (RLVR):

    • इसमें प्रोग्रामिंग, इंस्ट्रक्शन फॉलोिंग और मैथ से जुड़े डेटा से मॉडल को और मज़बूत किया गया।

    • खास रिवॉर्ड इंजीनियरिंग और प्रॉम्प्ट सेलेक्शन स्ट्रेटेजी का इस्तेमाल किया गया।

India AI Film: भारत की पहली AI फिल्म ‘Maharaja in Denims’ ने Cannes में बटोरी वाहवाही

    3. Inference Optimisation:

    • ट्रेनिंग के बाद Sarvam-M को FP8 क्वांटाइजेशन पर ऑप्टिमाइज़ किया गया ताकि स्पीड बढ़े और एक्यूरेसी में फर्क न आए।

    • ‘Lookahead decoding’ जैसे तकनीकों से इसकी आउटपुट स्पीड और बेहतर हो गई।

परफॉर्मेंस में दिखाया दम

  • भारतीय भाषाओं और गणित के कॉम्बिनेशन वाले टास्क जैसे GSM-8K बेंचमार्क में Sarvam-M ने +86% सुधार दिखाया।

  • यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और परफॉर्मेंस के मामले में Llama 3.3 70B और Gemma 3 27B जैसे बड़े मॉडल्स के बराबर है।

  • हालांकि, इंग्लिश ज्ञान वाले टेस्ट (जैसे MMLU) में यह मॉडल करीब 1% पीछे रह गया।

निष्कर्ष: भारत का पहला मेगा LLM जो बना रहा है नई पहचान

Sarvam-M का लॉन्च भारतीय एआई इकोसिस्टम के लिए एक बड़ी उपलब्धि है। यह दिखाता है कि अब भारत भी दुनिया के बड़े एआई मॉडल्स के मुकाबले खड़ा हो सकता है। मैथ, कोड और भारतीय भाषाओं में इसकी ताक़त इसे विशेष बनाती है।

FAQs – Sarvam AI और Sarvam-M के बारे में

Sarvam-M क्या है?

Sarvam-M भारत का एक नया ओपन-सोर्स लैंग्वेज मॉडल (LLM) है, जिसमें 24 बिलियन पैरामीटर्स हैं। इसे Sarvam AI द्वारा लॉन्च किया गया है और यह खासतौर पर मैथ्स, प्रोग्रामिंग और भारतीय भाषाओं में काम करने के लिए डिज़ाइन किया गया है।

Sarvam-M किन कामों में उपयोगी है?

Sarvam-M का उपयोग मैथमैटिकल रिज़निंग, कोडिंग, मशीन ट्रांसलेशन, एजुकेशनल टूल्स और भारतीय भाषाओं में कन्वर्सेशनल AI के लिए किया जा सकता है।

क्या Sarvam-M ओपन-सोर्स है?

हाँ, Sarvam-M एक ओपन-सोर्स LLM है, यानी कोई भी डेवलपर इसे अपने प्रोजेक्ट्स में इस्तेमाल कर सकता है।

Sarvam-M किन तकनीकों से तैयार किया गया है?

इस मॉडल को तीन मुख्य स्टेप्स से ट्रेन किया गया है:

  1. Supervised Fine-Tuning (SFT)

  2. Reinforcement Learning with Verifiable Rewards (RLVR)

  3. Inference Optimization

Sarvam-M की परफॉर्मेंस कितनी बेहतर है?

Sarvam-M ने भारतीय भाषाओं और गणित के टास्क में +86% तक सुधार दिखाया है। यह मॉडल Llama-4 Scout को पीछे छोड़ चुका है और कई मामलों में Llama 3.3 70B जैसे बड़े मॉडल्स के बराबर है।

क्या Sarvam-M इंग्लिश में भी अच्छा काम करता है?

हालाँकि Sarvam-M ने इंग्लिश नॉलेज बेंचमार्क (जैसे MMLU) में करीब 1% कम स्कोर किया है, फिर भी इसकी परफॉर्मेंस बाकी कई टास्क में शानदार है।

Sarvam AI क्या भारत का पहला ऐसा मॉडल बना रहा है?

हाँ, Sarvam AI का उद्देश्य है भारत का पहला sovereign LLM बनाना जो न सिर्फ रीज़निंग, बल्कि वॉइस कैपेबिलिटी में भी आगे हो।

AI Mode Shopping: अब कपड़े खरीदना और पहन कर देखना हुआ आसान, जानिए Google की नई टेक्नोलॉजी कैसे करेगी आपकी मदद

Leave a Comment

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *

Scroll to Top