DeepSeek ने अपने इन नए मॉडलों को DeepSeek-GRM दिया नाम
DeepSeek AI (आज समाज) नई दिल्ली: चीन की अग्रणी स्टार्टअप DeepSeek और त्सिंगहुआ विश्वविद्यालय साथ मिलकर एक ऐसे एआई मॉडल्स को तैयार कर रहे हैं जिसे नाम मात्र की ट्रेनिंग की जरूरत होगी। इसका उद्देश्य ऑपरेशनल खर्चों में कटौती, जिससे एआई मॉडल्स को कम संसाधनों में भी उच्च गुणवत्ता वाला प्रदर्शन मिल सके।
जनवरी में अपने कम लागत वाले रीजनिंग मॉडल से चर्चा में आए DeepSeek ने बीजिंग स्थित इस प्रतिष्ठित शैक्षणिक संस्थान के शोधकर्ताओं के साथ मिलकर एक शोध-पत्र प्रकाशित किया है। इस शोध में रिइन्फोर्समेंट लर्निंग (Reinforcement Learning) के एक नया नजरिया प्रस्तुत किया है, जिसे टीम ने सेल्फ-प्रिंसिपल्ड क्रिटिक ट्यूनिंग नाम दिया है।
कंप्यूटिंग संसाधनों की खपत भी कम करती है यह तकनीक
यह तकनीक एआई मॉडल्स को मानवीय प्राथमिकताओं के अनुसार बेहतर कार्य करने हेतु प्रशिक्षित करती है। इसमें ऐसे उत्तरों को इनाम दिए जाते हैं जो सटीक हों। पारंपरिक रिइन्फोर्समेंट लर्निंग जहां कुछ विशिष्ट कार्यों में ही असरदार साबित हुई है, वहीं DeepSeek का यह इनोवेशन सामान्य और बहुआयामी उपयोगों में इसे अधिक प्रभावी बनाने का प्रयास है। शोध-पत्र के अनुसार, यह नई रणनीति मौजूदा तरीकों और मॉडलों की तुलना में बेहतर प्रदर्शन करती है और साथ ही कंप्यूटिंग संसाधनों की खपत भी कम करती है।
ओपन सोर्स के रूप में जारी किए जाएंगे मॉडल
DeepSeek ने अपने इन नए मॉडलों को DeepSeek-GRM नाम दिया है, जो Generalist Reward Modeling का संक्षिप्त रूप है। कंपनी का कहना है कि ये मॉडल ओपन सोर्स के रूप में जारी किए जाएंगे, जिससे अन्य डेवलपर्स भी इस तकनीक का लाभ ले सकें।