ओपनएआई का नवीनतम और सबसे शक्तिशाली आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल GPT-4o, जिसे मई में जारी किया गया था, को एक नया अपग्रेड मिल रहा है। मंगलवार को, कंपनी ने एआई मॉडल के लिए एक नया फाइन-ट्यूनिंग फीचर जारी किया जो डेवलपर्स और संगठनों को कस्टम डेटासेट का उपयोग करके इसे प्रशिक्षित करने की अनुमति देगा। यह उपयोगकर्ताओं को उनके उपयोग से संबंधित अधिक प्रासंगिक और केंद्रित डेटा जोड़ने और उत्पन्न प्रतिक्रियाओं को अधिक सटीक बनाने की अनुमति देगा। अगले महीने के लिए, एआई फर्म ने यह भी घोषणा की है कि वह GPT-4o मॉडल को बढ़ाने के लिए संगठनों को मुफ्त प्रशिक्षण टोकन प्रदान करेगी।
GPT-4o को फाइन-ट्यूनिंग सुविधा मिली
एक पोस्ट में, OpenAI ने नई सुविधा के लॉन्च की घोषणा की और इस बात पर प्रकाश डाला कि यह डेवलपर्स और संगठनों को विशिष्ट उपयोग के मामलों के लिए कम लागत पर उच्च प्रदर्शन प्राप्त करने की अनुमति देगा। इसे “डेवलपर्स से सबसे अधिक अनुरोधित सुविधाओं में से एक” कहते हुए, AI फर्म ने बताया कि फाइन-ट्यूनिंग मॉडल को प्रतिक्रियाओं की संरचना और टोन को अनुकूलित करने में सक्षम बनाएगी। यह GPT-4o को जटिल डोमेन-विशिष्ट निर्देशों का पालन करने की भी अनुमति देगा।
इसके अलावा, कंपनी ने यह भी घोषणा की कि वह 23 सितंबर तक एआई मॉडल के लिए संगठनों को निःशुल्क प्रशिक्षण टोकन प्रदान करेगी। GPT-4o का उपयोग करने वाले उद्यमों को प्रतिदिन एक मिलियन प्रशिक्षण टोकन मिलेंगे, जबकि GPT-4o मिनी का उपयोग करने वालों को प्रतिदिन दो मिलियन प्रशिक्षण टोकन मिलेंगे।
इसके अलावा, मॉडल को फाइन-ट्यूनिंग ट्रेनिंग देने में प्रति मिलियन टोकन 25 डॉलर (लगभग 2,000 रुपये) का खर्च आएगा। इसके अलावा, अनुमान लगाने में प्रति मिलियन इनपुट टोकन 3.75 डॉलर (लगभग 314 रुपये) और प्रति मिलियन आउटपुट टोकन 15 डॉलर (लगभग 1,250 रुपये) का खर्च आएगा, ओपनएआई ने कहा।
GPT-4o को फाइन-ट्यून करने के लिए, उपयोगकर्ता नई विंडो में खुलने वाले फाइन-ट्यूनिंग डैशबोर्ड पर जा सकते हैं, क्रिएट पर क्लिक करें और बेस मॉडल ड्रॉप-डाउन मेनू से “gpt-4o-2024-08-06” चुनें। मिनी मॉडल के लिए भी ऐसा ही करने के लिए, उपयोगकर्ताओं को “gpt-4o-mini-2024-07-18” बेस मॉडल चुनना होगा। ये AI मॉडल केवल उन डेवलपर्स के लिए उपलब्ध होंगे जो OpenAI के पेड टियर के लिए सब्सक्राइब हैं।
इस संदर्भ में, फ़ाइन-ट्यूनिंग, अनिवार्य रूप से बड़े भाषा मॉडल (LLM) की पूर्ण प्रसंस्करण क्षमताओं को प्राप्त करने की एक विधि है, जबकि विशिष्ट डेटासेट को क्यूरेट करते हुए इसे विशिष्ट वर्कफ़्लो के लिए अधिक ग्रहणशील बनाया जाता है। यह एक AI एजेंट या GPTs की तरह काम करता है, लेकिन यह प्रसंस्करण शक्ति में सीमित नहीं है, जिसके परिणामस्वरूप तेज़ और आम तौर पर अधिक सटीक प्रतिक्रियाएँ मिलती हैं।