OpenAI का ChatGPT Agent लॉन्च, अब ऐप्स जैसे करेगा आपके लिए काम
ChatGPT
ओपनएआई का एजेंट अपनी पिछली एजेंटिक विशेषताओं, ऑपरेटर, जो वेबसाइटों के साथ बातचीत कर सकता है, और गहन शोध के पहलुओं को संयोजित करेगा। ओपनएआई ने गुरुवार को अपने लोकप्रिय चैटबॉट चैटजीपीटी के लिए एक कृत्रिम बुद्धिमत्ता एजेंट लॉन्च किया, जो जटिल कार्यों को पूरा कर सकता है। माइक्रोसॉफ्ट समर्थित यह स्टार्टअप एआई की दौड़ में प्रतिस्पर्धियों से आगे निकलने की कोशिश कर रहा है।
एआई एजेंट – जिन्हें सहायक का ही एक रूप माना जाता है – को तकनीकी जगत में अपनाया जा रहा है और माइक्रोसॉफ्ट, सेल्सफोर्स और ओरेकल जैसी बड़ी कंपनियां उत्पादकता बढ़ाने और संचालन को अधिक लागत-कुशल बनाने के लिए इस तकनीक पर अरबों डॉलर खर्च कर रही हैं।
ओपनएआई का एजेंट अपने पिछले एजेंटिक विशेषताओं, ऑपरेटर, जो वेबसाइटों के साथ बातचीत कर सकता है, और गहन अनुसंधान के पहलुओं को संयोजित करेगा जो उन्नत कार्यों के लिए बहु-चरणीय अनुसंधान कर सकता है। ओपनएआई ने आज एक नया आर्टिफिशियल इंटेलिजेंस एजेंट लॉन्च किया है जो उपयोगकर्ता के ब्राउज़र में जटिल कार्य कर सकता है।
चैटजीपीटी एजेंट, जैसा कि इस सुविधा का नाम है, एक नए तर्क-अनुकूलित एआई मॉडल द्वारा संचालित है। ओपनएआई का कहना है कि यह एल्गोरिथम कई मानकों पर अपने पहले के एआई सिस्टम से बेहतर प्रदर्शन करता है।
यह एजेंट उन कार्यों को स्वचालित करने के लिए डिज़ाइन किया गया है जिनमें उपयोगकर्ता को कई क्लाउड एप्लिकेशन में कार्य करने की आवश्यकता होती है। उदाहरण के लिए, एक डेवलपर इसे GitHub से एक कोड फ़ाइल डाउनलोड करके Google ड्राइव फ़ोल्डर में सहेजने के लिए कह सकता है। चैटजीपीटी को फ़ाइल को सहेजने से पहले एक भेद्यता स्कैनर के माध्यम से चलाने का निर्देश भी दिया जा सकता है।
ChatGPT एजेंट ऑनलाइन सेवाओं के साथ इंटरैक्ट करने के लिए दो अलग-अलग ब्राउज़रों का उपयोग करता है। पहला ब्राउज़र, जो मुख्य रूप से टेक्स्ट प्रोसेसिंग के लिए अनुकूलित है, “सरल तर्क-आधारित वेब क्वेरीज़” को सक्षम बनाता है। दूसरा ब्राउज़र चैटजीपीटी एजेंट को वेबसाइटों के ग्राफ़िकल इंटरफ़ेस के माध्यम से उसी तरह इंटरैक्ट करने की अनुमति देता है जैसे कोई उपयोगकर्ता करता है।
ChatGPT खरीदारी जैसे संवेदनशील कार्य करने से पहले अनुमति मांगता है। इसके अलावा, ओपनएआई उपयोगकर्ताओं को ऐसे कार्यों को करते समय टूल की सक्रिय निगरानी करने की आवश्यकता रखता है। अंतर्निहित नियंत्रण किसी कार्य को रोकना, उसे मैन्युअल रूप से पूरा करना या ChatGPT एजेंट को अद्यतन निर्देश प्रदान करना संभव बनाते हैं।
ब्राउज़र ही एकमात्र प्रकार का एप्लिकेशन नहीं है जिसके साथ यह टूल इंटरैक्ट कर सकता है। उपयोगकर्ता इसे टर्मिनल तक पहुँच प्रदान कर सकते हैं, एक प्रोग्राम जो स्क्रिप्ट का उपयोग करके कंप्यूटर के ऑपरेटिंग सिस्टम के साथ इंटरैक्ट करना संभव बनाता है। ChatGPT एजेंट फ़ाइलों को संपादित करने जैसे कार्यों के लिए टर्मिनल का उपयोग कर सकते हैं।
OpenAI के कर्मचारियों ने एक ब्लॉग पोस्ट में लिखा, “मॉडल टेक्स्ट ब्राउज़र या विज़ुअल ब्राउज़र का उपयोग करके एक पृष्ठ खोलने, वेब से एक फ़ाइल डाउनलोड करने, टर्मिनल में एक कमांड चलाकर उसमें हेरफेर करने और फिर विज़ुअल ब्राउज़र में आउटपुट देखने का विकल्प चुन सकता है।”
ChatGPT एजेंट एक नए AI मॉडल द्वारा संचालित है जो कुछ तर्क कार्यों में o4-mini और o3 से बेहतर प्रदर्शन करता है। एक आंतरिक परीक्षण में, OpenAI ने तीनों एल्गोरिदम को फ्रंटियरमैथ गणितीय बेंचमार्क से निपटने में सक्षम बनाया, जिसे अपनी श्रेणी में सबसे कठिन माना जाता है। चैटजीपीटी एजेंट के मॉडल ने 27.4% अंक प्राप्त किए, जबकि o4-mini और o4 ने क्रमशः 19.3% और 10.3% अंक प्राप्त किए।
एक अन्य मूल्यांकन में, ओपनएआई ने स्प्रेडशीटबेंच नामक एक बेंचमार्क का उपयोग करके चैटजीपीटी एजेंट की स्प्रेडशीट तकनीक का परीक्षण किया। इसने एक्सेल में शामिल माइक्रोसॉफ्ट कोपायलट के संस्करण की तुलना में 25% बेहतर स्कोर प्राप्त किया।
ओपनएआई ने हैकर्स को इसकी क्षमताओं का दुरुपयोग करने से रोकने के लिए ChatGPT एजेंट के लिए नए सुरक्षा उपाय विकसित किए हैं। ये सुरक्षा उपाय वेबपेजों में छिपे दुर्भावनापूर्ण संकेतों को रोकने पर विशेष जोर देते हैं। ओपनएआई के कर्मचारियों ने विस्तार से बताया, “हमने एजेंट को त्वरित इंजेक्शन की पहचान करने और उनका विरोध करने के लिए प्रशिक्षित और परीक्षण किया है, साथ ही त्वरित इंजेक्शन हमलों का तेज़ी से पता लगाने और उनका जवाब देने के लिए निगरानी का उपयोग भी किया है।”
यह एजेंट आज ChatGPT के प्रो, प्लस और टीम स्तरों में उपलब्ध है।