"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ >  > जीपीटी-5: 4 नई सुविधाएँ जो हम देखना चाहते हैं

जीपीटी-5: 4 नई सुविधाएँ जो हम देखना चाहते हैं

2024-08-17 को प्रकाशित
ब्राउज़ करें:912

कम से कम, हम तो यही उम्मीद कर रहे हैं। GPT-5 के लिए कोई विशिष्ट लॉन्च तिथि नहीं है, और हम जो सोचते हैं उसमें से अधिकांश अन्य जानकारी को एक साथ जोड़ने और बिंदुओं को जोड़ने का प्रयास करने से आता है।

फिर भी, नियत तारीख से कोई फर्क नहीं पड़ता, कुछ प्रमुख विशेषताएं हैं जिन्हें हम जीपीटी-5 के लॉन्च होने पर देखना चाहते हैं।

ओपनएआई का जीपीटी-5 क्या है?

जीपीटी-5, ओपनएआई के जीपीटी-4 एआई मॉडल का बहुप्रतीक्षित उत्तराधिकारी है, जिसके बाजार में व्यापक रूप से सबसे शक्तिशाली जेनरेटिव मॉडल होने की उम्मीद है। हालाँकि GPT-5 के लिए फिलहाल कोई आधिकारिक रिलीज़ डेट नहीं है, लेकिन ऐसे संकेत हैं कि इसे 2024 की गर्मियों की शुरुआत में रिलीज़ किया जा सकता है। इस समय मॉडल के बारे में बहुत कम विवरण ज्ञात है, लेकिन कुछ मात्रा में कई बातें कही जा सकती हैं निश्चितता:

ओपनएआई ने संयुक्त राज्य अमेरिका पेटेंट और ट्रेडमार्क कार्यालय के साथ नाम के लिए एक ट्रेडमार्क दायर किया है। कई OpenAI अधिकारियों ने मॉडल की संभावित क्षमताओं पर चर्चा या संकेत दिया है। मार्च 2024 में लेक्स फ्रिडमैन के साथ यूट्यूब साक्षात्कार के दौरान ओपनएआई के सीईओ सैम ऑल्टमैन ने बार-बार मॉडल का उल्लेख किया।

ये सभी एक रोमांचक वास्तविकता की ओर इशारा करते हैं: जीपीटी-5 आ रहा है! जैसा कि कहा गया है, इस बिंदु पर बहुत सी बातें अटकलें हैं। लेकिन कुछ चीजें हैं जिन्हें हम देखने की उम्मीद करते हैं और मॉडल में देखने को लेकर काफी आश्वस्त हैं। यहां उनमें से कुछ हैं:

1. अधिक मल्टीमॉडलिटी

GPT-5: 4 New Features We Want to See

एआई मॉडल के जीपीटी परिवार में सबसे रोमांचक सुधारों में से एक मल्टीमॉडलिटी रहा है। स्पष्टता के लिए, मल्टीमॉडैलिटी एआई मॉडल की न केवल टेक्स्ट बल्कि छवियों, ऑडियो और वीडियो जैसे अन्य प्रकार के इनपुट को भी संसाधित करने की क्षमता है। भविष्य में मॉडलों के जीपीटी परिवार के लिए मल्टीमॉडैलिटी एक महत्वपूर्ण उन्नति बेंचमार्क होगी।

GPT-4 पहले से ही छवि इनपुट और आउटपुट को संभालने में माहिर है, ऑडियो और वीडियो प्रोसेसिंग को कवर करने वाले सुधार OpenAI के लिए अगला मील का पत्थर हैं, और GPT-5 शुरू करने के लिए एक अच्छी जगह है। Google पहले से ही अपने जेमिनी एआई मॉडल के साथ इस प्रकार की बहुविधता में गंभीर प्रगति कर रहा है। प्रतिक्रिया न देना OpenAI के लिए अस्वाभाविक होगा। लेकिन, निःसंदेह, इसके लिए हमारी बात न मानें। अपने अनकन्फ्यूज मी पॉडकास्ट [पीडीएफ ट्रांसक्रिप्ट] में, बिल गेट्स ने ओपनएआई के सीईओ सैम ऑल्टमैन से पूछा कि अगले दो वर्षों में जीपीटी श्रृंखला के लिए उन्होंने क्या मील के पत्थर देखे हैं। उसका पहला उत्तर? वीडियो प्रोसेसिंग.

इसलिए, GPT-5 के लिए, हम वीडियो के साथ खेलने में सक्षम होने की उम्मीद करते हैं - संकेतों के अनुसार वीडियो अपलोड करें, चलते-फिरते वीडियो बनाएं, टेक्स्ट संकेतों के साथ वीडियो संपादित करें, वीडियो से सेगमेंट निकालें, और विशिष्ट दृश्य ढूंढें बड़ी वीडियो फ़ाइलों से. हम उम्मीद करते हैं कि हम ऑडियो फ़ाइलों के समान कार्य करने में सक्षम होंगे। यह एक बड़ा प्रश्न है, हाँ। लेकिन यह देखते हुए कि एआई का विकास कितना तेज़ है, यह एक बहुत ही उचित अपेक्षा है।

2. बड़ी और अधिक कुशल संदर्भ विंडो

GPT-5: 4 New Features We Want to See

बाजार में सबसे परिष्कृत एआई मॉडल में से एक होने के बावजूद, एआई मॉडल के जीपीटी परिवार में सबसे छोटी संदर्भ विंडो में से एक है। उदाहरण के लिए, एंथ्रोपिक का क्लाउड 3 200,000 टोकन की एक संदर्भ विंडो का दावा करता है, जबकि Google का जेमिनी 1 मिलियन टोकन (मानक उपयोग के लिए 128,000) को संसाधित कर सकता है। इसके विपरीत, GPT-4 में 128,000 टोकन की अपेक्षाकृत छोटी संदर्भ विंडो है, जिसमें ChatGPT जैसे इंटरफेस पर उपयोग के लिए लगभग 32,000 टोकन या उससे कम वास्तविक रूप से उपलब्ध हैं।

उन्नत मल्टीमॉडैलिटी के चित्र में आने के साथ, एक बेहतर संदर्भ विंडो लगभग अपरिहार्य है। शायद दो या चार गुना वृद्धि पर्याप्त होगी, लेकिन हमें दस गुना जैसा कुछ देखने की उम्मीद है। यह GPT-5 को अधिक जानकारी को अधिक कुशल तरीके से संसाधित करने की अनुमति देगा। अब, एक बड़ी संदर्भ विंडो का मतलब हमेशा बेहतर नहीं होता है। इसलिए, केवल संदर्भ विंडो को बढ़ाने के बजाय, हम संदर्भ प्रसंस्करण की बढ़ी हुई दक्षता देखना चाहेंगे।

आप देखते हैं, एक मॉडल में एक मिलियन टोकन संदर्भ विंडो (लगभग 700,000 शब्द क्षमता) हो सकती है, लेकिन जब 500,000 शब्दों की पुस्तक को सारांशित करने के लिए कहा जाता है तो वह एक व्यापक सारांश तैयार करने में विफल रहता है क्योंकि यह संपूर्णता को पर्याप्त रूप से संसाधित नहीं कर सकता है सैद्धांतिक रूप से ऐसा करने की क्षमता होने के बावजूद संदर्भ का। आप 500k शब्द की किताब पढ़ सकते हैं इसका मतलब यह नहीं है कि आप उसमें सब कुछ याद कर सकते हैं या उसे समझदारी से संसाधित कर सकते हैं।

3. जीपीटी एजेंट्स

GPT-5: 4 New Features We Want to See

शायद जीपीटी-5 रिलीज की सबसे रोमांचक संभावनाओं में से एक जीपीटी एजेंटों की शुरुआत है। जबकि "गेम-चेंजर" शब्द का संभवतः एआई में अत्यधिक उपयोग किया गया है, जीपीटी एजेंट वास्तव में हर व्यावहारिक अर्थ में गेम-चेंजर होंगे। लेकिन यह कितना गेम-चेंजिंग होगा?

वर्तमान में, GPT-4 जैसे AI मॉडल आपको किसी कार्य को पूरा करने में मदद कर सकते हैं। वे एक ईमेल लिख सकते हैं, एक चुटकुला सुना सकते हैं, गणित की कोई समस्या हल कर सकते हैं, या आपके लिए एक ब्लॉग पोस्ट का मसौदा तैयार कर सकते हैं। हालाँकि, वे केवल वह विशेष कार्य ही कर सकते हैं और संबंधित कार्यों का एक सेट पूरा नहीं कर सकते जो आपके कार्य को पूरा करने के लिए आवश्यक होंगे।

मान लीजिए कि आप एक वेब डेवलपर हैं। आपके काम के हिस्से के रूप में, आपसे कई चीज़ें करने की अपेक्षा की जाती है: डिज़ाइन करना, कोड लिखना, समस्या निवारण करना, और भी बहुत कुछ। वर्तमान में, आप एक समय में इन कार्यों का केवल एक हिस्सा ही एआई मॉडल को सौंप सकते हैं। हो सकता है कि आप GPT-4 मॉडल को होम पेज के लिए एक कोड लिखने के लिए कह सकते हैं, फिर उसे संपर्क पेज के लिए ऐसा करने के लिए कह सकते हैं, और फिर उसके बारे में पेज आदि के लिए भी ऐसा करने के लिए कह सकते हैं। आपको इन कार्यों को क्रमिक रूप से पूरा करना होगा। और ऐसे कार्य हैं जिन्हें मॉडल आसानी से पूरा नहीं कर सकते हैं।

विशिष्ट उपकार्यों के लिए एआई मॉडल को प्रेरित करने की यह पुनरावृत्तीय प्रक्रिया समय लेने वाली और अक्षम है। इस परिदृश्य में, आप-वेब डेवलपर-मानव एजेंट हैं जो एआई मॉडल को एक समय में एक कार्य के समन्वय और संकेत देने के लिए जिम्मेदार हैं जब तक कि आप संबंधित कार्यों का एक पूरा सेट पूरा नहीं कर लेते।

जीपीटी एजेंट, उम्मीद है, जीपीटी-5 द्वारा समन्वित विशेष विशेषज्ञ बॉट्स का वादा करते हैं जो स्वयं-संकेत देने और एक जटिल कार्य के सभी उपसमूहों को स्वायत्त रूप से निपटाने में सक्षम हैं। "स्वयं प्रेरित" और "स्वायत्त" पर जोर।

इसलिए, यदि GPT-5 GPT एजेंटों के साथ आता है, तो आप उसे केवल "मुझे होमपेज के लिए एक कोड लिखने" के बजाय "मैक्सवेल टिमोथी के लिए एक पोर्टफोलियो वेबसाइट बनाने" के लिए कह सकते हैं। GPT-5 तब सैद्धांतिक रूप से एक वेबसाइट बनाने के लिए आवश्यक विभिन्न उप-कार्यों को संभालने के लिए विशेषज्ञ AI एजेंटों को आमंत्रित करके स्वयं-संकेत देने में सक्षम होगा। यह मैक्सवेल टिमोथी के बारे में जानकारी के लिए वेब को स्क्रैप करने के लिए एक जीपीटी को बुला सकता है, अलग-अलग पेजों के लिए कोड लिखने के लिए एक और एजेंट, छवियों को उत्पन्न करने और अनुकूलित करने के लिए एक और एजेंट, और साइट को तैनात करने के लिए एक और एआई एजेंट भी, बार-बार मानव की आवश्यकता के बिना। प्रेरित करना.

4. कम मतिभ्रम

हालांकि ओपनएआई ने अपने एआई मॉडल में मतिभ्रम से निपटने में एक लंबा सफर तय किया है, जीपीटी-5 के लिए असली लिटमस टेस्ट लगातार जारी मुद्दे को संबोधित करने की इसकी क्षमता होगी। मतिभ्रम, जिसने स्वास्थ्य देखभाल, विमानन और साइबर सुरक्षा जैसे उच्च जोखिम वाले, सुरक्षा-महत्वपूर्ण डोमेन में एआई को व्यापक रूप से अपनाने में बाधा उत्पन्न की है। ये सभी ऐसे क्षेत्र हैं जो भारी एआई भागीदारी से भारी लाभ उठाएंगे लेकिन वर्तमान में किसी भी महत्वपूर्ण अपनाने से बच रहे हैं।

स्पष्टता के लिए, इस संदर्भ में मतिभ्रम उन स्थितियों को संदर्भित करता है जहां एआई मॉडल उच्च स्तर के आत्मविश्वास के साथ प्रशंसनीय-लगने वाली लेकिन पूरी तरह से मनगढ़ंत जानकारी उत्पन्न और प्रस्तुत करता है।

ऐसे परिदृश्य की कल्पना करें जहां रोगी के लक्षणों और चिकित्सा रिपोर्टों का विश्लेषण करने के लिए जीपीटी-4 को एक निदान प्रणाली में एकीकृत किया गया है। मतिभ्रम एआई को आत्मविश्वास से गलत निदान प्रदान करने या काल्पनिक तथ्यों और झूठे तर्क के आधार पर उपचार के संभावित खतरनाक पाठ्यक्रम की सिफारिश करने के लिए प्रेरित कर सकता है। चिकित्सा क्षेत्र में ऐसी त्रुटि के परिणाम विनाशकारी हो सकते हैं।

इसी तरह के आरक्षण अन्य उच्च-परिणाम वाले क्षेत्रों, जैसे विमानन, परमाणु ऊर्जा, समुद्री संचालन और साइबर सुरक्षा पर भी लागू होते हैं। हमें उम्मीद नहीं है कि GPT-5 मतिभ्रम की समस्या को पूरी तरह से हल कर देगा, लेकिन हम उम्मीद करते हैं कि यह ऐसी घटनाओं की संभावना को काफी हद तक कम कर देगा।

जैसा कि हम इस बहुप्रतीक्षित एआई मॉडल की आधिकारिक रिलीज का बेसब्री से इंतजार कर रहे हैं, एक बात निश्चित है: जीपीटी-5 में कृत्रिम बुद्धिमत्ता के साथ जो संभव है उसकी सीमाओं को फिर से परिभाषित करने की क्षमता है, जो मानव के एक नए युग की शुरुआत है। -मशीन सहयोग और नवाचार।

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://www.makeuseof.com/gpt-5-features-we-want-to-see/ यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3