जीपीटी-5: 4 नई सुविधाएँ जो हम देखना चाहते हैं

मुखपृष्ठ > ऐ > जीपीटी-5: 4 नई सुविधाएँ जो हम देखना चाहते हैं

जीपीटी-5: 4 नई सुविधाएँ जो हम देखना चाहते हैं

2024-08-17 को प्रकाशित

ब्राउज़ करें:912

कम से कम, हम तो यही उम्मीद कर रहे हैं। GPT-5 के लिए कोई विशिष्ट लॉन्च तिथि नहीं है, और हम जो सोचते हैं उसमें से अधिकांश अन्य जानकारी को एक साथ जोड़ने और बिंदुओं को जोड़ने का प्रयास करने से आता है।

फिर भी, नियत तारीख से कोई फर्क नहीं पड़ता, कुछ प्रमुख विशेषताएं हैं जिन्हें हम जीपीटी-5 के लॉन्च होने पर देखना चाहते हैं।

ओपनएआई का जीपीटी-5 क्या है?

जीपीटी-5, ओपनएआई के जीपीटी-4 एआई मॉडल का बहुप्रतीक्षित उत्तराधिकारी है, जिसके बाजार में व्यापक रूप से सबसे शक्तिशाली जेनरेटिव मॉडल होने की उम्मीद है। हालाँकि GPT-5 के लिए फिलहाल कोई आधिकारिक रिलीज़ डेट नहीं है, लेकिन ऐसे संकेत हैं कि इसे 2024 की गर्मियों की शुरुआत में रिलीज़ किया जा सकता है। इस समय मॉडल के बारे में बहुत कम विवरण ज्ञात है, लेकिन कुछ मात्रा में कई बातें कही जा सकती हैं निश्चितता:

ओपनएआई ने संयुक्त राज्य अमेरिका पेटेंट और ट्रेडमार्क कार्यालय के साथ नाम के लिए एक ट्रेडमार्क दायर किया है। कई OpenAI अधिकारियों ने मॉडल की संभावित क्षमताओं पर चर्चा या संकेत दिया है। मार्च 2024 में लेक्स फ्रिडमैन के साथ यूट्यूब साक्षात्कार के दौरान ओपनएआई के सीईओ सैम ऑल्टमैन ने बार-बार मॉडल का उल्लेख किया।

ये सभी एक रोमांचक वास्तविकता की ओर इशारा करते हैं: जीपीटी-5 आ रहा है! जैसा कि कहा गया है, इस बिंदु पर बहुत सी बातें अटकलें हैं। लेकिन कुछ चीजें हैं जिन्हें हम देखने की उम्मीद करते हैं और मॉडल में देखने को लेकर काफी आश्वस्त हैं। यहां उनमें से कुछ हैं:

1. अधिक मल्टीमॉडलिटी

एआई मॉडल के जीपीटी परिवार में सबसे रोमांचक सुधारों में से एक मल्टीमॉडलिटी रहा है। स्पष्टता के लिए, मल्टीमॉडैलिटी एआई मॉडल की न केवल टेक्स्ट बल्कि छवियों, ऑडियो और वीडियो जैसे अन्य प्रकार के इनपुट को भी संसाधित करने की क्षमता है। भविष्य में मॉडलों के जीपीटी परिवार के लिए मल्टीमॉडैलिटी एक महत्वपूर्ण उन्नति बेंचमार्क होगी।

GPT-4 पहले से ही छवि इनपुट और आउटपुट को संभालने में माहिर है, ऑडियो और वीडियो प्रोसेसिंग को कवर करने वाले सुधार OpenAI के लिए अगला मील का पत्थर हैं, और GPT-5 शुरू करने के लिए एक अच्छी जगह है। Google पहले से ही अपने जेमिनी एआई मॉडल के साथ इस प्रकार की बहुविधता में गंभीर प्रगति कर रहा है। प्रतिक्रिया न देना OpenAI के लिए अस्वाभाविक होगा। लेकिन, निःसंदेह, इसके लिए हमारी बात न मानें। अपने अनकन्फ्यूज मी पॉडकास्ट [पीडीएफ ट्रांसक्रिप्ट] में, बिल गेट्स ने ओपनएआई के सीईओ सैम ऑल्टमैन से पूछा कि अगले दो वर्षों में जीपीटी श्रृंखला के लिए उन्होंने क्या मील के पत्थर देखे हैं। उसका पहला उत्तर? वीडियो प्रोसेसिंग.

इसलिए, GPT-5 के लिए, हम वीडियो के साथ खेलने में सक्षम होने की उम्मीद करते हैं - संकेतों के अनुसार वीडियो अपलोड करें, चलते-फिरते वीडियो बनाएं, टेक्स्ट संकेतों के साथ वीडियो संपादित करें, वीडियो से सेगमेंट निकालें, और विशिष्ट दृश्य ढूंढें बड़ी वीडियो फ़ाइलों से. हम उम्मीद करते हैं कि हम ऑडियो फ़ाइलों के समान कार्य करने में सक्षम होंगे। यह एक बड़ा प्रश्न है, हाँ। लेकिन यह देखते हुए कि एआई का विकास कितना तेज़ है, यह एक बहुत ही उचित अपेक्षा है।

2. बड़ी और अधिक कुशल संदर्भ विंडो

बाजार में सबसे परिष्कृत एआई मॉडल में से एक होने के बावजूद, एआई मॉडल के जीपीटी परिवार में सबसे छोटी संदर्भ विंडो में से एक है। उदाहरण के लिए, एंथ्रोपिक का क्लाउड 3 200,000 टोकन की एक संदर्भ विंडो का दावा करता है, जबकि Google का जेमिनी 1 मिलियन टोकन (मानक उपयोग के लिए 128,000) को संसाधित कर सकता है। इसके विपरीत, GPT-4 में 128,000 टोकन की अपेक्षाकृत छोटी संदर्भ विंडो है, जिसमें ChatGPT जैसे इंटरफेस पर उपयोग के लिए लगभग 32,000 टोकन या उससे कम वास्तविक रूप से उपलब्ध हैं।

उन्नत मल्टीमॉडैलिटी के चित्र में आने के साथ, एक बेहतर संदर्भ विंडो लगभग अपरिहार्य है। शायद दो या चार गुना वृद्धि पर्याप्त होगी, लेकिन हमें दस गुना जैसा कुछ देखने की उम्मीद है। यह GPT-5 को अधिक जानकारी को अधिक कुशल तरीके से संसाधित करने की अनुमति देगा। अब, एक बड़ी संदर्भ विंडो का मतलब हमेशा बेहतर नहीं होता है। इसलिए, केवल संदर्भ विंडो को बढ़ाने के बजाय, हम संदर्भ प्रसंस्करण की बढ़ी हुई दक्षता देखना चाहेंगे।

आप देखते हैं, एक मॉडल में एक मिलियन टोकन संदर्भ विंडो (लगभग 700,000 शब्द क्षमता) हो सकती है, लेकिन जब 500,000 शब्दों की पुस्तक को सारांशित करने के लिए कहा जाता है तो वह एक व्यापक सारांश तैयार करने में विफल रहता है क्योंकि यह संपूर्णता को पर्याप्त रूप से संसाधित नहीं कर सकता है सैद्धांतिक रूप से ऐसा करने की क्षमता होने के बावजूद संदर्भ का। आप 500k शब्द की किताब पढ़ सकते हैं इसका मतलब यह नहीं है कि आप उसमें सब कुछ याद कर सकते हैं या उसे समझदारी से संसाधित कर सकते हैं।

3. जीपीटी एजेंट्स

शायद जीपीटी-5 रिलीज की सबसे रोमांचक संभावनाओं में से एक जीपीटी एजेंटों की शुरुआत है। जबकि "गेम-चेंजर" शब्द का संभवतः एआई में अत्यधिक उपयोग किया गया है, जीपीटी एजेंट वास्तव में हर व्यावहारिक अर्थ में गेम-चेंजर होंगे। लेकिन यह कितना गेम-चेंजिंग होगा?

वर्तमान में, GPT-4 जैसे AI मॉडल आपको किसी कार्य को पूरा करने में मदद कर सकते हैं। वे एक ईमेल लिख सकते हैं, एक चुटकुला सुना सकते हैं, गणित की कोई समस्या हल कर सकते हैं, या आपके लिए एक ब्लॉग पोस्ट का मसौदा तैयार कर सकते हैं। हालाँकि, वे केवल वह विशेष कार्य ही कर सकते हैं और संबंधित कार्यों का एक सेट पूरा नहीं कर सकते जो आपके कार्य को पूरा करने के लिए आवश्यक होंगे।

मान लीजिए कि आप एक वेब डेवलपर हैं। आपके काम के हिस्से के रूप में, आपसे कई चीज़ें करने की अपेक्षा की जाती है: डिज़ाइन करना, कोड लिखना, समस्या निवारण करना, और भी बहुत कुछ। वर्तमान में, आप एक समय में इन कार्यों का केवल एक हिस्सा ही एआई मॉडल को सौंप सकते हैं। हो सकता है कि आप GPT-4 मॉडल को होम पेज के लिए एक कोड लिखने के लिए कह सकते हैं, फिर उसे संपर्क पेज के लिए ऐसा करने के लिए कह सकते हैं, और फिर उसके बारे में पेज आदि के लिए भी ऐसा करने के लिए कह सकते हैं। आपको इन कार्यों को क्रमिक रूप से पूरा करना होगा। और ऐसे कार्य हैं जिन्हें मॉडल आसानी से पूरा नहीं कर सकते हैं।

विशिष्ट उपकार्यों के लिए एआई मॉडल को प्रेरित करने की यह पुनरावृत्तीय प्रक्रिया समय लेने वाली और अक्षम है। इस परिदृश्य में, आप-वेब डेवलपर-मानव एजेंट हैं जो एआई मॉडल को एक समय में एक कार्य के समन्वय और संकेत देने के लिए जिम्मेदार हैं जब तक कि आप संबंधित कार्यों का एक पूरा सेट पूरा नहीं कर लेते।

जीपीटी एजेंट, उम्मीद है, जीपीटी-5 द्वारा समन्वित विशेष विशेषज्ञ बॉट्स का वादा करते हैं जो स्वयं-संकेत देने और एक जटिल कार्य के सभी उपसमूहों को स्वायत्त रूप से निपटाने में सक्षम हैं। "स्वयं प्रेरित" और "स्वायत्त" पर जोर।

इसलिए, यदि GPT-5 GPT एजेंटों के साथ आता है, तो आप उसे केवल "मुझे होमपेज के लिए एक कोड लिखने" के बजाय "मैक्सवेल टिमोथी के लिए एक पोर्टफोलियो वेबसाइट बनाने" के लिए कह सकते हैं। GPT-5 तब सैद्धांतिक रूप से एक वेबसाइट बनाने के लिए आवश्यक विभिन्न उप-कार्यों को संभालने के लिए विशेषज्ञ AI एजेंटों को आमंत्रित करके स्वयं-संकेत देने में सक्षम होगा। यह मैक्सवेल टिमोथी के बारे में जानकारी के लिए वेब को स्क्रैप करने के लिए एक जीपीटी को बुला सकता है, अलग-अलग पेजों के लिए कोड लिखने के लिए एक और एजेंट, छवियों को उत्पन्न करने और अनुकूलित करने के लिए एक और एजेंट, और साइट को तैनात करने के लिए एक और एआई एजेंट भी, बार-बार मानव की आवश्यकता के बिना। प्रेरित करना.

4. कम मतिभ्रम

हालांकि ओपनएआई ने अपने एआई मॉडल में मतिभ्रम से निपटने में एक लंबा सफर तय किया है, जीपीटी-5 के लिए असली लिटमस टेस्ट लगातार जारी मुद्दे को संबोधित करने की इसकी क्षमता होगी। मतिभ्रम, जिसने स्वास्थ्य देखभाल, विमानन और साइबर सुरक्षा जैसे उच्च जोखिम वाले, सुरक्षा-महत्वपूर्ण डोमेन में एआई को व्यापक रूप से अपनाने में बाधा उत्पन्न की है। ये सभी ऐसे क्षेत्र हैं जो भारी एआई भागीदारी से भारी लाभ उठाएंगे लेकिन वर्तमान में किसी भी महत्वपूर्ण अपनाने से बच रहे हैं।

स्पष्टता के लिए, इस संदर्भ में मतिभ्रम उन स्थितियों को संदर्भित करता है जहां एआई मॉडल उच्च स्तर के आत्मविश्वास के साथ प्रशंसनीय-लगने वाली लेकिन पूरी तरह से मनगढ़ंत जानकारी उत्पन्न और प्रस्तुत करता है।

ऐसे परिदृश्य की कल्पना करें जहां रोगी के लक्षणों और चिकित्सा रिपोर्टों का विश्लेषण करने के लिए जीपीटी-4 को एक निदान प्रणाली में एकीकृत किया गया है। मतिभ्रम एआई को आत्मविश्वास से गलत निदान प्रदान करने या काल्पनिक तथ्यों और झूठे तर्क के आधार पर उपचार के संभावित खतरनाक पाठ्यक्रम की सिफारिश करने के लिए प्रेरित कर सकता है। चिकित्सा क्षेत्र में ऐसी त्रुटि के परिणाम विनाशकारी हो सकते हैं।

इसी तरह के आरक्षण अन्य उच्च-परिणाम वाले क्षेत्रों, जैसे विमानन, परमाणु ऊर्जा, समुद्री संचालन और साइबर सुरक्षा पर भी लागू होते हैं। हमें उम्मीद नहीं है कि GPT-5 मतिभ्रम की समस्या को पूरी तरह से हल कर देगा, लेकिन हम उम्मीद करते हैं कि यह ऐसी घटनाओं की संभावना को काफी हद तक कम कर देगा।

जैसा कि हम इस बहुप्रतीक्षित एआई मॉडल की आधिकारिक रिलीज का बेसब्री से इंतजार कर रहे हैं, एक बात निश्चित है: जीपीटी-5 में कृत्रिम बुद्धिमत्ता के साथ जो संभव है उसकी सीमाओं को फिर से परिभाषित करने की क्षमता है, जो मानव के एक नए युग की शुरुआत है। -मशीन सहयोग और नवाचार।

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://www.makeuseof.com/gpt-5-features-we-want-to-see/ यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] से संपर्क करें।

नवीनतम ट्यूटोरियल अधिक>

झुंड खुफिया एल्गोरिदम: तीन पायथन कार्यान्वयन
Imagine watching a flock of birds in flight. There's no leader, no one giving directions, yet they swoop and glide together in perfect harmony. It may...

ऐ 2025-03-24 को पोस्ट किया गया
कैसे अपने एलएलएम को राग और ठीक-ट्यूनिंग के साथ अधिक सटीक बनाने के लिए
Imagine studying a module at university for a semester. At the end, after an intensive learning phase, you take an exam – and you can recall th...

ऐ 2025-03-24 को पोस्ट किया गया
Google मिथुन क्या है? Google के Chatgpt प्रतिद्वंद्वी के बारे में आपको सब कुछ जानना होगा
Google recently released its new Generative AI model, Gemini. It results from a collaborative effort by a range of teams at Google, including members ...

ऐ 2025-03-23 पर पोस्ट किया गया
DSPY के साथ संकेत देने पर गाइड
] ] यह ट्यूटोरियल DSPY के घोषणात्मक दृष्टिकोण का उपयोग करके शक्तिशाली AI अनुप्रयोगों के निर्माण के लिए एक व्यापक मार्गदर्शिका प्रदान करता है। सीखने ...

ऐ 2025-03-22 पर पोस्ट किया गया
ट्विटर थ्रेड के लिए स्वचालित ब्लॉग
] मैनुअल थ्रेड क्रिएशन समय लेने वाली है; यह एप्लिकेशन प्रक्रिया को सुव्यवस्थित करता है। ] ] ] स्वचालित सामग्री परिवर्तन के लिए मिथुन -2.0 की क्ष...

ऐ 2025-03-11 को पोस्ट किया गया
आर्टिफिशियल इम्यून सिस्टम (एआईएस): पायथन उदाहरणों के साथ एक गाइड
] हम एआईएस के मुख्य सिद्धांतों में तल्लीन करेंगे, क्लोनल चयन, नकारात्मक चयन और प्रतिरक्षा नेटवर्क सिद्धांत जैसे प्रमुख एल्गोरिदम की जांच करेंगे, और प...

ऐ 2025-03-04 पर पोस्ट किया गया
चैटजीपीटी से अपने बारे में ये मज़ेदार प्रश्न पूछने का प्रयास करें
क्या आपने कभी सोचा है कि चैटजीपीटी आपके बारे में क्या जानता है? यह आपके द्वारा उसे दी गई जानकारी को समय के साथ कैसे संसाधित करता है? मैंने विभिन्न परि...

ऐ 2024-11-22 को प्रकाशित
यहां बताया गया है कि आप अभी भी रहस्यमय GPT-2 चैटबॉट को कैसे आज़मा सकते हैं
यदि आप एआई मॉडल या चैटबॉट में रुचि रखते हैं, तो आपने रहस्यमय जीपीटी-2 चैटबॉट और इसकी प्रभावशीलता के बारे में चर्चा देखी होगी।यहां, हम बताते हैं कि जीप...

ऐ 2024-11-08 को प्रकाशित
ChatGPT का कैनवास मोड बढ़िया है: इसे उपयोग करने के ये 4 तरीके हैं
चैटजीपीटी के नए कैनवस मोड ने दुनिया के अग्रणी जेनरेटिव एआई टूल में लेखन और संपादन में एक अतिरिक्त आयाम जोड़ा है। मैं लॉन्च होने के बाद से चैटजीपीटी कै...

ऐ 2024-11-08 को प्रकाशित
चैटजीपीटी के कस्टम जीपीटी आपके डेटा को कैसे उजागर कर सकते हैं और इसे कैसे सुरक्षित रखें
चैटजीपीटी की कस्टम जीपीटी सुविधा किसी को भी लगभग किसी भी चीज़ के लिए कस्टम एआई टूल बनाने की अनुमति देती है जिसके बारे में आप सोच सकते हैं; रचनात्मक, ...

ऐ 2024-11-08 को प्रकाशित
10 तरीके जिनसे चैटजीपीटी आपको लिंक्डइन पर नौकरी दिलाने में मदद कर सकता है
2,600 उपलब्ध पात्रों के साथ, आपके लिंक्डइन प्रोफ़ाइल का परिचय अनुभाग आपकी पृष्ठभूमि, कौशल, जुनून और भविष्य के लक्ष्यों के बारे में विस्तार से बताने क...

ऐ 2024-11-08 को प्रकाशित
अद्वितीय अनुभव प्रदान करने वाले इन 6 कम-ज्ञात एआई ऐप्स को देखें
इस बिंदु पर, अधिकांश लोगों ने चैटजीपीटी और कोपायलट के बारे में सुना है, दो अग्रणी जेनरेटिव एआई ऐप्स जिन्होंने एआई बूम का नेतृत्व किया है।लेकिन क्या आप...

ऐ 2024-11-08 को प्रकाशित
ये 7 संकेत बताते हैं कि हम पहले ही चरम एआई पर पहुंच चुके हैं
जहां भी आप ऑनलाइन देखते हैं, वहां साइटें, सेवाएं और ऐप्स हैं जो घोषणा करते हैं कि एआई का उपयोग इसे सबसे अच्छा विकल्प बनाता है। मैं आपके बारे में नहीं ...

ऐ 2024-11-08 को प्रकाशित
शिक्षकों, व्याख्याताओं और मालिकों के लिए 4 एआई-चेकिंग चैटजीपीटी डिटेक्टर उपकरण
जैसे-जैसे चैटजीपीटी शक्ति में आगे बढ़ रहा है, यह बताना कठिन होता जा रहा है कि किसी मानव द्वारा क्या लिखा गया है और एआई द्वारा क्या उत्पन्न किया गया ह...

ऐ 2024-11-08 को प्रकाशित
चैटजीपीटी का उन्नत वॉयस फीचर अधिक उपयोगकर्ताओं के लिए उपलब्ध कराया जा रहा है
यदि आप कभी चैटजीपीटी के साथ पूर्ण बातचीत करना चाहते हैं, तो अब आप कर सकते हैं। यानी, जब तक आप चैटजीपीटी का उपयोग करने के विशेषाधिकार के लिए भुगतान करत...

ऐ 2024-11-08 को प्रकाशित