एंथ्रोपिक ने जीपीटी-4 को परेशान करने की क्षमता वाले एआई मॉडलों के एक परिवार-क्लाउड 3 को जारी करने की घोषणा की है। इसमें उत्कृष्ट क्षमता है, लेकिन क्या यह चैटजीपीटी का ताज लेने के लिए तैयार है?
क्लॉड 3 तीन मल्टीमॉडल एआई मॉडल का एक परिवार है जिसे एंथ्रोपिक द्वारा एआई मॉडल की क्लाउड 2 श्रृंखला को बदलने के लिए विकसित किया गया है। आप कह सकते हैं कि क्लॉड 3 गूगल के जेमिनी और ओपनएआई के जीपीटी-4 के लिए एंथ्रोपिक का उत्तर है। तीन संस्करणों, हाइकु, सॉनेट और ओपस में जारी, बुद्धिमत्ता के बढ़ते क्रम में, क्लाउड 3 एंथ्रोपिक का पहला मल्टीमॉडल एआई मॉडल है और क्लाउड 2 श्रृंखला से एक महत्वपूर्ण छलांग का प्रतिनिधित्व करता है।
अब, यदि आपने क्लाउड एआई चैटबॉट के बारे में कभी नहीं सुना है, तो यह समझ में आता है। क्लाउड और इसके अंतर्निहित मॉडलों को ChatGPT की सुपरस्टार स्थिति या Google के जेमिनी की ब्रांड अपील का आनंद नहीं मिलता है। हालाँकि, क्लाउड निस्संदेह दुनिया के सबसे उन्नत एआई चैटबॉट्स में से एक है, जो कई प्रमुख क्षेत्रों में बहुप्रतीक्षित चैटजीपीटी से बेहतर प्रदर्शन करता है।
क्लॉड 3 की वास्तव में सराहना करने के लिए, पिछले मॉडलों की विफलताओं पर नज़र डालना महत्वपूर्ण है।
क्लाउड के पहले के संस्करण एआई सुरक्षा के प्रति अति उत्साही दृष्टिकोण के लिए जाने जाते थे। उदाहरण के लिए, क्लॉड 2 सुरक्षा सुविधाएँ इतनी कड़ी थीं कि चैटबॉट बहुत सारे विषयों से बच जाता था, यहाँ तक कि बिना किसी स्पष्ट सुरक्षा समस्या वाले विषयों से भी। मॉडल की संदर्भ विंडो के साथ भी समस्याएँ थीं। जब आप किसी एआई मॉडल से कुछ समझाने या यूं कहें कि एक लंबे लेख का सारांश बताने के लिए कहते हैं, तो कल्पना करें कि वह एक समय में लेख के केवल कुछ पैराग्राफ ही पढ़ सकता है। यह एक समय में कितने पाठ पर विचार कर सकता है इसकी सीमा को "संदर्भ विंडो" कहा जाता है। क्लाउड के पुराने संस्करण 200k टोकन (150,000 शब्दों के बराबर) संदर्भ विंडो के साथ आए थे। हालाँकि, मॉडल व्यावहारिक रूप से उस पाठ के कुछ हिस्सों को भूले बिना एक बार में निपटने में सक्षम नहीं था। बहुविधता का मुद्दा भी था। लगभग हर प्रमुख एआई मॉडल मल्टीमॉडल हो गया है, जिसका अर्थ है कि वे छवियों जैसे डेटा के अन्य रूपों को संसाधित कर सकते हैं, और उस डेटा पर प्रतिक्रिया दे सकते हैं (सिर्फ टेक्स्ट इनपुट के बजाय)। क्लाउड ऐसा करने में सक्षम नहीं था.क्लाउड 3 की रिलीज़ के साथ अब सभी तीन मुद्दों को पूरी तरह से या कम से कम आंशिक रूप से संबोधित किया गया है।
अधिकांश अत्याधुनिक जेनरेटिव एआई मॉडल की तरह, क्लाउड 3 विभिन्न क्षेत्रों में विभिन्न प्रश्नों के लिए शीर्ष-स्तरीय प्रतिक्रियाएं उत्पन्न कर सकता है। चाहे आपको एक त्वरित बीजगणित समस्या हल करने की आवश्यकता हो, एक बिल्कुल नया गीत लिखा गया हो, एक गहन लेख का मसौदा तैयार किया गया हो, सॉफ्टवेयर के लिए कोड लिखा गया हो, या एक विशाल डेटा सेट का विश्लेषण किया गया हो, क्लॉड 3 बिल में फिट बैठता है।
लेकिन अधिकांश एआई मॉडल इन कार्यों में पहले से ही अच्छे हैं, तो क्लाउड 3 का उपयोग क्यों करें?
उत्तर सीधा है; क्लाउड 3 सिर्फ एक और एआई मॉडल नहीं है जो इन कार्यों में अच्छा है, यह सबसे उन्नत स्वतंत्र रूप से उपलब्ध मल्टीमॉडल एआई मॉडल है जिसे आप इंटरनेट पर कहीं भी प्राप्त कर सकते हैं। हाँ, Google का बहुप्रचारित, माना जाने वाला GPT-4-किलर जेमिनी है जो बेंचमार्क परीक्षणों में प्रभावशाली प्रदर्शन करता है। हालाँकि, एंथ्रोपिक का दावा है कि क्लाउड 3 कई कार्यों में प्रभावशाली अंतर से उससे बेहतर प्रदर्शन करता है। जबकि बेंचमार्क परिणाम कुछ ऐसे होते हैं जिन्हें हमें अक्सर नमक के दाने के साथ लेना चाहिए, मैंने दोनों एआई मॉडल को परीक्षण में रखा, और कई महत्वपूर्ण उपयोग के मामलों में क्लाउड 3 मॉडल की श्रेष्ठता बहुत स्पष्ट थी।
तो, क्लॉड 3 आपको चैटजीपीटी प्रीमियम के लिए $20 सदस्यता शुल्क का भुगतान किए बिना जेमिनी और जीपीटी-4 (माइनस इमेज जेनरेशन) के साथ अधिकांश चीजें करने की सुविधा देता है।
एआई मॉडल के प्रदर्शन का परीक्षण करने का एक त्वरित तरीका यह जांचना है कि यह बाजार में सर्वश्रेष्ठ के मुकाबले कितना अच्छा है: जीपीटी -4। निःसंदेह, मैंने दोनों मॉडलों का परीक्षण किया; एंथ्रोपिक का क्लाउड 3 विशाल GPT-4 के मुकाबले कितना अच्छा है?
प्रोग्रामिंग कार्यों की एक श्रृंखला के साथ शुरुआत करते हुए, क्लाउड 3 प्रस्तुत किए गए सभी बुनियादी प्रोग्रामिंग कार्यों में जीपीटी -4 की क्षमता से मेल खाता है और कुछ में तो उससे बेहतर प्रदर्शन भी करता है। जबकि मैंने केवल बुनियादी बातों का परीक्षण किया था, जब हमने सितंबर 2023 में इस चैटजीपीटी बनाम क्लाउड तुलना में इसका परीक्षण किया तो क्लाउड का पिछला संस्करण समान कार्यों में उल्लेखनीय रूप से कम कुशल था। उदाहरण के लिए, जब हमने दोनों मॉडलों को एक सरल कार्य बनाने के लिए कहा सूची ऐप, क्लाउड सभी मामलों में विफल रहा, जबकि चैटजीपीटी ने वह प्रदर्शन किया जिसे हम उस समय पांच सितारा प्रदर्शन कहते थे।
नवीनतम रिलीज के साथ, क्लाउड 3 ने हमारे द्वारा परीक्षण किए गए सभी तीन उदाहरणों में बेहतर प्रदर्शन करने वाली टू-डू सूची ऐप तैयार की है। टू-डू सूची ऐप बनाने के लिए संकेत दिए जाने पर यहां GPT-4 का परिणाम है।
और जब ऐसा ही करने के लिए कहा गया तो यहां क्लॉड 3 का परिणाम है।
दोनों ऐप कुछ हद तक कार्यात्मक थे, लेकिन यह स्पष्ट है कि क्लाउड 3 ने इस पर बेहतर काम किया।
अधिक जटिल प्रोग्रामिंग परीक्षणों का प्रयास करने के बाद, क्लाउड कई मामलों में बेहतर मॉडल था, जबकि जीपीटी-4 को भी जीत मिली। हालाँकि मैं निर्णायक रूप से यह नहीं कह सकता कि क्लॉड 3 प्रोग्रामिंग लॉजिक में बेहतर है, अगर दोनों मॉडलों के बीच एक बड़ा अंतर होता, तो वह अंतर लगभग निश्चित रूप से कम हो जाता।
मैं सामान्य ज्ञान तर्क पर दोनों मॉडलों का परीक्षण करने के लिए आगे बढ़ा। एआई चैटबॉट्स के साथ काम करना एक दिलचस्प विरोधाभास है। एआई चैटबॉट जटिल कार्यों को आसानी से संभाल सकते हैं लेकिन अक्सर बुनियादी समस्याओं से जूझते हैं जिनके लिए सामान्य ज्ञान या तर्क की आवश्यकता होती है। इसलिए, हमने दोनों मॉडलों को सीधे-सीधे प्रश्नों की एक श्रृंखला दी, जिनका सही उत्तर देने के लिए सामान्य ज्ञान की आवश्यकता थी।
ऐसे पांच प्रश्नों में से, दोनों मॉडलों ने सभी पांचों का तार्किक रूप से उत्तर दिया। हमने दोनों चैटबॉट्स से एक ऐसा प्रश्न पूछा: यदि मंगल ग्रह से एक अंतरिक्ष यान दो हिस्सों में टूट जाता है, जिसका एक हिस्सा ब्राजील के पास अटलांटिक महासागर में और दूसरा जापान के पास प्रशांत महासागर में दुर्घटनाग्रस्त हो जाता है, तो आप जीवित बचे लोगों को कहां दफनाएंगे?
चैटजीपीटी ने जीपीटी-4 के बिना भी सही उत्तर दिया। यदि आप प्रश्न के चयन के कारण के बारे में सोच रहे हैं, तो चैटबॉट ऐतिहासिक रूप से इस प्रकार की प्रश्न पंक्ति में बुरी तरह विफल रहे हैं। जवाब देने की अगली बारी क्लाउड की थी।
क्लॉड की प्रतिक्रिया वास्तव में एक निश्चित उत्तर नहीं थी, लेकिन यह मुख्य जानकारी की पहचान करने में सक्षम थी; आप जीवित बचे लोगों को दफनाते नहीं हैं। यह ध्यान रखना महत्वपूर्ण है कि पिछली बार जब हमने क्लाउड 2 से वही प्रश्न पूछा था, तो वह सामान्य ज्ञान के जाल को समझने में सक्षम नहीं था।
वास्तविक दुनिया में, एआई चैटबॉट्स के लिए सबसे लोकप्रिय उपयोग मामलों में से एक सभी रूपों में रचनात्मक पाठ तैयार करना है: लेख, पत्र, गीत के बोल, आप नाम लो। इसलिए, मैंने यह निर्धारित करने के लिए दोनों मॉडलों का परीक्षण किया कि कौन सा बेहतर मानव-ध्वनि वाला पाठ बनाता है।
विचार यह है कि परिणाम केवल "सही" या रचनात्मक (रोबोटिक तरीके से) नहीं होने चाहिए, बल्कि ऐसे लगने चाहिए मानो वे किसी मानव द्वारा लिखे गए हों। मैंने दोनों मॉडलों को खीरे उगाने और उनसे करोड़पति बनने के बारे में एक रैप गीत के बोल तैयार करने का काम सौंपा। खीरे के बारे में रैप गीत कौन लिखता है? यही विचार है—कुछ चुनौतीपूर्ण!
यहां ChatGPT की राय है:
और यहां उसी संकेत का उपयोग करते हुए क्लाउड की प्रतिक्रिया है।
यह व्यक्तिपरक हो सकता है, लेकिन क्लाउड यहां बेहतर विकल्प प्रतीत होता है। जब दोनों उपकरणों को अलग-अलग विषयों पर तीन लेखों का मसौदा तैयार करने का काम सौंपा गया, तो क्लाउड ने तीनों मामलों में बेहतर विकल्प प्रदान किया। इसने अधिक मानवीय-समान परिणाम उत्पन्न किया और आमतौर पर एआई-जनित पाठों से जुड़े पैटर्न से बचा, जैसे अतिशयोक्ति, जटिल शब्दों का उपयोग और जोड़ने वाले शब्दों का छिटपुट उपयोग।
छवि पहचान क्षमताओं का परीक्षण करने के लिए, हमने चैटजीपीटी और क्लाउड को दुनिया भर में लोकप्रिय ऊंची इमारतों की कई छवियां प्रदान कीं। चैटजीपीटी ने उनमें से सभी 20 की सही पहचान की, जबकि क्लॉड 3 कुछ की पहचान करने में विफल रहा, जिनमें काफी लोकप्रिय दुबई की मरीना 101, सियोल में लोटे वर्ल्ड टॉवर और कुआलालंपुर, मलेशिया में मर्डेका 118 इमारत शामिल हैं।
चैटजीपीटी के विपरीत, क्लाउड को अन्य इमारतों की पहचान करने में संघर्ष करना पड़ा, और यदि इमारत अमेरिका या चीन में नहीं थी तो विफलता दर बढ़ गई। हालाँकि, इसे एफिल टॉवर या एम्पायर स्टेट बिल्डिंग के अस्पष्ट संस्करणों की पहचान करने में कोई समस्या नहीं हुई।
चैटजीपीटी स्पष्ट रूप से इसमें बेहतर है, लेकिन क्लॉड 3 को मल्टीमॉडल एआई मॉडल के निर्माण में एंथ्रोपिक का पहला प्रयास मानते हुए, यह एक बुरा प्रयास नहीं था।
हालांकि Google के पाम 2 और उसके बाद जेमिनी जैसे बड़े नाम वाले मॉडल को हमेशा संभावित जीपीटी-4-हत्यारों के रूप में देखा गया है, हमने लगातार यह सुनिश्चित किया है कि कम-ज्ञात क्लाउड एआई को संभवतः यह सम्मान मिलेगा। मार्च 2023 में इसकी प्रारंभिक रिलीज़। कुछ महीनों और लाइन में कई पुनरावृत्तियों के बाद, क्लाउड 3 बिल्कुल GPT-4 किलर जैसा दिख रहा है जैसा हमने अनुमान लगाया था। यदि आप एक भारी चैटबॉट उपयोगकर्ता हैं, लेकिन क्लाउड एआई चैटबॉट की कोशिश नहीं की है, तो आप एक बेहद प्रभावशाली एआई टूल से चूक रहे हैं जो आपकी उत्पादकता को बढ़ा सकता है।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3