Claude Opus 4.8: एंथ्रोपिक का सबसे पावरफुल AI मॉडल लॉन्च, मस्क ने भी की तारीफ

एंथ्रोपिक ने लॉन्च किया Claude Opus 4.8। बेहतर कोडिंग, रीजनिंग और सेल्फ-अवेयरनेस के साथ आए इस मॉडल की एलन मस्क ने भी की प्रशंसा। जानें इसके फीचर्स और बेंचमार्क स्कोर।

एआई स्टार्टअप एंथ्रोपिक ने अपना अब तक का सबसे पावरफुल एआई मॉडल क्लाउड ओपस 4.8 (Claude Opus 4.8) लॉन्च कर दिया है. इस नए मॉडल को बेहतर रीजनिंग, कोडिंग और लंबे समय तक बिना इंसानी मदद के काम करने की क्षमता के साथ पेश किया गया है. खास बात यह है कि प्रतिद्वंदी कंपनी एक्सएआई के मालिक एलन मस्क ने भी इसकी खुलकर तारीफ की है. मस्क ने सोशल मीडिया पर एंथ्रोपिक के काम को “शानदार” बताया, जिसके बाद टेक इंडस्ट्री में इसकी खूब चर्चा हो रही है.

एलन मस्क की तारीफ से चर्चा में आया नया मॉडल

क्लाउड ओपस 4.8 के लॉन्च के बाद सबसे ज्यादा चर्चा एलन मस्क की प्रतिक्रिया को लेकर हो रही है. मस्क की कंपनी एक्सएआई का ग्रोक सीधे क्लाउड, चैटजीपीटी और जेमिनी जैसे एआई मॉडल्स से मुकाबला करता है. ऐसे में किसी प्रतिद्वंदी कंपनी के प्रोडक्ट की सार्वजनिक रूप से तारीफ करना काफी कम ही देखने मिलता है. सोशल मीडिया पर मस्क ने एंथ्रोपिक के लिए “शानदार काम” लिखकर अपनी प्रतिक्रिया दी. इसके बाद टेक जगत में यह सवाल भी उठने लगा कि आखिर इस मॉडल में ऐसा क्या खास है, जिसने प्रतिद्वंदी कंपनियों का ध्यान भी अपनी ओर खींच लिया. मस्क की यह प्रतिक्रिया एआई इंडस्ट्री में स्वस्थ प्रतिस्पर्धा का भी संकेत मानी जा रही है.

रीजनिंग, कोडिंग और सेल्फ अवेयरनेस में बड़ा अपग्रेड

एंथ्रोपिक के अनुसार, क्लाउड ओपस 4.8 में कई महत्वपूर्ण सुधार किए गए हैं. कंपनी का दावा है कि यह मॉडल पहले की तुलना में हालात और उपलब्ध जानकारी को बेहतर तरीके से समझकर ज्यादा सटीक फैसले ले सकता है. इसके अलावा इसमें सेल्फ अवेयरनेस की क्षमता भी बेहतर की गई है, जिससे यह अपनी सीमाओं को पहचान सकता है और गलत दावे करने से बचता है. मॉडल को लंबे और जटिल प्रोजेक्ट्स पर बिना प्रदर्शन घटाए काम करने के लिए भी तैयार किया गया है. कंपनी का कहना है कि यह एआई टूल कोडिंग, एनालिसिस और समस्या समाधान जैसे कार्यों में पहले से अधिक सक्षम साबित होगा, जिससे पेशेवर और डेवलपर्स दोनों को फायदा मिलेगा.

बेंचमार्क / क्षमता क्लाउड ओपस 4.8 क्लाउड ओपस 4.7 जीपीटी-5.5 जेमिनी 3.1 प्रो
एजेंटिक कोडिंग (SWE-Bench Pro) 69.20% 64.30% 58.60% 54.20%
एजेंटिक टर्मिनल कोडिंग (Terminal-Bench 2.1) 74.60% 66.10% 78.20% 70.30%
मल्टीडिसिप्लिनरी रीजनिंग (Humanity’s Last Exam – बिना टूल्स) 49.80% 46.90% 41.40% 44.40%
मल्टीडिसिप्लिनरी रीजनिंग (Humanity’s Last Exam – टूल्स के साथ) 57.90% 54.70% 52.20% 51.40%
एजेंटिक कंप्यूटर उपयोग (OSWorld-Verified) 83.40% 82.80% 78.70% 76.20%
नॉलेज वर्क (GDPval-AA) 1890 1753 1769 1314
एजेंटिक फाइनेंशियल एनालिसिस (Finance Agent v2) 53.90% 51.50% 51.80% 43.00%

बेंचमार्क टेस्ट में शानदार प्रदर्शन, कीमत भी कम

क्लाउड ओपस 4.8 की एक बड़ी खासियत इसकी कीमत भी है. जहां आमतौर पर कंपनियां नए और अधिक सक्षम एआई मॉडल्स को महंगे सब्सक्रिप्शन प्लान के साथ पेश करती हैं, वहीं एंथ्रोपिक ने इसे पुराने वर्जन की कीमत पर ही उपलब्ध कराया है. कंपनी द्वारा शेयर किए गए बेंचमार्क आंकड़ों के अनुसार, एसडब्ल्यूई-बेंच प्रो टेस्ट में मॉडल ने 69.2 प्रतिशत स्कोर हासिल किया. वहीं ह्यूमैनिटीज लास्ट एग्जाम में इसे 57.9 प्रतिशत और फाइनेंशियल एनालिसिस टेस्ट में 53.9 प्रतिशत अंक मिले. कंपनी का दावा है कि यह मॉडल सवाल का जवाब नहीं होने पर अनुमान लगाने के बजाय अपनी अनिश्चितता को स्वीकार करता है. यही वजह है कि इसे अधिक भरोसेमंद एआई मॉडल के रूप में देखा जा रहा है.

Leave A Reply

Your email address will not be published.