Claude Opus 4.6؛ مدل جدید آنتروپیک با حافظه یک میلیون توکنی معرفی شد
مدل هوش مصنوعی Claude Opus 4.6 با حافظه یک میلیون توکنی رونمایی شد
شرکت آنتروپیک (Anthropic) از جدیدترین مدل هوش مصنوعی پرچمدار خود با نام Claude Opus 4.6 رونمایی کرد. این مدل نسخه ارتقایافته Opus 4.5 محسوب میشود و برای اولینبار در سری Opus به یک پنجره متن (Context Window) عظیم یک میلیون توکنی مجهز شده است.
این قابلیت درحالحاضر بهصورت نسخه بتا در دسترس قرار دارد و بهگفته سازندگان، Opus 4.6 میتواند اطلاعات مرتبط را در اسناد بسیار حجیم با دقت و اطمینان بیشتری نسبتبه نسلهای قبلی پیدا کند.
- معرفی Claude Opus 4.6 با حافظه یک میلیون توکنی و قابلیت Compaction
- کسب امتیاز ۷۶٪ در تست یافتن اطلاعات پنهان (MRCR v2)
- برتری نسبتبه GPT-5.2 و Opus 4.5 در بنچمارکهای دانشی و استدلال
- ادغام پیشرفته با اکسل، پاورپوینت و تیمهای ایجنت در کدنویسی
- اعمال نرخ پریمیوم برای پرامپتهای بالای ۲۰۰ هزار توکن
حل مشکل «فرسایش محتوا» با فناوری جدید
افزایش پنجره متن معمولاً با مشکلی به نام فرسایش محتوا (Context Rot) همراه است؛ به این معنا که هرچه حجم ورودی بیشتر شود، عملکرد مدل کاهش مییابد.
آنتروپیک اعلام کرده این چالش را با بهبود معماری مدل و معرفی ویژگی جدید Compaction (فشردهسازی) حل کرده است. این قابلیت پیش از پر شدن پنجره، محتواهای قدیمیتر را بهصورت خودکار خلاصه میکند تا اطلاعات کلیدی حفظ شوند.
در تست MRCR v2، Claude Opus 4.6 با یک میلیون توکن ورودی، موفق به کسب امتیاز ۷۶ درصد شد؛ درحالیکه مدل Sonnet 4.5 در شرایط مشابه تنها ۱۸.۵ درصد امتیاز کسب کرده بود.
برتری مطلق نسبتبه GPT-5.2 در بنچمارکها
در بنچمارک GDPval-AA که توانایی انجام کارهای دانشی در حوزههایی مانند مالی و حقوقی را میسنجد، Opus 4.6 به امتیاز Elo برابر با ۱۶۰۶ رسید.
این امتیاز ۱۴۴ واحد بالاتر از GPT-5.2 (با امتیاز ۱۴۶۲) و ۱۹۰ واحد بیشتر از Opus 4.5 است.
همچنین در تست Humanity’s Last Exam این مدل امتیاز ۵۳.۱ درصد را کسب کرد و در بنچمارک کدنویسی Terminal-Bench 2.0 به امتیاز ۶۵.۴ درصد دست یافت.
بااینحال، آنتروپیک اشاره کرده که این مدل در برخی کارهای ساده دچار بیشفکری (Overthinking) میشود که میتواند هزینه و زمان پاسخ را افزایش دهد.
هزینهها و جدول قیمتگذاری
Claude Opus 4.6 هماکنون از طریق پلتفرم claude.ai و API در دسترس است. قیمتگذاری استاندارد به شرح زیر است:
| نوع سرویس | قیمت ورودی (۱M توکن) | قیمت خروجی (۱M توکن) |
|---|---|---|
| استاندارد (زیر ۲۰۰ هزار توکن) | ۵ دلار | ۲۵ دلار |
| پریمیوم (بالای ۲۰۰ هزار توکن) | ۱۰ دلار | ۳۷.۵ دلار |
ویژگیهای جدید API و ادغام با آفیس
آنتروپیک قابلیتهای جدیدی را به API اضافه کرده است. ویژگی تفکر تطبیقی (Adaptive Thinking) به مدل اجازه میدهد تشخیص دهد چه زمانی به استدلال عمیق نیاز دارد.
حداکثر خروجی مدل به ۱۲۸ هزار توکن افزایش یافته و در بخش Claude Code، امکان استفاده از تیمهای ایجنت (Agent Teams) برای انجام موازی وظایف فراهم شده است.
در بخش آفیس، ادغام با اکسل بهبود یافته و پیشنمایش تحقیقاتی ادغام با پاورپوینت ارائه شده است.
آسیبپذیری امنیتی در برابر تزریق پرامپت
با وجود پیشرفتهای عملکردی، Opus 4.6 در برابر تزریق پرامپت غیرمستقیم کمی آسیبپذیرتر از نسل قبلی خود است؛ موضوعی که بهویژه برای کاربردهای ایجنتمحور نگرانکننده محسوب میشود.
آنتروپیک اعلام کرده تمرکز خود را بر تهدیدات شخص ثالث گذاشته و به همین دلیل دیگر شاخص تزریق پرامپت مستقیم را گزارش نمیکند.
بهنظر شما آیا حافظه عظیم و قابلیتهای پیشرفته Claude Opus 4.6 ارزش هزینههای بالاتر آن نسبتبه مدلهای استاندارد را دارد؟
مطالعه بیشتر در اخبار هوش مصنوعی موبایل رستا