تکنولوژی, هوش مصنوعی

Claude Opus 4.6؛ مدل جدید آنتروپیک با حافظه یک میلیون توکنی معرفی شد

opus 46 claude

مدل هوش مصنوعی Claude Opus 4.6 با حافظه یک میلیون توکنی رونمایی شد

شرکت آنتروپیک (Anthropic) از جدیدترین مدل هوش مصنوعی پرچم‌دار خود با نام Claude Opus 4.6 رونمایی کرد. این مدل نسخه ارتقایافته Opus 4.5 محسوب می‌شود و برای اولین‌بار در سری Opus به یک پنجره متن (Context Window) عظیم یک میلیون توکنی مجهز شده است.

این قابلیت درحال‌حاضر به‌صورت نسخه بتا در دسترس قرار دارد و به‌گفته سازندگان، Opus 4.6 می‌تواند اطلاعات مرتبط را در اسناد بسیار حجیم با دقت و اطمینان بیشتری نسبت‌به نسل‌های قبلی پیدا کند.

خلاصه در یک نگاه:
  • معرفی Claude Opus 4.6 با حافظه یک میلیون توکنی و قابلیت Compaction
  • کسب امتیاز ۷۶٪ در تست یافتن اطلاعات پنهان (MRCR v2)
  • برتری نسبت‌به GPT-5.2 و Opus 4.5 در بنچمارک‌های دانشی و استدلال
  • ادغام پیشرفته با اکسل، پاورپوینت و تیم‌های ایجنت در کدنویسی
  • اعمال نرخ پریمیوم برای پرامپت‌های بالای ۲۰۰ هزار توکن

حل مشکل «فرسایش محتوا» با فناوری جدید

افزایش پنجره متن معمولاً با مشکلی به نام فرسایش محتوا (Context Rot) همراه است؛ به این معنا که هرچه حجم ورودی بیشتر شود، عملکرد مدل کاهش می‌یابد.

آنتروپیک اعلام کرده این چالش را با بهبود معماری مدل و معرفی ویژگی جدید Compaction (فشرده‌سازی) حل کرده است. این قابلیت پیش از پر شدن پنجره، محتواهای قدیمی‌تر را به‌صورت خودکار خلاصه می‌کند تا اطلاعات کلیدی حفظ شوند.

در تست MRCR v2، Claude Opus 4.6 با یک میلیون توکن ورودی، موفق به کسب امتیاز ۷۶ درصد شد؛ درحالی‌که مدل Sonnet 4.5 در شرایط مشابه تنها ۱۸.۵ درصد امتیاز کسب کرده بود.

برتری مطلق نسبت‌به GPT-5.2 در بنچمارک‌ها

در بنچمارک GDPval-AA که توانایی انجام کارهای دانشی در حوزه‌هایی مانند مالی و حقوقی را می‌سنجد، Opus 4.6 به امتیاز Elo برابر با ۱۶۰۶ رسید.

این امتیاز ۱۴۴ واحد بالاتر از GPT-5.2 (با امتیاز ۱۴۶۲) و ۱۹۰ واحد بیشتر از Opus 4.5 است.

همچنین در تست Humanity’s Last Exam این مدل امتیاز ۵۳.۱ درصد را کسب کرد و در بنچمارک کدنویسی Terminal-Bench 2.0 به امتیاز ۶۵.۴ درصد دست یافت.

بااین‌حال، آنتروپیک اشاره کرده که این مدل در برخی کارهای ساده دچار بیش‌فکری (Overthinking) می‌شود که می‌تواند هزینه و زمان پاسخ را افزایش دهد.

بنچمارک‌های Claude Opus 4.6 در مقایسه با رقبا

هزینه‌ها و جدول قیمت‌گذاری

Claude Opus 4.6 هم‌اکنون از طریق پلتفرم claude.ai و API در دسترس است. قیمت‌گذاری استاندارد به شرح زیر است:

نوع سرویس قیمت ورودی (۱M توکن) قیمت خروجی (۱M توکن)
استاندارد (زیر ۲۰۰ هزار توکن) ۵ دلار ۲۵ دلار
پریمیوم (بالای ۲۰۰ هزار توکن) ۱۰ دلار ۳۷.۵ دلار

ویژگی‌های جدید API و ادغام با آفیس

آنتروپیک قابلیت‌های جدیدی را به API اضافه کرده است. ویژگی تفکر تطبیقی (Adaptive Thinking) به مدل اجازه می‌دهد تشخیص دهد چه زمانی به استدلال عمیق نیاز دارد.

حداکثر خروجی مدل به ۱۲۸ هزار توکن افزایش یافته و در بخش Claude Code، امکان استفاده از تیم‌های ایجنت (Agent Teams) برای انجام موازی وظایف فراهم شده است.

در بخش آفیس، ادغام با اکسل بهبود یافته و پیش‌نمایش تحقیقاتی ادغام با پاورپوینت ارائه شده است.

ادغام Claude Opus 4.6 با پاورپوینت

آسیب‌پذیری امنیتی در برابر تزریق پرامپت

با وجود پیشرفت‌های عملکردی، Opus 4.6 در برابر تزریق پرامپت غیرمستقیم کمی آسیب‌پذیرتر از نسل قبلی خود است؛ موضوعی که به‌ویژه برای کاربردهای ایجنت‌محور نگران‌کننده محسوب می‌شود.

آنتروپیک اعلام کرده تمرکز خود را بر تهدیدات شخص ثالث گذاشته و به همین دلیل دیگر شاخص تزریق پرامپت مستقیم را گزارش نمی‌کند.

آسیب‌پذیری Claude Opus 4.6 در برابر تزریق پرامپت

به‌نظر شما آیا حافظه عظیم و قابلیت‌های پیشرفته Claude Opus 4.6 ارزش هزینه‌های بالاتر آن نسبت‌به مدل‌های استاندارد را دارد؟

مطالعه بیشتر در اخبار هوش مصنوعی موبایل رستا

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *