شرکت OpenAI در آوریل ۲۰۲۶ از جدیدترین و هوشمندترین مدل زبانی خود با نام GPT-5.5 رونمایی کرد. این مدل نشاندهنده یک گام بزرگ به سمت روشهای نوین انجام کارها با کامپیوتر است. برخلاف مدلهای پیشین که نیازمند راهنمایی مرحلهبهمرحله بودند، GPT-5.5 به عنوان یک هوش مصنوعی عاملگرا (مطالعه بیشتر: ایجنت هوش مصنوعی چیست؟ ) طراحی شده است که میتواند مقاصد شما را سریعتر درک کند و بخش عمدهای از بار کاری را به تنهایی به دوش بکشد.
هوش مصنوعی عاملگرا؛ عبور از چتباتهای ساده
مدل GPT-5.5 در نوشتن و دیباگ کردن کدها، جستجو و تحقیق آنلاین، تحلیل دادهها (یادگیری عمیق)، ایجاد اسناد و صفحات گسترده و حتی کار با نرمافزارهای مختلف عملکرد خیرهکنندهای دارد. به جای مدیریت دقیق هر مرحله، اکنون میتوانید یک وظیفه چندبخشی و نامنظم را به GPT-5.5 بسپارید و مطمئن باشید که این مدل میتواند برنامهریزی کند، از ابزارها استفاده کند، کار خود را بازبینی نماید و از میان ابهامات عبور کند تا وظیفه به پایان برسد.
این پیشرفتها بهویژه در زمینههای برنامهنویسی عاملمحور، کارهای دانشی و تحقیقات علمی اولیه مشهود است؛ حوزههایی که پیشرفت در آنها به استدلال در بستر متنهای طولانی و اقدام در طول زمان بستگی دارد.
جهش در برنامهنویسی و توسعه نرمافزار
مدل GPT-5.5 قویترین مدل برنامهنویسی OpenAI تا به امروز است. این مدل در بنچمارک Terminal-Bench 2.0 (که گردشکارهای پیچیده خط فرمان، نیاز به برنامهریزی و هماهنگی ابزارها را میسنجد) به دقت بیسابقه ۸۲.۷ درصد دست یافته است. در بنچمارک SWE-Bench Pro نیز با امتیاز ۵۸.۶ درصد، توانسته وظایف بیشتری را به صورت کامل و در یک مرحله نسبت به مدلهای قبلی به انجا برساند.
برنامهنویسانی که نسخه آزمایشی این مدل را بررسی کردهاند، معتقدند GPT-5.5 دارای درک مفهومی بسیار بالایی از سیستمهاست. این مدل میفهمد که چرا یک سیستم از کار افتاده، اصلاحات باید در کجا اعمال شوند و چه بخشهای دیگری از کد تحت تاثیر قرار میگیرند. بسیاری از توسعهدهندگان ارشد گزارش دادهاند که توانایی استدلال و استقلال این مدل به طرز چشمگیری بالاتر از GPT-5.4 و رقبایی مانند Claude Opus 4.7 است.
تحول در کارهای دانشی و تحقیقات علمی
نقاط قوتی که GPT-5.5 را در برنامهنویسی متمایز میکند، آن را برای کارهای روزمره کامپیوتری نیز قدرتمند میسازد. این هوش مصنوعی اکنون میتواند چرخه کامل کارهای دانشی را طی کند: یافتن اطلاعات، درک مفاهیم مهم، استفاده از ابزارها، بررسی خروجیها و تبدیل دادههای خام به محتوای کاربردی.
علاوه بر کارهای اداری، GPT-5.5 در تحقیقات علمی و فنی نیز پیشرفتهای چشمگیری داشته است. محققان معمولاً به چیزی بیش از پاسخ به یک سوال سخت نیاز دارند؛ آنها باید یک ایده را بررسی و شواهد جمعآوری کنند، فرضیهها را آزمایش کرده و نتایج را تفسیر نمایند.
- تحلیل دادههای زیستی: در بنچمارکهای GeneBench و BixBench که بر تحلیل دادههای علمی چندمرحلهای در ژنتیک و بیوانفورماتیک تمرکز دارند، این مدل توانسته با غلبه بر چالشهای دادههای مبهم، آمار پیشتازی را ثبت کند.
- کشفیات ریاضی: در یک نمونه شگفتانگیز، یک نسخه داخلی از GPT-5.5 توانسته یک اثبات ریاضی جدید درباره اعداد رمزی (Ramsey numbers) در حوزه ترکیبیات کشف کند که بعدها توسط سیستمهای تاییدگر ریاضی اثبات شد.
کارایی استنتاج و پردازش بینظیر
با وجود افزایش چشمگیر سطح هوشمندی، GPT-5.5 با همان سرعت و تأخیر (Latency) مدل GPT-5.4 عمل میکند. معمولاً مدلهای بزرگتر و توانمندتر، در پاسخگویی کندتر هستند، اما OpenAI با بهینهسازیهای زیرساختی توانسته این مدل را همزمان سریعتر و هوشمندتر کند. جالب اینجاست که مدل GPT-5.5 خودش در بهینهسازی کدهای زیرساختی برای توزیع بار (Load balancing) و پارتیشنبندی سرورهای NVIDIA GB200 نقش داشته و توانسته سرعت تولید توکنها را تا ۲۰ درصد افزایش دهد!
همچنین، این مدل دارای یک پنجره زمینه ۱ میلیون توکنی است. برای مدیریت این حجم عظیم از اطلاعات، GPT-5.5 از سیستم فشردهسازی حافظه استفاده میکند تا اطلاعات قدیمیتر را فشرده کرده و در عین حال دقت بالا را برای اطلاعات جدیدتر حفظ کند.
امنیت و دسترسی سایبری (Cybersecurity)
با پیشرفت مدلهای هوش مصنوعی، توانایی آنها در کشف و رفع آسیبپذیریهای امنیتی نیز افزایش مییابد. OpenAI مدل GPT-5.5 را با قویترین مجموعههای امنیتی تا به امروز منتشر کرده است.
این شرکت برنامه دسترسی مورد اعتماد برای سایبری (Trusted Access for Cyber) را راهاندازی کرده است. سازمانهایی که مسئولیت امنیت سایبری و دفاع از زیرساختهای حیاتی را بر عهده دارند، میتوانند پس از تایید هویت، به نسخههایی با محدودیت کمتر (مانند GPT-5.4-Cyber و بهزودی GPT-5.5) دسترسی پیدا کنند تا از آن برای محافظت از سیستمهای خود استفاده نمایند.
مقایسه عملکرد GPT-5.5 با سایر مدلها
در جدول زیر، عملکرد مدلهای خانواده GPT-5.5 در مقایسه با نسلهای قبلی و رقبای برجسته در بنچمارکهای معتبر آورده شده است:
| بنچمارک (آزمون) | GPT-5.5 | GPT-5.4 | GPT-5.5 Pro | Claude Opus 4.7 | Gemini 3.1 Pro |
| Terminal-Bench 2.0 (کدنویسی) | ۸۲.۷ درصد | ۷۵.۱ درصد | – | ۶۹.۴ درصد | ۶۸.۵ درصد |
| GDPval (کارهای دانشی/حرفهای) | ۸۴.۹ درصد | ۸۳.۰ درصد | ۸۲.۳ درصد | ۸۰.۳ درصد | ۶۷.۳ درصد |
| BrowseComp (استفاده از ابزار وب) | ۸۴.۴ درصد | ۸۲.۷ درصد | ۹۰.۱ درصد | ۷۹.۳ درصد | ۸۵.۹ درصد |
| OSWorld-Verified (کار با محیط سیستمعامل) | ۷۸.۷ درصد | ۷۵.۰ درصد | – | ۷۸.۰ درصد | – |
| FrontierMath Tier 1–3 (ریاضیات پیشرفته) | ۵۱.۷ درصد | ۴۷.۶ درصد | ۵۲.۴ درصد | ۴۳.۸ درصد | ۳۶.۹ درصد |
| CyberGym (امنیت سایبری) | ۸۱.۸ درصد | ۷۹.۰ درصد | – | ۷۳.۱ درصد | – |
(توجه: خط تیره به معنای عدم انتشار داده برای آن مدل در بنچمارک مربوطه است).
دسترسی و قیمتگذاری
مدل GPT-5.5 هماکنون برای کاربران پلاس (Plus)، پرو (Pro)، تجاری (Business) و سازمانی (Enterprise) در ChatGPT و Codex در دسترس است. همچنین مدل قدرتمندتر GPT-5.5 Pro برای کاربرانی که به بالاترین سطح دقت نیاز دارند (کاربران پرو و تجاری) فعال شده است.
برای توسعهدهندگان در بستر API:
- مدل gpt-5.5: به قیمت ۵ دلار به ازای هر ۱ میلیون توکن ورودی و ۳۰ دلار به ازای هر ۱ میلیون توکن خروجی.
- مدل gpt-5.5-pro: به قیمت ۳۰ دلار به ازای هر ۱ میلیون توکن ورودی و ۱۸۰ دلار به ازای هر ۱ میلیون توکن خروجی.
اگرچه قیمت این مدل نسبت به نسخه ۵.۴ بالاتر است، اما به دلیل بهرهوری بهینهتر در استفاده از توکنها (Token Efficiency) و نیاز کمتر به تلاشهای مجدد، در عمل میتواند برای کارهای پیچیده مقرونبهصرفهتر و سریعتر باشد.
سخن پایانی
رونمایی از GPT-5.5 نشان میدهد که آینده یادگیری ماشین و مدلهای زبانی فراتر از تولید متن خواهد بود و به سمت سیستمهای هوشمند و خودگردان حرکت میکند؛ سیستمهایی که میتوانند مانند یک همکار متخصص، وظایف پیچیده و سنگین را بهصورت کامل از ابتدا تا انتها انجام دهند.
منبع: OpenAI

