شرکت چینی دیپسیک (DeepSeek) روز جمعه (۲۴ آوریل ۲۰۲۶)، پیشنمایشی از مدل پرچمدار خود یعنی V4 را پس از ماهها هیاهو و انتظار کاربران منتشر کرد. این نسخه جدید، نشاندهنده یک جهش بزرگ در کارایی و پردازش دادههاست. نکته قابل توجه این است که مدل جدید میتواند دستورات (پرامپتهای) بسیار طولانیتری را نسبت به نسل قبلی خود پردازش کند؛ دستاوردی که به لطف یک طراحی کاملاً جدید به دست آمده و به مدل کمک میکند تا حجم عظیمی از متن را با کارایی بسیار بالاتری مدیریت کند. هوش مصنوعی DeepSeek در نسخه V4 نیز مانند مدلهای قبلی، کاملاً متنباز (Open-source) است؛ به این معنی که برای دانلود، استفاده و اصلاح در دسترس همه قرار دارد. نسخه V4 مهمترین دستاورد این شرکت از زمان معرفی مدل استدلالی R1 در ژانویه ۲۰۲۵ به شمار میرود. مدل R1 که با منابع پردازشی محدودی آموزش دیده بود، با عملکرد خیرهکننده و کارایی بالای خود، صنعت جهانی هوش مصنوعی را شگفتزده کرد و دیپسیک را تقریباً یکشبه از یک تیم تحقیقاتی ناشناخته، به شناختهشدهترین شرکت هوش مصنوعی چین تبدیل نمود.
این رویداد بهسرعت به موجی از عرضه مدلهای متنباز توسط سایر شرکتهای چینی دامن زد. دیپسیک از آن زمان تا حدودی در سکوت خبری به سر میبرد، اما در اوایل ماه جاری با اضافه کردن حالتهای «Expert» و «Flash» به نسخه آنلاین مدل خود، نشانههایی از انتشار قریبالوقوع V4 را بروز داد. هرچند این شرکت اکنون به نماد قدرتمند جاهطلبیهای چین در حوزه هوش مصنوعی تبدیل شده است، اما بازگشت بزرگ آن به عرصه مدلهای پیشرفته پس از ماهها نظارت شدید، خروج برخی از نیروهای کلیدی، تأخیر در عرضه مدلهای قبلی و فشارهای فزاینده از سوی دولتهای آمریکا و چین صورت میگیرد.
آیا V4 به اندازه R1 در دنیای هوش مصنوعی زلزله به پا خواهد کرد؟ احتمالاً نه به همان شدت، اما در ادامه سه دلیل اصلی که نشان میدهد چرا انتشار این نسخه از هوش مصنوعی DeepSeek اهمیت بسیار زیادی دارد را بررسی میکنیم.
۱. ثبت رکوردهای جدید در دنیای مدلهای متنباز:
دیپسیک ادعا میکند که عملکرد V4، مشابه مسیر موفقیتآمیز مدل R1، با برترین مدلهای بسته و تجاری موجود در بازار رقابت میکند، با این تفاوت که هزینه استفاده از آن بهمراتب کمتر است. این موضوع خبر بسیار مهمی برای توسعهدهندگان و شرکتهایی محسوب میشود که از این فناوری بهره میبرند؛ زیرا اکنون میتوانند بدون مواجهه با هزینههای سنگین، به قابلیتهای پیشرفته هوش مصنوعی دسترسی داشته باشند. این مدل جدید در دو نسخه عرضه شده است که هر دو از طریق وبسایت و اپلیکیشن دیپسیک در دسترس هستند و دسترسی API نیز برای توسعهدهندگان باز است. این دو نسخه عبارتند از:
نسخه V4-Pro: یک مدل بزرگتر که برای کدنویسی و وظایف پیچیده عاملمحور (Agentic tasks) ساخته شده است.
نسخه V4-Flash: یک نسخه کوچکتر که با هدف سرعت بیشتر و هزینه اجرای کمتر طراحی شده است.
هر دو نسخه دارای حالتهای «استدلالی» هستند که در آن مدل میتواند دستور کاربر را به دقت تجزیه و تحلیل کرده و هر مرحله از حل مسئله را به وضوح نشان دهد.
هزینه استفاده از این نسخهها به شدت رقابتی است. برای نسخه V4-Pro، دیپسیک تنها ۱.۷۴ دلار به ازای هر یک میلیون توکن ورودی و ۳.۴۸ دلار برای هر یک میلیون توکن خروجی دریافت میکند که در مقایسه با مدلهای مشابه از OpenAI و Anthropic بسیار ناچیز است. نسخه V4-Flash حتی از این هم مقرونبهصرفهتر است؛ با قیمتی حدود ۰.۱۴ دلار برای هر یک میلیون توکن ورودی و ۰.۲۸ دلار برای توکنهای خروجی. این مدل را میتوان یکی از ارزانترین مدلهای پیشرفته در جهان دانست که آن را به گزینهای بسیار جذاب برای توسعه و ساخت اپلیکیشنها تبدیل میکند.
از نظر عملکرد، V4 یک جهش عظیم نسبت به R1 محسوب میشود. بر اساس نتایج منتشر شده توسط این شرکت، عملکرد هوش مصنوعی DeepSeek در نسخه V4-Pro با برترین مدلهای متنبسته مانند Claude-Opus-4.6 (آنتراپیک)، GPT-5.4 (اوپنایآی) و Gemini-3.1 (گوگل) برابری میکند. همچنین دیپسیک V4 در مسائل برنامهنویسی، ریاضیات و علوم پایه (STEM) در مقایسه با سایر مدلهای متنباز چینی مانند Qwen-3.5 از شرکت علیبابا یا GLM-5.1 از شرکت Z.ai، همه ردهبندیها را پشت سر گذاشته و به یکی از قویترین مدلهای متنباز تاریخ تبدیل شده است.
دیپسیک همچنین نتایج یک نظرسنجی داخلی از ۸۵ توسعهدهنده باتجربه را منتشر کرده است که نشان میدهد بیش از ۹۰ درصد آنها، V4-Pro را در میان انتخابهای برتر خود برای وظایف کدنویسی قرار دادهاند. این شرکت اعلام کرده که V4 را به طور ویژه برای چارچوبهای محبوب هوش مصنوعی مانند Claude Code، OpenClaw و CodeBuddy بهینهسازی کرده است.
۲. رویکردی نوین و انقلابی در کارایی حافظهیکی از نوآوریهای کلیدی V4، «پنجره زمینه» (Context Window
یکی از نوآوریهای کلیدی V4، «پنجره زمینه» (Context Window) بسیار بزرگ آن است؛ یعنی مقدار متنی که مدل میتواند به طور همزمان پردازش کند. هر دو نسخه Pro و Flash اکنون میتوانند ۱ میلیون توکن را پردازش کنند. برای درک این عظمت، کافی است بدانید این حجم برای گنجاندن کل سه جلد کتاب «ارباب حلقهها» و کتاب «هابیت» به صورت یکجا کافی است. دیپسیک اعلام کرده که این اندازه از پنجره زمینه، اکنون پیشفرض تمام سرویسهای این شرکت است و با مدلهای پیشرفتهای چون جمینای و کلود برابری میکند.
اما فراتر از این دستاورد، نحوه دستیابی به آن است. V4 تغییرات معماری قابلتوجهی نسبت به مدلهای قبلی داشته است؛ بهویژه در مکانیزم توجه (Attention Mechanism) که به مدل کمک میکند هر بخش از پرامپت را در ارتباط با بقیه متن درک کند. با طولانیتر شدن متن، این مقایسهها بسیار پرهزینه و سنگین میشوند و مکانیزم توجه را به گلوگاه اصلی مدلهای با زمینه طولانی تبدیل میکنند.
نوآوری هوش مصنوعی DeepSeek در این است که مدل را در انتخابِ آنچه باید به آن توجه کند، گزینشگرتر کرد. به جای اینکه تمام متنهای قبلی با اهمیت یکسان در نظر گرفته شوند، V4 اطلاعات قدیمیتر را فشرده میکند و تمرکز خود را روی بخشهایی میگذارد که بیشترین ارتباط را با لحظه حال دارند؛ در حالی که متنهای جدیدتر را دستنخورده نگه میدارد تا جزئیات مهم از دست نروند.
این رویکرد هزینههای پردازش متون طولانی را به شدت کاهش داده است. در یک پنجرهی ۱ میلیون توکنی، نسخه V4-Pro تنها از ۲۷ درصد توان پردازشی و ۱۰ درصد حافظه مدل قبلی (V3.2) استفاده میکند. این کاهش در نسخه V4-Flash چشمگیرتر است و تنها به ۱۰ درصد توان پردازشی و ۷ درصد حافظه نیاز دارد. در عمل، این موضوع؛ ساخت ابزارهایی مانند دستیاران برنامهنویسی که نیاز به خواندن کل یک پایگاه کد (Codebase) دارند یا نمایندگان تحقیقاتی که اسناد طولانی را تحلیل میکنند، بسیار ارزانتر و عملیتر میسازد.
۳. اولین گامهای سخت برای استقلال از سختافزارهای انویدیا (Nvidia)
نسخهV4 اولین مدل هوش مصنوعی DeepSeek است که برای تراشههای بومی چین، مانند سری Ascend هوآوی، بهینهسازی شده است. این اقدام، عرضه V4 را به یک آزمون بزرگ تبدیل کرده تا مشخص شود آیا صنعت داخلی هوش مصنوعی چین میتواند وابستگی خود را به غول تراشهسازی آمریکا یعنی انویدیا کاهش دهد یا خیر.
این اتفاق تا حد زیادی قابل پیشبینی بود. گزارشها حاکی از آن است که دیپسیک برخلاف رویه معمول که پیش از عرضه عمومی، دسترسی اولیه را به شرکتهای تراشهساز میدهند تا هماهنگیها انجام شود، هیچ دسترسی اولیهای به شرکتهای آمریکایی نظیر انویدیا و AMD نداد و این دسترسی منحصراً در اختیار تراشهسازان چینی قرار گرفت. شرکت هوآوی تأیید کرده است که ابرگرههای مبتنی بر سری Ascend 950 از مدل DeepSeek V4 پشتیبانی میکنند، بنابراین سازمانها و افرادی که میخواهند نسخه اصلاحشده خود از این مدل را اجرا کنند، به راحتی میتوانند از تراشههای هوآوی استفاده کنند.
از سال ۲۰۲۲، کنترلهای صادراتی ایالات متحده، شرکتهای چینی را از دسترسی به قدرتمندترین تراشههای انویدیا محروم کرده است. واکنش پکن به این محدودیتها، تسریع تلاشها برای ایجاد یک زیرساخت کاملاً بومی از تراشه گرفته تا نرمافزار و دیتاسنترها بوده است. با این حال، جایگزینی انویدیا تنها به تعویض یک تراشه با تراشه دیگر ختم نمیشود. مزیت انویدیا در اکوسیستم نرمافزاری آن است که توسعهدهندگان سالها برای ساخت آن زمان گذاشتهاند.
البته شواهد نشان میدهد که دیپسیک هنوز به طور کامل از انویدیا عبور نکرده است. گزارش فنی شرکت تأیید میکند که از تراشههای چینی برای مرحله استنتاج (Inference) – یعنی زمانی که مدل به پرامپت کاربر پاسخ میدهد – استفاده میشود. با این حال، متخصصان کامپیوتر در دانشگاه چینهوا (Chinhua) بر این باورند که به دلیل عدم ذکر جزئیات در مورد نحوه اجرای ویژگیهای پیچیده زمینه طولانی روی تراشههای بومی، احتمالاً بخش اعظم فرآیند آموزش (Training) این مدل همچنان متکی به تراشههای انویدیا بوده است.
دیپسیک همچنین آینده قیمتگذاری V4 را به این تغییر سختافزاری گره زده است و اعلام کرده که با عرضه انبوه ابرگرههای Ascend 950 هوآوی در نیمه دوم سال ۲۰۲۶، قیمت نسخه V4-Pro میتواند حتی کاهش چشمگیرتری را تجربه کند. اگر این برنامهریزی موفقیتآمیز باشد، V4 میتواند یکی از اولین نشانههای موفقیت چین در ساخت یک زیرساخت موازی و مستقل هوش مصنوعی در جهان باشد.
منبع : technologyreview

