deepseek

فهرست مطالب

شرکت چینی دیپ‌سیک (DeepSeek) روز جمعه (۲۴ آوریل ۲۰۲۶)، پیش‌نمایشی از مدل پرچم‌دار خود یعنی V4 را پس از ماه‌ها هیاهو و انتظار کاربران منتشر کرد. این نسخه جدید، نشان‌دهنده یک جهش بزرگ در کارایی و پردازش داده‌هاست. نکته قابل توجه این است که مدل جدید می‌تواند دستورات (پرامپت‌های) بسیار طولانی‌تری را نسبت به نسل قبلی خود پردازش کند؛ دستاوردی که به لطف یک طراحی کاملاً جدید به دست آمده و به مدل کمک می‌کند تا حجم عظیمی از متن را با کارایی بسیار بالاتری مدیریت کند. هوش مصنوعی DeepSeek در نسخه V4 نیز مانند مدل‌های قبلی، کاملاً متن‌باز (Open-source) است؛ به این معنی که برای دانلود، استفاده و اصلاح در دسترس همه قرار دارد. نسخه V4 مهم‌ترین دستاورد این شرکت از زمان معرفی مدل استدلالی R1 در ژانویه ۲۰۲۵ به شمار می‌رود. مدل R1 که با منابع پردازشی محدودی آموزش دیده بود، با عملکرد خیره‌کننده و کارایی بالای خود، صنعت جهانی هوش مصنوعی را شگفت‌زده کرد و دیپ‌سیک را تقریباً یک‌شبه از یک تیم تحقیقاتی ناشناخته، به شناخته‌شده‌ترین شرکت هوش مصنوعی چین تبدیل نمود.

این رویداد به‌سرعت به موجی از عرضه مدل‌های متن‌باز توسط سایر شرکت‌های چینی دامن زد. دیپ‌سیک از آن زمان تا حدودی در سکوت خبری به سر می‌برد، اما در اوایل ماه جاری با اضافه کردن حالت‌های «Expert» و «Flash» به نسخه آنلاین مدل خود، نشانه‌هایی از انتشار قریب‌الوقوع V4 را بروز داد. هرچند این شرکت اکنون به نماد قدرتمند جاه‌طلبی‌های چین در حوزه هوش مصنوعی تبدیل شده است، اما بازگشت بزرگ آن به عرصه مدل‌های پیشرفته پس از ماه‌ها نظارت شدید، خروج برخی از نیروهای کلیدی، تأخیر در عرضه مدل‌های قبلی و فشارهای فزاینده از سوی دولت‌های آمریکا و چین صورت می‌گیرد.

آیا V4 به اندازه R1 در دنیای هوش مصنوعی زلزله به پا خواهد کرد؟ احتمالاً نه به همان شدت، اما در ادامه سه دلیل اصلی که نشان می‌دهد چرا انتشار این نسخه از هوش مصنوعی DeepSeek اهمیت بسیار زیادی دارد را بررسی می‌کنیم.


۱. ثبت رکوردهای جدید در دنیای مدل‌های متن‌باز:

دیپ‌سیک ادعا می‌کند که عملکرد V4، مشابه مسیر موفقیت‌آمیز مدل R1، با برترین مدل‌های بسته و تجاری موجود در بازار رقابت می‌کند، با این تفاوت که هزینه استفاده از آن به‌مراتب کمتر است. این موضوع خبر بسیار مهمی برای توسعه‌دهندگان و شرکت‌هایی محسوب می‌شود که از این فناوری بهره می‌برند؛ زیرا اکنون می‌توانند بدون مواجهه با هزینه‌های سنگین، به قابلیت‌های پیشرفته هوش مصنوعی دسترسی داشته باشند. این مدل جدید در دو نسخه عرضه شده است که هر دو از طریق وب‌سایت و اپلیکیشن دیپ‌سیک در دسترس هستند و دسترسی API نیز برای توسعه‌دهندگان باز است. این دو نسخه عبارتند از:

نسخه V4-Pro: یک مدل بزرگ‌تر که برای کدنویسی و وظایف پیچیده عامل‌محور (Agentic tasks) ساخته شده است.


نسخه V4-Flash: یک نسخه کوچک‌تر که با هدف سرعت بیشتر و هزینه اجرای کمتر طراحی شده است.

هر دو نسخه دارای حالت‌های «استدلالی» هستند که در آن مدل می‌تواند دستور کاربر را به دقت تجزیه و تحلیل کرده و هر مرحله از حل مسئله را به وضوح نشان دهد.

هزینه استفاده از این نسخه‌ها به شدت رقابتی است. برای نسخه V4-Pro، دیپ‌سیک تنها ۱.۷۴ دلار به ازای هر یک میلیون توکن ورودی و ۳.۴۸ دلار برای هر یک میلیون توکن خروجی دریافت می‌کند که در مقایسه با مدل‌های مشابه از OpenAI و Anthropic بسیار ناچیز است. نسخه V4-Flash حتی از این هم مقرون‌به‌صرفه‌تر است؛ با قیمتی حدود ۰.۱۴ دلار برای هر یک میلیون توکن ورودی و ۰.۲۸ دلار برای توکن‌های خروجی. این مدل را می‌توان یکی از ارزان‌ترین مدل‌های پیشرفته در جهان دانست که آن را به گزینه‌ای بسیار جذاب برای توسعه و ساخت اپلیکیشن‌ها تبدیل می‌کند.
از نظر عملکرد، V4 یک جهش عظیم نسبت به R1 محسوب می‌شود. بر اساس نتایج منتشر شده توسط این شرکت، عملکرد هوش مصنوعی DeepSeek در نسخه V4-Pro با برترین مدل‌های متن‌بسته مانند Claude-Opus-4.6 (آنتراپیک)، GPT-5.4 (اوپن‌ای‌آی) و Gemini-3.1 (گوگل) برابری می‌کند. همچنین دیپ‌سیک V4 در مسائل برنامه‌نویسی، ریاضیات و علوم پایه (STEM) در مقایسه با سایر مدل‌های متن‌باز چینی مانند Qwen-3.5 از شرکت علی‌بابا یا GLM-5.1 از شرکت Z.ai، همه رده‌بندی‌ها را پشت سر گذاشته و به یکی از قوی‌ترین مدل‌های متن‌باز تاریخ تبدیل شده است.

دیپ‌سیک همچنین نتایج یک نظرسنجی داخلی از ۸۵ توسعه‌دهنده با‌تجربه را منتشر کرده است که نشان می‌دهد بیش از ۹۰ درصد آن‌ها، V4-Pro را در میان انتخاب‌های برتر خود برای وظایف کدنویسی قرار داده‌اند. این شرکت اعلام کرده که V4 را به طور ویژه برای چارچوب‌های محبوب هوش مصنوعی مانند Claude Code، OpenClaw و CodeBuddy بهینه‌سازی کرده است.

۲. رویکردی نوین و انقلابی در کارایی حافظهیکی از نوآوری‌های کلیدی V4، «پنجره زمینه» (Context Window

یکی از نوآوری‌های کلیدی V4، «پنجره زمینه»  (Context Window) بسیار بزرگ آن است؛ یعنی مقدار متنی که مدل می‌تواند به طور همزمان پردازش کند. هر دو نسخه Pro و Flash اکنون می‌توانند ۱ میلیون توکن را پردازش کنند. برای درک این عظمت، کافی است بدانید این حجم برای گنجاندن کل سه جلد کتاب «ارباب حلقه‌ها» و کتاب «هابیت» به صورت یک‌جا کافی است. دیپ‌سیک اعلام کرده که این اندازه از پنجره زمینه، اکنون پیش‌فرض تمام سرویس‌های این شرکت است و با مدل‌های پیشرفته‌ای چون جمینای و کلود برابری می‌کند.
اما فراتر از این دستاورد، نحوه دستیابی به آن است. V4 تغییرات معماری قابل‌توجهی نسبت به مدل‌های قبلی داشته است؛ به‌ویژه در مکانیزم توجه (Attention Mechanism) که به مدل کمک می‌کند هر بخش از پرامپت را در ارتباط با بقیه متن درک کند. با طولانی‌تر شدن متن، این مقایسه‌ها بسیار پرهزینه و سنگین می‌شوند و مکانیزم توجه را به گلوگاه اصلی مدل‌های با زمینه طولانی تبدیل می‌کنند.

نوآوری هوش مصنوعی DeepSeek در این است که مدل را در انتخابِ آنچه باید به آن توجه کند، گزینش‌گرتر کرد. به جای اینکه تمام متن‌های قبلی با اهمیت یکسان در نظر گرفته شوند، V4 اطلاعات قدیمی‌تر را فشرده می‌کند و تمرکز خود را روی بخش‌هایی می‌گذارد که بیشترین ارتباط را با لحظه حال دارند؛ در حالی که متن‌های جدیدتر را دست‌نخورده نگه می‌دارد تا جزئیات مهم از دست نروند.

این رویکرد هزینه‌های پردازش متون طولانی را به شدت کاهش داده است. در یک پنجره‌ی ۱ میلیون توکنی، نسخه V4-Pro تنها از ۲۷ درصد توان پردازشی و ۱۰ درصد حافظه مدل قبلی (V3.2) استفاده می‌کند. این کاهش در نسخه V4-Flash چشمگیرتر است و تنها به ۱۰ درصد توان پردازشی و ۷ درصد حافظه نیاز دارد. در عمل، این موضوع؛ ساخت ابزارهایی مانند دستیاران برنامه‌نویسی که نیاز به خواندن کل یک پایگاه کد (Codebase) دارند یا نمایندگان تحقیقاتی که اسناد طولانی را تحلیل می‌کنند، بسیار ارزان‌تر و عملی‌تر می‌سازد.

۳. اولین گام‌های سخت برای استقلال از سخت‌افزارهای انویدیا (Nvidia)

نسخهV4 اولین مدل هوش مصنوعی DeepSeek است که برای تراشه‌های بومی چین، مانند سری Ascend هوآوی، بهینه‌سازی شده است. این اقدام، عرضه V4 را به یک آزمون بزرگ تبدیل کرده تا مشخص شود آیا صنعت داخلی هوش مصنوعی چین می‌تواند وابستگی خود را به غول تراشه‌سازی آمریکا یعنی انویدیا کاهش دهد یا خیر.
این اتفاق تا حد زیادی قابل پیش‌بینی بود. گزارش‌ها حاکی از آن است که دیپ‌سیک برخلاف رویه معمول که پیش از عرضه عمومی، دسترسی اولیه را به شرکت‌های تراشه‌ساز می‌دهند تا هماهنگی‌ها انجام شود، هیچ دسترسی اولیه‌ای به شرکت‌های آمریکایی نظیر انویدیا و AMD نداد و این دسترسی منحصراً در اختیار تراشه‌سازان چینی قرار گرفت. شرکت هوآوی تأیید کرده است که ابرگره‌های مبتنی بر سری Ascend 950 از مدل DeepSeek V4 پشتیبانی می‌کنند، بنابراین سازمان‌ها و افرادی که می‌خواهند نسخه اصلاح‌شده خود از این مدل را اجرا کنند، به راحتی می‌توانند از تراشه‌های هوآوی استفاده کنند.

از سال ۲۰۲۲، کنترل‌های صادراتی ایالات متحده، شرکت‌های چینی را از دسترسی به قدرتمندترین تراشه‌های انویدیا محروم کرده است. واکنش پکن به این محدودیت‌ها، تسریع تلاش‌ها برای ایجاد یک زیرساخت کاملاً بومی از تراشه گرفته تا نرم‌افزار و دیتاسنترها بوده است. با این حال، جایگزینی انویدیا تنها به تعویض یک تراشه با تراشه دیگر ختم نمی‌شود. مزیت انویدیا در اکوسیستم نرم‌افزاری آن است که توسعه‌دهندگان سال‌ها برای ساخت آن زمان گذاشته‌اند.
البته شواهد نشان می‌دهد که دیپ‌سیک هنوز به طور کامل از انویدیا عبور نکرده است. گزارش فنی شرکت تأیید می‌کند که از تراشه‌های چینی برای مرحله استنتاج (Inference) – یعنی زمانی که مدل به پرامپت کاربر پاسخ می‌دهد – استفاده می‌شود. با این حال، متخصصان کامپیوتر در دانشگاه چینهوا (Chinhua) بر این باورند که به دلیل عدم ذکر جزئیات در مورد نحوه اجرای ویژگی‌های پیچیده زمینه طولانی روی تراشه‌های بومی، احتمالاً بخش اعظم فرآیند آموزش (Training) این مدل همچنان متکی به تراشه‌های انویدیا بوده است.

دیپ‌سیک همچنین آینده قیمت‌گذاری V4 را به این تغییر سخت‌افزاری گره زده است و اعلام کرده که با عرضه انبوه ابرگره‌های Ascend 950 هوآوی در نیمه دوم سال ۲۰۲۶، قیمت نسخه V4-Pro می‌تواند حتی کاهش چشمگیرتری را تجربه کند. اگر این برنامه‌ریزی موفقیت‌آمیز باشد، V4 می‌تواند یکی از اولین نشانه‌های موفقیت چین در ساخت یک زیرساخت موازی و مستقل هوش مصنوعی در جهان باشد.

منبع : technologyreview

مطالب مرتبط

آخرین مطالب