تصور کنید هوش مصنوعی پیش از انجام هر کار، بتواند آن را در ذهن خود شبیهسازی کند، از اشتباهات فرضیاش درس بگیرد و آنگاه بهترین مسیر را انتخاب کند؛ همانطور که ما در رؤیاهایمان تمرین میکنیم. این ایده که روزی تنها در داستانهای علمی-تخیلی وجود داشت، امروز به یکی از مهمترین روندهای پژوهشی تبدیل شده: مدلهای جهانی (World Models). یک مدل جهانی، در واقع شبیهساز داخلی و فشردهای از محیط است که هوش مصنوعی آن را در “ذهن” خود میسازد. این مدل به ماشین اجازه میدهد تا قوانین فیزیکی و روابط علت و معلولی حاکم بر دنیایش را یاد بگیرد و بر اساس آن، آینده را پیشبینی کند. این توانایی، یک جهش کوانتومی به سوی خلق عاملان هوشمندتر، کارآمدتر و دارای نوعی “عقل سلیم” است.
کالبدشکافی یک «رویا»: مدل جهانی چگونه کار میکند؟
ایده اصلی مدلهای جهانی اولین بار در مقالهای در سال ۲۰۱۸ توسط دیوید ها (David Ha) و یورگن اشمیدهوبر (Jürgen Schmidhuber) مطرح شد. آنها پیشنهاد کردند که به جای آموزش یک مدل غولپیکر برای انجام همه کارها، میتوان عامل هوشمند را به دو بخش تقسیم کرد: یک “مدل جهانی” بزرگ که محیط را یاد میگیرد و یک “کنترلگر” کوچک که با استفاده از آن مدل، تصمیمگیری میکند. این ساختار معمولاً سه جزء اصلی دارد:
- چشم (Vision): این بخش وظیفه دارد دادههای حسی خام (مثلاً پیکسلهای یک تصویر از یک بازی) را ببیند و آن را به یک نمایش فشرده و معنادار ریاضی (یک بردار) تبدیل کند. این بخش، دنیای پیچیده بیرونی را به زبانی فشرده و قابلدرک برای ماشین ترجمه میکند.
- حافظه (Memory): این قلب پیشبینیکننده مدل جهانی است. این بخش که معمولاً یک شبکه عصبی بازگشتی (RNN) است، با دیدن توالیای از اتفاقات گذشته، یاد میگیرد که اتفاق بعدی چه خواهد بود. این مدل میتواند بدون نیاز به دیدن دنیای واقعی، صرفاً با استفاده از حافظه و درک خود از قوانین، زنجیرهای طولانی از آیندههای محتمل را تولید کند. این فرآیند تولید سناریوهای درونی، همان چیزی است که به صورت استعاری به آن “خواب دیدن” میگوییم.
- کنترلگر (Controller): این یک مدل بسیار کوچک و ساده است که وظیفه تصمیمگیری برای اقدام را برعهده دارد. کنترلگر به جای دیدن مستقیم دنیای واقعی، به خروجیهای «چشم» و «حافظه» نگاه کرده و بهترین اقدام بعدی را برای رسیدن به هدف انتخاب میکند. از آنجایی که این مدل بسیار کوچک است، میتواند به سرعت و به طور بسیار کارآمد، حتی در دل رویاهای تولید شده توسط مدل جهانی، آموزش ببیند.
از نظریه تا واقعیت: غولهای فناوری چگونه مدلهای جهانی میسازند؟
ایده مدلهای جهانی دیگر یک مفهوم نظری نیست. شرکتهای پیشرو در حال ساخت مدلهایی بر پایه این معماری هستند که تواناییهای شگفتانگیزی از خود نشان میدهند.
یکی از برجستهترین نمونهها، مدل جینی (Genie) از گوگل دیپمایند است. جینی یک “محیط تعاملی مولد” است که میتواند از روی تنها یک تصویر یا یک متن، یک بازی پلتفرمر دوبعدی کامل و قابل بازی بسازد! این مدل با تحلیل میلیونها ویدیو از بازیهای اینترنتی، قوانین فیزیک، کنترل شخصیت و طراحی مراحل را به صورت ضمنی یاد گرفته است. وقتی شما یک تصویر به آن میدهید، جینی در ذهن خود یک دنیای کامل با قوانین فیزیکیاش را “خواب میبیند” و به شما اجازه میدهد در آن بازی کنید.
گوگل دیپمایند پا را فراتر گذاشته و عامل هوشمند سیما (SIMA) را نیز معرفی کرده است. سیما یک عامل هوشمند عمومی است که میتواند دستورات به زبان طبیعی (مثلاً “در را باز کن و از پلهها بالا برو”) را در طیف وسیعی از بازیها و محیطهای سهبعدی مختلف اجرا کند، حتی بازیهایی که قبلاً ندیده است. این نشان میدهد که مدل جهانی در حال حرکت به سمت درک عمومیتری از قوانین تعامل در جهانهای مختلف است.
چرا مدلهای جهانی، آینده هوش مصنوعی هستند؟
اهمیت این رویکرد در چندین مزیت کلیدی نهفته است:
- یادگیری بسیار کارآمد: یادگیری در دنیای واقعی، بهویژه برای رباتها، کند، پرهزینه و خطرناک است. اما یادگیری در یک “رویای” شبیهسازی شده که با سرعت هزاران برابر دنیای واقعی اجرا میشود، به مراتب کارآمدتر است.
- برنامهریزی و استدلال بهتر: عاملان هوشمند میتوانند پیش از انجام هر کاری، سناریوهای مختلف را در مدل جهانی خود شبیهسازی کرده، نتایج آنها را ارزیابی کنند و سپس بهترین زنجیره اقدامات را انتخاب نمایند. این یک گام بزرگ به سوی توانایی “فکر کردن به آینده” است.
- راهی به سوی عقل سلیم (Common Sense): با یادگیری قوانین نانوشته فیزیک و روابط علت و معلولی از طریق مشاهده، این مدلها در حال ساختن پایههای نوعی عقل سلیم هستند. آنها میفهمند که یک توپ پس از پرتاب شدن سقوط میکند یا یک کلید در را باز میکند، نه به این دلیل که به آنها گفته شده، بلکه چون این الگو را در مدل جهانی خود آموختهاند.
هوش مصنوعی که خواب میبیند، دیگر استعارهای شاعرانه نیست. مدلهای جهانی در حال تبدیل کردن هوش مصنوعی از یک ابزار پردازش الگو، به یک عامل هوشمند با نوعی “زندگی ذهنی” و درک درونی از جهان هستند. این مدلها به ماشینها اجازه میدهند تا تصور کنند، پیشبینی کنند و برنامهریزی نمایند. این توانایی “رویاپردازی”، سنگ بنای نسل بعدی سیستمهای خودران، رباتهای هوشمند و هوش مصنوعی عمومی است که میتوانند به شکلی عمیقتر و معنادارتر با دنیای ما تعامل داشته باشند.
منابع: