در مورد هوش مصنوعی عمومی باید بدانید انسانها همواره به دنبال بنا کردن سازههایی عظیمتر و باشکوهتر بودهاند تا مرزهای توانایی خود را جابجا کنند. امروز این جاهطلبی تاریخی از دنیای سنگ و آجر به سرورهای تاریک و سیلیکونی منتقل شده است. مهندسان امروزی میلیاردها دلار هزینه میکنند تا شبکههای عصبی مصنوعی را وسعت ببخشند به این امید که در نهایت از دل این مدارهای در هم تنیده، یک ذهن کامل متولد شود. این ذهن کامل همان جام مقدس دنیای فناوری است که تمام شرکتهای بزرگ برای رسیدن به آن مسابقه میدهند.
پرسش اساسی این است که آیا صرفا با تزریق دادههای بیشتر و افزودن پردازندههای قویتر میتوانیم به این هدف غایی دست پیدا کنیم؟ در این نوشتار استدلالهای دو گروه بدبین و معتقد را در این زمینه بررسی میکنیم تا ببینیم آینده ماشینهای هوشمند به کدام سمت میرود.
هوش مصنوعی عمومی چیست؟
پیش از ورود به بحث باید دقیقا بدانیم که به دنبال چه چیزی هستیم. هوش مصنوعی عمومی (Artificial General Intelligence) به سیستمی گفته میشود که بتواند هر کار فکری و شناختی انسان را با همان کیفیت یا حتی بهتر انجام دهد. سیستمهای امروزی در کارهای خاصی مثل تولید متن یا کشف الگوهای پزشکی مهارت دارند اما یک سیستم عمومی باید بتواند منطق را درک کند و یک رمان شاهکار بنویسد و همزمان توانایی طراحی یک فضاپیما یا کشف یک قانون فیزیک را داشته باشد.
رسیدن به چنین سطحی یعنی ماشینها بتوانند خودشان تحقیق کنند و حتی نسخههای بعدی خودشان را ارتقا دهند. اینجا دقیقا همان نقطهای است که مسیر تمدن بشری برای همیشه تغییر میکند. اما آیا مسیر فعلی توسعه که بر مبنای توسعه و گسترش (Scaling) مدلهای زبانی استوار است ما را به این مقصد میرساند؟
مطالعه بیشتر: هوش مصنوعی و جهان در سال 2050
بحران دادهها؛ آیا سوخت موتور ماشینها تمام میشود؟
گروه بدبینان بر این باورند که ما تا سال آینده با کمبود شدید دادههای متنی باکیفیت روبرو میشویم. محاسبات نشان میدهد برای ساخت یک ماشین هوشمند که آنقدر توانمند باشد که بتواند یک گزارش علمی و معتبر بنویسد، به حجم عظیمی از پردازش نیاز داریم. این محاسبات ثابت میکند که ما به صد هزار برابر داده بیشتر از آنچه امروز روی اینترنت وجود دارد نیازمندیم. بعضیها فکر میکنند با کمی بهبود در الگوریتمها مشکل حل میشود اما این یک اختلاف نجومی و فلجکننده است.
ایده استفاده از دادههای مصنوعی یا بازی ماشین با خودش نیز چالشهای وحشتناکی دارد. سیستمهای قدیمی توانستند با خودشان بازی کنند چون شرط پیروزی در یک بازی رومیزی کاملا مشخص بود. تفکر انتقادی و استدلال کردن هیچ شرط پیروزی واضحی ندارد. به همین دلیل مدلهای امروزی نمیتوانند استدلالهای خودشان را به درستی ارزیابی و اصلاح کنند.
در جبهه مقابل معتقدان استدلال میکنند که اگر تنها نگرانی ما کمبود داده است باید به این حقیقت شگفتانگیز نگاه کنیم که ما توانستیم با بخش بسیار کوچکی از بودجه شرکتهای بزرگ و با استفاده از دادههای پر از خطای اینترنت یک نسخه اولیه و خیرهکننده از هوش ماشین بسازیم. این سیستمها به شدت تشنه یادگیری هستند. بنابراین اگر تولید دادههای مصنوعی به زودی جواب دهد، نباید تعجب کنیم. همین الان هم سیستمها در پیدا کردن اشتباهات یک متن خیلی بهتر از تولید یک متن جدید عمل میکنند. این فرآیند دقیقا شبیه تکامل اجداد ما است. پستانداران اولیه در ابتدا هوش تحلیلی بالایی نداشتند اما با اختراع زبان یک تکامل فرهنگی شکل گرفت که باعث جهش هوشی آنها شد.
مطالعه بیشتر: مدل هوش مصنوعی چیست؟
مطالعه بیشتر: مدل زبانی بزرگ چیست ؟
آیا بزرگ کردن شبکهها تا الان واقعا جواب داده است؟
مدافعان توسعه سیستمها میگویند عملکرد مدلها در هشت نسل گذشته به طرز دقیقی با افزایش قدرت پردازش بهبود یافته است. مهندسان توانستند عملکرد مدلهای نهایی خود را با استفاده از نسخههایی که ده هزار بار کوچکتر بودند، پیشبینی کنند. وقتی یک روند اینقدر دقیق کار میکند منطقی است فرض کنیم که برای نسلهای بعدی هم کار خواهد کرد و عملکرد را به شدت افزایش میدهد.
اما بدبینان این پیشرفت را یک توهم میدانند. آنها استدلال میکنند که ما نمیخواهیم این سیستمها فقط کلمه بعدی را درست حدس بزنند بلکه ما به دنبال تفکر واقعی هستیم. آزمونهای معروفی که برای سنجش این سیستمها استفاده میشوند بیشتر شبیه نتایج جستجوی گوگل هستند و فقط قدرت حفظ کردن اطلاعات را میسنجند.
آیا اینکه یک سیستم بداند در زمان تولد یک شخص خاص، چه کسی رئیسجمهور آمریکا بوده نشاندهنده یک تفکر عمیق است؟ وقتی پای وظایف طولانیمدت به میان میآید این مدلها به طرز فاجعهباری عمل میکنند. آزمونهای کدنویسی مستقل نشان میدهد امتیاز این سیستمها زیر پنج درصد است. این ماشینها هنوز درک نمیکنند که اگر یک شخص پسر شخص دیگری است پس آن شخص دوم قطعا مادر یا پدر اوست.
مدافعان در پاسخ میگویند توقفهای مقطعی در عملکرد مدلهای جدید شرکتهای رقیب فقط به این دلیل است که آنها هنوز از نظر الگوریتمی به پیشگامان بازار نرسیدهاند. اگر سقف سختی وجود داشت باید خیلی پیشتر از اینها خودش را نشان میداد. ما هنوز جای زیادی برای بزرگتر کردن شبکهها داریم و میتوانیم آنها را دهها هزار بار دیگر توسعه دهیم پیش از آنکه هزینه آن حتی به یک درصد از تولید ناخالص جهانی برسد. پیشرفتهای سختافزاری هم مانند یک ضریب رایگان عمل کرده و عملکرد را چند برابر میکنند.
آیا ماشینها دنیای واقعی را میفهمند؟
مدافعان معتقدند برای پیشبینی دقیق کلمه بعدی، یک سیستم مجبور است تمام قواعد دنیای واقعی را یاد بگیرد. برای پیشبینی یک متن تخصصی زیستشناسی سیستم باید قوانین تکامل را کاملا بفهمد. یک اتفاق حیرتانگیز این است که وقتی شبکهها را با کدهای برنامهنویسی آموزش میدهیم، توانایی استدلال زبانی آنها هم بهتر میشود. این یعنی ماشین توانسته ساختار منطقی مشترک بین زبان انسان و کد کامپیوتر را درک کند. آنها باور دارند که فشردهسازی اطلاعات در این شبکهها در واقع همان درک عمیق از جهان است.
اما بدبینان تاکید دارند که فشردهسازی لزوما مساوی با درک عمیق نیست. یک دانشمند باهوش است چون میتواند نظریه جدیدی خلق کند اما یک سیستم که فقط اطلاعات آن دانشمند را فشرده کرده است؛ هوشمند محسوب نمیشود. آموزش دادن یک نظریه به ماشین با اینکه ماشین بتواند خودش آن نظریه را کشف کند، دو مقوله کاملا متفاوت هستند.
در نهایت باید به مفهوم یادگیری شهودی و تکامل مغز اشاره کنیم. شبکههای عصبی با دیدن اطلاعات زیاد، ناگهان مفاهیم را درک میکنند اما این روش در مقایسه با انسان بسیار کند است. وقتی به یک کودک میگویید خورشید مرکز منظومه شمسی است، او فورا این حقیقت را در ذهن خود جایگزین میکند اما مدلهای فعلی برای درک این موضوع باید هزاران بار آن را در متنهای مختلف ببینند.
با این وجود اگر به تکامل مغز پستانداران نگاه کنیم میبینیم مغز انسان نسبت به ابعادش بسیار بهتر از مغز موجودات کوچکتر توسعه یافته است. این نشان میدهد که طبیعت یک معماری عالی پیدا کرده است. شاید ساختارهای دیجیتالی که امروز استفاده میکنیم، همان ساختار تکاملی دنیای صفر و یک باشند.
آینده این مسیر هنوز در هالهای از ابهام است. اگر به روند سالهای گذشته نگاه کنیم پیشرفتها منطقی به نظر میرسند و توسعه سختافزارها تا حد زیادی ما را به سمت هدف میبرد. با این حال در دنیای واقعی همهچیز بسیار سختتر از تئوریهای روی کاغذ است. اگر تولید دادههای مصنوعی و یادگیری سیستمها با یکدیگر کارساز نباشد، رسیدن به هدف غیرممکن خواهد بود.
میتوان گفت هفتاد درصد احتمال دارد که ترکیب توسعه سختافزارها و الگوریتمهای جدید ما را تا سال دو هزار و چهل به هوش مصنوعی عمومی برساند. در مقابل سی درصد احتمال دارد که گروه بدبین حق داشته باشد و مدلهای زبانی در یک بنبست کامل و ناامیدکننده متوقف شوند. سالهای پیش رو بدون شک یکی از هیجانانگیزترین دورانهای تاریخ بشر برای یافتن پاسخ این معمای بزرگ خواهد بود.
منبع : dwarkesh

