flapping-airplanes-on-the-future-of-ai-we-want-to-try-really-radically-different-things

در ماه‌های اخیر تعداد زیادی آزمایشگاه هوش مصنوعی با تمرکز بر پژوهش راه‌اندازی شده‌اند و «هواپیماهای بال‌زن» یکی از جالب‌ترین آن‌هاست. این مجموعه که توسط بنیان‌گذاران جوان و کنجکاوش هدایت می‌شود، بر یافتن روش‌هایی برای آموزش هوش مصنوعی با وابستگی کمتر به داده تمرکز دارد. این رویکرد می‌تواند قواعد بازی را در اقتصاد و توانمندی‌های مدل‌های هوش مصنوعی تغییر دهد — و با ۱۸۰ میلیون دلار سرمایه اولیه، فرصت کافی برای آزمودن ایده‌هایشان خواهند داشت.

هفته گذشته با سه هم‌بنیان‌گذار این آزمایشگاه — برادران بن و اَشر اسپکتور و آیدان اسمیت — درباره این‌که چرا اکنون زمان هیجان‌انگیزی برای راه‌اندازی یک آزمایشگاه جدید هوش مصنوعی است و چرا بارها به ایده‌های مرتبط با مغز انسان بازمی‌گردند، گفت‌وگو کردم.

می‌خواهم با این سؤال شروع کنم: چرا حالا؟ آزمایشگاه‌هایی مانند OpenAI و DeepMind هزینه‌های هنگفتی برای مقیاس‌دهی مدل‌هایشان صرف کرده‌اند. رقابت باید دلهره‌آور به نظر برسد. چرا احساس کردید اکنون زمان مناسبی برای راه‌اندازی یک شرکت مدل پایه است؟

بن: کارهای بسیار زیادی برای انجام دادن وجود دارد. پیشرفت‌هایی که در پنج تا ده سال گذشته داشته‌ایم خارق‌العاده بوده‌اند. ما این ابزارها را دوست داریم و هر روز از آن‌ها استفاده می‌کنیم. اما سؤال این است: آیا این تمام کارهایی است که باید انجام شود؟ ما با دقت زیادی به این موضوع فکر کردیم و پاسخ‌مان «نه» بود؛ کارهای بسیار بیشتری باقی مانده است. در مورد ما، فکر کردیم مسئله کارایی داده واقعاً کلید اصلی است. مدل‌های پیشرو امروز با مجموع کل دانش بشری آموزش می‌بینند، در حالی که انسان‌ها آشکارا با بسیار کمتر از آن هم می‌توانند کار کنند. این شکاف بزرگی است و ارزش فهمیدن دارد.

آنچه ما انجام می‌دهیم در واقع یک شرط‌بندی متمرکز بر سه چیز است. اول، این‌که مسئله کارایی داده موضوع مهمی است که باید روی آن کار کرد؛ مسیری تازه و متفاوت که می‌توان در آن پیشرفت کرد. دوم، این‌که این کار از نظر تجاری بسیار ارزشمند خواهد بود و اگر موفق شویم، جهان را به جای بهتری تبدیل می‌کند. و سوم، این‌که تیم مناسب برای این کار، تیمی خلاق و حتی تا حدی کم‌تجربه است که بتواند این مسائل را از پایه دوباره بررسی کند.

آیدان: بله، دقیقاً. ما خودمان را در رقابت مستقیم با دیگر آزمایشگاه‌ها نمی‌بینیم، چون فکر می‌کنیم مجموعه کاملاً متفاوتی از مسائل را بررسی می‌کنیم. اگر به ذهن انسان نگاه کنید، یادگیری‌اش به‌طرز باورنکردنی با ترنسفورمرها متفاوت است — نه لزوماً بهتر، فقط بسیار متفاوت. مدل‌های زبانی بزرگ توانایی شگفت‌انگیزی در حفظ کردن و بهره‌گیری از گستره وسیعی از دانش دارند، اما در یادگیری سریع مهارت‌های جدید چندان خوب نیستند. برای سازگار شدن، به سیلابی از داده نیاز دارند. وقتی به درون مغز نگاه می‌کنید، می‌بینید الگوریتم‌هایی که استفاده می‌کند اساساً با گرادیان نزولی و روش‌های رایج آموزش امروز متفاوت‌اند. به همین دلیل ما در حال ساخت نسل جدیدی از پژوهشگران هستیم تا این مسائل را با نگاهی متفاوت بررسی کنند.

اَشر: این پرسش از نظر علمی بسیار جذاب است: چرا سیستم‌های هوشمندی که ساخته‌ایم تا این حد با شیوه کار انسان‌ها متفاوت‌اند؟ این تفاوت از کجا می‌آید؟ چگونه می‌توانیم از دانش درباره این تفاوت برای ساخت سیستم‌های بهتر استفاده کنیم؟ در عین حال، فکر می‌کنم این مسیر از نظر تجاری هم بسیار قابل‌اجرا و برای جهان مفید است. حوزه‌های مهم زیادی هستند که به‌شدت با محدودیت داده مواجه‌اند، مثل رباتیک یا کشف علمی. حتی در کاربردهای سازمانی، مدلی که یک میلیون برابر کاراتر از نظر داده باشد، احتمالاً یک میلیون برابر راحت‌تر وارد اقتصاد می‌شود. برای ما بسیار هیجان‌انگیز بود که با دیدگاهی تازه به این رویکردها نگاه کنیم و بپرسیم اگر مدلی واقعاً بسیار کاراتر از نظر داده داشته باشیم، چه کارهایی می‌توانیم انجام دهیم؟

این بحث به سؤال بعدی من می‌رسد که به نام «هواپیماهای بال‌زن» هم مربوط است. در هوش مصنوعی یک پرسش فلسفی وجود دارد: تا چه حد می‌خواهیم آنچه انسان‌ها در مغزشان انجام می‌دهند را بازآفرینی کنیم، و تا چه حد می‌خواهیم نوعی هوش انتزاعی بسازیم که مسیر کاملاً متفاوتی را طی می‌کند؟ آیدان پیش‌تر در Neuralink کار کرده که کاملاً بر مغز انسان متمرکز است. آیا شما خود را در حال دنبال کردن دیدگاهی نورومورفیک در هوش مصنوعی می‌بینید؟

آیدان: من به مغز به‌عنوان «اثبات وجود» نگاه می‌کنم. مغز نشان می‌دهد الگوریتم‌های دیگری هم وجود دارند؛ فقط یک ارتدوکسی واحد در کار نیست. مغز محدودیت‌های عجیبی دارد. از نظر سخت‌افزاری، شلیک یک پتانسیل عمل یک میلی‌ثانیه طول می‌کشد، در حالی که کامپیوتر شما در همان زمان عملیات بسیار زیادی انجام می‌دهد. بنابراین احتمالاً رویکردی وجود دارد که هم از مغز بهتر است و هم بسیار متفاوت از ترنسفورمر. ما از برخی کارهای مغز الهام می‌گیریم، اما خود را به آن محدود نمی‌کنیم.

بن: همان‌طور که در نام‌مان هم هست: «هواپیماهای بال‌زن». سیستم‌های فعلی را مثل یک بوئینگ ۷۸۷ بزرگ تصور کنید. ما نمی‌خواهیم پرنده بسازیم — این یک قدم بیش از حد است. ما می‌خواهیم نوعی هواپیمای بال‌زن بسازیم. از دیدگاه من در سیستم‌های کامپیوتری، محدودیت‌های مغز و سیلیکون آن‌قدر متفاوت‌اند که نباید انتظار داشته باشیم سیستم‌ها در نهایت شبیه هم شوند. وقتی بستر فیزیکی این‌قدر متفاوت است و بده‌بستان‌های کاملاً متفاوتی درباره هزینه محاسبه و جابه‌جایی داده وجود دارد، طبیعی است که سیستم‌ها کمی متفاوت باشند. اما متفاوت بودن به این معنا نیست که نباید از مغز الهام بگیریم.

(متن کامل گفت‌وگو بسیار طولانی است؛ در ادامه، ترجمه کامل بخش‌های باقیمانده:)

به نظر می‌رسد اکنون آزادی بیشتری برای آزمایشگاه‌ها وجود دارد تا بر پژوهش تمرکز کنند، نه صرفاً توسعه محصول. این تفاوت بزرگی برای نسل جدید آزمایشگاه‌هاست. برخی کاملاً پژوهش‌محورند و برخی «فعلاً پژوهش‌محور». این بحث در هواپیماهای بال‌زن چگونه است؟

اَشر: ای کاش می‌توانستم یک جدول زمانی بدهم و بگویم سه سال دیگر مسئله پژوهشی را حل می‌کنیم و بعد تجاری‌سازی می‌کنیم. اما نمی‌توانم. ما به دنبال حقیقت هستیم. با این حال، پیشینه تجاری داریم و معتقدیم رساندن ارزش خلق‌شده به دست مردم کار خوبی است. فقط فکر می‌کنیم باید از پژوهش شروع کنیم، چون اگر با قراردادهای بزرگ سازمانی شروع کنیم، حواس‌مان پرت می‌شود.

آیدان: ما می‌خواهیم چیزهایی واقعاً به‌شدت متفاوت را امتحان کنیم، و گاهی ایده‌های رادیکال حتی بدتر از پارادایم فعلی از آب درمی‌آیند. ما در حال کاوش مجموعه‌ای از بده‌بستان‌های متفاوت هستیم.

بن: استارتاپ‌ها وقتی بهترین عملکرد را دارند که روی یک چیز متمرکز باشند. ما اکنون بیشترین ارزش را زمانی خلق می‌کنیم که کاملاً روی حل مسائل بنیادی متمرکز باشیم.

(…)

درباره هزینه‌های محاسباتی: بن توضیح می‌دهد که پژوهش‌های عمیق و رادیکال گاهی paradoxically ارزان‌تر از کارهای افزایشی هستند، چون ایده‌های کاملاً جدید معمولاً در مقیاس کوچک شکست می‌خورند و نیازی به مقیاس‌دهی پرهزینه ندارند. با این حال، مقیاس همچنان ابزار مهمی برای آن‌هاست.

اَشر سه فرضیه درباره آینده مطرح می‌کند:
۱) آموزش با داده کمتر ممکن است مدل‌ها را به سمت «درک عمیق‌تر» سوق دهد، حتی اگر دانش واقعیتی کمتری داشته باشند.
۲) ممکن است آموزش پسینی بسیار کاراتر شود و با چند مثال بتوان مدل را وارد حوزه‌ای جدید کرد.
۳) ممکن است حوزه‌های جدیدی مانند برخی شاخه‌های رباتیک یا کشف علمی باز شوند که امروز به دلیل محدودیت داده عملی نیستند.

بن تأکید می‌کند که جذاب‌ترین چشم‌انداز هوش مصنوعی صرفاً خودکارسازی و کاهش هزینه‌ها نیست، بلکه خلق علم و فناوری‌های جدیدی است که انسان‌ها به تنهایی قادر به ابداع آن‌ها نیستند.

در بحث AGI، اَشر می‌گوید تعریف روشنی از آن ندارد و معتقد نیست در کوتاه‌مدت به «خدایی در جعبه» یا تکینگی برسیم. جهان بزرگ است و کارهای زیادی باقی مانده.

آیدان می‌گوید مغز سقف نیست، بلکه شاید کف باشد؛ سیستمی فیزیکی با محدودیت‌ها که احتمالاً می‌توان از آن فراتر رفت.

در مورد استخدام، آن‌ها به دنبال خلاقیت هستند — افرادی بسیار جوان که هنوز در چارچوب هزاران مقاله «آلوده» نشده‌اند و بتوانند پارادایم را تغییر دهند. تجربه ارزشمند است، اما ترس نداشتن از تغییر پارادایم مهم‌تر است.

درباره تفاوت سیستم‌های آینده، اَشر می‌گوید باید انتظار آینده‌ای «عجیب» را داشته باشیم، با معماری‌های حتی عجیب‌تر و بهبودهایی هزار برابری در کارایی داده. بن اضافه می‌کند که این قابلیت‌های عجیب در نهایت به شکلی قابل‌مصرف ارائه خواهند شد.