گاردین با انتشار مقالهای به یافته جدید یک تیم پژوهش دانشگاه آستین در تگزاس پرداخته است که ترجمهای از آن را در ادامه میخوانید.
در یک نوآوری بیسابقه، رمزگشایی متکی به هوش مصنوعی توانست با ترجمه فعالیت مغز به سلسله جملات، اجازه دهد افکار فرد خوانده شود و به رشته سخن درآید.
این "رمزگشا" نشان داد میتواند هنگامی که افراد به داستانی گوش میکنند یا در سکوت خیالپردازی میکنند با دقتی فوقالعاده و با کمک اسکن داده افامآرآی (تصویربرداری تشخیص مغناطیسی)، افکار را به شکل متن بازسازی کند.
سیستمهای پیشین رمزگشایی زبان نیازمند کاشت ایمپلنت با جراحی بودند اما این راه نیاز به هیچ جراحیای ندارد و به کمک بیمارانی خواهد آمد که به دلیل سکته یا بیماری نورون حرکتی، در برقراری ارتباط مشکل دارند.
دکتر الکساندر هوث، دانشمند علوم اعصاب در دانشگاه تگزاس آستین گفت که او و تیمش ۱۵ سال بر روی این ابداع کار کردهاند و این که این رمزگشا اینگونه خوب کار میکند، شگفتانگیز و هیجانآور است.
نوآوری جدید در ابداع این رمزگشا بر محدودیت اساسی افامآرآی پیروز شده است؛ چون افامآرآی در حالی که میتواند فعالیت مغزی را در قسمت خاصی از مغز، با وضوحی فوقالعاده بالا ترسیم کند اما این موضوع زمان میبرد که در حقیقت دنبال کردن افکار و همان زمان وقوع آن را غیرممکن میکند.
این تاخیر به دلیل فاصله بین زمانی است که اسکن افامآرآی جریان خون را برای پاسخ به فعالیت مغزی اندازه میگیرد که بالا میرود و به اوج میرسد و در ۱۰ ثانیه به شماره پایه میرسد؛ به عبارت دیگر حتی قدرتمندترین ابزار اندازهگیری نمیتوانسته این مشکل را حل کند و علاوه بر این، چنین فرآیندی «پر سر و صدا» و کند هم بوده است.
چنین محدودیت دستوپاگیری، توانایی برای تفسیر فعالیت مغز در پاسخ به گفتار طبیعی را هم مختل میکرد چون طی چند ثانیه آمیزهای درهم از اطلاعات را تحویل میداد.
پیشرفت الگوهای زبانی بزرگ -مثلا فنآوریهایی مثل چتجیپیتی- هم در به نتیجه رسیدن چنین نوآوریای موثر بوده است.
چنین مدلهایی قادرند معنای زبان را در قالب اعداد ارائه دهند و به این شکل دانشمندان را قادر سازند تا ببینند کدام الگوی فعالیتهای عصبی با رشته کلام و معنای خاص کلام مرتبط است تا این که فعالیت مغز (کلمات) را تحتاللفظی و واژه به واژه معنا کنند.
در فرآیند ابداع این نوآوری از سه داوطلب خواسته شد تا هر کدام ۱۶ ساعت در اسکنر دراز بکشند و به پادکستی گوش کنند. سپس به رمزگشا دستور داده شد تا فعالیت ذهنی این افراد را با استفاده از یک مدل زبانی بزرگ و با معنا، مرتبط کند و تطابق دهد.
بعدتر همان داوطلبان در حالی که به داستان جدیدی گوش یا به روایت داستانی فکر میکردند، دوباره اسکن شدند و از رمزگشا استفاده شد تا از فعالیت مغزی، متن تولید و استخراج کند. تقریبا در نیمی از زمان، متن دقیقا یا نزدیک به معنا و مقصود کلمات اصلی در ذهن داوطلبان بود.
هوث در این باره گفت که سیستم ابداعی او و تیمش در سطح افکار و معانی کار میکند و به این دلیل است که کلمات (تحتاللفظی) خروجی آن نیست بلکه خروجی لب کلام است.
در این پژوهش، همچنین از داوطلبان خواسته شد تا در همان حین که در اسکنر دراز کشیده بودند چند ویدیوی صامت تماشا کنند و سپس رمزگشا قادر بود تا از فعالیت مغزی آنها استفاده کند و محتوایی را که در ویدیو بود، به دقت توصیف کند.
هوث گفت که اسکنر گاهی درباره بخشهایی از زبان، مثلا ضمایر گیج میشده و ضمایر مونث و مذکر (در زبان انگلیسی) و گاهی اول شخص و سوم شخص را قاطی میکرده است.
هوث افزود که نمیداند چنین مشکلی تا چه اندازه دردسر ایجاد خواهد کرد.
جری تنگ، دانشجوی دانشگاه آستین تگزاس و عضوی از تیم پژوهش هوث هم درباره این یافته گفت که تیم تحقیقات میداند ممکن است از چنین ابزاری برای مقاصد بدی استفاده شود و این چیزی است که در طراحی چنین نوآوریای در نظر گرفته شده و پیامدهای اینچنینی این ابداع برای تیم پژوهش مسالهای جدی است.