محققان MIT روشی کارآمد برای آموزش هوش مصنوعی قابل اعتمادتر ارائه کردند
“`html
آموزش سیستمهای هوش مصنوعی برای تصمیمگیری مؤثر
زمینههای مختلفی از روباتیک تا پزشکی و علوم سیاسی در تلاش هستند تا سیستمهای هوش مصنوعی را برای اتخاذ تصمیمات مؤثر آموزش دهند. به عنوان مثال، استفاده از سیستم AI برای کنترل هوشمند ترافیک در یک شهر شلوغ میتواند به رانندگان کمک کند سریعتر به مقاصد خود برسند و همچنین ایمنی و پایداری را بهبود بخشد.
چالشهای آموزش سیستمهای AI
آموزش یک سیستم AI برای اتخاذ تصمیمات خوب کار آسانی نیست. مدلهای یادگیری تقویتی که پایهگذار این سیستمها هستند اغلب در مواجهه با حتی تغییرات کوچک در وظایفی که آموزش دیدهاند، ناکام میمانند. برای مثال، یک مدل ممکن است در کنترل مجموعهای از تقاطعها با محدودیتهای سرعت یا الگوهای ترافیکی متفاوت دچار مشکل شود.
معرفی الگوریتم جدید
برای بهبود قابلیت اطمینان مدلهای یادگیری تقویتی در وظایف پیچیده، محققان MIT یک الگوریتم جدید و کارآمد برای آموزش آنها را معرفی کردهاند. این الگوریتم بهطور استراتژیک بهترین وظایف را برای آموزش یک عامل AI انتخاب میکند تا بتواند به طور مؤثر در تمام وظایف مربوطه عمل کند.
با تمرکز بر روی تعداد کمتری از تقاطعها که بیشترین تأثیر را بر کارایی الگوریتم دارند، این روش عملکرد را به حداکثر میرساند و هزینه آموزش را پایین نگه میدارد. این محققان دریافتهاند که تکنیک آنها بین پنج تا ۵۰ برابر کارآمدتر از روشهای استاندارد در طیف وسیعی از وظایف شبیهسازی شده است.
تضمین پیشرفت عملکرد
کاتی وو، نویسنده اصلی، میگوید: “ما توانستیم بهبودهای قابل توجهی را با یک الگوریتم بسیار ساده ببینیم.” این الگوریتم به دلیل سادگیاش شانس بیشتری برای پذیرش توسط جامعه دارد، زیرا پیادهسازی و درک آن سادهتر است.
یافتن تعادل میان رویکردها
برای کنترل چراغهای ترافیکی در چندین تقاطع، مهندسان معمولاً بین دو رویکرد اصلی انتخاب میکنند. آنها میتوانند یک الگوریتم جداگانه برای هر تقاطع آموزش دهند یا یک الگوریتم بزرگتر با استفاده از دادههای همه تقاطعها ایجاد کنند.
اما هر یک از این رویکردها معایب خاص خود را دارند. آموزش الگوریتم جداگانه برای هر وظیفه زمانبر و نیازمند دادههای زیاد است، در حالی که آموزش یک الگوریتم برای همه وظایف ممکن است منجر به عملکرد پایینتری شود.
کاهش هزینههای آموزش
محققان این تکنیک را بر روی وظایف شبیهسازی شده آزمایش کردند و دریافتند که این الگوریتم ۵ تا ۵۰ برابر کارآمدتر از روشهای دیگر است. این به این معناست که آنها توانستهاند به همان راهحل با استفاده از دادههای بسیار کمتری دست یابند. با این روش، حتی اضافه کردن مقداری زمان آموزش میتواند منجر به عملکرد بسیار بهتر شود.
پروژههای آینده
در آینده، محققان برنامهریزی میکنند که الگوریتمهای MBTL را برای مسائل پیچیدهتر طراحی کنند و همچنین تمایل دارند رویکرد خود را برای مسائل دنیای واقعی، به ویژه در سیستمهای حملونقل نسل آینده، اعمال کنند.
منبع: news.mit.edu
“`