محققان نقاط کور مدل‌های بینایی کامپیوتری در تصاویر حیات وحش را یافتند


“`html

بررسی مدل‌های هوش مصنوعی برای کمک به محققان محیط زیست

تصور کن که بخواهی عکس‌هایی از حدود ۱۱۰۰۰ نوع درخت در آمریکای شمالی بگیری. حتی با این حال، فقط یک بخش کوچکی از میلیون‌ها عکس موجود در دیتاست‌های تصاویر طبیعت را خواهی دید. این مجموعه‌های بزرگ از عکس‌ها — که شامل هر چیزی از پروانه‌ها تا نهنگ‌های گوژپشت می‌شود — ابزاری عالی برای محققان زیست‌محیطی هستند، چون به آن‌ها کمک می‌کنند تا رفتارهای خاص موجودات، شرایط نادر، الگوهای مهاجرت و واکنش‌ها به آلودگی و تغییرات اقلیمی را بهتر درک کنند.

چالش‌ها در استفاده از داده‌های تصویری

با اینکه دیتاست‌های تصاویر طبیعت جامع هستند، اما هنوز به اندازه‌ای که باید، مفید نیستند. جستجو در این پایگاه‌های داده وقت‌گیر است و یافتن تصاویر مرتبط با فرضیه‌ها دشوار است. به همین دلیل، استفاده از دستیارهای پژوهشی خودکار یا مدل‌های هوش مصنوعی چندحالته (VLMs) می‌تواند بهترین گزینه باشد. این مدل‌ها هم بر روی متن و هم تصاویر آموزش دیده‌اند و به همین خاطر جزئیات ظریف‌تری را شناسایی می‌کنند.

آزمون‌ها و نتایج

تحقیقات انجام شده توسط تیمی از MIT، دانشگاه کالج لندن و دیگر موسسات، نشان داد که مدل‌های VLM بزرگ‌تر و پیشرفته‌تر می‌توانند در گاهی اوقات نتایج بهتری برای محققان ارائه دهند. این مدل‌ها در شناسایی محتواهای بصری مانند شناسایی زباله‌ها روی صخره‌ها عملکرد خوبی داشتند، اما در مسائل تخصصی‌تر مثل شناسایی شرایط بیولوژیکی خاص چالش‌هایی داشتند. به عنوان مثال، شناسایی آکسانتیسم در قورباغه‌های سبز به سادگی امکان‌پذیر نبود.

نتایج این تحقیقات نشان می‌دهند که برای پردازش پرسش‌های دشوار، به داده‌های آموزشی خاص‌تر نیاز است. یکی از محققان، ادوارد وندروا، اعتقاد دارد که آشنایی با داده‌های بیشتر و اطلاعاتی می‌تواند روزی VLMs را به دستیاران پژوهشی فوق‌العاده تبدیل کند.

مطلب مرتبط:  ابزار جدید هوش مصنوعی تصاویر واقعی از سیلاب‌های آینده تولید می‌کند

داده‌های INQUIRE

دیتاست INQUIRE شامل پرسش‌هایی است که از نظرات کارشناسان زیست‌شناسی و اقیانوس‌شناسی شکل‌گرفته و بر اساس تصاویر خاصی طراحی شده‌اند. یک تیم از annotators با صرف ۱۸۰ ساعت، تقریباً ۲۰۰۰۰۰ نتیجه را بررسی کردند و ۳۳۰۰۰ جستجو را برچسب‌گذاری کردند.

پژوهشگران همچنین آزمایش کردند که چگونه VLMs می‌توانند تصاویر موجود در بانک اطلاعاتی iNaturalist را بازیابی کنند و در این فرآیند، برخی از مدل‌ها قادر به شناسایی بهتر نبودند. برای مثال، نتایج مربوط به درختان سرخ‌چوب گاهی شامل تصاویری از درختان بدون نشانه‌های سوختگی بود.

آینده و عملکرد بهتر

تحقیقات نشان می‌دهد که حتی مدل‌های بزرگ و قوی هنوز هم در برخی وظایف دچار مشکل هستند. این نتایج در کنفرانس NeurIPS ارائه شد و محققان در حال کار روی سیستم‌های جستجوی جدیدی هستند تا تصویرهای خاص‌تری از حیات وحش را به راحتی پیدا کنند.

داده‌های INQUIRE به محققان کمک می‌کند تا بتوانند جستجوهایی فراتر از سوالات ساده محققان را توسعه دهند و بر روی داده‌های وسیع‌تر تمرکز کنند. پژوهشگران به دنبال آن هستند تا با بهبود الگوریتم‌ها، نتایج بهتری را ارائه دهند.

منبع: news.mit.edu

“`

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *