ژنراتور ویدیویی گوگل به مشتریان بیشتری دسترسی پیدا میکند
گوگل در حال گسترش خدمات تولید ویدیوی خود به مشتریان جدید است.
در روز سهشنبه، گوگل اعلام کرد که مدل هوش مصنوعی Veo، که میتواند کلیپهای ویدیویی کوتاه از تصاویر و ورودیها تولید کند، به صورت خصوصی برای مشتریان پلتفرم توسعه هوش مصنوعی Vertex AI در دسترس خواهد بود.
این راهاندازی باعث میشود که مشتریانی مانند Quora بتوانند Veo را به پلتفرم چتبات Poe خود اضافه کنند و Mondelez International، مالک برند Oreo، با همکاری شرکای بازاریابی خود محتوای تبلیغاتی تولید کند.
تولیدکننده اصلی
مدل Veo که در ماه آوریل معرفی شد، قادر است کلیپهای 1080p از حیوانات، اشیاء و افراد تا شش ثانیه با 24 یا 30 فریم در ثانیه تولید کند. این مدل میتواند سبکهای بصری و سینمایی مختلفی را شبیهسازی کند.
وarren Barkley، مدیر ارشد مدیریت محصولات در گوگل کلود، گفت: «حرفهای بودن» یکی از دلایل تاخیر در ارائه API بود. اما اکنون Veo شاهد بهبودهایی برای مشتریان تجاری است.
Veo توانایی خوبی در درک جلوههای ویژه و برخی اصول فیزیک دارد و میتواند ویدیوها را به پروژههای بزرگتری متصل کند. این امکانات Veo را در رقابت با مدلهای برتر تولید ویدیو قرار میدهد.
اما Veo هنوز کامل نیست و ممکن است در ویدیوها اشیاء ناپدید و دوباره ظاهر شوند. همچنین گاهی فیزیک تصاویر به درستی رعایت نمیشود.
آموزش و خطرات
Veo با استفاده از حجم زیادی از ویدیوها آموزش دیده است. در حالی که گوگل نمیگوید دقیقاً از کجا دادهها برای آموزش این مدلها را به دست میآورد، Barkley اشاره کرد که این مدل ممکن است بر اساس محتوای یوتیوب آموزش دیده باشد.
گوگل مدعی است که این مدلها بر اساس دادههای عمومی آموزش دیدهاند و استفاده از این دادهها را به عنوان «استفاده عادلانه» معرفی میکند. اما این به این معنا نیست که حقوق مؤلفان و خالقان نادیده گرفته شود.
در حالی که گوگل ابزارهایی برای جلوگیری از جمعآوری دادهها توسط رباتهای خود دارد، هیچ مکانیزمی برای حذف آثار از مجموعههای آموزشی موجود ارائه نمیدهد. این میتواند مشکلات قانونی برای کاربران تولیدکنندگان ایجاد کند.
Veo در همه جا
گوگل به تدریج Veo را به بیشتر برنامهها و خدمات خود اضافه میکند. این مدل اخیراً به برنامه آزمایشی Google Labs وارد شده و در YouTube Shorts نیز ادغام شده است.
با وجود ریسکهای فیکسازی، گوگل به استفاده از فناوری علامتگذاری SynthID برای قرار دادن نشانههای نامرئی در ویدیوهای تولیدی Veo اشاره کرده است. این در حالی است که این فناوری هنوز یک راه حل کاملاً مطمئن نیست.
گوگل به طور محتاطانه و مرحله به مرحله در جهت توسعه Veo عمل میکند و از ارائه زمان مشخصی برای دسترسی عمومی به آن خودداری کرده است.
در بیانیهای جداگانه، گوگل اعلام کرد که تولیدکننده تصویر اصلی خود، Imagen 3، اکنون بدون لیست انتظار برای همه مشتریان Vertex AI در دسترس است.
منبع: techcrunch.com