گوگل در حال آزمایش یک تولیدکننده تصویر جدید است که سه تصویر را ترکیب میکند
معرفی ابزار جدید تصویرسازی Google
گوگل در حال آزمایش یک ابزار جدید به نام “Whisk” است که به کاربران اجازه میدهد به جای متن، با تصاویر کار کنند. این ابزار به شما این امکان را میدهد که یک عکس را با تغییرات در موضوع، صحنه و سبک، بازآفرینی کنید.
عملکرد Whisk
Whisk از مدل تصویرسازی گوگل به نام Imagen 3 استفاده میکند که سه تصویر را ترکیب میکند: یکی برای موضوع، یکی برای صحنه و دیگری برای سبک. به عنوان مثال، میتوانید یک عکس از خودتان را به عنوان موضوع انتخاب کنید، یک چشمانداز آیندهنگر به عنوان صحنه و سبک انیمه را برای نتیجه نهایی انتخاب کنید.
تولید تصاویر و توصیفها
این مدل به صورت خودکار یک توضیح دقیق درباره تصاویر شما تولید میکند که برای راهنمایی Imagen 3 در ایجاد عکس جدید استفاده میشود. همچنین میتوانید متنهایی برای مشخص کردن نتیجه نهایی وارد کنید، مانند “موضوع در حال رکاب زدن بر روی یک دوچرخه پرنده است.”
چالشها و محدودیتها
چون Whisk تنها بر روی چند ویژگی کلیدی از هر تصویر تمرکز میکند، ممکن است نتایج همیشه مطابق انتظار شما نباشد. به عنوان مثال، ممکن است ویژگیهایی مانند قد، وزن، مدل مو یا رنگ پوست در موضوع تولید شده متفاوت باشد. گوگل اعلام کرده که شما میتوانید در هر زمان از زیرنویسها دیدن کرده و آنها را ویرایش کنید.
دسترسی به Whisk
این آزمایش در حال حاضر تنها برای کاربران واقع در ایالات متحده در دسترس است. برای استفاده از این ابزار میتوانید به آدرس labs.google/whisk مراجعه کنید.
منبع: techcrunch.com