گوگل در حال آزمایش یک تولیدکننده تصویر جدید است که سه تصویر را ترکیب می‌کند

معرفی ابزار جدید تصویرسازی Google

گوگل در حال آزمایش یک ابزار جدید به نام “Whisk” است که به کاربران اجازه می‌دهد به جای متن، با تصاویر کار کنند. این ابزار به شما این امکان را می‌دهد که یک عکس را با تغییرات در موضوع، صحنه و سبک، بازآفرینی کنید.

عملکرد Whisk

Whisk از مدل تصویرسازی گوگل به نام Imagen 3 استفاده می‌کند که سه تصویر را ترکیب می‌کند: یکی برای موضوع، یکی برای صحنه و دیگری برای سبک. به عنوان مثال، می‌توانید یک عکس از خودتان را به عنوان موضوع انتخاب کنید، یک چشم‌انداز آینده‌نگر به عنوان صحنه و سبک انیمه را برای نتیجه نهایی انتخاب کنید.

تولید تصاویر و توصیف‌ها

این مدل به صورت خودکار یک توضیح دقیق درباره تصاویر شما تولید می‌کند که برای راهنمایی Imagen 3 در ایجاد عکس جدید استفاده می‌شود. همچنین می‌توانید متن‌هایی برای مشخص کردن نتیجه نهایی وارد کنید، مانند “موضوع در حال رکاب زدن بر روی یک دوچرخه پرنده است.”

چالش‌ها و محدودیت‌ها

چون Whisk تنها بر روی چند ویژگی کلیدی از هر تصویر تمرکز می‌کند، ممکن است نتایج همیشه مطابق انتظار شما نباشد. به عنوان مثال، ممکن است ویژگی‌هایی مانند قد، وزن، مدل مو یا رنگ پوست در موضوع تولید شده متفاوت باشد. گوگل اعلام کرده که شما می‌توانید در هر زمان از زیرنویس‌ها دیدن کرده و آن‌ها را ویرایش کنید.

دسترسی به Whisk

این آزمایش در حال حاضر تنها برای کاربران واقع در ایالات متحده در دسترس است. برای استفاده از این ابزار می‌توانید به آدرس labs.google/whisk مراجعه کنید.

منبع: techcrunch.com

مطلب مرتبط:  افزایش اطلاعات نادرست مبتنی بر هوش مصنوعی و پاسخ استارتاپ‌ها

مطالب مرتبط

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *