AI

گوگل مدل جدید تولید تصویر خود، نانو موز پرو (Nano Banana Pro) را منتشر کرد

4 دقیقه مطالعه
منبع
گوگل مدل جدید تولید تصویر خود، نانو موز پرو (Nano Banana Pro) را منتشر کرد
چکیده کوتاه
- گوگل نانو بنانا پرو (Google's Nano Banana Pro)*- با رزولوشن‌های بالاتر، ادغام با جستجوی وب و کنترل‌های ویرایش دقیق، تولید تصویر هوش مصنوعی را ارتقا می‌دهد و نشان‌دهنده تلاش برای ابزارهای خلاقانه در سطح حرفه‌ای است.
- این مدل که بر پایه جمینای ۳ (Gemini 3)*- ساخته شده، رندر متن بهبود یافته و ترکیب صحنه‌های پیچیده را ارائه می‌دهد، هرچند با هزینه بالاتر، که نشان‌دهنده بده‌بستان‌های صنعت بین قابلیت و هزینه است.
- واترمارکینگ SynthID در آن گنجانده شده است، که بر تعهد گوگل به توسعه مسئولانه هوش مصنوعی و منشأ محتوا در مجموعه رو به رشد محصولات مبتنی بر هوش مصنوعی آن تأکید می‌کند.

گوگل در حال ارتقاء مدل تولید تصویر خود با قابلیت‌های ویرایش جدید، رزولوشن‌های بالاتر، رندر دقیق‌تر متن و امکان جستجو در وب است.

این مدل جدید که نانو موز پرو (Nano Banana Pro) نام گرفته، بر اساس آخرین مدل زبان بزرگ گوگل، جمنای ۳ (Gemini 3) ساخته شده که اوایل این هفته منتشر شد. این شرکت ادعا می‌کند که نانو موز پرو با قابلیت ایجاد تصاویر دقیق‌تر و متنی با جزئیات بیشتر و همچنین تولید متن در سبک‌ها، فونت‌ها و زبان‌های مختلف، نسبت به نسل قبلی خود، نانو موز (Nano Banana)، بهبود یافته است.

تصویری تولید شده توسط مدل نانو موز پرو گوگل که اینفوگرافیکی در مورد نحوه تهیه چای الایچی را نشان می‌دهد.

این مدل همچنین قابلیت جستجو در وب را دارد، بنابراین می‌توانید کارهایی مانند درخواست جستجوی دستور پخت و تولید فلش کارت را انجام دهید.

گوگل می‌گوید نانو موز پرو برای کنترل بیشتر تصاویر توسط متخصصان طراحی شده است و به کاربران امکان می‌دهد جنبه‌هایی مانند زاویه دوربین، نورپردازی صحنه، عمق میدان، فوکوس و درجه‌بندی رنگ را کنترل کنند. و در مقایسه با سقف رزولوشن ۱۰۲۴ در ۱۰۲۴ پیکسل نانو موز، کاربران می‌توانند با نانو موز پرو تصاویر ۲K یا ۴K تولید کنند.

این شرکت خاطرنشان کرد که در حالی که نانو موز پرو می‌تواند تصاویر را با کیفیت بالاتری تولید کند، کندتر و پرهزینه‌تر از مدل اصلی است که هزینه آن ۰.۰۳۹ دلار برای هر تصویر ۱۰۲۴ پیکسلی بود. در مقایسه، مدل جدید برای هر تصویر ۱۰۸۰p یا ۲K هزینه ۰.۱۳۹ دلاری و برای هر تصویر ۴K هزینه ۰.۲۴ دلاری دارد.

مدل جدید می‌تواند از شش عکس با وفاداری بالا استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب کند. همچنین می‌تواند ثبات و شباهت تا پنج نفر را حفظ کند. این شرکت یک اپلیکیشن دموی منتشر کرده است که در آن می‌توانید برخی از این قابلیت‌ها را امتحان کنید.

نانو موز پرو در حال حاضر در بسیاری از ابزارهای هوش مصنوعی موجود گوگل در حال عرضه است. اپلیکیشن جمنای (Gemini) اکنون به طور پیش‌فرض از مدل جدید برای تولید تصاویر استفاده خواهد کرد، اگرچه کاربران در سطح اشتراک رایگان قادر خواهند بود از این مدل برای تولید تعداد محدودی تصویر استفاده کنند، پس از آن به طور پیش‌فرض به مدل اصلی نانو موز باز خواهند گشت.

مشترکین گوگل هوش مصنوعی پلاس (Google AI Plus)، پرو (Pro) و اولترا (Ultra) آستانه‌های تولید بالاتری دریافت خواهند کرد، اگرچه این شرکت محدودیت‌های دقیق را فاش نکرده است. این مشترکین همچنین به مدل در نوت‌بوک‌ال‌ام (NotebookLM) دسترسی خواهند داشت.

گوگل همچنین این مدل را از طریق حالت هوش مصنوعی برای مشترکین هوش مصنوعی پرو و اولترا در ایالات متحده در جستجو در دسترس قرار می‌دهد. مشترکین اولترا می‌توانند به مدل در ابزار ویدیوی شرکت، فلو (Flow) دسترسی داشته باشند و همچنین برای مشتریان Workspace در گوگل اسلایدز (Google Slides) و ویدز (Vids) نیز در دسترس است.

توسعه‌دهندگان می‌توانند از طریق جمنای API (Gemini API)، گوگل هوش مصنوعی استودیو (Google AI Studio) و IDE جدید شرکت، آنتی‌گرویتی (Antigravity) به نانو موز پرو دسترسی پیدا کنند.

این شرکت همچنین در حال گنجاندن سینت‌آی‌دی (SynthID)، فناوری خود برای واترمارک کردن و تشخیص تصاویر تولید شده توسط هوش مصنوعی، در اپلیکیشن جمنای است. کاربران می‌توانند تصویری را آپلود کنند و چت‌بات به آن‌ها می‌گوید که آیا تصویر توسط مدل‌های تصویر گوگل ایجاد یا ویرایش شده است.

گوگل اعلام کرد که در طول زمان، پشتیبانی از تشخیص اعتبار محتوای C2PA را برای تأیید محتوا اضافه خواهد کرد.

این داستان برای بازتاب رویکرد گوگل در پشتیبانی از C2PA به‌روزرسانی شده است.

این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.