گوگل مدل جدید تولید تصویر خود، نانو موز پرو (Nano Banana Pro) را منتشر کرد

- این مدل که بر پایه جمینای ۳ (Gemini 3)*- ساخته شده، رندر متن بهبود یافته و ترکیب صحنههای پیچیده را ارائه میدهد، هرچند با هزینه بالاتر، که نشاندهنده بدهبستانهای صنعت بین قابلیت و هزینه است.
- واترمارکینگ SynthID در آن گنجانده شده است، که بر تعهد گوگل به توسعه مسئولانه هوش مصنوعی و منشأ محتوا در مجموعه رو به رشد محصولات مبتنی بر هوش مصنوعی آن تأکید میکند.
گوگل در حال ارتقاء مدل تولید تصویر خود با قابلیتهای ویرایش جدید، رزولوشنهای بالاتر، رندر دقیقتر متن و امکان جستجو در وب است.
این مدل جدید که نانو موز پرو (Nano Banana Pro) نام گرفته، بر اساس آخرین مدل زبان بزرگ گوگل، جمنای ۳ (Gemini 3) ساخته شده که اوایل این هفته منتشر شد. این شرکت ادعا میکند که نانو موز پرو با قابلیت ایجاد تصاویر دقیقتر و متنی با جزئیات بیشتر و همچنین تولید متن در سبکها، فونتها و زبانهای مختلف، نسبت به نسل قبلی خود، نانو موز (Nano Banana)، بهبود یافته است.

این مدل همچنین قابلیت جستجو در وب را دارد، بنابراین میتوانید کارهایی مانند درخواست جستجوی دستور پخت و تولید فلش کارت را انجام دهید.
گوگل میگوید نانو موز پرو برای کنترل بیشتر تصاویر توسط متخصصان طراحی شده است و به کاربران امکان میدهد جنبههایی مانند زاویه دوربین، نورپردازی صحنه، عمق میدان، فوکوس و درجهبندی رنگ را کنترل کنند. و در مقایسه با سقف رزولوشن ۱۰۲۴ در ۱۰۲۴ پیکسل نانو موز، کاربران میتوانند با نانو موز پرو تصاویر ۲K یا ۴K تولید کنند.
این شرکت خاطرنشان کرد که در حالی که نانو موز پرو میتواند تصاویر را با کیفیت بالاتری تولید کند، کندتر و پرهزینهتر از مدل اصلی است که هزینه آن ۰.۰۳۹ دلار برای هر تصویر ۱۰۲۴ پیکسلی بود. در مقایسه، مدل جدید برای هر تصویر ۱۰۸۰p یا ۲K هزینه ۰.۱۳۹ دلاری و برای هر تصویر ۴K هزینه ۰.۲۴ دلاری دارد.

مدل جدید میتواند از شش عکس با وفاداری بالا استفاده کند یا تا ۱۴ شیء را در یک تصویر ترکیب کند. همچنین میتواند ثبات و شباهت تا پنج نفر را حفظ کند. این شرکت یک اپلیکیشن دموی منتشر کرده است که در آن میتوانید برخی از این قابلیتها را امتحان کنید.
نانو موز پرو در حال حاضر در بسیاری از ابزارهای هوش مصنوعی موجود گوگل در حال عرضه است. اپلیکیشن جمنای (Gemini) اکنون به طور پیشفرض از مدل جدید برای تولید تصاویر استفاده خواهد کرد، اگرچه کاربران در سطح اشتراک رایگان قادر خواهند بود از این مدل برای تولید تعداد محدودی تصویر استفاده کنند، پس از آن به طور پیشفرض به مدل اصلی نانو موز باز خواهند گشت.
مشترکین گوگل هوش مصنوعی پلاس (Google AI Plus)، پرو (Pro) و اولترا (Ultra) آستانههای تولید بالاتری دریافت خواهند کرد، اگرچه این شرکت محدودیتهای دقیق را فاش نکرده است. این مشترکین همچنین به مدل در نوتبوکالام (NotebookLM) دسترسی خواهند داشت.
گوگل همچنین این مدل را از طریق حالت هوش مصنوعی برای مشترکین هوش مصنوعی پرو و اولترا در ایالات متحده در جستجو در دسترس قرار میدهد. مشترکین اولترا میتوانند به مدل در ابزار ویدیوی شرکت، فلو (Flow) دسترسی داشته باشند و همچنین برای مشتریان Workspace در گوگل اسلایدز (Google Slides) و ویدز (Vids) نیز در دسترس است.
توسعهدهندگان میتوانند از طریق جمنای API (Gemini API)، گوگل هوش مصنوعی استودیو (Google AI Studio) و IDE جدید شرکت، آنتیگرویتی (Antigravity) به نانو موز پرو دسترسی پیدا کنند.
این شرکت همچنین در حال گنجاندن سینتآیدی (SynthID)، فناوری خود برای واترمارک کردن و تشخیص تصاویر تولید شده توسط هوش مصنوعی، در اپلیکیشن جمنای است. کاربران میتوانند تصویری را آپلود کنند و چتبات به آنها میگوید که آیا تصویر توسط مدلهای تصویر گوگل ایجاد یا ویرایش شده است.
گوگل اعلام کرد که در طول زمان، پشتیبانی از تشخیص اعتبار محتوای C2PA را برای تأیید محتوا اضافه خواهد کرد.
این داستان برای بازتاب رویکرد گوگل در پشتیبانی از C2PA بهروزرسانی شده است.
این مقاله توسط هوش مصنوعی ترجمه شده است و ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.



