AI

گوگل عمیق‌ترین عامل تحقیقاتی هوش مصنوعی خود را عرضه کرد - در همان روزی که OpenAI مدل GPT-5.2 را منتشر کرد.

3 دقیقه مطالعه
منبع
گوگل عمیق‌ترین عامل تحقیقاتی هوش مصنوعی خود را عرضه کرد - در همان روزی که OpenAI مدل GPT-5.2 را منتشر کرد.

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.

گوگل روز پنجشنبه نسخه "بازطراحی شده" عامل تحقیقاتی خود، Gemini Deep Research را که بر پایه مدل پیشرفته و پر سر و صدای خود، Gemini 3 Pro، ساخته شده است، منتشر کرد.

این عامل جدید فقط برای تولید گزارش‌های تحقیقاتی طراحی نشده است - اگرچه هنوز هم می‌تواند این کار را انجام دهد. اکنون به توسعه‌دهندگان اجازه می‌دهد تا قابلیت‌های تحقیقاتی مدل پیشرفته گوگل را در برنامه‌های خود ادغام کنند. این قابلیت از طریق API جدید Interactions گوگل امکان‌پذیر شده است که برای کنترل بیشتر توسعه‌دهندگان در عصر هوش مصنوعی عامل‌محور طراحی شده است.

ابزار جدید Gemini Deep Research یک عامل مجهز است که قادر به ترکیب حجم عظیمی از اطلاعات و پردازش حجم زیادی از داده‌ها در پرامپت است. گوگل می‌گوید مشتریان از آن برای وظایفی از بررسی دقیق تا تحقیقات ایمنی سمیت داروها استفاده می‌کنند.

گوگل همچنین اعلام کرده است که به زودی این عامل تحقیقاتی عمیق جدید را در سرویس‌هایی از جمله جستجوی گوگل، گوگل فاینانس، اپلیکیشن جمنای و NotebookLM محبوب خود ادغام خواهد کرد. این گامی دیگر در جهت آماده‌سازی برای جهانی است که در آن انسان‌ها دیگر چیزی را در گوگل جستجو نمی‌کنند - بلکه عوامل هوش مصنوعی آن‌ها این کار را انجام می‌دهند.

این غول فناوری می‌گوید که Deep Research از وضعیت Gemini 3 Pro به عنوان "واقع‌گرایانه‌ترین" مدل خود بهره می‌برد که برای به حداقل رساندن توهمات در طول وظایف پیچیده آموزش دیده است.

توهمات هوش مصنوعی - جایی که مدل زبان بزرگ (LLM) صرفاً چیزهایی را اختراع می‌کند - مسئله‌ای بسیار حیاتی برای وظایف عامل‌محور با استدلال عمیق و طولانی‌مدت است، که در آن تصمیمات مستقل زیادی طی دقایق، ساعت‌ها یا بیشتر گرفته می‌شود. هرچه LLM مجبور به انتخاب‌های بیشتری باشد، احتمال اینکه حتی یک انتخاب توهمی کل خروجی را بی‌اعتبار کند، بیشتر می‌شود.

برای اثبات ادعاهای پیشرفت خود، گوگل یک معیار (benchmark) دیگر نیز ایجاد کرده است (گویی دنیای هوش مصنوعی به یکی دیگر نیاز دارد). این معیار جدید به طور غیر خلاقانه DeepSearchQA نامگذاری شده است و هدف آن آزمایش عامل‌ها در وظایف پیچیده و چند مرحله‌ای جستجوی اطلاعات است. گوگل این معیار را منبع باز کرده است.

همچنین Deep Research را بر روی Humanity’s Last Exam، یک معیار مستقل با نام جالب‌تر که پر از وظایف غیرقابل تصور تخصصی است، و BrowserComp، معیاری برای وظایف عامل‌محور مبتنی بر مرورگر، آزمایش کرده است.

همانطور که انتظار می‌رود، عامل جدید گوگل در معیار خود و Humanity’s بر رقبا پیشی گرفت. با این حال، ChatGPT 5 Pro از OpenAI به طرز شگفت‌آوری در رتبه دوم قرار گرفت و در BrowserComp کمی از گوگل بهتر عمل کرد.

اما این مقایسه‌های معیار تقریباً در لحظه انتشارشان توسط گوگل منسوخ شدند. زیرا در همان روز، OpenAI مدل مورد انتظار GPT 5.2 خود را - با نام رمز Garlic - عرضه کرد. OpenAI می‌گوید جدیدترین مدل آن در مجموعه‌ای از معیارهای معمول، از جمله معیار داخلی خود OpenAI، از رقبای خود - به ویژه گوگل - بهتر عمل می‌کند.

شاید یکی از جالب‌ترین بخش‌های این اعلامیه، زمان‌بندی آن بود. با علم به اینکه دنیا منتظر انتشار Garlic بود، گوگل نیز اخبار هوش مصنوعی خود را منتشر کرد.