گوگل عمیقترین عامل تحقیقاتی هوش مصنوعی خود را عرضه کرد - در همان روزی که OpenAI مدل GPT-5.2 را منتشر کرد.

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.
گوگل روز پنجشنبه نسخه "بازطراحی شده" عامل تحقیقاتی خود، Gemini Deep Research را که بر پایه مدل پیشرفته و پر سر و صدای خود، Gemini 3 Pro، ساخته شده است، منتشر کرد.
این عامل جدید فقط برای تولید گزارشهای تحقیقاتی طراحی نشده است - اگرچه هنوز هم میتواند این کار را انجام دهد. اکنون به توسعهدهندگان اجازه میدهد تا قابلیتهای تحقیقاتی مدل پیشرفته گوگل را در برنامههای خود ادغام کنند. این قابلیت از طریق API جدید Interactions گوگل امکانپذیر شده است که برای کنترل بیشتر توسعهدهندگان در عصر هوش مصنوعی عاملمحور طراحی شده است.
ابزار جدید Gemini Deep Research یک عامل مجهز است که قادر به ترکیب حجم عظیمی از اطلاعات و پردازش حجم زیادی از دادهها در پرامپت است. گوگل میگوید مشتریان از آن برای وظایفی از بررسی دقیق تا تحقیقات ایمنی سمیت داروها استفاده میکنند.
گوگل همچنین اعلام کرده است که به زودی این عامل تحقیقاتی عمیق جدید را در سرویسهایی از جمله جستجوی گوگل، گوگل فاینانس، اپلیکیشن جمنای و NotebookLM محبوب خود ادغام خواهد کرد. این گامی دیگر در جهت آمادهسازی برای جهانی است که در آن انسانها دیگر چیزی را در گوگل جستجو نمیکنند - بلکه عوامل هوش مصنوعی آنها این کار را انجام میدهند.
این غول فناوری میگوید که Deep Research از وضعیت Gemini 3 Pro به عنوان "واقعگرایانهترین" مدل خود بهره میبرد که برای به حداقل رساندن توهمات در طول وظایف پیچیده آموزش دیده است.
توهمات هوش مصنوعی - جایی که مدل زبان بزرگ (LLM) صرفاً چیزهایی را اختراع میکند - مسئلهای بسیار حیاتی برای وظایف عاملمحور با استدلال عمیق و طولانیمدت است، که در آن تصمیمات مستقل زیادی طی دقایق، ساعتها یا بیشتر گرفته میشود. هرچه LLM مجبور به انتخابهای بیشتری باشد، احتمال اینکه حتی یک انتخاب توهمی کل خروجی را بیاعتبار کند، بیشتر میشود.
برای اثبات ادعاهای پیشرفت خود، گوگل یک معیار (benchmark) دیگر نیز ایجاد کرده است (گویی دنیای هوش مصنوعی به یکی دیگر نیاز دارد). این معیار جدید به طور غیر خلاقانه DeepSearchQA نامگذاری شده است و هدف آن آزمایش عاملها در وظایف پیچیده و چند مرحلهای جستجوی اطلاعات است. گوگل این معیار را منبع باز کرده است.
همچنین Deep Research را بر روی Humanity’s Last Exam، یک معیار مستقل با نام جالبتر که پر از وظایف غیرقابل تصور تخصصی است، و BrowserComp، معیاری برای وظایف عاملمحور مبتنی بر مرورگر، آزمایش کرده است.
همانطور که انتظار میرود، عامل جدید گوگل در معیار خود و Humanity’s بر رقبا پیشی گرفت. با این حال، ChatGPT 5 Pro از OpenAI به طرز شگفتآوری در رتبه دوم قرار گرفت و در BrowserComp کمی از گوگل بهتر عمل کرد.
اما این مقایسههای معیار تقریباً در لحظه انتشارشان توسط گوگل منسوخ شدند. زیرا در همان روز، OpenAI مدل مورد انتظار GPT 5.2 خود را - با نام رمز Garlic - عرضه کرد. OpenAI میگوید جدیدترین مدل آن در مجموعهای از معیارهای معمول، از جمله معیار داخلی خود OpenAI، از رقبای خود - به ویژه گوگل - بهتر عمل میکند.
شاید یکی از جالبترین بخشهای این اعلامیه، زمانبندی آن بود. با علم به اینکه دنیا منتظر انتشار Garlic بود، گوگل نیز اخبار هوش مصنوعی خود را منتشر کرد.



