AI

OpenAI با GPT-5.2 به گوگل پاسخ می‌دهد؛ پس از یادداشت «کد قرمز»

8 دقیقه مطالعه
منبع
OpenAI با GPT-5.2 به گوگل پاسخ می‌دهد؛ پس از یادداشت «کد قرمز»

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، می‌توانید منبع اصلی را مطالعه کنید.

OpenAI روز پنجشنبه، در بحبوحه رقابت فزاینده با گوگل، آخرین مدل پیشرفته خود یعنی GPT-5.2 را معرفی کرد و آن را به عنوان پیشرفته‌ترین مدل خود تا به امروز و مدلی طراحی شده برای توسعه‌دهندگان و استفاده روزمره حرفه‌ای معرفی نمود.

GPT-5.2 اوپن‌ای‌آی از طریق API در سه نسخه برای کاربران پولی ChatGPT و توسعه‌دهندگان عرضه می‌شود: Instant، یک مدل بهینه‌شده برای سرعت برای پرس‌وجوهای معمول مانند جستجوی اطلاعات، نوشتن و ترجمه؛ Thinking، که در کارهای پیچیده ساختاریافته مانند کدنویسی، تجزیه و تحلیل اسناد طولانی، ریاضیات و برنامه‌ریزی عالی عمل می‌کند؛ و Pro، مدل سطح بالا که برای ارائه حداکثر دقت و قابلیت اطمینان برای مشکلات دشوار طراحی شده است.

فیدجی سیمو، مدیر ارشد محصول اوپن‌ای‌آی، روز پنجشنبه در نشستی با خبرنگاران گفت: «ما 5.2 را برای آزادسازی ارزش اقتصادی بیشتر برای مردم طراحی کردیم. این مدل در ایجاد صفحات گسترده، ساخت ارائه‌ها، نوشتن کد، درک تصاویر، درک زمینه طولانی، استفاده از ابزارها و سپس پیوند دادن پروژه‌های پیچیده چند مرحله‌ای بهتر است.»

GPT-5.2 در میانه یک مسابقه تسلیحاتی با Gemini 3 گوگل قرار می‌گیرد که در اکثر بنچمارک‌ها (به جز کدنویسی - که Claude Opus-4.5 آنتروپیک همچنان آن را در اختیار دارد) در صدر جدول LMArena قرار دارد.

اوایل این ماه، The Information گزارش داد که سم آلتمن، مدیرعامل، یادداشت داخلی «کد قرمز» را به کارکنان در بحبوحه کاهش ترافیک ChatGPT و نگرانی‌ها مبنی بر از دست دادن سهم بازار مصرف‌کننده به گوگل، منتشر کرده است. کد قرمز خواستار تغییر اولویت‌ها، از جمله توقف تعهداتی مانند معرفی تبلیغات و تمرکز بر ایجاد تجربه بهتر ChatGPT بود.

GPT-5.2 تلاش اوپن‌ای‌آی برای بازپس‌گیری رهبری است، حتی در حالی که برخی از کارکنان گزارش شده خواستار به تعویق انداختن انتشار مدل بودند تا شرکت زمان بیشتری برای بهبود آن داشته باشد. و علی‌رغم نشانه‌هایی مبنی بر تمرکز اوپن‌ای‌آی بر موارد استفاده مصرف‌کننده با افزودن شخصی‌سازی و سفارشی‌سازی بیشتر به ChatGPT، عرضه GPT-5.2 به نظر می‌رسد فرصت‌های سازمانی را تقویت کند.

این شرکت به طور خاص توسعه‌دهندگان و اکوسیستم ابزار را هدف قرار داده است و قصد دارد به پایه پیش‌فرض برای ساخت برنامه‌های کاربردی مبتنی بر هوش مصنوعی تبدیل شود. اوایل این هفته، اوپن‌ای‌آی داده‌های جدیدی منتشر کرد که نشان می‌دهد استفاده سازمانی از ابزارهای هوش مصنوعی آن در سال گذشته به شدت افزایش یافته است.

این در حالی است که Gemini 3 به طور تنگاتنگی در اکوسیستم محصولات و ابری گوگل برای گردش کارهای چندوجهی و عاملی ادغام شده است. گوگل این هفته سرورهای مدیریت شده MCP را راه‌اندازی کرد که خدمات گوگل و ابری آن مانند Maps و BigQuery را برای عوامل آسان‌تر می‌کند تا به آن‌ها متصل شوند. (MCP ها اتصالات بین سیستم‌های هوش مصنوعی و داده‌ها و ابزارها هستند.)

اوپن‌ای‌آی می‌گوید GPT-5.2 امتیازات بنچمارک جدیدی را در کدنویسی، ریاضیات، علوم، بینایی، استدلال زمینه طولانی و استفاده از ابزار به دست آورده است که این شرکت ادعا می‌کند می‌تواند منجر به «گردش کارهای عاملی قابل اطمینان‌تر، کد در سطح تولید و سیستم‌های پیچیده‌ای شود که در زمینه‌های بزرگ و داده‌های دنیای واقعی عمل می‌کنند.»

این قابلیت‌ها آن را در رقابت مستقیم با حالت Deep Think در Gemini 3 قرار می‌دهد که به عنوان یک پیشرفت استدلالی عمده با هدف ریاضیات، منطق و علوم معرفی شده است. در نمودار بنچمارک خود اوپن‌ای‌آی، GPT-5.2 Thinking در تقریباً تمام تست‌های استدلال ذکر شده، از وظایف مهندسی نرم‌افزار دنیای واقعی (SWE-Bench Pro) و دانش علمی در سطح دکترا (GPQA Diamond) گرفته تا استدلال انتزاعی و کشف الگو (مجموعه ARC-AGI)، از Gemini 3 و Claude Opus 4.5 آنتروپیک پیشی می‌گیرد.

ایدن کلارک، رهبر تحقیقات، گفت که نمرات قوی‌تر ریاضی فقط به حل معادلات مربوط نمی‌شود. او توضیح داد که استدلال ریاضی معیاری برای این است که آیا یک مدل می‌تواند منطق چند مرحله‌ای را دنبال کند، اعداد را در طول زمان ثابت نگه دارد و از خطاهای ظریفی که می‌توانند در طول زمان انباشته شوند، اجتناب کند.

کلارک گفت: «اینها همه ویژگی‌هایی هستند که در طیف گسترده‌ای از کارهای مختلف اهمیت دارند. «مواردی مانند مدل‌سازی مالی، پیش‌بینی، تجزیه و تحلیل داده‌ها.»

در طول جلسه، مکس شوارتزر، مدیر محصول اوپن‌ای‌آی، گفت که GPT-5.2 «بهبودهای قابل توجهی در تولید و اشکال‌زدایی کد ایجاد می‌کند» و می‌تواند ریاضیات و منطق پیچیده را گام به گام طی کند. او افزود که استارتاپ‌های کدنویسی مانند Windsurf و CharlieCode، «عملکرد کدنویسی عاملی در سطح پیشرفته» و پیشرفت‌های قابل اندازه‌گیری در گردش کارهای پیچیده چند مرحله‌ای را گزارش می‌کنند.

فراتر از کدنویسی، شوارتزر گفت که پاسخ‌های GPT-5.2 Thinking حاوی 38 درصد خطای کمتر نسبت به نسل قبلی خود است و این مدل را برای تصمیم‌گیری‌های روزمره، تحقیق و نوشتن قابل اعتمادتر می‌کند.

GPT-5.2 کمتر یک بازآفرینی و بیشتر یک ادغام از دو ارتقاء اخیر اوپن‌ای‌آی به نظر می‌رسد. GPT-5 که در ماه اوت عرضه شد، یک بازنشانی بود که زمینه را برای یک سیستم یکپارچه با یک مسیریاب برای جابجایی مدل بین یک مدل پیش‌فرض سریع و یک حالت عمیق‌تر «Thinking» فراهم کرد. GPT-5.1 در ماه نوامبر بر گرم‌تر، مکالمه‌ای‌تر و مناسب‌تر کردن آن سیستم برای وظایف عاملی و کدنویسی تمرکز داشت. آخرین مدل، GPT-5.2، به نظر می‌رسد که تمام این پیشرفت‌ها را تقویت می‌کند و آن را به پایه‌ای قابل اطمینان‌تر برای استفاده در تولید تبدیل می‌کند.

برای اوپن‌ای‌آی، ریسک‌ها هرگز بالاتر نبوده است. این شرکت تعهداتی به ارزش 1.4 تریلیون دلار برای توسعه زیرساخت‌های هوش مصنوعی در چند سال آینده برای حمایت از رشد خود داشته است - تعهداتی که زمانی که هنوز مزیت پیشگام در میان شرکت‌های هوش مصنوعی را داشت، انجام داد. اما اکنون که گوگل، که در ابتدا عقب مانده بود، پیش می‌رود، این شرط ممکن است دلیل «کد قرمز» آلتمن باشد.

تمرکز مجدد اوپن‌ای‌آی بر مدل‌های استدلالی نیز یک حرکت پرخطر است. سیستم‌های پشت حالت‌های Thinking و Deep Research آن گران‌تر از چت‌بات‌های استاندارد هستند زیرا محاسبات بیشتری مصرف می‌کنند. با دو برابر کردن تمرکز بر این نوع مدل با GPT-5.2، اوپن‌ای‌آی ممکن است یک چرخه معیوب را ایجاد کند: صرف هزینه بیشتر برای محاسبات برای برنده شدن در جدول رهگیری، سپس صرف هزینه بیشتر برای حفظ مقیاس این مدل‌های پرهزینه.

گزارش شده است که اوپن‌ای‌آی در حال حاضر بیش از آنچه قبلاً اعلام کرده بود، صرف هزینه‌های محاسباتی می‌کند. همانطور که TechCrunch اخیراً گزارش داد، بیشتر هزینه‌های استنتاج اوپن‌ای‌آی - پولی که برای اجرای یک مدل هوش مصنوعی آموزش‌دیده صرف می‌کند - به صورت نقدی و نه از طریق اعتبارات ابری پرداخت می‌شود، که نشان می‌دهد هزینه‌های محاسباتی این شرکت فراتر از آنچه مشارکت‌ها و اعتبارات می‌توانند یارانه‌دهی کنند، افزایش یافته است.

در طول تماس، سیمو پیشنهاد کرد که با مقیاس‌پذیر شدن اوپن‌ای‌آی، قادر به ارائه محصولات و خدمات بیشتر برای تولید درآمد بیشتر برای پرداخت هزینه‌های محاسباتی اضافی است.

سیمو گفت: «اما من فکر می‌کنم مهم است که این را در قوس بزرگ بهره‌وری قرار دهیم. «شما امروز، هوش بسیار بیشتری را با همان مقدار محاسبات و همان مقدار پول نسبت به یک سال پیش دریافت می‌کنید.»

با وجود تمام تمرکز بر استدلال، یک چیز که در عرضه امروز غایب است، یک مولد تصویر جدید است. گزارش شده است که آلتمن در یادداشت کد قرمز خود گفته است که تولید تصویر یک اولویت کلیدی در آینده خواهد بود، به خصوص پس از اینکه Nano Banana گوگل (نام مستعار مدل تصویر Gemini 2.5 Flash گوگل) پس از عرضه در ماه اوت، لحظه ویروسی خود را داشت.

ماه گذشته، گوگل Nano Banana Pro (معروف به Gemini 3 Pro Image) را راه‌اندازی کرد، یک نسخه ارتقا یافته با رندر متن بهتر، دانش جهانی و حس «واقعی، بدون ویرایش و وهم‌آور» به عکس‌های خود. همچنین در محصولات گوگل بهتر ادغام می‌شود، همانطور که در هفته گذشته نشان داده شد زیرا در ابزارها و گردش کار مانند Google Labs Mixboard برای تولید خودکار ارائه‌ها ظاهر می‌شود.

گزارش شده است که اوپن‌ای‌آی قصد دارد در ماه ژانویه مدل جدید دیگری را با تصاویر بهتر، سرعت بهبود یافته و شخصیت بهتر عرضه کند، اگرچه این شرکت روز پنجشنبه این برنامه‌ها را تأیید نکرد.

اوپن‌ای‌آی همچنین روز پنجشنبه اعلام کرد که در حال راه‌اندازی اقدامات ایمنی جدیدی در مورد استفاده از سلامت روان و تأیید سن برای نوجوانان است، اما بخش زیادی از عرضه را به تبلیغ این تغییرات اختصاص نداد.

این مقاله با اطلاعات بیشتر در مورد وضعیت بهره‌وری محاسباتی اوپن‌ای‌آی به‌روز شده است.

یک نکته حساس یا اسناد محرمانه دارید؟ ما در حال گزارش در مورد عملکرد داخلی صنعت هوش مصنوعی هستیم - از شرکت‌هایی که آینده آن را شکل می‌دهند تا افرادی که تحت تأثیر تصمیمات آن‌ها قرار می‌گیرند. با ربکا بلان در rebecca.bellan@techcrunch.com یا راسل براندوم در russell.brandom@techcrunch.com تماس بگیرید. برای ارتباط امن، می‌توانید از طریق سیگنال با آن‌ها در @rebeccabellan.491 و russellbrandom.49 تماس بگیرید.