OpenAI با GPT-5.2 به گوگل پاسخ میدهد؛ پس از یادداشت «کد قرمز»

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.
OpenAI روز پنجشنبه، در بحبوحه رقابت فزاینده با گوگل، آخرین مدل پیشرفته خود یعنی GPT-5.2 را معرفی کرد و آن را به عنوان پیشرفتهترین مدل خود تا به امروز و مدلی طراحی شده برای توسعهدهندگان و استفاده روزمره حرفهای معرفی نمود.
GPT-5.2 اوپنایآی از طریق API در سه نسخه برای کاربران پولی ChatGPT و توسعهدهندگان عرضه میشود: Instant، یک مدل بهینهشده برای سرعت برای پرسوجوهای معمول مانند جستجوی اطلاعات، نوشتن و ترجمه؛ Thinking، که در کارهای پیچیده ساختاریافته مانند کدنویسی، تجزیه و تحلیل اسناد طولانی، ریاضیات و برنامهریزی عالی عمل میکند؛ و Pro، مدل سطح بالا که برای ارائه حداکثر دقت و قابلیت اطمینان برای مشکلات دشوار طراحی شده است.
فیدجی سیمو، مدیر ارشد محصول اوپنایآی، روز پنجشنبه در نشستی با خبرنگاران گفت: «ما 5.2 را برای آزادسازی ارزش اقتصادی بیشتر برای مردم طراحی کردیم. این مدل در ایجاد صفحات گسترده، ساخت ارائهها، نوشتن کد، درک تصاویر، درک زمینه طولانی، استفاده از ابزارها و سپس پیوند دادن پروژههای پیچیده چند مرحلهای بهتر است.»
GPT-5.2 در میانه یک مسابقه تسلیحاتی با Gemini 3 گوگل قرار میگیرد که در اکثر بنچمارکها (به جز کدنویسی - که Claude Opus-4.5 آنتروپیک همچنان آن را در اختیار دارد) در صدر جدول LMArena قرار دارد.
اوایل این ماه، The Information گزارش داد که سم آلتمن، مدیرعامل، یادداشت داخلی «کد قرمز» را به کارکنان در بحبوحه کاهش ترافیک ChatGPT و نگرانیها مبنی بر از دست دادن سهم بازار مصرفکننده به گوگل، منتشر کرده است. کد قرمز خواستار تغییر اولویتها، از جمله توقف تعهداتی مانند معرفی تبلیغات و تمرکز بر ایجاد تجربه بهتر ChatGPT بود.
GPT-5.2 تلاش اوپنایآی برای بازپسگیری رهبری است، حتی در حالی که برخی از کارکنان گزارش شده خواستار به تعویق انداختن انتشار مدل بودند تا شرکت زمان بیشتری برای بهبود آن داشته باشد. و علیرغم نشانههایی مبنی بر تمرکز اوپنایآی بر موارد استفاده مصرفکننده با افزودن شخصیسازی و سفارشیسازی بیشتر به ChatGPT، عرضه GPT-5.2 به نظر میرسد فرصتهای سازمانی را تقویت کند.
این شرکت به طور خاص توسعهدهندگان و اکوسیستم ابزار را هدف قرار داده است و قصد دارد به پایه پیشفرض برای ساخت برنامههای کاربردی مبتنی بر هوش مصنوعی تبدیل شود. اوایل این هفته، اوپنایآی دادههای جدیدی منتشر کرد که نشان میدهد استفاده سازمانی از ابزارهای هوش مصنوعی آن در سال گذشته به شدت افزایش یافته است.
این در حالی است که Gemini 3 به طور تنگاتنگی در اکوسیستم محصولات و ابری گوگل برای گردش کارهای چندوجهی و عاملی ادغام شده است. گوگل این هفته سرورهای مدیریت شده MCP را راهاندازی کرد که خدمات گوگل و ابری آن مانند Maps و BigQuery را برای عوامل آسانتر میکند تا به آنها متصل شوند. (MCP ها اتصالات بین سیستمهای هوش مصنوعی و دادهها و ابزارها هستند.)
اوپنایآی میگوید GPT-5.2 امتیازات بنچمارک جدیدی را در کدنویسی، ریاضیات، علوم، بینایی، استدلال زمینه طولانی و استفاده از ابزار به دست آورده است که این شرکت ادعا میکند میتواند منجر به «گردش کارهای عاملی قابل اطمینانتر، کد در سطح تولید و سیستمهای پیچیدهای شود که در زمینههای بزرگ و دادههای دنیای واقعی عمل میکنند.»
این قابلیتها آن را در رقابت مستقیم با حالت Deep Think در Gemini 3 قرار میدهد که به عنوان یک پیشرفت استدلالی عمده با هدف ریاضیات، منطق و علوم معرفی شده است. در نمودار بنچمارک خود اوپنایآی، GPT-5.2 Thinking در تقریباً تمام تستهای استدلال ذکر شده، از وظایف مهندسی نرمافزار دنیای واقعی (SWE-Bench Pro) و دانش علمی در سطح دکترا (GPQA Diamond) گرفته تا استدلال انتزاعی و کشف الگو (مجموعه ARC-AGI)، از Gemini 3 و Claude Opus 4.5 آنتروپیک پیشی میگیرد.
ایدن کلارک، رهبر تحقیقات، گفت که نمرات قویتر ریاضی فقط به حل معادلات مربوط نمیشود. او توضیح داد که استدلال ریاضی معیاری برای این است که آیا یک مدل میتواند منطق چند مرحلهای را دنبال کند، اعداد را در طول زمان ثابت نگه دارد و از خطاهای ظریفی که میتوانند در طول زمان انباشته شوند، اجتناب کند.
کلارک گفت: «اینها همه ویژگیهایی هستند که در طیف گستردهای از کارهای مختلف اهمیت دارند. «مواردی مانند مدلسازی مالی، پیشبینی، تجزیه و تحلیل دادهها.»
در طول جلسه، مکس شوارتزر، مدیر محصول اوپنایآی، گفت که GPT-5.2 «بهبودهای قابل توجهی در تولید و اشکالزدایی کد ایجاد میکند» و میتواند ریاضیات و منطق پیچیده را گام به گام طی کند. او افزود که استارتاپهای کدنویسی مانند Windsurf و CharlieCode، «عملکرد کدنویسی عاملی در سطح پیشرفته» و پیشرفتهای قابل اندازهگیری در گردش کارهای پیچیده چند مرحلهای را گزارش میکنند.
فراتر از کدنویسی، شوارتزر گفت که پاسخهای GPT-5.2 Thinking حاوی 38 درصد خطای کمتر نسبت به نسل قبلی خود است و این مدل را برای تصمیمگیریهای روزمره، تحقیق و نوشتن قابل اعتمادتر میکند.
GPT-5.2 کمتر یک بازآفرینی و بیشتر یک ادغام از دو ارتقاء اخیر اوپنایآی به نظر میرسد. GPT-5 که در ماه اوت عرضه شد، یک بازنشانی بود که زمینه را برای یک سیستم یکپارچه با یک مسیریاب برای جابجایی مدل بین یک مدل پیشفرض سریع و یک حالت عمیقتر «Thinking» فراهم کرد. GPT-5.1 در ماه نوامبر بر گرمتر، مکالمهایتر و مناسبتر کردن آن سیستم برای وظایف عاملی و کدنویسی تمرکز داشت. آخرین مدل، GPT-5.2، به نظر میرسد که تمام این پیشرفتها را تقویت میکند و آن را به پایهای قابل اطمینانتر برای استفاده در تولید تبدیل میکند.
برای اوپنایآی، ریسکها هرگز بالاتر نبوده است. این شرکت تعهداتی به ارزش 1.4 تریلیون دلار برای توسعه زیرساختهای هوش مصنوعی در چند سال آینده برای حمایت از رشد خود داشته است - تعهداتی که زمانی که هنوز مزیت پیشگام در میان شرکتهای هوش مصنوعی را داشت، انجام داد. اما اکنون که گوگل، که در ابتدا عقب مانده بود، پیش میرود، این شرط ممکن است دلیل «کد قرمز» آلتمن باشد.
تمرکز مجدد اوپنایآی بر مدلهای استدلالی نیز یک حرکت پرخطر است. سیستمهای پشت حالتهای Thinking و Deep Research آن گرانتر از چتباتهای استاندارد هستند زیرا محاسبات بیشتری مصرف میکنند. با دو برابر کردن تمرکز بر این نوع مدل با GPT-5.2، اوپنایآی ممکن است یک چرخه معیوب را ایجاد کند: صرف هزینه بیشتر برای محاسبات برای برنده شدن در جدول رهگیری، سپس صرف هزینه بیشتر برای حفظ مقیاس این مدلهای پرهزینه.
گزارش شده است که اوپنایآی در حال حاضر بیش از آنچه قبلاً اعلام کرده بود، صرف هزینههای محاسباتی میکند. همانطور که TechCrunch اخیراً گزارش داد، بیشتر هزینههای استنتاج اوپنایآی - پولی که برای اجرای یک مدل هوش مصنوعی آموزشدیده صرف میکند - به صورت نقدی و نه از طریق اعتبارات ابری پرداخت میشود، که نشان میدهد هزینههای محاسباتی این شرکت فراتر از آنچه مشارکتها و اعتبارات میتوانند یارانهدهی کنند، افزایش یافته است.
در طول تماس، سیمو پیشنهاد کرد که با مقیاسپذیر شدن اوپنایآی، قادر به ارائه محصولات و خدمات بیشتر برای تولید درآمد بیشتر برای پرداخت هزینههای محاسباتی اضافی است.
سیمو گفت: «اما من فکر میکنم مهم است که این را در قوس بزرگ بهرهوری قرار دهیم. «شما امروز، هوش بسیار بیشتری را با همان مقدار محاسبات و همان مقدار پول نسبت به یک سال پیش دریافت میکنید.»
با وجود تمام تمرکز بر استدلال، یک چیز که در عرضه امروز غایب است، یک مولد تصویر جدید است. گزارش شده است که آلتمن در یادداشت کد قرمز خود گفته است که تولید تصویر یک اولویت کلیدی در آینده خواهد بود، به خصوص پس از اینکه Nano Banana گوگل (نام مستعار مدل تصویر Gemini 2.5 Flash گوگل) پس از عرضه در ماه اوت، لحظه ویروسی خود را داشت.
ماه گذشته، گوگل Nano Banana Pro (معروف به Gemini 3 Pro Image) را راهاندازی کرد، یک نسخه ارتقا یافته با رندر متن بهتر، دانش جهانی و حس «واقعی، بدون ویرایش و وهمآور» به عکسهای خود. همچنین در محصولات گوگل بهتر ادغام میشود، همانطور که در هفته گذشته نشان داده شد زیرا در ابزارها و گردش کار مانند Google Labs Mixboard برای تولید خودکار ارائهها ظاهر میشود.
گزارش شده است که اوپنایآی قصد دارد در ماه ژانویه مدل جدید دیگری را با تصاویر بهتر، سرعت بهبود یافته و شخصیت بهتر عرضه کند، اگرچه این شرکت روز پنجشنبه این برنامهها را تأیید نکرد.
اوپنایآی همچنین روز پنجشنبه اعلام کرد که در حال راهاندازی اقدامات ایمنی جدیدی در مورد استفاده از سلامت روان و تأیید سن برای نوجوانان است، اما بخش زیادی از عرضه را به تبلیغ این تغییرات اختصاص نداد.
این مقاله با اطلاعات بیشتر در مورد وضعیت بهرهوری محاسباتی اوپنایآی بهروز شده است.
یک نکته حساس یا اسناد محرمانه دارید؟ ما در حال گزارش در مورد عملکرد داخلی صنعت هوش مصنوعی هستیم - از شرکتهایی که آینده آن را شکل میدهند تا افرادی که تحت تأثیر تصمیمات آنها قرار میگیرند. با ربکا بلان در rebecca.bellan@techcrunch.com یا راسل براندوم در russell.brandom@techcrunch.com تماس بگیرید. برای ارتباط امن، میتوانید از طریق سیگنال با آنها در @rebeccabellan.491 و russellbrandom.49 تماس بگیرید.



