متنفرم که عاشق «Rewind» مبتنی بر هوش مصنوعی Riverside برای پادکسترها شدم

این مقاله/پست توسط هوش مصنوعی ترجمه شده است، ممکن است دارای اشکالاتی باشد. برای دقت بیشتر، میتوانید منبع اصلی را مطالعه کنید.
پلتفرم ضبط پادکست آنلاین Riverside نسخه خود را از مرور پایان سال، شبیه به “Wrapped” اسپاتیفای ارائه کرد. این خلاصه که «Rewind» نام دارد، سه ویدئوی سفارشی برای پادکسترها ایجاد میکند.
به جای اشتراکگذاری آماری مانند تعداد دقایق ضبط شده یا تعداد قسمتهای ساخته شده، Riverside یک کلاژ ۱۵ ثانیهای از خندهها ایجاد کرد که مجموعهای سریع از کلیپها را نشان میدهد که در آن من و همکارم در پادکست یکدیگر را به خنده میاندازیم. ویدیوی بعدی مشابه است، با این تفاوت که یک سوپرکات از ماست که بارها و بارها «اِاِ» میگوییم.
سپس، Riverside رونوشتهای تولید شده توسط هوش مصنوعی از ضبطهای شما را اسکن میکند تا کلمهای را که بیش از هر کلمه دیگری گفتهاید پیدا کند (ما فرض میکنیم کلماتی مانند «و» یا «از» را حذف کردهاند).
کمی طنزآمیز است، اما در پادکست من درباره فرهنگ اینترنت، من و همکارم بیشتر از هر کلمه دیگری «کتاب» را گفتیم (این احتمالاً به دلیل ضبطهای «باشگاه کتاب» که فقط برای مشترکین بود... یا این واقعیت که همکارم کتابی در دست انتشار دارد که ما به طور مداوم تبلیغ میکنیم).
نمایش دیگر در شبکه پادکست ما، Spirits، بیشتر از هر کلمه دیگری «آماندا» را گفت (نه به این دلیل که شیفته من هستند، بلکه چون آنها نیز میزبان به نام آماندا دارند).
در اسلک شبکه پادکست، ویدیوهای Rewind خود را مبادله کردیم. چیز ذاتی خندهداری در ویدیویی از افرادی که بارها و بارها «اِاِ» میگویند وجود دارد. اما ما همچنین میدانیم که این ویدیوها نمایانگر چه چیزی هستند: ابزارهای خلاقانه ما با ویژگیهای هوش مصنوعی اشباعتر میشوند، که بسیاری از آنها را نمیخواهیم یا نیاز نداریم. Riverside Rewind به بیفایده بودن خود این ابزارها اشاره دارد - چرا من به ویدیویی از همکارم و خودم نیاز دارم که بارها و بارها کلمه «کتاب» را بگویند؟ برای یک خنده سریع خوب است، اما هیچ عمقی ندارد.
اگرچه از خلاصه هوش مصنوعی Riverside لذت بردم، اما زمان ورود آن در زمانی است که همکاران من در صنعت به دلیل همان ابزارهای هوش مصنوعی که ویدیوهای Rewind ما را تولید کردند، فرصتهای خود را برای ایجاد، ویرایش و تولید پادکستهای جدید از دست میدهند. اما در حالی که هوش مصنوعی به ما اجازه میدهد برخی از وظایف را خودکار کنیم - مانند ویرایش «اِاِ»ها و سکوتهای ما - خود پادکستسازی چندان مکانیکی نیست.
هوش مصنوعی میتواند به سرعت رونوشتی از پادکست من تولید کند، که برای دلایل دسترسی مهم است و به خودکارسازی فعالیتی کمک میکند که قبلاً بسیار زمانبر و خستهکننده بود. با این حال، هوش مصنوعی قادر به اتخاذ تصمیمات ویرایشی در مورد نحوه مدیریت صدا یا تصویر برای روایت مؤثر داستان نیست. برخلاف ویراستاران انسانی که با آنها کار میکنم، هوش مصنوعی نمیتواند تشخیص دهد که چه زمانی یک گفتگوی جانبی در پادکست خندهدار است و چه زمانی باید حذف شود زیرا خستهکننده است.
علیرغم ظهور ابزارهای صوتی شخصیسازی شده هوش مصنوعی، مانند NotebookLM گوگل، توانایی آن به عنوان یک ابزار خلاقانه نیز با شکستهای پر سر و صدایی روبرو شده است.
هفته گذشته، واشنگتن پست شروع به ارائه پادکستهای شخصیسازی شده و تولید شده توسط هوش مصنوعی درباره اخبار روز کرد.
میتوانید بفهمید چرا این ایده «خوبی» برای مدیران سودجو به نظر میرسد - به جای پرداخت هزینه به یک تیم برای انجام کار فشرده تحقیق، ضبط، ویرایش و توزیع یک نمایش روزانه، میتوانید آن را خودکار کنید - جز اینکه نمیتوانید.
این پادکستها نقل قولهای ساختگی و خطاهای واقعی را بیان کردند که برای یک سازمان خبری از نظر وجودی خطرناک است. طبق گزارش سمافور، آزمایشهای داخلی پست نشان داد که بین ۶۸ تا ۸۴ درصد از پادکستهای هوش مصنوعی نتوانستند استانداردهای این نشریه را برآورده کنند. این به نظر میرسد یک تفسیر اشتباه اساسی از نحوه کار LLMها باشد. شما نمیتوانید یک LLM را برای تمایز بین واقعیت و تخیل آموزش دهید زیرا برای ارائه آماریترین خروجی احتمالی به یک درخواست طراحی شده است، که همیشه صادقانهترین خروجی نیست - به خصوص در اخبار فوری.
Riverside در ساخت یک محصول سرگرمکننده پایان سال عالی عمل کرد، اما این یک یادآوری نیز هست. هوش مصنوعی در حال نفوذ به هر صنعتی، از جمله پادکستسازی است. اما در این لحظه از «رونق هوش مصنوعی»، در حالی که شرکتها با فناوریهای جدید سر و کله میزنند، ما باید بتوانیم بین زمانی که هوش مصنوعی به ما خدمت میکند و زمانی که خوراک لجن بیفایده است، تمایز قائل شویم.



