OpenAI در سال ۲۰۲۲ با رونمایی از ChatGPT، چتبات مبتنی بر مدلهای زبانی بزرگ، سر و صدای زیادی به پا کرد. این چتبات با دستیابی به ۱۰۰ میلیون نفر کاربر تا ژانویه سال ۲۰۲۳، لقب سریعترین رشد یک اپلیکیشن در تاریخ را به دست آورد. حال محصول جدید این شرکت، هوش مصنوعی مولد ویدئو Sora، ظاهراً انقلابی تازه در این حوزه به پا خواهد کرد. با ما در پلی پاد تی وی همراه باشید.
مدل هوش مصنوعی مولد Sora؛ انقلاب جدید تکنولوژی
ما با مدلهای تولید تصویر بر مبنای متن غریبه نیستیم. در واقع اگر هم غریبه بودیم، طی یکی دو سال اخیر، به لطف ترند وحشتناک تمام موضوعات مربوط به هوش مصنوعی، دیگر آنها را میشناسیم. مدل Midjourney که در جولای ۲۰۲۲ شروع به کار کرد، در همین حوزه فعالیت میکند. ۶ نسخهای که تاکنون از این مدل در دسترس قرار گرفتهاند، به تدریج به کیفیت خارقالعادهای رسیدهاند.
تشخیص برخی تصاویر مصنوعی ساخته شده با نسخه ششم مدل Midjourney، به شدت سخت است. حال، OpenAI، هوش مصنوعی مولد ویدئو Sora را در دسترس قرار داده که شباهت زیادی به چنین مدلهایی دارد. جالب است بدانید خود Midjourney هم از Dall-E، مدل یادگیری ماشینی این شرکت استفاده میکند!
از طرفی، نتیجه کار Sora به طرز حیرتانگیزی متمایز و طبیعی است. هر چند Sora هنوز در دسترس عموم کاربران قرار نگرفته، اما OpenAI نمونههایی از ویدئوهای تولید شده به کمک آن را منتشر کرده است. در همین حین، هر چند ما ویدئوهای نمونههای مشابه از گوگل، متا و Runway ML را قبلاً دیدهایم ولی به نظر میرسد Sora عصر جدیدی از مدلهای هوش مصنوعی مولد ویدئو است.
OpenAI چه زمانی Sora را عرضه میکند؟
سم آلتمن، مدیر عامل OpenAI چند روز پیش از کاربران شبکههای اجتماعی درخواست کرد ایدههای خودشان را برای ساخت ویدئو ارسال کنند. این ایدهها به صورت پرامپتهای متنی به مدل Sora ارائه میشوند. با انتشار هر چه بیشتر ویدئوهای نهایی، بهتر متوجه میشویم که چرا کاربران تا این حد شیفته سرویس جدید این شرکت شدهاند. هنوز مشخص نیست این استارتاپ آمریکایی، از چه منابعی برای تمرین مدل هوش مصنوعی مولد Sora استفاده میکند یا چه زمانی قرار است آن را به عموم عرضه کند.
صرفاً با استناد به پست بلاگ خود شرکت، میتوان ادعا کرد که پیش از عرضه این مدل، تیم سم آلتمن با هنرمندان و سایر افراد همکاری میکند. انتظار میرود این همکاریها از تولید ویدئوهایی با محتوای توهینآمیز، نفرتپراکن و جهتدار، تا حد زیادی جلوگیری کند. جدای از این موارد، رسانهها و کاربران بیشماری حدس میزنند OpenAI نگرانیهای زیادی درباره سواستفاده احتمالی از این ابزار قدرتمند دارد.
تصور کنید بشر بتواند ویدئوهایی تولید کند که ۹۰ درصد (حتی شاید ۱۰۰ درصد!) افراد به هیچ عنوان قادر به تشخیص مصنوعی بودن آنها نیستند! از سمت دیگر، بحثهای بسیاری مانند از بین رفتن شغل تدوینگران، عکاسان و هزاران حوزه دیگر مورد توجه است. ما هم مثل شما به این بحثها علاقهمند شدیم؛ بنابراین، پلی پاد تی وی را برای اخبار آینده، دنبال کنید.
منبع: EuroNews