مگ بلاگ

مولد متن به ویدیو سورا OpenAI امسال دسترسی عمومی را باز خواهد کرد

مولد متن به ویدیو سورا OpenAI امسال دسترسی عمومی را باز خواهد کرد

تولیدکننده ویدیوی OpenAI نه تنها می‌تواند از سبک‌های دوربین تقلید کند، بلکه می‌تواند ویدیوهایی را با چشم‌اندازهای خاص برای نمای دوربین ارائه دهد، در حالی که سطح خیره‌کننده‌ای از فوتورئالیسم را حفظ می‌کند. برخی از کارشناسان همچنین به چند شباهت وهم‌آور بین فیلم‌های استوک و خروجی Sora اشاره کرده‌اند که نشان می‌دهد این مدل بر اساس داده‌های در دسترس عموم آموزش داده شده است، اما دقیقاً نحوه استفاده از آن مشخص نیست.

با این حال، به نظر می رسد تمام این کیفیت و ظرافت بصری هزینه دارد. موراتی در مصاحبه‌اش گفت: «در حال حاضر، تولید کلیپ‌های ویدیویی سورا بسیار گران‌تر از تصاویر Dall-E است. در حال حاضر ساخت یک کلیپ ویدیویی 20 ثانیه ای از سورا چند دقیقه طول می کشد. فاکتور تمام قدرت محاسباتی مورد نیاز در فرآیند، و پتانسیل OpenAI برای شارژ بیش از میانگین اشتراک ChatGPT Plus غیر واقعی نیست.

با این حال، مجموعه داده‌های آموزشی مورد استفاده در مدل آن همچنان محل بحث است و موراتی در مورد نحوه آموزش سورا و عمق محتوا در مراحل آموزشی شفاف نبود. پس از انتشار عمومی این مدل، احتمالاً می‌تواند دستوری برای مشکلات قانونی باشد. جدا از شکایت ایلان ماسک، OpenAI نیز توسط نیویورک تایمز به دلیل ادعاهای حق چاپ شکایت کرد. تعداد انگشت شماری از نشریات دیگر از جمله The Intercept نیز علیه این شرکت شکایت کردند.

امتیاز شما به این نوشته چند است؟

ADS