صنعت رسانه با «یادگیری عمیق» تکان می‌خورد

۱۳۹۸/۰۷/۲۲ - ۰۰:۰۰:۰۰
کد خبر: ۱۵۵۰۴۹
صنعت رسانه با «یادگیری عمیق» تکان می‌خورد

گروه دانش و فن|

مدیران صنعت رسانه و استودیوهای فیلمسازی همواره در حال کشف پتانسیل عظیم فناوری‌های مدرن هستند تا بتوانند با استفاده از قابلیت‌های موجود، نسل جدیدی از سرگرمی‌های ویدیویی را به تلویزیون و سینما وارد کنند. در این میان هوش مصنوعی، یادگیری ماشین و یادگیری عمیق کلمات کلیدی هستند که مدیران رسانه‌ای را با وعده توانایی‌های انقلابی جدید برای ایجاد و ویرایش ویدیو هیجان‌زده می‌کنند.

یادگیری عمیق (deep learning) زیرمجموعه‌ای از یادگیری ماشینی (machine learning) در هوش مصنوعی (artificial intelligence) است که از عملکرد مغز انسان در پردازش داده‌ها و ایجاد الگویی برای استفاده در تصمیم‌گیری تقلید می‌کند. یادگیری عمیق با عصر دیجیتال دست به دست هم داده‌اند و باعث ایجاد انفجار داده‌ها در همه اشکال و از هر منطقه جهان شده است. این داده‌ها که با عنوان داده‌های بزرگ شناخته می‌شوند، از منابع دیگری مانند رسانه‌های اجتماعی، موتورهای جست‌وجوی اینترنتی، سیستم عامل‌های تجارت الکترونیکی و سینماهای آنلاین گرفته شده‌اند. این حجم عظیم از داده‌ها به آسانی قابل دسترسی هستند و می‌توانند از طریق برنامه‌هایی مانند رایانش ابری به اشتراک گذاشته شوند. با این حال، داده‌ها، ‌که به‌طور معمول بدون ساختار هستند، چنان گسترده‌اند که برای درک و استخراج اطلاعات مربوط به آنها، چندین دهه طول ‌می‌کشد؛ اما شرکت‌ها پتانسیل باورنکردنی حاصل از کشف این ثروت از اطلاعات را درک می‌کنند و برای پشتیبانی خودکار به‌طور فزاینده‌ای با سیستم‌های هوش مصنوعی سازگار می‌شوند. هوش مصنوعی هر نوعی تلاشی است که باعث می‌شود کامپیوتر هوشمند به نظر برسد. اگرچه می‌توان در هر شرایطی به یک کامپیوتر گفت که دقیقا چه کاری انجام دهد، اما این بدان معناست که گویی این سیستم هیچ چیزی نیاموخته است؛ در مقابل یادگیری ماشین به دنبال این است که به کامپیوتر امکان یادگیری نحوه انجام برخی وظایف را بدهد تا بر اساس آن، کامپیوترها توانایی تعلم و یادگیری پیدا ‌کنند. روش‌های مختلفی برای این کار وجود دارد و یکی از این راه‌ها، تقلید از نورون‌ها در مغز بیولوژیکی است. وقتی این مغزهای مصنوعی یا شبکه‌های عصبی را پیچیده‌تر کنیم، یادگیری عمیق داریم. یادگیری عمیق به کامپیوتر این امکان را می‌دهد که یک ورودی را، برای مثال یکسل‌های موجود در یک قاب ویدیویی، دریافت کند، آنگاه داده‌ها را تغییر داده و در یک قالب جدید، اما به همان پیچیدگی به عنوان خروجی تحویل دهد. هرچه داده‌هایی که به عنوان ورودی به هوش مصنوعی تحویل داده شود، این سیستم برای خروجی‌هایی که مشابه آنها وجود ندارد، قدرتمند‌تر می‌شود. یکی از کاربردهای یادگیری عمیق، چگونگی ترجمه از زبانی به زبان دیگر توسط کامپیوترهاست؛ همچنین خودروهای خودران که امروزه بسیاری از شرکت‌های فناوری روی پروژه‌هایی با این مضمون کار می‌کنند هم بر این فناوری تکیه دارند؛ شرکت‌هایی هم هستند که از یادگیری عمیق برای تحلیل رفتار مشتری‌ در واحد بازاریابی خود استفاده می‌کنند تا بتوانند واکنش مشتریان را در موقعیت‌های خاص پیش‌بینی ‌کنند؛ دستیارهای دیجیتال هم از حوزه‌های کاربردی این فناوری هستند که با استفاده از شبکه عصبی، درخواست‌های کاربران را درک می‌کنند و به آنها پاسخ می‌دهند.

   ورود یادگیری عمیق به صنعت رسانه

با داشتن چنین ویژگی‌هایی، یکی از مهم‌ترین کاربردهای هوش مصنوعی و یادگیری عمیق، در صنعت رسانه و فیلمسازی است و در حال حاضر، یادگیری عمیق، تاثیر زیادی بر این صنعت دارد، همانطور که استودیوهای فیلمسازی از قابلیت‌های موجود فناوری‌های مدرن استفاده می‌کنند تا نسل جدیدی از سرگرمی‌های ویدیویی را به تلویزیون و سینما وارد کنند. یادگیری عمیق، مرز جدیدی در صنعت فیلمبرداری است که به متخصصان صنعت رسانه و فیلمسازان اجازه می‌دهد به صورت خودکار اقداماتی را انجام دهند که تا پیش از این، هفته‌ها به طول می‌انجامید یا انجام آنها به‌طور کلی غیرممکن بود. فرصت‌های متعددی برای به‌کارگیری روش‌های یادگیری عمیق در حوزه تولید ویدیو و ویرایش و بخش‌های دیگر وجود دارد. البته این فناوری در تولید ویدیو به خودکارسازی وظایف تکراری محدود نمی‌شود؛ بلکه می‌توان در فرایندهای تولید خلاقانه نیز از آن استفاده کرد. به‌علاوه بهبود فرایند توزیع ویدیو و حفظ آرشیو‌های بزرگ استودیوهای فیلمسازی نیز با یادگیری عمیق ممکن می‌شود.

گوگل ابزاری به‌صورت شبکه عصبی دارد که به‌صورت خودکار تصاویر پیش‌زمینه و پس‌زمینه ویدیو را از هم جدا می‌کند. چنین فرایندی قبلا به پرده سبز نیاز داشت و اکنون با سرعت و بهره‌وری بیشتری از طریق یادگیری عمیق انجام می‌شود. نرم‌افزارهای دیپ‌ فیک هم اخیرا اخبار متعددی در دنیای فناوری به خود اختصاص داده‌اند. با استفاده از این فناوری، از چهره فردی در ویدیو به عنوان فردی دیگر استفاده می‌شود. فناوری مشابه دیگری هم وجود دارد که پرتره‌های ثابت را متحرک می‌کند. ظرفیت‌های فناوری این‌چنینی در بخش جلوه‌های ویژه تولید فیلم بی‌شمار هستند. ترمیم ویدیوها و فیلم‌های قدیمی هم یکی دیگر از کاربردهایی است که با یادگیری عمیق می‌توان به آن دست یافت. آمار آرشیو UCLA Film & Television ادعا می‌کند تقریبا نیمی از فیلم‌های تولیدشده پیش از سال ۱۹۵۰ از بین رفته‌اند. در آماری بدتر می‌‌بینیم که ۹۰ درصد از کپی فیلم‌های کلاسیک در وضعیت مناسبی قرار ندارند. فرایند ترمیم این ویدیوها زمان‌بر و خسته‌کننده و هزینه‌بر است. یادگیری عمیق در چنین شرایطی کاربرد دارد و تغییری عظیم در فرایند ترمیم ایجاد می‌کند. فرایند رنگی‌کردن فیلم‌های سیاه‌و‌سفید همیشه زمان‌بر بوده است. هزاران فریم در یک فیلم وجود دارد و رنگی‌کردن هریک از آنها زمان زیادی می‌طلبد. حتی با ابزارهای بسیار حرفه‌ای هم فقط می‌توان بخشی از فرایند را خودکارسازی کرد. این در حالی است که با استفاده از یادگیری عمیق، فرایند رنگی‌کردن بسیار سریع‌تر انجام می‌شود. از مشکلات بزرگ دیگر در‌تریم ویدیوها می‌توان به حذف برخی از فریم‌ها اشاره کرد. قطعا فعالان این صنعت توانایی بازسازی و فیلمبرداری فریم‌هایی را ندارند که سال‌ها پیش تولید شدند. ترمیم آن فیلم‌ها قبلا کارآمد نبود؛ اما اکنون فناوری گوگل برای کمک به این بخش وارد عمل شده است. آنها ابزارهایی ساخته‌اند که فریم‌های از‌دست‌رفته را براساس فریم‌های قبل و بعد با کیفیتی نزدیک به واقعیت بازسازی می‌کنند. یادگیری عمیق همچنین با تشخیص چهره افراد حاضر در ویدیو،  قابلیت دسته‌بندی دقیقی ارایه می‌کند. به عنوان مثال، می‌توان در آرشیو فیلم‌ها، ویدیوهایی پیدا کرد که بازیگر خاصی در آنها حضور دارد. در رویکردی دیگر، می‌توان زمان دقیق حضور بازیگر را در فیلم مدنظر محاسبه کرد. فناوری مذکور فقط به تشخیص چهره در ویدیوها محدود نمی‌شود.رسانه‌های ورزشی امروزه از فناوری به‌کمک فیلمبردارها استفاده می‌کنند تا حرکت توپ یا دیگر مولفه‌های بازی مانند گل را شناسایی کنند. هوش مصنوعی با استفاده از ابزار تشخیص اجسام، خودکارسازی فرایندهای رسانه‌ای ورزشی را هم ممکن می‌کند. با استفاده از فناوری یادگیری عمیق، می‌توان حتی محتوای ایراددار را از ویدیوها حذف کرد تا محصول نهایی برای کاربر هدف مناسب باشد. در رویکردی مشابه، می‌توان ویدیو‌های جدید را براساس علایق قبلی کاربر به او پیشنهاد داد و به‌نوعی فهرستی شخصی‌سازی‌شده از محتوای رسانه‌ای ارایه کرد.

اکنون در مسیری قرار داریم که استریم با کیفیت 4K و تولید تلویزیون‌ها و نمایشگرهای 8K به روندی مرسوم در جهان فناوری تبدیل شده‌اند. درنتیجه همین افزایش کیفیت، استریم حجم بیشتری از داده مصرف می‌کند. افرادی که به اتصال پرسرعت دسترسی ندارند، قطعا با مشکلات افزایش حجم داده آشنا هستند. اگر شما نمایشگر 4K داشته باشید؛ اما سرعت اینترنت برای ارایه محتوای مدنظر کافی نباشد، قطعا بهره‌ای از خرید جدید خود نخواهید برد. شبکه‌های عصبی می‌توانند فریم‌های باکیفیت را برای ورودی‌هایی با ظرفیت کم بازسازی کنند؛ بنابراین در آینده نزدیک، می‌توان محتوایی با مصرف داده کمتر و کیفیت بیشتر را برای کاربران دارای اینترنت کم‌سرعت ارایه کنیم.

   آینده یادگیری عمیق در رسانه

استفاده از یادگیری عمیق برای تولید ویدیو و ایجاد تحولی در صنعت رسانه، هنوز در ابتدای راهی قرار دارد که حتما در آینده به پیشرفت‌های بیشتری منجر می‌شود و کارشناسان معتقدند که بهره‌گیری از فناوری یادگیری عمیق در صنعت رسانه آینده‌‌ای روشن دارد. البته نمی‌توان از این موضوع چشم‌پوشی کرد که یادگیری عمیق هم مانند هر تکنولوژی دیگر، بدون مشکل نیست، کما اینکه همین حالا هم استفاده از این فناوری برای تولید ویدیوهای دیپ‌فیک یا تشخیص چهره، مشکلاتی برای کاربران ایجاد کرده است، که این موضوع نشان می‌دهد نگرانی‌هایی درباره حریم خصوصی و مسائل اعتمادی، بر اثر پیشرفت سریع این فناوری، ایجاد خواهد شد. اما در عین حال، لازم است که صنعت موضوعات و مشکلات ناشی از این فناوری را مانند هر فناوری جدید دیگر، بررسی کرده و برای رفع آنها تلاش کند. متخصصان صنعت فیلمبرداری و فناوری باید برای تهیه استانداردهایی فناوری یادگیری عمیق در صنعت رسانه، هم‌فکری و تعامل داشته باشند. با وجود این، با در‌پیش‌گرفتن یک رویکرد صحیح، مزایای این فناوری به هر آنچه تا پیش از این بوده افزوده می‌شود و ابزارهای مفیدی دراختیار فعالان قرار می‌گیرد، بدین‌ترتیب دقیقاً همان‌گونه که ظهور فیلم‌های صدادار و رنگی‌ شدن آنها، تاثیر شگرفی بر صنعت رسانه گذاشت، یادگیری عمیق هم می‌تواند در آینده‌ای نزدیک، تحول عظیمی در این صنعت ایجاد کند.