صنعت رسانه با «یادگیری عمیق» تکان میخورد
گروه دانش و فن|
مدیران صنعت رسانه و استودیوهای فیلمسازی همواره در حال کشف پتانسیل عظیم فناوریهای مدرن هستند تا بتوانند با استفاده از قابلیتهای موجود، نسل جدیدی از سرگرمیهای ویدیویی را به تلویزیون و سینما وارد کنند. در این میان هوش مصنوعی، یادگیری ماشین و یادگیری عمیق کلمات کلیدی هستند که مدیران رسانهای را با وعده تواناییهای انقلابی جدید برای ایجاد و ویرایش ویدیو هیجانزده میکنند.
یادگیری عمیق (deep learning) زیرمجموعهای از یادگیری ماشینی (machine learning) در هوش مصنوعی (artificial intelligence) است که از عملکرد مغز انسان در پردازش دادهها و ایجاد الگویی برای استفاده در تصمیمگیری تقلید میکند. یادگیری عمیق با عصر دیجیتال دست به دست هم دادهاند و باعث ایجاد انفجار دادهها در همه اشکال و از هر منطقه جهان شده است. این دادهها که با عنوان دادههای بزرگ شناخته میشوند، از منابع دیگری مانند رسانههای اجتماعی، موتورهای جستوجوی اینترنتی، سیستم عاملهای تجارت الکترونیکی و سینماهای آنلاین گرفته شدهاند. این حجم عظیم از دادهها به آسانی قابل دسترسی هستند و میتوانند از طریق برنامههایی مانند رایانش ابری به اشتراک گذاشته شوند. با این حال، دادهها، که بهطور معمول بدون ساختار هستند، چنان گستردهاند که برای درک و استخراج اطلاعات مربوط به آنها، چندین دهه طول میکشد؛ اما شرکتها پتانسیل باورنکردنی حاصل از کشف این ثروت از اطلاعات را درک میکنند و برای پشتیبانی خودکار بهطور فزایندهای با سیستمهای هوش مصنوعی سازگار میشوند. هوش مصنوعی هر نوعی تلاشی است که باعث میشود کامپیوتر هوشمند به نظر برسد. اگرچه میتوان در هر شرایطی به یک کامپیوتر گفت که دقیقا چه کاری انجام دهد، اما این بدان معناست که گویی این سیستم هیچ چیزی نیاموخته است؛ در مقابل یادگیری ماشین به دنبال این است که به کامپیوتر امکان یادگیری نحوه انجام برخی وظایف را بدهد تا بر اساس آن، کامپیوترها توانایی تعلم و یادگیری پیدا کنند. روشهای مختلفی برای این کار وجود دارد و یکی از این راهها، تقلید از نورونها در مغز بیولوژیکی است. وقتی این مغزهای مصنوعی یا شبکههای عصبی را پیچیدهتر کنیم، یادگیری عمیق داریم. یادگیری عمیق به کامپیوتر این امکان را میدهد که یک ورودی را، برای مثال یکسلهای موجود در یک قاب ویدیویی، دریافت کند، آنگاه دادهها را تغییر داده و در یک قالب جدید، اما به همان پیچیدگی به عنوان خروجی تحویل دهد. هرچه دادههایی که به عنوان ورودی به هوش مصنوعی تحویل داده شود، این سیستم برای خروجیهایی که مشابه آنها وجود ندارد، قدرتمندتر میشود. یکی از کاربردهای یادگیری عمیق، چگونگی ترجمه از زبانی به زبان دیگر توسط کامپیوترهاست؛ همچنین خودروهای خودران که امروزه بسیاری از شرکتهای فناوری روی پروژههایی با این مضمون کار میکنند هم بر این فناوری تکیه دارند؛ شرکتهایی هم هستند که از یادگیری عمیق برای تحلیل رفتار مشتری در واحد بازاریابی خود استفاده میکنند تا بتوانند واکنش مشتریان را در موقعیتهای خاص پیشبینی کنند؛ دستیارهای دیجیتال هم از حوزههای کاربردی این فناوری هستند که با استفاده از شبکه عصبی، درخواستهای کاربران را درک میکنند و به آنها پاسخ میدهند.
ورود یادگیری عمیق به صنعت رسانه
با داشتن چنین ویژگیهایی، یکی از مهمترین کاربردهای هوش مصنوعی و یادگیری عمیق، در صنعت رسانه و فیلمسازی است و در حال حاضر، یادگیری عمیق، تاثیر زیادی بر این صنعت دارد، همانطور که استودیوهای فیلمسازی از قابلیتهای موجود فناوریهای مدرن استفاده میکنند تا نسل جدیدی از سرگرمیهای ویدیویی را به تلویزیون و سینما وارد کنند. یادگیری عمیق، مرز جدیدی در صنعت فیلمبرداری است که به متخصصان صنعت رسانه و فیلمسازان اجازه میدهد به صورت خودکار اقداماتی را انجام دهند که تا پیش از این، هفتهها به طول میانجامید یا انجام آنها بهطور کلی غیرممکن بود. فرصتهای متعددی برای بهکارگیری روشهای یادگیری عمیق در حوزه تولید ویدیو و ویرایش و بخشهای دیگر وجود دارد. البته این فناوری در تولید ویدیو به خودکارسازی وظایف تکراری محدود نمیشود؛ بلکه میتوان در فرایندهای تولید خلاقانه نیز از آن استفاده کرد. بهعلاوه بهبود فرایند توزیع ویدیو و حفظ آرشیوهای بزرگ استودیوهای فیلمسازی نیز با یادگیری عمیق ممکن میشود.
گوگل ابزاری بهصورت شبکه عصبی دارد که بهصورت خودکار تصاویر پیشزمینه و پسزمینه ویدیو را از هم جدا میکند. چنین فرایندی قبلا به پرده سبز نیاز داشت و اکنون با سرعت و بهرهوری بیشتری از طریق یادگیری عمیق انجام میشود. نرمافزارهای دیپ فیک هم اخیرا اخبار متعددی در دنیای فناوری به خود اختصاص دادهاند. با استفاده از این فناوری، از چهره فردی در ویدیو به عنوان فردی دیگر استفاده میشود. فناوری مشابه دیگری هم وجود دارد که پرترههای ثابت را متحرک میکند. ظرفیتهای فناوری اینچنینی در بخش جلوههای ویژه تولید فیلم بیشمار هستند. ترمیم ویدیوها و فیلمهای قدیمی هم یکی دیگر از کاربردهایی است که با یادگیری عمیق میتوان به آن دست یافت. آمار آرشیو UCLA Film & Television ادعا میکند تقریبا نیمی از فیلمهای تولیدشده پیش از سال ۱۹۵۰ از بین رفتهاند. در آماری بدتر میبینیم که ۹۰ درصد از کپی فیلمهای کلاسیک در وضعیت مناسبی قرار ندارند. فرایند ترمیم این ویدیوها زمانبر و خستهکننده و هزینهبر است. یادگیری عمیق در چنین شرایطی کاربرد دارد و تغییری عظیم در فرایند ترمیم ایجاد میکند. فرایند رنگیکردن فیلمهای سیاهوسفید همیشه زمانبر بوده است. هزاران فریم در یک فیلم وجود دارد و رنگیکردن هریک از آنها زمان زیادی میطلبد. حتی با ابزارهای بسیار حرفهای هم فقط میتوان بخشی از فرایند را خودکارسازی کرد. این در حالی است که با استفاده از یادگیری عمیق، فرایند رنگیکردن بسیار سریعتر انجام میشود. از مشکلات بزرگ دیگر درتریم ویدیوها میتوان به حذف برخی از فریمها اشاره کرد. قطعا فعالان این صنعت توانایی بازسازی و فیلمبرداری فریمهایی را ندارند که سالها پیش تولید شدند. ترمیم آن فیلمها قبلا کارآمد نبود؛ اما اکنون فناوری گوگل برای کمک به این بخش وارد عمل شده است. آنها ابزارهایی ساختهاند که فریمهای ازدسترفته را براساس فریمهای قبل و بعد با کیفیتی نزدیک به واقعیت بازسازی میکنند. یادگیری عمیق همچنین با تشخیص چهره افراد حاضر در ویدیو، قابلیت دستهبندی دقیقی ارایه میکند. به عنوان مثال، میتوان در آرشیو فیلمها، ویدیوهایی پیدا کرد که بازیگر خاصی در آنها حضور دارد. در رویکردی دیگر، میتوان زمان دقیق حضور بازیگر را در فیلم مدنظر محاسبه کرد. فناوری مذکور فقط به تشخیص چهره در ویدیوها محدود نمیشود.رسانههای ورزشی امروزه از فناوری بهکمک فیلمبردارها استفاده میکنند تا حرکت توپ یا دیگر مولفههای بازی مانند گل را شناسایی کنند. هوش مصنوعی با استفاده از ابزار تشخیص اجسام، خودکارسازی فرایندهای رسانهای ورزشی را هم ممکن میکند. با استفاده از فناوری یادگیری عمیق، میتوان حتی محتوای ایراددار را از ویدیوها حذف کرد تا محصول نهایی برای کاربر هدف مناسب باشد. در رویکردی مشابه، میتوان ویدیوهای جدید را براساس علایق قبلی کاربر به او پیشنهاد داد و بهنوعی فهرستی شخصیسازیشده از محتوای رسانهای ارایه کرد.
اکنون در مسیری قرار داریم که استریم با کیفیت 4K و تولید تلویزیونها و نمایشگرهای 8K به روندی مرسوم در جهان فناوری تبدیل شدهاند. درنتیجه همین افزایش کیفیت، استریم حجم بیشتری از داده مصرف میکند. افرادی که به اتصال پرسرعت دسترسی ندارند، قطعا با مشکلات افزایش حجم داده آشنا هستند. اگر شما نمایشگر 4K داشته باشید؛ اما سرعت اینترنت برای ارایه محتوای مدنظر کافی نباشد، قطعا بهرهای از خرید جدید خود نخواهید برد. شبکههای عصبی میتوانند فریمهای باکیفیت را برای ورودیهایی با ظرفیت کم بازسازی کنند؛ بنابراین در آینده نزدیک، میتوان محتوایی با مصرف داده کمتر و کیفیت بیشتر را برای کاربران دارای اینترنت کمسرعت ارایه کنیم.
آینده یادگیری عمیق در رسانه
استفاده از یادگیری عمیق برای تولید ویدیو و ایجاد تحولی در صنعت رسانه، هنوز در ابتدای راهی قرار دارد که حتما در آینده به پیشرفتهای بیشتری منجر میشود و کارشناسان معتقدند که بهرهگیری از فناوری یادگیری عمیق در صنعت رسانه آیندهای روشن دارد. البته نمیتوان از این موضوع چشمپوشی کرد که یادگیری عمیق هم مانند هر تکنولوژی دیگر، بدون مشکل نیست، کما اینکه همین حالا هم استفاده از این فناوری برای تولید ویدیوهای دیپفیک یا تشخیص چهره، مشکلاتی برای کاربران ایجاد کرده است، که این موضوع نشان میدهد نگرانیهایی درباره حریم خصوصی و مسائل اعتمادی، بر اثر پیشرفت سریع این فناوری، ایجاد خواهد شد. اما در عین حال، لازم است که صنعت موضوعات و مشکلات ناشی از این فناوری را مانند هر فناوری جدید دیگر، بررسی کرده و برای رفع آنها تلاش کند. متخصصان صنعت فیلمبرداری و فناوری باید برای تهیه استانداردهایی فناوری یادگیری عمیق در صنعت رسانه، همفکری و تعامل داشته باشند. با وجود این، با درپیشگرفتن یک رویکرد صحیح، مزایای این فناوری به هر آنچه تا پیش از این بوده افزوده میشود و ابزارهای مفیدی دراختیار فعالان قرار میگیرد، بدینترتیب دقیقاً همانگونه که ظهور فیلمهای صدادار و رنگی شدن آنها، تاثیر شگرفی بر صنعت رسانه گذاشت، یادگیری عمیق هم میتواند در آیندهای نزدیک، تحول عظیمی در این صنعت ایجاد کند.