سیاست و بازاریابی

آخرين مطالب

موفقیت هوش مصنوعی مایکروسافت در رنگی‌کردن ویدئوها فقط با یک تصویر اخبار

  بزرگنمايي:

سیاست و بازاریابی - تلاش جدید تیمی از پژوهشگران نشان داد یادگیری ماشین به‌کمک هوش مصنوعی مایکروسافت می‌تواند ویدئوهای سیاه‌و‌سفید را تنها با یک تصویر مرجع رنگی، رنگی کند.

رنگی‌کردن ویدئوها ممکن است اثری هنری قلمداد شود. امروزه، مدل‌های جدید هوش مصنوعی کم‌کم به این حوزه نیز وارد شدند و می‌توانند اثری هنری خلق کنند. تیم دانشمندان مایکروسافت با همکاری دانشگاه حمد‌بن‌خلیفه و مؤسسه‌ی USC در بخش‌های تحقیقات آسیا (Research Asia) و ادراک هوش مصنوعی (AI Perception) و بخش واقعیت ترکیبی (Mixed Reality Division) پژوهشی جدید انجام داد و مقاله‌ای با عنوان رنگی‌کردن ویدئوها مبتنی‌بر نمونه‌ی مرجع (Deep Exemplar-based Video Colorization) در وب‌سایت Arxiv منتشر کرد. این پژوهش جدید دستاوردی در حوزه‌ی فناوری‌های خلاقانه است و پژوهشگران این تیم ادعا می‌کنند موفق شدند اولین سیستم سرتاسری مستقلِ مبتنی‌بر نمونه (مثلا برگرفته از تصویری مرجع) را در رنگی‌کردن ویدئوها ایجاد کنند. به‌گفته‌ی پژوهشگران مایکروسافت، این تحقیقات در هر دو بخش کمّی و کیفی به نتایجی فراتر از اثری هنری دست پیدا کرده است. نویسندگان این مقاله معتقدند: مسئله‌ی اصلی چگونگی دستیابی به ثبات زمانی (Temporal Consistency) است؛ درحالی‌که بتوان به سبک و ویژگی‌های تصویر مرجع وفادار ماند. تمام بخش‌های مختلف این مدل هوش مصنوعی که به‌صورت سیستم سرتاسری آموزش داده شده، باعث ایجاد ویدئوهای واقعی با پایداری زمانی (Temporal Stability) مناسب می‌شود. نویسندگان این مقاله خاطرنشان کردند توانایی هوش مصنوعی در تبدیل ویدئو‌های تک‌رنگی به ویدئوهای رنگی کار جدیدی نیست. برای نمونه، پژوهشگران انویدیا یکی از بزرگ‌ترین شرکت‌های فناوری جهان و غول پردازنده‌های گرافیکی ، در سپتامبر گذشته موفق شدند مدلی ارائه کنند که رنگ‌ها را از فریم فقط یک ویدئو رنگی‌شده استخراج می‌کرد. نمونه‌ی دیگر، هوش مصنوعی گوگل است که در ژوئن با ارائه‌ی الگوریتمی، ویدئوهای سیاه‌وسفید را بدون نظارت دستی انسان رنگی می‌کرد. بااین‌حال، نکته‌ی اصلی این است که خروجی تمام این مدل‌ها و الگوریتم‌های ارائه‌شده خطاها و آرتیفکت‌های بسیار دارد که مدت زمان ویدئو ورودی را افزایش می‌دهد.
برای مشاهده‌ی ابعاد اصلی روی تصویر کلیک کنید. پژوهشگران در تلاش برای کاهش این نقص‌ها در روشی جدید، نتیجه‌ی فریم ویدئو قبلی را به‌عنوان ورودی (برای حفظ ثبات) حفظ و با استفاده از تصویر مرجع جدید، ویدئو را رنگی‌ کردند. در بیشتر مدل‌های قبلی، رنگ صحیح اجسام درون تصویر را نمی‌شد به‌صورت مستقیم از تصویر سیاه‌وسفید به‌دست آورد؛ بنابراین، هوش مصنوعی باید می‌توانست نوع و رنگ اجسام را ازطریق یادگیری ماشینی که از چند میلیون عکس رنگی به‌دست آورد و به‌درستی پیش‌بینی کند. در این مدل، به تصویر نمونه‌ی مرجع اجازه‌ی هدایت رنگی‌کردن فریم‌به‌فریم ویدئو داده می‌شد که این کار باعث جلوگیری از تجمع خطاها کاهش تعداد آن‌ها می‌شد. در این مدل جدید، هنگام جلورفتن فریم‌به‌فریم ویدئو، رنگ فریم‌ها تغییر نمی‌کند؛ یعنی رنگ جدید محتوای ویدئویی سیاه‌وسفید با جلورفتن ویدئو در فریم‌های بعدی ثابت باقی می‌ماند. اگر تصویر مرجع یک فریم رنگی در ویدئو باشد، این کار همانند بسیاری دیگر از روش‌های رنگی‌کردن ویدئوها، اما بسیار قدرتمندتر و با دقت بیشتری انجام می‌شود؛ درنتیجه، این مدل جدید می‌تواند رنگ‌های «طبیعی» را براساس معانی ورودی تصویر سیاه‌وسفید پیش‌بینی کند. این مدل حتی می‌تواند زمانی‌که تطبیق مناسبی در تصویر مرجع یا فریم قبلی ارائه نشده باشد، پیش‌بینی مناسبی از معنای رنگ کند. دستیابی به چنین مدلی نیازمند معماری شبکه‌ی کانولوشن سرتاسری است. شبکه‌ی کانولوشن سرتاسری نوعی سیستم هوش مصنوعی است که برای تجزیه‌و‌تحلیل تصاویر دیداری از آن استفاده می‌شود و همراه‌با ساختاری مکرر است که اطلاعات تاریخی ازنظر زمانی را حفظ می‌کند. این مدل از دو ماژول تشکیل شده است: 1. مدل Correspondence که تراز تصویر مرجع را در فریم ورودی متناسب با معنای تراکم رنگ تنظیم می‌کند؛ 2. مدل رنگی‌کردن ویدئوها است که باتوجه‌به نتیجه‌ی رنگی‌شدن فریم فبلی و تراز تصویر مرجع، فریم ویدئو سیاه‌و‌سفید را رنگی می‌کند. مقاله‌های مرتبط:
رنگی کردن عکس‌ های قدیمی به کمک هوش مصنوعی پیتر جکسون چگونه فیلم‌های 100 ساله جنگ جهانی اول را رنگی کرد؟
تیم تحقیقاتی مجموعه‌ای از داده‌های آموزش‌دیده را از مجموعه‌ی متن‌باز Videvo گردآوری کردند که بیشتر شامل تصاویر حیوانات و مناظر بودند. آن‌ها پرتره ویدئوها را با استفاده از مجموعه‌ی جداگانه‌ای (هالیوود 2) کامل کردند و مجموع 768 ویدئویی را فیلتر کردند که بیش‌ازحد تصویر آن‌ها تاریک بود یا رنگ محوی داشتند. برای هر ویدئو، 25 فریم استخراج شد و دسته‌بندی داده‌ها را با عکس‌های ImageNet، مرکز داده‌ی وسیعی برای توسعه‌ی نرم‌افزارهای هوش مصنوعی گسترش دادند که برای اعمال تحریف هندسی تصادفی و مشخص‌کردن نویزها برای تولید فریم‌ها استفاده می‌شدند. نتیجه‌ی نهایی، تولید 70 هزار ویدئو تکمیل‌شده در «دسته‌‌بندی‌های گوناگون» بود. به‌گزارش نویسندگان این مقاله، در آزمایش‌های انجام‌شده‌ی این سیستم جدید، بهترین دقت کلاس Top-5 و Top-1 در ImageNet ارائه شده است. این نشان‌دهنده‌ی آن است که نتایج ازنظر معنایی معنادار بوده و آن را با کمترین مقدار Frechet Inception Distance یا FID در‌مقایسه‌با معیارهای بنچمارک مدیریت کرده که این کار باعث می‌شود خروجی بسیار واقعی‌تر باشد. پژوهشگران گفتند: به‌طورکلی، نتایج این مدل وایبرنت رنگی کمی دارند؛ اما شباهت زیادی با رنگ‌های زمینه عکس مرجع دارند. همچنین، این روش جدید در مقایسه‌ی کیفی نیز نتایج واقعی‌تری با وایبرنت رنگی‌سازی کمتری تولید می‌کند. علاوه‌براین در هر فریم، وایبرنت‌های رنگی با آرتیفکت‌های بسیار کمتری در‌مقایسه‌با مدل‌های قبلی وجود دارند. در‌عین‌حال، فریم‌های متوالی رنگی نشان می‌دهد هماهنگی ثبات زمانی مناسبی دارد.

لینک کوتاه:
https://www.siasatvabazaryabi.ir/Fa/News/76215/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

استاندار ایلام: از عملکرد اداره کل بنیاد شهید و امور ایثارگران استان رضایت داریم

تشخیص سرطان از یک قطره خون طی چند دقیقه

گوشی خوش‌قیمت جدید اوپو از شارژ 100 وات پشتیبانی می‌کند

غول باستانی که کوسه‌های سفید امروزی را کوتوله می‌کند!

اپل ظاهراً در تأمین نمایشگر OLED آیپد پرو 11 اینچی با محدودیت‌هایی روبه‌رو است

سرنوشت تیک‌تاک با تصویب قانون آمریکایی چه می‌شود؟

3 فضانورد چینی امروز راهی ایستگاه فضایی‌شان می‌شوند

غفلت از سرکشی به خانواده های شهدا پذیرفتنی نیست

هوش مصنوعی متن‌باز جدید اپل معرفی شد؛ پردازش بدون نیاز به اینترنت

این عینک، زبان اشاره را ترجمه می‌کند

مخترع ایرانی مدال برنز نمایشگاه اختراعات ژنو 2024 را کسب کرد

تصاویری خیره‌کننده از «ماه صورتی» در سراسر جهان

دو گوشی قدیمی به پایان چرخه عمر رسیدند و دیگر آپدیت نمی‌شوند

استفاده هکرها از دستگاه‌های سیسکو برای جاسوسی

ویدیویی از کاوشگر کنجکاوی که مناطق رسوبی در مریخ را نشان می دهد

تکریم و سپاسگزاری استاندار و مدیرکل بنیاد مازندران از والدین معزز شهیدان والامقام سروی

حضور مدیرکل بنیاد شهید و امور ایثارگران استان گلستان در برنامه زنده صبح عالی

بنیاد باید به نهاد راهبردی و مطالبه‌گر تبدیل شود

واتس‌اپ به ارسال پیام به شماره‌های ذخیره نشده و ورود با فیس‌آی‌دی مجهز می‌شود

توسعه روشی برای بهبود مصرف انرژی در دستگاه‌های مخابراتی

گلکسی زد فلیپ 5 از یک قابلیت هوش مصنوعی One UI 6.1 محروم است

اینترنت برای کنکور امسال قطع نمی‌شود؟

منتظر پیکسل تبلت 2 گوگل نباشید

اگر از تبلیغات داخل سیستم عامل متنفرید ویندوز 11 را آپدیت نکنید!

تعداد کاربران فعال اسپاتیفای 19 درصد رشد کرد

هوش مصنوعی شیطانی هم ساخته شد!

چرا اجرام زحمت در ایستگاه فضایی بین المللی شناور می شوند؟

قابلیت انقلابی واتساپ معرفی شد؛ انتقال فایل بدون نیاز به اینترنت

از هوش مصنوعی تا تماس ویدیویی؛ قابلیت‌های جدید عینک متا ری-بن را ببینید

قابلیت عجیب P70 پرو را ببینید؛ عضو پرآوازه خانواده هواوی

طرح تعویض رایگان سامسونگ برای گوشی هایی که این مشکل را دارند

برنامه/ فکرتان را به یک اثر هنری تبدیل کنید

نمایش داستان مرموز بازی INDIKA در تریلر جدید

این ویژگی امنیتی اندروید 15 شما را از اپلیکیشن‌های مشکل‌دار نجات می‌دهد

تعهد شرکت‌های پیشرو در هوش مصنوعی برای حفاظت از کودکان

با روش تخلیه الکتریکی آشنا شوید

با گوشی جدید هواوی می‌توان بدون اینترنت تصویر ارسال کرد!

هوش مصنوعی جدید گوگل می‌تواند جان شما را نجات دهد

مسیریابی بهتر نابینایان با عینک هوشمند ایرانی ممکن شد

آغاز به کار مرکز خدمات جامع سلامت فارابی کیش در گرامیداشت هفته سلامت

افتتاح پایگاه سلامت خانواده با محوریت مادر وکودک درمجتمع مسکونی مهستان کیش

فوری: رئیس‌جمهور آمریکا قانون فیلترشدن تیک‌تاک را امضا کرد

نقدها و نمرات بازی Stellar Blade منتشر شدند

ستاره هایی که درآسمان میبینیم چه اندازه ای هستند؟

افشای مشخصات پردازنده‌های اسنپدراگون X پلاس کوالکام

ناسا یک گام به کشف حیات بیگانه در مریخ نزدیک‌تر شد

خانواده شهدا پرچمداران اصلی ایثار و شهادت هستند/ نسل امروز نیازمند آشنایی با شهدا

مادسازان بازی GTA 5 را روی کنسول نینتندو سوییچ اجرا کردند

ریلمی 2 گوشی جدید و هیجان‌انگیز با نمایشگر 120 هرتز رونمایی کرد

گوشی پولستار رونمایی شد؛ وقتی خودروسازان وارد بازار موبایل می‌شوند