بازاریابی سیاسی

آخرين مطالب

موفقیت هوش مصنوعی سامسونگ در خلق تصاویر متحرک تنها با یک عکس اخبار

موفقیت هوش مصنوعی سامسونگ در خلق تصاویر متحرک تنها با یک عکس

  بزرگنمايي:

سیاست و بازاریابی - در مدلی جدید با استفاده از یادگیری ماشین، لابراتور هوش مصنوعی سامسونگ تنها با در اختیار داشتن یک عکس یا نقاشی از شخص می‌تواند تصویر متحرکی بسیار زنده خلق کند.

محققان حوزه یادگیری ماشین موفق به طراحی سیستمی شدند که می‌تواند تصویر متحرک شبیه‎سازی‌شده‌ی بسیار واقعی را تنها با یک فریم از چهره شخص و حتی یک نقاشی‌ بازسازی کند. این سیستم هنوز کامل نشده و در حال آزمایش است، اما زمانی‌که به سیستمی تمام عیار تبدیل شود، مانند دستاوردهای هوش مصنوعی ، بسیار جذاب و شگفت‌انگیز خواهد بود. این مدل در مقاله‌ای منتشر شده توسط مرکز تحقیقات هوش مصنوعی سامسونگ (Samsung AI Center) به‌ثبت رسیده است. امکان دسترسی به این مقاله در آرشیو Arxiv وجود دارد. این مدل جدید از روشی برای بازسازی چهره با دو الگوی چهره منبع و چهره هدف استفاده می‌کند. تمام نشانه‌های صورت، هر کدام از اجزای صورت که به هنگام صحبت کردن به‎کار گرفته می‌شود در چهره منبع (source face) ذخیره می‌شود. سپس این اطلاعات به‌دست آمده از صورت در چهره هدف (target face) اعمال می‌شود. این کار باعث می‌شود تا شبیه‌سازی صورت هدف از روی صورت منبع صورت گیرد یعنی چهره هدف همان کاری را انجام دهد که چهره منبع انجام می‌دهد. این مدل به‌نوبه خود جدید نیست، بلکه بخشی از موضوع تصویرسازی مصنوعی است که دنیای هوش مصنوعی در حال حاضر با آن روبه‌رو است. موضوع بسیار جذابی که اخیرا در رویداد رباتیک و هوش مصنوعی دانشگاه برکلی مورد بحث قرار گرفت. امکان شبیه‌سازی چهره به‌صورت ویدئویی ازطریق الگو قرار دادن چهره‌ای دیگر وجود دارد. به‌طوری که چهره ویدئویی می‌تواند حالت حرف زدن یا نگاه کردن شخصی را شبیه‌سازی کند. اما بسیاری از این مدل‌ها، نیازمند اطلاعات درخورتوجهی مانند، یک تا دو دقیقه از تجزیه و تحلیل دقیق ویدئویی هستند. مقاله‌های مرتبط:
آیا می‌توان به فناوری تشخیص چهره تفاوت نژادها را آموخت؟ حسگر تشخیص چهره، حریم خصوصی کاربران گوشی‌ هوشمند را تضعیف می‌کند
در مقاله جدیدی که از سوی پژوهشگران Samsung در مرکز مسکو منتشر شده است؛ آن‌ها موفق به ساخت ویدئویی، تنها با استفاده از یک تصویر فرد شدند که می‌توانست صورتش را بچرخاند، صحبت کند و عبارات عادی را بیان کند. اگرچه این ویدئو متقاعدکننده به‌نظر می‌رسید اما به دور از نقص نبود. ساخت این ویدئو با استفاده از فرایند شناسایی نشانه‌های صورت با به‌کارگیری داده‌های بسیار زیاد انجام شد. این مدل به‌دنبال بخشی از اجزای چهره هدف بود که با چهره منبع مطابقت پیدا می‌کرد. در این مدل هرچه داده‌ها بیشتر باشد، نتیجه بهتر و کامل‌تری حاصل می‌شود. این درحالی است که این داده‌ها فقط باید از یک تصویر به دست آمده باشند که به آن یادگیری تک‌شات (single-shot learning) گفته می‌شود. با استفاده از این مدل می‌توان با داشتن تنها یک تصویر از انیشتین ، مریلین مونرو یا حتی مونا لیزا تصاویر متحرکی از آن‌ها ساخت که گویا صحبت می‌کنند و صورتشان را مانند یک انسان واقعی حرکت می‌دهند.
برای نمونه، در تصویری که مشاهده می‌کنید مونا لیزا با سه چهره منبع مختلف به‌صورت انیمیشن شبیه‌سازی شده است که نتایج مختلفی در ساختار صورت و رفتار آن قابل مشاهده است. همچنین، این مدل از فناوری Generative Adversarial Network استفاده می‌کند. این فناوری با قرار دادن دو مدل دربرابر یکدیگر، تلاش بر فریب دیگری دارد تا بتواند بیننده را متقاعد کند که آنچه ایجاد شده واقعی است. این بدان معنا است که نتایج حاصل شده با سطح مشخصی از واقع‌گرایی از سوی سازندگان این مدل تعیین شده است. به‌طوری که در مدل discriminator با قطعیت 90 درصد گفته می‌شود که خروجی، تصویر یک انسان واقعی است. در نمونه‌های دیگری که از سوی پژوهشگران ارائه شد، کیفیت و وضوح چهره‌ی شبیه‌سازی شده‌ی درحال صحبت کاملا متفاوت بود. برخی تلاش کردند تا تصویر شخصی را از یک برنامه خبری تکثیر کنند و در آن حتی زیرنویس اخبار شبکه را در زیر تصویر با کمک اطلاعات ساختگی بازسازی کردند و جزئیات تصویری دیگر را نیز در آن گنجاندند. همان‌طور که گفته شد، این مدل جدید هنوز کامل نیست. این مدل تنها می‌تواند صورت و گردن به بالا را به‌صورت ویدئویی شبیه‌سازی کند. پس فعلا انتظار رقصیدن مونا لیزا یا دست زدن او را نداشته باشید.





نظرات شما

ارسال دیدگاه

Protected by FormShield

ساير مطالب

اعلام شکست گوگل در پروژه تحقیقاتی همجوشی سرد

سفارش آنلاین از سوپرمارکت ها با اسنپ فود

شیائومی عرضه نسخه بتای رابط کاربری MIUI را متوقف می‌کند

مایکروسافت امکان برنامه‌نویسی به‌زبان جاوا را در VS Code فراهم کرد

افسانه‌های استراتژی؛ شماره 9: استراتژی باید خارج از سازمان تنظیم شود

آفت اکوسیستم استارتاپی؛ از منتورنماها تا دنیای خوش آب‌ و‌ رنگ استارتاپی

تلاش چندین‌ ماهه گروهی از هکرها برای نفوذ به نیروگاه‌‌های برق آمریکا

هوش مصنوعی ادوبی تصاویر جعلی و دست‌کاری‌شده را شناسایی می‌کند

شرکت ایزی؛ نماینده برتر دی لینک در خاورمیانه و شمال آفریقا

هرآنچه باید درباره شارژ بی‌ سیم بدانید (قسمت اول)

پوکو لانچر 2 با طراحی پیشرفته و قابلیت‌های جدید منتشر شد

مرکز تحقیقات سرن نرم‌افزارهای مایکروسافت را به مقصد نرم‌افزارهای متن باز ترک می‌کند

چرا هواپیما هنگام فرود دچار ضربه می‌شود؟

فضای اختصاصی برای فرود خودرو پرنده در میامی ساخته می‌شود

لمان 2019 با قهرمانی تویوتا و آلونسو به پایان رسید

مصاحبه با اندی فنگ، بنیان‌گذار استارتاپ دوردش

مرورگر اج مایکروسافت احتمالا برای لینوکس هم عرضه می‌شود

نگاهی به 18 سال خاطره‌سازی آیتونز؛ کهنه‌سربازی که بازنشسته شد

تاثیر زندگی مدرن بر استخوان‌های انسان

AMD پردازنده‌ تردریپر 64 هسته‌ای تا پایان امسال عرضه می‌کند

طراحی سایت دود، روش متفاوتی از تبلیغات اینترنتی

نتیجه نظرسنجی: کاربران زومیت iPad OS و Mac Pro را جذاب‌ترین‌های WWDC امسال می‌دانند

گزینه‌های زیاد در هنگام انتخاب به مشکل تبدیل می‌شوند

نگاهی به پهپاد تحویل کالای جدید آمازون

آموزش انتقال لایسنس ویندوز 10 به کامپیوتر جدید

سری جدید نمایشگرهای هوشمند پورتال فیسبوک پاییز امسال عرضه می‌شود

دور نیمه‌نهایی مسابقات جام رمضان بازی زولا برگزار شد

خرید آنلاین بلیط چگونه سفر را برای ما به‌صرفه‌تر می‌کند؟

رندرهای جدید هواوی میت 30 پرو و احتمال استفاده از نمایشگر 90 هرتزی

تلاش سیگما برای احیای لنزهای APS-C

بهترین بازی‌های بتل رویال شبیه PUBG که باید تجربه کنید

نمایشگر وان پلاس 7 پرو در برخی کاربردها از 90 هرتز به 60 هرتز سوئیچ می‌کند

اپل احتمالا امسال هفت مک بوک جدید معرفی خواهد کرد

احتمال بازتولید رنو تندر 90 با قطعات ایرانی

پنج دلیل برای اینکه سرور دل را از زیگورات بخریم

جزئیات طرح جایگزین زوج یا فرد اعلام شد

نسخه بتا اندروید Q در دسترس 11 گوشی هوشمند شیائومی قرار می‌گیرد

چرا بازاریابی محصول از خود محصول مهم‌تر است؟

علت کج بودن برج پیزا چیست؟

همه‌چیز درباره برنامه‌نویس‌شدن: ماجراجویی در دنیای کدها

جزئیاتی تازه از نمایشگر بزرگ شاسی بلند برقی بایتون منتشر شد

تخصیص پویای منابع، مسئله‌‌‌ای ریاضی که جهان را در بن‌‌بست گرفتار کرده است

گوشی‌های هواوی برای ساعاتی لوگوی تبلیغاتی روی صفحه‌‌ قفل نمایش دادند

قلم نوری هویون در سامان کام

آموزش استفاده از Windows Sandbox در آپدیت ماه مه ویندوز 10

دانشمندان معمای سخت شدن سرخرگ‌ها را حل کردند

دوچرخه برقی eRockit معرفی شد

ژئوکدینگ، قابلیتی برای یافتن مقصد با وارد کردن آدرس در سرویس نقشه و مسیریاب بلد

گزارش زومیت از هشتمین دوره کار با موبایل (Galaxy Workshop) سامسونگ

آلودگی کربنی بیت‌ کوین در حد شهرهایی مثل لاس‌وگاس و هامبورگ است