بازاریابی سیاسی

آخرين مطالب

گوگل و هوش مصنوعی درگیر انیمیشن‌های واقعیت افزوده هستند اخبار

گوگل و هوش مصنوعی درگیر انیمیشن‌های واقعیت افزوده هستند

  بزرگنمايي:

سیاست و بازاریابی - جلوه‌های جدیدی که در اپلیکیشن‌های مختلف موبایل، به‌ویژه در حوزه‌ی ویدئو می‌بینیم، دنیایی از هوش مصنوعی را در پسِ خود دارند.

ماسک‌‌ها، عینک‌ها، کلاه‌ها و انواع دیگر محتوای مجازی که در اپلیکیشن‌های مختلف از اینستاگرام گرفته تا یوتیوب استوریز روی چهره‌های کاربران اضافه می‌شوند، جذابیت و زیبایی خاصی دارند. تابه‌حال از خود پرسیده‌اید این جلوه‌ها چگونه اجرا می‌شوند؟ بخش هوش مصنوعی گوگل به‌تازگی مقاله‌ای درباره‌ی همین جلوه‌ها منتشر کرده که جزئیات آن را به بهترین نحو برای علاقه‌مندان توضیح می‌دهد. مهندسان شاغل در مانتین ویو در مقاله‌ای بلند، جزئیات فناوری هوش مصنوعی در هسته‌ی استوری اپلیکیشن‌های مختلف را فاش و نکاتی نیز درباره‌ی API مشهور آن ARCore ذکر کردند. طبق ادعای آن‌ها، API مذکور می‌تواند انواع حالات از بازتاب نور محیط تا حالت چهره و حتی بازتاب نور از هر چهره را شبیه‌سازی کند. همه‌ی آن موارد هم فقط به کمک دوربین و به‌‌طور زنده اتفاق می‌افتند. آرتیسام آبلاواتسکی و ایوان گریشنکو، متخصصان گوگل در بخش هوش مصنوعی، در مقاله‌ی خود توضیح می‌دهند: یکی از مشکلات اصلی در تولید قابلیت‌های واقعیت افزوده‌، قراردادن محتوای مجازی در تصاویر دنیای واقعی است. آن فرایند به چندین فناوری به‌هم‌پیوسته نیاز دارد که توانایی ردگیری هندسه‌ی سطوح در حالت‌های بسیار پویای چهره‌ی افراد را داشته باشند؛ حالت‌هایی همچون خنده یا اخم یا پوزخند که هرکدام تغییراتی در سطوح چهره‌ی افراد ایجاد می‌کنند.
بخش اختصاصی گوگل در حوزه‌ی واقعیت افزوده ، از فناوری TensorFlow Lite استفاده می‌کند. آن فناوری نمونه‌ای سبک از فریم‌ورک یادگیری ماشین گوگل به‌نام TensorFlow محسوب می‌شود که برای کاربردهای خاص بهینه‌سازی شد. در موقعیت‌های مناسب، آن‌ها از پردازش بهینه‌سازی‌شده‌ی سخت‌افزارها بهره می‌برند که دو شبکه‌ی عصبی را باهم ترکیب می‌کند. اولین شبکه‌ی عصبی در فناوری اشاره‌شده تشخیص‌دهنده است که روی داده‌های دوربین فعالیت و موقعیت‌های چهره را پردازش می‌کند. شبکه‌ی دوم مدل مِش سه‌بعدی نام دارد که از داده‌های دریافت‌شده‌ی موقعیتی، برای پیش‌بینی هندسه‌ی سطوح بهره می‌برد. چرا از رویکردی با دو مدل استفاده می‌شود؟ متخصصان گوگل دو دلیل را برای آن توضیح می‌دهند. استفاده از آن رویکرد نیاز به تقویت دیتاسِت با داده‌های مصنوعی را کاهش می‌‌دهد و درنتیجه، سیستم هوش مصنوعی می‌تواند حداکثر ظرفیت خود را برای بهبود پیش‌بینی مختصات مِش به‌کار گیرد. هر دو بخش، برای جانمایی دقیق محتوای مجازی در جلوه‌ها حیاتی هستند. مرحله‌ی بعدی، مستلزم اجرای شبکه‌ی مِش در یک فریم تصویر دوربین است. تکنیک خاصی باید برای آن مرحله استفاده شود تا تأخیر در تصویر و اختلال آن را کاهش دهد. مِش مدنظر از فریم‌های ویدئویی بریده‌شده تولید می‌شود و مختصات را در داده‌های واقعی پیش‌بینی می‌کند. درنتیجه، موقعیت‌های سه‌بعدی و نیز احتمالات صورت‌های موجود در تصویر در فریم‌هایی با جانمایی مقبول ارائه می‌شود.
بهره‌گیری از شبکه‌ی عصبی پردازش موردنیاز برای تولید جلوه‌ها را بهینه می‌کند
بهبود کارایی و دقت در پروژه‌های AR، نتیجه‌ی بهره‌گیری بهینه از TensorFlow Lite هستند که نویسندگان مقاله‌ی مذکور اعتقاد دارند درکنار بهبود کارایی، به کاهش مصرف انرژی هم منجر می‌شود. به‌علاوه، آن‌ها نتیجه‌ی روندی هستند که پیش‌بینی مدل مِش‌ها را بهینه‌سازی و درنهایت، به تیم‌ها در مقابله با مشکلات خاص تصویرسازی کمک می‌کند. این مشکلات از حالت‌های چهره‌ها یا وضعیت نامناسب دوربین یا نور ایجاد می‌شوند. نکته‌ی درخورتوجه آن است که مسیرهای جدید پردازش واقعیت افزوده، فقط به یک یا دو مدل بسنده نمی‌کنند؛ درعوض، از تعدادی معماری خاص استفاده می‌کنند که با هدف پشتیبانی از دستگاه‌های متنوع طراحی شده‌اند. به‌عنوان مثال، نمونه‌های سبک‌تر به حافظه و قدرت پردازش کمتری نیاز دارند و درنتیجه، رزولوشن موردنیاز برای ورودی آن‌ها نیز کمتر (128 در 128) خواهد بود. البته، مدل‌های پیچیده‌تر تا رزولوشن 256 در 256 را پردازش می‌کنند. طبق تحقیقات نویسندگان مقاله، سریع‌ترین مدل مِش کامل در طرح آن‌ها، زمان پردازشی برابر با 10 میلی‌ثانیه دارد که روی گوشی گوگل پیکسل 3 آزمایش شد. اجرای مدل سبک‌تر زمان را به 3 میلی‌ثانیه کاهش داد. آزمایش نمونه‌ها روی آیفون X فقط کمی کُندتر بود: نمونه‌ی سبک‌تر با بهره‌گیری از GPU، پردازش را در 4 میلی‌ثانیه برای هر فریم انجام داد و نمونه‌ی سنگین و پیچیده‌تر، مِش کامل را در 14 ثانیه آماده کرد.





نظرات شما

ارسال دیدگاه

Protected by FormShield

ساير مطالب

دولت هند به‌دنبال افزایش فروش موتورسیکلت و اسکوترهای برقی است

جدی گرفته‌نشدن هکرهای کلاه‌سفید؛ تهدیدی بزرگ برای امنیت سرویس‌های ایرانی

فریم 62: بررسی میزان وفاداری Game of Thrones به منبع اقتباس، 5 سریال فوق‌العاده و عملکرد جان ویک 3 در گیشه

فوجی فیلم دوربین بدون آینه 102 مگاپیکسلی GFX100 را معرفی کرد

چرا بهره‌وری بیشتر از بازدهی اهمیت دارد؟

آیا لئوناردو داوینچی به اختلال کم‌توجهی‌ بیش‌فعالی مبتلا بود؟

کالبدشکافی مک‌ بوک پرو تلاش اپل برای رفع مشکل صفحه کلید پروانه‌ای را نشان می‌دهد

امکان انتخاب و خرید خطوط تلفن رند آسیاتل فراهم شد

آمار شکایت از کیفیت ساخت خودروهای تسلا در نروژ افزایش یافت

انرژی هسته‌ای؛ گزینه‌ای حیاتی برای حل مشکل تغییرات اقلیمی

مایکروسافت: xCloud حداکثر 3500 بازی را ازطریق فضای ابری استریم می‌کند

اسپیس ایکس 60 ماهواره از پروژه اینترنت جهانی را به فضا ارسال کرد

خودروی مفهومی بی‌ ام‌ و گارمیش کلاسیک بازتولید شد

خودروسازان فعلا حق پیش فروش ندارند

همه‌چیز درباره‌ی گرافیست‌شدن: درآمدزایی از دنیای رنگ‌ و طرح

جعبه دنده ZF، بهترین محصول در بازار جهانی است؟

چه انتظاری از رویداد توسعه دهندگان اپل داریم؟

هواوی نشان تجاری سیستم عامل هانگ‌منگ را ثبت کرد

دانشمندان به چگونگی ویرایش خاطرات نزدیک‌تر شده‌اند

زوم‌اپ؛ Walldrobe Wallpapers: حد اعلای تصاویر پس‌زمینه موبایل

امکان پرداخت قبض‌های AT&T ازطریق ارز دیجیتال فراهم شد

گجت پوشیدنی آمازون احساسات کاربر را از روی صدای وی تشخیص می‌‌دهد

بهترین پیشرانه‌های جهان در سال 2019 و تکرار موفقیت فراری

رولزرویس Wraith Eagle VIII معرفی شد

انواع خدمات ملکی و ثبت رایگان و نامحدود آگهی در آقای املاک

استفاده از ویروس عفونی‌کننده میمون برای تولید واکسن HIV

نسخه سفارشی از هوندا سیویک Type R مخصوص رالی ساخته شد

برنده جایزه 12 هزار دلاری سری دوم مسابقه LG Challenger Iran مشخص شد

فیسبوک در سال 2020 ارز دیجیتال خود را عرضه می‌کند

DNA باستانی مصر باستان اسرار پیدایش هندوانه اهلی را فاش کرد

جایگزین آئودی TT خودرویی الکتریکی خواهد بود

استون مارتین V8 زاگاتو کلاسیک با قیمت 670 هزار دلار فروخته شد

گسترش ناپایداری در صفحات یخی سرزمین جنوبی

هواوی نمی‌تواند از کارت حافظه میکرو اس دی در گوشی‌هایش استفاده کند

TSMC به همکاری خود با هواوی ادامه می‌دهد

پیش‌بینی کاهش 25 درصدی عرضه گوشی‌های هوشمند هواوی در سال 2019

هواوی چگونه می‌تواند از تحریم‌های آمریکا در امان بماند

ماینرهای بیت‌ کوین کش با حمله‌ی 51 درصد، تراکنش هکرها را بازگردانی کردند

بهترین بازی های اندروید و آیفون هفته اول خرداد 1398

افسانه‌های استراتژی؛ شماره 7: استراتژی را مشاوران تنظیم می‌کنند

تشکیل ماه باعث آمدن آب به زمین شد

سرفیس پرو 7 به درگاه USB C و تایپ کاور جدید مجهز خواهد بود

مسافران در سفرهای هوایی از چه حقوقی برخوردارند؟

چرا بوش به‌دنبال تحول در صنعت تاکسی هوایی است؟

آتلیه خود را با نورنگار تجهیز کنید

ربات هوشمند تحویل بسته فورد رونمایی شد

آیفون 2019 با دوربین سه‌گانه و آیفون 2020 با تاچ‌ آیدی تمام‌صفحه معرفی می‌شوند

شرق چین، منبع افزایش انتشار گازهای تخریبگر ازن است

بایدها و نبایدهای سفر به روسیه

خودروی الکتریکی اشکودا Citigo e iV رونمایی شد