تکنولوژی

افکت Eye Contact Nvidia بازی را برای سازندگان ویدیو تغییر می دهد

افکت Eye Contact Nvidia بازی را برای سازندگان ویدیو تغییر می دهد

کنفرانس‌های ویدیویی، پادکست‌ها و وبینارها در طول سال‌های همه‌گیری در سال‌های 2020 و 2021 محبوبیت زیادی پیدا کردند، زیرا کار از راه دور به بخشی از عادی جدید تبدیل شد. با همه‌گیری اکنون در آینه دید عقب، فناوری‌های ارتباط تصویری هیچ نشانه‌ای از کاهش سرعت نشان نمی‌دهند.

چیزی که برای من سرگرم کننده بود این بود که علیرغم رواج ارتباطات ویدیویی، تعداد دفعاتی که ما با وب کم در دوربین ظاهر می شویم، وضوح پایین، ضعیف و کم توجه است. نور ضعیف، به ویژه هنگام استفاده از تماس های ویدیویی از خانه، بدون شک یک مشکل بزرگ است. وب کم های HD تعبیه شده در اکثر لپ تاپ ها، حتی لپ تاپ های پیشرفته، کمکی نمی کنند.

بدون دارایی‌های حرفه‌ای موجود در یک استودیوی تلویزیونی حرفه‌ای، سیاستمداران، افراد مشهور و کارشناسان صنعت اغلب هنگام مصاحبه از راه دور از خانه‌هایشان ترسیده به نظر می‌رسند.

تماس‌های کنفرانس ویدیویی معمول از خانه به‌ویژه در معرض ظاهر و احساس «ساعت آماتور» هستند، به‌ویژه در طول یک ارائه رسمی که در آن یک چشم سرگردان (مثلاً مستقیماً به یک وب‌کم نگاه نمی‌کند) می‌تواند حواس بیننده را پرت کند.

محل قرارگیری وب‌کم مسئول این اثر نامطلوب است زیرا دوربین معمولاً در بالای پنل لپ‌تاپ یا در یک پایه جداگانه قرار می‌گیرد که قرار دادن آن در مقابل مانیتور رومیزی دشوار است.

از آنجایی که کنفرانس ویدئویی معمولی با استفاده از رایانه رومیزی یا لپ تاپ عملکرد تله پرومتر مناسبی ندارد و پیچیده، حجیم و گران است، خواندن یادداشت های گوینده بدون اجتناب از پدیده آزاردهنده آن زاویه وحشتناک وب کم خیره شدن به بالا یا پایین تقریباً غیرممکن است. دماغت.

آیا راه های سریعی برای رفع مشکل نگاه چشم وجود دارد؟

راه های مختلفی برای کاهش این مشکل در راه اندازی دسکتاپ یا لپ تاپ معمولی وجود دارد. با این حال، این روش ها جذاب هستند و مشکل را برطرف نمی کنند.

چند شرکت وب‌کم‌های خارجی بسیار کوچکی را ارائه می‌کنند که اغلب بدون میکروفون داخلی مجهز هستند تا اندازه دستگاه را کاهش دهند و اجازه دهند آن را در مرکز صفحه نمایش، در مقابل هر متنی یا همان پنجره نمایشگر قرار دهد. از برنامه ویدیویی که استفاده می کنید.

این دوربین ها از سیم نازکی استفاده می کنند که در بالای صفحه نمایش سیم پیچ و بریده شده است. به این ترتیب، مستقیماً به وب‌کم نگاه می‌کنید و می‌توانید بیشتر، اما نه همه، مطالب ارائه یا متن خود را ببینید.


با این حال، روش دیگر استفاده از یک قطعه پلاستیکی شفاف اکریلیک است که به شما امکان می‌دهد تقریباً هر وب‌کمی را سوار کنید و آن را به بالای صفحه وصل کنید تا خود وب‌کم جلوی نقطه مرکزی صفحه وصل شود.

مزیت این روش این است که شما را آزاد می کند تا از وب کم مورد علاقه خود استفاده کنید. نکته منفی این است که اندازه وب‌کم و دستگاه پلاستیکی اکریلیک اغلب قسمت‌های زیادی از صفحه‌نمایش را مبهم می‌کند و به‌عنوان یک جایگزین از راه دور کمتر کاربرد دارد.

در آینده ممکن است شاهد نمایشگرهای لپ تاپ و رایانه های شخصی با وب کم های تعبیه شده در پشت پنل LCD باشیم که برای کاربر نامرئی هستند. در حالی که این یک راه حل ایده آل برای مشکلی است که در بالا توضیح دادم، اما نکته منفی این است که هزینه این پیشنهادات تخصصی بسیار بالا خواهد بود، که اکثر تولیدکنندگان به دلیل پیامدهای کشش قیمت، از ارائه آن ممانعت می کنند.

هوش مصنوعی می تواند مشکلات تماس چشمی را به راحتی و مقرون به صرفه برطرف کند.

ایده استفاده از هوش مصنوعی برای کاهش یا از بین بردن تماس چشمی در حین تماس‌های ویدیویی جدید نیست. وقتی به درستی انجام شود، هوش مصنوعی می‌تواند نیاز به خرید تجهیزات گران‌قیمت تله‌تکست را که توسط استودیوهای تلویزیونی استفاده می‌شود را از بین ببرد یا به برخی از تکنیک‌های حیله‌ای که در بالا توضیح دادم متوسل شود.

چالش استفاده از هوش مصنوعی برای انجام اصلاحات تماس چشمی در پرواز (زنده) یا حتی در یک سناریوی ضبط شده این است که برای انجام کارهای سنگین به اسب بخار نیاز دارد.

اپل سیلیکون چند سالی است که این قابلیت یکپارچه را با تراشه های آیفون خود دارد. بسیاری از کاربران نمی دانند که برنامه FaceTime اپل دارای اصلاح تماس چشمی است (که می توان آن را خاموش کرد)، که تضمین می کند چشمک زدن شما بدون توجه به جهت آیفون، روی مرکز صفحه متمرکز شده است.

تنظیمات تماس چشمی برای برنامه FaceTime اپل

تماس چشمی را در برنامه FaceTime اپل تنظیم کنید


مایکروسافت نیز برای رفع مشکلات تماس چشمی به حزب هوش مصنوعی پیوسته است. سال گذشته، اعلام کرد که با بهره‌گیری از قدرت راه‌حل‌های بازوی کوالکام و استفاده از واحد پردازش عصبی (NPU) برای بهبود ویدیو و صدا در جلسات – از جمله کادربندی سوژه، سرکوب نویز پس‌زمینه، و تاری پس زمینه

بسیاری از این ویژگی ها در حال حاضر در سرفیس پرو ایکس مایکروسافت که از تراشه Arm استفاده می کند، موجود است. با این حال، مایکروسافت امسال به طور گسترده این قابلیت را برای مدل‌های سازگارتر تولیدکنندگان بزرگ رایانه‌های شخصی عرضه خواهد کرد.

Nvidia با تماس چشمی پخش می شود

برنامه Broadcast Nvidia که روی طیف گسترده ای از کارت های گرافیک خارجی Nvidia اجرا می شود، یک ابزار قدرتمند هوش مصنوعی است که تماس های ویدیویی و ارتباطات را در رایانه های مبتنی بر x86 بهبود می بخشد. هفته گذشته، انویدیا این ابزار را در نسخه 1.4 بهبود بخشید تا از اجرای تماس چشمی خود پشتیبانی کند، که به نظر می رسد سوژه داخل ویدیو مستقیماً دوربین را تماشا می کند.

افکت جدید Eye Contact چشم‌های بلندگو را برای بازتولید تماس چشمی با دوربین تنظیم می‌کند. این توانایی با استفاده از اسب بخار هوش مصنوعی در پردازنده‌های گرافیکی انویدیا برای تخمین دقیق و تراز نگاه به دست می‌آید.

ویژگی تماس چشمی Nvidia Broadcast

افکت جدید Eye Contact در Nvidia Broadcast 1.4 چشم‌های بلندگو را برای شبیه‌سازی تماس چشمی با دوربین متحرک می‌کند. | اعتبار تصویر: Nvidia


مزیت رویکرد انویدیا این است که این قابلیت به یک پلتفرم یا برنامه ویدئو کنفرانس محدود نمی شود. اپل فقط از توانایی آنها برای اصلاح تماس چشمی با برنامه FaceTime در آیفون پشتیبانی می کند. با این حال، تعجب نمی‌کنم اگر اپل این قابلیت را به کاربران macOS در اواخر سال جاری همراه با قابلیت دوربین پیوسته گسترش دهد.

علاوه بر این، Nvidia Broadcast عملکرد مشابه Vignette را با آنچه بسیاری از کاربران برنامه اینستاگرام تجربه می کنند ارائه می دهد. به این ترتیب، Nvidia Broadcast می‌تواند یک تاری پس‌زمینه ساده برای یک تصویر تاری شبیه‌سازی شده با هوش مصنوعی در وب‌کم شما ایجاد کند و کیفیت تصویر را فوراً بهبود بخشد.

جایگزین کردن تصاویر پس زمینه در تماس های ویدیویی چیز جدیدی نیست. با این حال، رویکرد انویدیا قرار است کیفیت بهتری را ارائه دهد زیرا از قدرت کارت‌های گرافیکی خود استفاده می‌کند که برای تولید محتوای ویدیویی و بازی بهینه شده‌اند.

افکار پایانی

ویژگی تماس چشمی در برنامه Broadcast انویدیا در حال حاضر در مرحله بتا است و هنوز برای انتشار مناسب نیست. مانند هر ویژگی بتا، به ناچار از اشکالاتی رنج می برد و ما باید قضاوت رسمی در مورد کیفیت آن را تا زمانی که نسخه تولیدی در دسترس قرار گیرد به تعویق بیاندازیم.

علاوه بر این، Nvidia Broadcast فقط یک برنامه آماده برای استفاده نیست، بلکه یک SDK باز با ویژگی هایی است که می تواند در برنامه های شخص ثالث ادغام شود. این امکان‌های جدید جالبی را برای برنامه‌های شخص ثالث باز می‌کند تا مستقیماً از عملکرد Nvidia Broadcast استفاده کنند.

با وجود این، من از برخی بازخوردهای منفی که در چند سال گذشته در مورد چشم انداز استفاده از هوش مصنوعی برای اصلاح تماس چشمی به وجود آمده شگفت زده شده ام. برخی از تحلیلگران فنی از عباراتی مانند “عامل خزش” برای طبقه بندی این ویژگی به غیرجذاب ترین شکل ممکن استفاده کرده اند.


در واقع، اگر نتایج بعدی غیرطبیعی و مصنوعی به نظر برسند، این توانایی الهام‌بخش شوخی‌های زیادی خواهد بود، شاید شایسته آن باشد. با این حال، برچسب ترسناک اغراق آمیز و فریبنده به نظر می رسد. می‌توانید همین نکته را در مورد استفاده از آرایش یا ارسال ابزارهای بهبودیافته‌ای که نقص‌های صوتی را در طول تماس ویدیویی اصلاح می‌کنند، انجام دهید. برنامه هایی مانند TikTok یا Instagram بدون فیلترها که از نظر من عکس های ترسناک تری ایجاد می کنند، وجود ندارند.

چه بخواهیم چه نخواهیم، ​​ویدئو کنفرانس به عنوان یکی از نتایج مثبت دنیای پس از همه گیری باقی مانده است. استفاده از فناوری که تماس‌های ویدیویی سازنده‌تر، متقاعدکننده‌تر و تأثیرگذارتر را تسهیل می‌کند، چیزی است که باید از آن استقبال کنیم، نه تحقیر.

به عنوان فردی که یک پادکست ویدیویی هفتگی تولید می‌کند و پتانسیل حذف یا حتی کاهش نگاه چشم را درک می‌کند، که به نوبه خود می‌تواند مزایایی شبیه به تله پرومپتر ارائه دهد، مشتاقانه منتظر آزمایش این توانایی بسیار مورد نیاز در هفته‌های آینده هستم.

مشاهده بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا