افکت Eye Contact Nvidia بازی را برای سازندگان ویدیو تغییر می دهد
افکت Eye Contact Nvidia بازی را برای سازندگان ویدیو تغییر می دهد
کنفرانسهای ویدیویی، پادکستها و وبینارها در طول سالهای همهگیری در سالهای 2020 و 2021 محبوبیت زیادی پیدا کردند، زیرا کار از راه دور به بخشی از عادی جدید تبدیل شد. با همهگیری اکنون در آینه دید عقب، فناوریهای ارتباط تصویری هیچ نشانهای از کاهش سرعت نشان نمیدهند.
چیزی که برای من سرگرم کننده بود این بود که علیرغم رواج ارتباطات ویدیویی، تعداد دفعاتی که ما با وب کم در دوربین ظاهر می شویم، وضوح پایین، ضعیف و کم توجه است. نور ضعیف، به ویژه هنگام استفاده از تماس های ویدیویی از خانه، بدون شک یک مشکل بزرگ است. وب کم های HD تعبیه شده در اکثر لپ تاپ ها، حتی لپ تاپ های پیشرفته، کمکی نمی کنند.
بدون داراییهای حرفهای موجود در یک استودیوی تلویزیونی حرفهای، سیاستمداران، افراد مشهور و کارشناسان صنعت اغلب هنگام مصاحبه از راه دور از خانههایشان ترسیده به نظر میرسند.
تماسهای کنفرانس ویدیویی معمول از خانه بهویژه در معرض ظاهر و احساس «ساعت آماتور» هستند، بهویژه در طول یک ارائه رسمی که در آن یک چشم سرگردان (مثلاً مستقیماً به یک وبکم نگاه نمیکند) میتواند حواس بیننده را پرت کند.
محل قرارگیری وبکم مسئول این اثر نامطلوب است زیرا دوربین معمولاً در بالای پنل لپتاپ یا در یک پایه جداگانه قرار میگیرد که قرار دادن آن در مقابل مانیتور رومیزی دشوار است.
از آنجایی که کنفرانس ویدئویی معمولی با استفاده از رایانه رومیزی یا لپ تاپ عملکرد تله پرومتر مناسبی ندارد و پیچیده، حجیم و گران است، خواندن یادداشت های گوینده بدون اجتناب از پدیده آزاردهنده آن زاویه وحشتناک وب کم خیره شدن به بالا یا پایین تقریباً غیرممکن است. دماغت.
آیا راه های سریعی برای رفع مشکل نگاه چشم وجود دارد؟
راه های مختلفی برای کاهش این مشکل در راه اندازی دسکتاپ یا لپ تاپ معمولی وجود دارد. با این حال، این روش ها جذاب هستند و مشکل را برطرف نمی کنند.
چند شرکت وبکمهای خارجی بسیار کوچکی را ارائه میکنند که اغلب بدون میکروفون داخلی مجهز هستند تا اندازه دستگاه را کاهش دهند و اجازه دهند آن را در مرکز صفحه نمایش، در مقابل هر متنی یا همان پنجره نمایشگر قرار دهد. از برنامه ویدیویی که استفاده می کنید.
این دوربین ها از سیم نازکی استفاده می کنند که در بالای صفحه نمایش سیم پیچ و بریده شده است. به این ترتیب، مستقیماً به وبکم نگاه میکنید و میتوانید بیشتر، اما نه همه، مطالب ارائه یا متن خود را ببینید.
با این حال، روش دیگر استفاده از یک قطعه پلاستیکی شفاف اکریلیک است که به شما امکان میدهد تقریباً هر وبکمی را سوار کنید و آن را به بالای صفحه وصل کنید تا خود وبکم جلوی نقطه مرکزی صفحه وصل شود.
مزیت این روش این است که شما را آزاد می کند تا از وب کم مورد علاقه خود استفاده کنید. نکته منفی این است که اندازه وبکم و دستگاه پلاستیکی اکریلیک اغلب قسمتهای زیادی از صفحهنمایش را مبهم میکند و بهعنوان یک جایگزین از راه دور کمتر کاربرد دارد.
در آینده ممکن است شاهد نمایشگرهای لپ تاپ و رایانه های شخصی با وب کم های تعبیه شده در پشت پنل LCD باشیم که برای کاربر نامرئی هستند. در حالی که این یک راه حل ایده آل برای مشکلی است که در بالا توضیح دادم، اما نکته منفی این است که هزینه این پیشنهادات تخصصی بسیار بالا خواهد بود، که اکثر تولیدکنندگان به دلیل پیامدهای کشش قیمت، از ارائه آن ممانعت می کنند.
هوش مصنوعی می تواند مشکلات تماس چشمی را به راحتی و مقرون به صرفه برطرف کند.
ایده استفاده از هوش مصنوعی برای کاهش یا از بین بردن تماس چشمی در حین تماسهای ویدیویی جدید نیست. وقتی به درستی انجام شود، هوش مصنوعی میتواند نیاز به خرید تجهیزات گرانقیمت تلهتکست را که توسط استودیوهای تلویزیونی استفاده میشود را از بین ببرد یا به برخی از تکنیکهای حیلهای که در بالا توضیح دادم متوسل شود.
چالش استفاده از هوش مصنوعی برای انجام اصلاحات تماس چشمی در پرواز (زنده) یا حتی در یک سناریوی ضبط شده این است که برای انجام کارهای سنگین به اسب بخار نیاز دارد.
اپل سیلیکون چند سالی است که این قابلیت یکپارچه را با تراشه های آیفون خود دارد. بسیاری از کاربران نمی دانند که برنامه FaceTime اپل دارای اصلاح تماس چشمی است (که می توان آن را خاموش کرد)، که تضمین می کند چشمک زدن شما بدون توجه به جهت آیفون، روی مرکز صفحه متمرکز شده است.
تماس چشمی را در برنامه FaceTime اپل تنظیم کنید
مایکروسافت نیز برای رفع مشکلات تماس چشمی به حزب هوش مصنوعی پیوسته است. سال گذشته، اعلام کرد که با بهرهگیری از قدرت راهحلهای بازوی کوالکام و استفاده از واحد پردازش عصبی (NPU) برای بهبود ویدیو و صدا در جلسات – از جمله کادربندی سوژه، سرکوب نویز پسزمینه، و تاری پس زمینه
بسیاری از این ویژگی ها در حال حاضر در سرفیس پرو ایکس مایکروسافت که از تراشه Arm استفاده می کند، موجود است. با این حال، مایکروسافت امسال به طور گسترده این قابلیت را برای مدلهای سازگارتر تولیدکنندگان بزرگ رایانههای شخصی عرضه خواهد کرد.
Nvidia با تماس چشمی پخش می شود
برنامه Broadcast Nvidia که روی طیف گسترده ای از کارت های گرافیک خارجی Nvidia اجرا می شود، یک ابزار قدرتمند هوش مصنوعی است که تماس های ویدیویی و ارتباطات را در رایانه های مبتنی بر x86 بهبود می بخشد. هفته گذشته، انویدیا این ابزار را در نسخه 1.4 بهبود بخشید تا از اجرای تماس چشمی خود پشتیبانی کند، که به نظر می رسد سوژه داخل ویدیو مستقیماً دوربین را تماشا می کند.
افکت جدید Eye Contact چشمهای بلندگو را برای بازتولید تماس چشمی با دوربین تنظیم میکند. این توانایی با استفاده از اسب بخار هوش مصنوعی در پردازندههای گرافیکی انویدیا برای تخمین دقیق و تراز نگاه به دست میآید.
افکت جدید Eye Contact در Nvidia Broadcast 1.4 چشمهای بلندگو را برای شبیهسازی تماس چشمی با دوربین متحرک میکند. | اعتبار تصویر: Nvidia
مزیت رویکرد انویدیا این است که این قابلیت به یک پلتفرم یا برنامه ویدئو کنفرانس محدود نمی شود. اپل فقط از توانایی آنها برای اصلاح تماس چشمی با برنامه FaceTime در آیفون پشتیبانی می کند. با این حال، تعجب نمیکنم اگر اپل این قابلیت را به کاربران macOS در اواخر سال جاری همراه با قابلیت دوربین پیوسته گسترش دهد.
علاوه بر این، Nvidia Broadcast عملکرد مشابه Vignette را با آنچه بسیاری از کاربران برنامه اینستاگرام تجربه می کنند ارائه می دهد. به این ترتیب، Nvidia Broadcast میتواند یک تاری پسزمینه ساده برای یک تصویر تاری شبیهسازی شده با هوش مصنوعی در وبکم شما ایجاد کند و کیفیت تصویر را فوراً بهبود بخشد.
جایگزین کردن تصاویر پس زمینه در تماس های ویدیویی چیز جدیدی نیست. با این حال، رویکرد انویدیا قرار است کیفیت بهتری را ارائه دهد زیرا از قدرت کارتهای گرافیکی خود استفاده میکند که برای تولید محتوای ویدیویی و بازی بهینه شدهاند.
افکار پایانی
ویژگی تماس چشمی در برنامه Broadcast انویدیا در حال حاضر در مرحله بتا است و هنوز برای انتشار مناسب نیست. مانند هر ویژگی بتا، به ناچار از اشکالاتی رنج می برد و ما باید قضاوت رسمی در مورد کیفیت آن را تا زمانی که نسخه تولیدی در دسترس قرار گیرد به تعویق بیاندازیم.
علاوه بر این، Nvidia Broadcast فقط یک برنامه آماده برای استفاده نیست، بلکه یک SDK باز با ویژگی هایی است که می تواند در برنامه های شخص ثالث ادغام شود. این امکانهای جدید جالبی را برای برنامههای شخص ثالث باز میکند تا مستقیماً از عملکرد Nvidia Broadcast استفاده کنند.
با وجود این، من از برخی بازخوردهای منفی که در چند سال گذشته در مورد چشم انداز استفاده از هوش مصنوعی برای اصلاح تماس چشمی به وجود آمده شگفت زده شده ام. برخی از تحلیلگران فنی از عباراتی مانند “عامل خزش” برای طبقه بندی این ویژگی به غیرجذاب ترین شکل ممکن استفاده کرده اند.
در واقع، اگر نتایج بعدی غیرطبیعی و مصنوعی به نظر برسند، این توانایی الهامبخش شوخیهای زیادی خواهد بود، شاید شایسته آن باشد. با این حال، برچسب ترسناک اغراق آمیز و فریبنده به نظر می رسد. میتوانید همین نکته را در مورد استفاده از آرایش یا ارسال ابزارهای بهبودیافتهای که نقصهای صوتی را در طول تماس ویدیویی اصلاح میکنند، انجام دهید. برنامه هایی مانند TikTok یا Instagram بدون فیلترها که از نظر من عکس های ترسناک تری ایجاد می کنند، وجود ندارند.
چه بخواهیم چه نخواهیم، ویدئو کنفرانس به عنوان یکی از نتایج مثبت دنیای پس از همه گیری باقی مانده است. استفاده از فناوری که تماسهای ویدیویی سازندهتر، متقاعدکنندهتر و تأثیرگذارتر را تسهیل میکند، چیزی است که باید از آن استقبال کنیم، نه تحقیر.
به عنوان فردی که یک پادکست ویدیویی هفتگی تولید میکند و پتانسیل حذف یا حتی کاهش نگاه چشم را درک میکند، که به نوبه خود میتواند مزایایی شبیه به تله پرومپتر ارائه دهد، مشتاقانه منتظر آزمایش این توانایی بسیار مورد نیاز در هفتههای آینده هستم.