الثورة الصناعية 4.0

تقنية جديدة تتيح رقمنة ثلاثية الأبعاد للوجوه باستخدام فيديوهات الهاتف النقال العادي

ينتج استخدام الهاتف النقال لتصوير مقطع فيديو متواصل للوجه من الأمام والجوانب كمية ضخمة من البيانات. وبناءً على ذلك؛ طور فريق معهد الروبوت التابع لجامعة كارنيجي ميلون الأمريكية، طريقة من خطوتين لاستخدام تلك البيانات بمساعدة خوارزميات التعلم العميق للآلات، لإعادة تركيب رقمية للوجه.

ويتطلب تركيب وجوه ثلاثية الأبعاد بشكل دقيق وواقعي عادةً خبرات ومعدات باهظة الثمن، إلا أن الفريق البحثي نجح في تحقيق ذلك، باستخدام فيديو هاتف نقال عادي. وحققت التجارب دقة تصل إلى مستوى أقل من المليمتر، مع التفوق على العمليات الأخرى المعتمدة على الكاميرا.

وقد يُستخدَم الوجه الرقمي لبناء صورة رمزية للألعاب أو الواقع الافتراضي أو المعزز، فضلًا عن استخدامه في الرسوم المتحركة وعلم المقاييس الحيوية والإجراءات الطبية. وقد يفيد العرض الدقيق ثلاثي الأبعاد للوجه في بناء أقنعة جراحية أو أجهزة تنفس متخصصة.

وقد تنتج ماسحات الليزر الضوئية، وماسحات الضوء المرتب، ونظام كاميرات الاستوديو المتعددة عمليات مسح دقيقة جدًا للوجه، إلا أن أجهزة الاستشعار المتخصصة هذه باهظة الثمن لمعظم التطبيقات، في حين لا تتطلب تقنية الباحثين الجديدة سوى هاتفٍ نقال.

وشارك في تطوير الطريقة الجديدة الباحث سيمون لوسي، الأستاذ في معهد الروبوت، وطالبا الماجستير شوبهام أجراوال وأنوج باهوجا، وقدموا ابتكارهم الجديد في المؤتمر الشتوي لمعهد مهندسي الكهرباء والإلكترونيات الأمريكي لتطبيقات الرؤية الحاسوبية في كولورادو، وتبدأ الطريقة بتصوير فيديو من 15 إلى 20 ثانية. واستخدم الباحثون في هذه الحالة جهاز آي فون إكس مع ضبطه على وضعية الحركة البطيئة.

ونقل موقع تك إكسبلور عن لوسي أن «إعادة البناء ثلاثية الأبعاد للوجه شكلت مشكلة في البصريات الحاسوبية والرسومات، لحساسية الناس الكبيرة تجاه مظهر ملامح الوجه، إذ تبدو النتيجة النهائية غير واقعية، بسبب الشذوذات البسيطة في عمليات إعادة البناء. ومعدل الإطارات المرتفع الناتج عن وضع الحركة البطيئة هو أحد الأشياء الأساسية لطريقتنا، لأنه ينتج سحابة نقطية كثيفة.»

ويستخدم الباحثون بعد تسجيل الفيديو تقنية معروفة تُسمى التوطين المرئي ورسم الخرائط المتزامن (إس إل إيه إم)، وتُثلِّثُ إس إل إيه إم النقاط على سطح ما لحساب شكله، وتٌستخدَم هذه المعلومات في الوقت ذاته لتحديد موضع الكاميرا، ما يُنتج شكلًا هندسيًا أوليًا للوجه، إلا أن البيانات المفقودة تترك فجوات عليه.

وتتمثل الخطوة الثانية من هذه العملية بسد تلك الثغرات، إذ يستخدم الباحثون أولاً خوارزميات التعلم العميق للآلات بطريقة محدودة، إلا أنه يحدد مظهر الشخص ومعالمه؛ مثل الأذنين والعينين والأنف، ثم تُستخدَم تقنيات الرؤية الحاسوبية الكلاسيكية لملء الفجوات.

وقال لوسي إن «التعلم العميق للآلات أداة قوية نستخدمها يوميًا، إلا أنها تميل إلى حفظ ما تُنتِج من حلول كل مرة وهو ما يعمل ضد الجهود المبذولة لتمييز تفاصيل الوجوه. وإذا كنت تستخدم هذه الخوارزميات لاكتشاف المعالم فقط ستتمكن من استخدام الأساليب الكلاسيكية لملء الفجوات بسهولة أكبر.»

وتحتاج الطريقة الجديدة من 30 إلى 40 دقيقة معالجة، وتُنفَّذ بالكامل على الهاتف النقال، ولا تقتصر على الوجوه، إذ تُستخدَم لالتقاط هندسة أي جسم تقريبًا، ليتسنى بعد ذلك دمج عمليات إعادة البناء الرقمية لهذه الكائنات في رسوم متحركة، أو نقلها من خلال الإنترنت إلى أماكن إنتاجها بالطابعات ثلاثية الأبعاد.

– المصدر: تقنية جديدة تتيح رقمنة ثلاثية الأبعاد للوجوه باستخدام فيديوهات الهاتف النقال العادي على موقع مرصد المستقبل.

مرصد المستقبل

مرصد المستقبل هي منصة علمية عالمية لاستشراف المستقبل تعمل على تغطية آخر ما توصل له العلم وقطاع التكنولوجيا باللغة العربية بشكل يومي من خلال المقالات البحثية والإنفوجرافيك والمواد المرئية. المرصد هو ناتج شراكة استراتيجية بين مؤسسة دبي للمستقبل وشركة مرصد المستقبل ذ.ذ.م. يتكون فريق العمل من خبراء ومحللين من كلتا المؤسستين لتعزيز العلم والابتكار في المنطقة.