التعلم العميق

ذكاء اصطناعي يمكنك من مشاهدة تغير المعالم العالمية الشهيرة عبر التاريخ

طور باحثون من جامعة كورنيل وسيلة لصنع صور ثلاثية الأبعاد تظهر التغيرات بمرور الزمن، وتتكون من صور التقطها السياح لمعالم شهيرة حول العالم، مثل نافورة تريفي في روما أو ناطحة السحاب الشهيرة في نيويورك.

توظف الوسيلة المبتكرة خوارزميات التعلم العميق لجمع عشرات آلاف الصور غير الموسومة أو غير المؤرخة وتوليفها، ما يحل مشكلة حيرت الخبراء في علوم الرؤية الحاسوبية لعقود.

وصرح نوح سنيفلي، وهو أستاذ مساعد في علم الحاسوب بجامعة كورنيل «إنها وسيلة جديدة لنمذجة المشاهد على نحو يتيح رؤيتها من زوايا مختلفة، فضلًا عن إمكانية مشاهدة التغيرات بمرور الزمن.»

وصرح سنيفلي «إن أردت حقًا مشاهدة نافورة تريفي خلال إجازتك، فلن يستنى لك سوى مشاهدتها خلال فترة زمنية معينة، إذ تنار مساءً بمصابيح كشافة، وتكسوها أشعة الشمس صباحًا ما لم يكن الطقس غائمًا. غير أننا وثقنا مختلف المشاهد باختلاف الزمن والطقس، واستخدمنا لذلك كمًا هائلًا من الصور غير المنظمة، ما يتيح استكشاف المشهد كاملًا والتحرك حوله.»

وتبرز التحديات في الرؤية الحاسوبية عند محاولة تجسيد مشهد بصور واقعية، ويعزى ذلك جزئيًا إلى العدد الهائل من التراكيب الناتجة، إذ صرح سنيفلي «يحتمل العالم الحقيقي تنوعات هائلة في مشاهده، ويقدم أنواعًا مختلفة من المواد، كالأجسام الساطعة والمياه والتفاصيل الدقيقة.»

وتتمثل مشكلة أخرى في انعدام الاتساق في البيانات المتاحة. إذ أن وصف مشهد معين من كل زاوية ممكنة باختلاف الزمان والمكان ليس سهلًا أبدًا، وربما يكون ممكنًا إن توفرت مئات الكاميرات المثبتة حول المشهد، وسجلت البيانات ليلًا ونهارًا، لكن هذه الوسيلة ليست عملية، ما حمل الباحثين على تطوير وسيلة بديلة.

وصرح سنيفلي «قد لا تتوفر صورة ملتقطة عن الساعة الرابعة مساءً عند زاوية محددة، لذلك علينا مثلًا استنتاجها من صورة مأخوذة عند التاسعة مساءً من إحدى الزوايا، وصورة أخرى مأخوذة عند الساعة 4:03 مساءً من زاوية أخرى. ولا نعلم مستوى التفصيل التي التقطت عنده الصور، لكن خوارزميات تعلم الآلة تمكننا من استنتاج كيف بدى المشهد عند أي زمان أو مكان.»

أطلق الباحثون على هذه الوسيلة الجديدة اسم ديب ملتبلين إمجز، وهدفها استقراء المشهد بأربعة أبعاد؛ أي مشهد ثلاثي الأبعاد بالإضافة إلى الزمن. هذا النهج مستوحى جزئيًا من طريقة إعداد الرسوم المتحركة الكلاسيكية التي طورتها شركة والت ديزني في ثلاثينيات القرن الماضي، وتستخدم طبقات شفافة لابتكار تأثير ثلاثي الأبعاد دون إعادة رسم كل جانب من المشهد.

وأضاف سنيفلي «استخدمنا الفكرة ذاتها التي اخترعت لصنع تأثيرات ثلاثية الأبعاد في الرسوم المتحركة ثنائية الأبعاد، لكننا صنعنا تأثيرات ثلاثية الأبعاد في مشاهد العالم الحقيقي، وابتكرنا صورًا عميقة متعددة الطبقات بملائمة جميع القياسات المتباينة في صور السياح. وإنه لشيق أن نموذجنا منبثق عن طريقة كلاسيكية استخدمت في الرسوم المتحركة سابقًا.»

وأظهر الباحثون في دراستهم إمكانية تدريب النموذج على ابتكار مشهد اعتمادًا على 50 ألف صورة تقريبًا، شريطة أن تكون صورًا متاحة على مواقع مثل فليكر وإنستغرام. وينعكس فوائد هذا النموذج على علوم الرؤية الحاسوبية، وقد تلعب دورًا مهمًا في السياحة الافتراضية، وخاصة في ظل الظروف الراهنة.

وأضاف سنيفلي «يولد النموذج شعورًا لدى المشاهد بوجوده حقًا عند تلك المعالم، وأثبتت طريقتنا كفاءة عالية في معالم كثيرة حول العالم.»

– المصدر: ذكاء اصطناعي يمكنك من مشاهدة تغير المعالم العالمية الشهيرة عبر التاريخ على موقع مرصد المستقبل.

مرصد المستقبل

مرصد المستقبل هي منصة علمية عالمية لاستشراف المستقبل تعمل على تغطية آخر ما توصل له العلم وقطاع التكنولوجيا باللغة العربية بشكل يومي من خلال المقالات البحثية والإنفوجرافيك والمواد المرئية. المرصد هو ناتج شراكة استراتيجية بين مؤسسة دبي للمستقبل وشركة مرصد المستقبل ذ.ذ.م. يتكون فريق العمل من خبراء ومحللين من كلتا المؤسستين لتعزيز العلم والابتكار في المنطقة.