in

هل يمكن للذكاء الصنعي فهم الخدع البصرية أو إنتاج خدع خاصة به!

يمكنُ لأنظمةِ الرؤية الآلية إعطاء نتائجَ صحيحة عند تعرُّف الوجوه، كما يُمكنها إنشاء وجوه مُصطَنَعة واقعية المظهر. لكن هل يُمكن لنفس هذه الأنظمة أن تتعرَّف الخدع البصرية أو تُنشئ خدعًا خاصّة بها؟

فلنستكشف ما توصّل إليه الباحثون بهذا الخصوص..

تُعدُّ الرؤية البشرية حاسة استثنائية؛ فعلى الرغم من أنها تطوّرت في بيئات مُحددة على مدى ملايين السنين، إلا أنها قادرة على إنجاز المهام التي لم تستطع الأنظمة البصرية السابقة تأديتها، والقراءة هي مثالٌ جيد على ذلك، كما حالُ تحديد الأشياء الاصطناعية مثل: السيارات والطائرات ولافتات الطريق، وهلُم جرًا.

مع ذلك، لنظام الرؤية البشري أوجهُ قصورٍ معروفة نُعاني منها مثل الخدع البصرية؛ فقد حدد الباحثون العديد من الطرائق التي تسبب فيها هذه الخدع في أن يُسيئَ البشر تقدير اللون والحجم والخطوط المستقيمة (الانتظام) والحركة.

الخدع نفسها مثيرةٌ للاهتمام؛ لأنها توفّر نظرةً ثاقبة إلى طبيعة الإدراكِ والنظام البصري. لذلك فإن الطرائق التي تؤدي إلى إيجاد أوهام جديدة تستكشف هذه الحدود ستكون مفيدة للغاية.

حيث يأتي التعلم العميق. في السنوات الأخيرة، تعلّمت الأنظمةُ والآلاتُ الذكية تعرُّفَ الأشياء والوجوه في الصور ومن ثَم إنشاء صور مماثلة بنفسها.

 ومن هُنا يسهلُ علينا تخيُّل أن نظام الرؤية الآلية سيكون قادرًا على تعرُّف الخدع ومن ثَم إنشاء أوهام خاصة به.

شارك كُل من روبرت ويليامز ورومان يامبولسكي من جامعة لويزفيل في كنتاكي في هذا بحث، مُحاولان القيامَ بهذا العمل الفذّ، لكنّهم وجدوا أن الأمور ليست بهذه البساطة؛ إذ لا تستطيع أنظمة تعلّم الآلة الحالية توليد أوهام بصرية خاصة بها، على الأقل حتى الآن.

لكن ما السبب؟

أولاً سنقدم نُبذة عن الموضوع: تستند التطورات الحديثة في التعلم العميق إلى تقدمين اثنين تحديدًا. التطور الأول هو توافر شبكات عصبونية قوية بالإضافة إلى واحد أو اثنين من البرامج الحاسوبية التي تُحسِّن من جودة تعلّمها.

أما التطور الثاني فهو إنشاء قواعد بيانات ضخمة يمكن أن تتعلم منها الآلات؛ فعلى سبيل المثال: يتطلب تدريب الآلة على تعرُّف الوجوه عدّةَ عشراتٍ من الآلاف من الصور التي تحتوي على وجوه مُصنَّفة بوضوح.

وباستخدام هذه المعلومات، يمكن للشبكة العصبونية أن تتعلم اكتشاف أنماط الوجه المميزة مثل: العيون، والأنف، والفم.

وما يثير الإعجاب أكثر من ذلك، أن زوجًا منهم يُدعى الشبكة التخاصُمية المولِّدة (generative adversarial network) يمكن أن يُعلِّمَ بعضهم بعضًا لخلق صور واقعية للوجوه، ولكنها مُزيفة في الحقيقة ومُصطَنَعة تمامًا.

شرع الباحثان  في تعليم الشبكة العصبونية تحديدَ الخدع البصرية بنفس الطريقة. إن القدرة الحصانية الحاسوبية (التي تعتمد على قوة المعالج وعدد العمليات الحسابية التي يجريها في الثانية الواحدة) مُتاحة بسهولة.

إلا أن قواعد البيانات الضرورية ليست كذلك. لذا كانت المهمة الأولى للباحثين هي إنشاء قاعدة بيانات من الخدع البصرية للتدريب.

تبين أن الأمر صعب؛ وذلك حسب قولهم في هذا التصريح: “يصل عدد صور الوهم البصري الثابت بالكاد لبضعة آلاف، وعدد الأنواع الفريدة من الخدع هو بالتأكيد منخفض جدًا، وربما فقط بضع عشرات”.

يمثل هذا تحديًا لأنظمة تعلم الآلة الحالية؛ وذلك وفقا للباحثين في قولهم: “إنشاء نموذج قادر على التعلم من مثل هذه البيانات الصغيرة والمحدودة من شأنه أن يمثل قفزة نوعية هائلة في نماذج التوليد وفهم الرؤية البشرية”.

لذا قام وليامز و يامبولسكي بتجميع قاعدة بيانات تضم أكثر من 6000 صورة للأوهام البصرية وجعلها مُتاحة لمن يرغب في استخدامها، ثم قاموا بتدريب شبكة عصبونية لتعرُّفها. بعدها بنوا شبكة تخاصُمية مولِّدة لإنتاج خداع بصري بنفسه.

ما نتاجُ هذا العمل؟

كانت النتائج مخيبة للآمال؛ يقول الباحثون: “لم يتم إنشاء أي شيء ذو قيمة بعد 7 ساعات من التدريب على Nvidia Tesla K80”.

ومع ذلك، فإن هذه نتيجة مثيرة للاهتمام. ويشيرون إلى أن “الخدع البصرية الوحيدة التي يعرفها البشر قد نشأت بسبب التطور (على سبيل المثال: أنماط العين في أجنحة الفراشة) أو من قبل الفنانين من البشر”.

في كلتا الحالتين، يشغلُ البشر دورًا حاسمًا من خلال تقديم تغذية راجعة قيّمة – يمكن للإنسان أن يرى الخداع البصري، لكنّ أنظمة الرؤية الآلية لا يمكنها ذلك.

يقول ويليامز ويامبولسكي: “يبدو أنه من غير المحتمل أن تتعلم الشبكة التخاصُمية المولِّدة خداع الرؤية البشرية دون القدرة على فهم المبادئ الكامنة وراء هذه الخدع”.

وهذه العملية قد لا تكون سهلة؛ لأن هناك اختلافات جوهرية بين أنظمة الرؤية الآلية ونظام الرؤية البشري. يقوم العديد من الباحثين بتطوير شبكات عصبونية تشبه نظام الرؤية البشري من كثب.

ربما يكون الاختبار المثير للاهتمام هو ما إذا كانوا يستطيعون رؤية الخدع أم لا.

وفي الوقت الحاضر، من الواضح أن وليامز ويامبولسكي ليسا متفائلين، وذلك في قولهما: “يبدو أن مجموعة من الصور الوهمية قد لا تكون كافية لخلق أوهام جديدة”.

لذا، تُعدُّ الخدع البصرية، حتى هذه اللحظة، معقلًا للتجربة الإنسانية التي لا يمكن للآلات غزوها أو التغلُّب عليها

المصادر:

  • ترجمة: ياسر طبيلة.
  • مراجعة: نور عبدو.

بواسطة ياسر طبيله

خريج هندسة كهربائية، مهتم بالتكنولوجيا والبرمجة والتطبيقات المتعلقة بإنترنت الأشياء (IoT).

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

ما هو النسيان النشط؟ وما هي أهميته في عملية التذكر؟

كيف تعمل الشوارب لدى الحيوانات؟