in

علم البيانات، ثورة القرن!

ما هو علمُ البيانات؟ ما دوره في استخراج تحليلاتٍ ذاتِ معنى من مجموعات البيانات الضخمة والمعقّدة التي تحيط بنا؟ وهل تطويرُ المُنتجاتِ قائمٌ على البياناتِ حقاً؟ تابع معنا التفاصيل…

قبل كُلّ شيء علينا أن نفرّق بين مصطلحي البيانات والمعلومات؛ فالبيانات، هي مجموعة من الحروف أو الكلمات أو الأرقام أو الرموز أو الصور التي تكون متعلّقة بموضوع معيّن. أمّا المعلومات، هي البيانات التي تم تحليلها ومعالجتها بحيث أصبحت تحمل معاني مرتبطة بسياق معيّن. يكون لدينا بيانات غير متّسقة في البداية، وعند تحديد سياقها نحصل على معلومات، لنحلّلها ونعالجها ونربط عدّة معلومات بعضها مع بعض، حتى تنتج لدينا المعرفة.

لماذا نحتاج إلى علم البيانات؟

كانت البيانات، في ما سبق، مُهيكلة لكنّها صغيرة الحجم، ويمكن استخدام أدوات ذكاء الأعمال (Business Intelligence: BI) البسيطة. لكن على عكس تلك البيانات في الأنظمة القديمة، فإنّ مُعظم البيانات اليوم غير أو شبه مُهيكلة، ويوضّح الخط الزمني للبيانات، أنّه بحلول عام 2020، ستكون أكثر من 80% من البيانات المُجمّعة من قبل الشركات والمؤسسات في العالم غير مُهيكلة!

تُجمع هذه البيانات من مصادر مُختلفة مثل: السجلات المالية، والملّفات النصيّة، ونماذج الوسائط المتعدّدة، وأجهزة الاستشعار، والآلات. إلّا أنّ الأدوات البسيطة لذكاء الأعمال غير قادرة على معالجة هذا الكمّ الهائل والمتنوّع من البيانات. ومن هُنا نبعت الحاجة إلى أدوات وخوارزميات تحليليّة أكثر تعقيداً وتقدّماً لمعالجة وتحليل البيانات، وفهم هذه التحليلات بشكل دقيق وعميق، ودراستها من كل الجوانب.

ما هو علم البيانات؟

يمثّل علم البيانات مزيجاً من الأدوات المُختلفة، والخوارزميات، ومبادئ التعلّم الآلي، ويعتمد بشكل كبير على علم الإحصاء( أي التحليل الكمّي والنوعي للبيانات)، وذلك بهدف استكشاف الأنماط الخفيّة في البيانات الأولية، وفهم البيانات التي تمتلكها شركة أو مؤسسة معينة، واستخدامها في حل مشكلة معينة، أو تقديم نصائح لتحسين العمل وتجنب المشاكل في المستقبل.

هل تطوير المُنتجات قائمٌ على البيانات حقاً؟

يمكنك القول، وبثقة: نعم.

فماذا لو تمكنت من فهم المُتطلبات الدقيقة لعُملائك، باستخدام البيانات المتوفّرة فقط، مثل: العمر، والدخل، وسجّلات التصفح و محفوظات الشراء الخاصّة بهم؟

لا شكّ في أنّ الحصول على هذه المعلومات كان أمراً بديهيّاً وروتينيّاً، لكن الآن، ومع التضخّم والتنوّع الكبيرين للبيانات يمكن تدريب النماذج الخاصّة بالعُملاء بشكل أكثر فاعليّة واستحسان لإنتاج معلومات أكثر دقة. ألن يكون استحضار المزيد من الأعمال لشركتك أمراً مُذهلاً؟

لا بأس، فلنأخذ سيناريو آخر لفهم دور علم البيانات في عمليات اتخاذ القرار، ماذا لو كانت سيارتك ذاتية القيادة، وقادرة على قلّك إلى منزلك؟ إذْ تجمع السيارات ذاتيّة القيادة بيانات عن البيئة المُحيطة بشكل مُباشر وحيّ، عن طريق أجهزة الاستشعار، مثلىىى الرادارات، والكامرات، وأجهزة الليزر، لتصمّم خريطة لها، وتطبّق خوارزميات التعلّم الآلي عليها، لتقوم باتّخاذ قراراتٍ تخصّ الوقت المناسب للانعطاف، أو لزيادة السرعة، أو تخفيضها.

أيضاً، يُستخدم علم البيانات في التحليلات التنبؤيّة الإحصائية، كالتنبؤ بالطقس، على سبيل المثالة؛ إذْ تُجمع البيانات في هذه الحالة من السفن، والطائرات، والرادارات، والأقمار الاصطناعية، ومن ثمّ تُحلّل لبناء النماذج. ليس التنبؤ بالطقس فحسب، وإنما ستساعد أيضاً على التنبؤ بأي كوارث طبيعية مُحتملة، واتخاذ التدابير الوقائية المُناسبة لإنقاذ أرواح الناس.

لا تتوقف المجالات التي يُستخدم فيها علم البيانات هُنا، إذ للبحث على الويب نصيبٌ فيه؛ ولنكون أكثر دقّة، بحث غوغل (Google Search)، الذي تستخدمُه عشرات المرّات كلّ يوم. تلاحظ أنّه عند بحثك عن كلمة أو عبارة معيّنة لا يقدّم لك النتائج المتعلّقة بها فقط، وإنما يستخدم كل البيانات المُتاحة عن سلوكك على الويب، والأمور التي قمت بالبحث عنها سابقاً، وعمرك، وجنسك، وما إلى ذلك.

أيضاً، تُعدّ نُظُم الاقتراح أو التوصية ( Recommendation Systems) من أكثر التطبيقات المُستخدِمة لعلم البيانات، حيث تعتمد على اهتمامات وسلوك المُستخدم وبعض المعلومات الشخصية، لتقترح له مواداً أو منتجاتٍ أو إعلانات قد تعجبه، فلنأخذ على سبيل المثال، خدمة Netflix، التي تتيح لمستخدميها مشاهدة العروض التلفزيونية، والأفلام، والوثائقيات، وغيرها.

ويأتي دور أنظمة الاقتراح هذه في اقتراح أفلام أو عروض جديدة من الممكن أن تصبّ لدى اهتمامات المستخدم، وذلك بالاعتماد على نمط الأفلام التي يشاهدها، والأفلام الأخيرة التي شاهدها، وجنسه وعمره والتقييمات التي وضعها على الأفلام.

وكمثال حيّ ومُفصّل عن توظيف علم البينات في التطبيقات الذكيّة، يمكنك قراءة مقالنا عن تنبؤ خوارزميات الذكاء الصنعي بفائز كأس العالم، إطّلع على آلية التنبؤ وانتبه إلى الكم الهائل والضخم من البيانات المُستخدمة في الخوارزميات.

لا يمُكن حصر علم البيانات في مجالات محدّدة أو استخدامات مُعيّنة يُمكن القول إنه يدخل كعلم أساسيّ في أي تطبيقٍ يُراد تصميمه، أو خدمة يُراد تقديمها. لم تنتهِ رحلتنا هُنا، انتظر مقالنا القادم عن وظيفة عالم البيانات، وتعرّف إلى المهنة ذات الأجر الأكبر في العالم، و على كيفية الحصول عليها.

  • إعداد: نور عبدو.

بواسطة نور عبدو

تعليق واحد

ضع تعليقك

One Ping

  1. Pingback:

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

سلسلة علوم الحاسوب -11- الحوسبة التفرعية (الجزء الثاني)

شيء من لاشيء