صفحة 22 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 خصائص البيانات الضخمة وتقنيات إدارتها

المفاهيم الأساسية

القيمة (Value): مدى فائدة البيانات في اتخاذ القرارات، واستخراج التوصيات والأفكار من خلال التحليلات المناسبة.

الموثوقية (Veracity): دقة وصدق مجموعة البيانات، وترتبط بمصداقية المصدر ونوع البيانات وكيفية معالجتها.

الحجم (Volume): كميات كبيرة من البيانات غير المنظمة قليلة الكثافة، قد تصل إلى عشرات أو مئات التيرابايت.

السرعة (Velocity): معدل التقاط البيانات وتخزينها، حيث تنتج من الأجهزة الذكية في الوقت الحقيقي أو قريب منه.

خريطة المفاهيم

```markmap

البيانات الضخمة (Big Data)

التعريف

  • بيانات كبيرة جدًا أو معقدة
  • لا يمكن معالجتها بالطرق التقليدية
  • تخزينها ومعالجتها تحدي كبير

الخصائص الخمس (5V's)

التنوع (Variety)

  • أنواع مختلفة من البيانات
  • منظمة (قواعد بيانات تقليدية)
  • غير منظمة (نصوص، صوت، فيديو)
  • شبه منظمة

القيمة (Value)

  • الفائدة المستخلصة من البيانات لاتخاذ القرارات
  • استخراج التوصيات والأفكار عبر التحليل

الحجم (Volume)

  • كميات هائلة من البيانات غير المنظمة قليلة الكثافة
  • قد تصل إلى عشرات أو مئات التيرابايت
  • مصدرها: تصفح الويب، تطبيقات الهاتف، أجهزة إنترنت الأشياء

الموثوقية (Veracity)

  • دقة وصدق مجموعة البيانات
  • تعتمد على مصداقية المصدر ونوع البيانات وكيفية معالجتها

السرعة (Velocity)

  • معدل التقاط البيانات وتخزينها
  • تنتج من الأجهزة الذكية في الوقت الحقيقي أو قريب منه

تقنيات إدارة البيانات الضخمة

الهدف

  • استخراج قيمة الأعمال من البيانات
  • تحسين تجربة الشراء وجذب الزبائن
  • اتخاذ قرارات مدروسة (تعديل الأسعار، الحملات التسويقية)

مصادر البيانات

  • داخلية: المبيعات، التصنيع، المحاسبة
  • خارجية: إحصاءات سكانية، بيانات المنافسين

البنية التحتية والتقنيات

  • مستودعات البيانات (Data Warehouses)
  • بحيرات البيانات (Data Lakes)
  • الحوسبة في الذاكرة (In-memory Computing)
```

نقاط مهمة

  • قيمة البيانات لا تكمن في كميتها بل في الفائدة المستخلصة منها لاتخاذ القرارات.
  • تتطلب البيانات الضخمة تقنيات وأدوات جديدة للإدارة والتحليل.
  • تستخدم الشركات تحليل البيانات (مثل سلوك التصفح) لتحسين مواقعها ومنتجاتها واستراتيجياتها التسويقية.
  • تجمع الشركات البيانات من مصادر داخلية وخارجية لفهم الوضع الحالي والمستقبلي وتأثيرات السوق.

📄 النص الكامل للصفحة

--- SECTION: Value القيمة --- إن جمع الكثير من البيانات لا يعني أن تلك البيانات هي ذات قيمة، فقيمة البيانات تتمثل في إمكانية الحصول على التوصيات والوصول إلى بعض الأفكار من خلالها. يشير مصطلح القيمة إلى مدى فائدة البيانات في اتخاذ القرارات، وبالطبع فإن إجراء التحليلات المناسبة هو وسيلة استخراج قيمة البيانات الضخمة. --- SECTION: Veracity الموثوقية --- ترتبط صحة البيانات بمدى دقة مجموعة البيانات أو موثوقيتها . لا ترتبط الموثوقية بجودة البيانات نفسها فحسب، بل أيضًا بمدى مصداقية مصدر البيانات ونوعها وكيفية معالجتها. --- SECTION: Volume الحجم --- نظرا لأنه يجب معالجة كميات كبيرة من البيانات غير المنظمة والتي تتميز بقلة الكثافة وتسمى (low density (data) ، فإن كم البيانات يُعد جانبًا مهما في البيانات الضخمة. يمكن أن تكون قيمة بعض هذه البيانات غير معروفة قبل القيام بتحليلها ، مثل بيانات تصفح المستخدمين لأحد مواقع الويب أو أحد تطبيقات الهاتف الذكي، أو تلك البيانات التي يتم الحصول عليها من أجهزة إنترنت الأشياء المدعمة بأجهزة الاستشعار. قد يصل حجم هذه البيانات إلى العشرات، بل المئات من التيرابايت من البيانات. --- SECTION: Velocity السرعة --- يشير مصطلح السرعة إلى معدل التقاط البيانات وتخزينها. تنتج البيانات من معظم الأجهزة الذكية المتصلة بالإنترنت ( أجهزة إنترنت الأشياء ) والأجهزة المحمولة في الوقت الحقيقي أو قريبا من الوقت الحقيقي، مما يتطلب الجمع الفوري لتلك البيانات وكذلك نقلها وتخزينها. --- SECTION: تقنيات إدارة البيانات الضخمة --- تستخدم الشركات أنظمة الحاسب وقواعد البيانات للاحتفاظ بالسجلات المختلفة مثل المعاملات المتعلقة بمعالجة الطلبات والمدفوعات وتتبع العملاء وإدارة التكلفة في الشركات. تحتاج الشركات أيضًا إلى نظام لإعداد التقارير لتوفير المعلومات التي تساعدها على العمل بكفاءة والمساعدة المديرين التنفيذيين على اتخاذ القرارات المدروسة التي تضمن أداء أفضل للأعمال. يحتاج مديرو المتجر الإلكتروني إلى تحسين تجربة الشراء والتأكد من أن زوار الموقع الذين يتصفحون المنتجات سيصبحون زبائن للمتجر وذلك من خلال شراء المنتجات، وكذلك العمل على عودة الزبائن للشراء مرات أخرى في المستقبل من خلال الموقع. يمكن للشركة تحليل جميع البيانات التي يتم جمعها أثناء تصفح الزوار للمتجر الإلكتروني على الويب أو من خلال تطبيق الهاتف الذكي، وتتضمن تلك البيانات تفاصيل دقيقة عن تصفح الزوار للموقع، بما فيها أماكن وضع المؤشر على الشاشة وأجزاء الموقع التي يقضون وقتا أطول في تصفحها ، ومدة المرور فوق المنتج قبل الضغط للحصول على المزيد من المعلومات عنه أو للقيام بشرائه بالفعل. ينتج عن هذه التفاصيل الدقيقة التي يتم جمعها كم هائل من البيانات التي يجب تحليلها لتقديم رؤية واضحة وقيمة للقائمين علي أعمال الشركة. يتم استخدام نتائج تحليل تلك المعلومات لإحداث تغييرات في مخطط موقع الويب أو المتجر، ولتعديل أسعار المنتجات سواء بالزيادة أو بالخصم ، ولتنظيم الحملات التسويقية للمنتجات على وسائل التواصل الاجتماعي للتأثير على سلوكيات الشراء لدى الزبائن. يتطلب القيام بهذا الأمر من الشركات توفير تقنيات وأدوات جديدة لإدارة وتحليل البيانات الضخمة لاستخراج قيمة الأعمال، ويجب جمع البيانات المطلوبة من المصادر الداخلية كدوائر المبيعات والتصنيع والمحاسبة، وكذلك من المصادر الخارجية كالبيانات الإحصائية عن النمو السكاني وطبيعة الزبائن وأعمارهم، وكذلك البيانات المتعلقة بالشركات المنافسة مثلا ، وذلك لاستخراج معلومات موجزة وموثوقة حول الوضع الحالي والمستقبلي للشركة والتأثيرات المحتملة لمتغيرات السوق. تحتوي البنية التحتية الحديثة لذكاء الأعمال على مجموعة من الأدوات والتقنيات لتخزين البيانات ومعالجتها للحصول على معلومات مفيدة من البيانات الضخمة، وتشمل هذه التقنيات مستودعات البيانات وبحيرات البيانات وعمليات الحوسبة في الذاكرة.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 5 بطاقة لهذه الصفحة

ما المقصود بمصطلح 'القيمة' (Value) في سياق البيانات الضخمة؟

  • أ) كمية البيانات التي يتم جمعها من مصادر مختلفة.
  • ب) مدى فائدة البيانات في اتخاذ القرارات، وإمكانية الحصول على التوصيات والأفكار من خلالها.
  • ج) سرعة معالجة البيانات وتخزينها في الوقت الحقيقي.
  • د) دقة مجموعة البيانات وموثوقية مصدرها.

الإجابة الصحيحة: b

الإجابة: مدى فائدة البيانات في اتخاذ القرارات، وإمكانية الحصول على التوصيات والأفكار من خلالها.

الشرح: 1. القيمة لا تعني مجرد جمع كميات كبيرة من البيانات. 2. القيمة الحقيقية تكمن في استخراج معلومات مفيدة. 3. الفائدة الأساسية هي دعم عملية اتخاذ القرارات.

تلميح: يرتبط هذا المصطلح بالهدف النهائي من تحليل البيانات.

التصنيف: تعريف | المستوى: سهل

ما المقصود بمصطلح 'الموثوقية' (Veracity) كأحد خصائص البيانات الضخمة؟

  • أ) سرعة تدفق البيانات من الأجهزة الذكية وأجهزة الاستشعار.
  • ب) الحجم الهائل للبيانات غير المنظمة وقلة كثافتها.
  • ج) مدى دقة مجموعة البيانات وموثوقيتها، بما في ذلك مصداقية مصدر البيانات ونوعها وكيفية معالجتها.
  • د) قدرة البيانات على توليد أفكار جديدة دون تحليل مسبق.

الإجابة الصحيحة: c

الإجابة: مدى دقة مجموعة البيانات وموثوقيتها، بما في ذلك مصداقية مصدر البيانات ونوعها وكيفية معالجتها.

الشرح: 1. الموثوقية ترتبط بجودة البيانات ودقتها. 2. تشمل أيضًا تقييم مصدر البيانات. 3. تتأثر بطريقة جمع ومعالجة البيانات.

تلميح: هذا المصطلح لا يتعلق بالكمية، بل بجودة ومصداقية البيانات.

التصنيف: تعريف | المستوى: متوسط

أي من العبارات التالية تصف بشكل صحيح خاصية 'الحجم' (Volume) في البيانات الضخمة؟

  • أ) سرعة توليد البيانات من الأجهزة المتصلة بالإنترنت في الوقت الفعلي.
  • ب) قيمة البيانات المجهولة التي يتم الكشف عنها بعد التحليل.
  • ج) كميات كبيرة من البيانات غير المنظمة ذات كثافة قليلة، قد تصل إلى عشرات أو مئات التيرابايت.
  • د) مدى دقة البيانات المجمعة من أجهزة إنترنت الأشياء.

الإجابة الصحيحة: c

الإجابة: كميات كبيرة من البيانات غير المنظمة ذات كثافة قليلة، قد تصل إلى عشرات أو مئات التيرابايت.

الشرح: 1. الحجم يشير إلى الكمية الهائلة من البيانات. 2. غالبًا ما تكون البيانات غير منظمة. 3. تتميز بقلة الكثافة (low density). 4. يمكن أن تصل أحجامها إلى نطاق التيرابايت.

تلميح: تتعلق هذه الخاصية بالمقياس الكمي للبيانات، وليس بنوعيتها أو سرعتها.

التصنيف: مفهوم جوهري | المستوى: متوسط

ما المقصود بمصطلح 'السرعة' (Velocity) في سياق البيانات الضخمة؟

  • أ) كمية البيانات التي يمكن تخزينها في مستودع بيانات واحد.
  • ب) معدل التقاط البيانات وتخزينها، حيث تنتج البيانات في الوقت الحقيقي أو قريبًا منه من الأجهزة المتصلة.
  • ج) الوقت المستغرق لتحليل مجموعة بيانات ضخمة واستخراج الرؤى منها.
  • د) مصداقية البيانات المتدفقة من مصادر خارجية.

الإجابة الصحيحة: b

الإجابة: معدل التقاط البيانات وتخزينها، حيث تنتج البيانات في الوقت الحقيقي أو قريبًا منه من الأجهزة المتصلة.

الشرح: 1. السرعة تشير إلى معدل توليد البيانات. 2. مصدر البيانات غالبًا أجهزة متصلة (إنترنت الأشياء). 3. تحدث العملية في الوقت الحقيقي أو قريب منه. 4. تتطلب معالجة فورية للنقل والتخزين.

تلميح: تتعلق هذه الخاصية بوتيرة توليد وتدفق البيانات، وليس بحجمها أو دقتها.

التصنيف: تعريف | المستوى: سهل

ما الهدف الأساسي من استخدام تقنيات إدارة البيانات الضخمة في الشركات، كما ورد في النص؟

  • أ) تخزين أكبر كمية ممكنة من سجلات المعاملات والمدفوعات.
  • ب) استبدال العاملين البشريين في عملية اتخاذ القرارات بأدوات ذكاء اصطناعي.
  • ج) استخراج معلومات موجزة وموثوقة لاتخاذ قرارات مدروسة تضمن أداء أفضل للأعمال.
  • د) جمع بيانات الزوار فقط لتحسين تصميم موقع الويب.

الإجابة الصحيحة: c

الإجابة: استخراج معلومات موجزة وموثوقة لاتخاذ قرارات مدروسة تضمن أداء أفضل للأعمال.

الشرح: 1. الهدف ليس مجرد جمع أو تخزين البيانات. 2. التحليل يؤدي إلى استخراج معلومات مفيدة. 3. المعلومات تساعد في اتخاذ قرارات استراتيجية. 4. القرارات المدروسة تهدف لتحسين أداء الأعمال.

تلميح: فكر في الغاية النهائية من عملية جمع وتحليل كل هذه البيانات.

التصنيف: تفكير ناقد | المستوى: صعب