صفحة 21 - كتاب علم البيانات - الصف 11 - الفصل 1 - المملكة العربية السعودية

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب علم البيانات - الصف 11 - الفصل 1 | المادة: علم البيانات | المرحلة: الصف 11 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: درس تعليمي

📝 ملخص الصفحة

📚 البيانات الضخمة (Big Data)

المفاهيم الأساسية

البيانات الضخمة (Big Data): البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها بالطرائق التقليدية، حيث يشكل تخزينها ومعالجتها تحديًا كبيرًا.

خصائص البيانات الضخمة (5V's): خمسة معايير أساسية يجب أن تستوفيها البيانات لتُصنف كبيانات ضخمة:

  • التنوع (Variety): أنواع البيانات المختلفة (منظمة، غير منظمة، شبه منظمة).
  • القيمة (Value): الفائدة المستخلصة من البيانات.
  • الحجم (Volume): الكمية الهائلة للبيانات.
  • الموثوقية (Veracity): دقة وصدق البيانات.
  • السرعة (Velocity): المعدل السريع لجمع وتدفق البيانات.
  • خريطة المفاهيم

    ```markmap

    البيانات الضخمة (Big Data)

    التعريف

    • بيانات كبيرة جدًا أو معقدة
    • لا يمكن معالجتها بالطرق التقليدية
    • تخزينها ومعالجتها تحدي كبير

    الخصائص الخمس (5V's)

    التنوع (Variety)

    • أنواع مختلفة من البيانات
    • منظمة (قواعد بيانات تقليدية)
    • غير منظمة (نصوص، صوت، فيديو)
    • شبه منظمة

    القيمة (Value)

    • الفائدة المستخلصة

    الحجم (Volume)

    • الكمية الهائلة

    الموثوقية (Veracity)

    • الدقة والصدق

    السرعة (Velocity)

    • معدل سريع للتدفق والجمع
    ```

    نقاط مهمة

    • البيانات الضخمة تتطلب أنظمة حوسبة خاصة، وليست أنظمة تقليدية.
    • يجب أن تستوفي البيانات جميع المعايير الخمسة (5V's) لكي تُعد "ضخمة".
    • البيانات غير المنظمة (مثل النصوص والصوت) تحتاج إلى معالجة مسبقة لاستخلاص المعنى منها.
    • البيانات الوصفية (البيانات عن البيانات) ضرورية لمعرفة محتوى البيانات وكيفية معالجتها.

    📄 النص الكامل للصفحة

    رابط الدرس الرقمي www.ien.edu.sa الدرس الثاني التعامل مع البيانات --- SECTION: ما المقصود بالبيانات الضخمة ؟ What is Big Data --- ما المقصود بالبيانات الضخمة ؟ What is Big Data يشير مصطلح البيانات الضخمة (Big Data) إلى البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها بالطرائق التقليدية، ونظرًا لأن كم هذه البيانات يُعدّ كبيرًا جدًا لتتم معالجتها باستخدام أنظمة الحوسبة التقليدية، فإن تخزين مجموعاتها ومعالجتها يُعد تحديًا كبيرًا، وكذلك قد تتطلب السرعة الهائلة لعملية جمع البيانات متطلبات تخزين عالية للغاية. --- SECTION: خصائص البيانات الضخمة Characteristics of Big Data --- خصائص البيانات الضخمة Characteristics of Big Data هناك خمسة معايير أساسية تساعدنا في تصنيف أي بيانات تحت مصطلح "البيانات الضخمة" وهي: التنوع، والقيمة، والحجم، والموثوقية، والسرعة. وتُعدّ البيانات ضخمة عندما تأتي بأحجام كبيرة، وبمعدل سريع جدا ، وبتنوع كبير ، وبدقة عالية ، وفائدة. ويجب أن تستوفي البيانات جميع هذه المعايير لكي تُعد بيانات ضخمة. --- SECTION: التنوع Variety --- التنوع Variety يشير التنوع إلى العديد من أنواع البيانات المتوافرة ، ويتم هيكلة البيانات التقليدية المختلفة وتكييفها بدقة في قواعد البيانات العلائقية، ولكن مع ظهور البيانات الضخمة، أصبحت البيانات تتوافر في أنواع جديدة غير منظمة. تتطلب أنواع البيانات غير المنظمة وشبه المنظمة ( مثل النصوص والصوت والفيديو) معالجة إضافية مسبقة لاستخلاص المعاني ودعم معلومات البيانات الوصفية المتعلقة بتلك البيانات ودون هذه البيانات الوصفية يكون من المستحيل معرفة ما يجري تخزينه وكيف يمكن معالجته. الشكل 1.6 خصائص البيانات الضخمة - المعايير الخمسة --- VISUAL CONTEXT --- **DIAGRAM**: خصائص البيانات الضخمة - المعايير الخمسة Description: A circular diagram showing the five characteristics of big data: Variety, Value, Volume, Veracity, and Velocity. Each characteristic is represented by a different icon and color. Context: Illustrates the five key characteristics of big data.

    🎴 بطاقات تعليمية للمراجعة

    عدد البطاقات: 4 بطاقة لهذه الصفحة

    ما المقصود بمصطلح 'البيانات الضخمة' (Big Data)؟

    • أ) البيانات المخزنة في قواعد البيانات العلائقية فقط.
    • ب) البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها بالطرائق التقليدية.
    • ج) أي بيانات يتم جمعها بسرعة عالية بغض النظر عن حجمها.
    • د) البيانات المنظمة التي يمكن تحليلها باستخدام جداول إكسل.

    الإجابة الصحيحة: b

    الإجابة: البيانات الكبيرة جدًا أو المعقدة التي لا يمكن معالجتها بالطرائق التقليدية.

    الشرح: 1. البيانات الضخمة هي مجموعات بيانات هائلة الحجم والتعقيد. 2. لا يمكن معالجتها باستخدام أنظمة الحوسبة التقليدية. 3. يشكل تخزينها ومعالجتها تحديًا كبيرًا.

    تلميح: فكر في نوع البيانات التي تتجاوز قدرة الأنظمة الحاسوبية العادية.

    التصنيف: تعريف | المستوى: سهل

    ما المعايير الخمسة الأساسية التي تساعد في تصنيف البيانات تحت مصطلح 'البيانات الضخمة'؟

    • أ) الدقة، والسرعة، والتكلفة، والأمان، والمرونة.
    • ب) التنوع، والقيمة، والحجم، والموثوقية، والسرعة.
    • ج) الجودة، والكمية، والمصدر، والوقت، والتخزين.
    • د) التحليل، والتخزين، والعرض، والنقل، والنسخ الاحتياطي.

    الإجابة الصحيحة: b

    الإجابة: التنوع، والقيمة، والحجم، والموثوقية، والسرعة.

    الشرح: 1. الحجم (Volume): كمية البيانات الهائلة. 2. السرعة (Velocity): معدل تولد البيانات بسرعة. 3. التنوع (Variety): أنواع البيانات المختلفة (منظمة، غير منظمة). 4. الموثوقية (Veracity): دقة وثقة البيانات. 5. القيمة (Value): الفائدة المستخلصة من البيانات.

    تلميح: تذكر أن الخصائص تبدأ بحرف V في الإنجليزية (5Vs).

    التصنيف: مفهوم جوهري | المستوى: متوسط

    ما المقصود بخصيصة 'التنوع' (Variety) في سياق البيانات الضخمة؟

    • أ) سرعة تولد البيانات من مصادر مختلفة.
    • ب) كثرة النسخ الاحتياطية للبيانات في أماكن متنوعة.
    • ج) يشير إلى العديد من أنواع البيانات المتوافرة، بما في ذلك البيانات غير المنظمة وشبه المنظمة.
    • د) اختلاف جودة البيانات بناءً على مصدر جمعها.

    الإجابة الصحيحة: c

    الإجابة: يشير إلى العديد من أنواع البيانات المتوافرة، بما في ذلك البيانات غير المنظمة وشبه المنظمة.

    الشرح: 1. التنوع يعني وجود أنواع متعددة من مصادر البيانات. 2. يشمل البيانات المنظمة (قواعد البيانات) وغير المنظمة (نصوص، صوت، فيديو). 3. البيانات غير المنظمة تحتاج معالجة مسبقة لاستخلاص المعنى والمعلومات الوصفية (Metadata).

    تلميح: لا تقتصر البيانات على الأرقام والنصوص المنظمة في جداول.

    التصنيف: تعريف | المستوى: متوسط

    لماذا تُعد البيانات الوصفية (Metadata) مهمة جدًا عند التعامل مع البيانات غير المنظمة؟

    • أ) لأنها تقلل من حجم ملفات البيانات غير المنظمة بشكل كبير.
    • ب) لأنها تحل محل الحاجة إلى قواعد البيانات العلائقية.
    • ج) لأنها تضمن أن جميع البيانات غير المنظمة ستكون دقيقة بنسبة 100%.
    • د) لأنه بدون البيانات الوصفية يكون من المستحيل معرفة ما يجري تخزينه وكيف يمكن معالجته.

    الإجابة الصحيحة: d

    الإجابة: لأنه بدون البيانات الوصفية يكون من المستحيل معرفة ما يجري تخزينه وكيف يمكن معالجته.

    الشرح: 1. البيانات غير المنظمة (كالفيديو) لا تحمل بنية واضحة. 2. البيانات الوصفية تقدم معلومات عن محتوى وخصائص تلك البيانات. 3. هذه المعلومات ضرورية لفهم وتصنيف ومعالجة البيانات بشكل صحيح.

    تلميح: فكر في كيفية فهم محتوى ملف فيديو أو صوتي بدون معلومات عنه.

    التصنيف: تفكير ناقد | المستوى: صعب