📄 النص الكامل للصفحة
تُستخدم دالة ()plot_tree لرسم وعرض شجرة القرار. ولعدم توفر مساحة كافية للعرض سيتم تمثيل المستويين الأولين فقط، بالإضافة إلى الجذر. يمكن ضبط هذا الرقم بسهولة باستخدام المتغير max_depth.
# plot the tree
plot_tree(my_tree,
max_depth=2,
fontsize=10
عمق شجرة القرار.
كل عقدة في الشجرة تمثل مجموعة فرعية من المرضى، فعلى سبيل المثال، تمثل عقدة الجذر إجمالي عدد 1,400 مريض في مجموعة بيانات التدريب، من بينهم: 354، و 345، و 358، و 343 شُخصوا بـ Allergies (الحساسية)، Common cold (نزلات البرد)، و Covid-19 (كوفيد-19)، و Flu (الإنفلونزا)، على التوالي.
بُنيت الشجرة باستخدام نمط من الأعلى إلى الأسفل عبر التفرع الثنائي (Binary Splits). يستند التفرع الأول إلى ما إذا كان المريض يعاني من الحمى أم لا. ونظراً لأن كل خصائص الأعراض ثنائية، يكون التحقق 0.5 >= a صحيحاً إذا لم يكن المريض يعاني من الأعراض. أما المرضى الذين لا يعانون من الحمى (المسار الأيسر) يتفرعون مرة أخرى بناءً على ما إذا كانوا يعانون من التهاب الحلق أم لا. المرضى الذين لا يعانون من التهاب الحلق يتفرعون بناءً على ما إذا كانوا يعانون من رشح الأنف أم لا. في هذه المرحلة، تحتوي العقدة على 526 حالة. تم تشخيص 354، و 101، و 58، و 13 من بينهم بالحساسية، ونزلات البرد، وكوفيد-19، والإنفلونزا، على التوالي.
--- SECTION: مؤشر جيني (Gini Index) ---
يقيس مؤشر جيني (Gini Index) الشوائب بالعقدة، وبالتحديد احتمالية تصنيف محتويات العقدة بصورة خاطئة. يشير انخفاض معامل جيني إلى ارتفاع درجة تأكد الخوارزمية من التصنيف.
يستمر التفرع حتى تُحدد الخوارزمية الحالات التي انقسمت بالفعل إلى عقد نقية تماماً. العقدة النقية بالكامل تحتوي على الحالات التي لها تشخيص نفسه. قيم مؤشر gini (جيني) المحددة على كل عقدة، تمثل مؤشرات على مقياس جيني، وهي صيغة شهيرة تُستخدم لتقييم درجة نقاء العقدة.
102
وزارة التعليم
Ministry of Education
2023 - 1447
--- VISUAL CONTEXT ---
**DIAGRAM**: شجرة القرار
Description: A decision tree diagram illustrating the classification of patients based on symptoms like fever, sore throat, runny nose, tiredness, sneezing, and headache. Each node shows the splitting condition, Gini impurity, number of samples, and the distribution of diagnoses (Allergies, Common cold, Covid-19, Flu). The tree is displayed up to a maximum depth of 2 from the root.
Data: The diagram shows a root node splitting into two child nodes, and each of those splitting into two further child nodes, representing a depth of 2. Each node contains a condition (e.g., fever <= 0.5), a Gini impurity value, the number of samples, and an array representing the count of each diagnosis type (Allergies, Common cold, Covid-19, Flu) for the samples in that node.
Key Values: [object Object], [object Object], [object Object], [object Object], [object Object], [object Object], [object Object]
Context: This diagram visually represents the decision-making process of a classification algorithm, showing how patient data is split based on symptoms to predict a diagnosis. It demonstrates the concept of binary splits and Gini impurity in decision trees, where lower Gini values indicate higher purity of the node's samples regarding their diagnosis.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 5 بطاقة لهذه الصفحة
ما هو الغرض الرئيسي من دالة ()plot_tree في سياق أشجار القرار؟
الإجابة: تُستخدم دالة ()plot_tree لرسم وعرض شجرة القرار، مما يسهل فهم هيكلها وتوزيع البيانات فيها.
الشرح: تساعد الدوال الرسومية مثل plot_tree على تمثيل هياكل البيانات المعقدة بصرياً، مما يسهل على المستخدمين فهمها وتحليلها.
تلميح: فكر في الوظيفة الأساسية للدوال التي تتعامل مع تصور البيانات.
ماذا يمثل الجذر في شجرة القرار؟
الإجابة: يمثل الجذر في شجرة القرار المجموعة الكاملة للبيانات أو المرضى المتاحة في مجموعة بيانات التدريب.
الشرح: في سياق أشجار القرار، تبدأ العملية بعقدة الجذر التي تحتوي على جميع البيانات، ثم تتفرع الشجرة لتقسيم هذه البيانات بناءً على معايير محددة.
تلميح: فكر في نقطة البداية لأي هيكل شجري.
كيف يتم بناء شجرة القرار في المثال المذكور؟
الإجابة: تم بناء الشجرة باستخدام نمط من الأعلى إلى الأسفل عبر التفرع الثنائي (Binary Splits)، حيث يستند كل تفرع إلى ما إذا كان المريض يعاني من عرض معين أم لا.
الشرح: التفرع الثنائي هو أساس بناء أشجار القرار، حيث يتم تقسيم كل عقدة إلى عقدتين فرعيتين بناءً على شرط منطقي (صواب/خطأ) حول خاصية معينة.
تلميح: ما هو نوع التقسيم الذي تستخدمه الشجرة لتقسيم البيانات؟
ما هو دور مؤشر جيني (Gini Index) في أشجار القرار؟
الإجابة: يقيس مؤشر جيني (Gini Index) الشوائب في العقدة، وهو احتمالية تصنيف محتويات العقدة بصورة خاطئة. يشير انخفاض معامل جيني إلى ارتفاع درجة تأكد الخوارزمية من التصنيف.
الشرح: الهدف من مؤشر جيني هو تحديد أفضل تقسيمة ممكنة للعقدة، بحيث تكون العقد الناتجة نقية قدر الإمكان (أي تحتوي على عينات من فئة واحدة).
تلميح: ما الذي يحاول المؤشر قياسه لتقييم جودة تقسيم العقدة؟
متى تتوقف خوارزمية بناء شجرة القرار عن التفرع؟
الإجابة: تستمر خوارزمية بناء شجرة القرار في التفرع حتى تُحدد العقد التي انقسمت بالفعل إلى عقد نقية تماماً، أي العقد التي تحتوي على الحالات التي لها تشخيص نفسه.
الشرح: الهدف النهائي لبناء شجرة القرار هو الحصول على عقد نهائية (أوراق) تكون نقية قدر الإمكان، مما يعني أن جميع العينات فيها تنتمي إلى نفس الفئة المستهدفة (التشخيص).
تلميح: ما هي الحالة المثالية التي ترغب الخوارزمية في الوصول إليها في نهاية التفرع؟