توليد الصور باستخدام النموذج stable-diffusion - كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 - المنهج السعودي - وزارة التعليم

📚 معلومات الصفحة

الكتاب: كتاب الذكاء الإصطناعي - الصف 12 - الفصل 1 | المادة: الذكاء الإصطناعي | المرحلة: الصف 12 | الفصل الدراسي: 1

الدولة: المملكة العربية السعودية | المنهج: المنهج السعودي - وزارة التعليم

نوع المحتوى: example

الفصل: 4

مستوى الصعوبة: متوسط

📝 ملخص الصفحة

يقدم هذا المحتوى مثالاً تطبيقياً لاستخدام النموذج المدرب مسبقاً stable-diffusion_v1-4 لتوليد الصور من خلال التوجيه النصي. يبدأ المثال بصورة منظر طبيعي أصلية (شكل 4.31) ويستخدمها كمدخل للنموذج مع توجيه نصي يصف منظراً طبيعياً واقعياً يحتوي على قلعة كبيرة.

يشرح المحتوى مفهوم متغير القوة (strength) الذي يتحكم في الاختلاف البصري بين الصورة الأصلية والصورة المولدة، حيث يأخذ قيماً بين 0 و1. عند استخدام قوة 0.75 (شكل 4.32)، تنتج صورة تستجيب للتوجيه النصي مع الاحتفاظ بشبه بصري بالصورة الأصلية.

عند زيادة القوة إلى 1 (شكل 4.33)، تنتج صورة ذات شكل بصري أفضل وفقاً للتوجيه النصي، لكنها تكون أقل تشابهاً مع الصورة المدخلة الأصلية. يختتم المحتوى بمثال آخر باستخدام صورة قطة أصلية (شكل 4.34) لإظهار إمكانية تطبيق النموذج على صور متنوعة.

📋 المحتوى المنظم

📖 محتوى تعليمي مفصّل

المثال الموجود في الشكل 4.31

نوع: محتوى تعليمي

المثال الموجود في الشكل 4.31 يستخدم النموذج المدرب مسبقًا stable-diffusion_v1-4 المتناسب لتوليد صورة من صورة من خلال التوجيه النصي.

شكل 4.31

نوع: FIGURE_REFERENCE

شكل 4.31: صورة المنظر الطبيعي الأصلية

نوع: محتوى تعليمي

# a detailed prompt describing the desired visual
# for the produced image
prompt = "A realistic mountain
landscape with a large castle."
image = generator(prompt=prompt,
image = init_image, strength=0.75).
images[0]
plt.imshow(image);

شكل 4.32

نوع: FIGURE_REFERENCE

شكل 4.32: صورة منظر طبيعي مولدة بقوة = 0.75

نوع: محتوى تعليمي

في الواقع، يولد النموذج صورة مستجيبة للتوجيه النصي ومشابهة بصريًا للصورة الأصلية، ويُستخدم متغير strength (القوة) للتحكم في الاختلاف البصري بين الصورة الأصلية والصورة الجديدة، ويتخذ المتغير قيمًا بين 0 و 1، وتسمح القيم الأعلى للنموذج بأن يكون أكثر مرونة وأقل تقيدًا بالصورة الأصلية. على سبيل المثال، يُستخدم المقطع البرمجي التالي لضبط المتغير strength ليساوي 1.

نوع: محتوى تعليمي

# generate a new image based on the prompt and the
# initial image using the generator model
image = generator(prompt=prompt,
image = init_image, strength=1).images[0]
plt.imshow(image);

شكل 4.33

نوع: FIGURE_REFERENCE

شكل 4.33: صورة منظر طبيعي مولدة بقوة = 1

نوع: محتوى تعليمي

تؤكد الصورة الناتجة في شكل 4.33 أن زيادة قيمة متغير القوة تؤدي إلى شكل بصري أفضل بالإرشاد الوارد في التوجيه النصي، ولكنه أيضًا أقل تشابهًا إلى حد كبير مع الصورة المدخلة.

نوع: محتوى تعليمي

وهذا مثال نموذجي آخر، يتضح مخرجه في الشكل 4.34.

نوع: محتوى تعليمي

init_image = Image.open("cat_1.jpg")
init_image.thumbnail(((768, 768)))
plt.imshow(init_image);

شكل 4.34

نوع: FIGURE_REFERENCE

شكل 4.34: صورة القطة الأصلية

نوع: METADATA

وزارة التعليم
Ministry of Education
2023 - 1447

نوع: METADATA

242

🔍 عناصر مرئية

شكل 4.31: صورة المنظر الطبيعي الأصلية

A cartoonish, stylized landscape image featuring mountains, a river, and green hills under a blue sky with stars. This is presented as the 'original image' for an AI image generation process.

شكل 4.32: صورة منظر طبيعي مولدة بقوة = 0.75

A generated image, more detailed and realistic than Figure 4.31, depicting a mountain landscape with a large castle, a river, and green terrain. The style is still somewhat illustrative but with more texture and depth. This image was generated with a 'strength' parameter of 0.75.

شكل 4.33: صورة منظر طبيعي مولدة بقوة = 1

A highly realistic image of a mountain landscape featuring a prominent castle, a river, and lush green hills under a bright sky. This image is significantly more detailed and realistic than Figure 4.32 and Figure 4.31. It was generated with a 'strength' parameter of 1.

شكل 4.34: صورة القطة الأصلية

A photograph of an orange tabby cat sitting on a ledge, looking towards the right. The cat has striped fur and is in a natural setting, possibly outdoors or near a window. This is presented as another 'original image' for a different image generation example.

📄 النص الكامل للصفحة

--- SECTION: المثال الموجود في الشكل 4.31 --- المثال الموجود في الشكل 4.31 يستخدم النموذج المدرب مسبقًا stable-diffusion_v1-4 المتناسب لتوليد صورة من صورة من خلال التوجيه النصي.--- SECTION: شكل 4.31 --- شكل 4.31: صورة المنظر الطبيعي الأصلية# a detailed prompt describing the desired visual
# for the produced image prompt = "A realistic mountain landscape with a large castle."
image = generator(prompt=prompt,
image = init_image, strength=0.75).
images[0]
plt.imshow(image);--- SECTION: شكل 4.32 --- شكل 4.32: صورة منظر طبيعي مولدة بقوة = 0.75في الواقع، يولد النموذج صورة مستجيبة للتوجيه النصي ومشابهة بصريًا للصورة الأصلية، ويُستخدم متغير strength (القوة) للتحكم في الاختلاف البصري بين الصورة الأصلية والصورة الجديدة، ويتخذ المتغير قيمًا بين 0 و 1، وتسمح القيم الأعلى للنموذج بأن يكون أكثر مرونة وأقل تقيدًا بالصورة الأصلية. على سبيل المثال، يُستخدم المقطع البرمجي التالي لضبط المتغير strength ليساوي 1.# generate a new image based on the prompt and the
# initial image using the generator model image = generator(prompt=prompt,
image = init_image, strength=1).images[0]
plt.imshow(image);--- SECTION: شكل 4.33 --- شكل 4.33: صورة منظر طبيعي مولدة بقوة = 1تؤكد الصورة الناتجة في شكل 4.33 أن زيادة قيمة متغير القوة تؤدي إلى شكل بصري أفضل بالإرشاد الوارد في التوجيه النصي، ولكنه أيضًا أقل تشابهًا إلى حد كبير مع الصورة المدخلة.وهذا مثال نموذجي آخر، يتضح مخرجه في الشكل 4.34.init_image = Image.open("cat_1.jpg")
init_image.thumbnail(((768, 768)))
plt.imshow(init_image);--- SECTION: شكل 4.34 --- شكل 4.34: صورة القطة الأصلية2023 - 1447--- VISUAL CONTEXT ---
**IMAGE**: شكل 4.31: صورة المنظر الطبيعي الأصلية
Description: A cartoonish, stylized landscape image featuring mountains, a river, and green hills under a blue sky with stars. This is presented as the 'original image' for an AI image generation process.
Context: This image serves as the initial input (init_image) for the stable-diffusion model, which will be modified based on a text prompt and a 'strength' parameter.**IMAGE**: شكل 4.32: صورة منظر طبيعي مولدة بقوة = 0.75
Description: A generated image, more detailed and realistic than Figure 4.31, depicting a mountain landscape with a large castle, a river, and green terrain. The style is still somewhat illustrative but with more texture and depth. This image was generated with a 'strength' parameter of 0.75.
Context: This image demonstrates the output of the stable-diffusion model when using the original image (Figure 4.31) and a text prompt, with a 'strength' value of 0.75. It shows a balance between adhering to the original image's structure and incorporating details from the text prompt.**IMAGE**: شكل 4.33: صورة منظر طبيعي مولدة بقوة = 1
Description: A highly realistic image of a mountain landscape featuring a prominent castle, a river, and lush green hills under a bright sky. This image is significantly more detailed and realistic than Figure 4.32 and Figure 4.31. It was generated with a 'strength' parameter of 1.
Context: This image illustrates the effect of increasing the 'strength' parameter to 1. The generated image is visually superior and adheres more closely to the text prompt's guidance, but consequently, it bears less resemblance to the original input image (Figure 4.31).**IMAGE**: شكل 4.34: صورة القطة الأصلية
Description: A photograph of an orange tabby cat sitting on a ledge, looking towards the right. The cat has striped fur and is in a natural setting, possibly outdoors or near a window. This is presented as another 'original image' for a different image generation example.
Context: This image serves as a new 'init_image' for a separate demonstration of the image generation process, implying that the model can be applied to various input images.

🎴 بطاقات تعليمية للمراجعة

عدد البطاقات: 4 بطاقة لهذه الصفحة

ما هو النموذج المستخدم في المثال الأول لتوليد صورة من صورة من خلال التوجيه النصي؟

الإجابة: تم استخدام النموذج المدرب مسبقًا stable-diffusion_v1-4.

الشرح: النص يذكر صراحة أن النموذج المستخدم هو stable-diffusion_v1-4 لتوليد الصور بناءً على توجيه نصي وصورة أولية.

تلميح: فكر في اسم النموذج المذكور بوضوح في بداية وصف المثال الأول.

ما هو دور المتغير 'strength' (القوة) في نموذج توليد الصور؟

الإجابة: يتحكم المتغير 'strength' في الاختلاف البصري بين الصورة الأصلية والصورة الجديدة المولدة، وتتراوح قيمه بين 0 و 1. القيم الأعلى تسمح للنموذج بأن يكون أكثر مرونة وأقل تقيدًا بالصورة الأصلية.

الشرح: يشرح النص بوضوح أن 'strength' يتحكم في مدى التغيير أو المرونة التي يمنحها النموذج للصورة الأصلية عند توليد صورة جديدة بناءً على التوجيه النصي.

تلميح: فكر في العلاقة بين قيمة 'strength' ومدى تشابه الصورة المولدة مع الصورة المدخلة.

ماذا يحدث للصورة المولدة عند زيادة قيمة المتغير 'strength' إلى 1؟

الإجابة: عند زيادة قيمة المتغير 'strength' إلى 1، تصبح الصورة المولدة ذات شكل بصري أفضل وإرشاد أوضح من التوجيه النصي، ولكنها تصبح أقل تشابهًا بشكل كبير مع الصورة الأصلية المدخلة.

الشرح: تؤكد الأشكال والنصوص المصاحبة لها أن القوة العالية (strength=1) تعطي نتائج أفضل من حيث اتباع التوجيه النصي، لكنها تضحي بالتشابه مع الصورة الأصلية.

تلميح: قارن بين وصف الصورة في الشكل 4.32 (strength=0.75) والشكل 4.33 (strength=1) في سياق مدى التشابه مع الصورة الأصلية.

ما هي طبيعة الصورة الأصلية المستخدمة في المثال الثاني لتوليد صورة قطة؟

الإجابة: الصورة الأصلية هي صورة لقطة برتقالية مخططة (tabby cat) جالسة على حافة، تنظر إلى اليمين.

الشرح: النص يصف الصورة المستخدمة كمثال ثانٍ بأنها صورة قطة بأوصاف محددة، مما يشير إلى تنوع المدخلات التي يمكن للنموذج التعامل معها.

تلميح: ابحث عن وصف الصورة المذكورة بعد عبارة 'init_image = Image.open("cat_1.jpg")' وقبل عرضها.