📄 النص الكامل للصفحة
رسم صورة بالاسترشاد بنص Text-Guided Image-Inpaintingيركز المثال التالي على استخدام نموذج الانتشار المستقر لاستبدال شكل بصري جديد يصفه التوجيه النصي بأجزاء محددة من صورة موجودة. يُستخدم لهذا الغرض النموذج المدرب مسبقًا stable-diffusion-inpainting (رسم - الانتشار - المستقر). ويقوم المقطع البرمجي التالي بتحميل صورة قطة على مقعد، وهناك قناع (Mask) يعزل الأجزاء المحددة من الصورة التي تغطيها القطة.# tool used for text-guided image in-painting from diffusers import StableDiffusionInpaintPipeline init_image = Image.open("cat_on_bench.png").resize((512, 512))
plt.imshow(init_image);
mask_image = Image.open("cat_mask.jpg").resize((512, 512))
plt.imshow(mask_image);القناع (Mask) هو صورة بسيطة بالأبيض والأسود لها نفس أبعاد الصورة الأصلية بالضبط، والأجزاء التي استبدلت في الصورة الجديدة تتميز باللون الأبيض، في حين أن الأجزاء الأخرى من القناع سوداء. بعد ذلك، يتم تحميل النموذج المدرب مسبقًا، ويتم إنشاء prompt (التوجيه) لكي توضع صورة رائد الفضاء مكان القطة التي في الصورة الأصلية، كما يظهر في الشكل 4.39.generator = StableDiffusionInpaintPipeline.from_pretrained("runwayml/stable-diffusion-inpainting")
generator = generator.to("cuda")prompt = "A photo of an astronaut"
image = generator(prompt=prompt, image=init_image, mask_image=mask_image).
images[0]
plt.imshow(image);2023 - 1447--- VISUAL CONTEXT ---
**IMAGE**: شكل 4.37: صورة القطة الأصلية
Description: An image of an orange cat sitting on a green park bench. The cat is facing forward, looking towards the viewer. The background shows some foliage and a stone wall.
Context: This is the initial image (init_image) that will be used as input for the image inpainting process. The goal is to replace the cat with a different object.**IMAGE**: شكل 4.38: قناع صورة القطة
Description: A black and white mask image. A white silhouette of a cat is visible against a black background. The white area corresponds to the cat's shape in the original image.
Context: This mask (mask_image) defines the region in the original image (Figure 4.37) that will be modified or replaced. The white area indicates the pixels to be changed, while the black area indicates the pixels to be preserved.
🎴 بطاقات تعليمية للمراجعة
عدد البطاقات: 4 بطاقة لهذه الصفحة
ما هو النموذج المستخدم في المثال لشرح تقنية "الانتشار المستقر" (Stable Diffusion) لتعديل الصور؟
الإجابة: يُستخدم نموذج الانتشار المستقر المدرب مسبقًا والمسمى "stable-diffusion-inpainting" (رسم - الانتشار - المستقر) لهذا الغرض.
الشرح: المثال يوضح استخدام "stable-diffusion-inpainting" كنموذج مخصص لعمليات الرسم أو التعديل داخل الصور، وهو يختلف عن نماذج الانتشار المستقر العامة.
تلميح: ابحث عن اسم النموذج المحدد الذي تم تدريبه خصيصًا لتعديل الصور.
ما هي وظيفة "القناع" (Mask) في عملية "Text-Guided Image Inpainting"؟
الإجابة: القناع (Mask) هو صورة بالأبيض والأسود بنفس أبعاد الصورة الأصلية، حيث تشير المناطق البيضاء إلى الأجزاء التي سيتم استبدالها أو تعديلها في الصورة الجديدة، بينما تشير المناطق السوداء إلى الأجزاء التي سيتم الحفاظ عليها كما هي.
الشرح: القناع يعتبر دليلاً للنموذج يحدد بالضبط أي بكسلات في الصورة الأصلية يجب إعادة إنشائها بناءً على التوجيه النصي.
تلميح: فكر في ماهية المساحة المحددة التي يجب أن يركز عليها النموذج لتغيير جزء معين من الصورة.
اشرح كيف يوجه "التوجيه النصي" (Prompt) نموذج "stable-diffusion-inpainting" عند تعديل صورة.
الإجابة: يقوم التوجيه النصي (Prompt) بوصف الشكل البصري الجديد الذي يريده المستخدم أن يحل محل الجزء المحدد في الصورة الأصلية (كما يحدده القناع). يقوم النموذج بتفسير هذا النص لإنشاء محتوى جديد في المنطقة البيضاء من القناع.
الشرح: التوجيه النصي هو العنصر الذي يضمن أن التعديل لا يكون عشوائيًا، بل يتم بناءً على وصف دقيق للمحتوى المطلوب إنشاؤه.
تلميح: ما هو المدخل النصي الذي يخبر النموذج بما يجب أن يرسمه في المنطقة المحددة؟
ما الهدف الأساسي من استخدام تقنية "Text-Guided Image Inpainting" كما موضح في المثال؟
الإجابة: الهدف الأساسي هو استبدال أجزاء محددة من صورة موجودة بشكل ذكي، بناءً على وصف نصي، مع الحفاظ على سياق باقي أجزاء الصورة.
الشرح: التقنية تسمح بإجراء تعديلات دقيقة وموجهة على الصور، مثل استبدال قطة برائد فضاء، مما يفتح إمكانيات إبداعية كبيرة.
تلميح: ركز على التغيير الذي يحدث للصورة الأصلية وما الذي يتحكم في هذا التغيير.