حقائق رئيسية
- يستخدم التطبيق تدفقًا بصريًا لتحويل الأوهام السابقة إلى الإطار الحالي.
- منع التظليل بالانغلاق يمنع ظهور الأشباح ونقل الأوهام عند تحرك الأجسام.
- يدعم الأداة متعدد مصنفات الصور المُدرَّبة مسبقًا، بما في ذلك GoogLeNet.
- يعمل على أجهزة GPU و CPU و Apple Silicon.
- تظل المعلمات المتقدمة مثل الطبقات والأوكتاف والتكرارات تعمل بشكل وظيفي.
ملخص سريع
قام مطور بتحديث تطبيق PyTorch الخاص بـ DeepDream ليشمل دعم الفيديو مع الاستمرارية الزمنية. يسمح هذا التعديل بإنشاء مقاطع فيديو DeepDream سلسة مع الحد الأدنى من التوهج، وهو مشكلة شائعة في التطبيقات القياسية.
يتميز المشروع بمرونة عالية، حيث يدعم المعلمات المتقدمة ومصنفات الصور المُدرَّبة مسبقًا متعددة، بما في ذلك GoogLeNet. تم تصميمه للعمل على منصات أجهزة متنوعة، بما في ذلك وحدات معالجة الرسوميات (GPUs) ووحدات المعالجة المركزية (CPUs) وشرائح Apple السيليكون.
التطبيق التقني
تكمن التجديد الأساسية في تطبيق خوارزميات الاستمرارية الزمنية. من خلال تعديل تفرع PyTorch DeepDream الأصلي، يضمن المطور أن الأوهام البصرية تتطور بسلاسة عبر إطارات الفيديو بدلاً من إنشاء نتائج مستقلة وضوضائية لكل إطار.
يقلل هذا النهج بشكل كبير من تأثير الوميض أو التوهج المرئي الذي يظهر غالبًا في مقاطع الفيديو المولدة بالذكاء الاصطناعي.
الميزات الرئيسية والخوارزميات 🧠
يعتمد التطبيق على تقنيتين أساسيتين في رؤية الحاسوب للحفاظ على الاستقرار البصري:
- التدفق البصري (Optical Flow): تقوم هذه التقنية بتحويل الأوهام من الإطارات السابقة إلى الإطار الحالي، مما يوفر خط بصري ثابت.
- منع التظليل بالانغلاق (Occlusion Masking): يمنع هذا التقنية ظهور الأشباح ونقل الأوهام عند تحرك الأجسام، مما يضمن عدم بقاء الأثرات الضوئية بشكل غير صحيح.
تعمل هذه الميزات معًا لإنتاج مخرجات فيديو عالية الجودة ومستقرة.
المرونة والتوافق
على الرغم من معالجة الفيديو المعقدة، تحتفظ الأداة بمرونة تطبيق DeepDream الأصلي. لا يزال بإمكان المستخدمين ضبط المعلمات المتقدمة مثل الطبقات والأوكتاف والتكرارات لتخصيص النمط البصري للمخرجات.
علاوة على ذلك، يدعم الكود متعدد مصنفات الصور المُدرَّبة مسبقًا، مع ذكر GoogLeNet صراحةً. يمتد التوافق إلى نطاق واسع من الأجهزة، ويعمل على وحدات معالجة الرسوميات القياسية ووحدات المعالجة المركزية وبنية Apple السيليكون.
التوافر والاستخدام
يتوفر المشروع في مستودع عام شارك فيه المطور الكود. توجد مقاطع فيديو تجريبية توضح الاستمرارية الزمنية والتأثيرات البصرية في المستودع للمراجعة.
يمكن للمستخدمين المهتمين الوصول إلى المستودع لتحميل الكود ورؤية نتائج تقنيتي التدفق البصري ومنع التظليل بالانغلاق قيد التنفيذ.




