M
MercyNews
HomeCategoriesTrendingAbout
M
MercyNews

Your trusted source for the latest news and real-time updates from around the world.

Categories

  • Technology
  • Business
  • Science
  • Politics
  • Sports

Company

  • About Us
  • Our Methodology
  • FAQ
  • Contact
  • Privacy Policy
  • Terms of Service
  • DMCA / Copyright

Stay Updated

Subscribe to our newsletter for daily news updates.

Mercy News aggregates and AI-enhances content from publicly available sources. We link to and credit original sources. We do not claim ownership of third-party content.

© 2025 Mercy News. All rights reserved.

PrivacyTermsCookiesDMCA
الرئيسية
تكنولوجيا
DeepDream للفيديو يحقق الاستمرارية الزمنية
تكنولوجيا

DeepDream للفيديو يحقق الاستمرارية الزمنية

٨ يناير ٢٠٢٦•2 دقيقة قراءة•٣٧٣ words
DeepDream for Video Achieves Temporal Consistency
DeepDream for Video Achieves Temporal Consistency
📋

حقائق رئيسية

  • يستخدم التطبيق تدفقًا بصريًا لتحويل الأوهام السابقة إلى الإطار الحالي.
  • منع التظليل بالانغلاق يمنع ظهور الأشباح ونقل الأوهام عند تحرك الأجسام.
  • يدعم الأداة متعدد مصنفات الصور المُدرَّبة مسبقًا، بما في ذلك GoogLeNet.
  • يعمل على أجهزة GPU و CPU و Apple Silicon.
  • تظل المعلمات المتقدمة مثل الطبقات والأوكتاف والتكرارات تعمل بشكل وظيفي.

ملخص سريع

قام مطور بتحديث تطبيق PyTorch الخاص بـ DeepDream ليشمل دعم الفيديو مع الاستمرارية الزمنية. يسمح هذا التعديل بإنشاء مقاطع فيديو DeepDream سلسة مع الحد الأدنى من التوهج، وهو مشكلة شائعة في التطبيقات القياسية.

يتميز المشروع بمرونة عالية، حيث يدعم المعلمات المتقدمة ومصنفات الصور المُدرَّبة مسبقًا متعددة، بما في ذلك GoogLeNet. تم تصميمه للعمل على منصات أجهزة متنوعة، بما في ذلك وحدات معالجة الرسوميات (GPUs) ووحدات المعالجة المركزية (CPUs) وشرائح Apple السيليكون.

التطبيق التقني

تكمن التجديد الأساسية في تطبيق خوارزميات الاستمرارية الزمنية. من خلال تعديل تفرع PyTorch DeepDream الأصلي، يضمن المطور أن الأوهام البصرية تتطور بسلاسة عبر إطارات الفيديو بدلاً من إنشاء نتائج مستقلة وضوضائية لكل إطار.

يقلل هذا النهج بشكل كبير من تأثير الوميض أو التوهج المرئي الذي يظهر غالبًا في مقاطع الفيديو المولدة بالذكاء الاصطناعي.

الميزات الرئيسية والخوارزميات 🧠

يعتمد التطبيق على تقنيتين أساسيتين في رؤية الحاسوب للحفاظ على الاستقرار البصري:

  • التدفق البصري (Optical Flow): تقوم هذه التقنية بتحويل الأوهام من الإطارات السابقة إلى الإطار الحالي، مما يوفر خط بصري ثابت.
  • منع التظليل بالانغلاق (Occlusion Masking): يمنع هذا التقنية ظهور الأشباح ونقل الأوهام عند تحرك الأجسام، مما يضمن عدم بقاء الأثرات الضوئية بشكل غير صحيح.

تعمل هذه الميزات معًا لإنتاج مخرجات فيديو عالية الجودة ومستقرة.

المرونة والتوافق

على الرغم من معالجة الفيديو المعقدة، تحتفظ الأداة بمرونة تطبيق DeepDream الأصلي. لا يزال بإمكان المستخدمين ضبط المعلمات المتقدمة مثل الطبقات والأوكتاف والتكرارات لتخصيص النمط البصري للمخرجات.

علاوة على ذلك، يدعم الكود متعدد مصنفات الصور المُدرَّبة مسبقًا، مع ذكر GoogLeNet صراحةً. يمتد التوافق إلى نطاق واسع من الأجهزة، ويعمل على وحدات معالجة الرسوميات القياسية ووحدات المعالجة المركزية وبنية Apple السيليكون.

التوافر والاستخدام

يتوفر المشروع في مستودع عام شارك فيه المطور الكود. توجد مقاطع فيديو تجريبية توضح الاستمرارية الزمنية والتأثيرات البصرية في المستودع للمراجعة.

يمكن للمستخدمين المهتمين الوصول إلى المستودع لتحميل الكود ورؤية نتائج تقنيتي التدفق البصري ومنع التظليل بالانغلاق قيد التنفيذ.

المصدر الأصلي

Hacker News

نُشر في الأصل

٨ يناير ٢٠٢٦ في ٠١:٢١ م

تمت معالجة هذا المقال بواسطة الذكاء الاصطناعي لتحسين الوضوح والترجمة وسهولة القراءة. نحن دائماً نربط ونذكر المصدر الأصلي.

عرض المقال الأصلي

مشاركة

Advertisement

مقالات ذات صلة

AI Transforms Mathematical Research and Proofstechnology

AI Transforms Mathematical Research and Proofs

Artificial intelligence is shifting from a promise to a reality in mathematics. Machine learning models are now generating original theorems, forcing a reevaluation of research and teaching methods.

May 1·4 min read
Bose Open-Sources Smart Speaker API Instead of Bricking Devicestechnology

Bose Open-Sources Smart Speaker API Instead of Bricking Devices

Bose has announced it will open-source the API documentation for its SoundTouch smart speakers and extend official support until May 6, 2026.

Jan 8·5 min read
Angi to Cut 350 Jobs Citing AI-Driven Efficiencyeconomics

Angi to Cut 350 Jobs Citing AI-Driven Efficiency

Angi, the parent company of Angie's List, is cutting approximately 350 jobs. The company cited AI-driven efficiency improvements as a key reason for the layoffs, which are expected to save between $70 million and $80 million in annual spending.

Jan 8·5 min read
Zcash Backer Bootstrap Splits from Electric Coin Companycryptocurrency

Zcash Backer Bootstrap Splits from Electric Coin Company

Bootstrap, the nonprofit backer of Zcash, has announced a split with the Electric Coin Company. The separation stems from governance tensions regarding nonprofit limits on outside investment.

Jan 8·5 min read