ذكاء اصطناعى جديد يمكنه تحويل النص إلى صورة.. تعرف على Stable Cascade – سعوديوم

تم إصدار أحدث نموذج من برنامج إنشاء الصور الخاص بـ Stability AI، والذي يسمى Stable Cascade، وهو أسرع وأقوى من سابقه الرائد في الصناعة. وتعد التكنولوجيا المستخدمة فيه أساسًا للعديد من أدوات الذكاء الاصطناعي الأخرى لتحويل النص إلى صور، وفقًا لتقرير theverge.

يمكن لـ Stable Cascade إنشاء صور وإعطاء أشكال مختلفة للصورة الدقيقة التي قام بإنشائها، أو محاولة زيادة دقة الصورة الموجودة.

تشمل ميزات تحرير النص إلى صورة أخرى الرسم الداخلي والرسم الخارجي، حيث سيقوم النموذج بتحرير جزء معين فقط من الصورة، بالإضافة إلى ميزة Canny Edge، حيث يمكن للمستخدمين إنشاء صورة جديدة باستخدام حواف الصورة الموجودة فقط .

النموذج الجديد متاح على GitHub للباحثين ولكن ليس للاستخدام التجاري، ويجلب المزيد من الخيارات حتى مع قيام شركات مثل Google وحتى Apple بإصدار نماذج توليد الصور الخاصة بها.

على عكس نماذج Stable Diffusion الرائدة في Stability، فإن Stable Cascade ليس نموذجًا لغويًا واحدًا كبيرًا، بل ثلاثة نماذج مختلفة تعتمد على بنية Würstchen. تقوم المرحلة الأولى، المرحلة ج، بضغط المطالبات النصية إلى أجزاء كامنة (أو أجزاء أصغر من التعليمات البرمجية) يتم تمريرها بعد ذلك إلى المرحلتين أ وب لفك تشفير الطلب.

يؤدي تقسيم الطلبات إلى أجزاء أصغر إلى ضغط الطلب ليتطلب ذاكرة أقل، وساعات أقل من التدريب على وحدات معالجة الرسومات التي يصعب العثور عليها، ويعمل بشكل أسرع مع أداء أفضل “في كل من المحاذاة السريعة والجودة الجمالية، واستغرق إنشاء الصور حوالي 10 ثوانٍ مقارنة بـ 22 ثانية”. ثانية لنموذج SDXL المستخدم حاليًا.

ساعد Stability AI في نشر طريقة Stable Diffusion وكان أيضًا موضوعًا للعديد من الدعاوى القضائية التي تزعم أن Stable Diffusion تم تدريبه على البيانات المحمية بحقوق الطبع والنشر دون الحصول على إذن من أصحاب الحقوق، مع رفع دعوى قضائية في المملكة المتحدة بواسطة Getty Images ضد Stability AI للمحاكمة.


مصدر الخبر

مقالات ذات صلة

زر الذهاب إلى الأعلى