ذكاء اصطناعى جديد يمكنه تحويل النص إلى صورة.. تعرف على Stable Cascade

الخميس، 15 فبراير 2024 06:00 م

صور الذكاء الاصطناعى - أرشيفية

كتبت سماح لبيب

اضف تعليقاً واقرأ تعليقات القراء

تم إصدار أحدث نموذج من برنامج لـ Stability AI والخاص بتوليد الصور بالذكاء الاصطناعى، الذى يسمى Stable Cascade، ويعد أسرع وأقوى من سابقه الرائد في الصناعة، فالتقنية المستخدمة فيه هى أساس العديد من أدوات الذكاء الاصطناعي الأخرى لتحويل النص إلى صورة، وفقا لتقرير theverge.

ويمكن لـ Stable Cascade إنشاء صور وإعطاء أشكال مختلفة للصورة الدقيقة التي أنشأها، أو محاولة زيادة دقة الصورة الموجودة.

وتشتمل ميزات تحرير النص إلى صورة أخرى على الرسم الداخلي والرسم الخارجي، حيث سيقوم النموذج بتحرير جزء معين فقط من الصورة، بالإضافة إلى ميزة Canny Edge، حيث يمكن للمستخدمين إنشاء صورة جديدة فقط باستخدام حواف الصورة الموجودة.

ويتواجد النموذج الجديد على GitHub للباحثين ولكن ليس للاستخدام التجارى، ويجلب المزيد من الخيارات حتى مع قيام شركات مثل Google وحتى Apple بإصدار نماذج توليد الصور الخاصة بها.

وعلى عكس نماذج Stable Diffusion الرائدة في Stability، فإن Stable Cascade ليس نموذجًا لغويًا واحدًا كبيرًا ، بل إنه ثلاثة نماذج مختلفة تعتمد على بنية Würstchen ، المرحلة الأولى، المرحلة C، تضغط مطالبات النص إلى أجزاء كامنة (أو أجزاء أصغر من التعليمات البرمجية) التي يتم بعد ذلك تمريرها إلى المرحلتين A وB لفك تشفير الطلب.

ويؤدي تقسيم الطلبات إلى أجزاء أصغر إلى ضغط الطلب ليتطلب ذاكرة أقل، وساعات أقل من التدريب على وحدات معالجة الرسومات التي يصعب العثور عليها، ويعمل بشكل أسرع مع الأداء الأفضل "في كل من المحاذاة السريعة والجودة الجمالية، واستغرق إنشاء الصورة حوالي 10 ثوانٍ مقارنة بـ 22 ثانية لنموذج SDXL المستخدم حاليًا.

وساعد Stability AI في نشر طريقة النشر المستقر وكان أيضًا موضوعًا للعديد من الدعاوى القضائية التي تزعم أن Stable Diffusion تم تدريبه على البيانات المحمية بحقوق الطبع والنشر دون الحصول على إذن من أصحاب الحقوق، حيث يتم رفع دعوى قضائية في المملكة المتحدة من جانب Getty Images ضد Stability AI إلى المحاكمة.