يكشف الخبراء عن أداة الذكاء الاصطناعي (AI) التي يمكنها تحويل اللوحات الشهيرة إلى أنماط فنية مختلفة، أو إنشاء أعمال فنية جديدة تمامًا من رسالة نصية، قد تعمل باستخدام "لغة سرية"، وتم إطلاق تطبيق تحويل النص إلى صورة DALL-E 2 بواسطة مختبر الذكاء الاصطناعي OpenAI الشهر الماضي، وهو قادر على إنشاء العديد من الصور الواقعية والأعمال الفنية من رسالة نصية واحدة.
وفقا لما ذكرته صحيفة "ديلى ميل" البريطانية، فإنه قادر على إضافة كائنات إلى الصور الموجودة، أو حتى توفير وجهات نظر مختلفة على صورة موجودة.
يعتقد الباحثون الآن أنهم ربما اكتشفوا كيفية عمل التكنولوجيا، بعد اكتشاف أن الكلمات المبهمة تنتج صورًا محددة، فاستخدم طالب الدكتوراه في علوم الكمبيوتر، جيانيس داراس، البرنامج في البداية لإنشاء صور تحتوي على نص بداخلها، عن طريق طلب "تسميات توضيحية" أو "ترجمات"، ثم احتوت الصور الناتجة على ما بدا أنه تسلسل عشوائي من الحروف.
ولكن عندما أعاد إدخال هذه الأحرف إلى التطبيق، وجد أن التطبيق ينتج صورًا لنفس الموضوع أو المشهد، مما يعني أنها لم تكن عشوائية على الإطلاق.
يشير هذا إلى أن DALL-E 2 يمكن أن يعمل عن طريق ترجمة النص المدخل إلى لغته الخاصة، والتي يستخدمها بعد ذلك لإنشاء الصور التي نراها.
كيف يعمل DALL-E؟
أمضت شركة OpenAI عامين في بناء DALL-E 2 وسابقتها DALL-E، التي تعتمد على الشبكات العصبية الاصطناعية (ANNs)، تحاول محاكاة الطريقة التي يعمل بها الدماغ من أجل التعلم، وتستخدم أيضًا في المساعدين الأذكياء مثل Siri و Cortana.
يمكن تدريب الشبكات العصبية الاصطناعية على التعرف على أنماط المعلومات، بما في ذلك الكلام أو البيانات النصية أو الصور المرئية، وهي الأساس لعدد كبير من التطورات في الذكاء الاصطناعي خلال السنوات الأخيرة.
جمع مطورو OpenAI بيانات عن ملايين الصور للسماح لخوارزمية DALL-E بمعرفة الشكل الذي من المفترض أن تبدو عليه الكائنات المختلفة ووضعها معًا في النهاية.
عندما يقوم المستخدم بإدخال بعض النص لـ DALL-E لإنشاء صورة منه، فإنه يلاحظ سلسلة من الميزات الرئيسية التي يمكن أن تكون موجودة، ثم تقوم شبكة عصبية ثانية، تُعرف بنموذج الانتشار، بإنشاء الصورة وتوليد وحدات البكسل اللازمة لتصورها وتكرارها.
تم أضافة تعليقك سوف يظهر بعد المراجعة