الرسم بالكلمات.. وداعاً للمصمّمين؟

في كانون الثاني/يناير 2021، طوّرت شركة "OpenAI" نموذجاً أولياً للذكاء الاصطناعي أطلق عليه اسم "DALL-E"، والذي اعتبر وقتها ثورة حقيقية في هذا المجال.

  • الرسم بالكلمات.. وداعاً للمصمّمين!
    الرسم بالكلمات.. وداعاً للمصمّمين؟

منذ فترة قصيرة، انتشرت في منصات التواصل الاجتماعي مجموعة من الصور والرسومات التي يمكن تصنيفها بأنها أقرب إلى الخيال العلمي. واللافت أنَّ أغلب هذه الصّور صمَّمه أشخاص غير متخصّصين باستخدام تقنية الذكاء الاصطناعي عبر كتابة مجموعة من الكلمات الوصفية فقط، من دون الحاجة إلى برامج التصميم التقليدية (كالفوتوشوب وغيره)، فإنتاج صورة أو تصميم محترف لن يحتاج منك إلا إلى بعض الخيال والقليل من المهارة الكتابية باللغة الإنكليزية لتحصل خلال ثوانٍ على ما يفوق تصوّرك، فهل تشكّل هذه التقنية الجديدة تهديداً حقيقياً لمصمّمي الغرافيكس والفنانين عموماً؟

لقد بقي المجال الفني والإبداعي لفترة طويلة من المجالات التي كنا نعتقد أنَّ الذكاء الاصطناعي سيعجز عن غزوها بسهولة وإحداث تغيير جذري فيها، نظراً إلى البصمة الفنية الخاصة التي تركها المبدعون، إلى أن وصلت فكرة "الرسم بالكلمات"، وهي أحدث ما توصَّل إليه خبراء الذكاء الاصطناعي، الذي أطلق العنان لعصر جديد يدمج بين الفن والخيال والإبداع المعزز بالتكنولوجيا، والذي لم يعد حكراً على أي فئة فنية، إذ ستتولى الشبكات العصبية الاصطناعية (ANNS) إنتاج أيّ عمل فني كامل من نقطة الصفر.

ما الشبكات العصبية الاصطناعية (ANNs)؟ وكيف تعمل؟

الشبكات العصبية الاصطناعية "Artificial Neural Networks" هي إحدى طرق الذكاء الاصطناعي التي تعلّم الحواسيب معالجة البيانات بطريقة مستوحاة من الدماغ البشري، وهي نوع من عمليات التعلم الآلي التي تسمّى "التعلم العميق"، والتي تؤدي دوراً كبيراً في التعلّم الآلي، إذ يُمكن تدريب الشبكات العصبية الاصطناعية عبر خوارزميات معيّنة للتعرف إلى الكلام أو البيانات النصية أو الصور المرئية، وتستغرق مهامّ التعرف إلى الكلام والصور دقائق أو ثواني في مقابل ساعات عند مقارنتها مع التعرف اليدوي الذي يحدث من قبل البشر.

  • الرسم بالكلمات.. وداعاً للمصمّمين؟
    الشبكات العصبية الاصطناعية "Artificial Neural Networks" هي إحدى طرق الذكاء الاصطناعي

وتشكّل هذه الشبكات الأساس لعدد كبير من التطوّرات التي حدثت في الذكاء الاصطناعي خلال السنوات الماضية، بما فيها أنظمة تحويل الكلمات إلى صور، كما تعدّ خوارزمية البحث من غوغل واحدة من أكثر الشبكات العصبية الاصطناعية شهرةً في العالم.

وتحتوي الشبكة العصبية الاصطناعية 3 طبقات أساسية مترابطة. تتكوَّن الطّبقة الأولى من الخلايا العصبية المدخلة. ترسل هذه الخلايا العصبية البيانات إلى الطبقات الأكثر عمقاً، التي ترسل بدورها بيانات الإخراج النهائية إلى طبقة الإخراج الأخيرة.

كيف بدأ الأمر؟

في كانون الثاني/يناير 2021، طوّرت شركة "OpenAI" نموذجاً أولياً للذكاء الاصطناعي أطلق عليه اسم "DALL-E"، والذي اعتبر وقتها ثورة حقيقية في هذا المجال، وكان قادراً على تحويل الكلمات إلى رسوم بشكل مبسط. بعدها، قام المطورون بجمع بيانات عن ملايين الصور لتدريب خوارزمية "DALL-E" لإعطاء المخرجات المطلوبة بشكل أفضل، إلا أنَّ النتائج التي قدَّمها لم تكن مرضية.

  • الرسم بالكلمات.. وداعاً للمصمّمين؟
    لقد أظهر هذا النظام براعة في التعامل مع الجمل الطويلة والمفصّلة

خلال العام الحالي، أعيد العمل مجدداً على المشروع، ولكن بطريقة محسّنة، وتم تقليص العوامل المستخدمة في النموذج الأول إلى أن أطلق بشكل رسمي في شهر نيسان/أبريل تحت اسم "DALL-E 2"، والذي جاء مبهراً في نتائجه، فقد أذهل الجميع، بمن فيهم الفنانون ومصممو الغرافيكس، بقدرته على تحويل اللغة الطبيعية إلى صور، فلم يعد الخيال هو الحد النهائي للإبداع، بل وصل الإبداع إلى ما يفوق الخيال.

لقد أظهر هذا النظام براعة في التعامل مع الجمل الطويلة والمفصّلة، وأعطى نتائج فاقت التوقعات. وبالمقارنة مع سلفه "DALL-E"، استطاع التفوق عليه بإنتاج صور أكثر واقعية وبدقة أربعة أضعاف.

شركة "غوغل" تدخل على خط المنافسة!

أما شركة "غوغل"، فقد أطلقت نظام "Imagen AI" المنافس لنظام "DALL-E2"، وهو الذي أنشأه فريق "Google rain"، الذي يتمتّع بدرجة غير مسبوقة من الواقعية، وبمستوى عميق من فهم اللغة، بحسب القيمين عليه.

وكما يوحي اسمه، فإنه يسمح لك بإطلاق العنان لخيالك، إذ يلغي حاجتك إلى استخدام برامج التصميم المخصصة، كالفوتوشوب وغيره، لإنتاج صور تعبر عما يدور في خيالك، وكلّ ما عليك فعله هو كتابة ما تريد رؤيته، وهو سيتكفل بتحويل الكلمات إلى رسوم بمجرد إضافة الوصف، فقد تم تدريبه جيداً على فهم العلاقة بين الصورة والكلمات المستخدمة لوصفها.

  • الرسم بالكلمات.. وداعاً للمصمّمين؟
    شركة "غوغل" أطلقت نظام "Imagen AI" المنافس لنظام "DALL-E2"

ولاختبار أدائه، طوّر الفريق أداة "DrawBench" كمعيار يقوم من خلاله البشر بتقييم جودة الصور التي ينتجها نظام "Imagen". وبالمقارنة مع الصور التي ينتجها نظام "DALL- E2"، كان "Imagen" هو الأفضل من حيث جودة الصور ودقتها وواقعيتها.

خاتمة

وأخيراً، فإننا نعتقد أن تقنية الرسم بالكلمات باستخدام تقنية الذكاء الاصطناعي ستساعد في جعل حياتنا أسهل، ولكن ليست مثالية بالقدر الكافي، وستكون من دون شك أداةً طيعة بيد الفنانين والمصممين لبلوغ آفاق جديدة من الإبداع والخيال من دون الخوف أو القلق على مستقبلهم.