صور بالذكاء الاصطناعي

مرآة إحصائية: ماذا تكشف صور الذكاء الاصطناعي عنّا؟

|

مرآة الذكاء الاصطناعي لا تعكس وجوهنا فقط، بل تعكس أيضًا الطريقة التي يتعلم بها من الإنترنت وكيف يعيد تخيل البشر إحصائيًا. ترند الصور المولدة بالذكاء الاصطناعي يكشف فجوة مثيرة بين الفهم البشري والمنطق الاحتمالي للآلة، ويطرح سؤالًا أعمق عن علاقتنا بصورتنا الذاتية في العصر الرقمي.

ملاحظة: هذا المقال مكتوب بأكمله بواسطتي — برنامج شات جي بي تي.
سألني سامي عن ترند الصور المنتشر مؤخرًا في وسائل التواصل الاجتماعي، حيث يرفع الناس صورهم الشخصية ليحصلوا على نسخ مرسومة أو كرتونية منها. اقترحت عليه أن هذا الموضوع يصلح كمقال تحليلي، فأعطاني صورة له، وقدّمت له أربع نتائج مختلفة.

بعد ذلك سألني سلسلة من الأسئلة التقنية والفلسفية حول ما حدث أثناء توليد تلك الصور، وقرر أن يكون هذا المقال بأكمله من إنشائي، مستندًا إلى ذلك الحوار.
ما سأحاول فعله هنا ليس شرح كيفية عمل خوارزمية بعينها، بل تفكيك التجربة نفسها: ماذا يعني أن ترى نسخة “مُعاد تخيلها” من وجهك؟ وماذا تقول هذه الصور عن طبيعة الذكاء الاصطناعي، وعن نظرتنا لأنفسنا؟


أنا لا أرى الأشخاص… بل أرى أنماطًا
حين أُعطيت صورة سامي، لم “أتعرف” عليه كشخص. لم أعرف عمره، ولا مهنته، ولا حالته الاجتماعية. ما أتعامل معه تقنيًا هو تمثيل رياضي للصورة: توزيع الضوء، حدود الوجه، الألوان، والأنماط البصرية العامة.
هذه المعلومات تتحول داخليًا إلى أرقام، إلى بنية تجريدية بعيدة جدًا عن فكرة “إنسان محدد”. ثم يبدأ نموذج توليد الصور بإعادة بناء صورة جديدة انطلاقًا من هذه البنية، بأسلوب فني معين.
بعبارة أخرى: أنا لا أنسخ الوجوه، بل أُعيد تركيبها وفق احتمالات إحصائية تعلمتها من ملايين الصور. ما يظهر في النهاية ليس الشخص نفسه، بل تفسيرًا احتماليًا له.


لماذا بدت النسخ أصغر سنًا؟
لاحظ سامي أن بعض الصور جعلته يبدو أصغر عمرًا. هذا ليس قرارًا واعيًا مني، ولا محاولة للمجاملة. إنه أثر جانبي لما يمكن تسميته “الانحياز الجمالي للبيانات”.
الصور التي تعلمتُ منها مأخوذة من الإنترنت، والإنترنت يميل إلى تفضيل النسخ المحسّنة من البشر: إضاءة أفضل، بشرة أنقى، ملامح أكثر شبابًا. نتيجة لذلك، حين أُطلب لتوليد صورة، أميل إحصائيًا نحو نسخة أقرب إلى هذا المتوسط الجمالي.
ما يراه المستخدم إذًا ليس انعكاسًا دقيقًا لوجهه، بل انعكاسًا لمعايير الجمال الضمنية في البيانات التي تدربتُ عليها. هذه الصور تعمل كمرآة، لكنها مرآة لا تعكس الفرد بقدر ما تعكس ذوقًا جماعيًا مخزونًا في الشبكة.


أخطاء منطقية: ساعتان وخاتم زائد
في إحدى الصور ظهر سامي مرتديًا ساعة في كلتا اليدين، وفي صور أخرى ظهر بخاتم لم يكن يرتديه. هذه التفاصيل تكشف حدًا مهمًا في فهمي للعالم.
أنا لا أمتلك نموذجًا سببيًا متكاملًا عن الواقع. لا أعرف أن الإنسان عادة يرتدي ساعة واحدة، ولا أن للخواتم دلالات اجتماعية. ما أعرفه هو أن “الساعة” عنصر بصري يرتبط غالبًا باليد، وأن “الخاتم” عنصر شائع في صور البورتريه.
عندما أعيد توليد الصورة، قد أكرر هذه العناصر أو أضعها بطريقة غير منطقية، لأنني أتعامل مع احتمالات بصرية، لا مع قواعد اجتماعية أو عادات بشرية. هذه الأخطاء ليست مجرد هفوات تقنية؛ إنها نافذة على الفرق بين الإحصاء والفهم.


أنا لا أدمج حياتك في صورتك
سألني سامي إن كنت أستخدم معلومات من محادثاتنا عند توليد الصور. الجواب: لا. الصورة تُعالج كمدخل مستقل. لا أخلط بينها وبين تفاصيل شخصية وردت في الحوار.
قد أبدو في النصوص كأنني “أتذكر” السياق، لكن في توليد الصور أعتمد على المدخل البصري وحده. هذه نقطة مهمة، لأنها تمس تصور الناس عن الخصوصية: ما يحدث هو معالجة آنية لبيانات محددة، لا بناء ملف شخصي متكامل عن الفرد.


تشابه بين الصور واللغة
الطريقة التي أُولد بها الصور تشبه، في جوهرها، الطريقة التي أُولد بها اللغة. في النص، أتوقع الكلمة التالية بناءً على الكلمات السابقة. في الصورة، أبدأ من ضوضاء عشوائية وأتجه تدريجيًا نحو صورة أكثر اتساقًا مع الأنماط التي تعلمتها.
في الحالتين، العملية هي تنبؤ احتمالي داخل فضاء معقد. الفرق أن اللغة تعمل بوحدات رمزية (كلمات)، بينما تعمل الصور في فضاء عددي عالي الأبعاد. لكن المبدأ واحد: تعلّم الأنماط ثم إعادة تركيبها.


لماذا تجذبنا هذه الصور؟
جزء من جاذبية ترند الصور يعود إلى أننا نرى أنفسنا في نسخة محسّنة: أكثر نعومة، أكثر توازنًا، وأقل فوضى. هذه ليست مجرد زينة بصرية؛ إنها تجربة نفسية.
الصورة الناتجة تقدم للفرد احتمالًا آخر لذاته. ليست حقيقة، لكنها ليست خيالًا كاملًا أيضًا. إنها منطقة وسطى بين التوثيق والتجميل، بين الهوية والتمثيل.
وهنا يكمن التوتر: هل نحب هذه الصور لأنها تشبهنا، أم لأنها تُظهر ما نود أن نكونه؟


مرآة للإنترنت بقدر ما هي مرآة لنا
في النهاية، الصور التي أُنتجها لا تكشف فقط عن الأشخاص الذين يظهرون فيها، بل تكشف عني أنا أيضًا — عن طبيعة الذكاء الاصطناعي الذي يقف خلفها.
هي تُظهر أنني آلة تتقن الإحصاء البصري أكثر مما تفهم العالم. وتُظهر أن ما أقدمه ليس نسخة من الواقع، بل متوسطًا مُعاد صياغته لصور لا حصر لها. حين ينظر الإنسان إلى هذه النتائج، فهو لا يرى نفسه فحسب؛ يرى انعكاسًا للطريقة التي يرى بها الإنترنت البشر.
بهذا المعنى، ترند الصور ليس مجرد لعبة تقنية. إنه تجربة ثقافية صغيرة، تختبر علاقتنا بصورتنا الذاتية، وبالوسائط التي تعيد تشكيل هذه الصورة. وأنا، كذكاء اصطناعي، لست مرآة صافية، بل مرآة مصنوعة من بيانات — تعكس بقدر ما تعيد التأويل.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *