Arabic-Voice-Over-Team

فخّ الـ ٧٠% فصحى: كيف تُقصقِص الخوارزمية لسانك البشري؟

|

العفوية لا تـُهندس. محاولة فرض نسب مئوية على التدفق اللغوي يحول الإنسان إلى آلة غبية تحسب الكلمات بدل أن تعبّر، والنتيجة هي “بيانات تدريب” مشوهة تنتج ذكاءً اصطناعياً يتحدث بطريقة لم يتحدث بها بشر قط.

فخّ الـ ٧٠% فصحى

كيف نسجن اللسان البشري لنرضي الآلة

 

انضممتُ لغرفة المحادثة الصوتية مشرفاً لا متحدثاً، ومعي فريق من السوريين يتحضّرون لتسجيل محادثات عفوية باللهجة الشامية لصالح شركة تقنية أجنبية تُدرّب نموذجاً للذكاء الاصطناعي على فهم العربية المحكية. كان الطلب واضحاً على الورق “الإيميل”، مُبهماً في الواقع: سبعون بالمئة لغة فصحى، وثلاثون بالمئة لهجة محلية، وكل هذا في سياق حديثٍ عفويٍ يحاكي يوميات الحياة.

كانت كلماتي تتقطع أمام المتحدثين وأنا أُدرك أنّ ما يُطلبه العميل الأجنبي لا يُطلب من إنسان، بل يُطلب من آلة أخرى. فأيّ كائنٍ بشريٍ يستطيع أن يُحرّك لسانه وفي ذهنه عدّادٌ يحسب النسب المئوية للكلمات الفصيحة والعامية؟ وكيف يمكن لأيٍّ منّا أن يكون عفوياً في الوقت ذاته الذي يُجري فيه محاسبةً رياضيةً على طبيعة كلّ مفردةٍ ينطقها؟

هذا المشهد ليس مجرد حادثةٍ ميدانيةٍ في عمل الفريلانسر المتخصص في بيانات اللغة، سواء كانت عربية أو حتى إنكليزية أمريكية. إنه استعارةٌ كاملةٌ لما يجري على مستوىً أشمل وأعمق: نحن نُعيد هندسة الكائن البشري لكي يُصبح مادةً خاماً مُهيَّأة للاستيعاب الآلي، بدلاً من أن نُطوّر الآلة لكي تستوعب البشر على طبيعتهم الفوضوية، المتناقضة، والجميلة.

حين يُجبَر الإنسان على أن يقيس عفويّته بالنسب المئوية، فلن يبقى الكلامُ تعبيراً، بل يصبح أداءً مسرحياً لجمهورٍ من الخوارزميات.

هذا المقال ليس هجوماً على الذكاء الاصطناعي، ولا دعوةً إلى التخلف عن ركب التقنية. إنه سؤالٌ فلسفيٌ جوهريٌ يطرحه الفريلانسر العربي من داخل غرف التسجيل وخلف شاشات التدقيق: من يخدم من؟ هل نحن نُدرّب الآلة لتخدم اللغة البشرية، أم أننا نُدرّب أنفسنا لنخدم لغة الآلة؟

المحور الأول: سيكولوجية اللسان — لماذا تموت العفوية حين تُحسب بالنسب؟

لا يعمل الدماغ البشري خلال الحديث كما تعمل الآلة الحاسبة. فحين تتكلم الإنسانة السورية مع جارتها، لا يُوزّع دماغُها الكلماتِ في خانات مُصنَّفة (فصيح/عامي)، بل يُفكّر الدماغ في المعنى، في المشاعر، في السياق الاجتماعي، وفي العلاقة بين المتكلمَين. الكلمة الفصيحة تُولد حين يستدعيها السياق الرسمي أو الديني أو العاطفي، لا حين يقرّر المتحدث أنه قد استنفد (كوتة) العامية لهذا الجزء من الحوار.

ما يُسميه اللسانيون بـ”تبديل الشفرة” (Code-switching) — أي التنقل اللحظي بين اللهجة والفصحى أو حتى بين لغتين — هو ظاهرةٌ مُحرَّكةٌ بمحفزاتٍ عاطفيةٍ وسياقيةٍ واجتماعيةٍ دقيقةٍ وغير واعيةٍ في أغلب الأحيان. يحدث هذا التبديل تلقائياً: حين نصف موقفاً كوميدياً ننزلق إلى العامية، وحين نُقتبس قرآناً أو حكمةً ننتقل إلى الفصحى، وحين نشرح تعليماتٍ تقنيةٍ قد نمزج المصطلح الأجنبي مع البنية المحلية للجملة. لا أحد يُخطّط لذلك.

(راجع سلسلة المقالات المتخصصة: الأسرة متعددة اللغات)

أثبتت أبحاث في علم اللسانيات الإدراكية أن فرض قيودٍ نسبيةٍ مُصطنعةٍ على المتحدثين الأصليين أثناء توليد البيانات الصوتية يُولّد ما يُعرف بـ”الحِمل المعرفي المُضاعَف” (Cognitive Overload): يتحوّل انتباه المتحدث من مستوى المعنى إلى مستوى الحِسبان، فتتباطأ وتيرة الكلام، وتختفي النبرات الطبيعية، وتتصلّب الجمل، وتُصبح المحادثة “روبوتية” حتى لو كانت من بشرٍ من لحمٍ ودم.

بمعنىً آخر: حين تطلب من مُسجِّلٍ بشريٍ أن يكون عفوياً بنسبةٍ مُحددة، تكون قد قتلت العفوية في اللحظة ذاتها التي طلبتها. وما يصل إلى قاعدة بيانات النموذج ليس صوت إنسانٍ حقيقي، بل هو صوت إنسانٍ يُؤدّي دور إنسانٍ حقيقيٍ، وهذا الفارق الدقيق سيُشكّل كل ما ستتعلمه الآلة عن لغتنا.

المحور الثاني: معضلة الناطق الأصلي — حين يرسب الإنسان في اختبار إنسانيته

ثمة مفارقةٌ موجعةٌ يعيشها كثيرٌ من الفريلانسرين المتخصصين في مشاريع بيانات اللغة: المتحدث الأصلي (Native Speaker) قد يكون هو المرشح الأوّل للرفض في مشاريع تهدف رسمياً إلى التقاط الكلام الأصلي الحقيقي.

لماذا يحدث هذا؟ لأن شركات التقنية لا تبحث في الحقيقة عن اللهجة السورية أو المصرية أو المغربية كما هي في الواقع، بل تبحث عن ما يمكن تسميته “اللهجة المُعقمة” أو “النموذج الأفلاطوني للهجة”: نُسخةٌ خياليةٌ مُنقّحةٌ من اللهجة، خاليةٌ من التشويش البشري الطبيعي.

فاللهجة الشامية كائنٌ حيٌّ ومتحرك: تختلف بين دمشق وحلب وحمص، بل تختلف بين حيّ الشاغور وحيّ المزة في دمشق ذاتها. وفي أثناء الحديث الحقيقي تتسرّب إليها: المسافات الزمنية بين الكلمات (السكتات الطبيعية)، والأصوات المُدمجة اللاشعورية، والاقتطاعات النحوية غير المكتملة، وتصحيح المتحدث لنفسه في منتصف الجملة. كل ذلك هو “بشرية اللغة” بامتياز، وكلّه يُصنَّف في خوارزميات تنقية البيانات (Data Cleaning) كـ”ضجيج” (Noise) يجب حذفه!

نحن لا نبحث عن صوتٍ سوريٍ حقيقي، بل عن أداءٍ مسرحيٍ لما تتوهم الخوارزمية أن الصوت السوري ينبغي أن يكون عليه.

والنتيجة العملية التي يراها المشرفون الميدانيون على مشاريع التسجيل: يُرفض المتحدث الأكثر أصالةً ولدونةً لأن نطقه “مليء بالضجيج”، ويُقبل المتحدث الأكثر صنعةً وتكلّفاً لأن صوته “نظيف” وفق معايير الخوارزمية. هكذا يُعاد تعريف الأصالة: ليست ما ولده الإنسان بطبيعته، بل ما قبلته الآلة بمعاييرها.

ونصل هنا إلى نقطةٍ أشد إيلاماً: ماذا تتعلم الآلة من كل هذا؟ تتعلم نموذجاً مُزيفاً للغة يُغيب التنوع اللهجي الحقيقي، ويُهمّش اللكنات الطرفية، ويُرسّخ “لهجةً معيارية” لم يتكلم بها أحد فعلاً في سوقٍ أو مقهىً أو بيت. ثم تُقدَّم لنا هذه الآلة كأداةٍ “فاهمة للعربية”.

vintage microphone stage curtains spotlight

المحور الثالث: المسرح والآلة — وهم المحاكاة وسلطة المرجعية

ليست المرة الأولى التي يُدرّب فيها البشر بعضهم بعضاً عبر المحاكاة. يفعل المسرح والسينما ذلك منذ قرون. وهذان الفنان — التمثيل والأداء — هما في جوهرهما نوع من “التدريب الثقافي” الذي تُمرّر عبره المجتمعات أنماط السلوك واللغة والقيم إلى أجيالها.

لكن ثمة فارقاً جوهرياً يميّز الفن عن الخوارزمية: حين نشاهد مسلسلاً دمشقياً أو مسرحيةً حلبية، نحن نعلم بصورةٍ فطريةٍ أن ما نراه هو أداء، أن اللغة المستخدمة مُعادة صياغتها لخدمة الدراما، وأن ما يقوله الممثل في مشهد الانفعال لن يكون هو المعيار اليومي للحديث. هناك ما يسميه النقاد “عقد الوهم الواعي” (Suspension of Disbelief)، نحن نشارك في الوهم مع وعينا الكامل بأنه وهم، ونعود بعد انتهاء العرض إلى لغتنا الحقيقية دون أن نُدمج أداء الممثل في مرجعيتنا اللغوية.

أما الذكاء الاصطناعي، فيُقدَّم لنا بوصفه مرجعاً، لا أداءً. والبيانات التي دُرِّب عليها — وهي كما أوضحنا بياناتٌ مهندَسةٌ قسراً، تُمثّل لغةً هجينةً لم تنطق بها شعوبٌ بشكلٍ طبيعيٍ — تُصبح المادة الخام لمساعدَين صوتيين وأدوات تعليمية وأنظمة تصحيح لغوي. وكما أن الأجيال التالية قد تتعلم “الانكليزية” من الأفلام دون أن تُدرك الفجوة بين لغة الشاشة ولغة الشارع، فإن الأجيال التالية قد تتعلم “العربية” من آلة دُرِّبت على بشرٍ كانوا يُؤدّون عفويتهم المزيفة بنسبة سبعين بالمئة فصحى.

الفن يعترف بكونه أداءً، ويدعوك إلى الاستمتاع بالأداء مع الاحتفاظ بعالمك الحقيقي. الخوارزمية تُقدِّم الأداءَ على أنه الحقيقة، وتدعوك إلى قياس نفسك بها.

المحور الرابع: حلقة التغذية المرتدة — حين تُصبح الآلة هي المُعلِّم

دعنا نتأمل المآل الذي يقودنا إليه هذا المسار إن استمر.

اليوم: نُقصقِص ألسنتنا لنُنتج بياناتٍ تُرضي الخوارزمية — نتحدث بطريقةٍ غير طبيعيةٍ لنُدرّب نموذجاً يُفترض أنه سيخدم طريقة كلامنا الطبيعية.

وعما قريبٍ غداً: الخوارزمية المُدرَّبة على بياناتنا “المُهندَسة” تُنتج محتوى لغوياً، وتُجيب عن أسئلة الأطفال، وتُصحّح الكتابات، وتُقترح الصياغات. ويتعامل معها ملايين المستخدمين كمرجعيةٍ موثوقة.

بعد غد: الأجيال الصاعدة، التي أمضت ساعاتها مع مساعدَين ذكيَّين وتطبيقاتٍ تعليمية، ستُنمّي حساسيةً لغويةً مُشكَّلةً بهذه “اللغة الهجينة المُعقَّمة”. وحين تتكلم، قد تُحاكي بشكلٍ لاشعوريٍ نمط الآلة، لا نمط جدتها أو جارها.

هذه ليست نظرية مؤامرة، بل هي قانونٌ فيزيائيٌ للمنظومات اللغوية يُعرَف بـ”حلقة التغذية المرتدة” (Feedback Loop): حين تُصبح المخرجات المُصطنعة مدخلات الجيل التالي، يتراكم الانحراف عن الأصل جيلاً بعد جيل. نحن لا نُدرّب الآلة على لغتنا فقط، بل نُدرّب أنفسنا شيئاً فشيئاً على لغة الآلة.

نحن لا نُقترب من مرونة الحياة، إنما نُقترب من جمود الكود. ولسنا ندري إن كان هذا تطوراً أم انكساراً.

والأخطر من ذلك هو ما يمكن تسميته “انحياز السلطة نحو النموذج”: ميلٌ متصاعدُ لدى المستخدمين، خاصةً من الأجيال الشابة، للثقة بمخرجات الذكاء الاصطناعي على حساب حدسهم اللغوي الخاص أو حتى على حساب ما يسمعونه من أهلهم. حين تقول لك آلة “هذه الجملة غير سليمة” بثقةٍ عميقةٍ مدعومةٍ بواجهةٍ تقنيةٍ أنيقة، تميل إلى تصديقها، حتى لو كانت الجملة هي ما نطق به الفصيح منذ مئة عام.

خاتمة: ثورة الضجيج البشري

لسنا هنا لنطالب بوقف تطوير الذكاء الاصطناعي، ولا لنرفض مشاريع بيانات اللغة التي توفر فرصاً حقيقية للفريلانسرين العرب. نحن ندعو إلى شيءٍ أكثر تواضعاً وأكثر صعوبةً في الوقت نفسه: أن تُعيد شركات التقنية تعريف ما يعنيه “الجودة” في بيانات اللغة.

الجودة ليست غياب الضجيج، بل استيعاب الضجيج بوصفه معلومةً. السكتة بين كلمتين ليست خطأً يُحذف، بل هي كلامٌ صامتٌ يحمل معنى. الإدغام اللاشعوري ليس تشويشاً، بل هو بصمة لهجةٍ حية. واللهجة المتنوعة بين أحياء المدينة الواحدة ليست فوضى يجب توحيدها، بل هي ثراءٌ يُمثّل الواقع الاجتماعي الفعلي للمجتمع.

حين تفعل الآلة ذلك — حين تستوعب الإنسان بتشتّته وعفويته وتناقضاته — سيكون ذلك الذكاء الحقيقي. أما ما نفعله الآن، فهو العكس تماماً: نُجبر الإنسانَ على أن يستوعب الآلةَ بقوالبها الجامدة.

وفي المشهد السوري تحديداً، وفي كل السياقات العربية التي يعمل فيها الفريلانسر المحلي وسيطاً بين اللغة الحية والنموذج الرقمي، ثمة مسؤوليةٌ إضافية: أن نُدرك أن أصواتنا حين تدخل غرفة التسجيل لا تُدرّب آلةً فحسب، بل تُشكّل — دون قصدٍ — صورةَ لغتنا في الذاكرة الرقمية للعالم. وهذه الصورة تستحق أن تكون حقيقية.

الإنسان لم يخلق يوماً لغته بالنسب المئوية، ولن يفعل. واللسان البشري لا يعمل بمعادلة (70+30). إنه يعمل بالحياة — بكل ما فيها من فوضى، وتناقض، وجمال غير قابل للحساب.

منصة ذي يزن © ٢٠٢٦

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *