مقدمة إلى

تصميم واجهات المستخدم التحادثية

Conversational User Experience Design

الجزء الأول

تطور تصميم الواجهات كثيراً منذ بداية اختراعنا للحواسيب وتعاملنا معها. بداية من الواجهات التي تعتمد على الأوامر المكتوبة CLI في الحواسيب المستخدمة ما بين 1970-1980 إلى الواجهات الرسومية GUI التي تم اختراعها في مختبرات Xerox PARC وانتشر استخدامها بشكل موسع لتتحول لمعيار قياسي في التعامل مع الحواسيب.

نعيش اليوم مرحلة جديدة، توصف فيها الواجهات بالـ “طبيعية” أو Natural User Interfaces . تغطي هذه الواجهات طيفاً واسعاً من التفاعلات والأوساط أو الأجهزة. بداية من ضربات الأصابع على شاشات الموبايل الصغيرة إلى حركات الجسم واليدين في واجهات الواقع الافتراضي VR وتلك التي تضيف طبقة من المعلومات الرقمية أو واجهات الواقع المعزز AR. لكل خصوصية ولجميعها ميزات تأتي كتطور جوهري في لواجهات المستخدم الرسومية.

يتلاشى الحد الفاصل بين ماهو رقمي وماهو فيزيائي مع تطور الواجهات المستمر هذا، خصوصاً في ضوء تطور التكنولوجيا الجوهري والتسارع الملحوظ في تقنيات الذكاء الصنعي تحديداً. استطاعت تكنولوجيات الذكاء الصنعي المختلفة مثل تعلّم الآلة Machine Learning كسر حواجز كثيرة، أهمها في حالتنا اليوم التعرف على اللغة بشكل طبيعي Natural Language Processing.

في عالم التصميم، ظهرت صَنعة تصميم تجربة المستخدم User Experience Design من أروقة آبل في تسعينيات القرن العشرين عبر المصمم الشهير دون نورمان الذي كان سباقاً في وضع “المستخدم” في مركز عملية التطوير الصناعي والبرمجي والنظر للتعامل مع الآلة كـ “تجربة” تستحق الدراسة العميقة. كان هذا وقتها نظرة جديدة لتعامل الإنسان مع الآلة. شكل إنشاء مجال جديد مثل تصميم تجربة المستخدم نقلة نوعية في تصميم البرمجيات والإلكترونيات الحديثة بشكل عام.


قد يكون الزمن الذي نعيشه اليوم مشابهاً مع ولادة نوع جديد من الواجهات وهي الواجهات التحادثية Conversational Interface التي نتجت عن أفكار منتجات مثل المساعدات الشخصية الافتراضية والأجهزة الإلكترونية المتصلة بالإنترنت بشكل دائم مثل مكبرات الصوت الذكية. 

في الواقع، يعود العمل على هذا النوع من الواجهات والتطبيقات لعقود كثيرة (عمل البروفيسور جوزيف فايزباوم من جامعة MIT على مشروع ELIZA كان بالتحديد ثورياً عام 1966). لكن الفرق (كأي تطور ملحوظ) أن عملية التطوير والبحث كانت تقاد من قبل التكنولوجيا وليس التصميم.


أتاحت أجهزة مثل أمازون إيكو وغوغل هوم للتخاطب الصوتي وحتى تطبيقات المحادثة المعاصرة ميزات التخاطب الطبيعي مع الآلة لملايين المستخدمين.


لكن، لايزال هذا المجال حديثاً نوعاً ما ولاتزال الشركات تحاول بناء ذلك النظام التقني الموحد الذي يجعل جميع المساعدات تعمل وفق نفس البنية التحتية وإن اختلفت الواجهة. قد تكون غوغل في الصف الأول مع نظام Google Assistant الذي يمكن التعامل معه بالصوت أو الكتابة، لكن جميع الشركات الأخرى مثل آبل وأمازون تطور مساعداتها بشكل مستمر.

الفرق الجوهري هو اعتماد المساعدات المعتمدة على الكتابة (تشات)  على النص والصورة بالدرجة الأولى (عناصر بصرية بسيطة غير معقدة)، بينما الصوت هو الواجهة في مكبرات الصوت الذكية مثلاً (أي أنها تعتمد على الكلام وسلاسله دون أي عنصر بصري).


التحدي التصميمي واضح هنا..


صحيح أن التطور التكنولوجي ساعد على فهم النص المكتوب والمنطوق بشكل طبيعي جيد، إلا أنه لم يستطع فهم طبيعة التفاعل مع تطبيقات تستفيد من هذه الميزات. أكثر المحاولات “تحاول” تقليد المحادثة (كما سنجد لاحقاً) ولايزال دعم الحديث المتواصل مع المساعدات الرقمية في بداياته. التعامل مع الكلام معقّد وليس ببساطة الواجهات الرسومية المتمثلة بالضغط على الشاشة أو بسحب وإفلات الماوس.

ولعل هذا أهم مميزات التصميم المعاصر لهذه المساعدات. على المصمم فهم مايقوم به بشكل جيد.

لدون نورمان توجيه جيد في هذا المجال. ففي كتاب Living with Complexity يرى نورمان أن علينا عدم تفادي التعقيد لأن النتائج ستكون إما مخيبة للآمال أو غير مرغوبة. علينا فهم التعقيد الذي تقوم عليه هذه الواجهات الجديدة لأنها في جوهرها تعكس تعقيد العالم الذي نعيش.

أتحدث عن التعقيد هنا لأن تصميم تجربة المستخدم التحادثية يتجاوز تطبيقات التصميم وأدواتها المختلفة. أصبح تصميم النماذج الأولية وحتى تطوير المساعدات سهلاً نوعاً ما (تدعم تطبيقات مثل Adobe XD تطوير نماذج أولية لواجهات صوتية قادرة على التعرف على الكلام والحديث، هناك الكثير من منصات إنشاء البوتات بدون برمجة)، لكن تصميم التجربة ليس بهذه البساطة.

على مصممي التجارب التحادثية الاستسقاء من مجالات أخرى مثل العلوم الاجتماعية وعلم النفس واللسانيات أو علم اللغة. مجال تحليل المحادثات CA على سبيل المثال هو أحد المجالات المتفرعة من علم الاجتماع والتي تقدم خبرة أكثر من 50 عام من الدراسات التجريبية التي توضح طبيعة التفاعلات التي تجري أثناء الحديث وسنرى لاحقاً أهميته في فهم طبيعة الحديث.

مفاهيم كثيرة في اللغة فندتها غوغل بشكل جميل في دليلها للتصميم التحادثي المجاني مثل “مفهوم التعاون” الذي يقوم على أن هناك نوع من التعاون الخفي بين المشاركين في أي حوار طبيعي بين البشر لفهم النيّة. (سأتحدث عن هذا المفهوم بشكل موسّع في المستقبل).

ما أودّ أن أركز عليه في هذه التدوينة السريعة هو بعض المفاهيم الأساسية حول التصميم التحادثي إضافة لذكر بعض المصادر التي قد تساعد على الاستزادة. الجميل في مقاربة الموضوع تصميمياً أنه يمكننا تجاوز عقبات تكنولوجيا التطوير للغة العربية الذي لايزال ضعيفاً ونركز على المفاهيم اللغوية المشتقة من علم اللسانيات التي من الممكن أن تنطبق على أي لغة.

أنماط التفاعل والتحادث أولاً

يرى Robert J. Moore وزملاؤه في كتاب دراسات في تصميم تجربة المستخدم التحادثية Studies in Conversational UX Design أن هناك أنماط للتطبيقات التحادثية التي يمكن أن نصمم لها. كل التجارب التحادثية هي تفاعلات من نوع ما، لكن ليست كل التفاعلات محادثات حتى لو بدت كذلك. تقدم منصات تطوير التطبيقات التحادثية اليوم (بوتات، مساعدات صوتية وغيرها) إمكانية التصميم لكثير من التفاعلات التحادثية إن صح التعبير نظراً لاعتمادها في الجوهر على تصنيف اللغة الطبيعية Natural Language Classification أو NLC (وهو أحد مجالات معالجة اللغة الطبيعية آلياً المشتق من دراسات الذكاء الصنعي في اللغة).

يؤمن استخدام NLC القدرة على تمييز الكثير من أنماط الكلام والعبارات، لكن الفكرة هنا أن الأمر لا يتوقف فقط على التطور الناتج عن فهم الكلام. تصميم وبناء كل تطبيق يؤدي لتجربة استخدام مختلفة. وفقاً لـ Moore وزملاؤه، هناك أربع أنماط مختلفة للتفاعل مع المساعدات القادرة على التعرف على الكلام هذه.

  • مساعدات تتمركز حول نظام System-centric

  • مساعدات تتمركز حول المحتوى Content-centric

  • مساعدات تتمركز حول الدلائل البصرية Visual-centric

  • مساعدات تتمركز حول التحادث Conversation-centric


سأحاول الآن وبشكل تقريبي، طرح مثال حول كل نوع وأتمنى أن أوفق في نقلها للعربية (يمكن مراجعة الكتاب للأصل). جميع أمثلتنا تفترض مساعداً "ذكياً" لشركة تأمين طبي ومعذرة مسبقاً إذا لم تكن دقيقة في عالم التأمين فالهدف هنا توضيح نوع المساعدات.

  • المساعدات التي تتمركز حول نظام

يماثل التفاعل مع هذه المساعدات التعامل مع محرك بحث على الويب أو نظام تحكم صوتي بسيط.

مرحباً وأهلاً وسهلاً بك. يمكنك الحصول على إجابات مباشرة حول أي استفسار يتعلق بحسابك. فقط أتبع سؤالك بنوع الحساب. مثال: أود الإستعلام عن لقاح الانفلونزا لـ الحساب الذهبي


أود الإستعلام عن فحص السكري لـ الحساب الذهبي

يغطي حسابك فحص السكري إضافة لتكاليف المعالجة. نقوم بتغطية 100% من التكاليف.

شكراً

لايوجد إجابة لهذا السؤال. يمكنك الحصول على إجابات مباشرة حول أي استفسار يتعلق بحسابك. فقط أتبع سؤالك بنوع الحساب. مثال: أود الإستعلام عن لقاح الانفلونزا لـ الحساب الذهبي


كما نلاحظ في هذه الحالة يمكن للمساعد التعرف فقط على نمط واحد من التفاعل وهو الأسئلة أو الأوامر. لا يمكن للنظام التعرف على أنواع أخرى من الحديث كالشكر مثلا.ً من أكثر مميزات هذا النمط من المساعدات أيضاً هو أنها غير قادرة على متابعة الحديث، حيث أنها "تنسى" التتابع وتعود للبداية بهدف الحصول على سؤال أو استفسار جديد.

  • مساعدات تتمركز حول المحتوى Content-centric Style

المساعدات هنا مشابهة لصفحة الأسئلة الشائعة FAQ على الويب.

مرحباً بك. أنا مساعد شركة التأمين الآلي. ماسؤالك؟


هل لدي تأمين لمرض السكري؟