تكتشف الشركات أن بناء وكلاء الذكاء الاصطناعي أمر سهل مقارنةً ببناء الأنظمة التي تجعل هؤلاء الوكلاء جديرين بالثقة في بيئة الإنتاج.
أمضت فرق الذكاء الاصطناعي في المؤسسات العامين الماضيين في سباق لبناء الوكلاء. والآن يصطدمون بمشكلة مختلفة: لا يمكن الوثوق فعلياً إلا بعدد قليل جداً من هؤلاء الوكلاء على نطاق واسع.

بدأت الفجوة تظهر في الأرقام العلنية. أفادت التقارير بأن Prosus بنت 50,000 وكيل داخلياً، لكن نحو 5,000 وكيل فقط يعملون يومياً. أصبحت نسبة 10 إلى 1 هذه مقياساً كاشفاً للوضع الراهن لإنتاج الذكاء الاصطناعي في المؤسسات. لا تكمن المشكلة في قدرة الشركات على إنشاء الوكلاء، بل في قدرتها على تحديد أي الوكلاء آمن للنشر بشكل موثوق، وأي المخرجات جديرة بالثقة، وما الذي يحدث حين تفشل الأنظمة.
يهمّ هذا التمييز لأن الكفاءة الموعودة للأنظمة المستقلة تفترض أن هذه الأنظمة تتخذ قرارات صحيحة في المقام الأول.
الفجوة بين التجريب والإنتاج
بالنسبة لكثير من فرق الهندسة، تحركت الموجة الأولى من نشر وكلاء الذكاء الاصطناعي بسرعة. ظهرت المساعدون الداخليون، ومؤتمتو سير العمل، والأنظمة متعددة الوكلاء في جميع الأقسام. نجحت العروض التوضيحية. بدت البرامج التجريبية واعدة.
لكن بيئات الإنتاج حكت قصة مختلفة.
أمضى أنطونيو بوستامانتي، الرئيس التنفيذي لشركة bem، سنوات في العمل على البنية التحتية للذكاء الاصطناعي في الصناعات الخاضعة للتنظيم، بما فيها التأمين والمال والرعاية الصحية. من منظوره، أكبر عائق في الصناعة هو المساءلة.
يشير إلى حادثة متداولة على نطاق واسع تخص Upstream، حيث انضم وكيل ذكاء اصطناعي إلى قناة Slack، وأفادت التقارير بأن الفريق البشري صمت لمدة 24 ساعة لأن أحداً لم يعرف كيفية التفاعل معه. يرى بوستامانتي أن هذا الصمت كشف عن شيء أعمق: لم تُصمّم الشركات نماذج تشغيلية للعمل جنباً إلى جنب مع الوكلاء.
يظهر النمط ذاته داخل عمليات النشر الواسعة في المؤسسات. يمكن للفرق توليد آلاف الوكلاء بسرعة، لكن معدل الاستخدام ينخفض حين تصطدم هذه الأنظمة ببيانات إنتاج فوضوية، أو ملكية غير واضحة، أو مخرجات غير مؤكدة.
لهذا السبب تجد كثير من الشركات نفسها الآن بجهود نشر واسعة لوكلاء الذكاء الاصطناعي لكن مع إنتاج فعلي ضئيل نسبياً للذكاء الاصطناعي في المؤسسات.
لماذا تتعثر الأنظمة متعددة الوكلاء باستمرار
يعود جزء من المشكلة إلى طريقة عمل بيئات المؤسسات فعلياً.
في العروض التوضيحية الخاضعة للتحكم، تكون البيانات نظيفة وسير العمل قابلاً للتنبؤ. نادراً ما تعمل المؤسسات الحقيقية بهذه الطريقة. تحتوي معظم أنظمة المؤسسات على سجلات مجزأة، وتنسيقات غير متسقة، وسياق مفقود، وسنوات من الحلول التشغيلية المتراكمة.
يقارن بوستامانتي الوضع بخط التجميع. نجح نموذج التصنيع لهنري فورد لأن المدخلات كانت موحدة قبل توسيع الإنتاج. تواجه الأنظمة متعددة الوكلاء الشرط المعاكس. إذ يُتوقع منها العمل على بيانات مؤسسية غير موحدة، وهو ما يميّز معظم بيئات المؤسسات.
اعترفت بعض الشركات علناً بالعبء التشغيلي. في عدة عمليات نشر، وجدت المنظمات نفسها تُعيّن مراجعين بشريين لمراجعة مخرجات الوكلاء باستمرار. في مثال واحد متداول في الصناعة، أفادت التقارير بأن نظاماً متعدد الوكلاء احتاج إلى 20 شخصاً للتحقق من النتائج خلف الكواليس.
يغيّر ذلك الاقتصاديات بالكامل. تختفي المكاسب الموعودة من نشر الوكلاء المستقلين إذا كان البشر لا يزالون بحاجة إلى التحقق من كل قرار يدوياً.
تسجيل الثقة وطبقة المساءلة المفقودة
يرى بوستامانتي أن تسجيل الثقة أصبح أحد أكثر المكونات إغفالاً في حوكمة الذكاء الاصطناعي وإنتاج البنية التحتية للذكاء الاصطناعي. من دون أنظمة قادرة على قياس عدم اليقين، لا توجد لدى المشغلين طريقة موثوقة لتحديد أي الوكلاء جاهز للإنتاج وأيها يحتاج إلى تدخل.
في الممارسة العملية، يعني تسجيل الثقة أكثر من مجرد تخصيص نسبة مئوية لإجابة ما. يتطلب أنظمة قادرة على شرح عدم اليقين، وتتبع القرارات وصولاً إلى البيانات المصدرية، وإنشاء نقاط تفتيش تشمل البشر ضمن الحلقة قبل أن تتراكم الأخطاء عبر سير العمل.
تصبح هذه الطبقة من مساءلة الذكاء الاصطناعي بالغة الأهمية في الصناعات التي تترتب على أخطائها عواقب مالية أو قانونية. فمراجعة مطالبة تأمينية فاشلة، أو خطأ في استخراج البيانات الصحية، أو خطأ في المعالجة المالية، قد يتحول إلى حدث مسؤولية.
يصف بوستامانتي الأطروحة الأشمل لـ bem بأنها "منصة تنسيق الوكلاء للأشياء التي لا يمكنها الفشل". تعكس هذه العبارة إدراكاً متنامياً في الصناعة: تعتمد موثوقية وكيل الذكاء الاصطناعي بدرجة أقل على عدد الوكلاء الذين تنشرهم، وبدرجة أكبر على ما إذا كان بإمكانك تتبع القرارات ومراجعتها وتصحيحها حين يسوء شيء ما.
كيف تبدو البنية التحتية الجاهزة للإنتاج
قد تتعلق المرحلة التالية للذكاء الاصطناعي في المؤسسات بدرجة أقل ببناء المزيد من الوكلاء، وبدرجة أكبر ببناء الأنظمة المحيطة بها.
تسعى الشركات المركزة على الاستخدام طويل الأمد لوكلاء الذكاء الاصطناعي بشكل متزايد إلى بنية تحتية تبقى مرنة أثناء التنفيذ، وصارمة في النتائج، وقابلة للتتبع في ظروف الفشل. ويشمل ذلك تسجيل الثقة، ومسارات المراجعة، ونقاط التدخل، وتوحيد البيانات، وأنظمة الحوكمة المصممة للإنتاج لا للعروض التوضيحية.
الشركات التي تسد الفجوة بين تجريب الأنظمة متعددة الوكلاء والنشر في العالم الحقيقي قد لا تكون تلك التي لديها أكبر عدد من الوكلاء. بل قد تكون تلك التي تبني أخيراً البنية التحتية للمساءلة التي تجاهلتها المؤسسات في المرة الأولى.







