Companiile descoperă că construirea agenților AI este ușoară în comparație cu construirea sistemelor care fac acești agenți demni de încredere în producție. Echipele AI din întreprinderiCompaniile descoperă că construirea agenților AI este ușoară în comparație cu construirea sistemelor care fac acești agenți demni de încredere în producție. Echipele AI din întreprinderi

Ai implementat 50.000 de agenți. Și acum? Problema infrastructurii de responsabilitate pe care întreprinderile continuă să o ignore

2026/05/30 14:28
5 min de lectură
Pentru opinii sau preocupări cu privire la acest conținut, contactează-ne la crypto.news@mexc.com

Companiile descoperă că a construi agenți AI este ușor în comparație cu a construi sistemele care fac acei agenți demni de încredere în producție.

Echipele de AI enterprise au petrecut ultimii doi ani în cursă pentru a construi agenți. Acum se confruntă cu o problemă diferită: foarte puțini dintre acei agenți pot fi cu adevărat de încredere la scară largă.

Ai Implementat 50.000 de Agenți. Și Acum? Problema Infrastructurii de Responsabilitate pe Care Întreprinderile Continuă să o Ignore

Decalajul începe să apară în cifre publice. Se raportează că Prosus a construit intern 50.000 de agenți, dar doar aproximativ 5.000 rulează zilnic. Acel raport de 10 la 1 a devenit un indicator revelator pentru starea actuală a producției AI enterprise. Problema nu este dacă companiile pot crea agenți. Este dacă pot determina în mod fiabil care agenți sunt siguri pentru implementare, care rezultate sunt demne de încredere și ce se întâmplă când sistemele eșuează.

Această distincție contează deoarece eficiența promisă a sistemelor autonome presupune că sistemele iau decizii corecte în primul rând.

Decalajul dintre Experimentare și Producție

Pentru multe echipe de inginerie, primul val de implementare a agenților AI s-a mișcat rapid. Copilots interni, automatizatoare de fluxuri de lucru și sisteme multi-agent au apărut în toate departamentele. Demo-urile au funcționat. Programele pilot păreau promițătoare.

Mediile de producție au spus o altă poveste.

Antonio Bustamante, CEO al bem, a petrecut ani lucrând la infrastructura AI pentru industrii reglementate, inclusiv asigurări, finanțe și sănătate. Din perspectiva sa, cel mai mare blocaj al industriei este responsabilitatea.

El se referă la un incident larg discutat implicând Upstream, în care un agent AI s-a alăturat unui canal Slack, iar echipa umană ar fi tăcut timp de 24 de ore deoarece nimeni nu știa cum să interacționeze cu el. Bustamante susține că tăcerea a expus ceva mai profund: companiile nu au proiectat modele operaționale pentru a lucra alături de agenți.

Același tipar apare în implementările enterprise la scară largă. Echipele pot genera rapid mii de agenți, dar utilizarea scade odată ce acele sisteme întâlnesc date de producție dezordonate, proprietate neclară sau rezultate incerte.

De aceea multe companii se găsesc acum cu eforturi extinse de implementare a agenților AI, dar cu o producție AI enterprise relativ mică.

De Ce Sistemele Multi-Agent Continuă să Stagneze

O parte din problemă vine din modul în care mediile enterprise funcționează în realitate.

În demo-urile controlate, datele sunt curate și fluxurile de lucru sunt previzibile. Organizațiile reale operează rar în acest mod. Majoritatea sistemelor enterprise conțin înregistrări fragmentate, formate inconsistente, context lipsă și ani de soluții operaționale acumulate.

Bustamante compară situația cu linia de asamblare. Modelul de fabricație al lui Henry Ford a reușit deoarece intrările au fost standardizate înainte ca producția să fie scalată. Sistemele multi-agent se confruntă cu condiția opusă. Se așteaptă să opereze pe date enterprise nestandardizate, ceea ce este caracteristic pentru majoritatea mediilor enterprise.

Unele companii au recunoscut deja public povara operațională. În mai multe implementări, organizațiile s-au găsit alocând recenzori umani pentru a verifica continuu rezultatele agenților. Într-un exemplu care circulă în industrie, un sistem multi-agent ar fi necesitat 20 de persoane pentru a valida rezultatele în culise.

Aceasta schimbă complet economia. Câștigurile promise din implementarea agenților autonomi dispar dacă oamenii trebuie în continuare să verifice manual fiecare decizie.

Scorul de Încredere și Stratul de Responsabilitate Lipsă

Bustamante susține că scorul de încredere a devenit una dintre cele mai neglijate componente în guvernanța AI și producția infrastructurii AI. Fără sisteme care pot măsura incertitudinea, operatorii nu au o modalitate fiabilă de a determina care agenți sunt pregătiți pentru producție și care necesită intervenție.

În practică, scorul de încredere înseamnă mai mult decât a atribui un procent unui răspuns. Necesită sisteme care pot explica incertitudinea, urmări deciziile înapoi la datele sursă și crea puncte de control cu implicare umană înainte ca erorile să se acumuleze în fluxurile de lucru.

Acel strat de responsabilitate AI devine deosebit de important în industriile unde greșelile au consecințe financiare sau legale. O revizuire eșuată a unei cereri de asigurare, o eroare de extragere în sănătate sau o greșeală de procesare financiară pot deveni un eveniment de răspundere.

Bustamante descrie teza mai largă a bem ca „Platforma de orchestrare a agenților pentru lucrurile care nu pot eșua." Fraza reflectă o realizare crescândă în industrie: fiabilitatea agentului AI depinde mai puțin de câți agenți implementezi și mai mult de dacă poți urmări, audita și corecta deciziile când ceva merge prost.

Cum Arată Infrastructura Pregătită pentru Producție

Următoarea fază a AI enterprise poate avea mai puțin de-a face cu construirea mai multor agenți și mai mult cu construirea sistemelor din jurul lor.

Companiile axate pe utilizarea pe termen lung a agenților AI caută din ce în ce mai mult infrastructuri care rămân flexibile în timpul execuției, sunt rigide în rezultate și sunt trasabile în condiții de eșec. Aceasta include scorul de încredere, trasee de audit, puncte de intervenție, standardizarea datelor și sisteme de guvernanță proiectate pentru producție, nu demo-uri.

Companiile care închid decalajul dintre experimentarea cu sisteme multi-agent și implementarea în lumea reală s-ar putea să nu fie cele cu cei mai mulți agenți. Ar putea fi cele care construiesc în cele din urmă infrastructura de responsabilitate pe care întreprinderile au omis-o prima dată.

Comentarii
Oportunitate de piață
Logo Gensyn
Pret Gensyn (AI)
$0.02903
$0.02903$0.02903
-9.11%
USD
Gensyn (AI) graficul prețurilor în timp real

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Register for a chance to win a free lucky draw

Declinarea responsabilității: Articolele publicate pe această platformă provin de pe platforme publice și sunt furnizate doar în scop informativ. Acestea nu reflectă în mod necesar punctele de vedere ale MEXC. Toate drepturile rămân la autorii originali. Dacă consideri că orice conținut încalcă drepturile terților, contactează crypto.news@mexc.com pentru eliminare. MEXC nu oferă nicio garanție cu privire la acuratețea, exhaustivitatea sau actualitatea conținutului și nu răspunde pentru nicio acțiune întreprinsă pe baza informațiilor furnizate. Conținutul nu constituie consiliere financiară, juridică sau profesională și nici nu trebuie considerat o recomandare sau o aprobare din partea MEXC.

SPACEX(PRE) Launchpad

SPACEX(PRE) LaunchpadSPACEX(PRE) Launchpad

Register for a chance to win a free lucky draw