IBM ma ponad 1000 agentów AI w produkcji — czego CIO mogą nauczyć się z playbooka skalowania enterprise

IBM wdrożył setki enterprise workflow agentów i tysiące personal productivity agents — donosi Matt Lyteson, CIO w IBM. To nie jest pilotaż. To produkcyjna operacja na dużą skalę. A to, czego IBM nauczył się z prowadzenia ponad 1000 agentów, to playbook do skalowania enterprise, którego większość firm wciąż działających w trybie pilotażowym jeszcze nie ma.

Don Schuerman z Pegii szczerze definiuje obecne ograniczenie: halucynacje uniemożliwiają szersze wdrożenie, a firmy, które opanowały produkcję, wiedzą, że architektura musi być wolna od halucynacji od pierwszego dnia. Ten artykuł to praktyczny playbook z doświadczeń IBM: co podejście oparte na konkretnych celach oznacza w praktyce, jak IBM określił zakres i zarządzał wdrożeniami oraz jakie zmiany organizacyjne były potrzebne, aby przejść od garstki pilotaży do ponad 1000 agentów działających w produkcji.

Jak wygląda ponad 1000 agentów w praktyce w IBM

Ta liczba ponad 1000 to suma dwóch bardzo różnych kategorii wdrożeniowych, które IBM prowadzi w odmienny sposób.

Agenty workflow enterprise: setki agentów automatyzujących procesy biznesowe obejmujące wiele działów. Zbudowane pod kątem konkretnych funkcji biznesowych, każdy powiązany z określonym workflow z mierzalnymi rezultatami. Wyższa kontrola, wyższe ryzyko, bardziej rygorystyczne wymagania architektoniczne. To agenci wymagający pełnego stosu architektury wolnej od halucynacji, formalnego zarządzania i dedykowanego wsparcia agent operations.

Personal productivity agents: tysiące agentów wdrożonych dla poszczególnych pracowników do automatyzacji zadań. Sortowanie maili, zarządzanie kalendarzem, tworzenie dokumentów. Niższe indywidualne ryzyko, wyższe zagregowane oszczędności czasu. Szybszy cykl wdrożenia, szybsza iteracja. Ci agenci mogą być wdrażani do poszczególnych pracowników szybciej, ponieważ obszar oddziaływania awarii ogranicza się do workflow jednej osoby, a nie do procesu biznesowego obejmującego wiele działów.

Co ta struktura mówi większości przedsiębiorstw: nie należy próbować wdrażać agentów workflow enterprise do wszystkich naraz. IBM zaczął od agentów produktywności osobistej, co dało im doświadczenie operacyjne z agentami w kontekście niższego ryzyka, podczas gdy budowali infrastrukturę workflow enterprise.

Podejście oparte na konkretnych celach — główna zasada skalowania IBM

Zasada konkretnych celów to pierwsza rzecz, którą IBM robi dobrze, a którą większość przedsiębiorstw robi źle. Każdy agent wdrożony przez IBM jest powiązany z konkretnym, mierzalnym rezultatem biznesowym. Nie jest to mandat technologiczny. Nie jest to „używaj agentów AI". To konkretny cel, jak zmniejszenie czasu sortowania maili o 60% dla zespołu sprzedaży enterprise.

Dlaczego to działa: gdy zaczynasz od zdefiniowanego rezultatu, zakres agenta jest ograniczony do tego rezultatu. Agenta łatwiej testować, bo dokładnie wiesz, jak wygląda sukces. Łatwiej monitorować, bo masz liczbę do śledzenia. Gdy agent odnosi sukces, masz jednoznaczny wskaźnik pokazujący zwrot z inwestycji. Gdy zawodzi, dokładnie wiesz, co poszło nie tak.

Dlaczego szerokie wdrożenie się nie sprawdza: „agenci AI dla organizacji" nie daje jasnej definicji sukcesu, żadnego sposobu na pomiar zwrotu z inwestycji, żadnej pętli zwrotnej i żadnej iteracji. Agenci wdrożeni bez jasnych rezultatów stają się showcasami technologicznymi. Robią wrażenie na demo. Nikt nie wie, czy faktycznie działają.

Podejście IBM w praktyce: każdy agent ma zdefiniowanego właściciela biznesowego. Każdy agent ma mierzalną metrykę sukcesu uzgodnioną przed wdrożeniem. Każdy agent ma wyznaczoną osobę, która przegląda wyniki. Agenci są rozszerzani dopiero po mierzalnym sukcesie, nie według harmonogramu.

Architektura wolna od halucynacji — co IBM zbudował, aby umożliwić skalowanie

Halucynacje uniemożliwiają szersze wdrożenie. Każde zdarzenie halucynacyjne podważa zaufanie organizacji do agentów i tworzy opór utrudniający kolejne wdrożenia. Na skalę IBM, halucynacje to nie tylko problem niezawodności. To ograniczenie skalowalności.

Jak wygląda architektura wolna od halucynacji na skalę enterprise: Graph-RAG łączy źródła danych enterprise z grafem wiedzy. Agenci pobierają wyłącznie zweryfikowane fakty, nie surowe fragmenty tekstu, które mogą zawierać błędy. Semantyczny wybór narzędzi potwierdza dopasowanie narzędzia przed wywołaniem. Polityki enterprise są kodowane jako neurosymboliczne guardraile, które nadpisują wynik modelu. Krytyczne workflow enterprise otrzymują walidację multi-agentową: drugi agent przegląda działania pierwszego agenta przed wykonaniem.

Ta infrastruktura to warunek wstępny skalowania, nie dodatek. Ponad 1000 agentów IBM nie ma ludzi przeglądających każdą akcję. Mają architekturę, która ogranicza, co agenci mogą robić, i weryfikuje, że to, co robią, jest poprawne.

Funkcja Agent Operations — czego faktycznie wymaga prowadzenie ponad 1000 agentów

Oprogramowanie działa. Agenci wymagają zarządzania. Ta różnica brzmi oczywiście, gdy się ją usłyszy, a większość organizacji uczy się jej na własnych błędach po pierwszym incydencie z agentem.

Agenci dryfują. Ich zachowanie zmienia się wraz ze zmianą środowiska, aktualizacjami modeli, przesunięciami danych, na których się opierają. Agent, który działał poprawnie sześć tygodni temu, może dziś działać inaczej.

Agenci zawodzą w ciszy. Wykonują zadania w sposób wyglądający rozsądnie, ale błędny. Oprogramowanie albo działa, albo rzuca błąd. Agenci kończą zadania, które wyglądały na udane, ale nie osiągnęły zamierzonego rezultatu.

Infrastruktura operacyjna IBM dla ponad 1000 agentów: dedykowany zespół agent operations. Stos observability, gdzie każdy agent jest obserwowalny. Jasne playbooks reagowania na incydenty dla awarii agentów. Regularne przeglądy wyników, gdzie rezultaty agentów są porównywane z docelowymi metrykami sukcesu.

Framework zarządzania — jak IBM utrzymuje kontrolę na skalę

Wyzwanie zarządzania dla autonomicznych agentów różni się od zarządzania oprogramowaniem w sposób, którego większość przedsiębiorstw nie przewiduje. Oprogramowanie albo wykonuje zdefiniowaną procedurę poprawnie, albo nie. Agenci mogą wykonywać procedury w sposób technicznie poprawny, ale kontekstualnie błędny.

Podejście IBM do zarządzania ma cztery komponenty. Jasne granice zakresu: agenci są upoważnieni do robienia konkretnych rzeczy, nie wszystkiego. Ślady audytowe: każda akcja agenta jest logowana z wystarczającym kontekstem do odtworzenia tego, co się stało. Ścieżki eskalacji: agenci wiedzą, kiedy eskalować do człowieka. Kodowanie polityk: reguły biznesowe są kodowane jako guardraile, które nadpisują wynik modelu, nie tylko miękkie wytyczne, do których model jest instruowany.

Model odpowiedzialności ludzkiej to to, co sprawia, że wdrożenie autonomicznych agentów jest akceptowalne dla regulatorów i wewnętrznego zarządzania. Każdy agent ma wskazaną osobę odpowiedzialną za jego wyniki. Zawsze jest ktoś odpowiedzialny. Ta struktura odpowiedzialności to to, co pozwala agentom działać autonomicznie w ramach ich zakresu.

Co każdy CIO powinien wynieść z playbooka IBM

Pięć przekazywalnych lekcji z doświadczenia IBM.

Lekcja 1: Zaczynaj od konkretnych celów, nie szerokich mandatów. Jeśli nie możesz sformułować, jakiego konkretnego, mierzalnego rezultatu ten agent ma osiągnąć, nie masz wdrożenia agentów. Masz pilotaż, który się nie przeskaluje.

Lekcja 2: Buduj architekturę wolną od halucynacji, zanim jej potrzebujesz. Graph-RAG, semantyczny wybór narzędzi, guardraile i walidacja multi-agentowa nie są opcjonalne, gdy osiągniesz pewną liczbę agentów. To infrastruktura umożliwiająca skalowanie.

Lekcja 3: Wyznacz agent ops przed wdrożeniem. Agenci wymagają ciągłego zarządzania. To nowa funkcja organizacyjna, nie dodatkowy obowiązek. Przedsiębiorstwa, które traktują agent ops jako infrastrukturę, będą prowadzić agentów efektywniej.

Lekcja 4: Agenci workflow enterprise i personal productivity agents to różne rzeczy. Nie traktuj ich tak samo. Zaczynaj od personal productivity agents, aby zbudować doświadczenie operacyjne przed próbą agentów workflow enterprise.

Lekcja 5: Większość pilotaży nie udaje się, ponieważ pomijają pracę organizacyjną. Technologia nie jest barierą. Gotowość organizacyjna jest.

Okno konkurencyjne jest realne. IBM wyprzedza większość przedsiębiorstw w wdrażaniu agentów o lata. Firmy, które teraz zbudują infrastrukturę agent ops, będą miały kumulującą się przewagę.