AgenticOps: Der Engineering-Fall für KI-Agenten in der Infrastruktur

Am 25. März 2026 veröffentlichte HyperFrame Research etwas, das Infrastructure Engineers schon lange intuitiv wussten, aber nie quantifiziert hatten: „Menschliche Operatoren können mit der generierten Telemetrie schlicht nicht Schritt halten."

Das ist die Infrastructure Intelligence Gap. Kein Personalproblem. Kein Tooling-Problem. Ein Physik-Problem. Das Datenvolumen an Infrastructure-Telemetrie – Events, Metriken, Logs, Traces, Alerts – das in modernen Enterprise-Umgebungen generiert wird, hat überschritten, was menschliche Operatoren sinnvoll verarbeiten können. Nicht nur knapp. Um Größenordnungen.

Die Frage ist nicht, ob diese Lücke wachsen wird. Sie wird. Jeder neue KI-Agent, den du deployst, fügt mehr Infrastruktur hinzu. Jeder Cloud-Service, den du aktivierst, generiert mehr Telemetrie. Jedes verteilte System, das du betreibst, multipliziert die Datenpunkte, die deine Operatoren verfolgen müssen. Die Lücke ist strukturell bedingt – und sie wächst.

Am 24. März kündigte SUSE auf der KubeCon Europe das erste offene agentische KI-Ökosystem für Infrastructure Management an – Liz, ein KI-Agent, gebaut auf dem Model Context Protocol, designed um spezialisierte Infrastructure-Agenten über Storage, Security, Observability und Fleet Management zu koordinieren. Cisco hatte bereits AI Canvas und das Deep Network Model angekündigt – speziell gebaut für Network Operations im Enterprise-Maßstab. Gartner's Predicts 2026 – via Itential – hat die Vorhersage formalisiert: KI-Agenten entwickeln sich von Tools, die Menschen unterstützen, zu Plattformen, die manuelle Arbeit in komplexen Infrastructure-Workflows ersetzen.

Dies sind keine Ankündigungen über KI, die Features zu bestehenden Tools hinzufügt. Sie sind Belege für eine entstehende Kategorie: AgenticOps.

Dieser Artikel ist der Engineering-Fall dafür. Wir behandeln: warum die Infrastructure Complexity Crisis ein erzwingender Faktor ist, der KI-Agenten nicht optional, sondern notwendig macht; was AgenticOps in der Praxis tatsächlich bedeutet; warum das SUSE Liz-Ökosystem und das Model Context Protocol den ersten offenen Standard für Infrastructure-KI-Agenten darstellen; wie Ciscos AI Canvas dies im Enterprise-Maßstab demonstriert; und wie du die AgenticOps-Readiness deiner Organisation bewerten kannst.

Warum die Infrastructure Complexity Crisis ein Physik-Problem ist

Die Infrastructure Complexity Crisis ist nicht über Nacht passiert. Sie ist das kumulative Ergebnis von drei Jahrzehnten Infrastructure-Akkumulation – jede Schicht fügt Telemetrie hinzu, jedes Tool fügt Dashboards hinzu, jeder Cloud-Service fügt Monitoring-Anforderungen hinzu.

Enterprise Infrastructure im Jahr 2026 ist kein System. Es ist ein Konstellation von Systemen. Cloud-Umgebungen über mehrere Provider verteilt. Kubernetes-Cluster über Regionen hinweg gestreut. SaaS-Plattformen mit ihren eigenen Observability-Schichten. Network Infrastructure, die Events schneller generiert, als Menschen sie lesen können. Legacy-Systeme, die nicht für Monitoring in diesem Maßstab entworfen wurden, laufen neben modernen Cloud-nativen Services, die 10x mehr Telemetrie generieren als ihre Vorgänger.

Die Dynatrace-Studie mit 919 Führungskräften, veröffentlicht in ihrem Agentic AI Report, fand heraus: Infrastructure Complexity ist die größte operative Herausforderung für 78% der Enterprise-IT-Leader. Die Komplexität ist nicht nur operativ – sie ist kognitiv. Die Anzahl an Dashboards, Monitoring-Tools und Datenquellen, die Infrastructure-Teams synthetisieren müssen, um zu verstehen, was in ihrer Umgebung passiert, hat die Kapazität jedes menschlichen Operators überschritten, der gleichzeitig alles im Kopf behalten kann.

APM Digests Coverage der Dynatrace-Studie fügte die konkrete Zahl hinzu, die das greifbar macht: 80% der Konfigurationsaufgaben, die derzeit von Enterprise-IT-Teams manuell verwaltet werden, werden 2026 von KI-Agenten automatisiert. Nicht schrittweise. In diesem Kalenderjahr.

Gartner's Predicts 2026, via Itential, hat die Trajektorie explizit gemacht: KI-Agenten in Infrastructure Operations sind keine Tools mehr, die menschliche Operatoren unterstützen. Sie werden zu Plattformen, die manuelle Arbeit für komplexe Workflows ersetzen. Die Unterscheidung ist wichtig. Ein unterstützendes Tool macht den Menschen schneller. Eine Ersatzplattform macht den Menschen für diesen Workflow überflüssig.

Das AgenticOps-Konzept – Was es tatsächlich bedeutet

AgenticOps ist kein Vendor-Produkt. Es ist eine Kategoriedefinition – die Praxis, KI-Agenten zu nutzen, um Enterprise-IT-Infrastructure-Operations autonom zu verwalten.

Der Name folgt dem Muster von DevOps: kein einzelnes Tool, sondern eine Disziplin. DevOps entstand, weil die Komplexität moderner Software-Lieferung das überstieg, was Silos und manuelle Prozesse bewältigen konnten. AgenticOps entsteht aus demselben Grund: die Komplexität moderner Infrastructure Operations übersteigt das, was menschliche Operatoren und traditionelle Monitoring-Tools bewältigen können.

Das Kernprinzip: Mehrere spezialisierte KI-Agenten – jeder verantwortlich für eine bestimmte Infrastructure-Domain wie Network Monitoring, Security Alerting, Storage Optimization oder Application Performance – koordinieren durch eine geteilte Orchestrierungsschicht, um Infrastructure Operations autonom zu verwalten. Menschliche Operatoren überwachen, setzen Policies und bearbeiten Exceptions. Die Agenten übernehmen den Rest.

VentureBeats Coverage von AgenticOps hat das Fragmentierungsproblem eingerahmt, das es lösen soll: Enterprises betreiben 15 bis 30 verschiedene Observability- und Monitoring-Tools gleichzeitig. Jedes generiert seine eigenen Alerts, eigene Dashboards, eigene Datensilos. Die Operatoren, die über diese Tools hinweg synthetisieren müssen, ertrinken in Daten, während die Systeme immer komplexer werden.

Die Agenten werden nicht überfordert. Ein Network Operations-Agent kann gleichzeitig Tausende von Network-Segmenten überwachen, Events über mehrere Provider korrelieren, Muster identifizieren, die ein menschlicher Operator Stunden bräuchte um zu finden, und Korrekturmaßnahmen einleiten – alles in Sekunden.

SUSE Liz und das Model Context Protocol – Das erste offene Ökosystem

Suses Ankündigung am 24. März auf der KubeCon Europe ist aus einem bestimmten Grund bedeutsam: Es ist das erste offene agentische KI-Ökosystem für Infrastructure Management, das keine Custom-Integrationsarbeit erfordert, um Agenten mit den Tools zu verbinden, die Operatoren bereits nutzen.

Liz – Suses KI-Agent für Infrastructure Management – ist auf dem Model Context Protocol aufgebaut. MCP ist das technische Detail, das dies bedeutsam macht. Es ist ein offenes Protokoll für standardisierte Konnektivität zwischen KI-Agenten und Drittanbieter-Enterprise-Tools – ohne die Custom-Integrationscodes, die Multi-Vendor-KI-Deployments historisch so teuer und fragil gemacht haben.

Die praktische Auswirkung: Ein Infrastructure-Operator kann Liz deployen, mit seinem bestehenden Monitoring-Stack, Cloud-Umgebungen und Ticketing-Systemen verbinden – durch MCP-kompatible Adapter, ohne Custom-Integrationen zu schreiben. Liz koordiniert spezialisierte Agenten über Storage Management, Security Policy Enforcement, Observability-Datensynthese und Fleet-weite Performance-Optimierung.

Randy Bias von Mirantis, speaking via TFIR, ordnete die MCP-Bedeutung in einen breiteren Kontext ein: Das Model Context Protocol ist das Infrastructure-Äquivalent dessen, was USB für Hardware-Konnektivität getan hat. Vor USB erforderten Geräte-Verbindungen Custom-Treiber, proprietäre Kabel und vendor-spezifisches Wissen. Nach USB konnte jedes konforme Gerät mit jedem anderen konformen Gerät über eine Standard-Schnittstelle verbunden werden.

MCP versucht, für KI-Agent-Infrastrukturkonnektivität dasselbe zu tun, was USB für Hardware-Konnektivität getan hat. Wenn es gelingt – und Suses Adoption auf der KubeCon Europe deutet darauf hin, dass es an Traktion gewinnt – fällt die Ökosystem-Barriere für AgenticOps dramatisch. Enterprises brauchen keine Custom-Integrationsprojekte mehr, um koordinierte Infrastructure-Agenten zu deployen.

Cisco AI Canvas und das Enterprise-Scale-Modell – Network Ops im Maßstab

Ciscos AI Canvas, kombiniert mit dem Deep Network Model, repräsentiert den Enterprise-Scale-Nachweis dafür, wie AgenticOps in Produktion bei den größten Organisationen aussieht.

Das Deep Network Model ist Ciscos speziell gebaute KI für Network Infrastructure – trainiert auf den operational Patterns von Enterprise-Netzwerkumgebungen, fähig, Network Failures vorherzusagen, bevor sie passieren, und Remediation über Network-Segmente hinweg zu koordinieren, ohne menschliches Eingreifen.

Beam.ais Coverage des Cisco-Modells dokumentierte die konkrete Anwendung: Große Finanzinstitutionen betreiben Ciscos AI Canvas für Network Operations. Das Deep Network Model überwacht Network Performance über Tausende von Endpoints, identifiziert anomale Traffic-Muster, die Ausfällen vorausgehen, löst präventives Re-Routing aus, bevor Failures sich kaskadieren, und generiert Natural-Language-Summaries für menschliche Operatoren, die verstehen müssen, was das System entschieden hat und warum.

Dies ist kein Monitoring-Dashboard mit KI-Features. Es ist ein KI-System, das die Rolle des menschlichen Operators bei kontinuierlichem Network Monitoring ersetzt hat. Es tut, was ein Team von NOC-Engineers tat – schneller, in größerem Maßstab, mit weniger Fehlern.

Die Dynatrace-Daten – 919 globale IT-Leader, 80% Konfigurationsaufgaben-Automatisierung – ist der Benchmark für das, was das über die Enterprise hinweg bedeutet. Konfigurationsaufgaben, die manuell von Infrastructure-Teams verwaltet wurden – Provisioning, Skalierung, Network Path Changes, Security Policy Updates – werden von KI-Agenten End-to-End automatisiert. Die Aufgabe des menschlichen Operators wird zu: definieren, was „gut" bedeutet, Policies setzen, und Exceptions bearbeiten, die die Agenten flaggen.

Gartners Vorhersage: Von Tool zur Plattform

Gartner's Predicts 2026, wie von Itential gecovert, formalisierte die Rollentransformation, die die Infrastructure-KI-Bewegung produziert.

Die Vorhersage: KI wird sich von Tools, die menschliche Operatoren unterstützen, zu Plattformen entwickeln, die manuelle Arbeit für komplexe Workflows ersetzen. Die Sprache ist präzise. Nicht „KI hilft Operatoren, schneller zu arbeiten." KI wird zur Plattform, durch die Infrastructure-Arbeit passiert.

Die Konsequenz der Rollentransformation: Die Aufgabe des Infrastructure Engineers entwickelt sich von „Operator, der Tasks erledigt" zu „Leader, der Systeme überwacht". Das ist keine Degradierung. Es ist ein Reframe. Ein Engineer, der 60% seiner Zeit mit manueller Konfiguration, Incident-Triage und Routine-Monitoring verbracht hat, verbringt diese Zeit nun damit, das Agent-Verhalten zu designen, die Exception-Thresholds zu definieren und die Systeme zu verbessern, die die Agenten ausführen.

IDCs Projektion, zitiert via CIO.com: 1,3 Billionen Dollar in agentic AI Spending bis 2029. Enterprise Infrastructure ist nicht der größte Anteil daran – aber es ist das Segment, wo der operative Fall am unmittelbarsten ist. Weil die Komplexität am akutesten ist und die menschlichen Kosten der Intelligence Gap am messbarsten.

Die AgenticOps Readiness-Bewertung – 8 Fragen für IT Operations Leader

Nutze diese acht Fragen, um die aktuelle AgenticOps-Readiness deiner Organisation zu bewerten.

Frage 1: Kann dein Operations-Team Daten aus allen deinen Infrastructure-Monitoring-Tools gleichzeitig synthetisieren?

Wenn deine Operatoren zwischen 5, 10 oder 15 verschiedenen Dashboards kontextwechseln müssen, um den aktuellen Zustand deiner Infrastruktur zu verstehen, hast du eine Intelligence Gap. Das Fragmentierungsproblem – zu viele Tools, zu viele Daten, nicht genug Synthese – ist das Problem, das AgenticOps zu lösen designed ist.

Frage 2: Welcher Prozentsatz deiner Incident Response ist noch manuell – Triaging von Alerts, Identifizieren der Root Cause, Einleiten von Remediation?

Wenn die Mehrheit deiner Incident Response noch human-driven ist, trägst du operative Kosten, die AgenticOps reduzieren kann. Dynatraces Finding: 80% der Konfigurationsaufgaben können automatisiert werden. Wenn deine Zahl deutlich darunter liegt, ist die Opportunity größer als du schätzt.

Frage 3: Betreibst du Agenten von mehreren Vendors, die nicht miteinander koordinieren?

Wenn du KI-Monitoring-Tools von mehreren Vendors hast, die jeweils isoliert operieren – ihre eigenen Alerts generieren, ihre eigenen Dashboards erfordern, ihren eigenen Kontext pflegen – erfährst du das Fragmentierungsproblem, das MCP und AgenticOps-Frameworks zu lösen designed sind.

Frage 4: Können deine Infrastructure-KI-Agenten über offene Protokolle miteinander kommunizieren, oder brauchen sie Custom-Integrationscode?

Wenn deine Agenten Custom-Code brauchen, um Kontext zu teilen, bist du in ein vendor-spezifisches Integrationsmodell eingeschlossen, das zur Barriere für das Skalieren von AgenticOps wird. Open-Protocol-Konnektivität – MCP oder Äquivalent – ist die architektonische Voraussetzung für koordiniertes Multi-Agent Infrastructure Management.

Frage 5: Wie viel Prozent der Zeit deines Infrastructure-Teams wird für Konfigurationsaufgaben aufgewendet, die automatisiert werden könnten?

Der 80%-Benchmark von Dynatrace ist ein Referenzpunkt. Wenn dein Team den Großteil seiner Zeit mit manueller Konfiguration verbringt, anstatt mit Exception-Handling und Systemverbesserung, hast du eine signifikante Automatisierungs-Opportunity.

Frage 6: Können deine Network Operations während Off-Hours autonom laufen, ohne menschliches Eingreifen?

Wenn dein Netzwerk einen menschlichen Operator braucht, um für Off-Hours-Incidents verfügbar zu sein, trägst du Personalkosten und Reaktionszeitkosten, die Network-KI-Agenten wie Ciscos Deep Network Model eliminieren können.

Frage 7: Haben deine Infrastructure-Agenten den Kontext, den sie für Decisions brauchen – oder operieren sie in Silos?

AgenticOps erfordert, dass Agenten Kontext über Infrastructure-Domains hinweg teilen. Ein Network Monitoring-Agent, der nicht weiß, was der Application Performance-Agent sieht, wird Decisions treffen, die Probleme für die Application-Schicht verursachen. Cross-Domain-Kontext ist die Intelligenz, die koordiniertes AgenticOps von fragmentiertem Tool-Sprawl unterscheidet.

Frage 8: Wer owns die AgenticOps-Strategie?

Wenn die Antwort „niemand" oder „wir evaluieren Tools" ist, hast du keine AgenticOps-Strategie. Du hast eine Sammlung von KI-Tools, die nicht koordinieren. Die Organisationen, die bei Infrastructure-KI gewinnen werden, sind diejenigen mit einem Owner, der AgenticOps als Disziplin behandelt, nicht als Sammlung von Point Solutions.

Wie man in Richtung AgenticOps aufbaut

Wenn die Self-Assessment Lücken aufgedeckt hat – und bei den meisten Organisationen werden mehrere davon der Fall sein – hier ist die praktische Sequenz, um sie zu schließen.

Schritt 1: Audit dein aktuelles Infrastructure-Agenten- und Monitoring-Tool-Landschaft.

Du kannst nicht koordinieren, was du nicht inventarisiert hast. Mappe jedes KI-enabled Monitoring-Tool, jedes automatisierte Konfigurationssystem, jede Observability-Plattform, die du betreibst. Für jedes: Was überwacht es? Welche Decisions trifft es oder assisted es? Welche Systeme berührt es? Welche Daten generiert es? Das ist der Baseline für das Design einer AgenticOps-Koordinationsschicht.

Schritt 2: Evaluiere MCP-kompatible Agent-Plattformen.

Das Model Context Protocol ist der offene Standard, der AgenticOps ohne Custom-Integrationsprojekte viable macht. Evaluiere, ob deine aktuellen Monitoring- und Infrastructure-Management-Tools MCP unterstützen. Wenn nicht, frag deine Vendors direkt – diejenigen, die keine Open Standards unterstützen, werden zunehmend diejenigen sein, um die dein Team herumarbeiten muss.

Schritt 3: Identifiziere deinen highest-cost Infrastructure-Workflow.

Versuch nicht, alles auf einmal zu automatisieren. Identifiziere den einzelnen Infrastructure-Workflow, der die meiste Operator-Zeit verbraucht, die meisten Alerts generiert und die klarste Automatisierungslogik hat. Network Ops ist oft der beste Starting Point, weil die Regeln gut definiert und die Monitoring-Daten strukturiert sind.

Schritt 4: Deploy einen spezialisierten Agenten und miss seine Performance.

Starte mit einer Domain. Deploye einen spezialisierten Agenten – Network Monitoring, Configuration Management, Security Alerting – in dieser Domain. Miss: Alert-Response-Zeit, Konfigurationsgenauigkeit, False-Positive-Rate, Operator-Zeit recovered. Nutze diese Zahlen, um den Business Case für Expansion zu bauen.

Schritt 5: Designe die Koordinationsschicht, bevor du den zweiten Agenten hinzufügst.

Bevor du einen zweiten spezialisierten Agenten deployst, definiere, wie Agenten Kontext teilen werden. Die Organisationen, die mehrere Agenten ohne Koordinations-Framework deployen, enden mit mehr fragmentiertem Tool-Sprawl – nur einer anderen Art. Definiere die Orchestrierungsschicht, bevor du expandierst.

Bottom Line

HyperFrame Research hat quantifiziert, was Infrastructure Engineers seit Jahren wissen: Das Volumen der Infrastructure-Telemetrie hat überschritten, was menschliche Operatoren verarbeiten können. Nicht nur ein bisschen. Um Größenordnungen.

Die Infrastructure Intelligence Gap ist kein Personalproblem. Es ist ein Physik-Problem. Und die Engineering-Antwort auf ein Physik-Problem ist Engineering-Infrastruktur – nicht mehr Human-Effort, die auf eine unmögliche Task angewendet wird.

AgenticOps ist diese Engineering-Antwort. Mehrere spezialisierte KI-Agenten, koordiniert durch offene Protokolle wie das Model Context Protocol, die Infrastructure Operations autonom verwalten, während menschliche Engineers überwachen, Policies definieren und Exceptions bearbeiten.

Suses Ankündigung von Liz auf der KubeCon Europe, Ciscos Deep Network Model, Gartners Vorhersage, dass KI-Agenten manuelle Infrastructure-Effort ersetzen werden – das sind keine isolierten Ankündigungen. Das sind Belege einer entstehenden Kategorie.

Die Organisationen, die jetzt AgenticOps-Capability aufbauen – die ihre Infrastructure-Agenten inventarisieren, MCP-kompatible Plattformen evaluieren und koordiniertes Multi-Agent Infrastructure Management deployen – sind diejenigen, die den operational Leverage haben werden, wenn Infrastructure-Komplexität weiter compouned.

Die Intelligence Gap schließt sich nicht von selbst. Aber die Agenten können es.

Bereit, deine Infrastruktur auf AgenticOps-Readiness zu bewerten? Sprich mit Agencie für eine Infrastructure-KI-Assessment – inklusive Agent-Landscape-Audit, MCP-Kompatibilitäts-Review und einer phasenweisen AgenticOps-Roadmap →

The Infrastructure Intelligence Gap: Why AI Agents Are the Only Tool That Can Manage Modern Enterprise Complexity