Wie wichtig sind KI-Agenten wirklich?

KI-Agenten als Game Changer: Kooperation, Protokolle (MCP/A2A) und die neue Welle der Digitalisierung

Interview mit Dr. Yunpu Ma

Dr. Yunpu Ma ist Research Scientist (wissenschaftlicher Mitarbeiter/Forscher) an der Ludwig-Maximilians-Universität (LMU) München und Mitglied des Munich Center of Machine Learning.

Yunpu Ma befasst sich in diesem Interview mit der rasanten Entwicklung von KI-Agenten und zeigt, wie diese sich von einfachen Werkzeugen zu hochentwickelten Kooperationspartnern entwickeln, die planen, diskutieren und eigenständige Recherchen durchführen können. Er erklärt, wie Frameworks wie Model Context Protocol (MCP) und Agent-to-Agent (A2A) die Art und Weise verändern, wie Agenten mit dem Internet interagieren, und reflektiert über die weitreichenden industriellen und gesellschaftlichen Veränderungen, die ihre breite Einführung mit sich bringen könnte.

 
 

Maximilian Seeth: Andrew Ng prognostizierte letztes Jahr, dass die Entwicklung von KI-Agenten einen größeren Einfluss haben würde als die neue Generation von Foundation Models. Würdest Du diese Annahme teilen?

Yunpu Ma: Ja, KI-Agenten werden einen großen Einfluss haben. Sie verfügen über Erinnerungsspeicher, können Aufgaben planen und ihre Vorhersagen reflektieren. In dieser Hinsicht unterscheiden sie sich von den Foundation Models. Während KI-Agenten derzeit für die Programmierung oder zur Verbesserung von Chatbots durch Tool-Aufrufe eingesetzt werden, werden sie grundsätzlich in der Lage sein, viel komplexere Aufgaben zu bewältigen. Beispielsweise streben mehrere KI-Labore an, Agenten mit tiefgreifenden Forschungsfähigkeiten und Internetzugang auszustatten, damit sie selbstständig wissenschaftliche Forschung betreiben können.

Maximilian Seeth: Forschungen und Experimente mit KI-Agenten legen ebenfalls nahe, dass Zusammenarbeit und strukturierte Debatten die Leistung verbessern. So hat beispielsweise BlackRock den Einsatz von KI-Agenten zur Unterstützung der Aktienauswahl und des Portfoliomanagements untersucht, wobei sich die Qualität der Anlageentscheidungen verbesserte, wenn die Agenten miteinander debattierten. Dies wirft eine offene Frage auf: Welche Art von Kooperationsrahmen ist für KI-Agenten am effektivsten?

Yunpu Ma: Es gibt zwei Ansätze für die Zusammenarbeit von KI-Agenten. Beim ersten Ansatz weisen wir den Agenten unterschiedliche Rollen zu und lassen sie Teilaufgaben innerhalb eines Workflows bearbeiten. Beim zweiten Ansatz werden mehrere Agenten für dieselbe Aufgabe eingesetzt. Anschließend lässt man diese Agenten debattierten, mit der Hoffnung, dass ihre unterschiedlichen Perspektiven zu einer besseren Gesamtlösung führen. In der Regel fasst ein letzter Agent die Debatte zusammen und extrahiert aus allen Beiträgen die wertvollsten Lösungen. Man kann auch beide Ansätze kombinieren und sie über mehrere Runden hinweg wiederholen. Gerüchten zufolge verwendet xAI's Grok Heavy den zweiten Ansatz, der auch als „paralleles Denken” bezeichnet wird.

Maximilian Seeth: Marvin Minsky prägte den Begriff „Society of Mind“ (Gesellschaft des Geistes) auf der Grundlage der Idee, dass Intelligenz aus den Interaktionen vieler einfacher Akteure entsteht, die wie Mitglieder einer Gesellschaft zusammenarbeiten. Glaubst Du, dass die Zusammenarbeit und Interaktion zwischen Akteuren, die unterschiedliche kognitive Aufgaben ausführen, die Zukunft der künstlichen Intelligenz darstellt?

Yunpu Ma: Ich bin der Überzeugung, dass die Skalierung agentenbasierter Systeme zu leistungsfähigeren und damit intelligenteren Systemen führen wird. Diese Strategie ist jedoch auch mit steigenden Kosten verbunden. Mit jeder zusätzlichen Kommunikation zwischen den Agenten entsteht ein potenzieller Informationsverlust, und praktisch gesehen bedeutet jeder zusätzliche Austausch mehr Token-Vorhersagen, die ebenfalls kostspielig sind.

Maximilian Seeth: KI-Agenten sind für viele Nutzer durch den neuen Agentenmodus von ChatGPT greifbarer geworden, der sich besonders bei der Websuche und beim Browsen bewährt. Du hast ein ähnliches Web-Pilot-System entwickelt, das vor nicht allzu langer Zeit auf dem neuesten Stand der Technik war. Heute dominieren jedoch Unternehmen wie OpenAI und IBM Benchmarks wie WebArena. Welche wesentlichen Verbesserungen oder Innovationen haben diese Unternehmen vorgenommen, die zu leistungsfähigeren Web-Agenten geführt haben?

Yunpu Ma: Das ist schwer zu sagen, da sie ihre Methoden geheim halten. Was ich sagen kann, ist, dass ich auch an neuen Strategien für Web-Agenten arbeite. Eine Idee ist die weitere Integration von Speichermodulen, wobei frühere Erfahrungen dem Agenten helfen könnten, sich durch Websites zu navigieren. Genauer gesagt möchte ich prozedurale Erfahrungen nachahmen, die auch wir Menschen nutzen. Prozedurales Wissen unterscheidet sich von Faktenwissen. Das Ziel ist es, Agenten mit genügend prozeduralem Know-how für die Webnavigation auszustatten, damit sie nicht jede Website bis ins kleinste Detail erkunden müssen, um ihre nächsten Schritte zu planen.

Maximilian Seeth: Glaubst Du, dass zukünftige Nutzer*innen in erster Linie auf Web-Agenten zurückgreifen werden, die für sie im Internet surfen, oder werden sie stattdessen spezialisierte Agenten verwenden, die direkt mit bestimmten Protokollen oder Diensten interagieren und so einen Großteil der Komplexität der Webnavigation umgehen?

Yunpu Ma: Zukünftige Agenten werden Websites nicht mehr selbstständig navigieren und erkunden. Stattdessen werden sie Schnittstellen wie Model Context Protocol (MCP)-Server nutzen, um mit dem Web zu interagieren. Das bedeutet, dass die Agenten eine Website nicht verstehen und auf Schaltflächen klicken müssen. Stattdessen wird die Website auf Basis des Model Context Protocols in eine andere Darstellung umgewandelt, mit der die Agenten interagieren können. Genau das ist ein Projekt, das mein Forschungsteam und ich in Zusammenarbeit mit einem Unternehmen zumsetzen wollen. Die Interaktion mit MCP-Servern ist außerdem zuverlässiger. Aus diesem Grund würde ich keinen Web-Agenten für die Suche im Internet verwenden.

Maximilian Seeth: Könntest Du kurz erklären, worum es sich beim Agent-to-Agent (A2A)-Framework und beim Model Context Protocol handelt? Warum sind diese Protokolle für agentenbasierte KI wichtig?

Yunpu Ma: Beide Frameworks sind Schnittstellen, die die Interaktion zwischen KI-Agenten und Software oder Diensten erleichtern. Das Agent-to-Agent-Framework wurde von Google eingeführt und ist eher auf ein Kommunikationsprotokoll für Agenten ausgerichtet. Das von Anthropic entwickelte Model Context Protocol hilft uns dabei, Server einzurichten, die Agenten mit Tools, Daten und passenden Prompts versorgen. Diese werden den Agenten auf standardisierte Weise zugänglich gemacht. Das bedeutet, dass wir nicht für jeden Dienst, mit dem unsere Agenten interagieren sollen, unterschiedliche Lösungen implementieren müssen. Das ist sehr praktisch!

Maximilian Seeth: Wo haben Unternehmen Deiner Meinung nach den größten Return-on-Investment bei der Implementierung von agentenbasierter KI? Gibt es bestimmte Anwendungsfälle, Branchen oder Domänen, bei denen die Auswirkungen besonders stark sind?

Yunpue Ma: Die Möglichkeiten sind so vielfältig, dass ich davon überzeugt bin, dass jedes Unternehmen von dem Einsatz von KI-Agenten stark profitieren kann. Die Einführung von KI-Agenten kann man als eine neue Welle der Digitalisierung verstehen.

Maximilian Seeth: Welche ethischen Herausforderungen siehst Du, wenn die Welt einmal von vielen KI-Agenten bevölkert sein wird?

Yunpu Ma: Ich diskutiere diese Frage oft mit meinen Freunden und Studierenden. Ich bin der Meinung, dass KI-Agenten sich von anderen technologischen Revolutionen unterscheiden, da ich derzeit nicht erkennen kann, wie sie zu neuen Berufen oder Arbeitsplätzen führen werden. Das ist natürlich eine große Herausforderung. Wir müssen uns überlegen, was den Menschen noch bleibt und wie wir mit den Folgen umgehen, wenn viele Arbeitsplätze durch KI-Agenten ersetzt werden.

Maximilian Seeth: Während KI-Agenten derzeit viel Aufmerksamkeit erhalten, welche anderen Bereiche der KI hältst Du für besonders vielversprechend?

Yunpu Ma: Diffusion Language Models finde ich besonders spannend. Im Gegensatz zu autoregressiven Modellen, die derzeit die meisten großen Sprachmodelle antreiben, können Diffusionsmodelle Texte ganzheitlich generieren. Das bedeutet, dass sie nicht Token für Token, sondern viele Token parallel generieren. Ein weiterer Bereich, den ich sehr interessant finde, ist der Einsatz von KI in der Wissenschaft, insbesondere in der Medizin. Ich glaube beispielsweise, dass wir in Zukunft Medikamente mithilfe von KI entwickeln werden, was meiner Meinung nach auch für die Menschheit von großem Nutzen sein wird.

Vielen Dank an Dr. Yunpu Ma für das Interview.

Übersetzt aus dem Englischen.
Das Interview ist zuerst auf https://www.dailogues.ai/just-how-important-are-ai-agents erschienen. 


 
 
 

Stay in touch

Maximilian Seeth
Spezialisiert auf maschinelles Lernen, NLP, Ethik und Safety. Über zwei Jahre Erfahrung in der Beratung zu KI.

Weiter
Weiter

Die KI-Agentenökonomie kommt: Differenzierung, Sichtbarkeit, Gestaltungsfreiheit sichern