Was ist der Hermes Agent? Wie er funktioniert und was ihn von anderen KI-Agenten unterscheidet
May 07, 2026
/
Vera P.
/
8 Min. Lesezeit

Der Hermes Agent ist ein Open-Source-, autonomes KI-Agenten-Framework von Nous Research, das im Februar 2026 unter der MIT-Lizenz veröffentlicht wurde.
Es wird auf der eigenen Infrastruktur als durchgehend aktiver Dienst betrieben und nicht als chatbasiertes Tool pro Sitzung. Es verwendet ein Large Language Model (LLM) als logische Instanz, eine Reihe von Tools für die Benutzerinteraktion und ein mehrschichtiges Speichersystem, das den Kontext sitzungsübergreifend beibehält.
Während viele KI-Assistenten bei einzelnen Fragen überzeugen, haben sie Schwierigkeiten mit Workflows, die sich über Tage erstrecken. Der Hermes Agent verfolgt einen anderen Ansatz: Er ist auf Beständigkeit ausgelegt, behält Informationen im Gedächtnis, entwickelt wiederverwendbare Fähigkeiten und läuft unauffällig im Hintergrund.
Dieser Wechsel führt weg von isolierten Interaktionen hin zu kontinuierlichen, selbstgehosteten KI-Workflows, bei denen der Fortschritt im Laufe der Zeit stetig wächst.
Was ist der Hermes Agent?
Der Hermes Agent ist ein Open Source KI-Agenten-Framework unter MIT-Lizenz, das rund um die Uhr auf selbst gehosteter Infrastruktur läuft.
Hermes Agent erledigt mehrstufige Aufgaben eigenständig, verwendet Tools wie ein Terminal und einen Browser und behält den Speicher über Sitzungen hinweg bei.
Nous Research, das Labor hinter den Modellfamilien Hermes, Nomos und Psyche, veröffentlichte Hermes Agent im Februar 2026 als sein erstes eigenständiges Agenten-Framework.
Hermes Agent läuft als Hintergrundprozess, empfängt Anweisungen über Plattformen wie Telegram, Discord oder Slack, führt Tool-Aufrufe auf Ihrem Rechner aus und arbeitet auch dann weiter, wenn Sie den Chat bereits geschlossen haben.
Dadurch kann derselbe Agent Kontext behalten, wiederverwendbare Fähigkeiten aufbauen und sich im Laufe der Zeit verbessern.
Hermes Agent reiht sich neben anderen Open-Source-Agenten ein, verfolgt jedoch einen stärker infrastrukturorientierten Ansatz. Er richtet sich an Personen, die ihren eigenen KI-Agenten lieber auf einem Virtual Private Server (VPS) oder einem Heimserver betreiben möchten, anstatt auf einen verwalteten Cloud-Dienst zu setzen.
Der Grund hierfür ist, dass er als fester Bestandteil Ihrer Infrastruktur operiert – und nicht als Tool, das Sie lediglich im Browser öffnen oder als Erweiterung in einer Programmierumgebung nutzen.
So funktioniert der Hermes Agent
Der Hermes Agent läuft auf Ihrem Server, nimmt Eingaben entgegen, plant mit einem Sprachmodell den nächsten Schritt, führt Tools aus, speichert Ergebnisse im Speicher und wiederholt den Vorgang dann, bis die Aufgabe abgeschlossen ist.
Für den Einstieg benötigen Sie eine selbst gehostete Umgebung, zum Beispiel einen VPS oder ein serverloses Backend. Stellen Sie den Agenten dann bereit, indem Sie das Installationsprogramm ausführen, das eine Python-Umgebung einrichtet und das Home-Verzeichnis des Agenten unter ~/.hermes/ erstellt.
Danach sieht der Workflow von Hermes Agent so aus:
- Eingang von Befehlen: Eine Aufgabe erreicht den Agenten über das CLI, eine angebundene Messaging-Plattform oder einen geplanten Cron-Job.
- Aufgabenplanung mittels LLM: Der Agent sendet die Anfrage an das konfigurierte Sprachmodell und berücksichtigt dabei das aktuelle Gedächtnis sowie die verfügbaren Werkzeuge. Das Modell entscheidet über den nächsten Schritt.
- Ausführung von Tools: Der Agent nutzt die benötigten Tools – wie Terminal, Texteditor, Webbrowser oder MCP-Server –, um den Plan umzusetzen. Die Ergebnisse der einzelnen Werkzeuge fließen direkt zurück in den Prozess.
- Speicherung und Abruf von Informationen: Der Agent schreibt Ergebnisse, Fakten und logische Schlussfolgerungen in eine lokale Datenbank. Bei Bedarf speichert er zudem aufbereitete Gedächtnisprotokolle, damit zukünftige Sitzungen darauf aufbauen können.
- Iteration und kontinuierlicher Betrieb: Dieser Kreislauf wiederholt sich so lange, bis die Aufgabe abgeschlossen ist. Danach verbleibt der Agent im Wartezustand für den nächsten Auslöser, ohne sich abzuschalten.
Zusammen bilden diese Schritte eine persistente Schleife, die über Aufgaben, Plattformen und Sitzungen hinweg weiterläuft.
Was den Hermes Agent von anderen KI-Agenten unterscheidet
Der Hermes Agent ist ein eigenständiger, selbst gehosteter Agent, der kontinuierlich läuft, autonom handelt und sich mit der Zeit verbessert.
Speicher, Fähigkeiten, Messaging und Zeitplanung sind bereits enthalten, sodass Sie nicht alles von Grund auf neu aufbauen müssen. Dennoch haben Sie die Freiheit, das LLM auszutauschen, Tools hinzuzufügen oder das Verhalten über eine SOUL.md-Datei individuell anzupassen.
Sobald eine Aufgabe abgeschlossen ist, hält der Hermes Agent die Arbeit fest und verwandelt komplexe Aufgaben in wiederverwendbare Fähigkeiten, auf denen spätere Durchläufe aufbauen können.
Wenn Sie ihn zum Beispiel bitten, ein fehlerhaftes Deployment zu debuggen, und der Agent die Korrektur über mehrere Schritte hinweg erarbeitet, schreibt er diesen Prozess als Fähigkeit nieder. Beim nächsten ähnlichen Deployment-Problem weiß er bereits, was funktioniert hat.
In diese Kategorie passen die meisten KI-Tools nicht, da sie meist in eine von drei Gruppen fallen: Chatbots, die jeweils nur eine Frage beantworten, IDE-Assistenten, die auf Ihren Editor beschränkt sind, oder Orchestrierungs-Frameworks wie LangChain, die Ihnen Bausteine liefern, Speicher, Zeitplanung und die Lernschleife aber Ihnen überlassen.
Hermes Agent im Vergleich zu OpenClaw
Hermes Agent und OpenClaw sind beide selbst gehostete, autonome KI-Agenten, verfolgen jedoch unterschiedliche Ansätze.
Hermes konzentriert sich auf eine Lernschleife, die wiederverwendbare Fähigkeiten erstellt, während OpenClaw sich auf die direkte, konversationsbasierte Aufgabenausführung auf Ihrem Rechner konzentriert.
Eine ausführlichere Gegenüberstellung von Hermes Agent und OpenClaw finden Sie in der Tabelle unten.
| Aspekt | Hermes Agent | OpenClaw |
| Kernfokus | Selbstverbesserung durch autonome Erstellung von Fähigkeiten | Direkte Aufgabenausführung über natürliche Sprache |
| Gedächtnismodell | Vierstufiger Speicher, Prompt-Dateien, SQLite-Archiv, Fähigkeiten und externe Anbieter | Langfristiger Konversationsspeicher |
| Beständigkeit | Kontinuierliche Schleife mit geplanten Aufgaben und Cron-Unterstützung | Ständig aktiver Assistent |
| Autonomie | Plant, führt aus und schreibt seine eigenen Fähigkeitsdokumente | Interpretiert die Absicht und handelt dann auf Ihrer Infrastruktur |
| Hosting-Modell | Lokaler Rechner, VPS oder serverlose Backends wie Modal oder Daytona | Lokaler Rechner, Raspberry Pi oder VPS |
Falls Sie OpenClaw bereits nutzen, können Sie zu Hermes migrieren, ohne Ihre bisherige Arbeit zu verlieren.
Führen Sie während der Ersteinrichtung einfach diesen Befehl aus, um Ihre Einstellungen, gespeicherten Informationen, Fähigkeiten und API-Schlüssel zu importieren:
hermes claw migrate
So behalten Sie Ihre Konfigurationen für LLM-Anbieter, Verbindungen zu Messaging-Plattformen und den angesammelten Kontext, statt alles von Grund auf neu einrichten zu müssen.
Hermes Agent im Vergleich zu Paperclip
Hermes Agent und Paperclip arbeiten auf unterschiedlichen Ebenen, weshalb sie sich eher ergänzen als direkt miteinander konkurrieren.
In der Praxis ist Hermes der Agent, mit dem Sie täglich interagieren. Paperclip ist die Orchestrierungsebene, die Sie verwenden, wenn eine Aufgabe die Koordination mehrerer Agenten erfordert.
Das bedeutet, dass Sie eine Hermes-Agent-Instanz als Worker innerhalb einer Paperclip-Organisation ausführen können.
| Aspekt | Hermes Agent | Paperclip |
| Rolle | Einzelner, beständiger Agent | Orchestrierungsplattform für mehrere Agenten |
| Arbeitsweise | Ein Agent mit Gedächtnis und Fähigkeiten | Mehrere Agenten mit definierten Rollen, Zielen und Aufgaben |
| Struktur | Persönliche KI, die sich im Laufe der Zeit weiterentwickelt | Organisationsähnliche Hierarchie mit Verwaltung |
| Eignung | Individuelle Produktivität, Entwicklerautomatisierung und Recherche | Durchgehende Workflows über ganze Agenten-Teams hinweg |
| Interaktion | Messaging-Apps, CLI, Cronjobs | Dashboard, Aufgabensystem, gemeinsamer Kontext |
Wenn Sie daran interessiert sind, mit Paperclip und Hermes Agent eine vollständige KI-Organisation aufzubauen, folgen Sie unserem Tutorial zum Einrichten einer Paperclip-Instanz.
Hauptmerkmale von Hermes Agent
Hermes Agent kombiniert mehrere Funktionen, die die meisten KI-Agenten nur separat bieten, darunter:
- Permanente Ausführung rund um die Uhr: Sobald Sie den Agenten als systemd-Dienst bereitstellen, reagiert er kontinuierlich auf Nachrichten, führt geplante Cron-Aufgaben aus und setzt die Arbeit nach einem Neustart automatisch fort. Dies macht zeitintensive Workflows praktikabel – etwa eine nächtliche Recherche-Zusammenfassung, einen Code-Build über Nacht oder einen Wochenbericht –, ohne dass jedes Mal eine neue Unterhaltung gestartet werden muss.
- Autonome Entscheidungsfindung und Erstellung von Fähigkeiten: Nach komplexen Aufgaben, die fünf oder mehr Tool-Aufrufe erfordern, erstellt der Agent ein strukturiertes Dokument für eine neue Fähigkeit („Skill“) zur Wiederverwendung. Diese Skills werden als Markdown-Dateien unter ~/.hermes/skills/ gespeichert und folgen dem offenen Standard von agentskills.io, was sie auf andere kompatible Agenten übertragbar macht. Zudem können Sie Community-Skills über den Skills Hub mit Slash-Befehlen wie /gif-search oder /github-pr-workflow importieren. Der Agent kann seine eigenen Fähigkeiten sogar aktualisieren, wenn diese veraltet sind.
- Langfristige Speicherung von Informationen: Hermes sichert Daten über vier Ebenen hinweg. Zwei aufbereitete Dateien, MEMORY.md und USER.md, enthalten Fakten über die Umgebung sowie Nutzerpräferenzen und werden zu Beginn jeder Sitzung in den System-Prompt geladen. Eine SQLite-Datenbank unter ~/.hermes/state.db mit FTS5-Volltextsuche archiviert jede Sitzung für spätere Abrufe. Das Skills-Verzeichnis dient als prozedurales Gedächtnis. Zusätzlich übernehmen anbindbare Anbieter wie Honcho, Mem0, OpenViking oder Supermemory das langfristige Benutzermodelling.
- Integration von Tools und APIs: Mehr als 40 integrierte Werkzeuge decken die Websuche, Terminal-Befehle, Dateioperationen (wie read_file und patch), Browser-Automatisierung, Bilderkennung, Bildgenerierung, Text-to-Speech sowie die Delegierung an Unter-Agenten ab. Tools registrieren sich beim Import automatisch selbst, sodass Sie eigene Plugins einfach über die entsprechenden Verzeichnisse für Nutzer, Projekte oder Pip-Einstiegspunkte hinzufügen können.
- Umfangreiche LLM-Kompatibilität: Jeder OpenAI-kompatible Endpunkt funktioniert mit Hermes Agent, einschließlich Nous Portal, OpenRouter, Anthropic oder einer lokalen Ollama-Instanz.
- Integrierte MCP-Unterstützung: Sie können jeden MCP-Server über stdio oder HTTP anbinden, steuern, welche Werkzeuge der jeweilige Server bereitstellt, und alles über eine einzige config.yaml-Datei verwalten.
- Self-hosted Deployment: Hermes Agent läuft auf jeder Plattform, die Python 3.11 unterstützt, einschließlich Linux, macOS, WSL2 unter Windows sowie Android via Termux. Für die Befehlsausführung stehen sechs Terminal-Backends zur Verfügung: „local“ für Geschwindigkeit, „Docker“ für Isolation, „SSH“ für Remote-Server sowie serverlose Optionen wie Daytona, Singularity oder Modal. Docker ist auf einem VPS die sicherste Standardwahl, da die Container als Sicherheitsbarriere fungieren.
Was sind die wichtigsten Anwendungsfälle von Hermes Agent?
Zu den wichtigsten Anwendungsfällen von Hermes Agent gehören Entwicklungsautomatisierung, Recherche und Datenanalyse, geplante Workflows und persönliche KI-Assistenz. Diese Anwendungsfälle basieren auf persistenter Ausführung, bei der der Agent den Kontext über längere Zeit beibehält und technische Aufgaben mit mehreren Schritten ohne fortlaufende Benutzereingaben automatisiert.

In einer Entwicklungsumgebung kann er Aufgaben wie das Prüfen von Pull Requests, das Ausführen von Tests und die Verwaltung lang laufender Refactorings übernehmen – und dabei über Sitzungen hinweg weiterarbeiten, ohne den Kontext zu verlieren.
Für Recherceh und Datenanalyse kombiniert er Browsing, Codeausführung und Speicherfunktionen, um Informationen zu sammeln, zu verarbeiten und im Zeitverlauf erneut aufzurufen.
Er unterstützt auch geplante Workflows durch integrierte Automatisierung, etwa wiederkehrende Berichte oder Aktualisierungen, die über Messaging-Plattformen wie Telegram oder Discord bereitgestellt werden.
Auf persönlicher Ebene kann er ein beständiger KI-Assistent sein, der sich an Ihre Präferenzen anpasst, sich an Ihre bisherige Arbeit erinnert und Ihnen hilft, wiederkehrende Aufgaben zu straffen.
Herausforderungen und Einschränkungen von Hermes Agent
Hermes Agent setzt auf volle Kontrolle statt auf Bequemlichkeit, was eine bewusste Auseinandersetzung mit dem Betrieb der Infrastruktur erfordert:
- Technischer Mehraufwand. Der Betrieb eines permanenten Agenten bedeutet, dass Sie Ihre eigene Infrastruktur verwalten. Dies setzt Grundkenntnisse in Linux, systemd oder Container-Tools voraus, um bei Problemen eingreifen zu können.
- Sicherheitsrisiken: Ein autonomer Agent mit Terminal-Zugriff und API-Schlüsseln vergrößert die Angriffsfläche. Hermes Agent verfügt zwar über Schutzmaßnahmen wie eine Sperrliste für gefährliche Befehle und Sudo-Abfragen, diese können jedoch in Container-Umgebungen umgangen werden. Die Absicherung des Hosts, die Isolierung von Zugangsdaten und die Überprüfung der Logs liegen somit in Ihrer Verantwortung.
- Ressourcenverbrauch: Ein schlankes Setup läuft zwar auf einem günstigen VPS, doch anspruchsvollere Aufgaben wie Browser-Automatisierung oder parallele Unter-Agenten lassen den CPU-, Speicher- und Token-Verbrauch schnell ansteigen. Bei intensiver Nutzung kann dies die Hardware belasten und die LLM-Kosten in die Höhe treiben.
- Grenzen des Sprachmodells: Der Agent ist nur so zuverlässig wie das dahinterstehende Modell. Hermes Agent benötigt Modelle mit großen Kontextfenstern (64K+ Token), dennoch können Probleme wie Halluzinationen, Fehlinterpretationen von Werkzeug-Ausgaben oder der Verlust des roten Fadens bei komplexen Logikketten auftreten.
- Verzögerung im Lernprozess: Die Erstellung neuer Fähigkeiten erfolgt erst nach Abschluss komplexer Aufgaben und geschieht nicht sofort. Wenn Ihre Arbeitsabläufe sehr unterschiedlich sind, findet das System weniger Muster, aus denen es lernen kann, was die Feedback-Schleife weniger effektiv macht.
- Plattform-Einschränkungen: Eine native Windows-Unterstützung ist nicht verfügbar (WSL2 ist erforderlich). Android funktioniert zwar über Termux, allerdings sind einige Sprach- und Medienfunktionen aufgrund von Kompatibilitätseinschränkungen limitiert.
Beachten Sie, dass keiner dieser Punkte Hermes Agent unbrauchbar macht. Sie bedeuten lediglich, dass das Framework für technisch versierte Benutzer gedacht ist, die ihre eigene Infrastruktur bereits selbst verwalten, und nicht für Personen, die einen vollständig verwalteten, sofort einsatzbereiten Assistenten suchen.
Wie legen Sie mit dem Hermes Agent los?
Um mit dem Hermes Agent loszulegen, müssen Sie eine selbst gehostete Umgebung vorbereiten, Abhängigkeiten installieren, einen LLM-Anbieter konfigurieren und Hermes Agent als kontinuierlichen Dienst ausführen.
Die erste Entscheidung betrifft den Ausführungsort des Agenten. Ein Setup, das nur funktioniert, solange Ihr Gerät eingeschaltet ist, verfehlt den Zweck von Persistenz. Deshalb ist ein VPS die praktischere Wahl.
Wenn Sie den Großteil der Einrichtung überspringen möchten, kann ein vorkonfigurierter Hermes-Agent-VPS die Laufzeitanforderungen sofort erfüllen.
Wenn Sie die Einrichtung lieber manuell vornehmen möchten, beginnen Sie mit der Vorbereitung der Umgebung. Das bedeutet in der Regel einen Linux-Server, einen macOS-Rechner oder eine WSL2-Instanz mit installiertem Python 3.11.
Eine Docker-Instanz ist optional, aber empfohlen, da sie dem Terminal-Backend eine zusätzliche Isolationsebene hinzufügt.
Nachdem Sie Docker eingerichtet haben, führen Sie das offizielle Installationsprogramm von Hermes Agent in Ihrem Terminal aus:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Dadurch werden Kernabhängigkeiten wie uv, Python, Node.js, ripgrep und ffmpeg installiert und das Verzeichnis ~/.hermes/ erstellt.
Nach der Installation konfigurieren Sie den Agenten, indem Sie mit dem Befehl hermes model einen LLM-Anbieter auswählen, Messaging-Plattformen wie Telegram oder Discord über gateway setup verbinden und optional mit hermes memory setup einen externen Speicheranbieter aktivieren.
Führen Sie den Agenten danach als systemd-Dienst aus, damit er auch nach Neustarts weiterläuft, und überwachen Sie Protokolle oder den Sitzungsverlauf, um zu bestätigen, dass der Agent Eingaben empfängt und Aufgaben wie erwartet ausführt.
Eine vollständige Installationsanleitung finden Sie in unserer Schritt-für-Schritt-Anleitung zum Einrichten von Hermes Agent auf einem VPS.

Alle Tutorial-Inhalte auf dieser Website unterliegen Hostingers strengen redaktionellen Standards und Normen.