Hermès : Le seul agent IA qui rivalise vraiment avec OpenClaw

Explorez ce sujet avec les assistants IA les plus avancés

Depuis le lancement d’OpenClaw, plusieurs agents ont été créés presque chaque semaine, et il devient presque impossible de tous les essayer. Mais il y en a un nouveau qui a attiré l’attention de nombreuses personnes, y compris la mienne.

Il ne compte que 6 000 étoiles sur GitHub contre 307 000 pour OpenClaw (au moment de la rédaction). Cependant, contrairement à la plupart des autres agents, il ne se bat pas sur l’utilisation de la mémoire. Au lieu de cela, il se concentre sur les performances. C’est pourquoi il pourrait être le seul véritable concurrent d’OpenClaw dans ce domaine.

Qu’est ce que Hermes Agent ?

Hermes Agent est un agent open-source entièrement basé sur Python, créé par Nous Research.

L’une de ses fonctionnalités les plus intéressantes est sa capacité à apprendre au fil du temps. À mesure que vous l’utilisez, l’agent peut transformer ce qu’il apprend en compétences réutilisables, les améliorer grâce à l’expérience, stocker des informations utiles, et même effectuer des recherches dans les conversations précédentes. Cela lui permet de construire une meilleure compréhension de la façon dont vous interagissez avec lui à travers différentes sessions.

Nous Research est un laboratoire de recherche en IA et une startup d’IA décentralisée connue pour développer des grands modèles de langage (LLMs) open-source, tels que Hermes-4–405B et Hermes-4–70B. Vous pouvez essayer leurs modèles en les téléchargeant depuis Hugging Face ou en utilisant leur API.

Cependant, Hermes Agent ne se limite pas à ces modèles. Il est aussi polyvalent qu’OpenClaw, et vous pouvez l’alimenter avec les clés API d’OpenAI, d’OpenRouter ou, bien sûr, de Nous Research.

Si vous disposez du matériel requis, vous pouvez également exécuter des modèles localement, ce qui ajoute une couche supplémentaire de confidentialité.

Dans cet article, je vais vous guider étape par étape sur la façon de configurer l’agent et de naviguer dans le dépôt, ainsi que partager quelques cas d’utilisation sympas et les principales différences avec OpenClaw.


Apprenez à configurer l’Agent Hermès et suivez ses bonnes pratiques.

Hermès fonctionne sur Linux, macOS, ou WSL pour Windows, et tout comme OpenClaw, la meilleure approche est de le configurer sur un VPS ou un ordinateur de rechange.

Configurer l’Agent Hermès sur un VPS

Personnellement, j’aime utiliser le Cloud VPS 20 de Contabo. Pour seulement 6 \$/mois, vous obtenez 12 Go de RAM et un SSD de 200 Go. La plupart des fournisseurs de VPS vous demanderont quelle distribution Linux vous souhaitez utiliser. Je choisis généralement Ubuntu car c’est la plus largement documentée.

Une fois que vous êtes connecté à la machine, vous pouvez installer l’Agent Hermès avec une seule commande

Il crée un environnement virtuel pour vous, avec toutes les dépendances Python et Node.js dont vous avez besoin.

Après cela, il vous suffit de recharger le shell

Hermès inclut également une expérience d’intégration, bien que je l’aie trouvée un peu moins conviviale que celle fournie par OpenClaw. Mais ce n’est pas vraiment un problème car tout le reste est très bien documenté et organisé, à commencer par la structure du dépôt, qui ressemble à ceci

Vous pouvez considérer le config.yaml comme le fichier principal. À partir de là, vous pouvez personnaliser votre agent, ce qui est l’équivalent de openclaw.json.

Mais avant d’explorer le config.yaml et les autres fichiers, il est bon de vérifier si vous avez ajouté avec succès une clé de fournisseur lors de l’intégration, et vous pouvez voir cela dans le fichier .env. Par exemple, pour OpenRouter, copiez simplement votre clé API ici, si elle n’y est pas encore

Cela devrait suffire pour commencer à discuter avec l’agent. Dans le chapitre suivant, nous allons voir les commandes CLI les plus utiles.

Commandes CLI utiles de l’Agent Hermès

Les commandes Hermès sont très intuitives, et vous pouvez toutes les trouver sur la page de documentation. Ici, je mettrai simplement en évidence celles que j’ai trouvées les plus utiles.

Chat

Pour parler avec l’agent, vous avez simplement besoin de ceci

Une fois que vous ouvrez le chat, vous trouverez des centaines de commandes slash / qui peuvent être utilisées pour remplacer de nombreuses commandes CLI. Le bon côté est que vous n’avez pas besoin de mémoriser ce que fait chacune d’elles, car il y a une brève description à côté.

Modèles

Vous pouvez changer votre modèle actuel en utilisant

Cela affichera tous les fournisseurs disponibles.

Vous trouverez des modèles par défaut, mais vous pouvez également en entrer un personnalisé.

Au moment de la rédaction, Nvidia vient de publier un modèle ultra-rapide entièrement gratuit sur OpenRouter, vous pouvez donc utiliser celui-ci si vous voulez économiser des crédits

Configuration

Maintenant, revenons aux commandes CLI. Si vous souhaitez avoir un aperçu rapide de votre configuration, vous pouvez exécuter ceci

Vous verrez quels modèles vous utilisez, les clés API, et ainsi de suite.

Vous pouvez également utiliser l’alias config pour modifier et mettre à jour la configuration

Sessions

L’agent enregistre chaque conversation que vous avez en tant que session, ce qui est utilisé pour le faire apprendre au fil du temps. Vous pouvez les lister avec des commandes comme celles-ci

Vous pouvez également exporter les sessions complètes et effectuer d’autres tâches si vous avez besoin de migrer votre agent vers une autre machine, sans perdre d’informations.

Passerelle (Gateway)

La passerelle est un processus en arrière-plan qui s’exécute en permanence et vous permet de discuter sur Telegram, Slack et d’autres canaux. Cependant, il rencontre parfois des problèmes et doit être démarré, arrêté ou redémarré

Vous pouvez également configurer les plateformes de messagerie que la passerelle englobe

Tâches Cron

Une chose que beaucoup de gens font avec ces agents est de planifier des tâches et de configurer des rappels. Cela se fait généralement via des tâches cron, qui peuvent être listées et modifiées à l’aide des commandes CLI

Pour supprimer la tâche cron, vous pouvez utiliser la commande slash suivante

Mettre à jour et désinstaller Hermes Agent

Pour mettre à jour Hermès avec les derniers changements du dépôt, vous pouvez exécuter

Si vous n’êtes pas fan d’Hermès et souhaitez vous en tenir à OpenClaw à la place, vous pouvez le désinstaller

Pour le moment, il n’y a pas de commande CLI audit pour Hermès, c’est un avantage qu’OpenClaw possède actuellement, car il peut vous guider sur les meilleures pratiques et vérifier s’il y a quelque chose de suspect avec votre agent.

Le mieux que vous puissiez faire est d’exécuter \insights dans le chat, et vous obtiendrez un résumé de tout ce que vous avez fait jusqu’à présent, y compris le nombre total de sessions, les coûts, le temps d’activité, et bien plus encore.

Dans la section suivante, je vous montrerai comment connecter Hermès à Telegram.


Connecter Hermès à Telegram

Le début est toujours le même : vous devez créer un /newbot en utilisant BotFather.

  1. Ouvrez Telegram et cherchez BotFather.
  2. Envoyez /newbot.
  3. Choisissez un nom d’affichage (par ex., « Hermes Agent »).
  4. Choisissez un nom d’utilisateur. Celui-ci doit être unique et se terminer par bot (par ex., mon_hermes_bot).
  5. BotFather répond avec votre jeton API.

Maintenant, vous devez obtenir votre ID utilisateur. Le moyen le plus rapide est de chercher @userinfobot.

Vous pouvez maintenant exécuter cette commande et sélectionner Telegram

Suivez les étapes pour ajouter à la fois le jeton API du bot et votre ID de jeton. Sinon, vous pouvez également coller les informations directement dans le fichier .env

Si, pour une raison quelconque, vous avez appliqué les changements et ne pouvez toujours pas parler à votre agent sur Telegram, essayez de redémarrer la passerelle.

Maintenant, personnalisons l’agent !


Personnaliser l’Agent Hermès

Plusieurs choses peuvent être personnalisées. Par exemple, vous pouvez changer la personnalité de l’agent, son effort de raisonnement, le terminal qu’il utilise (local, Docker, etc.), ses paramètres de mémoire, ainsi que les fonctionnalités de synthèse vocale (Text-to-Speech) et de reconnaissance vocale (Speech-to-Text), et plus encore…. La plupart de cela peut être configuré avec de petites modifications dans le fichier config.yaml.

Lui donner une personnalité

Hermès est livré avec toutes ces personnalités, et vous pouvez les sélectionner avec une commande slash

Vous pouvez simplement ajouter une autre personnalité à la liste dans le fichier config.yaml.

Ensuite, ajoutez le nom de la nouvelle personnalité ici

Changer le nom de l’agent

Par défaut, votre agent s’appelle « Hermès », mais vous pouvez changer cela. D’abord dans le dossier skins, vous devez créer un fichier skin .yaml avec le nom de votre agent

Mon agent s’appelle Pecas, j’ai donc nommé le fichier pecas-skin.yaml. Dans le config.yaml, j’ai ajouté le nom du skin sous display

Vous pouvez ajouter plus d’informations au fichier skin, telles que des messages de bienvenue et d’au revoir, un symbole d’invite, des couleurs d’interface utilisateur personnalisées, et plus encore.

Activer la synthèse vocale (TTS)

Pour le TTS, il prend en charge OpenAI, Edge (gratuitement) et ElevanLabs. Vous pouvez voir les trois options dans le fichier config.yaml

Contrairement à OpenClaw, qui affiche toujours des messages audio lorsque le TTS est activé, Hermès exige que vous demandiez explicitement un message audio, ou vous devez créer une compétence qui en génère toujours un.

Pour certains utilisateurs, cela peut ressembler à une régression. Cependant, pour moi, c’est en fait mieux car cela économise de la mémoire, et je n’ai pas besoin d’entendre des messages vocaux à chaque fois.

Récemment, j’ai également découvert un nouveau modèle TTS et STT disponible sur GitHub appelé Fish Speech. Vous pouvez utiliser le modèle localement ou utiliser leur API.

Activer la reconnaissance vocale (STT)

Similaire au TTS, le STT est également configuré dans le fichier config.yaml

Pour cela, vous avez besoin d’un jeton API OpenAI.

Maintenant, voyons quelques exemples de compétences et de projets que j’ai ajoutés à l’Agent Hermès.


Créer des compétences et des projets

Hermès est livré avec plusieurs compétences préinstallées, telles que

  • Claude Code : Délègue les tâches de codage à Claude Code (l’agent CLI d’Anthropic).
  • Apple Notes : Gère les notes Apple via la CLI sur macOS.
  • Dog Food : Effectue des tests exploratoires systématiques d’assurance qualité des applications web.
  • YouTube Content : Récupère les transcriptions de vidéos YouTube et les transforme en contenu structuré.
  • OpenHue : Contrôle les lumières, pièces et scènes Philips Hue via la CLI OpenHue.
  • Nano PDF : Modifie des PDF avec des instructions en langage naturel en utilisant la CLI nano-pdf.

Il y en a bien d’autres disponibles, et pour être honnête, en créer de nouvelles est très facile si vous avez le bon modèle.

La première chose que j’ai faite a été de remplacer l’outil de recherche web Firecrawl par Perplexity Sonar. Non seulement parce que j’aime la façon dont Perplexity fournit des informations résumées, mais aussi parce que je préfère avoir moins d’API dans ma configuration. J’ai donc pu réutiliser ma clé API OpenRouter pour Sonar.

Le fichier SKILL.md pour Perplexity avec OpenRouter est ici

base_url: https://openrouter.ai/api/v1
model: perplexity/sonar-pro

bash
cd ~/.hermes/hermes-agent
PYTHONPATH=. python3 -c « from tools.webtools import websearchtool; print(websearch_tool(‘query’, 3)) »

Vous pouvez également coder à la volée (vibe-code) des projets et des applications web avec Hermès.

Par exemple, j’ai créé un script similaire à Tricount à utiliser dans un groupe Telegram que je partage avec ma copine. Je lui ai donné des instructions qui suivent une logique similaire à Tricount (je l’ai appelé Hermescount).

J’ai également généré un fichier SKILL.md, afin de pouvoir partager Hermescount avec la communauté.

Parmi les autres projets et compétences que j’ai installés, l’un qui est particulièrement utile pour obtenir des informations à jour, comme les offres d’emploi dans la tech, les actualités tech, et plus encore, est la compétence Apify MCP.

Je viens aussi de demander à Hermès de la créer, sur la base de ce fichier JSON que vous pouvez trouver en bas de la page Apify MCP

Il nécessite un jeton Apify. Si vous n’en avez pas encore un, vous pouvez créer un compte ici.


Ma préférence entre OpenClaw et Hermes Agent

J’ai utilisé à la fois OpenClaw et Hermes Agent, et jusqu’à présent, il est difficile de dire lequel je préfère.

Le fait qu’Hermès soit entièrement basé sur Python me rend partial, car je peux littéralement lire tout le code, ce qui me fait lui faire davantage confiance qu’à OpenClaw. J’aime aussi le fait que toutes les clés soient enregistrées dans un fichier .env, et que je n’ai pas besoin de les exporter à chaque fois, ni de les exposer dans des fichiers JSON et .txt.

Une autre fonctionnalité sympa d’Hermès est que, chaque fois qu’il configure quelque chose, vous pouvez voir tous les changements qu’il effectue, comme ici :

C’est génial pour garder une trace de ce que fait l’agent, et vous pouvez toujours vérifier les fichiers modifiés pour confirmer que rien ne s’est mal passé.

Cependant, OpenClaw semble plus rapide dans de nombreux cas. Cela pourrait être dû au système d’apprentissage d’Hermès, qui prend des notes et met à jour les compétences pendant que vous discutez avec lui. Mais ce n’est rien qu’un modèle plus rapide ou quelques ajustements de configuration ne puissent corriger.

Un autre inconvénient d’Hermès est l’absence de commande d’audit et de tableau de bord, comme le propose OpenClaw.

Mais bon, Hermès n’est là que depuis quelques jours, tandis qu’OpenClaw est là depuis trois mois. Je pense que ce n’est qu’une question de jours ou de semaines avant que l’équipe n’ajoute ces fonctionnalités et ne rende l’agent plus fluide.

Pour l’instant, je vais continuer à jouer avec les deux et à partager mes impressions.