close
Bytebot Logo

Bytebot : Agent de Bureau IA Open-Source

bytebot-ai%2Fbytebot | Trendshift

Une IA qui possède son propre ordinateur pour accomplir des tâches à votre place

Déployer sur Railway

Docker Licence Discord

🌐 Site Web📚 Documentation💬 Discord𝕏 Twitter


https://github.com/user-attachments/assets/f271282a-27a3-43f3-9b99-b34007fdd169

https://github.com/user-attachments/assets/72a43cf2-bd87-44c5-a582-e7cbe176f37f

Qu'est-ce qu'un Agent de Bureau ?

Un agent de bureau est une IA qui possède son propre ordinateur. Contrairement aux agents limités au navigateur ou aux outils RPA traditionnels, Bytebot est livré avec un bureau virtuel complet où il peut :

  • Utiliser n'importe quelle application (navigateurs, clients de messagerie, outils bureautiques, IDE)
  • Télécharger et organiser des fichiers avec son propre système de fichiers
  • Se connecter à des sites web et applications à l'aide de gestionnaires de mots de passe
  • Lire et traiter des documents, PDF et feuilles de calcul
  • Accomplir des flux de travail complexes en plusieurs étapes à travers différents programmes

Considérez-le comme un employé virtuel disposant de son propre ordinateur, capable de voir l'écran, de déplacer la souris, de taper au clavier et d'accomplir des tâches exactement comme le ferait un humain.

Pourquoi donner à l'IA son propre ordinateur ?

Lorsque l'IA a accès à un environnement de bureau complet, elle débloque des capacités impossibles avec des agents uniquement basés sur un navigateur ou des intégrations d'API :

Autonomie complète des tâches

Donnez à Bytebot une tâche comme "Télécharge toutes les factures de nos portails fournisseurs et organise-les dans un dossier" et il va :

  • Ouvrir le navigateur
  • Naviguer vers chaque portail
  • Gérer l'authentification (y compris la 2FA via les gestionnaires de mots de passe)
  • Télécharger les fichiers vers son système de fichiers local
  • Les organiser dans un dossier

Traiter des documents

Téléversez directement des fichiers sur le bureau de Bytebot et il peut :

  • Lire des PDF entiers dans son contexte
  • Extraire des données de documents complexes
  • Recouper des informations à travers plusieurs fichiers
  • Créer de nouveaux documents basés sur une analyse
  • Gérer des formats auxquels les API ne peuvent pas accéder

Utiliser de vraies applications

Bytebot n'est pas limité aux interfaces web. Il peut :

  • Utiliser des applications de bureau comme des éditeurs de texte, VS Code, ou des clients de messagerie
  • Exécuter des scripts et des outils en ligne de commande
  • Installer de nouveaux logiciels si nécessaire
  • Configurer des applications pour des flux de travail spécifiques

Démarrage rapide

Déployer en 2 minutes

Option 1 : Railway (Le plus simple) Deploy on Railway

Cliquez simplement et ajoutez votre clé API de fournisseur d'IA.

Option 2 : Docker Compose

git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot

# Add your AI provider key (choose one)
echo "ANTHROPIC_API_KEY=sk-ant-..." > docker/.env
# Or: echo "OPENAI_API_KEY=sk-..." > docker/.env
# Or: echo "GEMINI_API_KEY=..." > docker/.env

docker-compose -f docker/docker-compose.yml up -d

# Open http://localhost:9992

Guide de déploiement complet →

Fonctionnement

Bytebot se compose de quatre composants intégrés :

  1. Bureau virtuel : Un environnement Ubuntu Linux complet avec des applications préinstallées
  2. Agent IA : Comprend vos tâches et contrôle le bureau pour les accomplir
  3. Interface de tâches : Interface web où vous créez des tâches et observez Bytebot travailler
  4. APIs : Points de terminaison REST pour la création programmatique de tâches et le contrôle du bureau

Fonctionnalités clés

  • Tâches en langage naturel : Décrivez simplement ce dont vous avez besoin
  • Téléchargements de fichiers : Déposez des fichiers sur les tâches pour que Bytebot les traite
  • Vue en direct du bureau : Observez Bytebot travailler en temps réel
  • Mode prise de contrôle : Prenez le contrôle lorsque vous devez aider ou configurer quelque chose
  • Support des gestionnaires de mots de passe : Installez 1Password, Bitwarden, etc. pour une authentification automatique
  • Environnement persistant : Installez des programmes et ils restent disponibles pour les tâches futures

Exemples de tâches

Exemples de base

"Go to Wikipedia and create a summary of quantum computing"
"Research flights from NYC to London and create a comparison document"
"Take screenshots of the top 5 news websites"

Traitement de documents

"Read the uploaded contracts.pdf and extract all payment terms and deadlines"
"Process these 5 invoice PDFs and create a summary report"
"Download and analyze the latest financial report and answer: What were the key risks mentioned?"

Workflows multi-applications

"Download last month's bank statements from our three banks and consolidate them"
"Check all our vendor portals for new invoices and create a summary report"
"Log into our CRM, export the customer list, and update records in the ERP system"

Contrôle programmatique

Créer des tâches via l'API

import requests

# Simple task
response = requests.post('http://localhost:9991/tasks', json={
    'description': 'Download the latest sales report and create a summary'
})

# Task with file upload
files = {'files': open('contracts.pdf', 'rb')}
response = requests.post('http://localhost:9991/tasks',
    data={'description': 'Review these contracts for important dates'},
    files=files
)

Contrôle direct du bureau

# Take a screenshot
curl -X POST http://localhost:9990/computer-use \
  -H "Content-Type: application/json" \
  -d '{"action": "screenshot"}'

# Click at specific coordinates
curl -X POST http://localhost:9990/computer-use \
  -H "Content-Type: application/json" \
  -d '{"action": "click_mouse", "coordinate": [500, 300]}'

Documentation complète de l'API →

Configuration de votre agent de bureau

1. Déployer Bytebot

Utilisez l'une des méthodes de déploiement ci-dessus pour faire fonctionner Bytebot.

2. Configurer le Bureau

Utilisez l'onglet Bureau dans l'interface utilisateur pour :

  • Installer les programmes supplémentaires dont vous avez besoin
  • Configurer des gestionnaires de mots de passe pour l'authentification
  • Configurer les applications selon vos préférences
  • Vous connecter aux sites web que vous souhaitez que Bytebot puisse accéder

3. Commencer à Donner des Tâches

Créez des tâches en langage naturel et observez Bytebot les accomplir en utilisant le bureau configuré.

Cas d'utilisation

Automatisation des Processus Métier

  • Traitement des factures et extraction de données
  • Synchronisation des données multi-systèmes
  • Génération de rapports à partir de multiples sources
  • Vérification de la conformité sur plusieurs plateformes

Développement & Tests

  • Tests d'interface utilisateur automatisés
  • Vérifications de compatibilité multi-navigateurs
  • Génération de documentation avec captures d'écran
  • Vérification du déploiement de code

Recherche & Analyse

  • Analyse concurrentielle sur plusieurs sites web
  • Collecte de données à partir de multiples sources
  • Analyse et synthèse de documents
  • Compilation d'études de marché

Architecture

Bytebot est construit avec :

  • Bureau : Ubuntu 22.04 avec XFCE, Firefox, VS Code et d'autres outils
  • Agent : Service NestJS qui coordonne les actions de l'IA et du bureau
  • Interface Utilisateur : Application Next.js pour la gestion des tâches
  • Support IA : Fonctionne avec Anthropic Claude, OpenAI GPT, Google Gemini
  • Déploiement : Conteneurs Docker pour un auto-hébergement facile

Pourquoi l'Auto-hébergement ?

  • Confidentialité des données : Tout s'exécute sur votre infrastructure
  • Contrôle total : Personnalisez l'environnement de bureau selon vos besoins
  • Aucune limite : Utilisez vos propres clés API d'IA sans restrictions de plateforme
  • Flexibilité : Installez n'importe quel logiciel, accédez à n'importe quel système

Fonctionnalités avancées

Multiples fournisseurs d'IA

Utilisez n'importe quel fournisseur d'IA via notre intégration LiteLLM :

  • Azure OpenAI
  • AWS Bedrock
  • Modèles locaux via Ollama
  • 100+ autres fournisseurs

Déploiement entreprise

Déployez sur Kubernetes avec Helm :

# Clone the repository
git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot

# Install with Helm
helm install bytebot ./helm \
  --set agent.env.ANTHROPIC_API_KEY=sk-ant-...

Guide de déploiement entreprise →

Communauté et support

  • Discord : Rejoignez notre communauté pour obtenir de l'aide et participer aux discussions
  • Documentation : Guides complets sur docs.bytebot.ai
  • Problèmes GitHub : Signalez des bugs et demandez des fonctionnalités

Contribution

Nous accueillons les contributions ! Que ce soit :

  • 🐛 Corrections de bugs
  • ✨ Nouvelles fonctionnalités
  • 📚 Améliorations de la documentation
  • 🌐 Traductions

Veuillez :

  1. Vérifier d'abord les problèmes existants
  2. Ouvrir un problème pour discuter des changements majeurs
  3. Soumettre des PR avec des descriptions claires
  4. Rejoindre notre Discord pour discuter des idées

Licence

Bytebot est open source sous licence Apache 2.0.


Donnez à votre IA son propre ordinateur. Voyez ce qu'elle peut faire.

Déployer sur Railway

Construit par Tantl Labs et la communauté open source