Bytebot : Agent de Bureau IA Open-Source
Une IA qui possède son propre ordinateur pour accomplir des tâches à votre place
https://github.com/user-attachments/assets/f271282a-27a3-43f3-9b99-b34007fdd169
https://github.com/user-attachments/assets/72a43cf2-bd87-44c5-a582-e7cbe176f37f
Qu'est-ce qu'un Agent de Bureau ?
Un agent de bureau est une IA qui possède son propre ordinateur. Contrairement aux agents limités au navigateur ou aux outils RPA traditionnels, Bytebot est livré avec un bureau virtuel complet où il peut :
- Utiliser n'importe quelle application (navigateurs, clients de messagerie, outils bureautiques, IDE)
- Télécharger et organiser des fichiers avec son propre système de fichiers
- Se connecter à des sites web et applications à l'aide de gestionnaires de mots de passe
- Lire et traiter des documents, PDF et feuilles de calcul
- Accomplir des flux de travail complexes en plusieurs étapes à travers différents programmes
Considérez-le comme un employé virtuel disposant de son propre ordinateur, capable de voir l'écran, de déplacer la souris, de taper au clavier et d'accomplir des tâches exactement comme le ferait un humain.
Pourquoi donner à l'IA son propre ordinateur ?
Lorsque l'IA a accès à un environnement de bureau complet, elle débloque des capacités impossibles avec des agents uniquement basés sur un navigateur ou des intégrations d'API :
Autonomie complète des tâches
Donnez à Bytebot une tâche comme "Télécharge toutes les factures de nos portails fournisseurs et organise-les dans un dossier" et il va :
- Ouvrir le navigateur
- Naviguer vers chaque portail
- Gérer l'authentification (y compris la 2FA via les gestionnaires de mots de passe)
- Télécharger les fichiers vers son système de fichiers local
- Les organiser dans un dossier
Traiter des documents
Téléversez directement des fichiers sur le bureau de Bytebot et il peut :
- Lire des PDF entiers dans son contexte
- Extraire des données de documents complexes
- Recouper des informations à travers plusieurs fichiers
- Créer de nouveaux documents basés sur une analyse
- Gérer des formats auxquels les API ne peuvent pas accéder
Utiliser de vraies applications
Bytebot n'est pas limité aux interfaces web. Il peut :
- Utiliser des applications de bureau comme des éditeurs de texte, VS Code, ou des clients de messagerie
- Exécuter des scripts et des outils en ligne de commande
- Installer de nouveaux logiciels si nécessaire
- Configurer des applications pour des flux de travail spécifiques
Démarrage rapide
Déployer en 2 minutes
Option 1 : Railway (Le plus simple)
Cliquez simplement et ajoutez votre clé API de fournisseur d'IA.
Option 2 : Docker Compose
git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot
# Add your AI provider key (choose one)
echo "ANTHROPIC_API_KEY=sk-ant-..." > docker/.env
# Or: echo "OPENAI_API_KEY=sk-..." > docker/.env
# Or: echo "GEMINI_API_KEY=..." > docker/.env
docker-compose -f docker/docker-compose.yml up -d
# Open http://localhost:9992
Guide de déploiement complet →
Fonctionnement
Bytebot se compose de quatre composants intégrés :
- Bureau virtuel : Un environnement Ubuntu Linux complet avec des applications préinstallées
- Agent IA : Comprend vos tâches et contrôle le bureau pour les accomplir
- Interface de tâches : Interface web où vous créez des tâches et observez Bytebot travailler
- APIs : Points de terminaison REST pour la création programmatique de tâches et le contrôle du bureau
Fonctionnalités clés
- Tâches en langage naturel : Décrivez simplement ce dont vous avez besoin
- Téléchargements de fichiers : Déposez des fichiers sur les tâches pour que Bytebot les traite
- Vue en direct du bureau : Observez Bytebot travailler en temps réel
- Mode prise de contrôle : Prenez le contrôle lorsque vous devez aider ou configurer quelque chose
- Support des gestionnaires de mots de passe : Installez 1Password, Bitwarden, etc. pour une authentification automatique
- Environnement persistant : Installez des programmes et ils restent disponibles pour les tâches futures
Exemples de tâches
Exemples de base
"Go to Wikipedia and create a summary of quantum computing"
"Research flights from NYC to London and create a comparison document"
"Take screenshots of the top 5 news websites"
Traitement de documents
"Read the uploaded contracts.pdf and extract all payment terms and deadlines"
"Process these 5 invoice PDFs and create a summary report"
"Download and analyze the latest financial report and answer: What were the key risks mentioned?"
Workflows multi-applications
"Download last month's bank statements from our three banks and consolidate them"
"Check all our vendor portals for new invoices and create a summary report"
"Log into our CRM, export the customer list, and update records in the ERP system"
Contrôle programmatique
Créer des tâches via l'API
import requests
# Simple task
response = requests.post('http://localhost:9991/tasks', json={
'description': 'Download the latest sales report and create a summary'
})
# Task with file upload
files = {'files': open('contracts.pdf', 'rb')}
response = requests.post('http://localhost:9991/tasks',
data={'description': 'Review these contracts for important dates'},
files=files
)
Contrôle direct du bureau
# Take a screenshot
curl -X POST http://localhost:9990/computer-use \
-H "Content-Type: application/json" \
-d '{"action": "screenshot"}'
# Click at specific coordinates
curl -X POST http://localhost:9990/computer-use \
-H "Content-Type: application/json" \
-d '{"action": "click_mouse", "coordinate": [500, 300]}'
Documentation complète de l'API →
Configuration de votre agent de bureau
1. Déployer Bytebot
Utilisez l'une des méthodes de déploiement ci-dessus pour faire fonctionner Bytebot.
2. Configurer le Bureau
Utilisez l'onglet Bureau dans l'interface utilisateur pour :
- Installer les programmes supplémentaires dont vous avez besoin
- Configurer des gestionnaires de mots de passe pour l'authentification
- Configurer les applications selon vos préférences
- Vous connecter aux sites web que vous souhaitez que Bytebot puisse accéder
3. Commencer à Donner des Tâches
Créez des tâches en langage naturel et observez Bytebot les accomplir en utilisant le bureau configuré.
Cas d'utilisation
Automatisation des Processus Métier
- Traitement des factures et extraction de données
- Synchronisation des données multi-systèmes
- Génération de rapports à partir de multiples sources
- Vérification de la conformité sur plusieurs plateformes
Développement & Tests
- Tests d'interface utilisateur automatisés
- Vérifications de compatibilité multi-navigateurs
- Génération de documentation avec captures d'écran
- Vérification du déploiement de code
Recherche & Analyse
- Analyse concurrentielle sur plusieurs sites web
- Collecte de données à partir de multiples sources
- Analyse et synthèse de documents
- Compilation d'études de marché
Architecture
Bytebot est construit avec :
- Bureau : Ubuntu 22.04 avec XFCE, Firefox, VS Code et d'autres outils
- Agent : Service NestJS qui coordonne les actions de l'IA et du bureau
- Interface Utilisateur : Application Next.js pour la gestion des tâches
- Support IA : Fonctionne avec Anthropic Claude, OpenAI GPT, Google Gemini
- Déploiement : Conteneurs Docker pour un auto-hébergement facile
Pourquoi l'Auto-hébergement ?
- Confidentialité des données : Tout s'exécute sur votre infrastructure
- Contrôle total : Personnalisez l'environnement de bureau selon vos besoins
- Aucune limite : Utilisez vos propres clés API d'IA sans restrictions de plateforme
- Flexibilité : Installez n'importe quel logiciel, accédez à n'importe quel système
Fonctionnalités avancées
Multiples fournisseurs d'IA
Utilisez n'importe quel fournisseur d'IA via notre intégration LiteLLM :
- Azure OpenAI
- AWS Bedrock
- Modèles locaux via Ollama
- 100+ autres fournisseurs
Déploiement entreprise
Déployez sur Kubernetes avec Helm :
# Clone the repository
git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot
# Install with Helm
helm install bytebot ./helm \
--set agent.env.ANTHROPIC_API_KEY=sk-ant-...
Guide de déploiement entreprise →
Communauté et support
- Discord : Rejoignez notre communauté pour obtenir de l'aide et participer aux discussions
- Documentation : Guides complets sur docs.bytebot.ai
- Problèmes GitHub : Signalez des bugs et demandez des fonctionnalités
Contribution
Nous accueillons les contributions ! Que ce soit :
- 🐛 Corrections de bugs
- ✨ Nouvelles fonctionnalités
- 📚 Améliorations de la documentation
- 🌐 Traductions
Veuillez :
- Vérifier d'abord les problèmes existants
- Ouvrir un problème pour discuter des changements majeurs
- Soumettre des PR avec des descriptions claires
- Rejoindre notre Discord pour discuter des idées
Licence
Bytebot est open source sous licence Apache 2.0.
Donnez à votre IA son propre ordinateur. Voyez ce qu'elle peut faire.
Construit par Tantl Labs et la communauté open source