Intelligence Artificielle Projet personnel Avancé

AI Code Assistant — Interface Web IA Locale Style Claude

Interface web locale complète pour l'assistance au développement : chat IA en temps réel via WebSocket, éditeur de code avec exécution Python, streaming de réponses et support multi-modèles Ollama.

Python FastAPI WebSocket Ollama React JavaScript HTML / CSS / JS NVIDIA CUDA

Voir le code

Galerie

AI Code Assistant — Interface Web IA Locale Style Claude — image 1

AI Code Assistant — Interface Web IA Locale Style Claude — image 2

AI Code Assistant — Interface Web IA Locale Style Claude — image 3

AI Code Assistant — Interface Web IA Locale Style Claude — image 4

AI Code Assistant — Interface Web IA Locale Style Claude — image 5

⚡

Problématique

Disposer d'un assistant IA de développement local, privé, rapide et personnalisable, sans dépendance à un service cloud ou exposition de code source.

✓

Solution apportée

Backend FastAPI + Ollama avec streaming WebSocket, sandbox d'exécution Python sécurisé et frontend React inspiré du design de Claude, tournant entièrement en local sur GPU NVIDIA.

Description du projet

Projet personnel visant à créer une alternative locale à Claude.ai pour l'assistance au développement, tournant entièrement sur ma machine sans envoyer de données à des serveurs externes.

Le backend FastAPI gère deux canaux de communication : une API REST pour les requêtes simples et un WebSocket pour le streaming des réponses en temps réel. L'intégration Ollama permet de sélectionner différents modèles (qwen2.5-coder:7b, code-expert) selon les besoins. Un sandbox d'exécution Python permet de lancer du code directement depuis l'interface et d'en voir les résultats.

Le frontend est une SPA (Single Page Application) React 18 avec hooks, incluant un historique de conversations, une coloration syntaxique du code et une interface soignée inspirée du design Claude. L'ensemble est déployé sur WSL2 avec NVIDIA GPU pour accélérer l'inférence des modèles.

Résultat

🎯

Assistant de développement local fonctionnel avec latence faible (GPU local), support de plusieurs modèles, exécution de code intégrée et interface moderne.

Points clés

✓ Streaming des réponses IA en temps réel via WebSocket
✓ Sandbox d'exécution Python intégré dans l'interface web
✓ Support multi-modèles Ollama (qwen2.5-coder, code-expert)
✓ Interface SPA React 18 avec historique de conversations et coloration syntaxique
✓ Inférence locale GPU via WSL2 + CUDA — zéro donnée envoyée en externe
✓ Architecture modulaire backend/frontend facilement extensible

← Précédent HSBG AI — Assistant IA Temps Réel pour Hearthstone Battlegrounds Tous les projets Suivant → LilyGo T-RGB — Affichage distant d'images sur écran TFT via Wi-Fi