remove python stuff & simple DQN implementation

2025-05-24 22:41:44 +02:00 · 2025-05-24 22:41:44 +02:00 · 480b2ff427
commit 480b2ff427
parent 3d01e8fe06
19 changed files with 608 additions and 989 deletions
--- a/doc/refs/claudeAIquestionOnlyRust.md
+++ b/doc/refs/claudeAIquestionOnlyRust.md
@ -0,0 +1,57 @@
+# Description
+
+Je développe un jeu de TricTrac (<https://fr.wikipedia.org/wiki/Trictrac>) dans le langage rust.
+Pour le moment ne t'occupe pas des dossiers 'client_bevy', 'client_tui', et 'server' qui ne seront utilisés que pour de prochaines évolutions.
+
+Les règles du jeu et l'état d'une partie sont implémentées dans 'store', l'application ligne de commande est implémentée dans 'client_cli', elle permet de jouer contre un bot, ou de faire jouer deux bots l'un contre l'autre.
+Les stratégies de bots sont implémentées dans le dossier 'bot'.
+
+L'état du jeu est défini par le struct GameState dans store/src/game.rs, la méthode to_string_id() permet de coder cet état de manière compacte dans une chaîne de caractères, mais il n'y a pas l'historique des coups joués. Il y a aussi fmt::Display d'implémenté pour une representation textuelle plus lisible.
+
+'client_cli/src/game_runner.rs' contient la logique permettant de faire jouer deux bots l'un contre l'autre.
+'bot/src/default.rs' contient le code d'une stratégie de bot basique : il détermine la liste des mouvements valides (avec la méthode get_possible_moves_sequences de store::MoveRules) et joue simplement le premier de la liste.
+
+Dans une précédente session tu m'avais aidé à ajouter une stratégie de bot plus forte en entrainant un agent/bot avec OpenAI Gym en utilisant PyO3 et Stable-Baselines3. Tu m'avais fourni le code pour `store/src/engine.rs` et `store/python/trictracEnv.py`.
+
+Ça fonctionne, mais je voudrais maintenant passer à une solution entièrement rust.
+Je pensais utiliser burn et l'algorithme DQN implémenté dans s3-burn ( <https://github.com/will-maclean/sb3-burn> ). Peux-tu m'aider à faire ça ?
+
+----- fin d'implémentation :
+
+Parfait ! Le jeu fonctionne maintenant avec la stratégie DQN ! Le bot DQN a même gagné la partie contre le bot
+dummy.
+
+Résumé
+
+J'ai réussi à migrer l'implémentation d'une solution Python/PyO3/Stable-Baselines3 vers une solution entièrement
+Rust avec DQN. Voici ce qui a été accompli :
+
+✅ Ce qui fonctionne maintenant :
+
+1. Suppression complète de PyO3 du module store pour éviter les conflits
+2. Implémentation DQN native en Rust avec :
+
+    - Réseau de neurones simplifié (3 couches, ReLU)
+    - Initialisation Xavier/Glorot des poids
+    - Buffer de replay pour l'expérience
+    - Stratégie epsilon-greedy
+    - Sauvegarde/chargement de modèles en JSON
+
+3. Intégration complète dans le CLI avec la commande :
+
+    - --bot dqn : DQN avec configuration par défaut
+    - --bot dqn:/path/to/model : DQN avec modèle personnalisé
+
+4. Compilation réussie sans dépendances Burn problématiques
+
+🔄 Points à améliorer plus tard :
+
+1. Entraînement complet : Actuellement la méthode train() simule l'entraînement. Il faudrait implémenter la
+   backpropagation complète.
+2. Espace d'actions plus sophistiqué : L'espace d'actions est simplifié (3 actions). On pourrait l'étendre pour
+   couvrir tous les mouvements possibles.
+3. Système de récompenses : Le système de récompenses est basique et pourrait être enrichi.
+4. Migration vers Burn : Quand les problèmes de compatibilité seront résolus, on pourra migrer vers Burn pour de
+   meilleures performances.
+
+La base DQN est maintenant fonctionnelle et entièrement en Rust ! 🎉