1/ Présentation du nouveau backend de RL Swarm : GenRL. Une bibliothèque modulaire d’apprentissage par renforcement conçue pour une formation distribuée et tolérante aux pannes, qui alimente désormais RL Swarm à partir de zéro. 🧵
2/ Chaque worker exécute sa propre instance d’environnement, contribue de manière asynchrone à une mémoire tampon de déploiement partagée et met à jour ses poids de modèle indépendamment, de sorte qu’aucun contrôleur central n’est requis.
3/ GenRL permet à RL Swarm de fonctionner avec n’importe quel environnement, décrit intuitivement par le code. Ce lancement intègre Reasoning Gym prêt à l’emploi, donnant accès à > 100 environnements créés par la communauté sans configuration supplémentaire requise.
4/ Quoi de neuf: – Backend modulaire GenRL – Surface de configuration élargie – Image Docker prédéfinie pour un déploiement facile – Environnement de gymnastique de raisonnement pour améliorer les capacités de raisonnement du modèle – Nouvel essaim multi-tâches
5/ Maintenant en ligne sur le testnet Gensyn. Vous pouvez exécuter RL-Swarm avec GenRL dès aujourd’hui. Code complet + configuration :
52,24K