DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

1/ Présentation du nouveau backend de RL Swarm : GenRL. Une bibliothèque modulaire d’apprentissage par renforcement conçue pour une formation distribuée et tolérante aux pannes, qui alimente désormais RL Swarm à partir de zéro. 🧵

2/ Chaque worker exécute sa propre instance d’environnement, contribue de manière asynchrone à une mémoire tampon de déploiement partagée et met à jour ses poids de modèle indépendamment, de sorte qu’aucun contrôleur central n’est requis.

3/ GenRL permet à RL Swarm de fonctionner avec n’importe quel environnement, décrit intuitivement par le code. Ce lancement intègre Reasoning Gym prêt à l’emploi, donnant accès à > 100 environnements créés par la communauté sans configuration supplémentaire requise.

4/ Quoi de neuf: – Backend modulaire GenRL – Surface de configuration élargie – Image Docker prédéfinie pour un déploiement facile – Environnement de gymnastique de raisonnement pour améliorer les capacités de raisonnement du modèle – Nouvel essaim multi-tâches

5/ Maintenant en ligne sur le testnet Gensyn. Vous pouvez exécuter RL-Swarm avec GenRL dès aujourd’hui. Code complet + configuration :

52,24K

Meilleurs

Classement

Favoris