Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
Présentation du nouveau backend de RL Swarm : GenRL.
Une bibliothèque modulaire d’apprentissage par renforcement conçue pour une formation distribuée et tolérante aux pannes, qui alimente désormais RL Swarm à partir de zéro. 🧵
2/
Chaque worker exécute sa propre instance d’environnement, contribue de manière asynchrone à une mémoire tampon de déploiement partagée et met à jour ses poids de modèle indépendamment, de sorte qu’aucun contrôleur central n’est requis.
3/
GenRL permet à RL Swarm de fonctionner avec n’importe quel environnement, décrit intuitivement par le code.
Ce lancement intègre Reasoning Gym prêt à l’emploi, donnant accès à > 100 environnements créés par la communauté sans configuration supplémentaire requise.
4/
Quoi de neuf:
– Backend modulaire GenRL
– Surface de configuration élargie
– Image Docker prédéfinie pour un déploiement facile
– Environnement de gymnastique de raisonnement pour améliorer les capacités de raisonnement du modèle
– Nouvel essaim multi-tâches
5/
Maintenant en ligne sur le testnet Gensyn.
Vous pouvez exécuter RL-Swarm avec GenRL dès aujourd’hui.
Code complet + configuration :
52,24K
Meilleurs
Classement
Favoris