1/ Presentazione del nuovo backend di RL Swarm: GenRL. Una libreria modulare di apprendimento per rinforzo creata per un addestramento distribuito e tollerante ai guasti, che ora alimenta RL Swarm da zero. 🧵
2/ Ogni worker esegue la propria istanza dell'ambiente, contribuisce in modo asincrono a un buffer di rollout condiviso e aggiorna i pesi del modello in modo indipendente, quindi non è necessario alcun controller centrale.
3/ GenRL consente a RL Swarm di funzionare con qualsiasi ambiente, descritto in modo intuitivo attraverso il codice. Questo lancio incorpora Reasoning Gym pronto all'uso, che dà accesso a >100 ambienti creati dalla community senza necessità di ulteriori configurazioni.
4/ Cosa c'è di nuovo: – Backend GenRL modulare – Superficie di configurazione ampliata – Immagine Docker preconfigurata per una facile implementazione – Ambiente Reasoning Gym per migliorare le capacità di ragionamento del modello – Nuovo sciame multi-task
5/ Ora in diretta sulla testnet Gensyn. È possibile eseguire RL-Swarm con GenRL oggi stesso. Codice completo + configurazione:
52,23K