Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
Presentazione del nuovo backend di RL Swarm: GenRL.
Una libreria modulare di apprendimento per rinforzo creata per un addestramento distribuito e tollerante ai guasti, che ora alimenta RL Swarm da zero. 🧵
2/
Ogni worker esegue la propria istanza dell'ambiente, contribuisce in modo asincrono a un buffer di rollout condiviso e aggiorna i pesi del modello in modo indipendente, quindi non è necessario alcun controller centrale.
3/
GenRL consente a RL Swarm di funzionare con qualsiasi ambiente, descritto in modo intuitivo attraverso il codice.
Questo lancio incorpora Reasoning Gym pronto all'uso, che dà accesso a >100 ambienti creati dalla community senza necessità di ulteriori configurazioni.
4/
Cosa c'è di nuovo:
– Backend GenRL modulare
– Superficie di configurazione ampliata
– Immagine Docker preconfigurata per una facile implementazione
– Ambiente Reasoning Gym per migliorare le capacità di ragionamento del modello
– Nuovo sciame multi-task
5/
Ora in diretta sulla testnet Gensyn.
È possibile eseguire RL-Swarm con GenRL oggi stesso.
Codice completo + configurazione:
52,23K
Principali
Ranking
Preferiti