トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/
RL Swarm の新しいバックエンドである GenRL をご紹介します。
分散型フォールトトレラントトレーニング用に構築されたモジュール式強化学習ライブラリ - RL Swarm をゼロから強化するようになりました。🧵
2/
各ワーカーは独自の環境インスタンスを実行し、共有ロールアウトバッファーに非同期的に貢献し、モデルの重みを個別に更新するため、中央コントローラーは必要ありません。
3/
GenRLを使用すると、RL Swarmは、コードで直感的に記述されたあらゆる環境で動作できます。
このリリースには、すぐに使用できる Reasoning Gym が組み込まれており、追加の構成を必要とせずに、コミュニティが作成した >100 の環境にアクセスできるようになります。
4/
新機能:
– モジュラー GenRL バックエンド
– 拡張された構成面
– 簡単にデプロイできる事前構築済みの Docker イメージ
– モデルの推論能力を強化するための推論ジム環境
–新しいマルチタスクスウォーム
5/
現在、Gensyn テストネットで稼働しています。
今すぐGenRLでRL-Swarmを実行できます。
完全なコード+セットアップ:
52.23K
トップ
ランキング
お気に入り