NVIDIA Nemotron 3 NanoがOpenRouterで公開されました! これは、特殊なエージェントAIシステム向けに作られた小さなMoE推論モデルです。 Nemotronファミリーの他の作品と同様に、Nano 3は以下に完全にオープンです: - オープンウェイト、オープンデータ、オープンレシピ - カスタマイズと最適化を目的に設計
@nvidia モデルに関する興味深い事実: - 最高トークン生成を可能にするハイブリッドトランスフォーマーとマンバアーキテクチャを用いたMixture of Experts(MoE) - 予測可能な推論コストの過剰思考を避けるための「思考予算」 - 30B MoEと3Bアクティブパラメータ、256k コンテキスト
いくつかのユースケースの例: - 金融:書類の抽出、所得分析、不正の発見 - サイバーセキュリティ:脆弱性のトリアージ、マルウェアの分析、脅威のハンティング - 開発者:コードの要約、リファクタ化、推論 - 小売:リアルタイムでパーソナライズされた推薦とサポート
45