我不明白为什么Meta会发布Llama 4的更新。即使是TorchTitan和TorchTune也放弃了尝试为它们添加支持,而这两个项目都是由Meta运营的。 他们一直在专注于DeepSeek架构。其实他们应该专注于Llama 5,并使用DeepSeek架构,哈哈。
22.76K