我不明白為什麼Meta會發布Llama 4的更新。即使是TorchTitan和TorchTune也放棄了嘗試為它們添加支持,而這兩個項目都是由Meta運營的。 他們一直在專注於DeepSeek架構。其實他們應該專注於Llama 5,並使用DeepSeek架構,哈哈。
22.76K