A Nous Research acaba de lançar o Hermes 4, uma nova fronteira em modelos de IA de peso aberto.
É um "modelo de raciocínio" híbrido que alterna entre respostas rápidas e pensamento profundo usando uma simples tag <think>.
Com 50x mais dados de treinamento do que seu predecessor e um viés anti-sycophancy embutido, o Hermes 4 é direto, direcionável e criativamente alinhado com os usuários—não com a ética corporativa.
Não tenho certeza do porquê de a meta lançar uma atualização para o llama 4. Até o torchtitan e o torchtune abandonaram a tentativa de adicionar suporte para eles, que são ambos geridos pela meta.
Eles têm se concentrado na arquitetura deepseek em vez disso. Eles deveriam apenas focar no llama 5 e usar a arquitetura deepseek lol.