Embora os laboratórios tenham estado a usar RL há algum tempo, a maioria das empresas ainda está apenas a usar pesos de modelos prontos a usar. O grande desbloqueio para a IA empresarial será ambientes de RL em empresas que aprendem e codificam o seu segredo. As empresas são valiosas por uma razão -- têm dados de uso únicos, um relacionamento com os clientes e, muitas vezes, conhecimento institucional e processos. Se grandes empresas não aproveitarem esta vantagem, nivelam o campo de jogo para os concorrentes. Esta semana no HITL, Mark, Sam e eu falámos sobre RLVR e outras notícias de IA, incluindo o investimento da Meta na Scale.
Desmarcar:
592