Der Grund, warum jedes Modell schlecht im Multimodal ist, liegt darin, dass buchstäblich niemand außer @vikhyatk es überhaupt versucht. Es gibt wahrscheinlich noch viele einfache Gewinne auf dem CUA-Weg zu finden.
Tzafon
Tzafon27. Feb., 03:20
Wir haben dem Modell farbige Quadrate für ein paar Stunden gezeigt. Es hat gelernt, einen Computer besser zu nutzen als Modelle, die auf Tausenden von echten Screenshots trainiert wurden.
@ainativefirm @vikhyatk vor dem Prometheus hat @sherjilozair auch hervorragende CUA-Arbeit geleistet, die nicht annähernd genug Aufmerksamkeit erhielt.
@ainativefirm @vikhyatk sowohl Anthropic als auch Perplexity haben korrekt erkannt, dass die nächste Welle der KI-Power, die über das Programmieren hinausgeht, die Finanzen betrifft.
128