Hvem bestemmer om en AI-modell faktisk er bra?
@gensynai nettopp lansert Judge - det første AI-evalueringssystemet der du kan utfordre de AI-genererte resultatene offentlig 🔥
Tråd 🧵 👇
Judge er mer enn en eval, det er en primitiv for å løse uenigheter i den virkelige verden.
Fremtiden for tillit er transparente, verifiserbare AI-dommer.
Dommer demonstrerer live-løsning av tvister i den virkelige verden ved hjelp av forhåndsforpliktede AI-modeller
vi demonstrerer det i dag med et prediksjonsmarked over et progressivt avsløringsspill på Gensyn Testnet
i fremtiden vil menneskeheten stole på AI for å avgjøre tvister, kontrakter, markeder osv