Microsoft presenterer rStar2-Agent
Teknisk rapport for agentisk resonnement
rStar2-Agent øker en forhåndstrent 14B-modell til toppmoderne i bare 510 RL-trinn i løpet av en uke, og oppnår gjennomsnittlig pass@1 score på 80,6 % på AIME24 og 69,8 % på AIME25, og overgår DeepSeek-R1 (671B) med betydelig kortere svar