USO Vereinheitlichte Stil- und subjektgetriebene Generierung durch entkoppelte und belohnungsbasierte Lernmethoden