Предсказание порядка предстоящих токенов улучшает языковое моделирование
10,3K