Новая полезная функция производительности: Сортировка по разделам Создайте производственный уровень для приоритизации быстрых LLM, без задержек.
Вы можете установить `preferred_min_throughput` и `preferred_max_latency`. Как и прежде, вы также можете установить предел затрат.
70