Тест qwen3.5:9b: Веб-серверы, прокси, балансировка — 98%
23.05.2026
Базовая модель:
qwen3.5:9b(сток, без дообучения). Полный прогон на GPU 3090.
Метод: где сток ломается — там реальная дыра. Под неё мы точечно готовим трейсы для нашей модели oni-main.
Что тестировали
nginx -t/reload, sites-enabled/conf.d, location/proxy-заголовки, upstream, разбор кодов 401/403/404/429/499/501/503, таймауты и worker_processes, apachectl, HAProxy, Caddy.
Результаты прогона
| Метрика | Значение |
|---|---|
| Прогнано кейсов | 1794 |
| Прошло (ok) | 1752 |
| Доля ok | 98% |
| Провалы по классам | api_error: 30, length: 2, degenerate_repeat: 10 |
Классы провалов: degenerate_repeat — модель зацикливается и повторяет одно и то же; api_error — обрыв или таймаут генерации; empty — пустой ответ; length — упёрлась в лимит длины.
Где сток спотыкается (примеры кейсов)
- Сделай изменение через
nginx -tс бэкапом или dry-run и подтверди результат. - Диагностируй отказ
nginx reloadиз-за отсутствующего файла конфигурации → найди источник → итог. - Собери финальный отчёт по upstream: состояние, конфиг, последняя ошибка, проверка результата.
- Сделай композит
caddy validate: найти конфиг → validate → apply/reload → post-check одной командой.
Что закрываем в oni-main
Под эти провалы готовим трейсы в едином формате: read-only диагностика → минимальный фикс только после подтверждения → пост-проверка одной командой. Цель — убрать зацикливания и обрывы именно на краевых кейсах домена «Веб-серверы, прокси, балансировка» и подтянуть оставшиеся 2% к стабильному поведению.
Это часть серии: один разбор на каждый домен. Прогон от 2026-05-23, всего 24 412 кейсов по 21 домену, сток — 98% ok.
