Тест qwen3.5:9b: Процессы, ресурсы, производительность — 98%

Базовая модель: qwen3.5:9b (сток, без дообучения). Полный прогон на GPU 3090.
Метод: где сток ломается — там реальная дыра. Под неё мы точечно готовим трейсы для нашей модели oni-main.

Что тестировали

pidstat/iostat/mpstat/sar, состояния процессов (R/S/D/Z), зомби и сироты, lsof/fuser, page cache, cgroups v2, prlimit.

Результаты прогона

Метрика	Значение
Прогнано кейсов	1243
Прошло (ok)	1217
Доля ok	98%
Провалы по классам	degenerate_repeat: 13, length: 2, api_error: 11

Классы провалов: degenerate_repeat — модель зацикливается и повторяет одно и то же; api_error — обрыв или таймаут генерации; empty — пустой ответ; length — упёрлась в лимит длины.

Где сток спотыкается (примеры кейсов)

Покажи pidstat CPU для процесса за 5 секунд.
Покажи iostat -xz и найди диск с максимальным await.
Собери финальный отчёт по zombie-процессам: состояние, конфиг, последняя ошибка, проверка.
Диагностируй деградацию через ltrace по метрикам и логам → минимальный фикс → пост-проверка.

Что закрываем в oni-main

Под эти провалы готовим трейсы в едином формате: read-only диагностика → минимальный фикс только после подтверждения → пост-проверка одной командой. Цель — убрать зацикливания и обрывы именно на краевых кейсах домена «Процессы, ресурсы, производительность» и подтянуть оставшиеся 2% к стабильному поведению.

Это часть серии: один разбор на каждый домен. Прогон от 2026-05-23, всего 24 412 кейсов по 21 домену, сток — 98% ok.