Последняя глава о суровой реальности эксплуатации: почему «Claude сегодня тупее» бывает правдой при замороженных весах, как экономить токены на уровне API, и что делать, когда упёрся в лимит.
После запуска модели её веса заморожены: переобучать никто не будет, это миллионы долларов. Но веса — лишь нижний слой. Над ними девять слоёв инференса, и каждый может менять то, что ты получаешь. Ощущение «модель отупела» реально, но обычно неверно атрибутировано.
Постмортем Anthropic за сентябрь 2025: три бага уронили качество, до 16% запросов Sonnet в худший час. MoE-роутинг даёт ±8-14% разброса даже без изменений: один и тот же тест 77% в один день и 63% в другой.
Confirmation bias (твитнули «тупой» — замечаешь все ошибки), honeymoon-эффект, миф про «выходной Claude» (паттернов по дням недели не нашли). Шум ±8-14% не даёт отличить реальные 5% от случайности.

Частая причина «Claude отупел» внутри сессии — загрязнение контекста: ранние ошибки копятся, модель видит их и тиражирует. Лечится одной командой: /compact или свежая сессия. На проде — пинь снапшот модели вместо плавающего алиаса, держи дневной канари-набор и фоллбэк-провайдера.
Четыре фичи уровня API (GA с февраля 2026) бьют по разным узким местам. Начинай с самого большого.
| Фича | Проблема | Эффект |
|---|---|---|
| Programmatic Tool Calling | многошаговые петли жгут токены на round-trip'ах | ~37% меньше токенов |
| Dynamic Filtering | веб-результаты раздувают контекст мусором | ~24% меньше входных |
| Tool Search | много определений инструментов раздувают контекст | ~85% меньше |
| Tool Use Examples | схема не выражает паттерны использования | точность 72% → 90% |
Tool Search встроен как MCPSearch auto с v2.1.7: когда описания MCP-инструментов превышают порог контекста, они откладываются и ищутся по требованию (мы видели это в Главе 04). Настройка — ENABLE_TOOL_SEARCH=auto:N. PTC и Dynamic Filtering — для тех, кто строит агентов на Agent SDK.
На подписке (Pro, Max) лимиты сбрасываются скользящим окном раз в 5 часов. Три команды помогают жить с этим.
| Команда | Что делает |
|---|---|
| /usage | Показать лимиты плана и статус. Сброс каждые 5 часов. |
| /extra-usage | Pay-as-you-go перелив: упёрся в лимит — работа продолжается, токены сверху по обычным API-ценам. Лимит редемпшна $2000/день. |
| /cost | Траты текущей сессии (для API-ключей). |
/fast (быстрый Opus из Главы 09) всегда биллится в extra-usage с первого токена, даже если на подписке ещё есть лимит. То есть для fast mode нужен включённый и пополненный extra-usage. Для API-ключей бюджет режут флаги --max-budget-usd и --max-turns.
Шестнадцать глав пройдены: от харнесса и трёх примитивов до оркестрации, мощных режимов, практики мастеров и внутренностей. Дальше — практика. Возьми одну привычку Бориса, один воркфлоу, один скилл и доведи до автоматизма. Вернуться к оглавлению →