ИИ «съел контекст»: почему чат внезапно забывает договорённости и как я перестал это терпеть
На прошлой неделе у меня случилась классическая боль, с которой (судя по разговорам в чатах) сталкиваются почти все, кто использует ИИ не «поиграться», а для работы.
Сценарий был простой: я несколько часов общался с моделью над задачей — договорились о стиле ответов, о терминах, о структуре, даже выстроили небольшую «систему» (как будем называть сущности, какие ограничения соблюдать, в каком формате отдавать результат). И в какой-то момент всё поехало.
Модель начала:
- путать термины, которые мы уже закрепили;
- отвечать «как обычно», игнорируя мой формат;
- предлагать решения, которые противоречат тому, что мы уже приняли ранее;
- задавать вопросы, на которые мы уже отвечали.
Ощущение было такое, будто я разговариваю с человеком, который вышел на минуту за кофе — и вернулся вообще в другой разговор.
Разберёмся, что это было и что реально помогает.
В чём проблема на самом деле
Эта штука обычно выглядит как «ИИ тупит» или «стал хуже». Но в большинстве случаев причина банальнее:
- контекст переполнился (или модель решила, что часть старых сообщений менее важна);
- в диалоге накопилось слишком много «шума» (обсуждения, варианты, промежуточные версии);
- ключевые правила остались «где-то там в начале», а модель ориентируется на последние куски;
- вы сами (как и я) постепенно начинаете писать менее строго: «ну ты понял», «как раньше», «по той же схеме».
И в итоге модель начинает угадывать, что вы хотите, по последним репликам — а не по вашим договорённостям.
Мой симптом, по которому я теперь сразу понимаю: «контекст поплыл»
Самый яркий маркер: модель уверенно продолжает в неправильном формате.
Например, вы 20 сообщений подряд просили «кратко и по пунктам», а она внезапно выдаёт полотно на 40 строк, да ещё и с советами «в целом можно…», «обычно лучше…».
Если вы ловили это ощущение «мы же только что договорились!» — это оно.
Решение, которое сработало лучше всего: «якорь контекста»
Я перестал пытаться «воспитывать» чат по ходу. Вместо этого я делаю короткий технический приём — перезакрепляю правила и факты в одном сообщении, как будто начинаю мини-сессию заново, но без потери прогресса.
Я называю это «якорь контекста». Он занимает 10–20 строк и резко повышает стабильность ответов.
Вот шаблон, который я теперь копирую и вставляю, когда чувствую дрейф:
- Цель: что именно делаем (1–2 предложения).
- Контекст: 3–7 фактов, которые нельзя забывать (термины, ограничения, важные решения).
- Формат ответа: как именно отвечать (структура, объём, язык, стиль).
- Запрещено: что точно не делать (например: «не предлагай альтернативный стек», «не меняй терминологию»).
- Текущий шаг: что нужно сделать прямо сейчас.
Пример (упрощённый):
Цель: подготовить текст для публикации в блоге. Контекст: пишу от первого лица; аудитория — новички+практики; без канцелярита; приводим 2–3 практических приёма. Формат: заголовки, списки, короткие абзацы; без “воды”; итог — чек-лист. Запрещено: не уходить в академические определения; не добавлять выдуманные факты/цифры. Текущий шаг: предложи 5 вариантов заголовка и план статьи.
Ключевой момент: я не прошу модель “вспомнить”. Я просто даю ей то, что должно быть в памяти, здесь и сейчас.
Что ещё помогло (в порядке эффективности)
- Жёстко сокращать “шум”: если мы перебрали 6 вариантов — я сам выбираю один и фиксирую: «Ок, берём вариант №3. Остальные не рассматриваем». Модели легче быть стабильной, когда ветки закрыты.
- Делать “контекстный ресет”: если диалог совсем разросся, я открываю новый чат и переношу только якорь + итог прошлого прогресса (3–10 пунктов). Парадоксально, но так часто получается быстрее.
- Ставить явные критерии качества: «если нет уверенности — задай 1 уточняющий вопрос», «если данных нет — скажи “не знаю” и предложи, где взять». Это снижает галлюцинации на длинных сессиях.
- Фиксировать словарь: особенно если в теме много сущностей. Список “термин → значение” на 5–15 строк творит магию.
Мини-чек-лист: что делать, когда ИИ “забывает” разговор
- Остановиться и не продолжать «на эмоциях» в том же потоке.
- Вставить якорь контекста (цель, факты, формат, запреты, текущий шаг).
- Закрыть ветки: выбрать один вариант и зафиксировать.
- Если снова поплыло — новый чат + перенос якоря и итогов.
Вывод
Я долго воспринимал это как «качели качества» и пытался уговорить модель «будь внимательнее». На практике работает другое: относиться к чату как к рабочей памяти, которую нужно структурировать и перезаписывать, когда она начинает расплываться.
С тех пор продуктивность выросла заметно: меньше повторов, меньше “мы же уже это обсуждали”, меньше случайных разворотов не туда.
Если хотите — напишите, для каких задач вы чаще всего используете ИИ (код, тексты, аналитика, обучение, поддержка), и я адаптирую “якорь контекста” под ваш типичный сценарий: чтобы его можно было просто вставлять и ехать дальше.