На прошлой неделе у меня случилась классическая боль, с которой (судя по разговорам в чатах) сталкиваются почти все, кто использует ИИ не «поиграться», а для работы.
Сценарий был простой: я несколько часов общался с моделью над задачей — договорились о стиле ответов, о терминах, о структуре, даже выстроили небольшую «систему» (как будем называть сущности, какие ограничения соблюдать, в каком формате отдавать результат). И в какой-то момент всё поехало.
Модель начала:
путать термины, которые мы уже закрепили;
отвечать «как обычно», игнорируя мой формат;
предлагать решения, которые противоречат тому, что мы уже приняли ранее;
задавать вопросы, на которые
мы уже отвечали
Ощущение было такое, будто я разговариваю с человеком, который вышел на минуту за кофе — и вернулся вообще в другой разговор.
Разберёмся, что это было и что реально помогает.
В чём проблема на самом деле
Эта штука обычно выглядит как «ИИ тупит» или «стал хуже». Но в большинстве случаев причина банальнее:
контекст переполнился
(или модель решила, что часть старых сообщений менее важна);
в диалоге накопилось слишком много «шума» (обсуждения, варианты, промежуточные версии);
ключевые правила остались «где-то там в начале», а модель ориентируется на последние куски;
вы сами (как и я) постепенно начинаете писать менее строго: «ну ты понял», «как раньше», «по той же схеме».
И в итоге модель начинает угадывать, что вы хотите, по последним репликам — а не по вашим договорённостям.
Мой симптом, по которому я теперь сразу понимаю: «контекст поплыл»
Самый яркий маркер:
модель уверенно продолжает в неправильном формате
Например, вы 20 сообщений подряд просили «кратко и по пунктам», а она внезапно выдаёт полотно на 40 строк, да ещё и с советами «в целом можно…», «обычно лучше…».
Если вы ловили это ощущение «мы же только что договорились!» — это оно.
Решение, которое сработало лучше всего: «якорь контекста»
Я перестал пытаться «воспитывать» чат по ходу. Вместо этого я делаю короткий технический приём —
перезакрепляю
правила и факты в одном сообщении, как будто начинаю мини-сессию заново, но без потери прогресса.
Я называю это «якорь контекста». Он занимает 10–20 строк и резко повышает стабильность ответов.
Вот шаблон, который я теперь копирую и вставляю, когда чувствую дрейф:
Цель
: что именно делаем (1–2 предложения).
Контекст
: 3–7 фактов, которые нельзя забывать (термины, ограничения, важные решения).
Формат ответа
: как именно отвечать (структура, объём, язык, стиль).
Запрещено
: что точно не делать (например: «не предлагай альтернативный стек», «не меняй терминологию»).
Текущий шаг
: что нужно сделать прямо сейчас.
Пример (упрощённый):
Цель:
подготовить текст для публикации в блоге.
Контекст:
пишу от первого лица; аудитория — новички+практики; без канцелярита; приводим 2–3 практических приёма.
Формат:
заголовки, списки, короткие абзацы; без “воды”; итог — чек-лист.
Запрещено:
не уходить в академические определения; не добавлять выдуманные факты/цифры.
Текущий шаг:
предложи 5 вариантов заголовка и план статьи.
Ключевой момент: я
не прошу модель “вспомнить”
. Я просто
даю ей то, что должно быть в памяти
, здесь и сейчас.
Что ещё помогло (в порядке эффективности)
Жёстко сокращать “шум”
: если мы перебрали 6 вариантов — я сам выбираю один и фиксирую: «Ок, берём вариант №3. Остальные не рассматриваем». Модели легче быть стабильной, когда ветки закрыты.
Делать “контекстный ресет”
: если диалог совсем разросся, я открываю новый чат и переношу только якорь + итог прошлого прогресса (3–10 пунктов). Парадоксально, но так часто получается быстрее.
Ставить явные критерии качества
: «если нет уверенности — задай 1 уточняющий вопрос», «если данных нет — скажи “не знаю” и предложи, где взять». Это снижает галлюцинации на длинных сессиях.
Фиксировать словарь
: особенно если в теме много сущностей. Список “термин → значение” на 5–15 строк творит магию.
Мини-чек-лист: что делать, когда ИИ “забывает” разговор
Остановиться
и не продолжать «на эмоциях» в том же потоке.
Вставить якорь контекста
(цель, факты, формат, запреты, текущий шаг).
Закрыть ветки
: выбрать один вариант и зафиксировать.
Если снова поплыло —
новый чат
+ перенос якоря и итогов.
Вывод
Я долго воспринимал это как «качели качества» и пытался уговорить модель «будь внимательнее». На практике работает другое: относиться к чату как к рабочей памяти, которую нужно
структурировать и перезаписывать
, когда она начинает расплываться.
С тех пор продуктивность выросла заметно: меньше повторов, меньше “мы же уже это обсуждали”, меньше случайных разворотов не туда.
Если хотите — напишите, для каких задач вы чаще всего используете ИИ (код, тексты, аналитика, обучение, поддержка), и я адаптирую “якорь контекста” под ваш типичный сценарий: чтобы его можно было просто вставлять и ехать дальше.