ИИ для клиентской поддержки: плейбук практика (2026) – A&M Flow
Гид оператора по запуску ИИ-поддержки в 2026. Выбор модели, реальность вендоров, дизайн инструментов и eval-набор, который все откладывают до первого укуса.
Опубликовано: 2026-05-05 · Автор: A&M Flow
Модель – самое дешёвое из ваших решений. Боты поддержки умирают на третьем месяце из-за пропущенного eval-набора, refund-инструмента без потолка и мультиязычного запуска, который сочли проблемой модели.
Большинство ИИ-ботов поддержки, которых отключают на третьем месяце, были обречены на первой неделе, когда кто-то выбрал векторную базу до того, как написал пятьдесят репрезентативных тестовых диалогов.
Большинство операторов сделали неверный вывод. Не то, что LLM не справляются с саппортом. А то, что resolution rate – тщеславная метрика в тот момент, когда у клиента выбор между авто-закрытием и эскалацией с мучениями. Если вы меряете только первую колонку, вы получаете систему, оптимизированную под закрытие тикетов, а не под решение проблем. Цифра Klarna была настоящей. То, что она измеряла, не было тем, что думал совет директоров.
Intercom Fin хороший. Хороший в узком смысле: B2B SaaS с чистым help-центром, простым SKU и планкой CSAT, терпящей редкие пожимания плечами. Цена за решённый диалог выглядит разумной, пока вы не наложите её на свой реальный микс тикетов и не поймёте, что платите премию за лёгкие, которые бот и так выигрывал. Для потребительских брендов с грязным каталогом, мультиязычными возвратами или чем-то регулируемым Fin – инструмент не той формы. Zendesk AI agents примерно в той же корзине, с дополнительной болью в виде брака с моделью данных Zendesk.
Стройте только тогда, когда коробочный путь заставляет вас гнуть бизнес под свои ограничения. Честная середина для большинства команд, с которыми я общаюсь, – тонкий собственный оркестратор поверх управляемой модели и управляемого векторного хранилища, разговаривающий с вашим хелпдеском через его API. Вы пишете тысячи четыре строк кода. Владеете тем, что важно: определениями инструментов, eval-харнесом и маршрутизацией эскалаций. Арендуете то, что не важно: веса модели и хранилище.
Бот, который доезжает до прода, отличается от бота, который выживает встречу с реальным трафиком, той самой работой, которую никто не пишет в коммерческое предложение. Модели среди этой работы нет.
Сдвиг возможностей, который имеет значение в 2026, – это tool calling, меняющий состояние. Бот не отвечает на вопросы, он выдаёт возвраты, меняет адреса и ставит подписки на паузу. Здесь живут деньги и здесь же живут иски. Правильный дизайн – три уровня, неправильный – одна большая корзина под названием «права ассистента».
Если у вашего refund-инструмента нет потолка на один вызов и дневного агрегатного потолка, у вас нет refund-инструмента, у вас инцидент, ждущий своего треда на Hacker News. Потолок не потому, что модель глупая. Он потому, что упорный клиент с работающим браузером и желанием повторять найдёт формулировку, которая обойдёт ваши guardrails. Потолок – это то, что ограничит радиус взрыва когда это случится.
Я постоянно вижу команды, которые относятся к мультиязыку как к проблеме модели. Это не она. Sonnet 4.5 и GPT-5 оба говорят на двадцати с лишним языках достаточно хорошо, чтобы обмануть случайного слушателя. Проблема в том, что ваши help-статьи существуют на английском, ваша политика возвратов существует на английском с наполовину переведённой немецкой версией 2022 года, а польская команда эскалаций использует другую схему тикетов, чем испанская. Бот говорит на языке свободно и уверенно даёт неправильные ответы, потому что лежащие в основе знания неправильны или отсутствуют.
Запускайтесь на двух языках. Добейтесь примерно равных CSAT, частоты эскалаций и оспоренных возвратов на обоих. Только тогда добавляйте третий. Команды, запускающие сразу семь, выбирают тот же скриншот дашборда, что выбрала Klarna.
Разделы статьи
- Почему громкая цифра никогда не была сутью
- Выбирайте модель последней, а не первой
- Intercom Fin, Zendesk AI и ловушка build vs buy
- Ретрив, инструменты и eval-набор, который вы откладываете
- Что вы реально разрешаете боту делать
- Мультиязычный саппорт это в основном проблема знаний
- Что мы реально отгрузили бы за двенадцать недель
Ключевые тезисы
- Если нужна вторая пара глаз
Ключевые цитаты
Бот настолько умён, насколько хуже всех переведён абзац в вашей базе знаний. Почините этот абзац до того как менять модель.