ИИ для клиентской поддержки: плейбук практика (2026) – A&M Flow

Гид оператора по запуску ИИ-поддержки в 2026. Выбор модели, реальность вендоров, дизайн инструментов и eval-набор, который все откладывают до первого укуса.

Опубликовано: 2026-05-05 · Автор: A&M Flow

Модель – самое дешёвое из ваших решений. Боты поддержки умирают на третьем месяце из-за пропущенного eval-набора, refund-инструмента без потолка и мультиязычного запуска, который сочли проблемой модели.

Большинство ИИ-ботов поддержки, которых отключают на третьем месяце, были обречены на первой неделе, когда кто-то выбрал векторную базу до того, как написал пятьдесят репрезентативных тестовых диалогов.

Большинство операторов сделали неверный вывод. Не то, что LLM не справляются с саппортом. А то, что resolution rate – тщеславная метрика в тот момент, когда у клиента выбор между авто-закрытием и эскалацией с мучениями. Если вы меряете только первую колонку, вы получаете систему, оптимизированную под закрытие тикетов, а не под решение проблем. Цифра Klarna была настоящей. То, что она измеряла, не было тем, что думал совет директоров.

Intercom Fin хороший. Хороший в узком смысле: B2B SaaS с чистым help-центром, простым SKU и планкой CSAT, терпящей редкие пожимания плечами. Цена за решённый диалог выглядит разумной, пока вы не наложите её на свой реальный микс тикетов и не поймёте, что платите премию за лёгкие, которые бот и так выигрывал. Для потребительских брендов с грязным каталогом, мультиязычными возвратами или чем-то регулируемым Fin – инструмент не той формы. Zendesk AI agents примерно в той же корзине, с дополнительной болью в виде брака с моделью данных Zendesk.

Стройте только тогда, когда коробочный путь заставляет вас гнуть бизнес под свои ограничения. Честная середина для большинства команд, с которыми я общаюсь, – тонкий собственный оркестратор поверх управляемой модели и управляемого векторного хранилища, разговаривающий с вашим хелпдеском через его API. Вы пишете тысячи четыре строк кода. Владеете тем, что важно: определениями инструментов, eval-харнесом и маршрутизацией эскалаций. Арендуете то, что не важно: веса модели и хранилище.

Бот, который доезжает до прода, отличается от бота, который выживает встречу с реальным трафиком, той самой работой, которую никто не пишет в коммерческое предложение. Модели среди этой работы нет.

Сдвиг возможностей, который имеет значение в 2026, – это tool calling, меняющий состояние. Бот не отвечает на вопросы, он выдаёт возвраты, меняет адреса и ставит подписки на паузу. Здесь живут деньги и здесь же живут иски. Правильный дизайн – три уровня, неправильный – одна большая корзина под названием «права ассистента».

Если у вашего refund-инструмента нет потолка на один вызов и дневного агрегатного потолка, у вас нет refund-инструмента, у вас инцидент, ждущий своего треда на Hacker News. Потолок не потому, что модель глупая. Он потому, что упорный клиент с работающим браузером и желанием повторять найдёт формулировку, которая обойдёт ваши guardrails. Потолок – это то, что ограничит радиус взрыва когда это случится.

Я постоянно вижу команды, которые относятся к мультиязыку как к проблеме модели. Это не она. Sonnet 4.5 и GPT-5 оба говорят на двадцати с лишним языках достаточно хорошо, чтобы обмануть случайного слушателя. Проблема в том, что ваши help-статьи существуют на английском, ваша политика возвратов существует на английском с наполовину переведённой немецкой версией 2022 года, а польская команда эскалаций использует другую схему тикетов, чем испанская. Бот говорит на языке свободно и уверенно даёт неправильные ответы, потому что лежащие в основе знания неправильны или отсутствуют.

Запускайтесь на двух языках. Добейтесь примерно равных CSAT, частоты эскалаций и оспоренных возвратов на обоих. Только тогда добавляйте третий. Команды, запускающие сразу семь, выбирают тот же скриншот дашборда, что выбрала Klarna.

Разделы статьи

Ключевые тезисы

Ключевые цитаты

Бот настолько умён, насколько хуже всех переведён абзац в вашей базе знаний. Почините этот абзац до того как менять модель.