Большинство «AI-ботов» на сайтах — это обёртка над GPT с одним системным промптом. Клиент задаёт вопрос, получает ответ, закрывает окно. Через день возвращается — бот его не помнит. Контекст потерян, квалификация не произошла, менеджер ничего не узнал. Деньги на токены потрачены, лид не конвертирован.

Проблема не в модели, а в архитектуре. Чат-бот без памяти, без связи с CRM и без стратегии — это расход, а не инструмент. Разберём, как выглядит AI-ассистент, который реально работает на воронку.

Чем ассистент с памятью отличается от чат-бота

Обычный бот получает сообщение, генерирует ответ, забывает. Каждый диалог — с нуля. Ассистент с памятью работает иначе: он хранит историю сессий, знает, на каком этапе воронки находится клиент, и адаптирует поведение.

Практически это означает три вещи. Во-первых, повторный визит — не холодный контакт. Ассистент помнит, что клиент интересовался CRM-интеграцией две недели назад, и продолжает с того места. Во-вторых, каждое сообщение попадает в CRM: менеджер видит не просто «лид из чата», а конкретную историю с квалификацией. В-третьих, ассистент сам понимает, когда передать диалог человеку — по стадии воронки и скорингу.

Как это устроено технически

Минимальная архитектура AI-ассистента для B2B: три стадии диалога, lead scoring и связка с CRM.

  • Стадия 1 — знакомство. Ассистент выясняет, с чем пришёл клиент. Короткие ответы, один вопрос за раз. Никаких прайс-листов и перечисления услуг. Задача — понять задачу.
  • Стадия 2 — квалификация. Если клиент рассказывает о бизнесе, болях, текущих системах — ассистент углубляется. Задаёт уточняющие вопросы, даёт полезные наблюдения. Тут уже начинает работать scoring: корпоративный email, упоминание конкретных CRM, роль в компании — каждый сигнал добавляет баллы.
  • Стадия 3 — передача. Когда score достаточный, ассистент резюмирует задачу и предлагает звонок с архитектором. Не давит — предлагает. Если клиент не готов — даёт Telegram.

Lead scoring считается на каждом сообщении. Спам и мусор отсекаются дешёвой моделью на ранних стадиях. Горячие лиды получают более мощную модель и больше токенов. Это не теория — это конкретная экономия: стоимость лида через AI-чат в 1000 раз ниже, чем через контекстную рекламу.

Что это даёт бизнесу

Три измеримых результата. Первый — конверсия из посетителя в квалифицированный лид растёт, потому что ассистент работает 24/7 и не пропускает ни одного обращения. Второй — менеджер получает не «имя + телефон», а готовую карточку: задача, боли, стек, размер команды. Третий — расходы на лидогенерацию падают на порядок, потому что AI-токены стоят копейки по сравнению с кликами в Директе.

При этом AI-ассистент — не замена менеджеру. Это фильтр и квалификатор. Он отсекает спам, прогревает холодных, а горячих передаёт живому человеку с полным контекстом. Менеджер тратит время на тех, кто уже готов обсуждать проект, а не на «просто спросить».

С чего начать

Не нужно строить всю систему сразу. Минимальный работающий контур: AI-ассистент на сайте + три стадии промптов + lead scoring + уведомления в Telegram при горячем лиде. Это внедряется за дни, не месяцы. Дальше — подключение CRM, аналитика, A/B-тесты промптов, автоматические follow-up.

Ключевой принцип: ассистент должен быть частью системы, а не отдельной игрушкой. Без связи с CRM и воронкой — это просто дорогой FAQ-бот. С правильной архитектурой — это инструмент, который окупается с первого дня.