Как устроена система Botseller: 7 технологических рвов

“Вы же просто GPT подключили и всё?” Слышу это каждую неделю. Нет. GPT выполняет примерно 10% работы. Остальные 90% - это скрытая инфраструктура, обеспечивающая точность, скорость и продажи: RAG pipeline, мульти-нодная обработка шестью моделями, встроенная CRM, маршрутизация и кеширование.
Я Дмитрий Дьяконов, CEO Botseller AI. Три года на рынке AI-ботов, 100+ внедрений в реальный бизнес, 500 000+ обработанных диалогов с клиентами. Сегодня открываю капот и показываю движок. Без маркетинговых обёрток и абстрактных схем - чистая инженерия и реальная архитектура.
Почему одна модель не работает для бизнеса?
Проведём мысленный эксперимент. Возьмите голый API ChatGPT. Подключите к Telegram. Напишите “сколько стоит профнастил С8?”. GPT ответит что-то вроде “средняя цена профнастила на рынке составляет 300-500 рублей за лист”. Это классическая галлюцинация. У вашего клиента конкретный прайс, конкретные остатки, конкретные цены. GPT о них не знает.

Одна модель не может одновременно: определить язык сообщения, классифицировать интент (покупка, жалоба, вопрос), найти данные в базе знаний клиента, сгенерировать ответ с правильными ценами, проверить себя на галлюцинации и сохранить данные в CRM. Для каждой из этих задач нужна своя отдельная нода, оптимизированная под конкретную функцию.
Аналогия: Tesla - это не электромотор. Мотор - это 10%. Остальное: батарея, BMS, автопилот, навигация, климат, OTA-обновления. GPT - это мотор. Botseller - это машина. Вы не купите мотор отдельно и не поедете на нём на работу. Точно так же вы не подключите голый GPT API и не получите продавца, который закрывает сделки.
Что происходит когда клиент пишет сообщение боту?
Одно входящее сообщение проходит через 6 специализированных нейросетевых узлов. Каждая нода использует свою модель, оптимизированную под задачу.

Нода 1: Язык. Лёгкая дешёвая модель определяет RU/EN/другой за миллисекунды. Это стоит доли копейки.
Нода 2: Интент. Классификация: покупка, вопрос о цене, жалоба, спам. От интента зависит весь дальнейший маршрут. Спам отсекается сразу, жалоба маршрутизируется менеджеру, вопрос о цене идёт в RAG.
Нода 3: RAG Retrieval. Поиск по базе знаний клиента - прайсам, каталогам, FAQ. Находит 3-5 релевантных фрагментов за 0.15 секунды. Подробнее про RAG - ниже.
Нода 4: Генерация. Тяжёлая LLM формирует ответ с контекстом из RAG. Это единственная нода, где работает “GPT” (или Claude, или Gemini - зависит от уровня модели).
Нода 5: Guardrails. Специализированная проверка: нет ли галлюцинаций, не вышел ли бот за рамки роли, корректны ли цены. Если что-то не так - ответ переписывается.
Нода 6: CRM Update. Извлечение сущностей: имя, телефон, бюджет, потребность. Сохранение в CRM с lead scoring (горячий/тёплый/холодный).
Именно поэтому невозможно сказать “ваш бот работает на GPT-5”. GPT-5 обрабатывает одну из шести нод. Остальные пять - другие модели, каждая заточенная под свою задачу. Это принципиально отличает Botseller от конкурентов, которые действительно просто подключают один API и называют это “AI-ботом”. У нас архитектура другого уровня: каждая нода независимо обновляется, масштабируется и оптимизируется.
Как RAG гарантирует точность ответов вместо галлюцинаций?
RAG (Retrieval-Augmented Generation) - технология, которая заставляет бота отвечать по вашим данным, а не выдумывать.

Пять этапов. Клиент загружает прайс-лист или каталог. Система разбивает документ на фрагменты по 256-512 токенов с перекрытием 10-20% (chunking). Каждый фрагмент превращается в числовой вектор - “отпечаток смысла” (embedding). Когда клиент задаёт вопрос, система мгновенно находит 3-5 самых релевантных фрагментов (retrieval). Найденные фрагменты подаются в LLM вместе с вопросом - и бот формирует ответ на основе реальных данных.

Почему это важно: без RAG бот просто галлюцинирует. Он не знает ваших цен, не знает ваш ассортимент, не знает ваших условий доставки. С RAG бот оперирует исключительно вашими данными и никогда не выдумывает то, чего нет в базе знаний. Если информации нет - честно скажет “уточню у менеджера”.
Реальный пример. Магазин стройматериалов : 45 000 товаров в базе. Клиент спрашивает “есть ли профнастил С8 0.5мм оцинкованный”. Векторный поиск среди десятков тысяч позиций. Результат за 0.3 секунды: точное наличие и актуальная цена. Без RAG LLM попыталась бы угадать или выдумать среднюю цену по рынку.
Что стоит за моделями Low, Medium, High, Ultra?
Мы не показываем реальные названия моделей в интерфейсе. Вместо GPT-5, Claude Opus или Gemini Pro вы видите наши бренды: Low, Medium, High, Ultra. И вот почему.

Одно сообщение обрабатывается 5-6 нодами. Каждая нода может использовать свою модель. Нода определения языка - лёгкая и дешёвая. Нода генерации - мощная и дорогая. Невозможно написать “ваш бот на GPT-5”, когда GPT-5 работает в одной ноде из шести. Поэтому мы создали систему динамической маршрутизации.
Low - оптимизация цены. Быстрые модели для простых задач: FAQ, однотипные вопросы. Нет смысла платить 15$/MTok за ответ на вопрос “как проехать?”.
Medium - баланс цена/качество. Стандартные продажи, консультации, запись на услуги. Покрывает 80% бизнес-задач.
High - максимум качества. Сложные B2B переговоры, дорогие услуги, юридические консультации.
Ultra - все топовые модели одновременно (ансамбль). Claude Opus, GPT-5.4, Gemini 2.5 Pro работают параллельно. Для VIP-клиентов и задач, где ошибка недопустима. Ответы сравниваются и выбирается лучший. Это дорого, но для сделки на миллион рублей - абсолютно оправдано. Подробнее про выбор архитектуры - в отдельной статье.
Системная логика оптимизации: нет смысла платить 15$/MTok за ответ на вопрос “как проехать?”. Low-модель справится за доли копейки. А вот сложные B2B-переговоры с возражениями требуют High или Ultra. Роутер определяет уровень сложности автоматически и направляет в нужную модель.
Botseller vs собрать самому на n8n: честное сравнение?
“Зачем мне ваш сервис, я сам настрою на n8n + OpenAI API”. Справедливый вопрос. Вот честный разбор - без маркетинговых передёргиваний.

Сетевые запросы. На n8n каждое сообщение = 1 дорогой вызов API. Botseller группирует запросы в batch, экономя на вызовах.
Кеширование. Типовые вопросы (“какие у вас цены?”, “как записаться?”) отвечаются из кеша без обращения к LLM. Стоимость: 0 руб. На n8n каждый вопрос = полный прогон через API.
Маршрутизация. Мульти-модельная: простой вопрос идёт в дешёвую модель, сложный - в дорогую. На n8n все вопросы проходят через одну модель (обычно самую дорогую).
Токенизация промптов. Наши промпты минимизированы на базе 500 000+ диалогов. Меньше токенов = дешевле ответ. На n8n - типовые избыточные шаблоны.
Инфраструктура. Сервер, бекапы, масштабирование, мониторинг - включено в цену. На n8n - самостоятельный DevOps и оплата хостинга.
Результат: для большинства бизнесов Botseller обходится выгоднее самостоятельной сборки. Опытный инженер с глубоким знанием batch-запросов и мульти-модельного роутинга может собрать сопоставимое решение дешевле по чистой стоимости токенов. Но таких инженеров единицы, и его время стоит денег.
Да, мы зарабатываем на разнице между стоимостью токенов и ценой для пользователя. Это честно. И именно эта маржа позволяет нам выстраивать экосистему: поддержка, обновления, новые модели, партнерская программа . Когда вы становитесь партнером, вы зарабатываете вместе с нами - пожизненная комиссия 5-80% с каждого приведённого клиента. Маржа на токенах превращается в мотивацию для всей партнерской сети.
Фиксированная цена за диалог - вы всегда знаете сколько платите. Если диалог выходит за стандартные рамки, включается экстра-режим: фактические токены без наценки. Мы зарабатываем на оптимизации - делаем процесс дешевле, чем вы сделаете сами. Это честная экономика: вы платите фиксированную цену за диалог, мы оптимизируем внутри. Если диалог выходит за стандартные рамки (очень длинный, десятки вложенных вопросов), включается экстра-режим: вы платите за фактические токены без наценки. Прозрачно.
Как защищены данные клиентов по 152-ФЗ?
С 2025-2026 года штрафы за нарушения 152-ФЗ выросли кратно (данные Роскомнадзор, 2025 ). Для бизнеса, использующего AI-ботов, это критичный вопрос: куда уходят персональные данные клиентов?
Наш подход. Персональные данные (имя, телефон, email) хранятся в CRM на российских серверах и никогда не передаются в LLM напрямую. В нейросеть уходит только обезличенный интент: классификация запроса, контекст из RAG (фрагменты прайса, FAQ) и история диалога без привязки к конкретному человеку. Entity extraction (нода 6) работает локально - извлечённые ПДн записываются в CRM, минуя внешние API.
При переключении на российские модели (YandexGPT, GigaChat) данные вообще не покидают российскую юрисдикцию. Это полное соответствие требованиям 152-ФЗ включая новые правила обезличивания (Приказ Роскомнадзора №140 от 19.06.2025). Методы обезличивания, которые мы используем: введение идентификаторов вместо реальных имён, декомпозиция данных и изменение семантики запроса перед отправкой в LLM. Для бизнесов, работающих с медицинскими, финансовыми или юридическими данными, это не просто рекомендация, а обязательное требование закона. Мы закрываем его архитектурно, а не организационными мерами.
Российские модели: готовность к любому сценарию?
Текущая ситуация: зарубежные модели (GPT, Claude, Gemini) пока доступны в России. Но регуляторная среда меняется. Реестр отечественного ПО, возможные ограничения на трансграничную передачу данных. Мы готовы к любому сценарию.

Что поддерживаем: YandexGPT, GigaChat (Сбер), SaluteLLM. Переключение между стеком - в один клик в настройках. Никакой перенастройки бота: промпты, база знаний, CRM работают одинаково на любом стеке. Гибридный режим: российские модели для базовых задач, зарубежные для сложных (пока разрешено).
Наша позиция - технологическая устойчивость. Мы не зависим от одного провайдера. Если завтра GPT станет недоступен, бот продолжит работать на российских моделях без перерыва и без потери качества для 80% задач. Мы уже проходили через подобное с блокировками мессенджеров - написали об этом в статье про блокировку WhatsApp и Telegram . Тот же принцип: не зависеть от одного канала, не зависеть от одного провайдера. Диверсификация - основа устойчивого бизнеса.
Почему мы сделали свою CRM вместо интеграции с amoCRM?
Бот без CRM - это продавец без памяти. Клиент написал вчера про профнастил, сегодня пишет “а что по доставке?” - бот должен помнить контекст.

Проблема внешних интеграций: amoCRM отвечает за 200-500ms на запрос (бот тормозит), webhook может не дойти (лид потерян), ограничения на произвольные поля. Наша CRM встроена в ядро. Entity extraction вычленяет имя, телефон, бюджет и потребность прямо во время диалога. Lead scoring автоматически квалифицирует лида. Доступ к истории - за наносекунды, без внешних API.
Для тех кто уже на amoCRM или Битрикс24 - параллельная отправка данных работает без влияния на скорость бота. Мы не заставляем отказываться от существующей CRM. Мы дополняем её AI-слоем, которого в ней нет: entity extraction в реальном времени, автоматический lead scoring и полный контекст диалога для менеджера.
Что мы делаем дальше: эксперименты и roadmap?
Каждое обновление делает систему точнее, быстрее и дешевле для клиента. Мы инженеры, одержимые эффективностью и качеством результата.

Dataset Mastery. Дообучение моделей на базе 500 000+ реальных диалогов. Это уникальный датасет продаж в переписке, которого нет ни у одной EdTech-платформы. Наши техники продаж основаны именно на этих данных.
RLP (Reinforcement Learning from Production). Автоматическое улучшение промптов на основе успешных продаж. Бот, который закрыл сделку, “запоминает” что сработало.
Custom Sales Model. Разработка собственной экспериментальной языковой модели, заточенной исключительно под продажи в переписке. Не универсальная LLM на все случаи жизни, а специализированный продажный движок, который знает как работать с возражениями, upsell и закрытием сделки лучше любого GPT. Мы постоянно экспериментируем, тестируем новые подходы и модели, потому что AI-рынок меняется каждый месяц.

Надёжность этого подхода подтверждается метриками: турфирма с 1 749 заявками/мес, магазин с 45 000 товаров в RAG, салон с 868 записями через WhatsApp. И этот блог: 48+ экспертных статей, написанных нашим собственным AI-пайплайном.

FAQ
На какой нейросети работает Botseller?
На нескольких одновременно. Одно сообщение обрабатывается 5-6 специализированными нодами, каждая из которых может использовать свою модель. Уровень Ultra включает ансамбль из топовых моделей (Claude Opus, GPT-5, Gemini Pro). Именно поэтому мы используем собственные бренды (Low/Medium/High/Ultra) вместо названий конкретных моделей.
Можно ли переключиться на российские модели?
Да, в один клик в настройках. Поддерживаем YandexGPT, GigaChat (Сбер), SaluteLLM. При переключении бот продолжает работать без перенастройки промптов и базы знаний. Гибридный режим тоже доступен.
Передаются ли персональные данные клиентов в нейросеть?
Нет. В LLM передаётся только обезличенный контекст: классификация интента и фрагменты из базы знаний (прайсы, FAQ). Персональные данные (имя, телефон) хранятся в CRM на российских серверах и не покидают инфраструктуру Botseller. Это соответствует требованиям 152-ФЗ.
Дешевле ли Botseller чем настроить бота самому на n8n?
Для новичка и среднего бизнеса - да. Batch-запросы, кеширование и мульти-модельная маршрутизация делают итоговую цену ниже, чем n8n + API + хостинг + DevOps. Для продвинутого инженера чистая стоимость токенов может быть ниже. Но вопрос в стоимости его времени и готовности поддерживать систему 24/7. Мы зарабатываем на марже - и реинвестируем в экосистему, поддержку и партнерскую программу .
Что будет если зарубежные модели заблокируют в России?
Бот продолжит работать без перерыва. Ядро системы (CRM, RAG, промпты, маршрутизация) не зависит от конкретного провайдера LLM. Переключение на российский стек (YandexGPT, GigaChat, SaluteLLM) происходит без даунтайма в один клик. 80% бизнес-задач российские модели закрывают на сопоставимом уровне качества. Для оставшихся 20% (сложные переговоры, мультиязычность) - гибридный режим позволяет комбинировать стеки.
Как часто обновляется система?
Постоянно. Мы тестируем новые модели каждый месяц, оптимизируем промпты на основе реальных диалогов и обновляем RAG-пайплайн. Обновления происходят бесшовно - бот не останавливается. Клиенты получают улучшения автоматически, без каких-либо действий и дополнительных оплат со своей стороны.
Хотите увидеть как это работает на вашем бизнесе? Зарегистрируйтесь бесплатно на Botseller и настройте первого бота за 30 минут. Или узнайте больше про обучение нейросетям для бизнеса в нашем закрытом клубе.



