Как загрузить базу знаний в ИИ-бота
База знаний — это регламент для ИИ-сотрудника: документы, прайсы и FAQ, на основе которых нейросетевой сотрудник отвечает клиентам. Загрузите текст в RAG-инструкцию — искусственный интеллект будет искать релевантные фрагменты и генерировать точные ответы. Не нужно помещать всё в промпт: RAG автоматически подбирает нужную информацию под каждый вопрос.
Что понадобится
- ИИ-сотрудник — созданный и подключённый к CRM (быстрый старт)
- Данные для загрузки — прайс-лист, FAQ, описания услуг, условия работы
- 10 минут — на создание RAG-инструкции и загрузку данных
Когда использовать базу знаний
Когда вы создаёте регламент для AI-сотрудника, важно выбрать правильный подход. RAG-подход решает конкретную проблему: если у вас много данных (десятки услуг, длинный прайс, подробные FAQ), они не помещаются в обычный промпт. RAG хранит данные отдельно — нейросеть для каждого вопроса клиента находит именно те фрагменты, которые нужны для ответа.
| Ситуация | Подход |
|---|---|
| 5–10 услуг, простые ответы | Обычный промпт (как написать промпт) |
| 50+ услуг, подробный прайс | RAG (База знаний) |
| FAQ на 100+ вопросов | RAG (База знаний) |
| Техническая документация | RAG (База знаний) |
Создание RAG-инструкции
Откройте настройку воронки
Перейдите в раздел AI Сотрудники → выберите сотрудника → нажмите «Настроить». Откроется страница «Настройка воронки»: слева — этапы, в центре — слоты обработки, справа — библиотека инструкций.

Создайте инструкцию с подходом RAG
Нажмите «+ Создать» в библиотеке. Откроется мастер из трёх шагов:
Шаг 1 — Тип инструкции: выберите «Только ответы» — этот тип подходит для консультаций и ответов на вопросы клиентов.

Шаг 2 — Подход: выберите «RAG (База знаний)» — AI будет отвечать на основе загруженных документов.

Шаг 3 — Способ создания: выберите «Вручную» для полного контроля или «С AI помощником» для автоматической генерации промпта.

Загрузите данные в базу знаний
После создания откроется редактор RAG-инструкции с двумя секциями:

Вставьте текст в поле «База знаний (RAG)». Рекомендуемый формат:
## Услуги и цены
### Генеральная уборка
- Однокомнатная квартира — от 4 500 ₽
- Двухкомнатная квартира — от 6 000 ₽
- Трёхкомнатная квартира — от 8 000 ₽
- Время выполнения: 4-6 часов
### Мелкий ремонт
- Выезд мастера — от 1 500 ₽
- Сантехника — от 2 000 ₽
- Электрика — от 2 500 ₽
## Частые вопросы
### Какие способы оплаты?
Наличные, банковская карта, перевод по СБП.
### Есть ли гарантия?
Да, гарантия 30 дней на все виды работ.Структурируйте данные с заголовками и списками. RAG лучше находит информацию, когда текст разбит на логические блоки с чёткими заголовками.
Напишите системный промпт
Системный промпт — это регламент для нейросети: как использовать данные из базы знаний, в каком стиле отвечать, что запрещено. В поле «Системный промпт» добавьте инструкцию:
Ты — консультант компании «СитиСервис».
Отвечай на вопросы клиентов ТОЛЬКО на основе базы знаний.
Если ответа нет в базе знаний — честно скажи, что уточнишь
и передашь вопрос менеджеру.
Правила:
- Отвечай кратко: 1-3 предложения
- Указывай конкретные цены из базы знаний
- Не придумывай информацию
- Если клиент готов — собери имя и номер телефонаСистемный промпт определяет поведение бота, а база знаний — контент. Не дублируйте прайсы в системном промпте — для этого есть поле базы знаний.
Векторизуйте и протестируйте
После загрузки данных:
- Нажмите «Векторизовать» — система обработает текст и создаст поисковый индекс
- Дождитесь завершения (обычно 10–30 секунд)
- Нажмите «Протестировать» — откроется тестовый чат
- Задайте вопрос, который есть в базе знаний, например: «Сколько стоит уборка двушки?»
- Убедитесь, что бот отвечает на основе загруженных данных
Настройки RAG (для продвинутых)
Кнопка «Настройки RAG» под редактором базы знаний открывает панель «Параметры векторизации» — тонкие настройки того, как система разбивает и ищет информацию.

Chunk Size (размер фрагмента)
Диапазон: 100–10 000 · По умолчанию: 1 000
Определяет, на какие фрагменты (чанки) система разбивает текст базы знаний перед индексацией. Значение задаётся в символах.
- Меньше (300–500) — точный поиск по узким вопросам. Подходит для FAQ, где каждый ответ короткий и самодостаточный.
- Больше (1 500–3 000) — больше контекста в каждом фрагменте. Подходит для описаний услуг, где важна связь между абзацами.
Рекомендация: начните с 1 000 (по умолчанию). Уменьшайте, если бот «подмешивает» в ответ лишнюю информацию. Увеличивайте, если ответы выглядят оторванными от контекста.
Chunk Overlap (перекрытие)
Диапазон: 0–1 000 · По умолчанию: 200
Количество символов, которые дублируются между соседними фрагментами. Перекрытие страхует от потери смысла на границе двух чанков — если важная фраза попала на стык, она будет в обоих фрагментах.
- 0 — фрагменты не пересекаются (экономия, но риск потери контекста на границах)
- 100–200 — оптимально для большинства случаев
- 300+ — для текстов с длинными предложениями и сложной структурой
Separator (разделитель)
По умолчанию: \\n\\n (двойной перенос строки)
Символ или последовательность, по которой система в первую очередь разбивает текст. Двойной перенос (\\n\\n) означает разбиение по пустым строкам — это совпадает с границами абзацев.
| Разделитель | Когда использовать |
|---|---|
\\n\\n | Текст с абзацами (по умолчанию) |
\\n | Списки, где каждая строка — отдельный пункт |
--- | Текст с явными разделителями между блоками |
Если ваш текст не содержит двойных переносов строк, система всё равно разобьёт его по chunk size, но границы фрагментов могут не совпадать с логическими блоками. Структурируйте текст пустыми строками между разделами.
Top K (количество фрагментов)
Диапазон: 1–20 · По умолчанию: 5
Сколько наиболее релевантных фрагментов система передаст AI для генерации ответа. Чем больше фрагментов — тем полнее ответ, но выше расход токенов и стоимость.
- 1–3 — для простых вопросов с однозначным ответом (цена, да/нет)
- 5 — универсальный баланс (по умолчанию)
- 7–10 — для сложных вопросов, требующих информации из нескольких разделов
- 15–20 — для развёрнутых консультаций (редко нужно)
Не забудьте нажать «Векторизовать» после изменения настроек — параметры применяются при создании поискового индекса.
Почему только текст, а не файлы
База знаний в Botseller работает только с текстом, который вы вставляете вручную. Мы не поддерживаем загрузку PDF, DOCX и других файлов напрямую в RAG — и вот почему:
Чтобы нейросеть точно отвечала, данные должны быть структурированными и размеченными: с заголовками, блоками, маркированными списками. Если просто загрузить документ — AI получит «сырой» текст без разметки и будет отвечать неточно.
Поэтому рекомендуемый процесс:
- Возьмите исходные документы (прайс, FAQ, условия работы)
- Перенесите информацию в текстовое поле с разметкой: заголовки, списки, блоки
- Каждый блок — самодостаточный ответ на один вопрос или описание одной услуги
Вкладка «Файлы» в библиотеке предназначена для другого: загруженные файлы (PDF, изображения, видео) можно отправлять клиентам в переписке — например, в дожимах или как вложения к ответу. Они не индексируются для базы знаний.
Советы по подготовке данных
Качественный регламент для AI-сотрудника начинается с хорошо структурированных данных. Чем понятнее организована информация, тем точнее нейросетевой сотрудник отвечает клиентам.
Структура
- Используйте заголовки (
## Раздел,### Подраздел) для логической группировки - Разбивайте длинный текст на блоки по 200–500 слов
- Каждый блок должен быть самодостаточным — содержать ответ без контекста из других блоков
Содержание
- Прайс-лист — все услуги с ценами, условиями и сроками
- FAQ — типичные вопросы клиентов с развёрнутыми ответами
- Описания услуг — что входит, как проходит, какой результат
- Условия работы — оплата, доставка, гарантии, возврат
Чего избегать
- Не загружайте внутренние документы (регламенты для сотрудников) — бот может процитировать их клиенту
- Не дублируйте одну информацию в разных формулировках — это путает поиск
- Не загружайте устаревшие данные — регулярно обновляйте базу знаний
Результат
После создания регламента с базой знаний для ИИ-сотрудника:
- Перетащите инструкцию из библиотеки в слот «Базовая обработка» на нужном этапе воронки
- Включите этап переключателем
- Бот начнёт отвечать клиентам, опираясь на загруженную базу знаний
Частые вопросы
Что такое RAG в Botseller?
RAG (Retrieval-Augmented Generation) — это подход к созданию регламентов для ИИ-сотрудника, при котором нейросеть ищет релевантную информацию в загруженных документах и генерирует ответ на её основе. Бот не придумывает — искусственный интеллект находит нужный фрагмент в вашей базе знаний и формулирует ответ.
Какие данные можно загрузить в базу знаний?
Текст в свободном формате: прайс-листы, FAQ, описания услуг, инструкции, условия доставки и оплаты. Текст нужно вставить вручную и структурировать с заголовками и списками — это обеспечивает точные ответы бота. Загрузка файлов (PDF, DOCX) в базу знаний не поддерживается — вкладка «Файлы» используется для отправки вложений клиентам в переписке.
Чем RAG отличается от обычного промпта?
Обычный промпт содержит все данные прямо в тексте инструкции. RAG хранит данные в отдельном поле и для каждого вопроса клиента автоматически находит нужные фрагменты. RAG лучше подходит для больших объёмов информации — от 50 услуг или 100+ вопросов в FAQ.
Есть ли ограничение на объём базы знаний?
Технического ограничения на объём текста нет. Рекомендуем структурировать данные: разбивать на блоки с заголовками и списками. Чем лучше структура — тем точнее поиск.
Как обновить базу знаний?
Откройте RAG-инструкцию, измените текст в поле «База знаний (RAG)» и нажмите «Векторизовать» повторно. Старые данные автоматически заменятся новыми.
Можно ли использовать RAG и обычный промпт вместе?
Да. RAG-инструкция — это комбинированный регламент для нейросетевого сотрудника из двух частей: системный промпт (роль, стиль, ограничения) и база знаний (данные для ответов). Системный промпт определяет поведение AI-сотрудника, база знаний — контент. Они работают в связке.
Как настроить Chunk Size и Top K?
Нажмите «Настройки RAG» под полем базы знаний. Chunk Size (по умолчанию 1 000) — размер фрагментов в символах: уменьшайте для коротких FAQ, увеличивайте для длинных описаний. Top K (по умолчанию 5) — сколько фрагментов передаётся AI для ответа: увеличивайте для сложных вопросов, требующих информации из нескольких разделов. После изменения настроек нажмите «Векторизовать».
Следующие шаги
Попробуйте бесплатно — создайте бота за 5 минут
Создать бота →