База знаний
Добавьте информацию о вашем бизнесе для более умных ответов ИИ
Обзор
База знаний — это место, где хранится вся информация, которую ваш ИИ использует для ответов на вопросы. Когда посетитель что-то спрашивает, ИИ ищет в базе знаний релевантное содержимое и использует его для формирования точных и полезных ответов.
Качество ответов вашего ИИ напрямую зависит от качества и полноты базы знаний. Чем полнее база знаний, тем лучше работает ИИ.
Источники контента
Вы можете добавлять контент в базу знаний из нескольких источников:
Простой текст
Вставьте или введите текст напрямую. Идеально подходит для FAQ, правил, описаний продуктов или любой другой информации, которую вы хотите сообщить ИИ.
URL / Веб-страница
Укажите URL, и система извлечёт текстовое содержимое с этой страницы. Отлично подходит для добавления конкретных страниц, таких как FAQ, страница «О нас» или страницы продуктов.
Сканировать сайт
Автоматически находите и извлекайте контент с нескольких страниц вашего сайта. Краулер переходит по ссылкам для поиска всех соответствующих страниц.
PDF-документ
Загружайте PDF-файлы: каталоги товаров, руководства, политики или любую документацию. Поддерживаются как цифровые PDF, так и сканированные документы с OCR.
HTML-файл
Загрузите файлы .html, и система извлечёт текстовый контент. Полезно при наличии сохранённых веб-страниц или HTML-документов.
Видео
Загружайте видеофайлы напрямую. Система извлекает транскрипты, чтобы ИИ мог отвечать на вопросы по видеоконтенту.
Таблица
Загрузите файлы CSV или Excel. Каждая строка становится отдельной записью в базе знаний — идеально для каталогов товаров, списков FAQ, прайс-листов и справочников контактов.
Поток данных в реальном времени
Подключитесь к живому источнику данных, который обновляется автоматически. ИИ всегда имеет доступ к актуальной информации.
Массовая загрузка
Загружайте несколько файлов одновременно, чтобы быстро наполнить базу знаний большим количеством контента.
Примечание: Хотите отображать карточки товаров в чате? Это отдельная функция — Product Cards, которая позволяет ИИ показывать визуальные карточки товаров с изображениями, ценами и кнопками покупки.
Лимиты хранилища базы знаний
Каждый тарифный план имеет лимит хранилища на общее количество символов, которые вы можете хранить в базе знаний, распределённый между всеми вашими сайтами.
| Тариф | Лимит хранилища |
|---|---|
| Free | 1,000,000 символов |
| Starter | 3,000,000 символов |
| Standard | 15,000,000 символов |
| Pro | 100,000,000 символов |
Примечание: A typical 50-page website crawl uses about 100,000-500,000 characters.
Сканирование сайта
Краулер сайта — один из самых эффективных способов наполнить базу знаний. Вы можете выбирать между двумя режимами обхода:
Режимы сканирования
Автоматически
Краулер начинает с главной страницы и автоматически обнаруживает страницы, переходя по ссылкам. Лучший вариант для обхода всего сайта или его большой части.
Вручную Starter+
Вы указываете конкретные URL для обхода (через запятую). Лучший вариант, когда нужно добавить в базу знаний только определённые страницы. Доступно на тарифах Starter, Standard и Pro.
Страницы, защищённые паролем Starter+
Нужно обойти страницы за авторизацией? Включите опцию «Страницы с паролем» и укажите учётные данные. Сканер авторизуется перед обходом и получит доступ к закрытому контенту, панелям управления и другим защищённым разделам сайта.
Чтобы использовать эту функцию:
- Включите переключатель «Страницы, защищённые паролем»
- Введите URL страницы входа (например,
yoursite.com/login) - Введите ваш логин/email и пароль
- Запустите краулинг — система сначала выполнит вход, затем будет сканировать защищённые страницы
Краулер автоматически определяет поля формы и CSRF-токены, поэтому работает с большинством стандартных форм входа без дополнительной настройки.
Ограничения: Эта функция работает со стандартными HTML-формами входа. Она может не работать с входом на основе JavaScript (React/Vue SPA), CAPTCHA, двухфакторной аутентификацией (2FA) или входом через OAuth (Google, Facebook и т. д.).
Лимиты сканирования по тарифам
| Тариф | Макс. проиндексированных страниц |
|---|---|
| Free | 50 страниц |
| Starter | 250 страниц |
| Standard | 1 000 страниц |
| Pro | 5 000 страниц |
Совет: Начните с краулинга наиболее важных страниц — страниц товаров, FAQ и описаний услуг. Не добавляйте неточную или устаревшую информацию, так как это повлияет на качество ответов ИИ.
Сканирование может быть заблокировано: Некоторые сайты используют Cloudflare или аналогичные сервисы безопасности, которые могут блокировать краулер. Если краулинг возвращает меньше страниц, чем ожидалось, или завершается с ошибкой, воспользуйтесь альтернативами: добавьте контент вручную через опцию «Текст», сохраните страницы как HTML-файлы и используйте массовую загрузку, или добавляйте URL по одному.
Загрузка PDF
При загрузке PDF можно выбрать один из двух режимов обработки:
Цифровой PDF
Для стандартных PDF с выделяемым текстом (например, документов, созданных в Word, Google Docs или другом ПО). Текст извлекается напрямую и быстро. Это режим по умолчанию, доступный на всех тарифах.
Сканированный PDF (OCR) Starter+
Для сканированных документов, фотографий документов или PDF, где текст встроен как изображение. Использует оптическое распознавание символов (OCR) на основе ИИ для чтения и извлечения текста. Доступно на тарифах Starter, Standard и Pro.
Чтобы загрузить PDF, перейдите на страницу Добавить PDF и выберите подходящий режим. Файл обрабатывается автоматически после выбора.
Совет: Не знаете, какой режим выбрать? Попробуйте сначала «Цифровой PDF» — он работает быстрее. Если результат окажется пустым или текст будет отсутствовать, переключитесь в режим «Сканированный PDF (OCR)» для обработки с помощью ИИ-распознавания текста.
Загрузка таблицы
Загрузите файлы CSV или Excel (.xlsx), чтобы добавить структурированные табличные данные в базу знаний. Каждая строка таблицы становится отдельной записью, обеспечивая точный поиск при ответах на вопросы пользователей.
Поддерживаемые форматы
- .csv — значения, разделённые запятыми (автоматически определяет кодировку UTF-8 и Latin-1)
- .xlsx — файлы Microsoft Excel (обрабатывается первый лист)
Как это работает
Первая строка вашей таблицы считается заголовком столбцов. Каждая последующая строка преобразуется в текстовую запись с метками. Например, строка со столбцами «Название», «Цена» и «Категория» станет:
Цена: $49.99
Категория: Электроника
Это облегчает ИИ поиск и обращение к конкретным строкам при ответах на вопросы.
Наиболее подходит для
- Каталоги продуктов с названиями, ценами и описаниями
- Таблицы FAQ со столбцами вопросов и ответов
- Таблицы цен и сравнение тарифов
- Справочники контактов и списки участников команды
- Каталог товаров или услуг
Лимиты строк по тарифам
Количество строк, обрабатываемых при загрузке таблицы, зависит от вашего тарифа. Если файл превышает лимит, будут обработаны первые строки в пределах лимита вашего тарифа.
| Тариф | Макс. строк в таблице |
|---|---|
| Free | 100 строк |
| Starter | 500 строк |
| Standard | 2 000 строк |
| Pro | 10 000 строк |
Совет: Убедитесь, что первая строка таблицы содержит описательные заголовки столбцов, и удалите пустые строки перед загрузкой. Чем описательнее заголовки, тем лучше ИИ понимает и извлекает данные.
Как это работает
Когда вы добавляете контент в базу знаний, система обрабатывает его в несколько этапов:
- Извлечение контента: текст извлекается из вашего источника (PDF, URL, транскрипт видео и т.д.)
- Разбивка на фрагменты: контент делится на небольшие управляемые части для эффективного поиска
- Эмбеддинг: каждый фрагмент преобразуется в числовое представление (эмбеддинг), отражающее его смысл
- Индексирование: эмбеддинги сохраняются в поисковом индексе
Когда посетитель задаёт вопрос:
- Вопрос преобразуется в эмбеддинг
- Система находит наиболее релевантные фрагменты из вашей базы знаний
- Эти фрагменты включаются в контекст ИИ
- ИИ формирует ответ на основе найденной информации
Управление базой знаний
Вы можете управлять базой знаний из Панели управления:
- Просмотр элементов: смотрите весь добавленный контент с указанием типа источника и даты
- Предпросмотр содержимого: нажмите на любой элемент, чтобы увидеть извлечённый текст
- Удалить элементы: удалите устаревший контент
- Добавить новый контент: нажмите в любом месте области "Добавить знания" или на кнопку "Выбрать источник", чтобы открыть выбор источника, затем выберите нужный тип
Лучшие практики
Качество контента
- Добавьте точную, актуальную информацию
- Включите часто задаваемые вопросы и ответы на них
- Охватите все свои товары и услуги
- Добавьте политики (доставка, возвраты, конфиденциальность), о которых спрашивают клиенты
- Укажите контактные данные и часы работы
Организация
- Используйте описательные имена при добавлении контента
- Своевременно удаляйте устаревшую информацию
- Обновляйте контент при изменении информации о вашем бизнесе
- Регулярно проверяйте, какой контент используется
Оптимизация
- Проверьте Пробелы в знаниях, чтобы найти вопросы, на которые ваш ИИ не смог ответить
- Протестируйте ИИ с типичными вопросами клиентов
- Добавьте контент по темам, с которыми ИИ не справляется
- Держите контент целенаправленным и актуальным для вашего бизнеса
Примечание: Изменения в базе знаний вступают в силу немедленно. Повторная публикация или перезапуск не требуются.