Как загрузить документы в базу знаний

Какие форматы документов подходят, как проходит индексация и что считать хорошим материалом для RAG.

Какие файлы поддерживаются

Для пользовательской загрузки подходят PDF, DOCX, TXT и MD. После загрузки документ разбирается на текстовые фрагменты и индексируется для дальнейшего поиска ответов.

Как проходит обработка

  1. Файл загружается в агента.
  2. SalesBot проверяет размер и тип файла.
  3. Из файла извлекается текст.
  4. Текст делится на фрагменты и индексируется.
  5. Документ получает статус готовности или ошибки.

Что лучше загружать

  • FAQ и инструкции по продукту.
  • Коммерческие условия и описания услуг.
  • Точные справочные материалы, на которые должен опираться бот.
Важно: если загрузить длинный хаотичный документ без структуры, это не делает ответы умнее автоматически. Лучше несколько чистых тематических файлов, чем один перегруженный PDF.
Предыдущая статья Как загрузить базу знаний Читать далее Как использовать Q&A в базе знаний