知识库

添加您的企业信息以获得更智能的 AI 回复

管理知识库

概述

知识库是存储 AI 用于回答问题的所有信息的地方。当访客提出问题时,AI 会搜索您的知识库以找到相关内容,并用它生成准确、有用的回复。

AI 回复的质量直接取决于知识库的质量和完整性。知识库越全面,AI 的表现就越好。

内容来源

您可以从多个来源向知识库添加内容:

纯文本

直接粘贴或输入文本。非常适合常见问题、政策、产品描述或任何您希望 AI 了解的自定义信息。

URL / 网页

提供一个 URL,系统将从该页面提取文本内容。非常适合添加特定页面,如常见问题页面、关于页面或产品页面。

爬取网站

自动发现并从您网站的多个页面提取内容。爬虫会跟踪链接以找到所有相关页面。

PDF 文档

上传 PDF 文件,如产品目录、手册、政策或任何文档。支持数字 PDF 和带 OCR 的扫描文档。

HTML 文件

上传 .html 文件,系统将提取文本内容。当您有保存的网页或 HTML 文档时非常有用。

视频

直接上传视频文件。系统会提取字幕,以便您的 AI 可以回答有关视频内容的问题。

电子表格

上传 CSV 或 Excel 文件。每行成为一个独立的知识条目,非常适合产品目录、常见问题列表、价格表和联系人目录。

实时数据源

连接到自动更新的实时数据源。AI 始终可以访问最新信息。

批量上传

一次上传多个文件,快速为知识库填充大量内容。

注意: 想在聊天中显示产品卡片?这是一个名为产品卡片的独立功能,可让您的 AI 展示带有图片、价格和购买按钮的可视化产品卡片。

知识库项目限额

每个计划对每个网站可添加的知识库项目数量有限制。每个内容来源(文本、URL、PDF、HTML、视频、电子表格或抓取)计为一个项目。

套餐 每个网站最大项目数
免费 5
Starter 25
Standard 100
Pro 500

注意: 每个内容来源计为一个项目。网站抓取无论抓取了多少页面都计为1个项目,PDF无论有多少页都计为1个项目,电子表格、视频和其他来源也是如此。

网站爬取

网站爬虫是填充知识库最强大的方式之一。您可以在两种爬取模式之间选择:

抓取模式

自动

爬虫从您的主页开始,通过跟踪链接自动发现页面。最适合爬取整个网站或其大部分内容。

手动

您可以指定要爬取的精确 URL(逗号分隔)。最适合只想将特定页面添加到知识库的情况。适用于 Starter、Standard 和 Pro 套餐。

密码保护页面

需要抓取登录后的页面?启用"密码保护页面"选项并提供您的登录凭据。爬虫将在抓取前进行身份验证,以访问会员专属内容、仪表板或网站上任何受密码保护的区域。

使用此功能:

  1. 启用"密码保护页面"开关
  2. 输入您的登录页面 URL(例如 yoursite.com/login
  3. 输入您的用户名/邮箱和密码
  4. 开始爬取 - 系统将先登录,然后爬取受保护的页面

爬虫会自动检测表单字段和 CSRF 令牌,因此它可以与大多数标准登录表单配合使用,无需额外配置。

限制: 此功能适用于标准 HTML 登录表单。可能不适用于基于 JavaScript 的登录(React/Vue SPA)、验证码、双因素身份验证(2FA)或 OAuth 登录(Google、Facebook 等)。

各计划的抓取限制

套餐 最大爬取页面数
免费 50 页
Starter 250 页
Standard 1,000 页
Pro 5,000 页

提示: 首先爬取您最重要的页面 - 产品页面、常见问题和服务描述。避免添加不准确或过时的信息,因为这会影响 AI 回复的质量。

爬取可能被阻止: 某些网站使用 Cloudflare 或类似的安全服务,可能会阻止爬虫。如果您的爬取返回的页面少于预期或失败,您有其他选择:使用文本选项手动添加内容、将页面保存为 HTML 文件并使用批量上传,或逐个添加 URL。

PDF 上传

上传 PDF 时,您可以在两种处理模式之间选择:

数字 PDF

适用于可选择文本的标准 PDF(例如从 Word、Google Docs 或其他软件创建的文档)。文本直接快速提取。这是默认模式,所有套餐均可使用。

扫描版 PDF(OCR)

适用于扫描文档、文档照片或文本以图片形式嵌入的 PDF。使用 AI 驱动的光学字符识别(OCR)来读取和提取文本。适用于 Starter、Standard 和 Pro 套餐。

要上传 PDF,请前往添加 PDF并选择适当的模式。选择文件后将自动处理。

提示: 不确定使用哪种模式?先试试数字 PDF - 更快。如果结果返回为空或缺少文本,请切换到扫描 PDF(OCR)模式,使用 AI 文本识别进行处理。

电子表格上传

上传 CSV 或 Excel(.xlsx)文件以将结构化表格数据添加到您的知识库。电子表格中的每一行成为一个独立的知识条目,使用户提问时能够精确检索。

支持的格式

  • .csv - 逗号分隔值(自动检测 UTF-8 和 Latin-1 编码)
  • .xlsx - Microsoft Excel 文件(处理第一个工作表)

工作原理

电子表格的第一行被视为列标题。后续每一行都会转换为带标签的文本条目。例如,包含"Name"、"Price"和"Category"列的一行会变为:

Name: Widget Pro
Price: $49.99
Category: Electronics

这使得 AI 在回答问题时可以轻松找到和引用特定行。

最适合用于

  • 包含名称、价格和描述的产品目录
  • 包含问答列的常见问题电子表格
  • 价格表和套餐对比
  • 联系人目录和团队成员列表
  • 库存或服务列表

各套餐行数限制

每次电子表格上传处理的行数取决于您的套餐。如果您的文件超过限制,将处理至您套餐限制内的前几行。

套餐 每个电子表格的最大行数
免费 100 行
Starter 500 行
Standard 2,000 行
Pro 10,000 行

提示: 确保电子表格的第一行包含描述性列标题,并在上传前删除所有空行。标题描述越详细,AI 就越能理解和检索数据。

工作原理

当您向知识库添加内容时,系统会按以下步骤处理:

  1. 内容提取:从您的来源中提取文本(PDF、URL、视频字幕等)
  2. 分块:内容被分割成更小、可管理的块,以便高效搜索
  3. 向量化:每个块被转换为捕获其含义的数值表示(embedding)
  4. 索引:向量存储在可搜索的索引中

当访客提出问题时:

  1. 问题被转换为向量
  2. 系统从您的知识库中找到最相关的块
  3. 这些块被包含在 AI 的上下文中
  4. AI 根据相关信息生成回复

管理您的知识库

您可以从控制面板管理您的知识库:

  • 查看条目:查看您添加的所有内容及其来源类型和日期
  • 预览内容:点击任何条目查看其提取的文本
  • 删除条目:删除不再相关的内容
  • 添加新内容:点击"添加知识"区域或"选择来源"按钮打开来源选择器,然后选择要添加的类型

最佳实践

内容质量

  • 添加准确、最新的信息
  • 包含常见问题及其答案
  • 涵盖您所有的产品和服务
  • 添加客户经常询问的政策(运输、退货、隐私)
  • 包含联系信息和营业时间

组织管理

  • 添加内容时使用描述性名称
  • 及时删除过时信息
  • 当企业信息发生变化时更新内容
  • 定期检查正在使用的内容

优化

  • 查看知识空白以找到 AI 无法回答的问题
  • 用常见客户问题测试您的 AI
  • 为 AI 表现不佳的主题添加内容
  • 保持内容与您的业务相关且有针对性

注意: 知识库的更改会立即生效。无需重新发布或重启任何内容。