知识库
添加您的企业信息以获得更智能的 AI 回复
概述
知识库是存储 AI 用于回答问题的所有信息的地方。当访客提出问题时,AI 会搜索您的知识库以找到相关内容,并用它生成准确、有用的回复。
AI 回复的质量直接取决于知识库的质量和完整性。知识库越全面,AI 的表现就越好。
内容来源
您可以从多个来源向知识库添加内容:
纯文本
直接粘贴或输入文本。非常适合常见问题、政策、产品描述或任何您希望 AI 了解的自定义信息。
URL / 网页
提供一个 URL,系统将从该页面提取文本内容。非常适合添加特定页面,如常见问题页面、关于页面或产品页面。
爬取网站
自动发现并从您网站的多个页面提取内容。爬虫会跟踪链接以找到所有相关页面。
PDF 文档
上传 PDF 文件,如产品目录、手册、政策或任何文档。支持数字 PDF 和带 OCR 的扫描文档。
HTML 文件
上传 .html 文件,系统将提取文本内容。当您有保存的网页或 HTML 文档时非常有用。
视频
直接上传视频文件。系统会提取字幕,以便您的 AI 可以回答有关视频内容的问题。
电子表格
上传 CSV 或 Excel 文件。每行成为一个独立的知识条目,非常适合产品目录、常见问题列表、价格表和联系人目录。
实时数据源
连接到自动更新的实时数据源。AI 始终可以访问最新信息。
批量上传
一次上传多个文件,快速为知识库填充大量内容。
注意: 想在聊天中显示产品卡片?这是一个名为产品卡片的独立功能,可让您的 AI 展示带有图片、价格和购买按钮的可视化产品卡片。
知识库项目限额
每个计划对每个网站可添加的知识库项目数量有限制。每个内容来源(文本、URL、PDF、HTML、视频、电子表格或抓取)计为一个项目。
| 套餐 | 每个网站最大项目数 |
|---|---|
| 免费 | 5 |
| Starter | 25 |
| Standard | 100 |
| Pro | 500 |
注意: 每个内容来源计为一个项目。网站抓取无论抓取了多少页面都计为1个项目,PDF无论有多少页都计为1个项目,电子表格、视频和其他来源也是如此。
网站爬取
网站爬虫是填充知识库最强大的方式之一。您可以在两种爬取模式之间选择:
抓取模式
自动
爬虫从您的主页开始,通过跟踪链接自动发现页面。最适合爬取整个网站或其大部分内容。
手动 Starter+
您可以指定要爬取的精确 URL(逗号分隔)。最适合只想将特定页面添加到知识库的情况。适用于 Starter、Standard 和 Pro 套餐。
密码保护页面 Starter+
需要抓取登录后的页面?启用"密码保护页面"选项并提供您的登录凭据。爬虫将在抓取前进行身份验证,以访问会员专属内容、仪表板或网站上任何受密码保护的区域。
使用此功能:
- 启用"密码保护页面"开关
- 输入您的登录页面 URL(例如
yoursite.com/login) - 输入您的用户名/邮箱和密码
- 开始爬取 - 系统将先登录,然后爬取受保护的页面
爬虫会自动检测表单字段和 CSRF 令牌,因此它可以与大多数标准登录表单配合使用,无需额外配置。
限制: 此功能适用于标准 HTML 登录表单。可能不适用于基于 JavaScript 的登录(React/Vue SPA)、验证码、双因素身份验证(2FA)或 OAuth 登录(Google、Facebook 等)。
各计划的抓取限制
| 套餐 | 最大爬取页面数 |
|---|---|
| 免费 | 50 页 |
| Starter | 250 页 |
| Standard | 1,000 页 |
| Pro | 5,000 页 |
提示: 首先爬取您最重要的页面 - 产品页面、常见问题和服务描述。避免添加不准确或过时的信息,因为这会影响 AI 回复的质量。
爬取可能被阻止: 某些网站使用 Cloudflare 或类似的安全服务,可能会阻止爬虫。如果您的爬取返回的页面少于预期或失败,您有其他选择:使用文本选项手动添加内容、将页面保存为 HTML 文件并使用批量上传,或逐个添加 URL。
PDF 上传
上传 PDF 时,您可以在两种处理模式之间选择:
数字 PDF
适用于可选择文本的标准 PDF(例如从 Word、Google Docs 或其他软件创建的文档)。文本直接快速提取。这是默认模式,所有套餐均可使用。
扫描版 PDF(OCR)Starter+
适用于扫描文档、文档照片或文本以图片形式嵌入的 PDF。使用 AI 驱动的光学字符识别(OCR)来读取和提取文本。适用于 Starter、Standard 和 Pro 套餐。
要上传 PDF,请前往添加 PDF并选择适当的模式。选择文件后将自动处理。
提示: 不确定使用哪种模式?先试试数字 PDF - 更快。如果结果返回为空或缺少文本,请切换到扫描 PDF(OCR)模式,使用 AI 文本识别进行处理。
电子表格上传
上传 CSV 或 Excel(.xlsx)文件以将结构化表格数据添加到您的知识库。电子表格中的每一行成为一个独立的知识条目,使用户提问时能够精确检索。
支持的格式
- .csv - 逗号分隔值(自动检测 UTF-8 和 Latin-1 编码)
- .xlsx - Microsoft Excel 文件(处理第一个工作表)
工作原理
电子表格的第一行被视为列标题。后续每一行都会转换为带标签的文本条目。例如,包含"Name"、"Price"和"Category"列的一行会变为:
Price: $49.99
Category: Electronics
这使得 AI 在回答问题时可以轻松找到和引用特定行。
最适合用于
- 包含名称、价格和描述的产品目录
- 包含问答列的常见问题电子表格
- 价格表和套餐对比
- 联系人目录和团队成员列表
- 库存或服务列表
各套餐行数限制
每次电子表格上传处理的行数取决于您的套餐。如果您的文件超过限制,将处理至您套餐限制内的前几行。
| 套餐 | 每个电子表格的最大行数 |
|---|---|
| 免费 | 100 行 |
| Starter | 500 行 |
| Standard | 2,000 行 |
| Pro | 10,000 行 |
提示: 确保电子表格的第一行包含描述性列标题,并在上传前删除所有空行。标题描述越详细,AI 就越能理解和检索数据。
工作原理
当您向知识库添加内容时,系统会按以下步骤处理:
- 内容提取:从您的来源中提取文本(PDF、URL、视频字幕等)
- 分块:内容被分割成更小、可管理的块,以便高效搜索
- 向量化:每个块被转换为捕获其含义的数值表示(embedding)
- 索引:向量存储在可搜索的索引中
当访客提出问题时:
- 问题被转换为向量
- 系统从您的知识库中找到最相关的块
- 这些块被包含在 AI 的上下文中
- AI 根据相关信息生成回复
管理您的知识库
您可以从控制面板管理您的知识库:
- 查看条目:查看您添加的所有内容及其来源类型和日期
- 预览内容:点击任何条目查看其提取的文本
- 删除条目:删除不再相关的内容
- 添加新内容:点击"添加知识"区域或"选择来源"按钮打开来源选择器,然后选择要添加的类型
最佳实践
内容质量
- 添加准确、最新的信息
- 包含常见问题及其答案
- 涵盖您所有的产品和服务
- 添加客户经常询问的政策(运输、退货、隐私)
- 包含联系信息和营业时间
组织管理
- 添加内容时使用描述性名称
- 及时删除过时信息
- 当企业信息发生变化时更新内容
- 定期检查正在使用的内容
优化
- 查看知识空白以找到 AI 无法回答的问题
- 用常见客户问题测试您的 AI
- 为 AI 表现不佳的主题添加内容
- 保持内容与您的业务相关且有针对性
注意: 知识库的更改会立即生效。无需重新发布或重启任何内容。