ナレッジベース
ビジネス情報を追加してAIの応答をよりスマートに
概要
ナレッジベースは、AIが質問に回答するために使用するすべての情報を保存する場所です。訪問者が質問すると、AIはナレッジベースを検索して関連するコンテンツを見つけ、それを使用して正確で有益な回答を生成します。
AIの回答の品質は、ナレッジベースの品質と網羅性に直接依存します。ナレッジベースが包括的であるほど、AIのパフォーマンスが向上します。
コンテンツソース
複数のソースからナレッジベースにコンテンツを追加できます:
プレーンテキスト
テキストを直接貼り付けまたは入力します。FAQ、ポリシー、商品説明、AIに覚えてほしいカスタム情報に最適です。
URL / ウェブページ
URLを入力すると、システムがそのページからテキストコンテンツを抽出します。FAQページ、概要ページ、商品ページなどの追加に最適です。
ウェブサイトをクロール
ウェブサイトの複数ページからコンテンツを自動的に検出・抽出します。クローラーがリンクをたどって関連するすべてのページを見つけます。
PDFドキュメント
商品カタログ、マニュアル、ポリシーなどのPDFファイルをアップロードします。デジタルPDFとOCR付きスキャンドキュメントの両方に対応しています。
HTMLファイル
.htmlファイルをアップロードすると、システムがテキストコンテンツを抽出します。保存したウェブページやHTMLドキュメントがある場合に便利です。
動画
動画ファイルを直接アップロードします。システムがトランスクリプトを抽出し、AIが動画コンテンツに関する質問に回答できるようになります。
スプレッドシート
CSVまたはExcelファイルをアップロードします。各行が個別のナレッジエントリとなるため、商品カタログ、FAQリスト、料金表、連絡先ディレクトリに最適です。
リアルタイムデータフィード
自動更新されるライブデータソースに接続します。AIは常に最新の情報にアクセスできます。
一括アップロード
複数のファイルを一度にアップロードして、ナレッジベースに大量のコンテンツをすばやく追加できます。
注意: チャットで商品カードを表示したいですか?それは商品カードという別の機能で、AIが画像、価格、購入ボタン付きのビジュアル商品カードを表示できます。
ナレッジベースアイテムの上限
各プランにはウェブサイトごとに追加できるナレッジベースアイテム数の上限があります。各コンテンツソース(テキスト、URL、PDF、HTML、動画、スプレッドシート、クロール)は1アイテムとしてカウントされます。
| プラン | ウェブサイトあたりの最大アイテム数 |
|---|---|
| 無料 | 5 |
| スターター | 25 |
| スタンダード | 100 |
| プロ | 500 |
注意: 各コンテンツソースは1アイテムとしてカウントされます。ウェブサイトのクロールはページ数に関係なく1アイテム、PDFはページ数に関係なく1アイテム、スプレッドシート、動画、その他のソースも同様です。
ウェブサイトクローリング
ウェブサイトクローラーは、ナレッジベースを充実させる最も強力な方法の1つです。2つのクロールモードから選択できます:
クロールモード
自動
クローラーはホームページから開始し、リンクをたどって自動的にページを検出します。ウェブサイト全体または大部分をクロールするのに最適です。
手動 Starter+
クロールする正確なURLをカンマ区切りで指定します。特定のページのみをナレッジベースに追加したい場合に最適です。Starter、Standard、Proプランで利用可能です。
パスワード保護ページ Starter+
ログインが必要なページをクロールしたいですか?「Password Protected Pages」オプションを有効にして、ログイン認証情報を入力してください。クローラーはクロール前に認証を行い、会員限定コンテンツ、ダッシュボード、またはウェブサイトのパスワード保護エリアにアクセスできます。
この機能を使用するには:
- 「Password Protected Pages」トグルを有効にします
- ログインページのURLを入力します(例:
yoursite.com/login) - ユーザー名/メールアドレスとパスワードを入力します
- クロールを開始します - システムが最初にログインし、その後保護されたページをクロールします
クローラーはフォームフィールドとCSRFトークンを自動検出するため、追加設定なしでほとんどの標準的なログインフォームで動作します。
制限: この機能は標準的なHTMLログインフォームで動作します。JavaScriptベースのログイン(React/Vue SPA)、CAPTCHA、二要素認証(2FA)、OAuthログイン(Google、Facebookなど)では動作しない場合があります。
プランごとのクロール上限
| プラン | 最大クロールページ数 |
|---|---|
| 無料 | 50ページ |
| スターター | 250ページ |
| スタンダード | 1,000ページ |
| プロ | 5,000ページ |
ヒント: まず最も重要なページからクロールしましょう - 商品ページ、FAQ、サービス説明など。不正確または古い情報の追加は避けてください。AIの応答品質に影響します。
クロールがブロックされる場合: 一部のウェブサイトでは、Cloudflareなどのセキュリティサービスによりクローラーがブロックされる場合があります。クロールで予想より少ないページが返されたり失敗した場合は、代替手段があります:テキストオプションを使用して手動でコンテンツを追加する、ページをHTMLファイルとして保存して一括アップロードを使用する、または個別のURLを1つずつ追加する。
PDFアップロード
PDFをアップロードする際、2つの処理モードから選択できます:
デジタルPDF
テキストを選択できる標準的なPDF用です(Word、Google Docs、その他のソフトウェアで作成されたドキュメントなど)。テキストが直接かつ迅速に抽出されます。これはデフォルトモードで、すべてのプランで利用可能です。
スキャンPDF(OCR)Starter+
スキャンドキュメント、ドキュメントの写真、またはテキストが画像として埋め込まれたPDF用です。AI搭載の光学文字認識(OCR)を使用してテキストを読み取り・抽出します。Starter、Standard、Proプランで利用可能です。
PDFをアップロードするには、PDF追加にアクセスして適切なモードを選択します。ファイルを選択すると自動的に処理されます。
ヒント: どのモードを使うべきかわからない場合は、まずデジタルPDFをお試しください - より高速です。結果が空またはテキストが欠落している場合は、スキャンPDF(OCR)モードに切り替えてAI搭載のテキスト認識で処理してください。
スプレッドシートアップロード
CSVまたはExcel(.xlsx)ファイルをアップロードして、構造化された表形式のデータをナレッジベースに追加します。スプレッドシートの各行が個別のナレッジエントリとなり、ユーザーの質問に対して正確な検索が可能になります。
対応フォーマット
- .csv - カンマ区切り値(UTF-8およびLatin-1エンコーディングを自動検出)
- .xlsx - Microsoft Excelファイル(最初のシートが処理されます)
仕組み
スプレッドシートの最初の行は列ヘッダーとして扱われます。それ以降の各行はラベル付きテキストエントリに変換されます。例えば、「Name」「Price」「Category」の列を持つ行は次のようになります:
Price: $49.99
Category: Electronics
これにより、AIが質問に回答する際に特定の行を見つけて参照しやすくなります。
最適な用途
- 名前、価格、説明を含む商品カタログ
- 質問と回答の列を持つFAQスプレッドシート
- 料金表とプランの比較
- 連絡先ディレクトリとチームメンバーリスト
- 在庫またはサービス一覧
プラン別の行数制限
スプレッドシートアップロードあたりの処理行数はプランによって異なります。ファイルが制限を超える場合、プランの制限までの最初の行が処理されます。
| プラン | スプレッドシートあたりの最大行数 |
|---|---|
| 無料 | 100行 |
| スターター | 500行 |
| スタンダード | 2,000行 |
| プロ | 10,000行 |
ヒント: スプレッドシートの最初の行にわかりやすい列ヘッダーが含まれていることを確認し、アップロード前に空の行を削除してください。ヘッダーがわかりやすいほど、AIがデータをより適切に理解・検索できます。
仕組み
ナレッジベースにコンテンツを追加すると、システムは複数のステップで処理します:
- コンテンツ抽出:ソース(PDF、URL、動画トランスクリプトなど)からテキストが抽出されます
- チャンキング:効率的な検索のために、コンテンツが小さく管理しやすいチャンクに分割されます
- エンベディング:各チャンクが意味を捉えた数値表現(エンベディング)に変換されます
- インデックス化:エンベディングが検索可能なインデックスに保存されます
訪問者が質問すると:
- 質問がエンベディングに変換されます
- システムがナレッジベースから最も関連性の高いチャンクを検索します
- これらのチャンクがAIのコンテキストに含まれます
- AIが関連情報に基づいて回答を生成します
ナレッジベースの管理
ダッシュボードからナレッジベースを管理できます:
- アイテムの表示:ソースタイプと日付とともに追加したすべてのコンテンツを確認できます
- コンテンツのプレビュー:任意のアイテムをクリックして抽出されたテキストを確認できます
- アイテムの削除:不要になったコンテンツを削除できます
- 新しいコンテンツの追加:「Add Knowledge」エリアの任意の場所または「Select Source」ボタンをクリックしてソースピッカーを開き、追加したいタイプを選択します
ベストプラクティス
コンテンツの品質
- 正確で最新の情報を追加してください
- よくある質問とその回答を含めてください
- すべての商品とサービスをカバーしてください
- Add policies (shipping, returns, privacy) that customers ask about
- 連絡先情報と営業時間を含めてください
組織
- コンテンツ追加時にわかりやすい名前を使用してください
- 古い情報は速やかに削除してください
- ビジネス情報が変わったらコンテンツを更新してください
- 使用されているコンテンツを定期的に確認してください
最適化
- ナレッジギャップを確認して、AIが回答できなかった質問を見つけてください
- よくある顧客の質問でAIをテストしてください
- AIが苦手なトピックのコンテンツを追加してください
- コンテンツをビジネスに関連した内容に集中させてください
注意: ナレッジベースへの変更は即座に反映されます。再公開や再起動の必要はありません。