Webページを学習する場合、大きく分けて2パターンで学習します。
- Webページのトップなどを学習してその下の階層をすべて学習する
- 項目ごとにWebページを分けて学習する
例)amieのホームページの場合
https://amie-ai.com/
→ このURLを学習データとして登録すると、配下のページ構成すべて学習されます。
https://amie-ai.com/faq/
https://amie-ai.com/contents/
→上のURLとは異なり、1つずつ学習すると、「https://amie-ai.com/サブサイト名/」 ごとに学習されます。
amieで学習データ登録を行う場合は、チャットボット作成時の概要設定で分類タグの紐付けることができますが、
上のパターン(Webページトップ)の場合は、あえて空欄で設定したほうが、回答精度が良い場合があります
下のパターン(カテゴリ・項目ごと)の場合は、そのWebページごとに設定することで、サブサイト内の中から優先的に回答を表示することができます。
分類タグは、後から設定することもできますが、ページの紐付けはされません。
ただし、後から付ける場合は、ページ内に記載されているキーワードや項目名などを回答精度によって設定することができるため、メリットがあります。