Database Support Blog

  • AWS
2026.01.15

「Amazon Q Business」でウェブサイトやイントラサイトをデータソースとして設定する方法

Amazon Q Businessでウェブサイトやイントラサイトをデータソースとして設定する方法

はじめに

Amazon Q Businessでは、社内データを連携させることで、自社専用のAIアシスタントを構築できます。

本記事ではデータ連携に利用する「データソース」の中でも、Web crawler機能に焦点を当て、一般の「ウェブサイト」を連携する基本パターンと、「イントラサイト」を連携する応用パターンの2つの設定方法について解説します。

Web crawler設定の前提条件

まず初めに、設定対象とするウェブサイトを選択する際は、Amazonの適正利用規約を遵守するほか、その他のAmazonの利用規約もすべて遵守する必要があります。

また、ご自身のウェブページもしくは許可されたウェブページのみをWeb crawlerの設定対象とするようご注意ください。


さらに、Web CrawlerをAmazon Q Businessと連携する場合、以下の前提条件をクリアする必要があります。


①Amazon Q Business のアプリケーションが作成済みであること。


②クロール対象としたいウェブサイトのURL情報(シード URL またはサイトマップURL)がテキストファイル、またはS3バケットへ保存されていること。


③(認証が必要なサイトの場合)認証情報が準備されていること。 ※認証タイプ(Basic, NTLM, Kerberos, SAML, フォーム認証)に応じたユーザー名・パスワード、およびフォーム認証の場合は各入力項目の XPath 情報などが必要です。これらは AWS Secrets Manager に保存されている必要があります。


④(必要な場合のみ) 内部サイトやプロキシへの接続情報が準備されていること。 ※VPC を使用して内部サイトに接続する場合はサブネット ID、ウェブプロキシを使用する場合はホスト名とポート番号が必要です。





Amazon Q Businessのデータソース(Web crawler)の設定方法
-Webサイト-

まず、一般の「ウェブサイト」と連携する基本パターンについて紹介します。


※HTTPSサイトのみをサポートしており、HTTP または自己署名証明書対応のウェブサイトはサポートされていません。

データソースの設定

それでは、具体的なデータソースの設定方法を見ていきましょう。


1.AWSマネージメントコンソールにログインし、Amazon Q Businessの画面にて、データソースを設定したいアプリケーションを一覧から選択します。


2.メニューから「Data sources」を選択し、「Add data source」をクリックします。


3.Data sorcesの一覧から、「Web crawler」を選択します。


4.データソースの設定画面にて設定値を入力し、「Add data source」をクリックします。

各設定項目の内容は以下の通りです。

項目内容
Data source nameデータソースの名前を入力します。
Description
- optional
データソースの説明を入力します。
Sourceソースのタイプについて以下4タイプから選択します。

・Source URLs
→クロール対象のWebページURLを直接入力します。
・Source URLs file
→クロール対象URLの一覧ファイルの配置先S3バケットを指定します。
・Source sitemaps
→サイトマップ(XML)のURLを直接入力します。
・Source sitemap URLs file
→サイトマップURLの一覧ファイルの配置先S3バケットを指定します。
Authentication

もしくは

Web proxy
- optional
SourceでURLを選択した場合はAuthentication以下の5つの認証方法から選択します。

・No authentication
→認証が不要な場合に選択
・Basic authentication
→ベーシック認証が必要な場合に選択
・NTLM/Kerberos authentication
→NTLM認証が必要な場合に選択
・Form authentication
→フォーム認証が必要な場合に選択
・SAML authentication
→SAML認証が必要な場合に選択

Sourceでsitemapを選択した場合はWeb proxyの設定が可能です。
・Host name:プロキシサーバーのホスト名
・Port number:プロキシサーバーのポート番号
・AWS Secrets Manager secret:アクセス認証
Configure VPC and
security group -
optional
VPCに接続する場合は以下の設定値を入力します。

・Virtual Private Cloud (VPC)
→Q Businessを接続するVPCについて、作成済みのVPCから選択可能
・Subnets
→上記で選択したVPCの中でQ Businessを接続したいサブネットを選択
・VPC security groups
→データソースへのアクセスを許可するセキュリティグループを選択
IAM roleデータソースに設定するIAMロールを選択します。

以下の2種類から選択が可能です。
・Create a new service role (Recommended)
・既存のIAMロール
Sync domain range同期の範囲を以下3つから選択します。

・Sync domains only
→ウェブサイトのドメイン本体ページのみを同期
・Sync domains with subdomains only
→ウェブサイトのドメインとそのすべてのサブドメイン含むページを同期
・Sync everything
→ドメインやサブドメインのページに加えて、リンク先の外部ドメインのページもすべて同期
Maximum single file size1ファイルの最大サイズを指定します。

・標準のテキストドキュメント: 最大50MB
・動画/音声が有効な場合:
 - 動画: 最大10,240MB (10GB)
 - 音声: 最大2,048MB (2GB)
Multi-media content configuration
- optional

・ Advanced indexing
画像や音声、映像を扱える用にする追加機能の設定が可能です。
以下の3項目それぞれ有効化有無を選択できます。

・Visual content in documents
→ドキュメントに埋め込まれた様々な種類の画像から情報やインサイトを抽出可能

・ Audio files
・Video files
→音声や動画ファイルから文字起こしやコンテンツを抽出可能
Sync modeSyncのモードについて、以下2つから選択します。

・Full sync
→以前の同期状態に関係なくすべてのコンテンツを同期するモード
・ New, modified, or deleted content sync
→新規、変更、または削除されたコンテンツのみを同期するモード
Sync run schedule同期の頻度を以下の6パターンから選択します。

・Run on demand
・Hourly
・Daily
・Weekly
・Monthly
・Custom

5.データソースが作成され、StatusがActiveとなったことを確認したら、画面上部の「Sync now」をクリックします。


6.「Sync started successfully…」のポップアップが表示され、Syncが開始されたことを確認します。


7.「You successfully synced…」のポップアップが表示され、Sync Historyにに記録されているFailedカウントが0であれば問題なく同期が完了しています。

8.AWSのマルチアカウントについての事例を質問してみると、回答が返ってきました。また、回答のソースがデータソースとして設定したWebサイト内の情報であることが確認できました。


※本章で扱ったWebサイトは以下です。

・アシスト事例 - アマゾンウェブサービス -
 (https://www.ashisuto.co.jp/case/product/aws)

Amazon Q Businessのデータソース(Web Crawler)の設定方法
-イントラサイト-

続いて、イントラサイトと連携する応用パターンについて、以下それぞれのケースの事前準備内容も合わせて紹介します。


■ケース

①オンプレミス環境のイントラサイト


②AWSプライベートサブネット環境のイントラサイト


事前準備

上記のケースについて、それぞれ以下の事前準備が必要です。


■共通:AWS側

  • Amazon Q Businessコネクタ用のVPC周りのリソース設定
    • VPC(*1):1つ
    • サブネット(*1):プライベートサブネット1つ
      ※そのほかのリソースについては各ケースに記載

(*1)以下の AWS リージョンとアベイラビリティーゾーンのいずれかに存在する必要があります


[対応リージョンとアベイラビリティゾーン(2025年11月現在)]

  • 米国西部 (オレゴン)/us-west-2—usw2-az1、usw2-az2、usw2-az3
  • 米国東部(バージニア北部)/us-east-1—use1-az1、use1-az2、use1-az4
  • ヨーロッパ (アイルランド)/eu-west-1—euw1-az1、euw1-az2、euw1-az3
  • アジア太平洋 (シドニー)/ap-southeast-2—apse2-az1、apse2-az2、apse2-az3

  • 認証情報登録(イントラサイトへのアクセスに認証が必要な場合)


■ケース①:AWS側

  • オンプレミスとのネットワーク接続
    AWS VPNもしくはAWS Direct Connectを利用した接続
  • Amazon Q Businessコネクタ用のVPC周りのリソース設定
    • ルートテーブル:1つ(オンプレミスのイントラサイトへのルートがDirect Connect Gatewayまたは仮想プライベートゲートウェイに向いている)
    • セキュリティグループ:1つ
      • インバウンドルール:なし
      • アウトバウンドルール:イントラサイトのIPアドレスまたはネットワーク範囲に対して、HTTPS(ポート443)やHTTP(ポート80)の通信を許可
  • DNS解決設定(必要であれば)
    • オンプレミスのホスト名をVPCから解決する設定

■ケース①:オンプレミス側

  • AWSとのネットワーク接続
    • AWS VPNもしくはAWS Direct Connect接続に対応するルーターやファイアウォールを設定
    • オンプレミスネットワークのルーターに、AWS側のコネクタ用サブネットのCIDRブロックへのルートを追加
  • DNS解決設定(必要であれば)
    • AWSのRoute 53 ResolverからのDNSクエリを許可し、イントラサイトのホスト名を正しく解決できるように設定

■ケース②
(Q Busienessコネクタ側)

  • VPC間接続(必要であれば)
    • コネクタ用VPCとイントラサイト側VPCが異なる場合、VPCピアリング または Transit Gateway で両VPCを接続
  • Amazon Q Businessコネクタ用のVPC周りのリソース設定
    • ルートテーブル:1つ(イントラサイト側VPCのCIDRブロックへのルート)
    • セキュリティグループ:1つ
      • インバウンドルール:なし
      • アウトバウンドルール:イントラサイトサーバーのIPアドレスまたはネットワーク範囲に対して、HTTPS(ポート443)やHTTP(ポート80)の通信を許可
  • イントラサイト用のVPC周りのリソース設定
    • ルートテーブル:1つ(イントラサイト側VPCのCIDRブロックへのルート)
    • セキュリティグループ:1つ
      • インバウンドルール:なし
      • アウトバウンドルール:イントラサイトサーバーのIPアドレスまたはネットワーク範囲に対して、HTTPS(ポート443)やHTTP(ポート80)の通信を許可
  • DNS解決設定(必要であれば)
    • イントラサイトをプライベートホスト名で運用する場合、Route 53 プライベートホストゾーンにレコードを登録

データソースの設定

前章の事前準備が完了した後、Amazon Q Businessのデータソースの設定に入っていきます。

設定項目や設定の流れ、Syncの実行までは「Webサイト」の設定方法と同様となるため、詳細はこちらをご確認ください。


■設定項目(Configure VPC and security group - optional)

イントラサイトの場合は、VPCを使用してデータソースの設定をします。

データソースの設定画面内の以下項目について、事前準備にて作成したAmazon Q Businessコネクタ用のVPC周りのリソースを選択します。


■検索結果
前章で実施した一般のウェブサイトの連携手順と同様に以下の様にイントラサイトの情報を検索することができました。

まとめ

プログラミング不要で、簡単にウェブサイトを連携できるAmazon Q Businessのデータソース機能。

ウェブサイト(公開情報)やイントラサイトを連携することで、AIアシスタントがよりリッチな情報源を持つことができます。情報検索の工数削減に大きく貢献するのではないでしょうか...!

 是非、身近なウェブサイトやイントラサイトでお試しください!




執筆者・シリーズ情報

山庄菜摘 プロフィール画像

2021年に新卒入社し、AWSのフィールド業務を担当している。最近は生成AI分野に興味を抱き、日々Amazon Qの検証を行っている。...show more



■本記事の内容について
 本記事に記載されている製品およびサービス、定義及び条件は、特段の記載のない限り本記事執筆時点のものであり、予告なく変更になる可能性があります。あらかじめご了承ください。

■商標に関して
 ・Oracle®、Java、MySQL及びNetSuiteは、Oracle、その子会社及び関連会社の米国及びその他の国における登録商標です。
 ・Amazon Web Services、AWS、Powered by AWS ロゴ、[およびかかる資料で使用されるその他の AWS 商標] は、Amazon.com, Inc. またはその関連会社の商標です。
  文中の社名、商品名等は各社の商標または登録商標である場合があります。

関連している記事

  • AWS
2025.12.24

「Amazon Q Business」の「Amazon Q Apps」で報告書作成アプリを作ってみた

この記事では「Amazon Q Business」のAmazon Q Appsで報告書作成アプリを作成する方法をご紹介します

  • AWS
2025.11.17

「Amazon Q Business」でS3をデータソースとして設定する方法

この記事ではAmazon Q BusinessでS3をデータソースとして設定する方法についてご紹介します

  • AWS
2025.10.20

「Amazon Q Developer」の使い方(VSCodeにインストールして利用する方法)

この記事では「Amazon Q Developer」の使い方(VSCodeにインストールして利用する方法)をご紹介します

ページの先頭へ戻る