こんにちは、ロジカルアーツの井川です。
以前Einstein AnalyticsとAWS RDS MySQLを接続してみたのですが、それに続き、今度はAmazon S3と接続してみました。
AWS RDS MySQLと接続したときの記事はこちら↓↓↓
AWS側
さっそくやっていきましょう。S3の画面より、対象となるバケットを開いてください。今回はS3バケットとして「einstein-analytics」を作成しています。
Einstein Analyticsとの連携には親・子フォルダが必要となりますので、それぞれ作成をしてください。
下記は関連パラメータの一覧です。
項目名 | 内容 |
---|---|
バケット名 | einstein-analytics |
親フォルダ | test |
子フォルダ | child |
必須ファイル | schema_sample.csv |
子フォルダchild
の中身が実質の連携データになります。ですので、必須ファイルschema_sample.csv
は子フォルダの中に入れてください。
上の画像で囲んでいるschema_sample.csv
ファイルは項目定義用ファイルとなります。名称固定ですので変えないで使用ください。
項目行だけ中に入れてください。
こちらはschema_sample.csv
ファイルの中身です。
Einstein Analytics側
Einstein Analyticsの手順です。
リモート接続を作成します。
Analytics Studioの歯車アイコン→データマネージャ→接続→データに接続→リモート接続を追加を押下します。
Amazon S3コネクタを選択します。
リモート接続を設定します。
項目名 | 内容 |
---|---|
接続名 | 任意の接続名を入力 |
API 参照名 | 任意のAPI 参照名を入力 |
説明 | 任意の説明を入力 |
Master Symmetric Key | AWS側で設定した値を入力(今回は空) |
Secret Key | AWS側で設定した値を入力 |
Region Name | Asia Pacific(Tokyo) |
Folder PathAccess Key | AWS側で設定した値を入力 |
保存&テストを押下します。
続行を押下します。
接続ソース(今回はAmazonS3Test)を選択します。
同期するS3のフォルダ(今回はeinstein-analytics/testの配下のchild)を選択して、続行を押下します。 ※まだ接続されていないので無効になっています。
Einstein Analyticsに取り込む項目を選択して、続行を押下します。
保存を押下します。
接続が確立されます。
Salesforceから接続したデータと同様に、接続済みデータに登録されています。 これでデータセットとして扱えます。
なぜかプレビューデータがないと表示されるので、データ同期を実行後、レシピを作成でデータが同期できていることを確認しました。
終わりに
RDSに続きS3も接続できるようになりました。 参考になれば幸いです。
参考サイト
Winter'19:Einstein Analytics 新機能メモ(Amazon S3 コネクタ) - Qiita