f:id:logicalarts:20191018170934p:plain — AWS pop-up loft Osaka

こんにちは、ロジカルアーツの井川です。

先日、AWS pop-up loft Osakaで開かれた「ML Hans-On」に行ってきました！講師はAWS Startup Solution Architect の針原さんです。

正直、機械学習については全然詳しくないのですが、凝縮した3時間を過ごすことが出来たので、復習のためにもSageMakerについてまとめてみたいと思います。

SageMakerとは？
まとめ
参考サイト

SageMakerとは？

Amazon SageMaker は、すべての開発者とデータサイエンティストに機械学習モデルの構築、トレーニング、デプロイ手段を提供します。Amazon SageMaker は、機械学習のワークフロー全体をカバーする完全マネージド型サービスです。データをラベル付けして準備し、アルゴリズムを選択して、モデルのトレーニングを行い、デプロイのための調整と最適化を行い、予測を行い、実行します。モデルをより少ない労力と費用で、本番稼働させることができます。

https://aws.amazon.com/jp/sagemaker/

機械学習を行うときに必要なワークフローを準備してくれるサービスのようですね。

どんなふうに使うのか？

巷では、機械学習やAI、IoTというのが賑わっていますが、皆さんは実際に使ったことがありますか？私は正直Workshopに参加するまできちんと使ったことがなかったです。機械学習の一般的なワークフローとともにSageMakerをどうやって使用するのか説明します。以下が機械学習の一般的なワークフローです。

f:id:logicalarts:20191021132651p:plain — 機械学習の一般的なワークフロー - ML Workshopより拝借

SageMakerでは、 開発環境としてJupyter Notebook/Labが使えます。 Jupyter Notebookはセル毎に実行でき、必要な要件の確認を容易にします。JupyterLabはJupyter Notebookの後継の対話型開発環境(IDE)です。これらはただインスタンスタイプを選ぶだけ！そうすると、TensorFlow等のライブラリがすでに入っているビルド済みのコンテナイメージが用意されます。

データ収集 - S3等のストレージよりデータを集めてくる。ちなみにCLIやSDKからだとaws s3 sync <source> <dest>で同期可能です
クリーンアップ - SageMakerでは、MLアルゴリズムの選択と最適化を行う
データ変換・ラベル付け - トレーニング環境の整備と運用によってメトリクスでソート、ベストなモデルを取得し、その時の実験環境を再現できる
トレーニング - トレーニングとパラメーターチューニングを行う。SageMakerでは高性能インスタンスを 秒数単位 で使用でき、コストを抑えられる。また分散学習も簡単に出来る
モデル評価 - 結果を評価する
本番環境へのデプロイ
推論・監視 - 本番環境での運用とスケーリング等を行う

SageMakerを使うメリット

機械学習を行うにあたって、選択肢はいくつかあるのかなと思います。例えばGoogle のColaboratoryなども有名ですよね。そんな中で私が考えるSageMakerを使うことのメリットをまとめてみます。（AWSの回し者みたいですみません。）

1.　簡単にワークフローを準備することが出来る！

機械学習を全て自身でやるとなると、どうしても時間がかかってしまいますね。ローカルでやるにしてもGPUなど環境構築に手間もお金もかかってしまいます。。

2.　AWS スポットインスタンスを使うことが出来る！

上に書いたようにお金がかかることが、機械学習を始めることのハードルをあげていると思いますが、スポットインスタンスを使うと、最大90％OFFでインスタンスを使うことができるのです！

3.　運用するためのテンプレートが豊富

環境構築後、どうしたらいいのか分からないっていう初心者の方でも勉強できるようgitにたくさんテンプレートが上がっていたりします。

SageMakerの料金

機械学習のサービスって高そうなイメージでしたが、SageMakerには無料枠もあるので、お試しでやるにはそんなに構えなくても良さそうです。 ※研究開発や事業サービスとして利用する場合には、十分な検討を行ってください。

なぜならSageMakerには無料利用枠があるようです。

無料利用枠

サインアップ後、最初の2か月間が対象
モデル構築のためのノートブック利用にt2.mediumまたはt3.mediumインスタンスを250時間/月
トレーニングにm4.xlargeまたはm5.xlargeインスタンスを50時間/月
リアルタイム推論とバッチ変換用機械学習モデルのデプロイにm4.xlargeまたはm5.xlargeインスタンスを追加で125時間

これだけあれば、お試しで使う分には無料利用枠内に収まると思います。私が今回のハンズオンで行った時は発生しなかったです。

詳細を知りたい方はこちらの公式ページへどうぞ。

まとめ

機械学習は、私たち人の代わりに様々な要素から処理を行ってくれます。そのため、データや機能も複雑になりやすいです。アルゴリズムも多様にある中で、経験と知見をもとに組み合わせることが高精度な結果を生み出すカギとなるようです。面倒な環境構築ワークフローを簡略することで、最も集中すべき推論などの作業に集中することができそうですね！