AI、マシンラーニングにおけるAWS、Azure、GCP、IBMの技術動向

みなさん、こんにちは。今年も元気いっぱい佐藤です。

昨年に引き続きAI、マシンラーニングはもちろんのこと、ブロックチェーン、コンテナ、音声UIは今年も熱くなりそうです。
昨年行われたAWS re:Inventでも多くのAI、マシンラーニング系新サービス、Echoのビジネスエコシステムが発表されました。
ブロックチェーン関連が出るかなと思っていましたが、こちらはありませんでしたね。

今日は現時点での今年もホットなテクノロジーであるAI、マシンラーニングについて各社の動向を考えてみたいと思います。

 

学習済みAI

 

画像認識

AWSはre:Inventで画像認識のAmazon Rekognitionの機能が拡張されましたが、画像認識ではまだAzureが強く、抽出可能なタグ情報は量、精度ともに高いようです。

IBMもBluemix、Watosonの一部がIBM Cloudに統合され、以前よりは利用しやすい価格になりましたね。

 

上記の画像を各社の画像認識APIに食わせて、自動的にタグ付けされた結果です。

※タグは信頼度が80%以上のみを抽出しました

 

AWSは HumanPeoplePersonLeisure ActivitiesWalking

Azureは personoutdoorpeoplestreet

GCPは vehicle のみ

IBMは80%以上のタグ付けはできませんでした。。

 

Azureはタグ付けだけでなく画像の内容を文章で出力してくれます。

今回の例ですと “a group of people walking down a street” でした。

すごいですね。

 

 

音声認識

Speech to Text、Text to SpeechでもAzureが先頭を走っています。

Speech to Textの対応言語はGCPの方が多いですが、日本語の精度がいまいちです。

雑音が多い状況での認識率やストリーミング(WebSocket)でのリアルタイム認識など精度、機能共にAzureがこの領域ではダントツですね。

また、ビジネス会話に特化して学習させているのもAzureの特徴です。

 

Speech to Text)

AWSは2言語

Azureは29言語

GCPは119言語

IBMは8言語

 

Text to Speech)

AWSは25言語(話者のバリエーションは52種類)

Azureは42言語(話者のバリエーションは72種類)

GCPとしては提供なし

IBMは10言語(話者のバリエーションは14種類)

 

もちろん各社日本語に対応しています。

 

 

自前でモデルを作成

 

ツール

 

本格的にマシンラーニングを始めようとすると多くのことを学習する必要があります(学習コストが高い)

これを緩和するため、AWS、Azureはマシンラーニングを簡単に使うためのツールを出してくれています。

ツールに関しては個人の好みや、知識・経験値によってなので比べるのは難しいですが、初心者向けということですとAzureのMachining Learning Studioがダントツだと思います。

Machining Studioは作成したモデルがエクスポートできない、ディープラーニングには向かないなど制約がありますが、マシンラーニングの取っ掛かりとして活用するには十分な機能となっているのでオススメです。

昨年秋に中級者向けにMachine Learning Servicesというツールもリリースされ、ディープラーニングやデプロイ先も自由に選べるようになりました。

AWSもre:InventでSageMakerを発表しましたが、出たてということもあり学習コストはそれなりにかかってしまうかなという印象です。

 

  • Azure Machining Learning Studio 

https://studio.azureml.net/

 

  • Azure Machining Learning Studio

https://studio.azureml.net/

 

  • Amazon SageMaker

https://aws.amazon.com/jp/sagemaker/

 

 

GPUインスタンス

IaaSが強いAWSはGPUのラインナップも豊富でパワフルです。

最近は専用イメージも用意されドライバーのセットアップなど環境づくりの手間が削減されるようになっています。

AWSはTesla V100/K80、1インスタンスの最大サイズは16GPUs

AzureはTesla K80、1インスタンスの最大サイズは4GPUs

GCPはTesla P100/K80、1インスタンスの最大サイズは8GPUs

 

 

今年もAI、マシンラーニングのホットなユースケースが出てきそうですし、私達もイノベーティブな活用事例を作っていきたいと思います!