2016/09/12
現在Eagle Eyeでは顔認識と連携したデモを作成しておりますが、人物以外の「物体」も検出ができるような「物体認識」API, ソフトウェアについてインターネット上で調べられる限りの物体認識の情報をまとめてみましたので公開致します。
物体認識は顔認識と異なり、ほとんどがRESTで提供されており、一部のOSSのエンジンでGPUアクセラレート可能なオンプレ型式での提供となっていることから、今回はRESTだけではなくオンプレでもテストを行ってみました。
ここでは折角ですので自社のリソースを使用し、物体認識のテストも行えるだけ行って結果も紹介しております。テストに使用した写真はインターネットニュースサイトの写真です(ネットで「Uptown-Sweats-by-Kiya-Tomlin-Sandra-Cadavid-boutique-opening.jpg」と検索すれば表示されると思いまので、興味あれば探してみてください)。
テスト内容は上記写真を何の加工もなく、各APIで何もカスタマイズ、チューニングせずにどれだけの認識精度を出せるかを実施しました。
取得したい内容は物体の名称やカテゴリ、画像そのものの説明となります。今回は結果表示にばらつきが多く、採点が難しいので、今回はランキング型式にはしておりません。
検証実施者の私見としては、「Clarifai」の画像タグが思った以上に精度が高く、また広範囲にデータを拾っているように見えました。ただしConfidenceが表示されないので、どこまで自信があるのかが不明ですが・・・。
またTensorFlowも折角検証環境にGPUがあったため、GPU版でテストを行ってみました。
学習を全く行っていないため精度は低いのですが、やはりノートPCと比べると数十倍の実行速度で分析完了しました。
今後、まだまだ色々なAPIやソフトウェアが物体認識の世界でも出てくると思いますので、引き続きトラッキングしたいと思います。
以下の表、結果につきましても株式会社イグアスが独自に調査、検証、テスト実施、結果判定を行ったものであり、いかなる企業、団体とも関連なく行ったものです。また順位やスコア出力は全て株式会社イグアスが独断で行ったものであり、下記内容、結果から発生するいかなる損失や損害につきましても一切保証するものではありません。
各会社名、商品名、サービス名、ロゴは、各会社のものとなります。
企業名 | 国籍 | 初出 | サービス名称 | 枝名称 | 提供形態 | API形式 | 独自画像の学習 | 認識度 | 検出内容 | 課金体系 | URL | 独自デモ結果 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
物体/説明 | 物体/分類 | 物体/タグ | ランドマーク | 顔 | 顔/性別 | 顔/年齢 | 顔/有名人 | 文字 | ロゴ | 色 | XXX | 無料枠 | 有償 | |||||||||||
IBM Watson Group (Parted of IBM) |
US | 2014 | IBM Watson Developer Cloud | Visual Recognition | SaaS | REST | ○ | N/A | ○ | ○ | ○ | ○ | ○ | ○ | 250API/D 1,000Lrn/M |
$0.002/ObjAPI $0.004/FaceAPI |
Watson Developer Cloud |
|
||||||
Microsoft | US | 2015 | Cognitive Services | Computer Vision API | SaaS | REST | ○ | N/A | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | 5,000API/M | $1.50/1,000API (10API/s) |
Computer Vision API |
|
||
US | 2016 | Google Cloud Platform | Google Cloud Vision API | SaaS | REST | N/A | ○ | ○ | ○ | ○ | ○ | ○ | ○ | 1,000API/M | $2.50/1,000API (1,001-1Mil) |
Google Comput Cloud Vision API |
|
|||||||
Clarifai | US | 2013 | Clarifai | - | SaaS | REST | N/A | ○ | 5,000API/M | Sub $19/M 20,000API/M |
Clarifai | Predicted Tags:
|
||||||||||||
CloudSight | US | 2014 | CloudSight | - | SaaS | REST | N/A | ○ | - | Sub $49/M 800API/M |
CloudSight |
|
||||||||||||
Image Vision Labs | US | 2009 | ImageVision | - | SaaS | REST | N/A | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | 100API/D | Sub $29/M 250API/D |
Image Vision Labs |
|
|||||
Imagga | BG | 2008 | Imaaga | Image Recognition API | SaaS | REST | ○ | N/A | ○ | ○ | ○ | - | Sub $14/M 12,000API/M 2API/S |
Imagga |
|
|||||||||
ClevAPI | RU | 2015 | ClevAPI | - | SaaS | REST | N/A | ○ | 1,000API/M | Sub $15/M 10,000API/M |
ClevAPI |
|
||||||||||||
NTT DoCoMo | JP | 2013 | docomo Developer support | 画像認識 | SaaS | REST | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ○ | 2,000API/M | 商用不可 | 画像認識 |
|
||||||
US | 2015 | TensorFlow | - | On Premis | C++/Python | ○ | △ | △ | △ | △ | △ | △ | △ | △ | △ | △ | △ | △ | - | - | TensorFlow | "I tensorflow/examples/label_image/main.cc:207] jigsaw puzzle (963): 0.45199 I tensorflow/examples/label_image/main.cc:207] toyshop (711): 0.049473 I tensorflow/examples/label_image/main.cc:207] gondola (236): 0.0354427 I tensorflow/examples/label_image/main.cc:207] restaurant (694): 0.0302614 I tensorflow/examples/label_image/main.cc:207] prison (702): 0.0236405" |
△・・・プログラム次第で何でも実現できるため