文字認識API のWebサイトへようこそ。 文字認識API は、文字を含んだ画像URLや切り出された文字の画像から、文字認識により抽出した単語とその位置等を取得する機能を提供します。 [1]
本APIでは、携帯電話で撮影した写真などに含まれる文字や言葉がどのように現れているか解析し、それらの単語を検出することが出来ます。 従来、風景写真のように複雑な画像に含まれる文字の認識は困難でしたが、本APIでは、単語データベースと認識した文字の並びを照合し、文字以外の不要な部分を除去しつつ誤った結果の訂正を行うことで精度の高い文字認識を実現しました。 現時点で100万語を超える単語の検出が可能で、今後さらに拡大してまいります。 本技術により、文書だけでなく風景などの複雑な条件の写真からでも文字認識することが可能となっています。 本APIを利用することで文字認識技術によりマッシュアップされた様々なサービス(ナビ、地図、辞書、翻訳、旅行、物品管理など)を構築いただけます。
文字認識API 使用例
文字認識API を用いたサービスの一例として、文字にスマートフォンをかざすことで文字認識し、入力文字として利用できる「撮って文字入力」アプリを2011年12月より提供しています。 本アプリは、カメラで撮った画像からのOCR(文字認識)を文字入力に利用できるAndroid用の文字入力アプリ(IME)です。 その場で撮影した画像のほか、事前に登録した画像から文字認識を行った結果を文字入力に利用できます。 読めない漢字の読みや意味を調べるなど、面倒な文字入力のサポートに活用できます。 そのほか、本アプリは英語、中国語、韓国語、日本語に対応しており、海外で看板に書かれている文字の意味を調べるなどの用途に利用できる予定です。 [2]
撮って文字入力サービス概要
アプリは Androidマーケット™ (下記URL)からダウンロードください。
https://market.android.com/details?id=jp.co.nttdocomo.ocrime
文字認識API を利用したものではありませんが、APIの一部機能をアプリケーション上に搭載し、認識対象は料理名に限定した Androidアプリ を Androidマーケット™ で公開しております。 端末上で認識処理を行うことで高速動作を実現している等、 文字認識API とは動作が異なりますが、単語検出の性能評価にご利用ください。
詳細については以下のサイトをご参照ください。
http://www.nttdocomo.co.jp/info/news_release/2011/09/16_01.html
文字認識API を用いたサービスとして (有)来栖川電算 から、 Twitter [6] および Evernote [7] と連携した文字認識サービス タンゴチュウ がリリースされています。 文字認識API を用いた文字認識の性能は同サービスによりご確認いただけます。
詳しくは タンゴチュウ ウェブサイト をご覧ください。
脚注
| [1] | 現在は単語としての検出機能のみで、文章としての結果は取得できません。 |
| [2] | 多言語対応は一行認識でのみの利用となります。 |
| [3] | 提供期間が過ぎるとダウンロードしたアプリがご利用になれません。 |
| [4] | ただし本アプリをダウンロードする際に別途パケット通信料が発生します。 |
| [5] | 「Androidマーケット」「Android」は、Google Inc.の商標または登録商標です。 |
| [6] | 「Twitter」は 、Twitter, Inc.の商標または登録商標です。 |
| [7] | 「Evernote」は 、Evernote Corporationの商標または登録商標です。 |