文字認識API

文字認識API のWebサイトへようこそ。 文字認識API は、文字を含んだ画像URLや切り出された文字の画像から、文字認識により抽出した単語とその位置等を取得する機能を提供します。 [1]

本APIでは、携帯電話で撮影した写真などに含まれる文字や言葉がどのように現れているか解析し、それらの単語を検出することが出来ます。 従来、風景写真のように複雑な画像に含まれる文字の認識は困難でしたが、本APIでは、単語データベースと認識した文字の並びを照合し、文字以外の不要な部分を除去しつつ誤った結果の訂正を行うことで精度の高い文字認識を実現しました。 現時点で100万語を超える単語の検出が可能で、今後さらに拡大してまいります。 本技術により、文書だけでなく風景などの複雑な条件の写真からでも文字認識することが可能となっています。 本APIを利用することで文字認識技術によりマッシュアップされた様々なサービス(ナビ、地図、辞書、翻訳、旅行、物品管理など)を構築いただけます。

  1. policestation
  2. kumamoto
  3. airport
  4. 熊本空港
  5. 派出所
  6. 派出所
  7. 警備
  8. 熊本
  9. 机場
  10. バニ

文字認識API 使用例

サービス事例

撮って文字入力

文字認識API を用いたサービスの一例として、文字にスマートフォンをかざすことで文字認識し、入力文字として利用できる「撮って文字入力」アプリを2011年12月より提供しています。 本アプリは、カメラで撮った画像からのOCR(文字認識)を文字入力に利用できるAndroid用の文字入力アプリ(IME)です。 その場で撮影した画像のほか、事前に登録した画像から文字認識を行った結果を文字入力に利用できます。 読めない漢字の読みや意味を調べるなど、面倒な文字入力のサポートに活用できます。 そのほか、本アプリは英語、中国語、韓国語、日本語に対応しており、海外で看板に書かれている文字の意味を調べるなどの用途に利用できる予定です。 [2]

撮って文字入力サービス概要

撮って文字入力サービス概要

アプリのトライアル提供について

提供期間
2011年12月上旬 から 6ヶ月間程度(予定) [3]
対応機種
Android 2.3 以上が搭載されたスマートフォン。
アプリのダウンロード方法

アプリは Androidマーケット™ (下記URL)からダウンロードください。

https://market.android.com/details?id=jp.co.nttdocomo.ocrime

利用料金
無料 [4]

アプリの利用イメージ

  1. カメラで撮って読み取る範囲を指定し、認識結果をIME入力として表示
  2. IME入力を用いて、翻訳や検索など自由にサービスを利用
利用イメージ

アプリの利用方法

「撮って文字入力」は、その場で撮影したカメラの画像から範囲を指定して利用することができ、 行画像文字認識API の機能により実現しています。

利用イメージ

利用イメージ

料理メニュー翻訳

文字認識API を利用したものではありませんが、APIの一部機能をアプリケーション上に搭載し、認識対象は料理名に限定した Androidアプリ を Androidマーケット™ で公開しております。 端末上で認識処理を行うことで高速動作を実現している等、 文字認識API とは動作が異なりますが、単語検出の性能評価にご利用ください。

詳細については以下のサイトをご参照ください。

http://www.nttdocomo.co.jp/info/news_release/2011/09/16_01.html

タンゴチュウ

文字認識API を用いたサービスとして (有)来栖川電算 から、 Twitter [6] および Evernote [7] と連携した文字認識サービス タンゴチュウ がリリースされています。 文字認識API を用いた文字認識の性能は同サービスによりご確認いただけます。

詳しくは タンゴチュウ ウェブサイト をご覧ください。

脚注

[1]現在は単語としての検出機能のみで、文章としての結果は取得できません。
[2]多言語対応は一行認識でのみの利用となります。
[3]提供期間が過ぎるとダウンロードしたアプリがご利用になれません。
[4]ただし本アプリをダウンロードする際に別途パケット通信料が発生します。
[5]「Androidマーケット」「Android」は、Google Inc.の商標または登録商標です。
[6]「Twitter」は 、Twitter, Inc.の商標または登録商標です。
[7]「Evernote」は 、Evernote Corporationの商標または登録商標です。

トライアル提供

文字認識API の詳細については以下リンクをご参照ください。

本トライアル提供を通じて、お客様から様々なご意見をいただくことで、 文字認識API の改善を図り、商用提供に向けた技術開発に活かしてまいります。 ドコモは、モバイルを核とした「総合サービス企業」を目指し、「カメラ越しに文字を表示させるだけで何でも教えてくれる」携帯電話の実現に向け、今後も研究開発を進めてまいります。