オープンソースの手書き文字入力ソフトウェア

いくつかオープンソースの手書き文字入力ソフトをいじってみたんですけど、結論から言うと、それぞれ一長一短あって、それらの長所を全部合わせると、それなりに使えそうなソフトが丁度出来上がるのではないかという歯痒い印象を受けました。

やはり電子辞書とか Windows とか市販品はさすが。認識を受け付ける「字形」も手書きに合わせてあるというか。

例えば「白」という漢字。最初の一画目は左斜め下に向かって書くのが普通ですけど、Tomoe のデータは元となっているフォントが悪いのか、垂直に降ろすように書かないと正しく認識されない。

Ubuntu も色々なプラットフォームに進出していて、欧米の人だとオープンソースで結構使えるツールが揃ってきてますけど。

日本語向けに Linux 用タブレット ATOK みたいなのが市販されて欲しいかな。

1. Tomoe

http://tomoe.sourceforge.jp/cgi-bin/ja/blog/index.rb

これは SCIM のアイコンの右クリックメニューにある「手書き認識」から利用できるもの。

長所は、漢字ストロークモデルが備わっていることや、漢字の読みを調べられること、Stroke-Editor というプログラムを利用して漢字モデルの再編集ができそうなこと。

短所は、1文字ずつの入力にしか対応していないことと、アルファベット等の文字のモデルがなさそうなこと。なのでキーボード代わりの文字入力には使えない。

2. Tegaki Project

http://tegaki.sourceforge.net/ http://www.tegaki.org/

Zinnia オンライン手書き文字認識エンジンを利用するデスクトップ向けのソフト。

漢字ストロークモデルは Tomoe のものをコンバートして利用してるみたいです。

まだ開発は始まって間もないようでマイナーな感じですけど、karmic koala の公式リポジトリにパッケージがすでに存在します(日本語漢字ストロークモデル除く)。

また、intrepid および jaunty 向けのパッケージはこちらの PPA にあります(こちらには日本語漢字モデル有り)。

ただ、自分が試した限りでは他のプログラム上のカーソル位置に直接文字を入力するってことができなさそうなんですよね。まだ実装されてないのか、自分の設定が悪いのか、それとも tegaki のウィンドウ上の入力文字列をコピペして利用しろっていう仕様でいくつもりなのか。

訂正SCIM のアイコンやパネルから Tegaki を選択して呼び出すことができ、テキストエディタ等のカーソル位置に文字を入力することもできました。

tegaki-menu

長所は、漢字ストロークモデルがあらかじめ備わっていることや、多くの文字を一度に入力していくのが Tomoe よりできそうなところ。

短所は、読みが調べたり、プリセットの漢字モデルを再編集する機能が現時点では備わっていないことや、アルファベット等の他の言語のモデルがないこと。

3. CellWriter

http://risujin.org/cellwriter/

オープンソース界に彗星のように現れた手書き文字入力ソフト。 😯

Ubuntu Netbook Remix にも標準インストール。

Windows Vista や Windows 7 の手書き入力パネルに近いインターフェイスをしていて、文字を書いてどんどん入力していくことができます! 😀

・・・ただ、アルファベットやひらがな、カタカナなど文字の種類が少ないものでないと事実上利用することはできません。😐

CellWriter は、文字のストローク情報というのが備わっていなくて、使用を開始する前に文字を手で書いて学習させる作業が必要なわけです。

アルファベットならそういう作業はすぐに終わってしまいますが、漢字は当たり前ですが普通に使用するだけでも何千とあるのでこりゃ無理かなと。

しかし、Tegaki Project も Tomoe の漢字モデルのデータを流用してるわけですから、データを CellWriter 用にコンバート出来さえすればなんとかなるんではと自分のような一般素人は考えてしまいます。

開発者のホームページにある論文 pdf の Asian Languages の項を見ると、javeDict の漢字データを利用するアプローチが言及されていたので、ひょっとしたらと思い開発者の方に問い合わせてみたんですが、実際にそれは試していなくてあくまで論理的な話、もちろん Tomoe のデータをハックしてコンバートし導入することは可能だろうけど、という回答。

覚えさせた文字に関しては認識して、この様に漢字もひらがなも書いていけるんですが、

cellwirter-input-panel

トレーニング画面には膨大な漢字があるわけです。残念。😦

cellwriter-train-mode

広告

2件のコメント »

  1. kawaji said

    Tegaki Project に関して訂正。

  2. kawaji said

    Tegaki Project のサイトが移動したようなので URL を修正。

RSS feed for comments on this post · TrackBack URI

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

%d人のブロガーが「いいね」をつけました。