京都発祥日本語入力「freewnn」は(今度こそ)どこまで賢くなれるか?
TRANSCRIPT
簡単に自己紹介。
● 東海道らぐ元名古屋案内人です– 東海道らぐ = Tokaido Linux User Group– ちなみに現在は神奈川県民
● ちびぎーこ保護者会の人
– ちびぎーこ保護者会 = 別名:日本openSUSEユーザ会
– 夏コミ、書きました。 「3日目 東P15b」
● 最近はおーぷん万葉を始めてます– 日本語入力についていろいろ研究中。。。
おーぷん万葉とは
● 目的「自由な日本語入力環境を手に入れよう!」– 現在: かな漢字変換ソフト「Izumo」を開発中。
● 現状の問題点:– ビックデータと叫ばれる時代に、開発がアクティブで
自由にコミットメントできる日本語入力システムがない???– インプットメソッド(UI側)も残念な状況orz
→ そんな現状を打破したい!てのが目的です。
今日はFreeWnnのお話
● 京都大・オムロン等が開発したWnnのオープンソース版
– Wnn はここ京都発祥のかな漢字変換ソフトです!
http://www.freewnn.org/
● 名称の由来は「わたしの(W)なまえは(N)なかのです(N)」
ところで、「なかのさん」って誰???
~ Wnn 開発の思い出 ~ より。
● 会議の席上、京大側は、かな漢字変換は単文節変換で十分ではないかという意見を出してきた。しかし、当時パソコンのワープロソフトは文章一括変換が主流。「いくらワークステーションだからといって、今から聞発するのだから、せめて『私の名前は中野です。』という文を一発で変換して欲しい。」と主張したのだった。
● 何回目かの設計会議の冒頭で、京大のY助手が黒板にWnnと書いた。 「これが、我々が今聞発している日本語処理ンステムの名前で、[ ウーンヌ ] と発首します。」と説明があった。 「Wnn」の意味を聞いて一同大笑いし、そしてその後、誰も反対しなかったので、自然に名前が決まっていった。
http://www.masuda.org/wnn-kaihatu.htm
実は昨年のOSC京都の頃に作成。
…だったのだけど、ソースコードがイケてないorz
→ 今回は少しだけ改良!一番イケていなかったローマ字かな変換をライブラリ化
● 「watasi」って打つと「わたし」に変換するアレ● Trieというアルゴリズム(実装方法)で実装したい● ライブラリ化すればIBus以外でも使える! ←これ超重要!
Ibus や Fcitx といったインプットメソッド
ローマ字かな変換
FreeWnnライブラリかな漢字変換ライブラリ
ここを作ってライブラリ化する
Trieとは?
● 通常の木構造に対し、枝にラベルがついたもの– メリット:共通接頭検索が可能になる
0
12 3
4
5 6
7
8
か
み
た
すび
わ
た
し
これがいわゆるラベルこれがついてるとTrieと呼ぶらしい
ラベルをたどることで辞書検索が可能になります→データ圧縮にもつながる
最近のかな漢字変換で非常によく使われる技術ですテストに出るよ!!!(どんなテスト?)
ライブラリ作成の基本であるI/Fの設計に失敗して見事にIBusと結合できなかった!!!
Ibus や Fcitx といったインプットメソッド
ローマ字かな変換
FreeWnnライブラリかな漢字変換ライブラリ
ここがくっつかないんですけど~!!!
大馬鹿者っ!!!
ん?
というわけで今回は…
それとは別の機能「リアルタイム?変換」を展示
お試しいただいた方、ありがとうございました!
ソースコードはこちら: https://github.com/hashimom/ibus-fwnn
「リアルタイム?変換」とは:– キーの入力に反応して漢字変換を行います
言い方変えると、キー入力に反応してFreeWnnで変換を行う
– …が、まだまだ未実装な箇所がある。。。スペースキーが反応しません!(なにっ!??