IMEの学習機能

投稿者: | 2019-02-24

かな漢字変換の仕組みには、何らかの学習機能があるのが普通である。ワープロ専用機の時代から、変換候補を順位付けしたり文節の区切りを覚えるくらいの機能はあった。
今のATOKでは、そういう基本的な学習はもちろん、それがAIにもなって、確定履歴を推測変換に使ったり自動で未登録の単語を登録したりして、辞書を使い手の変換癖に馴染むように成長させていく。
それはそれで良いところが多い反面、どんな文章を入力しているかが監視され、プライバシーが侵害されているようにも思えて不安になることもある。そうではなくても、自動登録の機能などでは誤変換も学習してしまうことがあって厄介である。
学習機能はユーザが統制できる場合もある。ATOKの場合、学習機能全てを使わないという選択もあるようだが、これをするのはさすがにやり過ぎで、もう少し機能的に選択をしたいものである。
ATOKでコントロールできるのはだいたい次のようなものだ。
・自動単語登録の有無
・任意登録単語の編集
・用例の編集
・省入力データの編集
・AI学習の有無
・修正履歴のクリア
・確定履歴の修正
単語の自動登録は、自分としてはあまり必要がないと思う。これは誤変換があったり、その後二度と変換しない語が登録されたりするからである。設定は「一時」にしてメモリに保存し、起動中に同じ変換があった場合にのみ反映されるようにしている。
省入力データも、変に学習機能やツールを使うと要らないデータまでもが登録されてしまうので、自動的な機能については使わない。確定履歴は入力したテキストがそのまま履歴として残るということで、入力した場所以外にも勝手にコピーが取られているのと同じであるから、自分以外が使わないPCであったとしてもプライバシーを考えると好ましくないと思い、せいぜいメモリに保存する程度にしている。
機能の選択ということもあるが、過度に何でも学習させてしまうとそういう弊害もあるし、特別深く学習させなくても変換機能自体が進化しているので、そんなに困ることはないだろうと思うのである。