ATOK省入力データ活用

投稿者: | 2019-02-24

標準辞書にない語をかな漢字変換に学習させる場合、一般的にはユーザ辞書に単語登録をしなければならないのだが、ATOKの場合は他にも方法がある。
一定数の語群がある場合などは専用の変換辞書を作ってしまうというのも一つだが、もっと簡単には確定履歴や省入力データとして、推測変換を行うという方法もある。
辞書への単語登録との違いは、変換候補ではなく推測変換の候補であるので、指定した文字数が入力された段階で自動的に候補が表示されるというもの。ちょうど携帯電話の文字入力のような感じである。
当初、この機能が実装されたときは候補へのアクセスが頻繁に発生するので変換動作が重くなるのではないかという危惧もあったが、今のようなスペックのPCでは問題にならない。使いたくない場合は推測変換自体をオフにすることもできる。
登録語は辞書ユーティリティで追加、修正や削除が可能である。読みと変換語のみで品詞指定やコメントはなく単純である。
確定履歴は、文字通りATOKで確定した語を専用の領域(これも一つ辞書のようなもの)に自動的に登録し、それを推測変換候補として活用する。メモリにだけ一時的に保存したりよく使う履歴だけ、あるいは全てファイルに保存するようコントロールができる。
一方の省入力データは任意に登録したり指定した文書データなどから学習させて辞書にない語を登録しておいたり、予め作成された複数の省入力データ辞書を参照して、同様に推測変換候補として表示させる。
確定履歴は誤変換の場合や一度しか変換しないような語も自動的に登録されてしまうなどの特徴はあるが、ユーザが意識しなくても推測変換候補が育っていく。きちんと候補を追加したい場合は省入力データとして作成するほうが良い。
実際、省入力データで推測変換候補として表示されるなら、あえてきちんと単語登録をしなくても変換できるようになるので、便利さはさほど変わらない。何でも単語登録をして辞書を汚すようなことをするよりは使い分けてみるのも良いのではないかと思い、用語の整理作業をしたところである。