ユーザー辞書の登録単語リニューアルを

投稿者: | 2015-01-10

ATOKでもMS-IMEでもGoogle日本語入力でも、IMEにはユーザー辞書というのがあって、システム側で用意されている辞書のみでは変換できない単語を登録していく領域がある。
その昔、ワープロ専用機の時代は変換辞書そのものが貧弱でユーザー辞書の活用が必須だった。それでもユーザー辞書として登録できる単語数に制限があったり、基本的に名詞としてしか登録できなかったりという制限もあって、登録しなければならない語数が増えると辞書を分けたりして苦労して使っていたものだった。自分も何だかんだ制限いっぱいの約2000語程度を登録していたこともあった。
今は、どのIMEもそれなりに基本辞書、システム辞書が充実していて単語登録という点ではユーザー辞書の出番は少なくなっているが、それでも固有名詞や独自の表現、よく使う記号などはユーザー辞書を活用しないと効率が悪い。
ATOKの場合のユーザー辞書は、単語を登録したり学習内容を格納したりする標準のユーザ辞書の他にも任意に変換辞書を作成することが可能だ。ネットからダウンロードしてきた用語集や他の形式の辞書などをベースに、ATOK用の専用変換辞書を作成し、それを標準の辞書やユーザー辞書と自由に組み合わせて変換候補に表示させるように出来る。Google日本語入力やMS-IMEはシステム標準の辞書とユーザー辞書という単純な組み合わせに比べると、ATOKの場合は慣れないとどう辞書を組み合わせるかが少し複雑だが、テキストエディタのカスタマイズ同様に、自分の使い勝手に合った運用が可能となる。無論、そもそも変換効率には定評があるので、難しければ標準的な設定で使ったとしても何ら問題は無い。
そういう組み合わせが自由に出来るので、特定の分野の専門語など一定の用語体系のものは専用辞書を作成し、一般用語で変換できないもの程度を通常のユーザー辞書に登録するようにしている。
しかしこのユーザー辞書も、予め必要な設定を行わないと自動登録単語として誤変換の結果が登録されたり、二度と変換しないような困った単語が辞書に登録されてしまって、後で変な変換に悩まされたりする事になる。
自分の場合は、そういうのが嫌なので、極力自動登録単語が発生しないように学習機能を制限している。自分で登録した単語についても時間があるときに一度全部見直して整理してみるのが良い。登録した品詞が間違っていたり、既に二度と変換しないような語が登録されたままになっていたり、あるいはATOKも以前のバージョンから辞書を引き継ぎ続けていると、既にシステム辞書に登録されていたりして、ユーザー辞書に登録しておく意味がなくなっている単語も存在する。
こういう場合は、辞書ユーティリティで登録単語をテキストファイルに出力してから、一旦ユーザー辞書の登録単語を全て削除してしまう。
こうすると、基本的に標準辞書のみで変換することになるので、出力した登録単語のテキストファイルを開き、要らない単語やその状態のシステム標準辞書で変換できてしまう単語を削除する。可能なら誤って登録されている品詞も修正し、今後も登録単語として残しておく必要がある語のみのリストを作成する作業を行うわけである。
そのリストを、再び辞書ユーティリティから一括で登録すると、辞書のリニューアル作業が完了するという訳である。
すこしくらいの余計な単語が登録されていても、今のパソコンの能力からすると問題になるようなことはないと思うが、それでも要らないものが変換候補になってくるのは気分が悪いので、こんな作業も時々やってみると良いのではないか。