テキストDB

投稿者: | 2020-10-25

たとえばWZ EDITORのマクロ機能について、これまでブログやその他でどう言及しているか。つまりこれをどう検索して探し出すか。自分が把握していられる量には限界があり、書き物が多くなればなるほど検索は時間も手間もかかることになる。
ワープロ専用機でそういう様々な文章書きをし始めた頃は、全部探し出すなら文書を保存したフロッピーディスクを全部一つずつ挿入して文書を開き、内容を確認していかなければならなかった。これは、印刷した紙を全部見るのに似た作業である。
しかしPCでは、ファイル横断的に中身を検索する機能もあると知っていて、PCを使い始める前頃から、そういう検索も後後必要になるかも知れないという事も予め見越して、後から参照しやすいようにすることを色々と考えた。
書いたデータはだいたい全て保存するように決めていたし、実際そうしている。ファイル横断的に検索を行うには、汎用性の高いテキストファイル形式のものでなければならない。これがワープロ文書のバイナリデータでは、仮にそういう検索機能があったとしてもそのワープロソフトがなければならない。
つまり、テキストエディタに備わっているGREP検索を使って、複数のテキストファイルの中身を検索するのである。
PCを使い始めた初期の頃から、書いた物の原稿は概ね全てテキストファイル形式にして溜め込み、言わば自分が書いた物の全文・全週データベースのようにしている。何十年もため込むのでかなり量はあるものの、メールや手紙の原稿、ブログの原稿、ツイート履歴などを全て合わせても所詮テキストファイルなのでたいして巨大なサイズという程でもない。
そういうデータベース、大袈裟に言えばビッグデータのような群の中からは、テキストエディタのGREP検索機能を使って、簡単に全て抽出することができる。正規表現を駆使すれば、様々な条件で絞り込んで書いた内容をすぐ探し出すことが可能である。
他の多くの人はどうしているか知らないが、とにかく自分はそういう書いた物を履歴として保存しておくという決めを持っていて、文章原稿類は全てテキストファイルとして特定の場所に保存する。保存の仕方はきちんと分類しても良いし、検索用にするならファイル名とか書いた内容の書誌情報というか、要は書いた日付だけでもわかるようにしておいて、それを後からテキストエディタのGREP検索で探し出せば良いのである。
20年とか、それ以上前に書いた原稿などを探し出して読み返すのもまた、今となっては面白いものである。たまに、自分の書いた昔の日記を読み返すのを面白いと思う、そういうのにも似ているのかも知れない。