「FESS」を導入してファイルをググってみよう

ソフトウェア

 

PC作業をしているとき、

「あのファイルどこに保存したっけ??」

とか

「あのファイルの内容はわかるんだけど、名前忘れた~」

とかありませんか?

 

自分のCドライブの中だったらまだしも、社内の共有フォルダで一つのファイルを探すのは大変です。

 

社員数が多ければ多いほど保存されるファイルも多くなり、ファイルを探すのに時間がかかりますよね。

 

そんな無駄な時間を最小化するために、フリーの全文検索システム「FESS」を導入しましょう。

 

「FESS」に慣れると、いちいちファイルの保存先を覚える必要がないので仕事の効率がすごくよくなります。

ファイルを「ググる」ようになると、もう元には戻れませんよ!

 

「FESS」とは?

 

「FESS」とは、オープンソースの全文検索システムです。

 

オープンソース全文検索サーバー Fess
Fess (フェス) は「5 分で簡単に構築可能な全文検索サーバー」です。 Java 実行環境があればどの OS でも実行可能です。 Fess は Apache ライセンスで提供され、無料 (フリーソフト) でご利用いただけます。

 

HPを見てもらえばわかるように、「5分で簡単に構築可能」なことを売りにしています。

 

その他の特徴もHPを参照ください。

 

全文検索システムとは?

 

Windowsで何かのファイルを探そうとするとき、エクスプローラ右上の検索窓に検索したい文字列を入力しますよね。

 

エクスプローラの検索窓で検索するためには、ファイル名と入力文字列が合致する必要があります。

これを、「ファイル名検索」と呼ぶそうです。

 

また、テキストファイルやOffice Wordなどのファイルでは、ファイル内の文字列を検索する機能があります。

これを、「単一ファイル内の文字列検索」と呼ぶそうです。

当然、別のファイル内で同じ文字列を検索したい場合は、そのファイルを開いて検索しなければなりません。

 

それに比べ、「全文検索」とは、「複数文書にまたがって、文書に含まれる全文を対象とした検索」を意味します。

 

要するに、「全文検索システムに検索したい文字列を突っ込むと、ファイルの中まで全て検索してくれる」ということです。

 

もちろん、検索のたびに全ファイルのすべての中身を解析していては時間がかかってしまいます。

 

なので、「全文検索システム」は所定のタイミングで検索対象フォルダ内の全ファイルを解析(これをクロール、クローリングと呼ぶ)し、各ファイルごとにインデックスを作ります。

 

そして、「全文検索システム」に検索したい文字列が突っ込まれると、クローリングで作成されたインデックスと文字列を比較し、合致するインデックスを持つファイルを検索結果として表示します。

 

なので、「全文検索システム」は非常に速くファイルを検索できます。

 

「FESS」立ち上げ時の注意点

 

実際に立ち上げてみた際の注意点を記します。

なお、「FESS」のバージョンは12.4.3です。

 

OSSなので、サポートがない

 

当然ですが、OSSなので技術的なサポートが期待できません。

 

一応、システムに関する質問を受け付けるページはありますが、過去の質問を見てみると、

「商用サポート(有償)を受けてください」的な回答が目立ちました。

 

立ち上げやカスタマイズで不明点があっても、自力で何とかするしかないです。

 

組み込みElasticSearchは開発用

 

「FESS」の全文検索は「ElasticSearch」という検索エンジンを使っています。

 

「FESS」には「ElasticSearch」が組み込まれているので、そのままでも動作するのですが、本番運用時は「ElasticSearch」は別に立ち上げた方が良いようです。

 

メモリ消費が激しい

 

インデックスの量に比例すると思いますが、かなりメモリを消費します。

 

本格的にファイル検索システムとして導入を検討する場合は、メモリをたくさん積んだマシンが必要になるでしょう。

 

まとめ

 

オープンソースの全文検索システム「FESS」を紹介しました。

 

普段、ネットで調べ物をするときに気軽にググる感覚で、ファイルを探すのもググるようになると、とても快適に仕事ができますよ!

 

以上!!

コメント