メールマガジン

Fess-サイト内検索など全文検索のオープンソース

今月の気になるオープンソース情報(2017年7月号)

OSS研究室 森 彰吾

皆さんは、こんなことを感じたことはないでしょうか?

  • 社内であるファイルを探しても探してもみつからない
  • WEBサイトを閲覧しても、欲しい情報が見つからない

今回はこのような課題を解決することができる、「Fess」というソフトウェアをご紹介します。
Fessは、いわゆる全文検索システムです。全文検索とは、文書データから特定の文字を検索することです。最もポピュラーな例としては、Google検索が挙げられます。Google検索は、世界中のWEBサイトの情報を収集し、ユーザの検索に応じて結果を返すようになっています。

Fessも基本的には同じような機能を持っています。
具体的には主に以下の機能があります。

  • WEBサイトのデータ収集
  • ファイルサーバのデータ収集(Samba/FTP経由)
  • CSVやRDBMSなどのデータストアからのデータ収集
  • 収集したデータの検索

これらの機能を利用することで、例えば自社内のファイルサーバを特定のキーワードで瞬時に検索できるようにしたり、WEBサイトにサイト内検索の機能を追加し、情報を発見しやすくすることができます。

Fessは全文検索システムとして優れている点が多くあります。


直感的なインタフェース

上記ような全文検索に必要な機能が、すべてWEBインタフェースで設定・利用できるということがあります。導入後、複雑なコマンドなどを必要とせず直感的なインタフェースで利用できるため、管理が容易です。

検索の高速さ

バックエンドにElasticsearchを利用しているため、RDBMSを利用した全文検索のシステムと比較して、非常に高速な検索を行うことができます。

ファイルの自動解析

データ収集時に様々なファイルの形式を理解して、解析を行うため、文書のタイトルだけの検索や本文で検索など、検索したい内容を絞ることもできます。解析可能なファイル形式は、MS Office(xls,xlsx,doc,docx,ppt,pttx)やPDF, html, xmlなどに対応しており、よく利用される形式がデフォルトで解析可能になっています。

LDAPとの連携

ファイルサーバの検索については、LDAPサーバと連携することで、ユーザやグループ毎にアクセスできるファイルを絞ることができます。つまりファイルサーバのアクセス権と同じような権限で、アクセス権があるファイルだけを検索できるということです。


このようにFessは、全文検索システムで「欲しい」と思う機能が詰まったソフトウェアです。

デージーネットでは、Fessを利用したファイルサーバ検索などのシステムを提案しています。またデージーネットコーポレートサイトに、サイト内検索の機能を追加することを検討しています。

ファイルやデータは増えれば増えるほど探すのが大変になっていきます。ファイルのパスを記録したメモファイルを作って、さらにファイルが増えていくという本末転倒なことも発生します。Fessを導入して、情報探しを楽にしてみてはいかがでしょうか。

関連ページ

デージーネットマガジン2017年7月号記事一覧

Fess-サイト内検索など全文検索のオープンソース先頭へ