-
サーバ構築のデージーネットTOP
-
OSS情報
-
一押しOSS
-
Fess〜全文検索システム〜
Fess〜全文検索システム〜
ここでは、OSSの全文検索システムFessを利用するとどんなことができるのか、どんなところが優れているのかを紹介します。また、Fessについてデージーネットの行っているサービスやサポートについても紹介します。
全文検索のFessとは
Fessは、Javaで開発されたオープンソースの全文検索システムです。CodeLibsというプロジェクトで開発されています。Fessは、いわゆるコミュニティ版のソフトウェアで、商用サポート付きのバージョンとしてN2SM searchを利用することもできます。
Fessには以下のような機能があります。
- WEBのデータ収集とデータの全文検索
- ファイルサーバの文書データ収集とデータの全文検索
- データストア(csv、RDBMS、Elasticsearch等)からのデータ収集と全文検索
Fessは、LinuxではRPM形式とDEB形式のパッケージで配布されており、公式のDockerイメージ(codelibs/fess)も公開されています。また、ZIP形式のファイルをダウンロードしWindowsにインストールすることもできます。
Fessでできる全文検索
全文検索とは、対象とする文字列全てを、指定した範囲内の複数のファイルから検索することをいいます。
全文検索は、対象の文字列をファイル名や単一ファイル内から検索する手法とは異なり、一回の検索で対象をすべて探すことが可能です。検索方法としては、最も満遍なく検索できる手法と言われています。しかし、満遍なく検索するため、検索時間がかかるという欠点があります。
Fessはこの欠点を補うことができる全文検索システムです。
全文検索システムFessの機能を利用することで次のことができるようになります。
コーポレートサイトのサイト内の全文検索
コーポレートサイト内に検索窓を設置し、サイト内の全文検索を行うことができます。
Fessに、検索対象のベースURLを登録しておくと、定期的に該当URLにアクセスし、リンクをたどってサイト内をクロールし、情報を取得し、インデックス化することができます。そのため、サイト内検索を高速に行うことができます。検索結果の出力には、Fessの標準の検索画面を使うことができます。この場合には、デザインを編集することもできます。また、開発者用にAPIも公開されていますので、独自の検索プログラムを作ることもできます。
「Fessでサイト内の全文検索」へ
ファイルサーバの文書の全文検索
Fessでは、大量の文書ファイルの中から求めている文書を全文検索によって探すことができます。
Fessは、対象フォルダを定期的にアクセスし、ファイルの内容を取得しインデックス化することができます。そのため、ファイルの全文検索を高速に行うことができます。Fessは、PDF、ExcelやWordなどのMS Officeの文書に対応しています。さらに、画像や動画のメタデータなども検索の対象にすることができます。また、ログインしたユーザによって、検索結果に表示されるファイルを制限することもできます。Fessは、ActiveDirectoryやLDAPとユーザ(パスワード)の情報を連携することができます。
「Fessでファイルサーバ全文検索」へ
全文検索システムFessの特徴
OSSの全文検索システムFessには様々な特徴があります。ここではその特徴を紹介します。
ライセンスコストフリー
FessはOSSの全文検索システムです。構成するコンポーネントもすべてOSSのためライセンスコストフリーで実用的な全文検索システムを構築することができます。
日本語に対応した全文検索
全文検索システムFessは日本語に対応しています。そのため、基本的な内容はドキュメントを読むだけで理解することができます。これは、N2SMという日本企業が母体となりFessの開発を行っているためです。
設定・管理をWebインターフェースから
Fessは、直感的な操作で設定を行うことができ、インストール後すぐに使い始めることができます。なぜなら、Fessでは、検索対象、クローラの実行時間の設定、全文検索の条件など、全文検索システムの設定をWebインターフェースから簡単に行うことができるためです。下の画像は全文検索システムのクローラの設定画面です。

自動クロール
全文検索システムFessは、あらかじめクローリング開始時間を設定しておくことでその時間になると自動的にクロールし情報を収集します。
大量のデータでも高速な全文検索を実現
全文検索システムFessは、大量のデータから欲しい情報を瞬時に検索することができます。これは、Fessが標準でOSSの検索エンジンであるElasticsearchをデータベースとして採用しているからです。Elasticsearchは、全文検索が高速にできるよう、収集したデータをインデックス化して管理します。
Elasticsearchと連携した全文検索
Elasticsearchとは、ビックデータの解析に使われる全文検索エンジンです。Elastic社が提供し、Apache2ライセンスの下で公開されているOSSです。全文検索エンジンのElasticsearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。
Elasticsearchには、主に以下の特長があります。
- 全文検索の性能
Elasticsearchは、全文検索に特化しており、検索速度を向上させるように設計されています。事前に全文検索の対象となるデータを検索し易い形式で保存するため、高速な全文検索が実現できます。
- 全文検索エンジン
Elasticsearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は大量のログデータから特定のキーワードを含むログだけを検索するような時に利用できます。また、指定したキーワードに関連するデータを抽出する機能もあります。
- スケーラビリティ
大規模データに対応するために全文検索の処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行なうことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。
このように、FessはElasticsearchと連携することによって全文検索の結果を瞬時に表示することを実現しています。また、規模に応じてサーバの台数を増やすなどして、全文検索システムのスケールアウトも可能です。
多種多様なファイル形式に対応した全文検索
全文検索システムFessは、多くのファイル形式に対応しています。全文検索に対応しているファイル形式は以下です。
- MSOffice形式(xls,xlsx,doc,docx,ppt.pptx)
- OpenDocument形式(odt,ods,odp)
- テキスト
- PDF
- XML,HTML
- 圧縮ファイル(zip,tar,gz)
- mp3などのメタ情報
- etc...
デスクトップ検索
FessのWeb画面で検索すると、検索結果にはfile://path/といったリンクが表示されます。しかし、最近のブラウザでは、セキュリティ上の問題があるとして、このようなリンクが機能しなくなっています。
そのため、Fessではデスクトップ検索機能をサポートしています。デスクトップ検索機能を有効にしておくと、リンクをクリックするとFessがファイルを読み込んで、Web経由でファイルを表示することができます。
多くの検索方法を搭載
Fessには、AND検索やOR検索など、様々な検索方法が用意されています。そのため検索方法を工夫すれば、目的としているページやファイルへの到達性が向上します。対応している検索方法は次の通りです。
- AND検索
- OR検索
- ワイルドカード
- 範囲検索
- ブースト検索
- あいまい検索
- etc...
全文検索システムFessの応用
全文検索システムFessは他のOSSと連携することでさらに便利に使うことができます。
ユーザ動向をチェック
webサイトの管理者に取ってユーザの動向やニーズはサイト改善などにとって重要な情報です。Fessは全文検索の際、以下の情報を残しますので、この情報を元にユーザの動向を解析することができます。
- 検索ワード
- 時間
- 接続元のIPアドレス
- etc..
この全文検索を行った際の情報をKibanaというOSSの可視化ソフトウェアで参照することが可能です。

画像文書の検索
FessのOCR機能を利用すると、PNGやPDF(画像)に含まれる文章画像を検索ができるようになります。調査の結果、1/4倍まで縮小コピーされた文書でも充分に読み取ることができます。OCR機能を付加した全文検索システムを導入することで、スキャナで取り込んだ紙の文書も検索できるようになり、ペーパーレス化を推進しつつ業務効率も向上することが可能になります。
「OCR機能で文書画像の全文検索」へ
注意点
Fessは、簡単に全文検索のシステムとして利用することができます。しかし、検索対象のファイル数や容量が多くなると、チューニングが必要になります。チューニングをするためには、Elasticsearchに関する詳細な知識が必要となります。また、クローリングにも時間がかかるようになるため、システム構成やクローリング設定にも工夫が必要です。
デージーネットのサービス
デージーネットでは、全文検索システムFessの導入をサポートします。オンプレやクラウドなど様々な環境に対応できます。お客様の要件をヒアリングさせていただき、要望に応えた全文検索の環境を構築します。
また、保守サポート(Open Smart Assistance)を利用いただければ、障害時には素早い復旧が可能です。費用など詳しい情報はお気軽にお問い合わせください。
お問い合わせ・資料請求はこちら
検討資料を無料でダウンロードいただけます。

サイト内検索とファイルサーバ全文検索についてまとめた資料です。サービスをご検討いただく際などにお役立てください。
デモのお申込み
もっと使い方が知りたい方へ
操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。デモをご希望の方は、下記よりお申込みいただけます。
全文検索システムFess
- Fess〜全文検索システム〜
- ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
- ファイルサーバ全文検索
- Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
- Fessのよくある質問
- ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。
「構築事例/情報の一覧」