オープンソース

サーバ構築のデージーネットTOP > OSS情報 > 一押しOSS > Fess〜全文検索システム〜

Fess〜全文検索システム〜

ここでは、OSSの全文検索システムFessを利用するとどんなことができるのか、どんなところが優れているのかを紹介します。また、Fessについてデージーネットの行っているサービスやサポートについても紹介します。

全文検索のFessとは

Fessは、Javaで開発されたオープンソースの全文検索システムです。CodeLibsというプロジェクトで開発されています。Fessは、いわゆるコミュニティ版のソフトウェアで、商用サポート付きのバージョンとしてN2SM searchを利用することもできます。
Fessには以下のような機能があります。

  • WEBのデータ収集とデータの全文検索
  • ファイルサーバの文書データ収集とデータの全文検索
  • データストア(csv、RDBMS、Elasticsearch等)からのデータ収集と全文検索

Fessでできる全文検索

全文検索とは、対象とする文字列全てを、指定した範囲内の複数のファイルから検索することをいいます。
全文検索は、対象の文字列をファイル名や単一ファイル内から検索する手法とは異なり、一回の検索で対象をすべて探すことが可能です。検索方法としては、最も満遍なく検索できる手法と言われています。しかし、満遍なく検索するため、検索時間がかかるという欠点があります。
Fessはこの欠点を補うことができる全文検索システムです。

全文検索システムFessの機能を利用することで次のことができるようになります。

コーポレートサイトのサイト内の全文検索

コーポレートサイト内に検索窓を設置し、サイト内の全文検索を行うことができます。

Fessに、検索対象のベースURLを登録しておくと、定期的に該当URLにアクセスし、リンクをたどってサイト内をクロールし、情報を取得し、インデックス化することができます。そのため、サイト内検索を高速に行うことができます。検索結果の出力には、Fessの標準の検索画面を使うことができます。この場合には、デザインを編集することもできます。また、開発者用にAPIも公開されていますので、独自の検索プログラムを作ることもできます。

ファイルサーバの文書の全文検索

大量の文書ファイルの中から求めている文書を全文検索によって探すことができます。

Fessは、対象フォルダを定期的にアクセスし、ファイルの内容を取得しインデックス化することができます。そのため、ファイルの全文検索を高速に行うことができます。Fessは、PDF、ExcelやWordなどのMS Officeの文書に対応しています。さらに、画像や動画のメタデータなども検索の対象にすることができます。また、ログインしたユーザによって、検索結果に表示されるファイルを制限することもできます。 Fessは、ActiveDirectoryやLDAPとユーザ(パスワード)の情報を連携することができます。

全文検索システムFessの特徴

OSSの全文検索システムFessには様々な特徴があります。ここではその特徴を紹介します。

ライセンスコストフリー

FessはOSSの全文検索システムです。構成するコンポーネントもすべてOSSのためライセンスコストフリーで実用的な全文検索システムを構築することができます。

日本語に対応した全文検索

全文検索システムFessは日本語に対応しています。そのため、基本的な内容はドキュメントを読むだけで理解することができます。これは、N2SMという日本企業が母体となりFessの開発を行っているためです。

設定・管理をWebインターフェースから

Fessは、直感的な操作で設定を行うことができ、インストール後すぐに使い始めることができます。なぜなら、Fessでは、検索対象、クローラの実行時間の設定、全文検索の条件など、全文検索システムの設定をWebインターフェースから簡単に行うことができるためです。下の画像は全文検索システムのクローラの設定画面です。

OSSの全文検索システムFessヘルプ画面例

自動クロール

全文検索システムFessは、あらかじめクローリング開始時間を設定しておくことでその時間になると自動的にクロールし情報を収集します。

大量のデータでも高速な全文検索を実現

全文検索システムFessは、大量のデータから欲しい情報を瞬時に検索することができます。これは、Fessが標準でOSSの全文検索エンジンであるElasticsearchをデータベースとして採用しているからです。Elasticsearchは、全文検索が高速にできるよう、収集したデータをインデックス化して管理します。

Elasticsearchと連携した全文検索

Elasticsearchとは、ビックデータの解析に使われる全文検索エンジンです。Elastic社が提供し、Apache2ライセンスの下で公開されているOSSです。全文検索エンジンのElasticsearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。
Elasticsearchには、主に以下の特長があります。

  • 全文検索の性能
  • Elasticsearchは、全文検索に特化しており、検索速度を向上させるように設計されています。事前に全文検索の対象となるデータを検索し易い形式で保存するため、高速な全文検索が実現できます。

  • 全文検索エンジン
  • Elasticsearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は大量のログデータから特定のキーワードを含むログだけを検索するような時に利用できます。また、指定したキーワードに関連するデータを抽出する機能もあります。

  • スケーラビリティ
  • 大規模データに対応するために全文検索の処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行なうことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。

このように、FessはElasticsearchと連携することによって全文検索の結果を瞬時に表示することを実現しています。また、規模に応じてサーバの台数を増やすなどして、全文検索システムのスケールアウトも可能です。

多種多様なファイル形式に対応した全文検索

全文検索システムFessは、多くのファイル形式に対応しています。全文検索に対応しているファイル形式は以下です。

  • MSOffice形式(xls,xlsx,doc,docx,ppt.pptx)
  • OpenDocument形式(odt,ods,odp)
  • テキスト
  • PDF
  • XML,HTML
  • 圧縮ファイル(zip,tar,gz)
  • mp3などのメタ情報
  • etc...

多くの検索方法を搭載

Fessの全文検索を利用することで、目的としているページやファイルへの到達率を高めることができます。なぜなら、Fessには、AND検索やOR検索など様々な検索方法が用意されているためです。以下、Fessが対応している検索方法です。

  • AND検索
  • OR検索
  • ワイルドカード
  • 範囲検索
  • ブースト検索
  • あいまい検索
  • etc...

全文検索システムFessの応用

全文検索システムFessは他のOSSと連携することでさらに便利に使うことができます。

ユーザ動向をチェック

webサイトの管理者に取ってユーザの動向やニーズはサイト改善などにとって重要な情報です。Fessを使うとユーザの動向を解析することができます。Fessは全文検索の際、以下の情報を残します。

  • 検索ワード
  • 時間
  • 接続元のIPアドレス
  • etc..

この全文検索を行った際の情報をKibanaというOSSの可視化ソフトウェアで参照することが可能です。

OSSの全文検索システムFess Kibanaとの連携例

注意点

Fessは、簡単に全文検索のシステムとして利用することができます。しかし、検索対象のファイル数や容量が多くなると、チューニングが必要になります。チューニングをするためには、Elasticsearchに関する詳細な知識が必要となります。また、クローリングにも時間がかかるようになるため、システム構成やクローリング設定にも工夫が必要です。

デージーネットのサービス

デージーネットでは、全文検索システムFessの導入をサポートします。オンプレやクラウドなど様々な環境に対応できます。お客様の要件をヒアリングさせていただき、要望に応えた全文検索の環境を構築します。
また、保守サポート(Open Smart Assistance)を利用いただければ、障害時には素早い復旧が可能です。費用など詳しい情報はお気軽にお問い合わせください。

検討資料を無料でダウンロードいただけます。

Fess検討資料

Fess検討用資料ダウンロードへ

サイト内検索とファイルサーバ全文検索についてまとめた資料です。サービスをご検討いただく際などにお役立てください。

デモのお申込み

もっと使い方が知りたい方へ
操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。デモをご希望の方は、下記よりお申込みいただけます。


デモをご希望の方


全文検索システムFess

Fess〜全文検索システム〜
ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
ファイルサーバ全文検索
Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
サイト内検索のOSS「Fess」
Fessの機能を利用して、サイト内の全文検索を実装することができます。ここでは、Fessでのサイト内全文検索の便利なところを紹介します。
Fessでサイト内検索【応用】
ここでは、OSSの全文検索システムFessでのサイト内全文検索の応用例を紹介します。
Fessの保守・サポート
ここでは、Fessの保守・サポートについて紹介します。
Fessのよくある質問
ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。

Fess〜全文検索システム〜の先頭へ