オープンソース

サーバー構築のデージーネットTOP > OSS情報 > 一押しOSS > 全文検索システム〜Fess〜

全文検索システム〜Fess〜

ここでは、OSSの全文検索システムFessを利用するとどんなことができるのか、Fessのどんなところが優れているのかを紹介します。また、Fessについてデージーネットの行っているサービスやサポートについても紹介します。

全文検索とは

全文検索とは、対象とする文字列全てを、指定した範囲内の複数のファイルから検索することをいいます。
全文検索は、対象の文字列をファイル名や単一ファイル内から検索する手法とは異なり、一回の検索で対象をすべて探すことが可能です。検索方法としては、最も満遍なく検索できる手法と言われています。しかし、満遍なく検索するため、検索時間がかかるという欠点があります。
Fessはこの欠点を補うことができる全文検索システムです。

全文検索のFessとは

FessはOSSの全文検索システムです。CodeLibsというプロジェクトで開発されています。
Fessには以下のような機能があります。

  • WEBのデータ収集とデータの全文検索
  • ファイルサーバの文書データ収集とデータの全文検索
  • データストア(csv, RDBMS, Elasticsearch等)からのデータ収集と全文検索

Fessでできる全文検索

全文検索システムFessの機能を利用することで次のことができるようになります。

コーポレートサイトのサイト内の全文検索

コーポレートサイト内に検索窓を設置し、サイト内の全文検索を行うことができます。

ファイルサーバの文書の全文検索

大量の文書ファイルの中から求めている文書を全文検索によって探すことができます。

全文検索システム【Fessの特徴】

OSSの全文検索システムFessには様々な特徴があります。ここではその特徴を紹介します。

ライセンスコストフリー

FessはOSSの全文検索システムです。構成するコンポーネントもすべてOSSのためライセンスコストフリーで実用的な全文検索システムを構築することができます。

日本語に対応した全文検索

全文検索システムFessは日本語に対応しています。そのため、基本的な内容はドキュメントを読むだけで理解することができます。これは、N2SMという日本企業が母体となりFessの開発を行っているためです。

設定・管理をWebインターフェースから

Fessは、直感的な操作で設定を行うことができ、インストール後すぐに使い始めることができます。なぜなら、Fessではクローラの実行時間の設定や全文検索の条件など、全文検索システムの設定をWebインターフェースから行うことができるためです。下の画像は全文検索システムのクローラの設定画面です。

OSSの全文検索システムFessヘルプ画面例

自動クロール

全文検索システムFessは、あらかじめクローリング開始時間を設定しておくことでその時間になると自動的にクロールし情報を収集します。

大量のデータでも高速な全文検索を実現

全文検索システムFessは、大量のデータから欲しい情報を瞬時に検索することができます。これは、Fessが標準でOSSの全文検索エンジンであるElasticsearchと連携しているためです。

Elasticsearchと連携した全文検索

Elasticsearchとは、ビックデータの解析に使われる全文検索エンジンです。Elastic社が提供し、Apache2ライセンスの下で公開されているOSSです。全文検索エンジンのElasticsearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。
Elasticsearchには、主に以下の特長があります。

  • 全文検索の性能
  • Elasticsearchは、全文検索に特化しており、検索速度を向上させるように設計されています。事前に全文検索の対象となるデータを検索し易い形式で保存するため、高速な全文検索が実現できます。

  • 全文検索エンジン
  • Elasticsearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は大量のログデータから特定のキーワードを含むログだけを検索するような時に利用できます。また、指定したキーワードに関連するデータを抽出する機能もあります。

  • スケーラビリティ
  • 大規模データに対応するために全文検索の処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行なうことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。

このように、FessはElasticsearchと連携することによって全文検索の結果を瞬時に表示することを実現しています。また、規模に応じてサーバの台数を増やすなどして、全文検索システムのスケールアウトも可能です。

多種多様なファイル形式に対応した全文検索

全文検索システムFessは、多くのファイル形式に対応しています。全文検索に対応しているファイル形式は以下です。

  • MSOffice形式(xls,xlsx,doc,docx,ppt.pptx)
  • OpenDocument形式(odt,ods,odp)
  • テキスト
  • PDF
  • XML,HTML
  • 圧縮ファイル(zip,tar,gz)
  • mp3などのメタ情報
  • etc...

多くの検索方法を搭載

Fessの全文検索を利用することで、目的としているページやファイルへの到達率を高めることができます。なぜなら、Fessには、AND検索やOR検索など様々な検索方法が用意されているためです。以下、Fessが対応している検索方法です。

  • AND検索
  • OR検索
  • ワイルドカード
  • 範囲検索
  • ブースト検索
  • あいまい検索
  • etc...

全文検索システム【Fessの応用機能】

全文検索システムFessは他のOSSと連携することでさらに便利に使うことができます。

ユーザ動向をチェック

webサイトの管理者に取ってユーザの動向やニーズはサイト改善などにとって重要な情報です。Fessを使うとユーザの動向を解析することができます。Fessは全文検索の際、以下の情報を残します。

  • 検索ワード
  • 時間
  • 接続元のIPアドレス
  • etc..

この全文検索を行った際の情報をKibanaというOSSの可視化ソフトウェアで参照することが可能です。

OSSの全文検索システムFess Kibanaとの連携例

全文検索システムFessに関する、デージーネットのサービスとサポート

デージーネットでは、全文検索システムFessの導入をサポートします。オンプレやクラウドなど様々な環境に対応できます。お客様の要件をヒアリングさせていただき、要望に応えた全文検索の環境を構築します。
また、保守サポート(Open Smart Assistance)を利用いただければ、障害時には素早い復旧が可能です。費用など詳しい情報はお気軽にお問い合わせください。

Fess導入の検討資料を無料でダウンロードいただけます。

Fess検討資料

Fess検討用資料ダウンロードへ

Fessを利用したサイト内検索ファイルサーバ全文検索についてまとめた資料です。Fessは、ビッグデータの解析に使われる検索エンジンと連携するため、非常に高速に動作します。Fessについて情報を収集する際、サービスをご検討いただく際などにお役立てください。


全文検索システムFess【一押しOSS】

全文検索システム〜Fess〜
ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
サイト内検索のOSS「Fess」
Fessの機能を利用して、サイト内の全文検索を実装することができます。ここでは、Fessでのサイト内全文検索の便利なところを紹介します。
Fessでサイト内検索【応用】
ここでは、OSSの全文検索システムFessでのサイト内全文検索の応用例を紹介します。
ファイルサーバ全文検索
Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
Fessの保守・サポート
ここでは、Fessの保守・サポートについて紹介します。
Fessのよくある質問
ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。

Fessによるサイト内検索システム事例

ホームページにサイト内検索の機能を持たせたいということで、相談を受けました。デージーネットからは、OSSであるFessを使った全文検索システムを提案しました。サイト内検索の統計情報や、検索キーワードなどはKibanaを使って参照できるようになり、SEO対策にも生かせるようになりました。

Fessによるファイルサーバ検索システム事例

社員の情報共有のために、ファイルサーバに保管されている情報を効率よく検索するシステムを導入したいという要望があり、OSSのFessを提案しました。ビックデータの技術を利用して高速検索ができるようになり、ファイルを探す手間が省けるようになりました。

Fess調査報告書

Fessは全文検索サーバです。WEBサイト内やファイルシステム内のデータを自動的に収集してElasticsearchに保管し、全文検索を行うことができます。データの収集の設定や検索のためのWEBインタフェースが用意されているため、導入してすぐ全文検索システムを使うことができます。

Elasticsearchを使ったログ解析システム構築事例

CATVのインターネットサービスでは、障害の対応や犯罪捜査への協力のために、IPアドレスから利用者を特定しなければならない場合があります。従来は、DHCPサーバ、WWWサーバ、メールサーバ、課金システムなどの膨大なログをgrepコマンドを使って調査し、利用者を特定していました。そのため、調査は大変時間がかかる作業でした。この調査を効率化できないかと相談を受け対応しました。

全文検索システム〜Fess〜の先頭へ