オープンソース

サーバー構築のデージーネットTOP > OSS情報 > 一押しOSS > OSSの全文検索システム Fess >OSSの全文検索システム Fessでファイルサーバの全文検索

OSSの全文検索システム Fessでファイルサーバの全文検索

「Fess」によるファイルサーバの全文検索を利用することで、煩雑になりがちなファイル検索を便利に、使いやすくすることができます。 ここでは、ファイルサーバの全文検索を実装すると何ができるようになるのか、どんな点で「Fess」を利用したファイルサーバの全文検索が優れているのかを紹介します。

Fessでファイルサーバの全文検索システム

ファイルサーバ内にある大量の文書ファイルから見たい文書を探すのに時間がかかることは多くの企業で起こっている問題です。 OSSの全文検索システム「Fess」を利用しファイルサーバの全文検索システムを構築することでこの問題を解消できます。

Fessデフォルトのインターフェース

大量のデータから瞬時に検索

Fessを利用し、ファイルサーバの全文検索システムを実装すると欲しいファイル瞬時に検索することができます。これは、Fessが標準でOSSの全文検索エンジンであるElasticsearchと連携しているためです。

Elasticsearchと連携

Elasticsearchとは、ビックデータの解析に使われる全文検索エンジンです。Elastic社が提供し、Apache2ライセンスの下で公開されているOSSです。Elasticsearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。 Elasticsearchには、主に以下の特長があります。

  • 検索性能
  • 全文検索に特化しており、検索速度を向上させるように設計されています。事前に検索対象となるデータを検索し易い形式で保存するため、高速な検索ができます。

  • 検索エンジン
  • Elasticsearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は大量のログデータから特定のキーワードを含むログだけを検索するような時に利用できます。また、指定したキーワードに関連するデータを抽出する機能もあります。

  • スケーラビリティ
  • 大規模データに対応するために検索処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行なうことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。

このように、FessはElasticsearchと連携することによって検索結果を瞬時に表示することを実現しています。また、規模に応じてサーバの台数を増やすなどしてスケールアウトすることもできます。

欲しいファイルに最短でアクセス

Fessを利用したファイルサーバ全文検索では、欲しいファイルに最短で到達することができます。それはFessが、クローリング時にデータに特定の「ラベル」を付けることができるためです。この機能を利用して、データをコンテンツごとにラベルでカテゴライズすることで、「絞り込み検索」や「ソート検索」が可能になります。

例えば、企画の提案書や見積書などに個別のラベルをつけておきます。そうすることで、検索の際に絞り込み検索を利用することができ、目的のファイルに到達する時間を短縮することができます。

ActiveDirectoryと連携し、ユーザ権限で閲覧できるファイルのみを検索結果に表示

Fessでのファイルサーバの全文検索の際に、ユーザの権限で閲覧できるファイルのみを検索結果として表示することができます。これは、FessがLDAPやActiveDirectoryなどの認証サーバと連携する機能を利用したものです。 その機能を利用することで、ファイルのアクセス権がFessでのファイル検索の際にも適用されます。そのため、社内運用時も安心してお使いいただけます。

多種多様なファイル形式に対応

Fessでは普段お使いの多くのファイルを検索できます。全文検索システムFessは多くのファイル形式に対応しています。 対応しているファイル形式は以下です。

  • MSOffice形式(xls,xlsx,doc,docx,ppt.pptx)
  • OpenDocument形式(odt,ods,odp)
  • テキスト
  • PDF
  • XML,HTML
  • 圧縮ファイル(zip,tar,gz)
  • mp3などのメタ情報
  • etc...

大規模システムにも対応

Fessでのファイル全文検索は大規模なファイルサーバにも対応することができます。方法としては、次のようなものがあります。

  • 複数のクローラを同時に動作させる
  • Elasticsearchをクラスタ構成にする

なお、デージーネットでは、ファイルサーバの性能やディスク容量を圧迫しないように、外部に検索サーバを構築することを推奨しています。

一押しOSS情報 「Fess」

OSSの全文検索システム Fess
ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
Fessでファイルサーバの全文検索
Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
Fessでサイト内検索
Fessの機能を利用して、サイト内検索を実装することができます。ここでは、Fessでのサイト内検索の便利なところを紹介します。
Fessでサイト内検索【応用例】
ここでは、Fessでのサイト内検索の応用例を紹介します。
Fessについてのよくある質問
ここでは、Fess導入検討時にお客様からいただくよくある質問を紹介します。

Fessによるサイト内検索システム

ホームページにサイト内検索の機能を持たせたいということで、相談を受けました。デージーネットからは、Fessを使った検索システムを提案しました。サイト内検索の統計情報や、検索キーワードなどはKibanaを使って参照できるようになり、SEO対策にも生かせるようになりました。

Fessによるファイルサーバ検索システム

社員の情報共有のために、ファイルサーバに保管されている情報を効率よく検索するシステムを導入したいという要望があり、Fessを提案しました。ビックデータの技術を利用して高速検索ができるようになり、ファイルを探す手間が省けるようになりました。

Fess調査報告書

Fessは全文検索サーバです。WEBサイト内やファイルシステム内のデータを自動的に収集してElasticsearchに保管し、検索を行うことができます。データの収集の設定や検索のためのWEBインタフェースが用意されているため、導入してすぐ使うことができます。

Elasticsearchを使ったログ解析システム構築事例

CATVのインターネットサービスでは、障害の対応や犯罪捜査への協力のために、IPアドレスから利用者を特定しなければならない場合があります。従来は、DHCPサーバ、WWWサーバ、メールサーバ、課金システムなどの膨大なログをgrepコマンドを使って調査し、利用者を特定していました。そのため、調査は大変時間がかかる作業でした。この調査を効率化できないかと相談を受け対応しました。

Fessでファイルサーバの全文検索の先頭へ