オープンソース

サーバー構築のデージーネットTOP > OSS情報 > 一押しOSS > OSSの全文検索システム Fess >OSSの全文検索システム Fessでファイルサーバの全文検索

OSSの全文検索システム Fessでファイルサーバの全文検索

「Fess」によるファイルサーバ全文検索を利用することで、煩雑になりがちなファイル検索を便利に、使いやすくすることができます。 ここでは、ファイルサーバの全文検索を実装すると何ができるようになるのか、どんな点で「Fess」を利用したファイルサーバの全文検索が優れているのかを紹介します。

Fessのファイルサーバ全文検索

ファイルサーバ内にある大量の文書ファイルから見たいファイルを探すのに時間がかかることは多くの企業で起こっている問題です。OSSの全文検索システム「Fess」を利用しファイルサーバの全文検索システムを構築することでこの問題を解消できます。

Fessのファイルサーバ全文検索のインターフェース

ファイルサーバ内のデータを瞬時に検索

Fessを利用し、ファイルサーバの全文検索システムを実装すると欲しいファイル瞬時に検索することができます。これは、Fessが標準でOSSの全文検索エンジンであるElasticsearchと連携しているためです。

Elasticsearchと連携したファイルサーバ全文検索

Elasticsearchとは、ビックデータの解析に使われる全文検索エンジンです。Elastic社が提供し、Apache2ライセンスの下で公開されているOSSです。Elasticsearchを利用すると、ファイルサーバにある大容量のデータから必要なファイルを素早くに取り出すことができます。Elasticsearchには、主に以下の特長があります。

  • 検索性能
  • 全文検索に特化しており、検索速度を向上させるように設計されています。事前に検索対象となるデータを検索し易い形式で保存するため、高速なファイルサーバ全文検索が可能です。

  • 検索エンジン
  • Elasticsearchでは、指定したキーワードに関連するデータを抽出することができます。この機能は、ファイルサーバ全文検索に利用されます。また、大量のデータから、指定したキーワードに一致するデータを抽出することができます。そのため、ファイルサーバ全文検索だけでなく、大量のログデータから特定のキーワードを含むログだけを検索するような時にも利用できます。

  • スケーラビリティ
  • 大規模データに対応するために検索処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行なうことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。

このように、FessはElasticsearchと連携することによってファイルサーバ全文検索の結果を瞬時に表示することを実現しています。また、ファイルサーバの規模に応じてサーバの台数を増やすなどしてスケールアウトすることもできます。

ファイルサーバ内の欲しいファイルに最短でアクセス

Fessを利用したファイルサーバ全文検索では、欲しいファイルに最短で到達することができます。それはFessが、ファイルサーバをクロールする際、ファイルデータに特定の「ラベル」を付けることができるためです。この機能を利用して、ファイルサーバのデータをコンテンツごとにラベルでカテゴライズすることで、「絞り込み検索」や「ソート検索」が可能になります。

例えば、ファイルサーバからデータを取得する際、企画の提案書や見積書などに個別のラベルをつけておきます。そうすることで、ファイルサーバ全文検索の際に絞り込み検索を利用することができ、目的のファイルに到達する時間を短縮することができます。

ファイルサーバ全文検索の絞り込み

ファイルサーバ全文検索のファイル種別による絞り込み

ActiveDirectoryと連携し、各ユーザが閲覧できるファイルのみを表示

Fessでのファイルサーバ全文検索の際に、ユーザの権限で閲覧できるファイルのみを検索結果として表示することができます。これは、FessがLDAPやActiveDirectoryなどの認証サーバと連携する機能を利用したものです。その機能を利用することで、ファイルサーバ内でのアクセス権がFessでのファイル検索にも適用されます。本来見ることができないファイルが検索結果に表示されることを防ぎ、企業内でもファイルサーバ全文検索を安心してお使いいただけます。

ファイルサーバ全文検索イメージ図

多種多様なファイル形式に対応

Fessでは企業のファイルサーバに保存された多くのファイルを検索できます。Fessのファイルサーバ全文検索が多くのファイル形式に対応しているためです。Fessのファイルサーバ全文検索が対応しているファイル形式は以下です。

  • MSOfficeファイル(xls,xlsx,doc,docx,ppt.pptx)
  • OpenDocumentファイル(odt,ods,odp)
  • テキストファイル
  • PDFファイル
  • XML,HTMLファイル
  • 圧縮ファイル(zip,tar,gz)
  • mp3などのメタ情報
  • etc...

大規模なファイルサーバにも対応

Fessでのファイルサーバ全文検索は大規模なファイルサーバにも対応することができます。方法としては、次のようなものがあります。

  • 複数のクローラを同時に動作させる
  • Elasticsearchをクラスタ構成にする

ファイルサーバ全文検索、大規模なファイルサーバへの対応

なお、デージーネットでは、ファイルサーバの性能やディスク容量を圧迫しないように、外部に検索サーバを構築することを推奨しています。

一押しOSS【全文検索システムFess】

OSSの全文検索システム Fess
ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
Fessでサイト内の全文検索
Fessの機能を利用して、サイト内の全文検索を実装することができます。ここでは、Fessでのサイト内全文検索の便利なところを紹介します。
Fessでサイトの内全文検索【応用例】
ここでは、OSSの全文検索システムFessでのサイト内全文検索の応用例を紹介します。
Fessでファイルサーバの全文検索
Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
Fessについてのよくある質問
ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。

Fessによるサイト内検索システム事例

ホームページにサイト内検索の機能を持たせたいということで、相談を受けました。デージーネットからは、OSSであるFessを使った全文検索システムを提案しました。サイト内検索の統計情報や、検索キーワードなどはKibanaを使って参照できるようになり、SEO対策にも生かせるようになりました。

Fessによるファイルサーバ検索システム事例

社員の情報共有のために、ファイルサーバに保管されている情報を効率よく検索するシステムを導入したいという要望があり、OSSのFessを提案しました。ビックデータの技術を利用して高速検索ができるようになり、ファイルを探す手間が省けるようになりました。

Fess調査報告書

Fessは全文検索サーバです。WEBサイト内やファイルシステム内のデータを自動的に収集してElasticsearchに保管し、全文検索を行うことができます。データの収集の設定や検索のためのWEBインタフェースが用意されているため、導入してすぐ全文検索システムを使うことができます。

Elasticsearchを使ったログ解析システム構築事例

CATVのインターネットサービスでは、障害の対応や犯罪捜査への協力のために、IPアドレスから利用者を特定しなければならない場合があります。従来は、DHCPサーバ、WWWサーバ、メールサーバ、課金システムなどの膨大なログをgrepコマンドを使って調査し、利用者を特定していました。そのため、調査は大変時間がかかる作業でした。この調査を効率化できないかと相談を受け対応しました。

Fessでファイルサーバの全文検索の先頭へ