オープンソース

ファイルサーバ全文検索

「Fess」によるファイルサーバ全文検索を利用することで、煩雑になりがちなファイル検索を便利に、使いやすくすることができます。 ここでは、ファイルサーバの全文検索を実装すると何ができるようになるのか、どんな点で「Fess」を利用したファイルサーバの全文検索が優れているのかを紹介します。

Fessのファイルサーバ全文検索

ファイルサーバ内にある大量の文書ファイルから見たいファイルを探すのに時間がかかることは多くの企業で起こっている問題です。OSSの全文検索システム「Fess」を利用しファイルサーバの全文検索システムを構築することでこの問題を解消できます。

Fessのファイルサーバ全文検索のインターフェース

ファイルサーバ内のデータを瞬時に検索

Fessを利用し、ファイルサーバの全文検索システムを実装すると欲しいファイル瞬時に検索することができます。これは、Fessが標準でビックデータに対応した全文検索エンジンであるOpenSearchと連携しているためです。

OpenSearchと連携したファイルサーバ全文検索

OpenSearchとは、ビックデータの解析に使われる全文検索エンジンです。OpenSearch projectによって、Apache License 2.0のライセンスで公開されています。OpenSearchを利用すると、大容量のデータから必要なデータを素早くに取り出すことができます。OpenSearchには、主に以下の特長があります。

  • 検索性能
  • 全文検索に特化しており、検索速度を向上させるように設計されています。事前に全文検索の対象となるデータを検索し易い形式で保存するため、高速な全文検索が実現できます。

  • 検索エンジン
  • OpenSearchでは、大量のデータから指定したキーワードに一致するデータを抽出することができます。この機能は、ファイルサーバ全文検索に利用されます。また、大量のデータから、指定したキーワードに一致するデータを抽出することができます。そのため、ファイルサーバ全文検索だけでなく、大量のログデータから特定のキーワードを含むログだけを検索するような時にも利用できます。

  • スケーラビリティ
  • 大規模データに対応するために検索処理やデータ配置を分散することができます。また、システムを拡張する時は、システムを停止することなくサーバを追加できます。導入時はスモールスタートで始め、利用者が増えてきたらサーバを追加するというようにシステム拡張を容易に行うことができます。サーバを追加した時、データは自動的に各サーバに分散して再配置されます。

このように、FessはOpenSearchと連携することによってファイルサーバ全文検索の結果を瞬時に表示することを実現しています。また、ファイルサーバの規模に応じてサーバの台数を増やすなどしてスケールアウトすることもできます。

ファイルサーバ内の欲しいファイルに最短でアクセス

Fessを利用したファイルサーバ全文検索では、欲しいファイルに最短で到達することができます。それはFessが、ファイルサーバをクロールする際、ファイルデータに特定の「ラベル」を付けることができるためです。この機能を利用して、ファイルサーバのデータをコンテンツごとにラベルでカテゴライズすることで、「絞り込み検索」や「ソート検索」が可能になります。

例えば、ファイルサーバからデータを取得する際、企画の提案書や見積書などに個別のラベルをつけておきます。そうすることで、ファイルサーバ全文検索の際に絞り込み検索を利用することができ、目的のファイルに到達する時間を短縮することができます。

ファイルサーバ全文検索の絞り込み

ファイルサーバ全文検索のファイル種別による絞り込み

ActiveDirectoryと連携し、各ユーザが閲覧できるファイルのみを表示

Fessでのファイルサーバ全文検索の際に、ユーザの権限で閲覧できるファイルのみを検索結果として表示することができます。これは、FessがLDAPやActiveDirectoryなどの認証サーバと連携する機能を利用したものです。その機能を利用することで、ファイルサーバ内でのアクセス権がFessでのファイル検索にも適用されます。本来見ることができないファイルが検索結果に表示されることを防ぎ、企業内でもファイルサーバ全文検索を安心してお使いいただけます。

ファイルサーバ全文検索イメージ図

多種多様なファイル形式に対応

Fessでは企業のファイルサーバに保存された多くのファイルを検索できます。Fessのファイルサーバ全文検索が多くのファイル形式に対応しているためです。Fessのファイルサーバ全文検索が対応しているファイル形式は以下です。

  • MSOfficeファイル(xls,xlsx,doc,docx,ppt.pptx)
  • OpenDocumentファイル(odt,ods,odp)
  • テキストファイル
  • PDFファイル
  • XML,HTMLファイル
  • 圧縮ファイル(zip,tar,gz)
  • mp3などのメタ情報
  • etc...

大規模なファイルサーバにも対応

Fessでのファイルサーバ全文検索は大規模なファイルサーバにも対応することができます。方法としては、次のようなものがあります。

  • 複数のクローラを同時に動作させる
  • OpenSearchをクラスタ構成にする

ファイルサーバ全文検索、大規模なファイルサーバへの対応

なお、デージーネットでは、ファイルサーバの性能やディスク容量を圧迫しないように、外部に検索サーバを構築することを推奨しています。

Fess導入の検討資料を無料でダウンロードいただけます。

Fess検討資料

Fess検討用資料ダウンロードへ

Fessを利用したサイト内検索ファイルサーバ全文検索についてまとめた資料です。Fessは、ビッグデータの解析に使われる検索エンジンと連携するため、非常に高速に動作します。Fessについて情報を収集する際、サービスをご検討いただく際などにお役立てください。

デモのお申込み

もっと使い方が知りたい方へ
Fessの操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。Fessのデモをご希望の方は、下記よりお申込みいただけます。

デモをご希望の方

デモの申し込みイメージ


全文検索システムFess

Fess〜全文検索システムのOSS〜
ここでは、OSSの全文検索システム「Fess」でできること、Fessに対するデージーネットのサポートについてご紹介します。
ファイルサーバ全文検索
Fessの機能を利用して、ファイルサーバの全文検索を行うことができます。ここでは、ファイルサーバ全文検索の便利なところを紹介します。
サイト内検索のOSS「Fess」
Fessの機能を利用して、サイト内の全文検索を実装することができます。ここでは、サイト内全文検索の便利なところを紹介します。
Fessでサイト内検索【応用】
ここでは、OSSの全文検索システムFessでのサイト内全文検索の応用例を紹介します。
OCR機能で文書画像の全文検索
ここでは、全文検索システムFessに追加されたOCR機能を紹介します。
Fessの保守・サポート
ここでは、Fessの保守・サポートについて紹介します。
Fessのよくある質問
ここでは、全文検索システムFessの導入検討時にお客様からいただくよくある質問を紹介します。

Fess調査報告書

Fessは全文検索サーバです。WEBサイト内やファイルシステム内のデータを自動的に収集してElasticsearchに保管し、全文検索を行うことができます。データの収集の設定や検索のためのWEBインタフェースが用意されているため、導入してすぐ全文検索システムを使うことができます。

全文検索サーバFessの導入事例

ファイルサーバの検索性能向上を検討されていたお客様に、高速に全文検索を行うことができるOSSの全文検索システム「Fess」を導入した事例についての記事です。また、ファイルサーバの権限から検索対象の制限を設定したいという使い方のご希望に合わせ、システムを構築しました。

Fessによるサイト内検索システム事例

ホームページにサイト内検索の機能を持たせたいということで、相談を受けました。デージーネットからは、OSSであるFessを使った全文検索システムを提案しました。サイト内検索の統計情報や、検索キーワードなどはKibanaを使って参照できるようになり、SEO対策にも生かせるようになりました。

Fessによるファイルサーバ検索システム事例

社員の情報共有のために、ファイルサーバに保管されている情報を効率よく検索するシステムを導入したいという要望があり、OSSのFessを提案しました。ビックデータの技術を利用して高速検索ができるようになり、ファイルを探す手間が省けるようになりました。

Elasticsearchを使ったログ解析システム構築事例

CATVのインターネットサービスでは、障害の対応や犯罪捜査への協力のために、IPアドレスから利用者を特定しなければならない場合があります。従来は、DHCPサーバ、WWWサーバ、メールサーバ、課金システムなどの膨大なログをgrepコマンドを使って調査し、利用者を特定していました。そのため、調査は大変時間がかかる作業でした。この調査を効率化できないかと相談を受け対応しました。

OpenSearch〜Elasticsearchをベースとした全文検索エンジン〜

OpenSearchとは、Elasticsearchをベースに開発された全文検索エンジンです。このページでは、OpenSearchの開発経緯、OpenSearchの特徴、Elasticsearchとの互換性について紹介します。

Elasticsearch〜ビッグデータに対応した全文検索エンジン〜

Elasticsearchは、Apache Luceneをベースに開発された全文検索エンジンです。このページでは、Elasticsearchの特徴、Elasticsearchと周辺ツール、Elasticsearchに対するデージーネットの取り組みを紹介します。

統合ログ管理・監視のOSS〜Graylog〜

Graylogとは、GUIからログサーバの管理やログの参照、検査、可視化などを行うことができる統合ログ管理ソフトウェアです。Graylogは、Graylog,INCによって開発・管理されているOSSで、GPLv3ライセンスの元で公開されています。

テレワークで使えるおすすめのOSS12選

働き方改革を促進するために、テレワーク環境の整備や生産性の向上などが求められています。ここではテレワークで使えるおすすめOSSについて紹介します。

ファイルサーバ全文検索の先頭へ