BIツールとは?無料で使えるおすすめOSSの比較6選(2022年版)
BIツールとは?
BIツールとは「ビジネスインテリジェンス(Business Intelligence)ツール」の略で、蓄積されたデータを分析し、意思決定を支援するためのツールやシステムを指します。意思決定というと、経営者の経営判断を想像して、非常に大げさに聞こえます。しかし、実際にはデータを加工し分かりやすく表示することで、ビジネスのあらゆるシーンのニーズに合せて、情報の分析を効率化し、最適な判断に役立てるためのツールと考えることができます。BIツールの適用範囲は広く、基幹業務、販売管理、市場分析、マーケティング、予算管理、在庫管理、組織管理や経営に必要な統計解析まで幅広い分野で使われています。
例えば、営業の活動のさまざまなデータの中から、どのような顧客から、どのような場合に売上が上がるのかといった要因を調べる目的で、データを可視化することができます。またはプロジェクトの管理データから、ボトルネックになっている業務を発見する際にも使用することができます。こうした業務は、個人の利用であれば、Excelなどを使って行うこともできますが、非常に時間がかかります。Excelは、参加者が多い業務や規模の大きなプロジェクトには向いていません。BIツールを使えば、このような業務を効率化できるのです。
このようなデータの活用プロセスをAIで自動でやってくれるものもあります。しかし、すべてのケースに対して効果のある手法があるわけではありません。そのため、どのデータソースから、どのようなデータを取得するのか、どのようにデータを加工し、どのような形式で出力するのかはユーザーが決定することになります。BIツールを使うと、的確かつスピーディーに情報を活用できるように、利用者を支援します。
BIツール導入のメリット
実際に意思決定をする場合には、次のような段取りを取ることになります。
- さまざまなデータの抽出、統合、集約、分析、可視化(レポート作成、ダッシュボード作成)
- データを元にした仮説と検証(多次元解析)
- 統計的な法則性の発見(データマイニング)
- データによる予測(プランニング)
つまり、BIツールは、これら4つの活動の支援を行うためのツールといえます。そのため、BIツールを導入すると次のようなメリットがあります。
- データを可視化し、分かりやすく表示する
- 専門家でなくても、データを活用することができる
- プログラミングや表計算ソフトなどにくらべて、迅速に解析を行える
- リアルタイムに解析が行える
- 課題をリアルタイムに把握し、迅速に意思決定ができる
BIツール導入のデメリット
BIツールを導入することは、このようにメリットが多いのですが、一方でデメリットもあります。
- コストがかかる
BIツールの製品は、比較的高額な有料の製品も多いようです。そのため、導入コストが問題になることがあります。無償のOSSのBIツールを使うと、機能的にはシンプルですが、コストを抑えて導入することができます。
- どの製品を導入すればよいのか選べない
特に初心者は、どの製品を選べばよいか分かりにくいため、導入に躊躇してしまうことが多いようです。特に製品のソフトウェアの導入にはコストがかかるため、慎重に選択する必要があります。OSSのBIツールなら、無料で使うことができるため、いろいろなツールを試してから選択することができます。
- 初期設定が難しい
さまざまなシステムに接続してデータを集めて表示を行うためには、データベースの知識やスキルが必要になる場合があります。また、高機能なツールほど、設定項目が多く、導入の作業にもスキルが求められます。そのため、技術的に自信がない人は、クエリビルダなど、初心者でも直感的に扱えるように工夫されているツールを選ぶ必要があります。
- 様々なデータソースからデータを集めることができる
- グラフや地図表示など、用途にあった表示形式が利用できる
- 利用者のプログラミングの知識にあったものを利用する
- ツールのユーザーと管理者を分けることができる
- 必要に応じて情報を共有したり、利用者に合わせた表示ができる
- データの機密性を守ることができる
BIツール選定のポイント
BIツールを選ぶには、次のようなことに気をつける必要があります。
最近はGoogleのData Studio、マイクロソフトのPowerBI、AWSのQuickSightなど、クラウド型サービスでもBIツールが提供されています。tableau(タブロー)等のBIツールの製品も販売されています。しかし、重要なデータを扱う場合には、機密性の問題でクラウド型サービスは利用しづらく、自社のオンプレミスで使いたい場合があります。また、製品のソフトを利用するとライセンス費用等のコストが高いという問題もあります。
この記事では、これらの検討ポイントを念頭において、オープンソースソフトウェアとして公開されており、ライセンスが無料で利用できるBIツールをとりあげ、それぞれのソフトの機能の違いを紹介します。また、まとめとしてデージーネットのおすすめも紹介します。
【Webセミナー】コンテナ技術基礎と導入のメリット(Docker/Kubernetes)
日程: | 8月26日(金)Webセミナー「BigBlueButton」を使用します。 |
内容: | IoTプラットフォームや機械学習基盤として注目されている「コンテナ技術」について基礎から解説します。 |
ご興味のあるかたはぜひご参加ください。 |
オープンソースのBIツール
Apache Superset
Apache Supersetは、Airbnb社が開発したBIツールで、2017年にApache Software Foundationのインキュベーションプロジェクトという位置づけで開発がスタートしました。2021年には、新たにトッププロジェクトに昇格しています。開発初期段階の従来のバージョンにおいては、他のOSSのBIツールと比較して非常に使いにくいものでしたが、最新のバージョンは機能が大幅に向上し、使いやすくなっています。
Apache Supersetの特徴は、30種類以上のデータベースに対応していることです。MySQLやPostgreSQLなどのデータベースだけでなく、主なクラウドサービスのデータベースにも対応しています。ElasticsearchやApache Solrなど、SQL機能がオプションで実装されているものについても、対応可能データベースにリストアップされています。
また、Apache Supersetはデータの可視化にも優れていて、各種のグラフ、チャート、マップ等、約60種類の多様なビジュアル表現をサポートしています。さらに、各種類毎に細かい表示のオプションなども用意されており、データややりたいことに合わせてグラフを作ることができます。
Apache Supersetでは、WEB画面からデータの追加が行えるのも特徴です。SQLで直接追加・更新の処理を行うこともできますし、CSV形式でデータをアップロードすることも可能です。データベースに溜まったデータだけでなく、手元にあるデータをその場で入力して可視化するという使い方ができるので非常に便利です。
Apache Supersetではユーザーにさまざまなアクセスの権限を持たせることができます。機能毎の参照や更新の権限に加えて、画面のメニューの表示なども制御できるようになっています。全体で200を超える細かい権限を組み合わせて、運用に合わせたロールを作ることができます。権限を制限することで、例えば特定の部門のユーザーが、特定のデータのダッシュボードのみを参照できるようにすることができます。
しかし、Apache Supersetの管理者にはSQLやデータベースに関する深い知識と技術が必要となります。その分、詳細で高度な検索をすることもできますが、ユーザーが自作することが難しいという課題があります。そのため、管理者がダッシュボードの設定や画面のカスタマイズを行い、一般のユーザーはダッシュボードの閲覧のみを利用するというような使い方が想定されます。
なお、Apache Supersetは多言語に対応しています。もちろん日本語にも対応しています。
Grafana
Grafanaは、ダッシュボードを構築することができるOSSのソフトウェアです。Grafana Labsが開発し、オープンソースとして公開しています。Elasticsearch、MySQL、PostgreSQL、Zabbixなど30種類以上のデータソースからデータを収集し、1つのダッシュボードに集約して表示することができます。MySQLやPostgreSQLなどの一般的なデータベースだけでなく、Elasticsearchなどビッグデータ系のデータベースや、MongoDBなどのNoSQLをサポートしていることと、Zabbixのデータを扱えることが最大の特徴です。
ダッシュボードは、Web画面から利用できます。また、表やグラフの作成・配置、操作が簡単に行えます。他のBIツールと比較して、時系列データの解析を行う時に特に強みを発揮します。ここで紹介されているツールの中では、最も幅広い用途で使われていて、安定性がよいツールといえます。また、アラートの送信機能もあり、リアルタイムに状態を知らせることができます。
また、LDAPと連携してユーザ管理を行うことができます。そのため、担当の業務や役割に合わせたダッシュボードを表示することができます。また、SAMLにも対応していて、IdPと連携したシングルサインオンも可能です。認証したユーザをもとに、ユーザとチームの単位でアクセス制御を行うことができ、ユーザの業務や役割に合わせたダッシュボードを表示できます。ただし、グラフのタイトルなどに日本語を使うことはできますが、表示は日本語化されていません。
Metabase
Metabaseとは、Metabaseプロジェクトによって開発されているオープンソースソフトウェアのデータ可視化ツールです。無料で使えるオープンソース版と、機能が豊富な有償版があります。Metabaseのインストールは、アーカイブファイルをダウンロードし設置するだけなので、とても簡単です。また公式のDockerイメージも提供されています。
Metabaseは、MySQL、PostgreSQL、Oracleなどの12種類のデータソースを扱うことができます。グラフの種類が豊富なのが特徴です。また、他のOSSのBIツールと比較してクエリビルダーの機能が優れており、簡単なデータベースであれば、SQLの知識がない初心者でも解析を行ったり、ダッシュボードを自作したりすることができます。一方で、管理者が複雑なSQLを設定しておくこともできます。
認証は、LDAPに対応しています。認証したユーザに毎に、データソース毎に権限設定ができます。まだ開発されて間もないことから、機能的に不十分だったり、正しく動作しない機能も存在します。しかし、そうしたことに注意すれば、十分に利用できるとして注目されています。とても使いやすく、将来が期待されるソフトウェアです。
Kibana
Kibanaは、ビッグデータ解析で知られるElasticsearch社が開発し、管理しているオープンソースのBIツールです。表示可能なグラフの種類が豊富で、データの可視化ツールとしては非常に強力なツールです。他のOSSのBIツールと比較して、Elasticsearchでの利用に特化しているのが特徴です。Elasticsearchと組み合わせて利用するBIツールとして人気があり、ビックデータなどの大量データを高速に検索し、視覚化することができます。
ユーザ認証はLDAPと連携して行うことができます。しかし、ユーザ管理の機能は弱く、利用者毎にダッシュボードを分けることはできません。そのため、担当者の業務や役割によってダッシュボードを分ける必要がある場合には、Grafanaの方が適しています。
Graylog
Graylogは、Graylogプロジェクトが開発管理しているオープンソースソフトウェアです。他のOSSのBIツールと比較すると、データの収集から行うことができるのが特徴です。データ収集時に自動的に前処理を行うことができます。ログのようなテキスト形式のデータをリアルタイムに解析するのに適しています。また、多彩なAPIとプラグインを用いて、様々な形式のデータに対応できます。
バックエンドにビッグデータ向けの全文検索データベースであるElasticsearchを使っているため、膨大なデータでも効率よく解析することができます。文字データだけでなく、数値のデータも取扱いもでき、異常な値が検出された場合にはアラートを出すこともできます。データの可視化もサポートし、ダッシュボードを作成することもできます。そのため、既にデータベースに入っているデータではなく、これから解析する必要のあるデータを扱う場合に適したソフトウェアです。
認証は、LDAPに対応していて、ユーザやグループ毎に権限の設定が可能です。同じくElasticsearchに対応しているGrafanaとの併用も可能です。残念ながら日本語化はされていませんが、デージーネットがマニュアルを日本語化し公開しています。
Re:dash
Re:dashは、Re:dashプロジェクトが管理しているオープンソースのBIツールです。他のOSSと比較すると、50以上のデータソースに対応しているのが特徴で、最も多くのデータソースに対応しています。ただし、Dockerイメージのみが配布されているため、利用するにはコンテナ型仮想化の知識と環境が必要になります。
ユーザ認証は、ローカルデータベースによるものだけで、LDAPとの連携はできません。また、権限管理は読込み、書込みの2種類のみで細かな設定を行うことができません。Metabaseのようなクエリビルダーの機能もないため、利用者にはSQLなどデータベースの知識が必須です。
表示はすべて英語で、ソフトウェア自体に国際化の仕組みがないため、今後も日本語対応されることは期待できません。
どのBIツールを選ぶのか?
Apache Supersetは、対応するデータベースが多く、作成できるグラフの種類も多く、日本語化もある程度されていますので、非常に使いやすいソフトウェアです。SQLについての知識が必要ですが、管理者と閲覧者を分けることで、広い用途に対応できます。そのため、SQLの知識がある人には、最も使いやすいソフトウェアであると言えます。また、開発がApache Foundationで行われていて、他の無料で使えるOSSのBIツールと比較しても、安定した開発やサポートが見込めます。そのため、デージーネットでも、BIツールとしてはApache Supersetを推奨しています。
Grafanaは、Apache Supersetと同じように、扱えるデータソースの数が多く、認証の機能なども優れているため使いやすいツールです。また、時系列のデータを扱う場合には、最も有効なソフトウェアです。しかし、日本語化がされていなかったり、クエリビルダーの機能がないためSQLなど扱うデータソースの知識が必須だという欠点があります。
一方で、Metabaseは、クエリビルダー、グラフ表示の種類、認証とアクセス制御などの機能が優れていて、SQLの知識があまりない人や初心者でも使いやすいソフトウェアです。ただし、オープンソース版は、バージョンが1.0に到達しておらず、まだ上手く動作しない機能があります。
現時点では、既に蓄積されたデータがある場合、この3つのうちのいれかを使うべきだと考えられます。また、これから大量のデータを収集して解析する場合には、Graylogを利用するのが便利です。
デージーネットの取り組み
デージーネットでは、Graylogの日本語マニュアルを公開するなど、BIツールの分野でもOSSの活用と導入について支援をしています。また導入後の保守・サポートも提供しています。
BIツールの関連情報
IoTプラットフォームで使われるOSS 20選
IoTプラットフォームとは、IoTに必要な機能を提供するための基盤(プラットフォーム)の総称です。ここでは、IoTプラットフォームで利用できる汎用的なOSSについて解説します。
https://www.designet.co.jp/ossinfo/selection/iot-platform.html
Elasticsearch〜OSSの全文検索エンジン〜
Elasticsearchは、OSSの全文検索エンジンです。このページでは、Elasticsearchの特徴、Elasticsearchと周辺ソフト、Elasticsearchに対するデージーネットの取り組みを紹介します。
Apache Superset調査報告書
Apache Supersetは、データの検索や可視化を行うためのBIツールの一種です。MySQLやPostgreSQL等のデータベースのほかに、約40種類のデータソースを扱うことができます。本書は「Apache Superset」についての調査報告書です。
Grafana調査報告書
Grafanaは、ダッシュボードを構築するためのオープンソースソフトウェアです。Zabbixと連携することができ、複数のZabbixの統計情報をひとつのダッシュボードに表示することができます。本書は、Grafanaを調査した結果をまとめたものです。
metabase調査報告書
Metabaseは、Metabaseプロジェクトによって開発されているデータの可視化を行うソフトウェアです。いわゆるダッシュボードソフトウェア・BIツールなどと呼ばれるもののひとつです。本書はmetabaseについて調査した結果をまとめたものです。
Graylog調査報告書
Graylogは、ログの収集・集計・グラフ化・アラート送信などを行うことができるログ管理システムです。本書は、Graylogでの様々なデータの収集・グラフ化の検証結果を実際の例を踏まえて解説しています。