オープンソース

Apache Superset〜可視化に優れたOSSのBIツール〜

BIツールとは「ビジネスインテリジェンスツール」の略で、蓄積されたデータを集め、分析結果をグラフや図表で分かりやすく可視化して業務に役立てるソフトウェアのことを示します。BIツールは、企業の意思決定を支援するためのツールとして、基幹業務、販売管理、マーケティング、予算管理、在庫管理、組織管理や経営に必要な統計解析まで、ビジネスにおける幅広い分野のシステムで使われています。最近は新型コロナウイルスの影響で、BIツールを利用してデータを活用する企業が増えてきています。今回は、OSSのBIツールの一つであるWebアプリケーション、Apache Supersetを紹介します。

目次

Apache Supersetとは

コロナダッシュボード

Apache Supersetのダッシュボード画面

Apache Supersetとは、Airbnb社が開発したデータの検索や可視化を行うためのオープンソースソフトウェアのBIツールです。ライセンスは、Apache License 2.0で公開されており、開発言語はpythonおよびjavascriptで、Apacheプロジェクトが管理しています。Apache Supersetは、開発初期段階においては他のOSS系のBIツールと比較して非常に使いにくいものでした。しかし、最新のバージョンは機能が大幅に向上し、使いやすくなっています。Apache Supersetは、シンプルな折れ線グラフや円グラフから詳細な地理空間チャートまで、さまざまなデータ探索や視覚化が可能です。MySQLやPostgreSQL等のほかに、40種類程度のデータソースを扱うことができます。

Apache Supersetの特徴

Apache Supersetの特徴は以下の通りです。

綺麗なインタフェースでデータの参照が可能

Apache SupersetはWEBブラウザ上で操作することが可能で、非常に分かりやすく見た目の良いインターフェースとなっています。列の背景をグラデーションにしたり、集計したデータをグラフ化する際に色を分けたりことができます。

Apache Supersetの折れ線チャート

多彩な可視化表現を実装している

Apache Supersetは、集めたデータをグラフ等で表示することができます。これはBIツールでは必須の機能ですが、Apache Supersetは、表示できるテーブル・バーチャートなどの可視化ツールがおよそ60種類存在します。各種類ごとに表示のオプションなども用意されており、データややりたいことに合わせてグラフを作ることができます。単体のグラフ作成の他、dashboard(ダッシュボード)としてまとめることが可能です。

Apache Supersetヴィジュアル

多くのデータベースに対応している

Apache Supersetは、MySQLやPostgreSQLに代表されるRDBMSや、SQL互換のインタフェースを持つ多くのDB(データベース)と接続可能です。その種類はクラウドサービスのデータベースも含めてほぼ30種類に及びます。GoogleのBig QueryやAmazonのRedshiftなどにも対応しています。

Apache Supersetデータセット

Apache Supersetは以下のデータベース・クラウドサービスに対応しています。

・Amazon Athena
・Apache Druid
・Ascend.io
・Apache Solr
・CockroachDB
・Exasol
・Hana
・MySQL
・Presto
・Teradata
・Trino
・Databricks
・Kusto
・Amazon Redshift
・Apache Hive
・Apache Kylin
・Apache Spark SQL
・Dremio
・Google BigQuery
・IBM DB2
・Oracle
・Snowflake
・Vertica
・Rockset
・Firebird
・Apache Drill
・Apache Impala
・Apache Pinot
・Clickhouse
・Elasticsearch
・Google Sheets
・IBM Netezza Performance Server
・Postgres
・Microsoft SQL Server
・Hologres
・CrateDB
・Firebolt

新たなデータを登録して検索対象にできる

WEB UIからデータの追加を行う際は、SQLで直接追加・更新の処理をしたり、CSV等でのデータアップロード・新規テーブルを追加したりすることが可能です。データベースの中にあるデータを可視化するだけではなく、手元にあるデータをアップロードして、解析対象にすることが可能となります。

CSVアップロード画面

CSVアップロード画面

SQLクエリを直接実行することが可能

SQL LabというSQLクエリを発行するためのWEB UIがあります。この機能を使うことで、データベースのデータを直接検索したり、時にはデータを更新することも可能です。なお更新する操作はデータベース登録時の設定で、更新系クエリを許可する必要があります。

SQLLab

多言語対応が可能

多言語に対応しています。日本語の翻訳は途中段階ですが、日本語への切り替えはすでに実装されています。

非常に細かい権限管理が可能

Apache Supersetでは、ユーザを複数作成してユーザアカウント毎にID・パスワードを設定すれば、操作・閲覧権限を割り当てることができます。非常に多くの権限の種類が用意されており、それらを組み合わせた設定を作成してユーザに割り当てることで、ユーザの操作を制限することができます。

現在、すでにデフォルトで作成されている設定は、全体で230件程度用意されています。しかしこれらの権限の詳細については、残念ながら現在はドキュメント化されていません。そのため権限のキーワードからどのような動作かを想像するしかありません。調査報告書では、権限管理についても解説しています。

ユーザー一覧

ダッシュボードを定期的にレポートすることができる

作成したグラフは、ダッシュボードとしてまとめて閲覧が可能になります。サンプルデータでは、各種ダッシュボードが予め用意されており絞り込みの検索も行うことができます。またそれぞれのダッシュボードにCSSを登録して、色などのデザインを変更することができます。ただしHTMLやjavascriptまでは書き換えることができないため、用意されたレイアウトの中でデザイン変更が可能です。その他に、ダッシュボードを画像としてダウンロードすることやダッシュボードの定期レポートを送信することができます。レポートを通知するスケジュールを入力することで、メールでダッシュボードのキャプチャ画像を送ることができます。この機能を使うことで、ダッシュボードにアクセスせず、定期的にダッシュボードを閲覧することができるようになります。

ダッシュボード

コロナワクチンダッシュボード

Apache Supersetの問題点

日本語に対応しているBIツールは非常に少ないため、私たちにとっては使いやすいツールの一つです。しかし、利用するにあたっての問題もいくつかあります。

データベースに関する高いスキルレベルが必要

他のBIツールと比較するとSQLに特化しており、MySQLやPostgreSQLに溜まったデータの分析・可視化などの課題に対して非常に有効です。そのため、基本的にSQLや使用するデータベースを管理できる環境(技術的・人的)が求められます。データの管理を行ったりダッシュボードを作る人には、SQLについての知識を持ったエンジニアなど、比較的高いスキルを持つ人材が必要です。

しかし権限管理によって、一般の人にはダッシュボードの参照のみを可能にするなど、利用者によって使い分けが可能です。管理者と閲覧者を分けるなど使い方を工夫することで、業種を問わず広い用途や場面に対応できます。

NoSQL系のデータベースに対応していない

多くのデータベースに対応していることがメリットとしてあげられますが、対応するデータベースの種類が限られており、MongoDBなどのNoSQL系のデータベースには対応することができません。NoSQL系のデータベースに対応したBIツールを利用したい場合は、Grafanaなどの他のソフトウェアを検討する必要があります。

日本語化できていない部分がある

日本語には対応していますが、日本語化が行われていない部分もまだ多く、今後の翻訳作業を待つ必要があります。また、チャートのラベルなど、一部で日本語の名前を登録するとエラーが発生する箇所があり、全てで日本語が使えるわけではないため注意が必要です。

マニュアル化されていない

非常に多くの権限の種類が用意されている一方で、それぞれの権限設定によってどのような行動が可能になるのか、マニュアルに記載がありません。現在は、権限の名前と動作、またはソースコードから推測が必要になります。

デージーネットの取り組み

現時点では、Apache Supersetを使用していく中で日本語の問題などの課題があります。デージーネットでは、今後日本語化を行い使いやすいツールになるようにするなど、役に立つ情報を提供していく予定です。なお、インストール方法や使い方などの詳しい情報は、調査報告書に掲載しています。

OSSのBIツールには他にも、GrafanaやMetabase、Kibanaなど多数存在します。デージーネットでは、これらのOSSのBIツールについても調査し、それぞれの特徴を基に、用途や利用者のスキルに合ったBIツールのシステムを提案しています。

なお、開発はApache Foundationによって行われているため、安定した開発やサポートが必要な場合は、他のOSSのBIツールよりもApache Supersetを推奨しています。さらに、弊社で構築を行った場合、導入後の保守・サポートも提供しております。保守サービスでは、使い方から運用方法まで幅広い範囲でのQ&Aや、適正に運用できるようなセキュリティの情報提供、障害調査、回避を行い、安心して利用して頂けるよう管理者の業務をサポートいたします。無料のお見積も可能ですので、お気軽にお問い合わせください。

各種費用についてのお問い合わせ

コンサルティング費用、設計費用、構築費用、運用費用、保守費用など、各種費用についてのお見積もりは以下のフォームよりお気軽にお問合せ下さい。

unboundやPowerDNSを使用したDNSサーバのモデルプランをご希望の方

全国対応イメージ

関連ページ

Apache Superset調査報告書

無料資料ダウンロード

データの検索や可視化を行うためのBIツールの一種である「Apache Superset」についての調査報告書です。主に公式のマニュアルを参考にしたインストール方法や基本の使い方について掲載しています。

BIツールとは?無料で使えるおすすめOSSの比較6選

bitool

BIツール(ビジネスインテリジェンスツール)とは、蓄積されたデータを分析し、意思決定を支援するためのツールやシステムのことを示します。この記事では、試し利用におすすめのライセンスが無料で利用できるBIツールのソフトウェアを紹介します。

Grafana〜ダッシュボードツールでデータ可視化〜

Grafana

Grafanaは、データベースの情報を可視化してWeb上に一覧表示する、オープンソースのダッシュボードツールです。経営判断などに役立つツールとしてビジネスで活用されています。ここでは、Grafanaの特徴やメリットを紹介します。

デモのお申込み

もっと使い方が知りたい方へ
操作方法や操作性をデモにてご確認いただけます。使い方のイメージを把握したい、使えるか判断したい場合にご活用下さい。デモをご希望の方は、下記よりお申込みいただけます。

デモをご希望の方

デモの申し込みイメージ

Apache Superset〜可視化に優れたOSSのBIツール〜の先頭へ