Apache Superset〜可視化に優れたOSSのBIツール〜
BIツールとは「ビジネスインテリジェンスツール」の略で、蓄積されたデータを集め、分析結果をグラフや図表で分かりやすく可視化して業務に役立てるソフトウェアのことを示します。BIツールは、企業の意思決定を支援するためのツールとして、基幹業務、販売管理、マーケティング、予算管理、在庫管理、組織管理や経営に必要な統計解析まで、ビジネスにおける幅広い分野のシステムで使われています。最近は新型コロナウイルスの影響で、BIツールを利用してデータを活用する企業が増えてきています。今回は、OSSのBIツールの一つであるWebアプリケーション、Apache Supersetを紹介します。
- +
目次
Apache Supersetとは
Apache Supersetとは、Airbnb社が開発したデータの検索や可視化を行うためのオープンソースソフトウェアのBIツールです。ライセンスは、Apache License 2.0で公開されており、開発言語はpythonおよびjavascriptで、Apacheプロジェクトが管理しています。Apache Supersetは、開発初期段階においては他のOSS系のBIツールと比較して非常に使いにくいものでした。しかし、最新のバージョンは機能が大幅に向上し、使いやすくなっています。Apache Supersetは、シンプルな折れ線グラフや円グラフから詳細な地理空間チャートまで、さまざまなデータ探索や視覚化が可能です。MySQLやPostgreSQL等のほかに、40種類程度のデータソースを扱うことができます。
Apache Supersetの特徴
Apache Supersetの特徴は以下の通りです。
綺麗なインタフェースでデータの参照が可能
Apache SupersetはWEBブラウザ上で操作することが可能で、非常に分かりやすく見た目の良いインターフェースとなっています。列の背景をグラデーションにしたり、集計したデータをグラフ化する際に色を分けたりことができます。
多彩な可視化表現を実装している
Apache Supersetは、集めたデータをグラフ等で表示することができます。これはBIツールでは必須の機能ですが、Apache Supersetは、表示できるテーブル・バーチャートなどの可視化ツールがおよそ60種類存在します。各種類ごとに表示のオプションなども用意されており、データややりたいことに合わせてグラフを作ることができます。単体のグラフ作成の他、dashboard(ダッシュボード)としてまとめることが可能です。
多くのデータベースに対応している
Apache Supersetは、MySQLやPostgreSQLに代表されるRDBMSや、SQL互換のインタフェースを持つ多くのDB(データベース)と接続可能です。その種類はクラウドサービスのデータベースも含めてほぼ30種類に及びます。GoogleのBig QueryやAmazonのRedshiftなどにも対応しています。
Apache Supersetは以下のデータベース・クラウドサービスに対応しています。
・Amazon Athena ・Apache Druid ・Ascend.io ・Apache Solr ・CockroachDB ・Exasol ・Hana ・MySQL ・Presto ・Teradata ・Trino ・Databricks ・Kusto |
・Amazon Redshift ・Apache Hive ・Apache Kylin ・Apache Spark SQL ・Dremio ・Google BigQuery ・IBM DB2 ・Oracle ・Snowflake ・Vertica ・Rockset ・Firebird |
・Apache Drill ・Apache Impala ・Apache Pinot ・Clickhouse ・Elasticsearch ・Google Sheets ・IBM Netezza Performance Server ・Postgres ・Microsoft SQL Server ・Hologres ・CrateDB ・Firebolt |
新たなデータを登録して検索対象にできる
WEB UIからデータの追加を行う際は、SQLで直接追加・更新の処理をしたり、CSV等でのデータアップロード・新規テーブルを追加したりすることが可能です。データベースの中にあるデータを可視化するだけではなく、手元にあるデータをアップロードして、解析対象にすることが可能となります。
SQLクエリを直接実行することが可能
SQL LabというSQLクエリを発行するためのWEB UIがあります。この機能を使うことで、データベースのデータを直接検索したり、時にはデータを更新することも可能です。なお更新する操作はデータベース登録時の設定で、更新系クエリを許可する必要があります。
多言語対応が可能
多言語に対応しています。日本語の翻訳は途中段階ですが、日本語への切り替えはすでに実装されています。
非常に細かい権限管理が可能
Apache Supersetでは、ユーザを複数作成してユーザアカウント毎にID・パスワードを設定すれば、操作・閲覧権限を割り当てることができます。非常に多くの権限の種類が用意されており、それらを組み合わせた設定を作成してユーザに割り当てることで、ユーザの操作を制限することができます。
現在、すでにデフォルトで作成されている設定は、全体で230件程度用意されています。しかしこれらの権限の詳細については、残念ながら現在はドキュメント化されていません。そのため権限のキーワードからどのような動作かを想像するしかありません。調査報告書では、権限管理についても解説しています。
ダッシュボードを定期的にレポートすることができる
作成したグラフは、ダッシュボードとしてまとめて閲覧が可能になります。サンプルデータでは、各種ダッシュボードが予め用意されており絞り込みの検索も行うことができます。またそれぞれのダッシュボードにCSSを登録して、色などのデザインを変更することができます。ただしHTMLやjavascriptまでは書き換えることができないため、用意されたレイアウトの中でデザイン変更が可能です。その他に、ダッシュボードを画像としてダウンロードすることやダッシュボードの定期レポートを送信することができます。レポートを通知するスケジュールを入力することで、メールでダッシュボードのキャプチャ画像を送ることができます。この機能を使うことで、ダッシュボードにアクセスせず、定期的にダッシュボードを閲覧することができるようになります。
Apache Supersetの問題点
日本語に対応しているBIツールは非常に少ないため、私たちにとっては使いやすいツールの一つです。しかし、利用するにあたっての問題もいくつかあります。
データベースに関する高いスキルレベルが必要
他のBIツールと比較するとSQLに特化しており、MySQLやPostgreSQLに溜まったデータの分析・可視化などの課題に対して非常に有効です。そのため、基本的にSQLや使用するデータベースを管理できる環境(技術的・人的)が求められます。データの管理を行ったりダッシュボードを作る人には、SQLについての知識を持ったエンジニアなど、比較的高いスキルを持つ人材が必要です。
しかし権限管理によって、一般の人にはダッシュボードの参照のみを可能にするなど、利用者によって使い分けが可能です。管理者と閲覧者を分けるなど使い方を工夫することで、業種を問わず広い用途や場面に対応できます。
NoSQL系のデータベースに対応していない
多くのデータベースに対応していることがメリットとしてあげられますが、対応するデータベースの種類が限られており、MongoDBなどのNoSQL系のデータベースには対応することができません。NoSQL系のデータベースに対応したBIツールを利用したい場合は、Grafanaなどの他のソフトウェアを検討する必要があります。
日本語化できていない部分がある
日本語には対応していますが、日本語化が行われていない部分もまだ多く、今後の翻訳作業を待つ必要があります。また、チャートのラベルなど、一部で日本語の名前を登録するとエラーが発生する箇所があり、全てで日本語が使えるわけではないため注意が必要です。
マニュアル化されていない
非常に多くの権限の種類が用意されている一方で、それぞれの権限設定によってどのような行動が可能になるのか、マニュアルに記載がありません。現在は、権限の名前と動作、またはソースコードから推測が必要になります。
デージーネットの取り組み
現時点では、Apache Supersetを使用していく中で日本語の問題などの課題があります。デージーネットでは、今後日本語化を行い使いやすいツールになるようにするなど、役に立つ情報を提供していく予定です。なお、インストール方法や使い方などの詳しい情報は、調査報告書に掲載しています。
OSSのBIツールには他にも、GrafanaやMetabase、Kibanaなど多数存在します。デージーネットでは、これらのOSSのBIツールについても調査し、それぞれの特徴を基に、用途や利用者のスキルに合ったBIツールのシステムを提案しています。
なお、開発はApache Foundationによって行われているため、安定した開発やサポートが必要な場合は、他のOSSのBIツールよりもApache Supersetを推奨しています。さらに、弊社で構築を行った場合、導入後の保守・サポートも提供しております。保守サービスでは、使い方から運用方法まで幅広い範囲でのQ&Aや、適正に運用できるようなセキュリティの情報提供、障害調査、回避を行い、安心して利用して頂けるよう管理者の業務をサポートいたします。無料のお見積も可能ですので、お気軽にお問い合わせください。
関連ページ
Apache Superset調査報告書
データの検索や可視化を行うためのBIツールの一種である「Apache Superset」についての調査報告書です。主に公式のマニュアルを参考にしたインストール方法や基本の使い方について掲載しています。
BIツールとは?無料で使えるおすすめOSSの比較6選
BIツール(ビジネスインテリジェンスツール)とは、蓄積されたデータを分析し、意思決定を支援するためのツールやシステムのことを示します。この記事では、試し利用におすすめのライセンスが無料で利用できるBIツールのソフトウェアを紹介します。
Grafana〜ダッシュボードツールでデータ可視化〜
Grafanaは、データベースの情報を可視化してWeb上に一覧表示する、オープンソースのダッシュボードツールです。経営判断などに役立つツールとしてビジネスで活用されています。ここでは、Grafanaの特徴やメリットを紹介します。