Apache Superset〜OSSのBIツール〜
BIツールとは「ビジネスインテリジェンスツール」の略で、蓄積されたデータを集め、分析した結果を、グラフや図表で分かりやすく可視化して業務に役立てるソフトウェアのことです。そのため、企業の意思決定を支援するためのツールやシステムのことを示します。BIツールは、基幹業務、販売管理、マーケティング、予算管理、在庫管理、組織管理や経営に必要な統計解析まで幅広い分野のビジネスで使われています。最近では、新型コロナウイルスの影響もあり、BIツールを利用してデータを活用する企業が増えてきています。OSS(Open Source Software/オープンソース ソフトウェア)のBIツールには、GrafanaやMetabase、Kibana、Apache Supersetなど多数存在します。今回は、OSSのBIツールの一つであるWebアプリケーションのApache Supersetを紹介します。
Apache Supersetとは
Apache Supersetとは、Airbnb社が開発したデータの検索や可視化を行うためのオープンソースソフトウェアのBIツールです。ライセンスは、Apache License 2.0で公開されており、開発言語はpythonおよびjavascriptで、Apacheプロジェクトが管理しています。Apache Supersetは、開発初期段階においては他のOSS系のBIツールと比較して非常に使いにくいものでした。しかし、最新のバージョンは機能が大幅に向上し、使いやすくなっています。Apache Supersetは、シンプルな折れ線グラフや円グラフから詳細な地理空間チャートまで、さまざまなデータ探索や視覚化が可能です。MySQLやPostgreSQL等のほかに、40種類程度のデータソースを扱うことができます。
Apache Supersetのダッシュボード画面
Apache Supersetの特徴
Apache Supersetの特徴は以下の通りです。
多彩な可視化表現を実装している
Apache Supersetは、集めたデータをグラフ等で表示することができます。これはBIツールでは必須の機能ですが、Apache Supersetは、表示できるテーブル・バーチャートなどの可視化ツールがおよそ60種類存在します。各種類ごとに表示のオプションなども用意されており、データややりたいことに合わせてグラフを作ることができます。単体のグラフ作成の他、dashboard(ダッシュボード)としてまとめることが可能です。
多くのデータベースに対応している
Apache Supersetは、MySQLやPostgreSQLに代表されるRDBMSや、SQL互換のインタフェースを持つ多くのDB(データベース)と接続可能です。その種類はクラウドサービスのデータベースも含めてほぼ30種類に及びます。GoogleのBig QueryやAmazonのRedshiftなどにも対応しています。
Apache Supersetは以下のデータベース・クラウドサービスに対応しています。
・Amazon Athena ・Apache Druid ・Ascend.io ・Apache Solr ・CockroachDB ・Exasol ・Hana ・MySQL ・Presto ・Teradata ・Trino ・Databricks ・Kusto |
・Amazon Redshift ・Apache Hive ・Apache Kylin ・Apache Spark SQL ・Dremio ・Google BigQuery ・IBM DB2 ・Oracle ・Snowflake ・Vertica ・Rockset ・Firebird |
・Apache Drill ・Apache Impala ・Apache Pinot ・Clickhouse ・Elasticsearch ・Google Sheets ・IBM Netezza Performance Server ・Postgres ・Microsoft SQL Server ・Hologres ・CrateDB ・Firebolt |
綺麗なインタフェースでデータの参照が可能
WEBブラウザで操作が可能です。非常に見た目の良い画面となっており、列の背景をグラデーションにするなど集計したデータをグラフ化する際など色をわけることができます。
新たなデータを登録して検索対象にできる
WEB UIからデータの追加を行うことが可能です。SQLで直接追加・更新の処理も行うことも可能ですが、CSV等でのデータアップロード・新規テーブル追加も可能です。データベースの中にあるデータを可視化するだけではなく、手元にあるデータをアップロードして、解析対象にすることが可能となります。
SQLクエリを直接実行することが可能
SQL LabというSQLクエリを発行するためのWEB UIがあります。この機能を使うことで、データベースのデータを直接検索したり、時にはデータを更新することも可能です。なお更新する操作はデータベース登録時の設定で、更新系クエリを許可する必要があります。
日本語対応が可能
多言語に対応しています。日本語の翻訳は途中段階ですが、日本語への切り替えはすでに実装されています。
非常に細かい権限管理が可能
ユーザを複数作成してユーザアカウント毎にID・パスワードを設定し、操作・閲覧権限を割り当てることができます。Apache Supersetでは、非常に多くの権限が用意されており、それらを組み合わせた設定を作成することができます。作成した設定をユーザに割り当てて、ユーザの操作を制限することができます。すでにデフォルトで作成されている設定は、現在全体では230件程度用意されています。これらの権限の詳細については、残念ながら現在はドキュメント化されていません。そのため権限のキーワードからどのような動作かを想像するしかありません。
ダッシュボードを定期的にレポートすることができる
作成したグラフは、ダッシュボードとしてまとめて閲覧が可能になります。サンプルデータでは、各種ダッシュボードが予め用意されており絞り込みの検索も行うことができます。またそれぞれのダッシュボードにCSSを登録して、色などのデザインを変更することができます。ただしHTMLやjavascriptまでは書き換えることができないため、用意されたレイアウトの中でデザイン変更が可能です。その他に、ダッシュボードを画像としてダウンロードすることやダッシュボードの定期レポートを送信することができます。レポートを通知するスケジュールを入力することで、メールでダッシュボードのキャプチャ画像を送ることができます。この機能を使うことで、ダッシュボードにアクセスせず、定期的にダッシュボードを閲覧することができるようになります。
Apache Supersetの問題点
日本語に対応しているものは非常に少ないため、私たちにとっては使いやすいツールの一つです。しかし、利用するにあたっての問題もいくつかあります。
データベースに関する高いスキルレベルが必要
基本的にSQLや使用するデータベースを管理できる環境(技術的・人的)が求められるツールです。このため、データの管理を行ったりダッシュボードを作る人間には、エンジニアなど比較的高いスキルが持つ人材が求められます。しかし、権限管理で一般的な人にダッシュボードの参照のみを可能にすることもできるため、利用者によって使い分けが可能となります。
データベースの対応が限定されている
多くのデータベースに対応していることがメリットとしてあげられますが、対応するデータベースが限られるため、MongoDBなどのNoSQL系のデータベースには対応することができません。
日本語化できていない部分がある
日本語に対応していますが、日本語化がまだ行われていない部分が多く今後、翻訳の作業を待つ必要があります。また、チャートのラベルなど一部日本語の名前を登録するとエラーが発生する箇所があり、全てで日本語が使えるわけではなく注意が必要です。
マニュアル化されていない
それぞれの権限設定にどのような行動が可能になるのかマニュアルに記載がありません。現在は、権限の名前と動作、またはソースコードから推測が必要になります。
デージーネットの取り組み
弊社では、GrafanaやMetabaseなどのOSSのダッシュボードツールを取り上げてきました。そういったツールと比較してApache SupersetはSQLに特化しているため、MySQLやPostgreSQLに溜まったデータの分析・可視化などの課題に対して非常に有効であると考えています。しかし、日本語の問題など使用していく中で課題があるソフトウェアとなっています。今後日本語化を行い使いやすいツールになるようにするなど、役に立つ情報を提供していきます。インストール方法などの詳しい情報は、Apache Superset調査報告書に掲載しています。
関連ページ
BIツールとは?無料で使えるおすすめOSSの比較6選
BIツール(ビジネスインテリジェンスツール)とは、蓄積されたデータを分析し、意思決定を支援するためのツールやシステムのことを示します。ここでは、試し利用におすすめのライセンスが無料で利用できるBIツールのソフトウェアを紹介します。
Apache Superset調査報告書
データの検索や可視化を行うためのBIツールの一種である「Apache Superset」についての調査報告書です。主に公式のマニュアルを参考にしたインストール方法や基本の利用方法の記事が掲載されています。
【Webセミナー】RDBMSの情報を活用できるOSSのBIツールセミナー
日程: | 6月23日(木)Webセミナー 「BigBlueButton」を使用します。 |
内容: | 今回は、弊社がおすすめするオープンソースソフトウェアのBIツールApache Supersetを紹介します。 |
ご興味のあるかたはぜひご参加ください。 |