Apache Superset〜可視化に優れたおすすめBIツール〜
BIツールとは「ビジネスインテリジェンスツール」の略で、蓄積したデータを集め、分析結果をグラフや図表で見やすく可視化するソフトウェアのことを指します。BIツールは、企業の意思決定を支援するためのツールとして、ビジネスの幅広い分野の業務で役立てられています。今回紹介するApache Supersetは、オープンソースであるため無料で利用可能で、可視化表現に優れていて特に使いやすいBIツールです。この記事では、Apache Supersetの特徴や課題点について紹介します。
- +
目次
Apache Supersetとは
Apache Supersetとは、Airbnb社が開発したデータの検索や可視化を行うためのオープンソースソフトウェアのBIツールです。ライセンスは、Apache License 2.0で公開されており、開発言語はpythonおよびjavascriptで、Apacheプロジェクトが管理しています。Apache Supersetは、開発初期段階においては他のOSS系のBIツールと比較して非常に使いにくいものでした。しかし、最新のバージョンは機能が大幅に向上し、使いやすくなっています。Apache Supersetは、シンプルな折れ線グラフや円グラフから詳細な地理空間チャートまで、さまざまなデータ探索や視覚化が可能です。MySQLやPostgreSQL等のほかに、40種類程度のデータソースを扱うことができます。
Apache Supersetの特徴
Apache Supersetの特徴は以下の通りです。
綺麗なインタフェースでデータの参照が可能
WEBブラウザ上で操作することが可能で、非常に分かりやすく見た目の良いインターフェースとなっています。列の背景をグラデーションにしたり、集計したデータをグラフ化する際に色を分けたりことができます。
多彩な可視化表現を実装している
Apache Supersetは、集めたデータをグラフ等で表示することができます。これはBIツールでは必須の機能ですが、Apache Supersetは、表示できるテーブル・バーチャートなどの可視化ツールがおよそ60種類存在します。各種類ごとに表示のオプションなども用意されており、データややりたいことに合わせてグラフを作ることができます。単体のグラフ作成の他、dashboard(ダッシュボード)としてまとめることが可能です。
多くのデータベースに対応している
Apache Supersetは、MySQLやPostgreSQLに代表されるRDBMSや、SQL互換のインタフェースを持つ多くのDB(データベース)と接続可能です。その種類はクラウドサービスのデータベースも含めてほぼ30種類に及びます。GoogleのBig QueryやAmazonのRedshiftなどにも対応しています。
Apache Supersetは以下のデータベース・クラウドサービスに対応しています。
・Amazon Athena ・Apache Druid ・Ascend.io ・Apache Solr ・CockroachDB ・Exasol ・Hana ・MySQL ・Presto ・Teradata ・Trino ・Databricks ・Kusto |
・Amazon Redshift ・Apache Hive ・Apache Kylin ・Apache Spark SQL ・Dremio ・Google BigQuery ・IBM DB2 ・Oracle ・Snowflake ・Vertica ・Rockset ・Firebird |
・Apache Drill ・Apache Impala ・Apache Pinot ・Clickhouse ・Elasticsearch ・Google Sheets ・IBM Netezza Performance Server ・Postgres ・Microsoft SQL Server ・Hologres ・CrateDB ・Firebolt |
新たなデータを登録して検索対象にできる
WEB UIからデータの追加を行うことが可能です。SQLで直接追加・更新の処理も行うことも可能ですが、CSV等でのデータアップロード・新規テーブル追加も可能です。データベースの中にあるデータを可視化するだけではなく、手元にあるデータをアップロードして、解析対象にすることが可能となります。
SQLクエリを直接実行することが可能
SQL LabというSQLクエリを発行するためのWEB UIがあります。この機能を使うことで、データベースのデータを直接検索したり、時にはデータを更新することも可能です。なお更新する操作はデータベース登録時の設定で、更新系クエリを許可する必要があります。
多言語対応が可能
多言語に対応しています。日本語の翻訳は途中段階ですが、日本語への切り替えはすでに実装されています。
非常に細かい権限管理が可能
Apache Supersetでは、ユーザを複数作成してユーザアカウント毎にID・パスワードを設定すれば、操作・閲覧権限を割り当てることができます。非常に多くの権限の種類が用意されており、それらを組み合わせた設定を作成してユーザに割り当てることで、ユーザの操作を制限することができます。
現在、すでにデフォルトで作成されている設定は、全体で230件程度用意されています。しかしこれらの権限の詳細については、残念ながら現在はドキュメント化されていません。そのため権限のキーワードからどのような動作かを想像するしかありません。調査報告書では、権限管理についても解説しています。
ダッシュボードを定期的にレポートすることができる
作成したグラフは、ダッシュボードとしてまとめて閲覧が可能になります。サンプルデータでは、各種ダッシュボードが予め用意されており絞り込みの検索も行うことができます。またそれぞれのダッシュボードにCSSを登録して、色などのデザインを変更することができます。ただしHTMLやjavascriptまでは書き換えることができないため、用意されたレイアウトの中でデザイン変更が可能です。その他に、ダッシュボードを画像としてダウンロードすることやダッシュボードの定期レポートを送信することができます。レポートを通知するスケジュールを入力することで、メールでダッシュボードのキャプチャ画像を送ることができます。この機能を使うことで、ダッシュボードにアクセスせず、定期的にダッシュボードを閲覧することができるようになります。
Apache Supersetの問題点
日本語に対応しているものは非常に少ないため、私たちにとっては使いやすいツールの一つです。しかし、利用するにあたっての問題もいくつかあります。
データベースに関する高いスキルレベルが必要
他のBIツールと比較すると、SQLに特化しており、MySQLやPostgreSQLに溜まったデータの分析・可視化などの課題に対して非常に有効なツールです。そのため、基本的にSQLや使用するデータベースを管理できる環境(技術的・人的)が求められます。データの管理を行ったりダッシュボードを作る人には、エンジニアなど比較的高いスキルを持つ人材が求められます。しかし、権限管理で一般的な人にダッシュボードの参照のみを可能にすることもできるため、利用者によって使い分けが可能となります。
データベースの対応が限定されている
多くのデータベースに対応していることがメリットとしてあげられますが、対応するデータベースが限られるため、MongoDBなどのNoSQL系のデータベースには対応することができません。
日本語化できていない部分がある
日本語に対応していますが、日本語化がまだ行われていない部分が多く今後、翻訳の作業を待つ必要があります。また、チャートのラベルなど一部日本語の名前を登録するとエラーが発生する箇所があり、全てで日本語が使えるわけではなく注意が必要です。
マニュアル化されていない
それぞれの権限設定にどのような行動が可能になるのかマニュアルに記載がありません。現在は、権限の名前と動作、またはソースコードから推測が必要になります。
このように、Apache Supersetの利用にはある程度のスキルが求められます。利用者はSQLについての知識が必要ですが、管理者と閲覧者を分けることで、業種を問わず広い用途や場面に対応できます。また、開発はApache Foundationによって行われているため、安定した開発やサポートが必要な場合は、他のOSSのBIツールよりもApache Supersetを推奨しています。なお、以下のページでは、OSS各種BIツールについて比較し、おすすめの選び方を紹介しています。
デージーネットの取り組み
現時点では、Apache Supersetを使用していく中で日本語の問題などの課題があります。デージーネットでは、今後日本語化を行い使いやすいツールになるようにするなど、役に立つ情報を提供していく予定です。なお、インストール方法などの詳しい情報は、Apache Superset調査報告書に掲載しています。
OSSのBIツールには、Apache Supersetだけでなく、GrafanaやMetabase、Kibana、Apache Supersetなど多数存在します。デージーネットでは、これらのOSSのBIツールについても調査し、それぞれの特徴を基に、用途や利用者のスキルに合ったBIツールのシステムを提案しています。
さらに、弊社で構築を行った場合、導入後の保守・サポートも提供しております。保守サービスでは、使い方から運用方法まで幅広い範囲でのQ&Aや、適正に運用できるようなセキュリティの情報提供、障害調査、回避を行い、安心して利用して頂けるよう管理者の業務をサポートいたします。無料のお見積も可能ですので、お気軽にお問い合わせください。
関連ページ
Apache Superset調査報告書
データの検索や可視化を行うためのBIツールの一種である「Apache Superset」についての調査報告書です。主に公式のマニュアルを参考にしたインストール方法や基本の利用方法の記事が掲載されています。
BIツールとは?無料で使えるおすすめOSSの比較6選
BIツール(ビジネスインテリジェンスツール)とは、蓄積されたデータを分析し、意思決定を支援するためのツールやシステムのことを示します。ここでは、試し利用におすすめのライセンスが無料で利用できるBIツールのソフトウェアを紹介します。
【Webセミナー】RDBMSの情報を活用できるOSSのBIツールセミナー
日程: | 6月23日(木)Webセミナー 「BigBlueButton」を使用します。 |
内容: | 今回は、弊社がおすすめするオープンソースソフトウェアのBIツールApache Supersetを紹介します。 |
ご興味のあるかたはぜひご参加ください。 |