任何一个信息系统,除了一些基本的业务功能外,数据分析功能也是普遍的需求,特别是对数据的可视化,能够帮助业务提高数据洞察力和透明度,从而更有效的帮助业务运行。
什么是Superset?之前的文章已有详细介绍了,这里再次简单说明一下:Superset是快速、轻量级、直观的,并通过选项配置,使所有的用户都可以轻松地探索和可视化他们的数据,从简单的折线图到高度详细的地理空间图。
Superset用到的后台组件:python(一般用于编写各种逻辑)、flask appbuilder(用于app管理)、pandas (用于数据处理及处理导入导出)、 sqlalchemy (用户管理数据库的ORM软件)。
Superset用到的界面组件:reacet(主要是交互的表单)、d3/nvd3 (可视化图表)、 jinja2(做后端模板,如菜单条)、npm(用作js管理 )。
本文以Superset 1.3.2如何做一个简单的Table获取CSV(EXCEL)文件数据为例,从零开始进行演示。Superset做一张可视化看板的完整过程大体如下:数据库(各类数据源)-》数据集(表或视图或SQL语句)-》图表-》看板(各类图表的组合),最多4大步骤,最少2到3大步骤。
基于性能的考虑,Superset默认行数为50000行,这个在实际生产运行过程中可能是不够的,但我们可以根据实际需要进行优化调整,比如本文从5万行调整50万行,实际调整起来也很方便,只要找到config.py:ROW_LIMIT = 500000即可,具体下图:
找到config.py文件
默认ROW_LIMIT为50000
ROW_LIMIT改为50000
下面重点介绍一下如何在Superset创建一个Table看板,数据csv文件的数据,以project.csv为例,总共有三行2列数据,用EXCEL打开,如下图:
project.csv文件数据
一、登录到Superset。输入用户名和密码,如下图:
登录首页
二、配置数据库的安全性并上传project.csv。数据库列表选择数据库:PostgreSQL(也可以配置其他数据库,比如my sql、ms sql server 、oracle等),注意不支持sqlite数据库,如下图:
选择并编辑PostgreSQL
编辑数据库,在安全选项中打钩允许数据上传即可
上传CSV文件:http://127.0.0.1:8001/csvtodatabaseview/form,实际上是把project.csv文件数据上传同步到postgresql数据表中,比如表名为project,如下图:
上传project.csv文件
三、连接配置Postgresql数据库数据集。新建一个数据集:http://127.0.0.1:8001/tablemodelview/list/?pageIndex=0&sortColumn=changed_on_delta_humanized&sortOrder=desc,如下图:
新建一个project数据集,选择表project,点击新增即可
四、配置图表。通过图表列表新增一个图表:http://127.0.0.1:8001/chart/list/?pageIndex=0&sortColumn=changed_on_delta_humanized&sortOrder=desc&viewMode=table,也可以在数据集列表中选择一个数据集进行打开配置或者通过SQL工具箱的SQL编辑器生成也可以,如下图:
通过数据集打开编辑,默认为table
保存看板
五、配置看板。通过看板列表新增一个看板:http://127.0.0.1:8001/dashboard/list/?pageIndex=0&sortColumn=changed_on_delta_humanized&sortOrder=desc&viewMode=table,如下图:
新建一个看板
把project图表直接拖拉到右边,保存即可
全屏看板
通过以上的步骤,一个简单的Superset的Table看板已完成了,后续将介绍其他图表,敬请关注,如有问题也可以随时与我联系沟通!
如果您喜欢这篇文章,请关注我,收藏、点赞、评论和转发,会让更多需要帮助的人看到这篇文章。举手之劳,善莫大焉!