基于Pandas+ECharts的金融大数据可视化实现方案
zndp1641
8年前
<p style="text-align: center;"><img src="https://simg.open-open.com/show/7dfb2cd1dcb0b1dc4296c506567701fc.jpg"></p> <h2>前言</h2> <p>最近无意中看到一篇文章,介绍的是在IPython Notebook里实现ECharts的可视化效果。我个人对ECharts一直是推崇有加,是baidu发布的开源项目中我比较喜欢的一个,绝对是良心之作了。所以,看到这篇文章着实小激动了一把。</p> <p>今天借花献佛,利用金融证券数据,举几个小例子,给大家分享一下实现过程。顺便告诉大家,怎么在tushare里调用前十大股东及流通股东数据的接口。</p> <h2>1 ECharts介绍</h2> <p>以下摘自ECharts官网的介绍:</p> <p>ECharts,一个纯 Javascript 的图表库,可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器,底层依赖轻量级的 Canvas 类库 ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。</p> <p>ECharts 3 中更是加入了更多丰富的交互功能以及更多的可视化效果,并且对移动端做了深度的优化。</p> <p>ECharts的成名,得益于几年前百度人口迁徙大数据效果的展示,当年看到那个基于地图连线忽闪忽闪的效果,简直了,太高大上了。最近一年在北京偶尔拜访一些所谓的大数据公司,进门显眼位置看见的那些大屏幕数据展示,估计很多都是基于ECharts开发的。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/cb014dc0c3020e701d0a908a7a3c67d9.png"></p> <h2>2 与Python的结合</h2> <p>ECharts主要是应用在web和app领域,跟Python应用的结合,目前在Django,Flask等web框架里更为常见。今天要介绍的,也是在IPython Notebook里基于web的效果展示,而在IPython qtconsole等环境下似乎无能为力。</p> <p>实际上,在IPython Notebook里使用ECharts相比纯web开发环境,要复杂麻烦一些。但是在IPython Notebook里作为除matplotlib以外的数据可视化方案,ECharts或许可以成为一个强有力候补。尤其是在基于国内地图、关系图、桑基图等方面的数据展示上,ECharts完全可以担当大任,游刃有余。</p> <h2>3 实现原理</h2> <p>在IPython Notebook里,有一个display的模块,可以实现HTML效果的展示。而最核心的条件是notebook自带一个JS模块,可以通过RequireJS动态导入js脚本并执行。</p> <p>我们先来看看HTML代码在IPython notebook里简单的实现效果:</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/5949ffc5f6036414c3af185471045f73.png"></p> <p>通过RequireJS,引入ECharts包</p> <p>然后配置echarts熟悉和数据</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/1de5fc02b17fec53f997d26569ca1874.png"></p> <h2>4 图表效果实例</h2> <p>这里只给大家展示K线图、折线图和饼图的效果,只揭示实现原理和过程,具体的代码优化和图表功能的完善,可以自行研究ECharts的相关资料来改进。</p> <p>要实现这三类图表,这里借用股票日线行情数据、前十大股东持股占比数据和前十大流通股东持股比例来举例。(请将tushare升级到最新版。)</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/c38136178c3fe413bab22c50dcc19454.png"></p> <p>1、K线图效果</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/ac36c46c55df96929864ab9bb9900997.png"></p> <p>通过tushare的get_k_data获取日线前复权数据,这里通过中国联通来演示。根据上文的实现原理,我们运行代码后可以看到如下效果。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/5aa251093b07ad905a3b60ec81eccaa4.png"></p> <p>2、折线图效果</p> <p>演示的折线图效果实际是我选用了关系图进行了改造,常规的折线图大家可以参考ECharts官网的代码。</p> <p>这里我用到了tusahre的新数据接口“十大流通股东”数据来做演示,数据包括了前十大股东和十大流通股东历年各季度的持股数量和占比。折线图我用前十大股东历年持股占比情况来演示。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/b821be1ff661fd8b34e7373b1c15714c.png"> <img src="https://simg.open-open.com/show/70ac7324e05b3ca7b0005fe6732dcd44.png"></p> <p>根据线图实现的代码,运行后,效果如下:</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/1198b26fbbd17fcb4806b5524fc70bf0.png"></p> <p>3、饼图效果</p> <p>饼图用到了前十大流通股数据,选用浦发银行2016年第三季度的数据作为示例。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/3d83ca499ac98f988a3950fed86b8e33.png"></p> <p>对前十大流通股东数据安装ECharts数据格式进行处理,代码大致如下</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/08939e707b43e4ef0f25ecbb44a3034f.png"></p> <p>完整执行后,可以看到最终效果图。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/c2a8c244fe82407295f5e0e87a91bd31.png"></p> <h2>5 总结</h2> <p>ECharts实际可以大大丰富Python的图表和展示效果。但是要想用好,需要对ECharts的用法有所了解,特别是要实现自定义的图表的时候,更要对底层代码进行研究。</p> <p>这里有三个应用方面的小技巧分享一下:</p> <p>1、选定图表后,在ECharts的官网里进行代码修改和效果调试,直到满意。(如果有条件,这一步可以交给前端工程师)</p> <p>2、根据已经完成的代码模板,将数据部分在IPythong notebook里用经过了pandas和Python数据清洗处理后的数据进行替换。</p> <p>3、如果在IPython notebook里无法出现图表效果,检查数据结构是否正确。可以将代码和数据重新拷贝到ECharts的调试器里进行检查。</p> <h2> </h2> <p> </p> <p>来自:https://zhuanlan.zhihu.com/p/25584144</p> <p> </p>