大数据

Python进行数据可视化分析快速教程实例

Jupyter Notebook介绍

Jupyter Notebook是一个交互式笔记本,支持运行 40 多种编程语言。IPython notebook 是一个基于 IPython REPL 的 web 应用,安装 IPython 后在终端输入 ipython notebook 即可启动服务。jupyter 是把 IPython 和 Python 解释器剥离后的产物,将逐渐替代 IPython 独立发行。jupyter 可以和 Python 之外的 程序结合,提供新的、强大的服务。比如 Ruby REPL 环境 IRuby 和 Julia REPL 环境 IJulia。相对的,jypyter 也提供 jupyter notebook。

Jupyter Notebook的安装

安装pyzmq,Pyzmq是zeromq的Python绑定。zeromq是一个消息内核,从网络通信的角度看,它处于会话层之上,应用层之下,有了它,你甚至不需要自己写一行的socket函数调用就能完成复杂的网络通信工作。

pip install pyzmq

安装tornado,Tornado是python编写的非阻塞式服务器,它使用epoll管理连接,每秒可以处理数以千计的连接,是一个理想的 Web 实时处理框架。

pip install tornado

安装jinjia2,Jinja2是Python下一个被广泛应用的模版引擎,他的设计思想来源于Django的模板引擎,并扩展了其语法和一系列强大的功能。其中最显著的一个是增加了沙箱执行功能和可选的自动转义功能,这对大多应用的安全性来说是非常重要的。

pip install jinja2

安装jsonschema,jasonschema 用来描述Json数据格式,Json模式有多种用途,其中之一就是实例认证。

pip install jsonschema

最后安装Jupyter

pip install jupyter

Jupyter Notebook的使用

安装好Jupyter后,打开Jupyter Notebook非常简单,直接在终端输入命令:

jupyter notebook

在浏览器中输入URL地址:localhost:8888即可,主界面如下:

在右上角的New按钮下可以点击新建文件,打开交互命令行:

为了使得后面能够顺利进行,需要先安装依赖包,再安装MatPlotlib、Numpy、SciPy等Python科学计算包

sudo apt-get install build-essential libssl-dev libffi-dev python-devpip

pip install numpy

pip install matplotlib

pip install scipy

NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy的前身Numeric最早是由Jim Hugunin与其它协作者共同开发,2005年,Travis Oliphant在Numeric中结合了另一个同性质的程序库Numarray的特色,并加入了其它扩展而开发了NumPy。NumPy为开放源代码并且由许多协作者共同维护开发。

SciPy是一个开源的Python算法库和数学工具包。SciPy包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。与其功能相类似的软件还有MATLAB、GNU Octave和Scilab。SciPy目前在BSD许可证下发布。它的开发由Enthought资助。

Matplotlib是一个Python的图形框架,类似于MATLAB和R语言

实例:


Github参考资料:

matplotlib-gallery:一个各种matplotlib绘图类型的集合,提供源代码和图形文件

matplotlib-tutorial:Github上的Matplotlib初学者教程,可以一步步教你画出炫酷的可视化图形