首页技术文章正文

Python数据分析工具介绍

更新时间:2018-05-02 来源:黑马程序员 浏览量:

有些网友对Python数据分析工具认识不是很全面,本文将整理如下:


1) NumPy:全称Numerical Python,是Python科学计算的基础包。功能主要包括:

① 快速高效的多维数组对象ndarray(numerical data array);

②用于对数组执行元素级计算以及直接对数组执行数学运算的函数;

③用于读取硬盘上基于数组的数据集的工具;

④ 线性代数运算,傅里叶变换,以及随机数生成;

⑤ 用于将C、C++、Fortran代码集成到Python的工具。

NumPy数组在存储和处理数据时要比内置的Python数据结构高效得多。此外,用低级语言(如C和Fortran)编写的库可以直接操作NumPy数组中的数据,无需进行任何数据复制工作。


2) Pandas:名字源自于Panel Data和Python Data Analysis。提供了快速便捷的处理结构化数据的大量数据结构和函数,它是使Python称为强大而高效的数据分析环境的重要因素之一。用得较多的数据对象是DataFrame(面向列的二维表结构)。

Pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能,也提供了复杂精细的索引功能(用于分片、切片、聚合、选取子集等)。


3) matplotlib:最流行的绘制数据图表的Python库。它和Ipython结合的很好。


4) IPython:是Python科学计算标准工具集的组成部分,它将其他所有的东西联系到了一起,为交互式和探索式计算提供了强健高效的环境,它是一个增强的Python Shell。

在用Python编程时经常用到IPython,包括运行、调试和测试代码。

IPython启动时使用ipython --pylab命令以pylab模式打开可以直接画图,pylab是matplotlib的一个子模块,也可以通过使用import pylab as pl方式使用(pl.plot(x, y),x,y为list)。

IPython notebook改为Jupyternotebook了,notebook模块从IPython中单独拉出来了,这样IPython的安装更加小了。使用pip install jupyternotebook 安装(如果使用pipinstall jupyter则安装jupyter,除了notebook还包含其他工具)。


5) SciPy:是一组专门解决科学计算中各种标准问题域的包的集合。主要包括下面这些包:

scipy.integrate:数值积分例程和微分方程求解器;

scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能;

scipy.optimize:函数优化器(最小化器)以及根查找算法;

scipy.signal:信号处理工具;

scipy.sparse:稀疏矩阵和稀疏线性系统求解器;

scipy.special:specfun(这是一个实现了许多常用数学函数(如伽玛函数)的Fortran库)的包装器;

scipy.stats:标准连续和离散概率分布(如密度函数、采样器、连续分布函数等),各种统计检验方法以及更好的描述统计法;

scipy.weave:利用内联C++代码加速数组计算的工具。

NumPy和SciPy的有机结合完全可以取代Matlab的计算功能。

注:本文来源于网络。

分享到:
在线咨询 我要报名
和我们在线交谈!