开篇¶
Python 在解决数据科学任务和挑战方面继续处于领先地位,本章主要介绍 Python 中几个最基础、也是最重要科学技计算包。
NumPy¶
NumPy 是科学应用程序库的主要软件包之一,用于处理大型多维数组和矩阵,它大量的高级数学函数集合和实现方法使得这些对象执行操作成为可能。
Pandas¶
Pandas 是一个 Python 库,提供高级的数据结构和各种各样的分析工具。这个软件包的主要特点是能够将相当复杂的数据操作转换为一两个命令。Pandas包含许多用于分组、过滤和组合数据的内置方法,以及时间序列功能。
Matplotlib¶
Matplotlib 是一个用于创建二维图和图形的底层库。藉由它的帮助,你可以构建各种不同的图标,从直方图和散点图到费笛卡尔坐标图。
Matplotlib 就是 MATLAB+Plot+Library ,即模仿 MATLAB 的绘图库,其绘图风格与 MATLAB 类似。
Seaborn¶
Seaborn 本质上是一个基于 matplotlib 库的高级 API。它包含更适合处理图表的默认设置。此外,还有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图
Scikit-learn¶
Scikit-learn 是 Python 中简单高效的数据挖掘和数据分析工具,建立在 NumPy,SciPy 和 matplotlib 的基础上,为许多标准的机器学习和数据挖掘任务提供算法,如聚类、回归、分类、降维和模型选择。