4.1.3 常见机器学习工具
(https://www.daowen.com)
Python是近几年机器学习中用到的主要工具,科学家已经开发了很多Python库用于机器学习并取得了很好的效果,常见的Python机器学习库有以下几种。
·Numerical Python或numpy是必不可少的Python扩展库。它为向量计算、数学函数、线性代数和随机数生成提供快速的N维数组对象。如果没有这个库,基本数组算术性能会明显变慢。
·SciPy是一个基于numpy的科学处理库。它提供了线性代数例程、信号和图像处理、常微分方程等功能函数。
·Matplotlib是一个包含类似数据绘图和可视化技术的Python库。Matlab是用于数据处理的标准工具。Matplotlib的简单性和实用性帮助Python成为Matlab的可行替代品。
·Pandas是一种用于数据聚合、数据操作和数据可视化的工具。在Pandas中,一维数组被称为序列,多维数组被称为数据框。
·Scikit-learn包含图像处理和机器学习技术。该库基于SciPy构建,支持聚类、分类和回归算法。这包括本书中讨论的许多算法,如朴素贝叶斯、决策树、随机森林、k-均值和支持向量机。
·NLTK或Natural Language Toolkit,是用于自然语言处理的库的集合。NLTK为诸如标记化、词干提取、标记、解析和分类等专家系统奠定了基础,这对于情感分析至关重要。
·Genism是一个用于非结构化文本的库。
·Scrapy是一种开源数据挖掘和统计,最初设计用于抓取网站。
·TensorFlow是Google Alphabet支持的开源数据计算库,针对机器学习进行了优化。它支持多层神经网络和快速训练。TensorFlow用于谷歌的许多智能平台。
·Keras是一个用于构建基于TensorFlow的神经网络的库。