当前位置: 首页 > news >正文

目前流行的网页设计风格seo网站模版

目前流行的网页设计风格,seo网站模版,广州正规网站建设,wordpress显示访问量这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。 而外部数据集加载之后,数据的字段和类型是…

这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集

外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。
而外部数据集加载之后,数据的字段和类型是不确定的。

简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载,
学习数据分析时,更多用到的是前面介绍的数据加载

  1. 玩具数据集
  2. 真实数据集
  3. 样本生成器

1. openml.org 数据集

openml.org网站上提供了丰富的用于机器学习的数据集,目前已经有5300多个各类数据集。

image.png

通过scikit-learn加载openml.org的数据集非常简单,
先在网站上找到自己感兴趣的数据集,然后根据其名称即可加载。
比如,下面的示例代码加载了一个关于糖尿病的数据集(diabetes)。

from sklearn.datasets import fetch_openmldata = fetch_openml(name='diabetes', version=1, parser="auto")
data

有的数据集有多个版本,通过 version 参数指定需要加载哪个版本。

2. svmlight / libsvm 格式数据

svmlight/libsvm格式是一种用于存储训练好的支持向量机(SVM)模型和数据集。
这种格式的特点是每一行都采用表格形式,以空格或者制表符分隔,适用于稀疏数据集。

scikit-learn中,加载svmlight/libsvm格式的数据使用load_svmlight_file函数。

import requests
import io
from sklearn.datasets import load_svmlight_file# 一个在线的 svm 数据
url = "https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/binary/a1a"
res = requests.get(url)# 加载svmlight/libsvm格式的数据文件
X, y = load_svmlight_file(io.BytesIO(res.content))# 打印特征数和样本数
print("特征数:", X.shape[1])
print("样本数:", X.shape[0])# 运行结果:
特征数: 119
样本数: 1605

由于load_svmlight_file不支持直接加载网络文件,所以先通过 requests 库获取数据,
然后将数据转换为IO数据流,再传入函数load_svmlight_file中。

3. 对接其他库

Python中用于数据分析的库最常用的当属pandasnumpyscipy
scikit-learn可以直接使用这些库所加载的数据,这就让scikit-learn加载数据的能力直接站在了巨人的肩膀上。

比如,scikit-learn可以直接使用通过 pandas.io模块来加载的数据,
也就是支持CSVJSONHTMLXMLEXCELHDF5SQL等等各种格式。

还有通过numpy/routines.io加载的列式数据,
以及通过 scipy.io 模块加载的科学计算环境中经常使用的二进制格式,如.mat.arff

4. 总结

scikit-learn库的数据加载系列至此告一段落。
我们在掌握机器学习算法的过程中,自然而然的会将注意点放在算法的原理和各种参数上,
但是,一份好的数据能够帮助我们更加直观的了解到机器学习算法的运行过程。

scikit-learn提供的各类丰富的数据集绝对是学习算法的一大助力。
我觉得库本身所提供的丰富的数据集也是scikit-learn库相较于其他机器学习库的一大特色和优势。

http://www.dtcms.com/a/591431.html

相关文章:

  • 如何将网站提交给谷歌创建一个网站需要怎么做
  • 画册设计公司网站建设校园网站国外研究现状
  • 海南网站建设方案wordpress更改图片大小
  • 成都网站优化排名推广学做网站教学百度网盘
  • 做网站题材广东省自然资源厅吴鋆
  • 网站推广方法有几个网站登录人太多进不去怎么办
  • 网站上线流程第一次做网站
  • 晋中市科技馆网站建设临淄网站制作
  • 国外作品集网站阿里网站怎样做seo
  • 网站没有备案可以做百度推广吗戚墅堰做网站价格
  • 小说网站开发 公司怎么开一个属于自己的网店
  • 成都网站建设公司有哪几家wordpress规范
  • 聊城门户网站建设哪里不好就去建设
  • 贵阳网站建设方案咨询如何建设诗词网站
  • vue开发视频网站网站建设怎么评估
  • 可免费注册的网站一个网站上面有名优
  • 帮别人做设计的网站wordpress怎么取消谷歌字体
  • 广西南宁建设厅网站seo去哪里培训
  • wordpress acf插件seo基本步骤顺序
  • 江西网站建设哪家好十大免费视频素材网
  • 做离线版申报表进入哪个网站建设工程网站新专家入库
  • 网站建设公司名称企业管理系统项目经理招聘
  • 侯马网站建设网站建设报告实训步骤
  • 青岛鲁icp 网站制作 牛商网php 如何在网站根目录创建文件夹
  • 网站建设经费保障网站 架构设计
  • 企业 网站设计关键词如何确定
  • 北京住房和城乡建设部网站自动外链网址
  • 温州电子网站建设cdr做网站
  • 长沙p2p网站建设静态网站建设的技术运用
  • wordpress 适合做小说站吗2019做什么类型网站