当前位置: 首页 > wzjs >正文

基于html5个人网站设计论文软文推广怎么写

基于html5个人网站设计论文,软文推广怎么写,微网站的特点,网站域名怎么用这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。 而外部数据集加载之后,数据的字段和类型是…

这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集

外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。
而外部数据集加载之后,数据的字段和类型是不确定的。

简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载,
学习数据分析时,更多用到的是前面介绍的数据加载

  1. 玩具数据集
  2. 真实数据集
  3. 样本生成器

1. openml.org 数据集

openml.org网站上提供了丰富的用于机器学习的数据集,目前已经有5300多个各类数据集。

image.png

通过scikit-learn加载openml.org的数据集非常简单,
先在网站上找到自己感兴趣的数据集,然后根据其名称即可加载。
比如,下面的示例代码加载了一个关于糖尿病的数据集(diabetes)。

from sklearn.datasets import fetch_openmldata = fetch_openml(name='diabetes', version=1, parser="auto")
data

有的数据集有多个版本,通过 version 参数指定需要加载哪个版本。

2. svmlight / libsvm 格式数据

svmlight/libsvm格式是一种用于存储训练好的支持向量机(SVM)模型和数据集。
这种格式的特点是每一行都采用表格形式,以空格或者制表符分隔,适用于稀疏数据集。

scikit-learn中,加载svmlight/libsvm格式的数据使用load_svmlight_file函数。

import requests
import io
from sklearn.datasets import load_svmlight_file# 一个在线的 svm 数据
url = "https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/binary/a1a"
res = requests.get(url)# 加载svmlight/libsvm格式的数据文件
X, y = load_svmlight_file(io.BytesIO(res.content))# 打印特征数和样本数
print("特征数:", X.shape[1])
print("样本数:", X.shape[0])# 运行结果:
特征数: 119
样本数: 1605

由于load_svmlight_file不支持直接加载网络文件,所以先通过 requests 库获取数据,
然后将数据转换为IO数据流,再传入函数load_svmlight_file中。

3. 对接其他库

Python中用于数据分析的库最常用的当属pandasnumpyscipy
scikit-learn可以直接使用这些库所加载的数据,这就让scikit-learn加载数据的能力直接站在了巨人的肩膀上。

比如,scikit-learn可以直接使用通过 pandas.io模块来加载的数据,
也就是支持CSVJSONHTMLXMLEXCELHDF5SQL等等各种格式。

还有通过numpy/routines.io加载的列式数据,
以及通过 scipy.io 模块加载的科学计算环境中经常使用的二进制格式,如.mat.arff

4. 总结

scikit-learn库的数据加载系列至此告一段落。
我们在掌握机器学习算法的过程中,自然而然的会将注意点放在算法的原理和各种参数上,
但是,一份好的数据能够帮助我们更加直观的了解到机器学习算法的运行过程。

scikit-learn提供的各类丰富的数据集绝对是学习算法的一大助力。
我觉得库本身所提供的丰富的数据集也是scikit-learn库相较于其他机器学习库的一大特色和优势。

http://www.dtcms.com/wzjs/72109.html

相关文章:

  • 建视频网站模板武汉关键词排名提升
  • 类似一起做网店的网站广告投放渠道
  • cms系统源码seo高手培训
  • 新昌县城乡建设局网站百度手机助手网页
  • 马来西亚做公路投标网站搜索引擎营销的方法
  • 南汇网站建设如何在百度投放广告
  • 网站如何在百度上做推广百度竞价价格
  • 三网站建设怎么推广公众号让人关注
  • 做网站多少钱特惠西宁君博sseo排名app
  • dedecms 我的网站实时热搜榜榜单
  • 网站服务器租赁多少钱百度热搜电视剧
  • 免费建站怎么操作深圳百度推广优化
  • ui设计是什么东西上海seo推广服务
  • .xyz做网站怎么样公司宣传网站制作
  • 网站开发和前端开发郑州搜索引擎优化
  • 对网站建设培训的建议国际新闻网
  • 建设网站文案杭州百家号优化
  • java购物网站开发教程优质的seo快速排名优化
  • 图片网站的优化病毒式营销
  • 武汉品牌网站建设线上销售如何找到精准客户
  • 让网站百度不到大数据是干什么的
  • 网站建设 发展方向线上推广员是做什么的
  • 如何整理网站上海seo公司排名
  • 家里笔记本做网站 怎么解析北京百度推广代运营
  • 政府网站建设考核 邵阳种子搜索引擎 磁力天堂
  • 大淘客网站logo怎么做百度打开百度搜索
  • 一家专做中式设计的网站推广电话
  • 提供手机网站制作公司谷歌账号
  • 备案平台新增网站宁波seo网络推广选哪家
  • 宁乡电商网站建设收费营业推广策略有哪些