当前位置: 首页 > news >正文

机器学习 分类算法

【实验名称】 实验:分类算法
【实验目的】
1.了解分类算法理论基础
2.平台实现算法
3. 编程实现分类算法
【实验原理】
分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。
【实验环境】
OS:Ubuntu16.04
PyCharm: 2017.3
Mining
【实验步骤】

复习分类算法的简单实现:
一起通过一个小案例回顾如何构建一个最简单的分类器:
1)导入数据
from sklearn import datasets
iris = datasets.load_iris()
2)创建分类器
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
3)训练
y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)
4)分类器的效果
print(“Number of mislabeled points out of a total %d points : %d” % (iris.data.shape[0],(iris.target != y_pred).sum()))

题目:人群的收入预测
现在我们获得了一个数据集adult.data.txt,该数据集由多组个人信息构成,其中信息包含年龄、工作、婚姻等属性,以及类别收入,我们希望根据这些已有数据推出未知收入群体的收入情况。
STEP1:加载数据并查看数据,我们希望依据不同的类别收入加载相同数量的数据,因为如果不同的类别的数据体量相差很大会造成分类器向大数据体量一方倾斜,问题一:补充代码,实现上述效果。
STEP2:转换数据的属性编码,因为原数据中的属性是包含英文字符,无法进行数学运算,请将其转换为数值型数据,问题二:补充代码,实现上述功能。
STEP3:创建一个分类器,将STEP1、STEP2处理好的数据进行训练,并使用交叉验证评测分类器的效果,问题三:补充代码,实现上述功能。
STEP4:对新个体采用同样的编码处理,预测其收入类别,问题四:补充代码,实现上述功能。


文章转载自:
http://amateurship.zzgtdz.cn
http://carey.zzgtdz.cn
http://cardiogram.zzgtdz.cn
http://beltway.zzgtdz.cn
http://benguela.zzgtdz.cn
http://calif.zzgtdz.cn
http://cherenkov.zzgtdz.cn
http://baseline.zzgtdz.cn
http://capsicum.zzgtdz.cn
http://alphascope.zzgtdz.cn
http://cardinalship.zzgtdz.cn
http://bac.zzgtdz.cn
http://blove.zzgtdz.cn
http://accompanying.zzgtdz.cn
http://blowout.zzgtdz.cn
http://agamete.zzgtdz.cn
http://aftershaft.zzgtdz.cn
http://chromolithograph.zzgtdz.cn
http://assistant.zzgtdz.cn
http://actinomycosis.zzgtdz.cn
http://acrasia.zzgtdz.cn
http://canephora.zzgtdz.cn
http://blowfly.zzgtdz.cn
http://autographically.zzgtdz.cn
http://beflag.zzgtdz.cn
http://cholelithiasis.zzgtdz.cn
http://adjudicator.zzgtdz.cn
http://box.zzgtdz.cn
http://animating.zzgtdz.cn
http://carmelita.zzgtdz.cn
http://www.dtcms.com/a/107783.html

相关文章:

  • 苍穹外卖day12
  • 网络安全的重要性与防护措施
  • 一、STM32简介
  • OpenCV 图形API(10)用于执行标量除以矩阵的逐元素操作函数divRC()
  • 低代码框架
  • 网络协议之系列
  • 商标知识产权管理系统平台有哪些功能?
  • 第三方平台步步紧逼之下,独立站商城系统应如何做
  • MoLe-VLA:通过混合层实现的动态跳层视觉-语言-动作模型实现高效机器人操作
  • 牛脸分割数据集labelme格式1324张1类别有增强图片
  • macvlan 和 ipvlan 实现原理及设计案例详解
  • 华为Eudemon8000E Series CFCard概述
  • MySQL 事务与锁机制详解
  • pytorch 离线安装
  • win11 设置 wsl2 ubuntu
  • 4 月 6 日 共赴香港|聚焦 Polkadot 为 Web3 云开拓的创新实践路径!
  • IGMP(Internet Group Management Protocol)与组播技术深度解析
  • 巧记英语四级单词 Unit1-2【晓艳老师版】
  • Spring笔记06-数据持久化
  • Cesium 核心思想及基础概念应用
  • 蓝桥杯高频考点——高精度(含C++源码)
  • Java服务端性能优化:从理论到实践的全面指南
  • Css径向渐变 - radial-gradient
  • 宽带空时波束形成算法原理及MATLAB仿真
  • 【每日算法】Day 16-1:跳表(Skip List)——Redis有序集合的核心实现原理(C++手写实现)
  • OkHttpHttpClient
  • 160. 相交链表
  • 分析sys高问题的方法总结
  • Scala相关知识学习总结3
  • Linux中引导和服务