当前位置：首页 > news >正文

网站鼠标悬停动态效果古田路9号设计网站

news 2025/11/7 16:31:30

网站鼠标悬停动态效果,古田路9号设计网站,做网站收费吗,管理企业7、有监督学习和无监督学习的区别有监督学习： 对具有概念标记（分类）的训练样本进行学习，以尽可能对训练样本集外的数据进行标记（分类）预测。这里 ，所有的标记（分类&#xff09…

7、有监督学习和无监督学习的区别

有监督学习：

对具有概念标记（分类）的训练样本进行学习，以尽可能对训练样本集外的数据进行标记（分类）预测。这里，所有的标记（分类）是已知的。因此，训练样本的岐义性低。监督学习中只要输入样本集,机器就可以从中推演出制定目标变量的可能结果.如协同过滤推荐算法,通过对训练集进行监督学习,并对测试集进行预测,从而达到预测的目的.

无监督学习：

对没有概念标记（分类）的训练样本进行学习，以发现训练样本集中的结构性知识。这里，所有的标记（分类）是未知的。因此，训练样本的岐义性高。聚类就是典型的无监督学习。监督学习的典型例子就是决策树、神经网络以及疾病监测，而无监督学习就是很早之前的西洋双陆棋和聚类。

8、有了解过哪些机器学习的算法？

问题分析：

考官主要考察的是学员是否对于人工智能方面的感兴趣，是否有空闲时间了解过机器学习算法这方面的知识，有则更好。

核心答案讲解：

学员需要根据自己的实际情况去回答，学员也可以自己课下空余的时间去掌握— 两常用的机器学习算法，以此来增加自己的筹码。

决策树模型：

构建决策树三要素

1、特征选择

信息熵---信息增益---信息增益大的

H(x) = -sum（pi*log(pi)）

Gain(A) =Info(D)-Info_A(D)

43Gini： Gini系数是对信息熵关于ln(x)在x =0处的— 阶泰勒展开近似得到是信息GIni系数

2、决策树的构成

ID3算法：

算法输入：特征和样本构成的数据集

算法输出： ID3的决策树

算法步骤：

（1）如果所有的属性都被处理完毕

（2）计算各个节点的信息增益，选择最大的信息增益所代表的特征构建决策树(信息熵--sum(pi*log(pi)))

（3）如果上述的属性没有处理完毕，需要从剩余的属性中继续获取其他的信息增益较大的值对应的特征。

（4）递归构建决策树算法模型算法优化

选择信息增益率--C4.5算法算法的停止迭代条件：

（1）迭代次数

（2）树的深度

（3）树的叶子节点的个数

（4）树的分支节点含有样本的个数

（5）树的最大不纯度的下降

（Cart树---gini系数）

3、决策树剪枝

先剪枝

后剪枝

问题扩展：

在算法的推导过程中，会大量的使用到数学的推导公式，而数学思想对于程序员来说是必不可缺的— 种思想，可以在讲解的时候，概括性的给学员讲— 下数学的相关知识。

信息熵数学公式(sum(pi*log(pi)))+信息增益数学公式(总体的信息熵-以A节点作为划分节点的信息熵)

结合项目中使用：

此问题在项目中是没有什么体现的，面试官就是想考察— 下面试者本身具有的学习能力，以此来评估该面试者的可培养价值，以及潜力。但是机器学习算法在推荐系统项目中、以后数据挖掘工作中会起到至关重要作用。

9、你对LR是怎么理解的？ LR的损失函数是怎样的？

首先,LR是逻辑斯特回归，是分类算法。

LR的原理是在线性回归的基础上增加— 个非线性函数，这里用的是sigmod函数，得到的结果是以概率的形式输出类别的结果。

LR的损失函数是似然函数，似然函数的log对数的形式，得到是交叉熵损失，对应的是分类中最重要交叉熵损失函数。

交叉熵损失和其他的损失函数区别就在于交叉熵损失是定义在概率分布基础上的，它通常是被用于基于多项式的逻辑斯特回归和神经网络中，还有用在EM算法中。对数损失是用来度量分类器的预测输出的概率分布和真是分布的差距，而不是比较离散类标签是否相等。

10、二分类模型如何做多分类？

决策树中ID3和C4.5算法都是可以解决多分类问题，而logisticModel、SVM只能解决二分类问题，如何将二分类问题拓展到多分类上，使用常用的方法有两种：

Ovo-One vs one ：通过将任意两个分类的组合形式来进行多分类

Ovr-One vs rest： C（ n,2）f分类结果

scikit-learn: machine learning in Python

11、KMeans算法和KNN算法区别？

KMeans算法是聚类的算法， KNN是— 个分类算法。

KNN是通过K值设定最近邻的个数，通过当前样本点到各个点之间的距离的求解，通过少数服从多数的投票原则划分当前样本点。

KMeans通过K值设定有几个聚类中心，通过将各个样本点到聚类中心的距离，将离中心点最小距离的样本进行组合，从而将样本点分成不同的簇，通过均值的方法迭代聚类中心，直到迭代次数或mse误差或聚类中心不在改变停止迭代。

12、请问GBDT和XGBoost的区别是什么？

XGBoost类似于GBDT的优化版，不论是精度还是效率上都有了提升。与GBDT相比，具体的优点有：

损失函数是用泰勒展式二项逼近，而不是像GBDT里的就是—阶导数；对树的结构进行了正则化约束，防止模型过度复杂，降低了过拟合的可能性；节点分裂的方式不同， GBDT是用的基尼系数，XGBoost是经过优化推导后的分裂增益。

http://www.dtcms.com/a/579247.html

相关文章：

突破 GEO 优化瓶颈：孟庆涛引领的 AI 时代营销新范式

网站模版编辑器企业简介范文

基于Vue的智慧楼宇报修平台设计与实现066z15wb（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。

php网站开发套模板步骤张家界城乡建设网站

一元云购网站建设教程wordpress侧边栏插件

惠州城市建设建筑网站cms网站开发网站模板

18年手机网站加强机关网站内容建设

村镇建设年度报表登录网站百度搜索引擎官网

中石化两学一做网站机票网站开发

ESP32堆栈空间优化全攻略

学做衣服网站知乎深圳有几家燃气公司

厦门市建设工程质量安全协会网站小程序和公众号的区别和优势

青岛网站设计微动力全国招商代理平台

【RL】学习路径指导-VRP求解方向

大连专业模板网站制作高端网站定制开发

网站seo诊断书郑州网站制作汉狮网络

网站建设广州白云wordpress 缓存目录

建设微网站网站建设总结体会

做响应式网站应该注意什么做网站销售怎么样

建设网站策划书有名的网站建设

C++编程基础(六)：函数

珠海网站设计价格wordpress 手动下一页

线性代数——矩阵、向量详解

工厂做网站有用吗wordpress注册邮件内容

Linux 中处理文件的陷阱（Python 示例）

自己建设一个网站需要多少钱自己开发制作游戏的软件

自己公司怎样弄个网站网站设计的公司概况简介

联通企业网站建设如何建立自己的平台

北京朝阳做网站深圳商城网站设计公司

无锡网站推ppt模板大全免费版