当前位置: 首页 > news >正文

李宏毅机器学习笔记(1)—机器学习基本概念+深度学习基本概念

在这里插入图片描述

机器学习基本概念

1、获取模型

步骤

1.1、假定未知函数

带未知参数的函数
在这里插入图片描述

1.2、定义损失函数

真实值:label
在这里插入图片描述
MAE
MSE
几率分布,cross-entropy?
在这里插入图片描述

1.3、优化

  • 单独考虑一个参数
    让损失函数最小,找导数为零的点
    单独考虑w,w0是随机选取的一个数
    斜率为负,左高右低,提高w,反之则反
    埃塔:调整步伐,学习速率,自己设定的(即hyperparameters)
    在这里插入图片描述
  • 考虑两个参数
    在这里插入图片描述
    在这里插入图片描述

2、验证模型

预测未来数据
在这里插入图片描述

3、模型调整

观察真实资料,周期性的,每隔七天就特别低,这个模型显示只能预测一天,我们应该看一个周期七天的的数据,可能模型更精准,因此要调整模型,考虑七天的数据
在这里插入图片描述
在这里插入图片描述

线性回归模型太简单了,需要一个复杂的模型模拟预测,线性模型存在Model Bias
在这里插入图片描述
引入threshold
在这里插入图片描述
Piecewise LInear Curve线段组成
在这里插入图片描述
如果是连续的曲线,逼近
在这里插入图片描述
因此,假设X和Y关系复杂,那么我们假定一个带有未知数的函数,这个函数表示一堆蓝色的函数(Hard SIgmoid)加上一个常数。这个蓝色函数公式如何写?直接写不容易,可以用曲线逼近,用sigmoid函数(即S形的函数)
在这里插入图片描述
调整b和w,可以获得不同形状的函数,来逼近蓝色函数
在这里插入图片描述
在这里插入图片描述
逼近模拟后获取新模型,之前使用单个特征值(x),接下来过渡到使用多个feature(x)

在这里插入图片描述
直观方式,考虑3个特征,j=1,2,3;i:一个i代表一个蓝色函数/sigmoid函数。wij表示第i个sigmoid函数在第j个特征处的权重
在这里插入图片描述
转换成矩阵
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用向量矩阵表示防治法,则转换成如下
在这里插入图片描述
接下来,找未知参数,重新定义一下符号,x:feature;未知参数:w,b,cT,b,把这些拼起来,编程一个长向量
在这里插入图片描述
至此,完成了机器学习第一步:函数定义
在这里插入图片描述
接下来进行第2步,求损失函数
在这里插入图片描述
最后,优化,找一组set使误差最小,对每个一未知的参数计算微分
在这里插入图片描述
在这里插入图片描述
取部分资料进行计算,再用下一个资料算gradient,再更新参数,每次参数更新叫做update,所有batch看过后叫epoch
在这里插入图片描述
区别update和epoch,batch size也是hyperparams
在这里插入图片描述

  • ReLU函数
    hard sigmoid vs soft sigmoid
    在这里插入图片描述
    换成relu函数
    在这里插入图片描述
    在这里插入图片描述
    接下来,继续改模型,反复求a,多做几次的sigmoid或relu运算
    在这里插入图片描述
    一层的意思是,通过一次ReLU运算
    在这里插入图片描述
    在这里插入图片描述
    除夕,机器不知道
    测试了几个模型,还不知道一个好名字,
    在这里插入图片描述
    神经网络,80,90年代已经出现,很多layer就叫deep,神经网络越叠越深
    在这里插入图片描述
    在这里插入图片描述
    反复用ReLu或sigmoid函数,为什么不变胖,而是变深
    在这里插入图片描述
    overfitting(过拟合):在训练资料好,在测试资料上不好在这里插入图片描述
    为了预测未来的资料,应该选3层还是4层,选模型问题
    在这里插入图片描述
    在这里插入图片描述

相关文章:

  • 软件工程面试题(六)
  • 解决linux centos ubuntu等无法启动谷歌chrome浏览器问题
  • HarmonyOS NEXT——【鸿蒙相册图片以及文件上传Picker封装】
  • Stereolabs ZED Box Mini:NVIDIA Orin™驱动,双GMSL2输入,智能机器视觉AI新选择”
  • android studio调试aosp手机userdebug版本无法查看局部变量和参数问题如何解决?
  • 【从零实现Json-Rpc框架】- 项目实现 -抽象消息类实现篇
  • Uni-app入门到精通:subPackages节点为小程序的分包加载配置
  • 实现金蝶与钉钉无缝对接以高效管理银行账号信息
  • 人脸识别新规落地,“多模态认证”将成常态
  • 每日一题之日期统计
  • 为什么大模型在 OCR 任务上表现不佳?
  • 包络解调在故障诊断中的应用-广义检波解调案例
  • 架构师面试(二十二):TCP 协议
  • PDF处理控件Spire.PDF系列教程:使用 JavaScript 在 React 中将 PDF 转换为 HTML
  • java八股文之企业场景
  • rv1106抓h264流
  • 从泛读到精读:合合信息文档解析如何让大模型更懂复杂文档
  • 【leetcode刷题记录】(java)贪心
  • Netty - 从Nginx 四层(TCP/UDP)流量中获取客户端真实/网络出口IP
  • Java实现pdf中动态插入图片
  • 中拉互联网发展与合作论坛在西安开幕
  • 奥运“四朝元老”华天回国参赛,伤势未愈谨慎出战全国锦标赛
  • 澎湃·镜相第二届非虚构写作大赛初选入围名单公示
  • “一百零一个愿望——汉字艺术展”亮相意大利威尼斯
  • 呼吸医学专家杜晓华博士逝世,终年50岁
  • 加强战略矿产出口全链条管控将重点开展哪些工作?商务部答问