当前位置：首页 > news >正文

机器学习(4) cost function(代价函数)

news 2025/11/10 10:22:41

目录

介绍

介绍

书接上文，现在我们的模型是 $f_{w,b}x=wx+b$ ，其中， $w, b$ 是模型参数，也被称为系数或者权重。那么我们有以下的结论
$\hat{y}^{(i)}=f_{w,b}x^{(i)}=wx^{(i)}+b$
现在我们的目标是找到合适的模型参数 $w$ 和 $b$ ，使得对于所有的 $x^{(i)},y^{(i)})$ ， $\hat{y}^{(i)}$ 尽可能接近 $y^{(i)}$
为了在整个数据集上计算误差，定义下面的函数为 $cost\ function$ ，为了让这个值不会随着训练集大小增加而变大，计算平均平方误差，其中 $m$ 为样本数量，除以2是为了方便求导
$=\frac{1}{2m}\sum_{i=1}^{m}(\hat y^{(i)}-y^{(i)})^2$
举个简单的例子，假设实际的点坐标为 $(1, 1), (2, 2), (3, 3)$ ， $cost\ function$ 参数为 $w = 0.5, b = 0$ ，有 $f (x) = 0.5 x$ ，样本数 $m = 3$ ，图像如下
那么有
$J(w,b)=\frac{{1}}{{2\times3}}[(0.5-1)^2+(1-2)^2+(1.5-3)^2]\approx0.58$
这就是所谓的 $cost\ function$ ，线性回归的目标就是找到最合适的 $(w, b)$ ，使得 $J (w, b)$ 尽可能地小。对于每一个 $(w, b)$ ，针对数据集进行训练，会得到下面这样一个等高线图
梯度下降( $gradient\ descent$ )算法就是一个找到等高线图最低点的算法，也就是找到使得 $cost\ function$ 最小的参数 $w$ 和 $b$ 。这个算法在机器学习领域被广泛运用，我么将在下节学习这个算法

http://www.dtcms.com/a/589793.html

相关文章：

翻译《The Old New Thing》- 为什么 SHFormatDateTime 要接收一个未对齐的 FILETIME？

企业网站怎么做的好看在wordpress添加算法

基于「YOLO目标检测 + 多模态AI分析」的医学骨折检测分析系统(vue+flask+数据集+模型训练)

linux31 网络编程TCP协议

南昌网站建设黄山网站建设公司

深入解析：动画组件为何必须使用useCallback

深度强化学习算法详解：从理论到实践

4.1.8 文件系统基础【2011统考真题】

行业网站开发互联网广告平台有哪些

做网站自己上传电影要多大服务器电商是做什么的?

零基础学JAVA--Day27（注释+异常+异常处理方法）

新华网站建设设计漂亮的网站

Linux下的编译器gcc/g++

【Redis｜第一篇】基础篇

嵌入式回调：弱函数与函数指针的实战解析

网站建设技术支持包括哪些小工程施工合同协议书

掌握RAG系统的七个优秀GitHub存储库

网站开发面试都会问什么问题网站开发的阶段流程图

如何将废弃笔记本搭建成服务器：使用花生壳内网穿透实现公网访问

Linux网络编程：应用层协议HTTP

网站按域名跳转不同的页面网站建设面谈话术

Photoshop - Photoshop 工具栏（25）仿制图章工具

Java 会话技术、Cookie、JWT令牌、过滤器Filter、拦截器Interceptor

简单理解：ADC（模数转换）采集的滤波算法

WASM 3.0 两大领域实战：SvelteKit前端新范式（完整版）

WebForms ArrayList 深入解析

免费建站网站建设wordpress4.9.1加速

网络seo营销推广网站开发百灵鸟优化

详解Shell中的if分支（单个条件、多个条件）

C++后端总览