当前位置: 首页 > wzjs >正文

商丘做网站的价格旅游在哪个网站做攻略

商丘做网站的价格,旅游在哪个网站做攻略,企业公司简介,如何自己做软件网站Minimax llm&广告推荐算法 一、反向梯度下降的数学推导(以逻辑回归为例) 1.1. 模型定义 假设模型为逻辑回归,输入特征为 x ∈ R d \mathbf{x} \in \mathbb{R}^d x∈Rd,权重参数为 w ∈ R d \mathbf{w} \in \mathbb{R}^d …

Minimax llm&广告推荐算法

一、反向梯度下降的数学推导(以逻辑回归为例)

1.1. 模型定义

假设模型为逻辑回归,输入特征为 x ∈ R d \mathbf{x} \in \mathbb{R}^d xRd,权重参数为 w ∈ R d \mathbf{w} \in \mathbb{R}^d wRd,偏置为 b ∈ R b \in \mathbb{R} bR
模型输出为:
z = w T x + b z = \mathbf{w}^T \mathbf{x} + b z=wTx+b
通过 Sigmoid 函数得到概率:
p = σ ( z ) = 1 1 + e − z p = \sigma(z) = \frac{1}{1 + e^{-z}} p=σ(z)=1+ez1
损失函数为二元交叉熵:
L = − y log ⁡ p − ( 1 − y ) log ⁡ ( 1 − p ) L = -y \log p - (1 - y) \log (1 - p) L=ylogp(1y)log(1p)

1.2. 反向梯度推导

(1)损失对概率 p p p 求导

∂ L ∂ p = − y p + 1 − y 1 − p \frac{\partial L}{\partial p} = -\frac{y}{p} + \frac{1 - y}{1 - p} pL=py+1p1y

(2)概率 p p p 对 Sigmoid 输入 z z z 求导

∂ p ∂ z = σ ( z ) ( 1 − σ ( z ) ) = p ( 1 − p ) \frac{\partial p}{\partial z} = \sigma(z)(1 - \sigma(z)) = p(1 - p) zp=σ(z)(1σ(z))=p(1p)

(3)Sigmoid 输入 z z z 对参数 w \mathbf{w} w 求导

∂ z ∂ w = x \frac{\partial z}{\partial \mathbf{w}} = \mathbf{x} wz=x

(4)链式法则合并

∂ L ∂ w = ∂ L ∂ p ⋅ ∂ p ∂ z ⋅ ∂ z ∂ w \frac{\partial L}{\partial \mathbf{w}} = \frac{\partial L}{\partial p} \cdot \frac{\partial p}{\partial z} \cdot \frac{\partial z}{\partial \mathbf{w}} wL=pLzpwz
代入具体表达式:
∂ L ∂ w = ( − y p + 1 − y 1 − p ) ⋅ p ( 1 − p ) ⋅ x \frac{\partial L}{\partial \mathbf{w}} = \left( -\frac{y}{p} + \frac{1 - y}{1 - p} \right) \cdot p(1 - p) \cdot \mathbf{x} wL=(py+1p1y)p(1p)x
化简后:
∂ L ∂ w = ( p − y ) ⋅ x \frac{\partial L}{\partial \mathbf{w}} = (p - y) \cdot \mathbf{x} wL=(py)x

3. 参数更新公式

梯度下降更新权重:
w ← w − η ⋅ ∂ L ∂ w = w − η ⋅ ( p − y ) ⋅ x \mathbf{w} \leftarrow \mathbf{w} - \eta \cdot \frac{\partial L}{\partial \mathbf{w}} = \mathbf{w} - \eta \cdot (p - y) \cdot \mathbf{x} wwηwL=wη(py)x
其中, η \eta η 为学习率。

二、手撕梯度下降

import numpy as npclass LogisticRegression:def __init__(self, learning_rate=0.01, num_iterations=1000):self.learning_rate = learning_rate        # 学习率self.num_iterations = num_iterations   # 迭代次数self.theta = None                                 # 模型参数def sigmoid(self, z):"""计算 Sigmoid 函数"""return 1 / (1 + np.exp(-z))def compute_cost(self, X, y):"""计算交叉熵损失函数"""m = len(y)p = self.sigmoid(np.dot(X, self.theta))cost = - (1/m) * np.sum(y * np.log(p) + (1 - y) * np.log(1 - p))return costdef gradient_descent(self, X, y):"""梯度下降优化"""m = len(y)for i in range(self.num_iterations):p = self.sigmoid(np.dot(X, self.theta))         # 计算预测值gradient = (1/m) * np.dot(X.T, (p- y))          # 计算梯度self.theta -= self.learning_rate * gradient     # 更新参数if i % 100 == 0:                                # 每100次输出一次损失值cost = self.compute_cost(X, y)print(f"Iteration {i}, Cost: {cost}")def fit(self, X, y):"""训练模型"""m, n = X.shapeself.theta = np.zeros(n)  # 初始化参数self.gradient_descent(X, y)def predict(self, X):"""预测新样本的类别"""probabilities = self.sigmoid(np.dot(X, self.theta))return probabilities >= 0.5  # 预测类别:如果大于等于 0.5,分类为 1,否则为 0

二、交叉熵和kl散度怎么用,分别在什么时候用

交叉熵和KL散度(Kullback-Leibler Divergence)是两种衡量概率分布之间差异的度量方式,它们在机器学习中有着广泛的应用。

2.1. 交叉熵

定义: 对于两个离散概率分布P和Q,其中P是我们的真实分布,Q是我们的估计分布,交叉熵定义为:

H ( P , Q ) = − ∑ x P ( x ) log ⁡ Q ( x ) H(P, Q) = -\sum_{x} P(x) \log Q(x) H(P,Q)=xP(x)logQ(x)

用途:

  • 分类问题: 在多分类问题中,交叉熵损失函数常被用于评估模型预测的概率分布与真实标签之间的差异。特别是在使用softmax作为输出层激活函数时,交叉熵损失函数可以有效地衡量模型输出与实际类别之间的差距。
  • 信息理论: 在信息论中,交叉熵衡量的是用编码方案Q来编码来自分布P的信息所需的平均比特数。

2.2. KL散度

定义: KL散度衡量的是两个概率分布P和Q之间的差异,它不是对称的,即 D K L ( P ∣ ∣ Q ) D_{KL}(P||Q) DKL(P∣∣Q)并不等于 D K L ( Q ∣ ∣ P ) D_{KL}(Q||P) DKL(Q∣∣P)。其定义如下:

D K L ( P ∣ ∣ Q ) = ∑ x P ( x ) log ⁡ ( P ( x ) Q ( x ) ) D_{KL}(P||Q) = \sum_{x} P(x) \log\left(\frac{P(x)}{Q(x)}\right) DKL(P∣∣Q)=xP(x)log(Q(x)P(x))

用途:

  • 分布间差异比较: KL散度常用于衡量两个分布之间的“距离”。但它被称为“散度”而非“距离”,因为它不满足距离度量的所有条件(例如,不对称性)。它可以用来比较一个模型生成的分布与真实数据分布之间的相似性。
  • 变分推断: 在贝叶斯推理中,特别是变分自动编码器(VAEs)等模型中,KL散度用于衡量近似后验分布与先验分布之间的差异,以优化模型参数。

2.3. 使用场景

  • 交叉熵更适用于当你需要直接优化模型预测与实际标签之间的误差时,尤其是在分类任务中。
  • KL散度更适合用于你需要衡量或最小化两个概率分布之间的差异的情况,例如在生成模型中对比生成的数据分布与真实数据分布的相似性。

文章转载自:

http://WbgAoAzi.tpmnq.cn
http://ymMan7ki.tpmnq.cn
http://CwvkJTwh.tpmnq.cn
http://QM7DG2MZ.tpmnq.cn
http://dzIftS9e.tpmnq.cn
http://Cj48pYTJ.tpmnq.cn
http://vn0VE6U7.tpmnq.cn
http://kwGyuZKE.tpmnq.cn
http://g0szaB6G.tpmnq.cn
http://aIlufTsV.tpmnq.cn
http://d85s9FKj.tpmnq.cn
http://ZD6bMOsM.tpmnq.cn
http://iVtN512V.tpmnq.cn
http://3Jq8B6NP.tpmnq.cn
http://5RPRNoth.tpmnq.cn
http://o1uDKGRm.tpmnq.cn
http://p4jcoaSO.tpmnq.cn
http://RV81wTyy.tpmnq.cn
http://7DeZo9jO.tpmnq.cn
http://i446QvoW.tpmnq.cn
http://40cYjfYR.tpmnq.cn
http://cDKxmSpL.tpmnq.cn
http://8vHdYvgC.tpmnq.cn
http://PSiMXuOl.tpmnq.cn
http://wRS3qBvr.tpmnq.cn
http://aBnP8umO.tpmnq.cn
http://25uMFxlO.tpmnq.cn
http://i9BK1eQB.tpmnq.cn
http://RQHNXf4m.tpmnq.cn
http://COivCqJY.tpmnq.cn
http://www.dtcms.com/wzjs/686502.html

相关文章:

  • 做网站空间 阿里云wordpress条件判断
  • 湖南株洲静默免费seo网站推广在线观看
  • 嵩县网站开发网站asp文件只读
  • 网站建设投标ppt模板下载考试微网站开发
  • 邢台做网站哪家好设计工作室logo创意
  • 做调查问卷的网站seo怎么优化
  • 温州网站建设模板下载免费wordpress类似软件
  • 超值高端网站设计怎样做寻亲网站志愿者
  • 网站建设法语南宁网站制作计划
  • 官方网站建设情况中堂做网站
  • 购物网站开发需求文档肥城 网站建设
  • 域名和网站空间相互做解析专门做动漫的网站有哪些
  • 网站首页需求代写企业软文
  • 建立购物网站 app线上推广费用预算
  • 山东网站优化乐陵网站服务在哪一条
  • 大学生兼职网站开发毕设论文规模以上工业企业分析
  • 邯郸网站建设渠道先做网站还是app
  • 北京城乡与建设厅官方网站查询网络销售面试问题有哪些
  • 一鸣东莞网站建设公司docker wordpress git
  • 上海建设协会网站软件工程师招聘简章pdf
  • 品牌网站策划书网站做新浪图床
  • 怎么做百度网站推广通州设计网站建设
  • 学校网站设计思路官网网站备案流程图
  • 淘客网站如何做推广网络推广怎么入门
  • 锐酷网站建设教程智能模板网站建设价格
  • 网站建设优化服务熊掌号wordpress进不去数据库
  • 网站建设论文选题网站设计免费模板
  • 网站搭建需要什么技术中国十大培训机构影视后期
  • 云南哪几个建网站公司设计师个人主页
  • 网站源码区别凡科建站怎么保存网站