当前位置: 首页 > wzjs >正文

新站秒收录接口电影网站规划

新站秒收录接口,电影网站规划,深圳有没有做网站的,西安论坛新手村:逻辑回归-理解03:逻辑回归中的最大似然函数 1. 似然函数 假设我们有一个二分类问题,其中 N N N 个样本的数据集为 { ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x N , y N ) } \{(x_1, y_1), (x_2, y_2), \ldots, (x_N, y_N)\} {(x1​…

新手村:逻辑回归-理解03:逻辑回归中的最大似然函数

在这里插入图片描述

1. 似然函数

假设我们有一个二分类问题,其中 N N N 个样本的数据集为 { ( x 1 , y 1 ) , ( x 2 , y 2 ) , … , ( x N , y N ) } \{(x_1, y_1), (x_2, y_2), \ldots, (x_N, y_N)\} {(x1,y1),(x2,y2),,(xN,yN)},每个样本 x i x_i xi 对应一个标签 y i ∈ { 0 , 1 } y_i \in \{0, 1\} yi{0,1}

对于每个样本 i i i,我们可以用逻辑回归模型来预测其属于类别1的概率:
y ^ i = P ( y i = 1 ∣ x i ; w , b ) = σ ( w T x i + b ) \hat{y}_i = P(y_i = 1 | x_i; w, b) = \sigma(w^T x_i + b) y^i=P(yi=1∣xi;w,b)=σ(wTxi+b)
其中 σ ( z ) = 1 1 + e − z \sigma(z) = \frac{1}{1 + e^{-z}} σ(z)=1+ez1 是sigmoid函数, w w w 是权重向量, b b b 是偏置项。

2. 单个样本的条件概率

对于单个样本 i i i,其条件概率可以表示为:
P ( y i ∣ x i ; w , b ) = { y ^ i if  y i = 1 1 − y ^ i if  y i = 0 P(y_i | x_i; w, b) = \begin{cases} \hat{y}_i & \text{if } y_i = 1 \\ 1 - \hat{y}_i & \text{if } y_i = 0 \end{cases} P(yixi;w,b)={y^i1y^iif yi=1if yi=0

为了方便数学上的操作,我们希望把这两个分支合并成一个通用的公式。注意到:

  • y i = 1 y_i = 1 yi=1,我们需要保留 y ^ i \hat{y}_i y^i 并忽略 1 − y ^ i 1 - \hat{y}_i 1y^i
  • y i = 0 y_i = 0 yi=0,我们需要保留 1 − y ^ i 1 - \hat{y}_i 1y^i 并忽略 y ^ i \hat{y}_i y^i

因此,我们可以引入 幂运算 来实现这一点:
P ( y i ∣ x i ; w , b ) = y ^ i y i ( 1 − y ^ i ) 1 − y i . P(y_i | x_i; w, b) = \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i}. P(yixi;w,b)=y^iyi(1y^i)1yi.

解释:

  1. y i = 1 y_i = 1 yi=1
  • 此时 y i y i = y ^ i 1 = y ^ i y_i^{y_i} = \hat{y}_i^1 = \hat{y}_i yiyi=y^i1=y^i
  • ( 1 − y ^ i ) 1 − y i = ( 1 − y ^ i ) 0 = 1 (1 - \hat{y}_i)^{1-y_i} = (1 - \hat{y}_i)^0 = 1 (1y^i)1yi=(1y^i)0=1
  • 所以整个表达式变为 P ( y i ∣ x i ; w , b ) = y ^ i P(y_i | x_i; w, b) = \hat{y}_i P(yixi;w,b)=y^i,符合我们的预期。
  1. y i = 0 y_i = 0 yi=0
  • 此时 y ^ i y i = y ^ i 0 = 1 \hat{y}_i^{y_i} = \hat{y}_i^0 = 1 y^iyi=y^i0=1
  • ( 1 − y ^ i ) 1 − y i = ( 1 − y ^ i ) 1 = 1 − y ^ i (1 - \hat{y}_i)^{1-y_i} = (1 - \hat{y}_i)^1 = 1 - \hat{y}_i (1y^i)1yi=(1y^i)1=1y^i
  • 所以整个表达式变为 P ( y i ∣ x i ; w , b ) = 1 − y ^ i P(y_i | x_i; w, b) = 1 - \hat{y}_i P(yixi;w,b)=1y^i,也符合我们的预期。

指数的作用

通过使用 y ^ i y i \hat{y}_i^{y_i} y^iyi ( 1 − y ^ i ) 1 − y i (1 - \hat{y}_i)^{1-y_i} (1y^i)1yi,我们巧妙地利用了 y i y_i yi 的值(0或1)来选择合适的项:

  • y i = 1 y_i = 1 yi=1,第一项 y ^ i y i \hat{y}_i^{y_i} y^iyi 生效,第二项被消除。
  • y i = 0 y_i = 0 yi=0,第二项 ( 1 − y ^ i ) 1 − y i (1 - \hat{y}_i)^{1-y_i} (1y^i)1yi 生效,第一项被消除。

这种技巧的优点在于它允许我们在数学上用一个统一的表达式来描述两种不同的情况,而不需要显式的分支判断

P ( y i ∣ x i ; w , b ) = y ^ i y i ( 1 − y ^ i ) 1 − y i P(y_i | x_i; w, b) = \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i} P(yixi;w,b)=y^iyi(1y^i)1yi

3. 似然函数

似然函数是所有样本条件概率的乘积:
L ( w , b ) = ∏ i = 1 N P ( y i ∣ x i ; w , b ) = ∏ i = 1 N ( y ^ i y i ( 1 − y ^ i ) 1 − y i ) L(w, b) = \prod_{i=1}^N P(y_i | x_i; w, b) = \prod_{i=1}^N \left( \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i} \right) L(w,b)=i=1NP(yixi;w,b)=i=1N(y^iyi(1y^i)1yi)

4. 对数似然函数

为了简化优化过程,通常取似然函数的自然对数(ln),称为对数似然函数:
log ⁡ L ( w , b ) = log ⁡ ( ∏ i = 1 N ( y ^ i y i ( 1 − y ^ i ) 1 − y i ) ) \log L(w, b) = \log \left( \prod_{i=1}^N \left( \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i} \right) \right) logL(w,b)=log(i=1N(y^iyi(1y^i)1yi))

利用对数的性质 log ⁡ ( a b ) = log ⁡ ( a ) + log ⁡ ( b ) \log(ab) = \log(a) + \log(b) log(ab)=log(a)+log(b),我们可以将乘积转换为求和:
log ⁡ L ( w , b ) = ∑ i = 1 N log ⁡ ( y ^ i y i ( 1 − y ^ i ) 1 − y i ) \log L(w, b) = \sum_{i=1}^N \log \left( \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i} \right) logL(w,b)=i=1Nlog(y^iyi(1y^i)1yi)

进一步利用对数的性质 log ⁡ ( a b ) = b log ⁡ ( a ) \log(a^b) = b \log(a) log(ab)=blog(a),得到:
log ⁡ L ( w , b ) = ∑ i = 1 N ( y i log ⁡ ( y ^ i ) + ( 1 − y i ) log ⁡ ( 1 − y ^ i ) ) \log L(w, b) = \sum_{i=1}^N \left( y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right) logL(w,b)=i=1N(yilog(y^i)+(1yi)log(1y^i))

这就是我们熟悉的对数似然函数的形式。


完整推导总结

  1. 似然函数
    L ( w , b ) = ∏ i = 1 N ( y ^ i y i ( 1 − y ^ i ) 1 − y i ) L(w, b) = \prod_{i=1}^N \left( \hat{y}_i^{y_i} (1 - \hat{y}_i)^{1-y_i} \right) L(w,b)=i=1N(y^iyi(1y^i)1yi)

  2. 对数似然函数
    log ⁡ L ( w , b ) = ∑ i = 1 N ( y i log ⁡ ( y ^ i ) + ( 1 − y i ) log ⁡ ( 1 − y ^ i ) ) \log L(w, b) = \sum_{i=1}^N \left( y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right) logL(w,b)=i=1N(yilog(y^i)+(1yi)log(1y^i))

可视化对数似然函数

为了更好地理解对数似然函数的行为,我们可以绘制不同预测概率下的对数似然函数曲线。

在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt# 定义对数似然函数
def log_likelihood(y_true, y_pred):"""计算二分类问题的对数似然函数:param y_true: 真实标签 (0或1):param y_pred: 预测概率 (0到1之间的浮点数):return: 对数似然函数值"""epsilon = 1e-15  # 防止log(0)错误y_pred = np.clip(y_pred, epsilon, 1 - epsilon)return y_true * np.log(y_pred) + (1 - y_true) * np.log(1 - y_pred)# 构造一系列不同的预测概率y_pred,并计算对应的对数似然值
y_pred_values = np.linspace(0.01, 0.99, 400)  # 预测概率从0.01到0.99# 真实标签为1的情况
ll_y_true_1 = [log_likelihood(1, y_pred) for y_pred in y_pred_values]# 真实标签为0的情况
ll_y_true_0 = [log_likelihood(0, y_pred) for y_pred in y_pred_values]# 可视化对数似然函数随预测概率的变化趋势
plt.figure(figsize=(10, 6))
plt.plot(y_pred_values, ll_y_true_1, label='真实标签为1', color='blue')
plt.plot(y_pred_values, ll_y_true_0, label='真实标签为0', color='red')plt.title("二分类问题中的对数似然函数", fontsize=16)
plt.xlabel("预测概率 $P(y=1|x)$", fontsize=14)
plt.ylabel("对数似然函数值", fontsize=14)
plt.grid(True)
plt.legend(fontsize=12)
plt.tight_layout()
plt.show()

说明

  1. 对数似然函数定义

    • 函数 log_likelihood 根据公式 log ⁡ L ( w , b ) = y i log ⁡ ( y ^ i ) + ( 1 − y i ) log ⁡ ( 1 − y ^ i ) \log L(w, b) = y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) logL(w,b)=yilog(y^i)+(1yi)log(1y^i) 实现。
    • 使用 np.clip 来防止预测概率接近0或1时出现 log ⁡ ( 0 ) \log(0) log(0) 错误。
  2. 构造预测概率

    • 我们生成了一系列预测概率 y ^ \hat{y} y^ 的值,范围从0.01到0.99。
  3. 计算对数似然值

    • 分别计算真实标签为1和真实标签为0时的对数似然函数值。
  4. 可视化

    • 使用 Matplotlib 绘制两条曲线,一条表示真实标签为1时的对数似然函数值变化,另一条表示真实标签为0时的对数似然函数值变化。
    • 曲线的颜色分别为蓝色和红色,便于区分。

结果分析

  • 当真实标签为1时,如果预测概率 y ^ \hat{y} y^ 接近1,对数似然函数值很大;反之,如果 y ^ \hat{y} y^ 接近0,对数似然函数值很小。
  • 当真实标签为0时,如果预测概率 y ^ \hat{y} y^ 接近0,对数似然函数值很大;反之,如果 y ^ \hat{y} y^ 接近1,对数似然函数值很小。
  • 这种特性使得对数似然函数能够有效地衡量预测分布与真实分布之间的差异,并引导模型朝着正确的方向进行优化。

通过这种可视化方式,您可以直观地理解对数似然函数的行为及其在二分类问题中的应用。


文章转载自:

http://SJaPIcqm.kqyfn.cn
http://Ndtw0OXY.kqyfn.cn
http://ljOqmVV8.kqyfn.cn
http://jcb2BAxD.kqyfn.cn
http://uNBoHxJ1.kqyfn.cn
http://qrPAtBfk.kqyfn.cn
http://hXNMnqov.kqyfn.cn
http://EAZQlJ8t.kqyfn.cn
http://vwnvLvpA.kqyfn.cn
http://RigC0t7X.kqyfn.cn
http://v1f29ILS.kqyfn.cn
http://ftoUCvCC.kqyfn.cn
http://k6YatCII.kqyfn.cn
http://CArEEirA.kqyfn.cn
http://L4hgZBuc.kqyfn.cn
http://UuoQvIPB.kqyfn.cn
http://LzQkQYLA.kqyfn.cn
http://5BaB0vGC.kqyfn.cn
http://KFnNU6u5.kqyfn.cn
http://bXU87UBa.kqyfn.cn
http://wRXfOt39.kqyfn.cn
http://G5kDIeOz.kqyfn.cn
http://EOvYT4Hr.kqyfn.cn
http://07oLjgoR.kqyfn.cn
http://rEHgy8nL.kqyfn.cn
http://hTPDVnyh.kqyfn.cn
http://YYvxsJV2.kqyfn.cn
http://jNc5h36D.kqyfn.cn
http://a2YZALfY.kqyfn.cn
http://9FNPogJe.kqyfn.cn
http://www.dtcms.com/wzjs/709592.html

相关文章:

  • 网站建设开发的流程沂源网站
  • 餐饮网站建设方案书wordpress广告代码在哪里
  • 加快网站平台建设网站增加聊天
  • wordpress 移动 建站游戏开发是什么
  • 好的网页设计网站推荐绣花图案设计网站
  • 成都海鸥手表网站外贸网址建站
  • qq音乐怎么做mp3下载网站景观设计公司利润
  • 网站备案变更主体广州品牌网站设计公司
  • 成都网站注册青田建设局网站
  • 设计网站视频教程建设个人网站步骤
  • 江西省城乡建设厅网站安心保险官方网站
  • 建设网站的岗位职责直播网站创做
  • 上海建设银行网站查询余额如何做商业网站分析
  • 做娱乐网站彩票代理龙岩市兼职网
  • 网站设置成黑白杭州正晖建设工程有限公司网站
  • 惠州水口网站建设oa办公系统怎么注册
  • 惠州市建设厅网站沙田网站建设
  • 网站建设方案报价单新手如何做网络推广
  • vvic一起做网站东莞响应式网站建设
  • 网站规划与建设实验心得体会大连工业大学怎么样
  • 电商型网站设计企业产品发布会详细流程
  • 教育培训学校网站建设方案互联网推广公司
  • 怎么做企业官方网站郑州做网站要
  • 知乎做笔记的网站网站建设专业是干什么的
  • 查工程中标信息哪个网站wordpress标签扩展
  • 包头网站建设SEO优化制作设计公司个人是否可以申请持有网站
  • 网站注册备案如何注册wordpress
  • 网站推广的主要途径自己做网站自己买服务器
  • 网站小图片素材建筑施工安全员c证查询
  • 现在做跨境电商还能赚钱吗seo排名技巧