当前位置：首页 > news >正文

Machine Learning HW1 report(Hongyi Lee)

news 2025/7/19 8:03:43

kaggle这个任务score越低越好，因为表示的是与真实值的差距。优化思路：选择更好的features，改神经网络架构，L2正则化。

要求

在这里插入图片描述

尝试

1.根据常识挑选feature

1到38表示各州，挑选前四天的感染率以及戴口罩的数据

   feat_idx = list(range(1,38))+[42,53,58,69,74,85,90,101,106]

结果：best test loss，Train loss: 1.2407, Valid loss: 0.8372，得分1.17068

2.利用pandas计算相关系数挑选feature

Feature Selection

df=pd.read_csv("/content/covid.test.csv")df.head() #show the first five lines to see if it's corrrectly readfeatures=df.drop(columns=['tested_positive']) #get all features except target 'tested_positive'corr_with_target = features.corrwith(df['tested_positive'],method='spearman').sort_values(ascending=False)#compute the correlation index of features with target, stored in descending orderstrong_corr = corr_with_target[abs(corr_with_target)>0.8] #get features has strong correlation with targetprint(strong_corr)

结果
请添加图片描述

调整参数

feat_idx = list(range(1,38))+[38,39,40,41,53,54,55,56,57, 69,70,71,72,73, 85,86,87,88,89, 101,102,103,104,105]

结果：Epoch [1485/3000]: Train loss: 1.1094, Valid loss: 1.0514，得分0.93286

3.使用L2正则化

尝试后发现weight_decay为0.01，0.001，0.002， 0.0005时，效果甚至不如不使用L2正则化。0.0001时，比不使用L2正则化有细微的进步，得分0.93275。调整为0.00005后效果又不如不使用L2正则化。

optimizer = torch.optim.SGD(model.parameters(), lr=config['learning_rate'], momentum=0.9,weight_decay=0.01)

在这里插入图片描述

4.使用Sigmoid代替ReLU

发现Sigmoid明显比ReLU收敛地更慢，且在此情景下结果极差。这是一次失败的尝试
在这里插入图片描述

5.增加神经网络层数

失败的尝试。把隐藏层从一个增加到了两个，private score（最终得分）为0.94437，但public score却很高：0.87614 ；将weight_decay调整为0.001后有细微进步，private score：0.94332，public score：0.89386

        self.layers = nn.Sequential(nn.Linear(input_dim, 64),nn.ReLU(),nn.Linear(64, 16),nn.ReLU(),nn.Linear(16, 8),nn.ReLU(),nn.Linear(8, 1))

在这里插入图片描述

总结

最好的结果为使用相关系数大于0.8的feature，L2正则化weight_decay为0.0001时取得，得分0.93275。
改变神经网络结构的尝试不多，全部失败，但理论上更合理的神经结构肯定取得更好的成果。此外，发现Sigmoid用于regression时效果很差。

查看全文

http://www.dtcms.com/a/167573.html

[基础]详解C++模板类（完整实例代码）

大鱼吃小鱼开源

蓝桥杯Python案例

[蓝桥杯 2021 省 AB] 砝码称重 Java

Android12 Rom定制设置默认语言为中文

c++题目_P1027 [NOIP 2001 提高组] Car 的旅行路线

SALOME源码分析: Data Object Model

JavaScript学习教程，从入门到精通， jQuery 下拉菜单、显示隐藏元素及查找元素方法详解（32）

如何将 VS Code 与 Linux 系统高效连接：从入门到进阶

归因理论——AI与思维模型【87】

RAG技术完全指南（一）：检索增强生成原理与LLM对比分析

第 2.3 节: 基于 Python 的关节空间与任务空间控制

MATLAB中removedelay函数用法

Android短信监控技术实现：合法合规的远程采集方案

【AI论文】ReasonIR：为推理任务训练检索器

【Unity】一个UI框架例子

【C到Java的深度跃迁：从指针到对象，从过程到生态】第五模块·生态征服篇 —— 第十九章 Spring生态：从main函数到企业级开发

Spring IoC容器的设计与实现

数字智慧方案6158丨智慧医疗解决方案精华版（58页PPT）（文末有下载方式）

【音频】Qt6实现MP3播放器

Seata服务端同步提交事务核心源码解析

【音频】基础知识

AI数字人系统开发：技术架构、应用场景与未来趋势

西式烹饪实训室建设路径

图论---有向图的强连通分量（Tarjan求SCC）

内存安全的攻防战：工具链与语言特性的协同突围

【docker学习笔记】如何删除镜像启动默认命令

Spring AI开发跃迁指南（第二章：急速上手3——Advisor核心原理、源码讲解及使用实例）

多线程系列二：Thread类

安装linux下的idea

要求

尝试

1.根据常识挑选feature

2.利用pandas计算相关系数挑选feature

Feature Selection

调整参数

3.使用L2正则化

4.使用Sigmoid代替ReLU

5.增加神经网络层数

总结

相关文章：