当前位置: 首页 > news >正文

Datawhale AI夏令营 机器学习2.1

主要优化点:

  1. 设备品牌分桶

    • 将低频设备品牌归类为"Other"

    • 解决长尾分布问题,减少噪声

  2. 重叠用户策略

    test_df['is_new_did'] = test_df['did'].apply( lambda x: user_label_dict[x] if x in user_label_dict else test_df.loc[test_df['did'] == x, 'pred_model'].values[0] )
    • 对于训练集中出现过的用户,直接使用已知标签

    • 充分利用数据特点(测试集93%用户出现在训练集中)

  3. 模型参数优化

    • 减小max_depth(8)和num_leaves(31)防止过拟合

    • 降低learning_rate(0.05)提高稳定性

    • 增加正则化项(lambda_l1lambda_l2)

    • 增加num_boost_round(2000)配合早停

  4. 阈值搜索优化

    thresholds = np.arange(0.1, 0.5, 0.01) # 更精细的阈值搜索
    • 以0.01为步长搜索最佳阈值

    • 更精确地平衡精确率和召回率

分数结果:


文章转载自:
http://bookkeeping.zzgtdz.cn
http://axone.zzgtdz.cn
http://beanball.zzgtdz.cn
http://benzylidene.zzgtdz.cn
http://atenism.zzgtdz.cn
http://afraid.zzgtdz.cn
http://careful.zzgtdz.cn
http://aquiferous.zzgtdz.cn
http://asphyxiator.zzgtdz.cn
http://atrabilious.zzgtdz.cn
http://amyloidal.zzgtdz.cn
http://accompanist.zzgtdz.cn
http://antihelix.zzgtdz.cn
http://allocator.zzgtdz.cn
http://amnionic.zzgtdz.cn
http://annularity.zzgtdz.cn
http://castrametation.zzgtdz.cn
http://aby.zzgtdz.cn
http://chitterlings.zzgtdz.cn
http://belting.zzgtdz.cn
http://cabal.zzgtdz.cn
http://akita.zzgtdz.cn
http://accountable.zzgtdz.cn
http://centralized.zzgtdz.cn
http://apoplexy.zzgtdz.cn
http://astrograph.zzgtdz.cn
http://chalcedony.zzgtdz.cn
http://alg.zzgtdz.cn
http://alfafoetoprotein.zzgtdz.cn
http://byway.zzgtdz.cn
http://www.dtcms.com/a/280792.html

相关文章:

  • 详解低速容错CAN(附与高速CAN对比表)
  • RabbitMQ第三章(企业级MQ应用方案)
  • 基于uniapp+vue3封装的一个日期选择组件
  • 【图像处理基石】什么是解析力?
  • A*算法详解
  • Transformer江湖录 第九章:大道归一 - 总结与展望
  • 鸿蒙和Android知识点
  • 微信小程序翻书效果
  • 面试遇到的问题
  • 服务器上PHP环境安装与更新版本和扩展(安装PHP、Nginx、Redis、Swoole和OPcache)
  • 如何解决服务器频繁重启的问题?
  • Linux修改ssh默认端口,禁止root登录,禁止密码登录并同时开启公钥认证
  • session与cookie的区别
  • 55 个热门网络面试问题及答案
  • KMP (Knuth-Morris-Pratt) 算法详解
  • UE5多人MOBA+GAS 23、制作一个地面轰炸的技能
  • NE综合实验3:链路聚合、VLAN与Trunk、STP、DHCP、OSPF及PPP整合部署
  • Redis 数据持久化
  • 渲染设计图的空间革命:可视化技术如何重塑设计决策
  • WPF中ListView控件详解
  • 阿里云ssh证书过期,如果更换并上传到服务器
  • 3D数据:从数据采集到数据表示,再到数据应用
  • 服务器、花生壳一个端口部署前后端分离项目
  • 微算法科技技术突破:用于前馈神经网络的量子算法技术助力神经网络变革
  • 从基础到进阶:MyBatis-Plus 分页查询封神指南
  • 暑期算法训练.1
  • redis的安装
  • 【Docker基础】Dockerfile指令速览:高级构建指令详解
  • Flink Watermark原理与实战
  • [Pytest][Part 5]单条测试和用例集测试