当前位置: 首页 > news >正文

简历模板2——数据挖掘工程师5年经验

姓名 / Your Name

数据挖掘工程师 | 5年经验 | 推荐/风控/图模型
📞 138-XXXX-XXXX | ✉️ your.email@example.com | 🌐 github.com/yourname | 📍 北京


🎯 个人简介 / Summary

5年大厂数据挖掘经验,硕士学历。擅长推荐系统、用户画像、图神经网络及反欺诈建模,具备扎实的机器学习与工程实践能力。主导多个线上模型从0到1落地,提升业务核心指标。熟悉数据全流程处理,具备从特征设计到模型部署、AB测试的全链条经验。


💼 工作经历 / Work Experience

高级数据挖掘工程师

字节跳动 | 推荐技术部门
2021.08 – 现今,北京

  • 参与短视频推荐排序算法设计与优化,主导多任务学习模型(DeepFM + MMoE)上线,点击率提升12.3%;
  • 构建用户画像系统,涵盖静态属性、兴趣聚类、动态行为标签,支撑推荐/广告/风控三大系统;
  • 联合平台团队建立特征服务系统,支持日均百亿级请求,稳定性达99.99%;
  • 跨部门推进 AB 实验平台优化,实现AB测试自动分流+指标归因分析。

数据挖掘工程师

美团 | 风控与调度技术组
2018.07 – 2021.07,北京

  • 主导“虚假商户识别”图挖掘项目,引入 GAT 图神经网络,准确率提升至91%,上线后每月拦截恶意商户300+;
  • 参与骑手调度优化项目,构建包含天气/订单/区域热度等多源特征体系,提升调度模型效率,配送时间下降8.5%;
  • 搭建基于 Hive + Airflow 的特征流水线系统,实现建模样本生成标准化、自动化。

🧪 项目经历 / Selected Projects

内容推荐排序优化模型(字节跳动)

  • 建立基于用户短期兴趣的推荐排序模型,采用 Transformer + DeepFM 架构;
  • 通过样本采样、重加权缓解曝光偏差,模型效果稳定,AB实验点击率提升12%+;
  • 推动线上部署,模型影响覆盖日均用户超2亿。

用户画像系统重构(字节跳动)

  • 基于用户行为、社交关系构建图结构,用 GCN 聚类兴趣簇;
  • 标签系统统一30+维度,接入推荐、广告和反作弊系统;
  • 实现标签异步更新机制,降低资源开销30%。

虚假交易识别系统(美团)

  • 构建交易网络图,引入 GAT 进行节点表示学习;
  • 使用无监督图聚类方法发现潜在团伙,结合规则系统实时拦截;
  • 系统部署后,整体识别准确率提升至91%,极大降低用户投诉率。

🏆 竞赛经历 / Competitions & Awards

  • 🥈 Kaggle - Santander Customer Transaction Prediction(Top 2%)
    构建堆叠模型 + 特征组合策略,团队协作完成200+特征筛选与融合。

  • 🥉 阿里天池用户增长算法大赛 全国三等奖
    提出 LightGBM + 用户行为时间窗特征方案,精度显著优于baseline。

  • 🎖️ “中国研究生数学建模竞赛” 国家二等奖


🎓 教育背景 / Education

北京航空航天大学
硕士,计算机科学与技术 | 2016.09 – 2018.06

山东大学
学士,信息管理与信息系统 | 2012.09 – 2016.06


🧠 技能清单 / Skills

  • 编程语言:Python(Pandas, Numpy, Sklearn, PyTorch), SQL, Shell
  • 模型方法:XGBoost, LightGBM, DeepFM, GNN(GAT/GCN), MMoE, Transformer
  • 平台工具:Hive, Spark, Airflow, TensorFlow Serving, Docker, Faiss, Kafka
  • 领域经验:推荐系统、反欺诈检测、图建模、特征工程、AB实验

📃 补充信息 / Additional

  • 英语水平:CET-6,具备良好的技术文档阅读能力;
  • 技术博客作者,撰写30+篇机器学习实战笔记(yourblog.com);
  • 开源项目参与者,贡献于 RecBole / DGL 图学习框架。

相关文章:

  • 嵌入式 STM32 开发问题:烧录 STM32CubeMX 创建的 Keil 程序没有反应
  • 人工智能学习16-Numpy
  • 想开启APP开发之旅,要准备哪些资料?
  • flowable工作流的学习demo
  • stm32传感器通用驱动代码
  • 从零搭建MySQL主从复制并集成Spring Boot实现读写分离
  • Hive 性能优化:从表设计到查询执行的全链路优化
  • Windows安装部署jenkins
  • Javaweb学习——day3(Servlet 中处理表单数据)
  • Hive SQL 执行计划详解:从查看方法到优化应用
  • DataX Hive写插件深度解析:从数据写入到Hive表关联实战
  • CNN中的感受野
  • 51单片机-IO扩展模块 pcf8575
  • React中使用Day.js指南
  • 使用NVIDIA NeMo Agent Toolkit扩展现实机器人仿真的物理AI应用
  • 228永磁同步电机无速度算法--基于双重锁相环的滑模观测器
  • 如何调优Kafka
  • 深入解析JVM类加载机制
  • MATLAB交互式贝塞尔曲线演示
  • 动态多目标进化算法:基于迁移学习的动态多目标遗传算法Tr-NSGA-II求解CEC2015,提供完整MATLAB代码
  • 坪山网站建设要多少钱/中囯联通腾迅
  • 网站如何做seo规划/最经典的营销案例
  • 外贸移动商城网站建设/网络推广免费平台
  • 郑州加盟做网站/青岛网站建设公司排名
  • 入境美国前做登记叫啥网站/深圳龙华区大浪社区
  • 宁波创建网站/有没有免费推广平台