当前位置: 首页 > news >正文

入门概述(面试常问)

🧮 一、机器学习(Machine Learning)

✅ 定义:

让计算机“自动从数据中学习”的方法,而不是手动写规则。

🔨 分类方式:
类型标签有无应用示例
监督学习有标签回归预测、分类任务
无监督学习无标签聚类、降维
半监督学习部分有标签提高训练效率
强化学习奖励驱动游戏、机器人控制
📦 常见模型:
  • 线性回归:预测连续值(如房价)

  • 逻辑回归:做二分类(如是否违约)

  • 决策树:用“条件判断”做分类,容易理解

  • 随机森林:多个决策树组合,效果更稳健

  • KNN:靠“邻居”投票分类,懒惰学习

  • SVM 支持向量机:寻找最优分界线分类

  • KMeans 聚类:自动把数据分成 K 类

  • XGBoost / GBDT:集成模型,用提升树叠加训练,性能好


🤖 二、深度学习(Deep Learning)

✅ 定义:

是机器学习的一个分支,用“人工神经网络”模拟大脑的学习方式,适合处理图像、语音、自然语言等复杂任务。

🧱 基本结构:
  • 神经网络(ANN):输入 → 隐藏层 → 输出

  • 激活函数:如 ReLU、Sigmoid,引入非线性

  • 损失函数:如 MSE、交叉熵,衡量模型效果

  • 优化器:如 SGD、Adam,更新权重参数

🧰 常见网络结构:
  • CNN(卷积神经网络):用于图像识别、目标检测

  • RNN(循环神经网络):处理序列数据,如语音、文本

  • LSTM / GRU:RNN 的改进版,能记住更长信息

  • Transformer:靠“注意力机制”实现并行处理,是 NLP 主力结构

  • BERT / GPT:基于 Transformer 的预训练语言模型,用于理解或生成语言


🧠 三、其他重点概念(易被问到)

  • 过拟合 / 欠拟合:模型过强 or 过弱,对泛化能力影响大

  • 交叉验证:稳定评估模型性能的方式

  • 特征工程:清洗、选择、转换特征,提高模型表现

  • 标准化 / 归一化:让特征数据处于统一尺度,加速训练

  • 集成学习(Ensemble):多个模型组合,提升稳定性

  • 训练 & 推理:训练是学习,推理是“用模型做预测”

http://www.dtcms.com/a/331376.html

相关文章:

  • 中久数创——笔试题
  • Android构建工具版本兼容性对照表
  • Git 中切换到指定 tag
  • 会议系统核心流程详解:创建、加入与消息交互
  • 卫星通信链路预算之七:上行载噪比计算
  • MySQL-dble分库分表方案
  • 【最新版】怎么下载mysqlclient并成功安装?
  • 物化视图优先迁移大表,缩短逻辑迁移时间
  • MySql——binlog和redolog的区别
  • uniapp开发动态添加密码验证
  • Go语言全面解析:从入门到精通
  • C/C++ 指针与内存操作详解——从一级指针到字符串转换函数的完整解析
  • 拒绝“孤岛式”作战,全方位构筑隧道应急通信解决方案
  • Java 学习笔记(基础篇2)
  • 13、C 语言结构体尺寸知识点总结
  • LeetCode 刷题【41. 缺失的第一个正数】
  • 【力扣322】零钱兑换
  • 非容器方式安装Prometheus和Grafana,以及nginx配置访问Grafana
  • GraphRAG查询(Query)流程实现原理分析
  • NetLimiter:精准掌控网络流量,优化网络体验
  • 《中国人工智能安全承诺框架》发布
  • arthas火焰图怎么看
  • 搭建 Docker 私有仓库
  • 前端css学习笔记5:列表表格背景样式设置
  • 【Golang】Golang内存泄漏问题排查(二)
  • 服务器路由相关配置Linux和Windows
  • Android POS应用在android运行常见问题及解决方案
  • 当消息队列遇上AI:飞算JavaAI实现智能流量调度与故障自愈实践
  • 在 Windows 系统中解决 Git 推送时出现的 Permission denied (publickey) 错误,请按照以下详细步骤操作:
  • LE AUDIO---Common Audio Service