深度学习预知识
一、深度学习相关核心职位
深度学习领域两大热门职位对能力有明确要求,是入行的重要参考。
深度学习应用工程师
需熟练掌握机器学习理论与实践技能,熟悉 CNN 等模型的使用场景及物体检测、图像分类模型;精通 Python 编程,掌握 PyTorch 或 TensorFlow 等至少一种深度学习框架;同时具备扎实的数学、编程功底和良好的团队合作能力。
AI 算法工程师
要掌握计算机视觉、图像处理及常用深度学习算法,在 GAN、扩散模型等至少一个方向有深入研究;熟练使用 Python/C++,熟悉 PyTorch 和 Linux 开发环境;拥有学习创新能力、问题解决能力与团队协作能力,有 AIGC 产品落地经验者优先。
二、人类工业文明的演进脉络
深度学习是工业文明长期发展的产物,人类工业文明经历了四个关键阶段:
机械化时代(18 世纪末):瓦特发明蒸汽机,推动工业设备发展,开启大规模工业化。
电气化时代(19 世纪末):爱迪生发明电灯,电力广泛应用,改变生产生活方式。
信息化时代(20 世纪 50 年代中期):电子信息技术与自动化技术兴起,计算机普及提升效率。
人工智能时代(21 世纪至今):智能系统成为核心,深度学习引领技术变革。
三、人工智能的定义与生活影响
人工智能的定义
人工智能是用人工方法让机器具备类人智能,其学科则是研究模拟、延伸人类智能的理论、技术与应用系统的科学。需注意,仅能按预设程序计算的计算器不属于人工智能。
生活方式的转变
人工智能已渗透生活各方面:居家有智能语音闹钟、灯光控制系统;出行领域自动驾驶技术逐步成熟;工作中人脸识别考勤提高效率;消费端有智能购物、智慧医疗、智慧试衣;此外,人脸支付、智能推荐、语音助手等也极大便利了日常生活。
四、机器学习的日常应用与核心逻辑
日常中的机器学习
生活中,机器学习可判断天气、辨别西瓜好坏,语音识别系统(如小爱、Siri)是典型应用:先采集标注音频数据,再设计带参数的算法,最后通过数据确定最佳参数。其中,参数类似 “旋钮”,调参后的程序是模型,所有模型构成 “模型族”,选参数的程序则是学习算法。
典型训练过程
模型训练分四步:从随机初始化参数的 “无智能” 模型开始;获取带标签的数据样本;调整参数提升模型在样本上的表现;重复数据获取与参数调整,直至模型表现达标。
关键组件
无论何种机器学习问题,都离不开四大组件:
数据:由样本组成,样本含特征,如图像数据中每张照片是样本,像素值是特征。优质且充足的数据能提升模型性能,知名数据集有 ImageNet、COCO 等。
模型:调参后的程序,深度学习模型由神经网络构成,通过多层数据转换处理复杂任务。
目标函数:量化模型效能,常作为损失函数优化,如回归用平方误差,分类用错误率,数据分训练集(拟合参数)和测试集(评估泛化能力)。
算法:优化参数的工具,深度学习常用梯度下降法,通过迭代调整参数以最小化损失。
五、机器学习的主要类型
监督学习:用带标签样本训练,预测标签,分回归(如房价预测,输出数值)和分类(如猫狗识别,输出类别),还有多标签分类(如多目标检测)。
推荐系统与序列问题:推荐系统个性化推荐(如电影推荐),序列问题处理可变长度序列(如语音识别、机器翻译)。
无监督学习:处理无标签数据,挖掘数据规律,如聚类、生成对抗网络。
强化学习:智能体与环境交互,通过获得奖励学习最优策略,区别于离线学习。
六、深度学习的发展与成果
21 世纪高速互联网、GPU 等为深度学习提供数据与算力支持,使其快速发展。成功案例众多:图像分类错误率大幅下降;目标检测能精准识别物体;人脸合成、机器翻译、图像描述、文本合成技术不断突破;还有 AlphaGo 战胜围棋手、自动驾驶合法化等里程碑事件,以及英伟达涂鸦变风景、微软 Seeing AI 助盲、脑机接口等创新应用。
七、图灵测试与 PyTorch 框架
图灵测试
由 “计算机科学之父” 图灵提出,测试者通过问答判断对方是人还是机器,机器若让参与者误判超 30%,则被认为有人类智能。电影《模仿游戏》讲述了图灵破译密码的传奇人生。
PyTorch 框架
在深度学习框架中应用广泛,2019-2023 年趋势显示其在论文实现中占比高(如 2022 年 3 月占 67%)。它由 Meta AI 开发,API 简洁易懂,是学习与实践的优选框架。