怎么样才能入门深度学习?
深度学习使用多层神经网络,并借助大型数据集的训练来解决复杂的信息处理任 务,已成为机器学习领域的成功范式。在过去的十多年里,深度学习已经深刻改变了 计算机视觉、语音识别和自然语言处理等领域,并且正越来越多地应用于医疗保健、 制造业、商业、金融、科学探索等众多行业。近期,被称为大语言模型的超大神经网 络——包含高达万亿数量级可学习参数,已经显示出通用人工智能的初步迹象,它们正在引发技术史上的一次重大颠覆。
入门深度学习就看这本《深度学习:基础与概念》
适读人群 :不管是机器学习的新手,还是有经验的实践者,都能从本书中获益。因为各章所讲解的主题既相对独立,又是按照线性展开的,所以本书还适合作为大学生及研究生相关课程的教材或自学图书。
如果看不懂“花书”,那就先来看看这本:《深度学习:基础与概念》
1.作者自身的知名度,经典著作《模式识别与机器学习》之后的又一力作;
2.三位图灵奖得主的共同推荐,2024 年诺贝尔物理学奖得主杰弗里·辛顿作序推荐;
3.为初学者打造,这本书不只能帮读者正确理解深度学习的关键知识,还能帮助读者构建整个深度学习的知识体系、理解其思想内核;
4.本书的重点是引导读者清晰地理解概念与思想,强调的是具有实际应用价值的技术而不是抽象的理论;
5.四色印刷,提升“悦读性”。
本书全面且深入地呈现了深度学习领域的知识体系,系统梳理了该领域的核心知识,阐述了深度学习的关键概念、基础理论及核心思想,剖析了当代深度学习架构与技术。全书共 20 章。本书首先介绍深度学习的发展历程、基本概念及其在诸多领域(如医疗诊断、图像合成等)产生的深远影响;继而深入探讨支撑深度学习的数学原理,包括概率、标准分布等;在网络模型方面,从单层网络逐步深入到多层网络、深度神经网络,详细讲解其结构、功能、优化方法及其在分类、回归等任务中的应用,同时涵盖卷积网络、Transformer 等前沿架构及其在计算机视觉、自然语言处理等领域的独特作用。本书还对正则化、采样、潜变量、生成对抗网络、自编码器、扩散模型等关键技术展开深入分析,阐释其原理、算法流程及实际应用场景。对于机器学习领域的新手,本书是全面且系统的入门教材,可引领其踏入深度学习的知识殿堂;对于机器学习领域从业者,本书是深化专业知识、紧跟技术前沿的有力工具;对于相关专业学生,本书是学习深度学习课程、开展学术研究的优质参考资料。无论是理论学习、实践应用还是学术研究,本书都是读者在深度学习领域探索与前行的重要指引。
更多推荐
动手学深度学习 (PyTorch版)
适读人群 :本书同时覆盖深度学习的方法和实践,主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程或附录中描述的线性代数、微分和概率基础。
在本书中,作者将适时教授大部分概念。换句话说,读者将在需要实现某些实际目的非常 时刻学习概念。虽然作者在开始时花了一些时间来教授基础的背景知识,如线性代数和概率, 但我们希望读者在思考更深奥的概率分布之前,先体会一下训练模型的满足感。
除了提供基本数学背景速成课程的几节初步课程,后续的每章都介绍了适量的新概念,并提供可独立工作的例子——使用真实的数据集。这带来了内容组织上的挑战,某些模型可能在逻辑上组合在单节中,而一些想法可能最好通过连续运行几个模型来传授。此外,坚持“一个工作例子一节”的策略有一个很大的好处:读者可以利用我们的代码尽可能轻松地启动自己的 研究项目,即只需复制本节的内容并开始修改。
本书将从零开始教授深度学习的概念。本书包含15章,第一部分介绍深度学习的基础知识和预备知识,并由线性模型引出最简单的神经网络——多层感知机;第二部分阐述深度学习计算的关键组件、卷积神经网络、循环神经网络、注意力机制等大多数现代深度学习应用背后的基本工具;第三部分讨论深度学习中常用的优化算法和影响深度学习计算性能的重要因素,并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。
深度学习[deep learning]
《深度学习》由该领域的三位专家撰写,是目前该领域唯一的综合性图书。它为正在进入该领域的软件工程师和学生提供了广泛的视角和基础的数学知识,同时也可以为研究者提供参考——Elon Musk,OpenAI联合主席,特斯拉和SpaceX共同创始人兼首席执行官
这是深度学习的权威教科书,由该领域的主要贡献者撰写。此书内容非常清晰、全面并且权威。阅读这本书,你可以知道深度学习的由来、它的好处以及它的未来。——Geoffrey Hinton,多伦多大学荣誉退休教授,Google杰出研究科学家
全书的内容包括3个部分:第1部分介绍基本的数学工具和机器学习的概念,它们是深度学习的预备知识;第2部分系统深入地讲解现今已成熟的深度学习方法和技术;第3部分讨论某些具有前瞻性的方向和想法,它们被公认为是深度学习未来的研究重点。
《深度学习》适合各类读者阅读,包括相关专业的大学生或研究生,以及不具有机器学习或统计背景、但是想要快速补充深度学习知识,以便在实际产品或平台中应用的软件工程师。