《AI基础》
1.AI基础知识

1.1 AI基础概念
| | AI的定义、简要发展历程(知道几次发展浪潮)、主要应用领域(如医疗、金融、交通等)。 |
| 目标: 听到“人工智能”能联想到其广泛应用。关键词: 自动化、智能化。 |
🤖 AI的定义与目标
人工智能 是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它旨在让机器能够像人类一样思考、学习、决策和解决问题。
通俗来讲,如果一台机器能够与人类对话而不能被辨别出其机器身份,那么我们就可以认为这台机器具有智能。这也就是著名的“图灵测试”所探讨的核心,当前我们接触到的人工智能系统,绝大多数都属于弱人工智能,它们专注于完成某个特定任务,但在其他方面能力有限
🛣️ AI的发展历程
人工智能作为一门学科,正式诞生于1956年的达特茅斯会议,约翰·麦卡锡在会上首次提出了“人工智能”这一术语。它的发展并非一帆风顺,经历了多次高潮与低谷
| 时间节点 | 核心事件与特征 | 代表性成果 |
|---|---|---|
| 20世纪50-70年代 | 诞生与早期探索:基于符号逻辑和推理规则。 | 达特茅斯会议确立AI概念;ELIZA聊天机器人出现 。 |
| 20世纪80年代 | 专家系统兴起:依靠专家知识和规则库解决特定领域问题。 | 医疗诊断、化学分析等领域的专家系统 。 |
| 20世纪90年代-21世纪初 | 互联网与数据驱动:随着计算能力提升和互联网普及,机器学习方法得到重视。 | IBM“深蓝”战胜国际象棋世界冠军;互联网搜索引擎发展 。 |
| 2012年至今 | 深度学习与大模型时代:神经网络技术取得突破,大数据和强大算力推动AI飞速发展。 | AlphaGo战胜围棋冠军;生成式AI和大模型爆发 。 |
💡 AI的应用领域
智能制造:AI助力建设智能工厂,通过智能调度、质量控制和预测性维护,极大提升了生产效率和产品质量
。医疗健康:AI辅助诊断系统能够帮助医生提高疾病诊断的准确率和效率,特别是在医学影像分析方面表现出色
。AI还能加速新药研发的进程。交通运输:智能网联汽车和自动驾驶技术正在重塑未来的交通模式,旨在提升运行安全和效率
。金融服务:机器学习算法广泛应用于风险评估、欺诈检测和智能投顾等领域,让金融服务更加精准和高效
。日常生活:从智能手机上的语音助手、个性化的内容推荐,到智能家居控制系统,AI无处不在,持续改善着我们的生活体验
。
1.2 AI技术领域(重点)
| 技术领域 | 核心目标 | 关键技术与方法 | 典型应用场景 |
|---|---|---|---|
| 计算机视觉 (CV) | 让计算机能“看”懂图像和视频,识别、跟踪、测量并理解其中的内容 。 | 图像增强、边缘锐化、图像分割、特征抽取、卷积神经网络(CNN)、目标检测、语义分割 。 | 人脸识别、智能视频监控、医疗影像分析(如乳腺癌筛查)、自动驾驶汽车、工业质检 。 |
| 自然语言处理 (NLP) | 让计算机能理解、解释和生成人类语言,实现人机有效沟通 。 | 词嵌入(Word2Vec)、句法分析、语义分析、Transformer模型、大语言模型(如GPT、BERT) 。 | 机器翻译、智能客服聊天机器人、情感分析、文本自动摘要、信息检索 。 |
| 语音技术 (ASR/TTS) | 让机器能“听”懂语音(语音识别,ASR)并“说”出语言(语音合成,TTS) 。 | 隐马尔可夫模型(HMM)、深度学习(如DNN-HMM混合模型)、声学模型、语言模型 。 | 语音输入法、智能语音助手(如Siri)、实时语音转文字、呼叫中心语音分析 。 |
1.2.1 计算机视觉(CV)
计算机视觉旨在让机器具备类似人类视觉系统的能力,能够从图像或视频中提取信息并理解其内容
核心原理与技术:其技术流程常借鉴人类视觉皮层的处理方式,即一个从低级特征到高级语义的逐层抽象过程:
简单来说,计算机先处理像素,提取边缘、角点等基本特征;然后组合这些特征识别出轮廓、形状;最终在更高层次上理解这是什么物体或场景。卷积神经网络(CNN)是实现这一过程的强大工具,其中的卷积层负责提取特征,池化层用于降维和保持特征稳定性。此外,还包括目标检测(框出图像中多个物体并识别)和语义分割(对图像中的每个像素进行分类)等重要任务。
应用实例:CV的应用非常广泛。在医疗领域,它可以分析医学影像,辅助医生更早、更准确地发现病灶,例如在乳腺癌筛查中,CV系统已表现出媲美甚至超越人类放射科医生的能力
在自动驾驶中,CV是感知环境的核心,用于识别道路、车辆、行人及交通标志。在零售业,它被用于分析顾客在店内的行为轨迹,优化商品陈列和营销策略
1.2.2 自然语言处理(NLP)
自然语言处理是人工智能中研究机器理解、处理和生成人类语言的领域,旨在搭建人机之间的语言桥梁
核心原理与技术:NLP的技术发展经历了从基于规则的方法到统计学习方法,再到当前以深度学习(特别是Transformer架构)为主流的阶段。处理文本时,通常先进行预处理,包括分词、词性标注等。由于计算机无法直接理解文字,需要将词汇转化为数值向量(即词嵌入),从而捕捉词语的语义信息。之后会进行句法分析(理解句子结构)和语义分析(理解深层含义)。大语言模型(如GPT系列)的出现,通过海量数据预训练,让机器在语言理解和生成方面取得了飞跃性进展。
应用实例:NLP的应用几乎无处不在。机器翻译(如中英文互译)是最早也是最常见的应用
智能客服和聊天机器人(如你手机里的语音助手或网站客服)依赖NLP来理解你的问题并生成回答。情感分析可以自动分析社交媒体上的用户评论,判断舆论倾向。此外,还有文本自动摘要、信息检索
