第一章:大模型的起源与发展
一、四次 AI 关键发展点
1. 第一次发展:AI的诞生(1950年代)核心:科学家开始思考“机器能否像人一样思考”。 关键事件:
- 图灵测试(1950年):计算机科学家图灵提出,如果一台机器能和人对话到让人分不清它是机器还是人,就算通过了“智能测试”。
- 达特茅斯会议(1956年):一群科学家聚在一起,正式提出“人工智能”这个词,并认为未来机器可以模仿人类的学习、推理等能力。 通俗理解:就像科幻电影里第一次有人提出“机器人可能有大脑”的想法。
2. 第二次发展:专家系统(1980年代)核心:让计算机成为某个领域的“专家”。 关键事件:
- 程序员给计算机输入大量专业规则(比如医学诊断、法律咨询),让它像人类专家一样回答问题。
- 例如:早期的医疗AI能根据症状判断疾病。 缺点:这些系统只能按设定好的规则工作,不够灵活,遇到新问题就“傻眼”了。
3. 第三次发展:深度学习的突破(2010年代)核心:计算机学会“自己学习”。 关键技术:
- 神经网络:模仿人脑结构,让计算机通过大量数据(比如图片、文字)自动总结规律。
- AlphaGo(2016年):谷歌的AI程序击败世界围棋冠军,震惊世界。它通过反复和自己下棋,学会了人类都没想到的战术。 影响:从此,AI能处理更复杂的任务,比如人脸识别、语音助手(如Siri)、推荐算法(如抖音)。
4. 第四次发展:生成式AI(2020年代)核心:AI不仅能回答问题,还能“创造内容”。 代表技术:
- ChatGPT:能写作文、编故事、写代码,像真人一样聊天。
- AI绘画(如Midjourney):输入文字就能生成逼真的图片。 特点:这些AI通过“读”海量数据,自己总结出创作规律,甚至能模仿人类风格。
总结: AI从“模仿规则”到“自己学习”,再到“主动创造”,发展速度越来越快。你现在用的智能手机、刷到的短视频推荐,背后都有AI的影子哦!
二、解码注意力机制(Attention Mechanism)
1、什么是注意力机制(Attention Mechanism)?
想象你在读一本很厚的书,书里有一句话特别重要,但这句话藏在第100页的某个角落。如果让你回答关于这句话的问题,你可能会直接“翻到第100页”仔细看它,而不是从头到尾把整本书再读一遍——这就是“注意力机制”的核心:让AI学会“主动关注重点”。
比如:
- 翻译句子:AI要把“我爱吃苹果”翻译成英文。当它翻译“苹果”(apple)时,会专门“注意”原句中的“苹果”这个词,而不是平均看待所有字。
- 生成回复:如果你问AI:“夏天的巴黎有什么好玩的?”,它会自动“注意”关键词“夏天”“巴黎”“好玩”,再生成回答
2、 注意力机制对AI的贡献
- 解决“健忘症”问题: 以前的AI(比如传统神经网络)处理长句子时,容易“忘记”开头的内容(比如翻译一本小说,看到后面忘了前面)。注意力机制让AI能随时“回头看”关键信息。
- 让AI更“聪明”: 比如,AI读“他打了篮球,然后去弹钢琴”,如果要回答“他弹了什么乐器”,注意力机制会直接“聚焦”在“钢琴”这个词上,而不是被“篮球”干扰。
- 推动技术革命: 注意力机制是如今ChatGPT、语音助手、自动驾驶的核心技术之一。它让AI能处理更复杂的任务,比如写文章、画图、和你聊天时“记住上下文”。
举个生活化的例子
假设你妈妈让你去超市买:牛奶、鸡蛋、草莓,但别买香蕉,因为家里还有。
- 没有注意力机制的AI:可能会漏掉“别买香蕉”,最后买了香蕉回家。
- 有注意力机制的AI:会特别“注意”“别买香蕉”这句话,自动忽略香蕉。
再比如下面这个例子:
“昨天,我在一个繁忙的一天结束后,决定去我最喜欢的咖啡店放松一下.我走进咖啡店,点了一杯拿铁,然后找了一个靠窗的位置坐下.我喝着咖啡,看着窗外的人们匆匆忙忙,感觉非常惬意.然后,我从咖啡店出来,回到了家中。“
问:我去了几次咖啡店?
在这个例子中,“咖啡店”出现了三次,但并非每次都是关键信息.
·当我们理解“我走进咖啡店,点了一杯拿铁”时,“走进”和“点了一杯拿铁”是关键动作,而
“咖啡店”的信息已经被我们知道了.
·同样,当理解“我从咖啡店出来,回到了家中”时,“从咖啡店出来”和“回到了家中”是关键信息,而“咖啡店”的信息仍然是冗余的.
注意力机制就是帮助模型在处理这样的句子时,能够更好地关注到关键的信息,而忽略冗余的信息。
总结
注意力机制就像给AI装了一个“智能手电筒”,让它能在海量信息中快速找到重点,变得更高效、更精准。没有它,就没有今天的智能聊天机器人、实时翻译和推荐算法哦!
3、注意力机制在自然语言处理任务中有哪些具体应用
注意力机制在自然语言处理(NLP)任务中非常重要,它让AI能更好地理解和生成语言。以下是几个具体的应用,我用简单的例子解释一下:
- 机器翻译
任务:把一种语言翻译成另一种语言,比如把中文翻译成英文。
注意力机制的作用:
翻译时,AI需要“注意”原句中的关键词。比如翻译“我爱吃苹果”为英文,AI会特别“注意”“苹果”这个词,并准确地翻译成“apple”。
以前的翻译模型容易漏掉重要信息,注意力机制让它能“记住”并聚焦在关键部分。
2. 文本生成
任务:让AI写文章、编故事或者生成对话。
注意力机制的作用:
比如你让AI写一段关于“夏天的巴黎”的文章,它会“注意”关键词“夏天”“巴黎”,并围绕这些词生成内容。
在生成对话时,AI会根据上下文“注意”你之前说过的话,从而生成连贯的回复。
3. 问答系统
任务:让AI回答用户的问题,比如“谁发明了电灯ÿ