当前位置: 首页 > news >正文

第一章:大模型的起源与发展

一、四次 AI 关键发展点

1. 第一次发展:AI的诞生(1950年代)核心:科学家开始思考“机器能否像人一样思考”。 关键事件:

  • 图灵测试(1950年):计算机科学家图灵提出,如果一台机器能和人对话到让人分不清它是机器还是人,就算通过了“智能测试”。
  • 达特茅斯会议(1956年):一群科学家聚在一起,正式提出“人工智能”这个词,并认为未来机器可以模仿人类的学习、推理等能力。 通俗理解:就像科幻电影里第一次有人提出“机器人可能有大脑”的想法。

2. 第二次发展:专家系统(1980年代)核心:让计算机成为某个领域的“专家”。 关键事件:

  • 程序员给计算机输入大量专业规则(比如医学诊断、法律咨询),让它像人类专家一样回答问题。
  • 例如:早期的医疗AI能根据症状判断疾病。 缺点:这些系统只能按设定好的规则工作,不够灵活,遇到新问题就“傻眼”了。

3. 第三次发展:深度学习的突破(2010年代)核心:计算机学会“自己学习”。 关键技术:

  • 神经网络:模仿人脑结构,让计算机通过大量数据(比如图片、文字)自动总结规律。
  • AlphaGo(2016年):谷歌的AI程序击败世界围棋冠军,震惊世界。它通过反复和自己下棋,学会了人类都没想到的战术。 影响:从此,AI能处理更复杂的任务,比如人脸识别、语音助手(如Siri)、推荐算法(如抖音)。

4. 第四次发展:生成式AI(2020年代)核心:AI不仅能回答问题,还能“创造内容”。 代表技术:

  • ChatGPT:能写作文、编故事、写代码,像真人一样聊天。
  • AI绘画(如Midjourney):输入文字就能生成逼真的图片。 特点:这些AI通过“读”海量数据,自己总结出创作规律,甚至能模仿人类风格。

总结: AI从“模仿规则”到“自己学习”,再到“主动创造”,发展速度越来越快。你现在用的智能手机、刷到的短视频推荐,背后都有AI的影子哦!

二、解码注意力机制(Attention Mechanism)

1、什么是注意力机制(Attention Mechanism)?

想象你在读一本很厚的书,书里有一句话特别重要,但这句话藏在第100页的某个角落。如果让你回答关于这句话的问题,你可能会直接“翻到第100页”仔细看它,而不是从头到尾把整本书再读一遍——这就是“注意力机制”的核心:让AI学会“主动关注重点”。

比如:

  • 翻译句子:AI要把“我爱吃苹果”翻译成英文。当它翻译“苹果”(apple)时,会专门“注意”原句中的“苹果”这个词,而不是平均看待所有字。
  • 生成回复:如果你问AI:“夏天的巴黎有什么好玩的?”,它会自动“注意”关键词“夏天”“巴黎”“好玩”,再生成回答

2、 注意力机制对AI的贡献

  1. 解决“健忘症”问题: 以前的AI(比如传统神经网络)处理长句子时,容易“忘记”开头的内容(比如翻译一本小说,看到后面忘了前面)。注意力机制让AI能随时“回头看”关键信息。
  2. 让AI更“聪明”: 比如,AI读“他打了篮球,然后去弹钢琴”,如果要回答“他弹了什么乐器”,注意力机制会直接“聚焦”在“钢琴”这个词上,而不是被“篮球”干扰。
  3. 推动技术革命: 注意力机制是如今ChatGPT、语音助手、自动驾驶的核心技术之一。它让AI能处理更复杂的任务,比如写文章、画图、和你聊天时“记住上下文”。

举个生活化的例子

假设你妈妈让你去超市买:牛奶、鸡蛋、草莓,但别买香蕉,因为家里还有。

  • 没有注意力机制的AI:可能会漏掉“别买香蕉”,最后买了香蕉回家。
  • 有注意力机制的AI:会特别“注意”“别买香蕉”这句话,自动忽略香蕉。

再比如下面这个例子:

“昨天,我在一个繁忙的一天结束后,决定去我最喜欢的咖啡店放松一下.我走进咖啡店,点了一杯拿铁,然后找了一个靠窗的位置坐下.我喝着咖啡,看着窗外的人们匆匆忙忙,感觉非常惬意.然后,我从咖啡店出来,回到了家中。“

问:我去了几次咖啡店?

在这个例子中,“咖啡店”出现了三次,但并非每次都是关键信息.

·当我们理解“我走进咖啡店,点了一杯拿铁”时,“走进”和“点了一杯拿铁”是关键动作,而

“咖啡店”的信息已经被我们知道了.

·同样,当理解“我从咖啡店出来,回到了家中”时,“从咖啡店出来”和“回到了家中”是关键信息,而“咖啡店”的信息仍然是冗余的.

注意力机制就是帮助模型在处理这样的句子时,能够更好地关注到关键的信息,而忽略冗余的信息。

总结

注意力机制就像给AI装了一个“智能手电筒”,让它能在海量信息中快速找到重点,变得更高效、更精准。没有它,就没有今天的智能聊天机器人、实时翻译和推荐算法哦!

3、注意力机制在自然语言处理任务中有哪些具体应用

注意力机制在自然语言处理(NLP)任务中非常重要,它让AI能更好地理解和生成语言。以下是几个具体的应用,我用简单的例子解释一下:

  1. 机器翻译
    任务:把一种语言翻译成另一种语言,比如把中文翻译成英文。
    注意力机制的作用:

翻译时,AI需要“注意”原句中的关键词。比如翻译“我爱吃苹果”为英文,AI会特别“注意”“苹果”这个词,并准确地翻译成“apple”。
以前的翻译模型容易漏掉重要信息,注意力机制让它能“记住”并聚焦在关键部分。
2. 文本生成
任务:让AI写文章、编故事或者生成对话。
注意力机制的作用:

比如你让AI写一段关于“夏天的巴黎”的文章,它会“注意”关键词“夏天”“巴黎”,并围绕这些词生成内容。
在生成对话时,AI会根据上下文“注意”你之前说过的话,从而生成连贯的回复。
3. 问答系统
任务:让AI回答用户的问题,比如“谁发明了电灯ÿ

相关文章:

  • 二、重学C++—C语言核心
  • JavaWeb——Mybatis、JDBC、数据库连接池、lombok
  • 【Linux系统编程】操作文件和目录的函数
  • 03_NLP常用的文本数据分析处理方法
  • elasticsearch 8.17.3部署文档
  • 『VUE』vue 引入Font Awesome图标库(详细图文注释)
  • 二、docker 存储
  • 文件系统调用(下) ─── linux第18课
  • 【redis】string应用场景:缓存功能和计数功能
  • UVa12303 Composite Transformations
  • c#客户端请求 Server-Sent Events
  • 音视频开发面试准备
  • Python组合数据类型(二)
  • Python字典,集合
  • Linux 网络:skb 数据管理
  • WEB实时推送消息的7种方式
  • 开发常用软件
  • C++设计模式-抽象工厂模式:从原理、适用场景、使用方法,常见问题和解决方案深度解析
  • Python 构建Flask网页端远程控制Windows系统功能
  • 基于Ollama平台部署的Qwen大模型实现聊天机器人
  • 中介网站设计/线上营销渠道主要有哪些
  • 淘宝网站开发店铺什么类别/seo是怎么优化的
  • 推广哪个网站好/现在感染症状有哪些
  • 如何搭建高品质网站/外包公司到底值不值得去
  • 五核网站建设/权威发布
  • 可做推广的网站/株洲发布最新通告