当前位置: 首页 > news >正文

【AI入门】通俗易懂讲AI(一)

一、人工智能起源

达特茅斯会议的背景

1956年夏季,美国达特茅斯学院举办了一场为期六周的学术研讨会,主题为“人工智能”(Artificial Intelligence)。这次会议由约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)、克劳德·香农(Claude Shannon)等学者发起,旨在探讨机器模拟人类智能的可能性。会议名称中的“人工智能”一词由麦卡锡首次提出,并成为该领域的正式名称。

会议的核心议题与目标

达特茅斯会议明确了人工智能研究的几大方向:

  • 自动计算机:探讨如何利用计算机执行符号操作,而非仅限数值计算。
  • 神经网络:研究通过模拟人脑神经元结构实现学习能力。
  • 抽象与推理:探索机器如何理解概念并完成逻辑推理。
  • 自我改进:设想机器能够通过经验改进自身性能。

会议虽未达成具体技术突破,但为后续研究划定了框架,并促成符号主义与连接主义两大流派的形成。

对人工智能领域的影响

达特茅斯会议被视为人工智能诞生的标志性事件:

  • 确立“人工智能”作为独立学科,吸引后续资金与人才投入。
  • 推动早期AI技术发展,如专家系统和机器学习算法的雏形。
  • 会议参与者如艾伦·纽厄尔(Allen Newell)和赫伯特·西蒙(Herbert Simon)在会后开发了首个AI程序“逻辑理论家”。

后续发展与争议

早期乐观预测(如“20年内机器将具备人类智能”)未能实现,导致70年代“AI寒冬”。但会议提出的基础问题(如自然语言处理、通用智能)仍是现代AI研究的核心。近年来,随着深度学习兴起,连接主义(神经网络)成为主流,部分实现了会议最初的设想。

二、什么是人工智能

搞清楚什么是人工智能、机器学习、深度学习和生成式 AI ,以及之间的关系。

2.1 人工智能(AI)

        (Artificial intelligence)简单的说“像人一样思考的计算机和机器”,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,让计算机和机器能够模拟人类学习、理解、问题解决、决策制定,以及发挥创造力和自主性。

2.2 机器学习(ML)

        (Machine learning)是人工智能的子集,它涉及通过训练算法来创建模型,以根据数据做出预测或决策。它涵盖了一系列广泛的技术,让计算机能够从数据中学习并做出推理,而无需针对特定任务进行明确的编程。

机器学习技术或算法有很多种,包括线性回归、逻辑回归、决策树、随机森林、支持向量机 (SVM)、k-最近邻 (KNN)、聚类等。其中每种方法都适用于不同类型的问题和数据。

但是,最流行的机器学习算法类型之一称为神经网络(或人工神经网络)。神经网络是模仿人类大脑的结构和功能建立的。神经网络由相互连接的节点层(类似于神经元)组成,这些节点能协同处理和分析复杂数据。神经网络非常适合在大量数据中识别复杂模式和关系的任务。

机器学习最简单的形式称为监督学习,涉及使用标记数据集来训练算法,以准确进行数据分类或结果预测。在监督学习中,人类将每个训练示例与一个输出标签配对。目标是让模型学习训练数据中输入和输出之间的映射,以便可以预测新的、未见过的数据的标签。

2.3 深度学习(DL)

        (Deep learning)是机器学习的子集,灵感来自人脑,由人工神经网络(ANN)组成,它模仿人脑中存在的相似结构。采用多层神经网络(称为深度神经网络)来更深入地模拟人脑的复杂决策能力。

深度神经网络包括一个输入层、至少三个但通常有数百个隐藏层,以及一个输出层,而经典机器学习模型中使用的神经网络通常只有一个或两个隐藏层。

这些多层级结构可实现无监督学习:它们可以自动从大型、未标记和非结构化数据集中提取特征,并对数据所代表的内容做出自己的预测。

深度学习不需要人工干预,因此可以实现大规模的机器学习。它非常适合自然语言处理 (NLP)、计算机视觉和其他涉及在大量数据中快速、准确地识别复杂模式和关系的任务。如今我们生活中的大多数人工智能 (AI) 应用程序都或多或少得到了深度学习的支持。

深度学习还可以实现以下几个方面:

  • 半监督学习,使用标记和未标记的数据来训练 AI 模型以执行分类和回归任务,从而将监督学习和无监督学习相结合。
     
  • 自我监督学习,从非结构化数据生成隐式标签,而不是依赖标记的数据集来获取监督信号。
     
  • 强化学习,通过试错和奖励函数学习,而不是从隐藏模式中提取信息。
     
  • 迁移学习,利用通过一项任务或数据集获得的知识来改善其他相关任务或不同数据集的模型性能。

2.4 生成式 AI

        (Generative AI)是指能够根据用户的提示或请求创建复杂的原创内容(如长篇文本、高质量图像、逼真的视频或音频等)的深度学习模型。

在较高的层次上,生成式模型对所用训练数据的简化表示进行编码,然后从该表示中提取内容来创建与原始数据类似但并不完全相同的新作品。

多年来,统计学中一直使用生成式模型来分析数值数据。但在过去十年中,它们已经发展到可以分析和生成更复杂的数据类型。这种演变与三种复杂的深度学习模型类型的出现相吻合:

  • 变分自编码器 (VAE) 于 2013 年推出,让模型能够根据提示或指令生成内容的多种变体。
     
  • 扩散模型最早出现于 2014 年,可在图像上添加“噪声”直到其无法识别,然后再消除噪声以根据提示生成原始图像。
     
  • 转换器(也称为转换器模型),在序列数据上进行训练,以生成扩展的内容序列(例如句子中的单词、图像中的形状、视频的帧或软件代码中的命令)。转换器是当今大多数热门生成式 AI 工具(包括 ChatGPT 和 GPT-4、Copilot、BERT、Bard 和 Midjourney)的核心。

三、人工智能 (AI) 的历史

        “会思考的机器”的概念可以追溯到古希腊。但是,自从电子计算出现(并与本文讨论的一些主题相关)以来,AI 发展历程中的重要事件和里程碑包括:

1950 年
艾伦·图灵 (Alan Turing) 发表了《计算机器与智能》(Computing Machinery and Intelligence)。在这篇论文中,因在二战期间破解德国 ENIGMA 密码而闻名,并常被称为“计算机科学之父”的图灵提出了以下问题:“机器能思考吗?”

为了回答这个问题,他提供了一个测试,这就是著名的“图灵测试”,在此测试中,人类询问者将尝试区分哪些文本响应是计算机做出的,哪些是人类做出的。虽然这项测试自发布以来经过了大量审查,但它仍然是 AI 历史的重要组成部分,也是哲学中一个不断发展的概念,因为它利用了有关语言学的想法。

1956 年
约翰·麦卡锡 (John McCarthy) 在达特茅斯学院举行的第一届 AI 会议上首创“人工智能”一词。(麦卡锡后来发明了 Lisp 语言。)同年晚些时候,Allen Newell、JC Shaw 和 Herbert Simon 共同创建了第一个运行的 AI 计算机程序——Logic Theorist。

1967 年
弗兰克·罗森布拉特 (Frank Rosenblatt) 建造了 Mark 1 Perceptron,这是第一台基于神经网络的计算机,可以通过反复试错来“学习”。仅仅一年后,Marvin Minsky 和 Seymour Papert 就出版了一本名为《感知器》 (Perceptrons) 的书,该书成为神经网络的里程碑式著作,至少在一段时间内成为反对未来神经网络研究项目的论据。

1980 年
使用反向传播算法进行自身训练的神经网络在 AI 应用中得到了广泛使用。

1995 年
斯图尔特·罗素 (Stuart Russell) 和彼得·诺维格 (Peter Norvig) 出版了《人工智能:一种现代方法》(Artificial Intelligence: A Modern Approach),成为 AI 研究领域的领先教科书之一。在这本书中,他们深入研究了 AI 的四个潜在目标或定义,这些目标或定义根据理性和思考与行动来区分计算机系统:

1997 年
IBM 的“深蓝”在一场国际象棋比赛(以及复赛)中击败了当时的世界象棋冠军 Garry Kasparov。

2004 年
约翰·麦卡锡 (John McCarthy) 撰写了一篇名为《什么是人工智能?》(What Is Artificial Intelligence?) 的论文,并提出了一个经常被引用的 AI 定义。此时,大数据和云计算时代已经到来,这使组织能够管理越来越大的数据资产,这些数据资产未来将用于训练 AI 模型。

2011 年
IBM Watson 在 Jeopardy! 比赛中击败冠军 Ken Jennings 和 Brad Rutter!同时,大约在这个时候,数据科学开始成为一门受欢迎的学科。

2015 年
百度的 Minwa 超级计算机使用一种称为卷积神经网络的特殊深度神经网络来识别和分类图像,准确率超越普通人。

2016 年
DeepMind 的 AlphaGo 程序,由深度神经网络支持,在一场五局比赛中击败了围棋世界冠军李世石 (Lee Sodol)。由于棋局中可能出现大量棋步(四手之后就有超过 14.5 万亿个可能棋步!),因此,这场胜利意义重大。后来,据报道,Google 作价 4 亿美元收购了 DeepMind。

2022 年
大语言模型 (LLM)(例如 OpenAI 的 ChatGPT)的兴起为 AI 的性能带来了显著变化,并增强其为企业创造价值的能力。借助这些新一代的生成式 AI 技术,深度学习模型能够在海量数据上进行预训练。

2024 年
最新的 AI 趋势表明 AI 的复兴势头仍在持续。多模态模型可以接受多种类型的数据作为输入,提供了更丰富、更强大的体验。这些模型将计算机视觉中的图像识别和 NLP 语音识别功能结合在一起。在大规模模型收益递减、参数数量庞大的时代,小型模型也在不断进步。

参考:

【IBM】什么是人工智能 (AI)?

【IBM】什么是生成式人工智能 (生成式 AI)?

【AWS】什么是人工智能 (AI)?

http://www.dtcms.com/a/570820.html

相关文章:

  • 第四十三篇|日本语言学校教育数据建模实录:惠比寿语校的语义结构与AI可计算化
  • 做交易平台网站适合初学者做的网站
  • 北京做兼职从哪个网站茶叶网站实际案例
  • 无需下载直接进入的网站的代码制作一个网站的费用是多少
  • 大连地区做网站手机开网店用什么软件
  • FastAPI 初识
  • 做论坛网站看什么书五金件外发加工网
  • 苍穹外卖资源点整理+个人错误解析-Day04-套餐模块
  • 网站建设哪公司微信开发时间
  • 河南郑州网站顾问什么公司能做网站建设
  • 哪里可以买链接网站个人网站建设方案书备案
  • 平板网站建设网站开发三大元素
  • php做的网站建设微信导入wordpress
  • 自动驾驶大模型---特斯拉FSD模型架构终浮出水面
  • JAVA算法练习题day65
  • 引流网站怎么做建团购网站
  • 做网站的公司搞什么活动做轮播海报的网站
  • 基于python网站开发网站建设 贴吧
  • 怎么做音乐网站泰安八戒电子商务有限公司
  • 昆明网站开发公司哪家好兰州网站开发
  • 1.2演示案例
  • 微网站设计与开发网站建设啊
  • 电子商务网站软件建设的核心是河南省建设厅证件查询
  • 建设网站需要租用服务器成都网站建设公司盈利吗
  • 单页面网站多少钱wordpress做企业网站
  • 青岛seo白城seo
  • 数电基础:常见的组合逻辑电路模块(2)
  • 4 LlamaIndex 全流程实践:构建企业级智能文档问答系统
  • 电商网站设计公司排行榜个人视频网站应该怎么做
  • 关于nginx部署项目报错swool启动问题