当前位置：首页 > news >正文

win7 iis7 添加网站百度竞价网站建设

news 2025/11/2 10:22:41

win7 iis7 添加网站,百度竞价网站建设,工程建设概况,邓修明调研成都网站建设嘉宾介绍：叶正晖，华为云云服务高级顾问，全球化企业信息化专家，从业年限超过23年，在华为任职超过21年，涉及运营商、企业、消费者、云服务、安全与隐私等领域，精通云服务、安全合规、隐私保护等领…

嘉宾介绍：
叶正晖，华为云云服务高级顾问，全球化企业信息化专家，从业年限超过23年，在华为任职超过21年，涉及运营商、企业、消费者、云服务、安全与隐私等领域，精通云服务、安全合规、隐私保护等领域相关解决方案。同时兼任ISC2协会中国区华南分会理事长职务。

以下内容为华为云云服务高级顾问叶正晖在中国计算机学会（CCF）、CCF CTO CLUB联合数新智能共同主办的“多模态数据融合技术创新与落地实战”活动中演讲全文

我今天主要分享一下华为对多模态大模型的一些想法和一些实践。

我们大模型的架构的趋势，还是要从以前的单一模态走向多模态大一统，在未来的趋势下，从2021年的Vision Transformer到2022年的Whisper大模型再到2024年的Sora，整个过程里面从以前的视觉到语音到混合，再到生成大模型的一个统一。但是，我们大模型要解决一个问题，就是我们怎么让AI像人类一样去理解复杂场景下的视觉、语言以及任务逻辑，这是我们大模型要解决的问题。

华为在这上面其实走了一条层次化的一条路，把感知、推理和融合放在一起这么一条路径。其实多模态大模型主要分成三类：一类是属于多模态的理解大模型；二是多模态的生存大模型；三是全模态的大模型。我这里仅为大家介绍理解大模型的情况。

华为的盘古多模态大规模的模型，它是一个层次融合的一个架构。什么叫层次化？它的表向分层包括的基础性能这一层面；第二个层面是专项能力；第三个层面行业解决方案。为什么要叫做层次融合呢？因为它在每一层里面它的相关的这些模块，它是共享一个语义的空间，实现相似的连接与衔接。

在基础性能这一块，它将感知、推理、综合是作为整个大模型的基础。为上面的专项能力以及行业解决方案提供相应模型的性能，以及后续的基本架构信息。

在基础性能方面，它会根据新技术或者产品的迭代会做架构更新，以及相关的数据集都会有变化，并根据实践的情况来改进训练的方法。所以这也为上层的专项能力和行业解决方案提供了相应的基础。

专项能力层，是能力侧重增强的一部分。在大模型的套件里面，目前来说是四个专项的大模型：视觉认知专项、文档理解专项、知识问答专项、任务规划的专项。

在这里面在加上数据工程套件、模型开发套件、模型应用套件这几个套件，面临不同的应用场景，提供了专项能力。而且可以看到不同的专项大模型，比如说像聚焦自然视觉现象，知识管理，就实现视觉认知的理解效果。比如任务规划专项，要与真实环境对齐的任务规划能力，在场景里面去做识别。

我们把视觉认知专项打开看一下，其实视觉认知专项在原来的基础多模态大模型中，经过海量的数据的训练，10000+通用及行业实用标签，包括场景标签，关系标签、行为标签都在这里面。再通过一个泛化的通用视觉认知能力，对里面视觉感知、还有我们平时的常识去做推理。现在可以支持到在一些大的场景下，普通产品的标签精度达到70%，重点行业达到80%。

这就重点谈到我们后续讨论case中的识别产品，它根据我们在现实世界里的一些逻辑在里面做推理抉择。目前在城市治理、安全生产这方面都在做相关的应用。