1.2.3 迅猛发展期(2020年至今)
这一阶段是大模型的迅猛发展和广泛应用阶段,也是大模型的挑战和机遇阶段。在这一阶段,大模型的参数规模和数据规模达到了前所未有的水平,同时也带来了前所未有的性能和效果。大模型的优势在于,它可以利用海量的数据,从中学习更多的知识和规律,从而提高模型的智能和通用性。大模型的发展受益于多方面的因素,如算力的突破,数据的丰富,算法的优化,框架的支持等。
在这一阶段,神经网络的结构和类型也出现了更多的变化和创新,如稀疏注意力(Sparse Attention)、卷积注意力(Convolutional Attention)、局部敏感哈希(Locality Sensitive Hashing)、自适应注意力(Adaptive Attention)、反向注意力(Inverse Attention)、对抗注意力(Adversarial Attention)等。这些神经网络模型在不同的领域和场景中,展现了不同的优势和特点,如稀疏注意力等注意力机制的改进,可以降低注意力的计算复杂度和内存消耗,从而提高模型的效率和可扩展性;卷积注意力等注意力机制的扩展,可以增加注意力的表达能力和灵活性,从而提高模型的性能和效果。
在这一阶段,大模型的概念和思想也开始出现和发展,主要体现在两个方面: