简单了解一下Hugging Face(抱抱脸)
文章目录
- 注册和登录
- 主要内容
- Models
- Datasets
- Spaces
- Community
- Docs、Daily Papers、Learn
Hugging Face 是一个开源的机器学习平台和社区,成立于2016年,总部位于美国纽约,被广泛称为“机器学习的GitHub”。其核心目标是推动人工智能的平民化,通过提供开源工具、模型库和协作平台,降低开发者使用AI技术的门槛。
注册和登录
首先需要通过邮件注册,成功后可以看到
之后通过邮件确认登录。
主要内容
Models
可以看到这里面有各种各样的开源大模型,文本生成模型,语音合成模型,图像生成模型。还有我们熟悉的Deepseek-R1和Qwen,这里我们点进Deepseek-R1可以看到:
Datasets
这里也有海量开源数据集,涵盖文本、图像、音频等类型(如IMDB影评、多语言翻译数据集)。
简单介绍一下其中的yandex/yambda和Wikimedia/Wikipedia。
Yambda-5B 是俄罗斯科技巨头 Yandex 于近日开源的音乐推荐领域超大规模数据集,全称为 Yandex Music Billion-Interactions Dataset。
Wikimedia/Wikipedia 数据集 是维基百科官方内容的开源存档。
Spaces
Hugging Face 的 Spaces 专栏 是一个零门槛的机器学习应用托管平台,允许用户快速构建、部署和分享基于 AI 的交互式应用。它解决了开发者“模型训练后无法直观展示效果”的核心痛点,被社区称为 “AI 模型的 Demo 游乐场”。
比如这个ai漫画工厂:
比如这个文本转语音模型:
Community
这是Hugging Face的社区,主要是关于一些最新开源模型的文章。
Docs、Daily Papers、Learn
Docs里面包含开发者日常参考的技术说明书(类似产品说明书)
每日热点论文:
Learn(学习中心)
一些课程: