当前位置: 首页 > news >正文

GitHub 热点项目介绍

Oumi - 端到端的基础模型平台

项目简介
Oumi 是一个全开源平台,旨在解决大模型在各个阶段面临的复杂问题,提供构建先进端到端基础模型所需的一切,涵盖数据准备、训练、评估和部署等环节。

项目链接
GitHub - oumi-ai/oumi

特点

  • 提供一致的 API、生产级可靠性及研究所需的灵活性。

  • 已与 13 所研究型大学的学者建立合作。

  • 可通过 pip 安装并使用 CRI 命令进行模型训练、评估和推理。

  • 项目中还提供了详细的 notebook 供参考实践。


Janus-Pro - DeepSeek 的多模态模型

项目简介
Janus-Pro 是 DeepSeek 发布的多模态框架,可统一多模式的理解和生成,是先前 Genus 的高级版本。

项目链接
GitHub - deepseek-ai/Janus

特点

  • 提供更优化的训练策略、扩展的训练数据和更大的模型大小。

  • 生成图片质量有所提升,具备图像识别、地标识别、文字识别等多种能力。

  • Mac 用户使用存在一些问题,建议优先考虑用 CUDA 运行。

  • 输出尺寸固定为 384×384。


Qwen2.5-VL - Qwen2.5 的视觉模型

项目简介
阿里云发布的千问 2.5VL 视觉语言模型,是千问模型家族的旗舰视觉语言模型。

项目链接
GitHub - QwenLM/Qwen2.5-VL

特点

  • 在感知更丰富世界、支持作为视觉 Agent、理解长视频和捕捉事件、视觉定位以及结构化输出等方面有显著提升。

  • 在处理发票表单和表格数据等任务中表现出色。

  • 7B 模型在多个任务中超过 GBT4o mini 水平。


Browser-Use - AI 控制浏览器

项目简介
一个开源库,用 Python 编写,结合自然语言处理、浏览器自动化工具 Playwright 和大语言模型,让 AI 能像人类一样控制浏览器完成各种任务。

项目链接
GitHub - browser-use/browser-use

特点

  • 支持多标签页管理、视觉识别与内容提取。

  • 支持多种大模型,可进行自动化 AI 任务。

  • 还支持自我纠正机制。

  • 可通过 pip 安装并配置大模型 API 密钥后使用。


Metabase - 开源 BI 工具

项目简介
一个开源的商业智能工具,帮助用户轻松从数据库提取数据并转化为易于理解的图表和仪表盘。

项目链接
GitHub - metabase/metabase

特点

  • 无需编写 SQL,非技术人员也可通过简单操作创建有用报告和可视化分析。

  • 安装简单,提供图形化查询构建器。

  • 支持多种可视化表格类型。

  • 可通过 Docker 或 Java 运行。


相关文章:

  • 闵氏几何详解
  • 用于仿真得到超材料的S参数后,利用S参数矩阵提取等效介电常数和磁导率
  • 【Golang学习之旅】Go 语言微服务架构实践(gRPC、Kafka、Docker、K8s)
  • 【java】方法的基本内存原理(栈和堆)
  • Python爬虫入门实例:Python7个爬虫小案例(附源码)
  • Python 爬虫中的异常处理
  • 如何学习HBase:从入门到精通的完整指南
  • java在文本追加内容时候发现数据丢失问题
  • 3.4 AI Agent体验设计革命:从界面美学到情感化交互的企业级设计指南
  • Mybatisplus自定义sql
  • 自然语言生成(NLG)与理解(NLU)的核心差异
  • Django ModelForm使用(初学)
  • 学习和掌握javaWeb
  • ELK组成及实现原理
  • pg认证需要培训机构吗
  • 【实战篇】DeepSeek全自动视频工厂搭建指南
  • 大语言模型常用微调与基于SFT微调DeepSeek R1指南
  • LLM赋能6-web端Chatbot再更新(待续)
  • c语言(函数)
  • 【MySQL】表的基本操作
  • 浙江广厦:诚挚道歉,涉事责任人交公安机关
  • 英国知名歌手批政府:让AI公司免费使用艺术家作品是盗窃
  • 上海公办小学验证今起开始,下周一和周二分区进行民办摇号
  • 美国新泽西客运公司遭遇罢工:40年来首次,35万人受影响
  • 以军称已开始在加沙的新一轮大规模攻势
  • 刘小涛任江苏省委副书记