当前位置: 首页 > news >正文

llm数据存储基础设施

链接:https://i68.ltd/notes/posts/20250310-llm-db/

infinity

  • 专为LLM应用程序构建的AI原生数据库,可提供对密集向量、稀疏向量、张量(多向量)和全文的快速混合搜索
  • 项目仓库:https://github.com/infiniflow/infinity
关键特性
  • 令人难以置信的快
    • 在百万级矢量数据集上实现0.1毫秒查询延迟和15K+ QPS
    • 在33M文档的全文搜索中实现1毫秒延迟和12K+ QPS
  • 强大的搜索功能
    • 除了过滤之外,还支持密集嵌入、稀疏嵌入、张量和全文的混合搜索
    • 支持多种类型的rerankers,包括RRF,加权和和ColBERT
  • 丰富的数据类型
    • 支持广泛的数据类型,包括字符串、数字、向量等
  • 易用性
    • 直观的Python API
    • 无依赖的单二进制架构,使部署变得轻而易举
    • 作为模块嵌入到Python中,对人工智能开发人员友好

MyScaleDb

  • 支持高性能矢量搜索和全文搜索的ClickHouse分支
  • https://github.com/myscale/MyScaleDB
  • MyScaleDB是SQL向量数据库,使开发人员能够使用熟悉的SQL构建生产就绪和可扩展的AI应用程序。它构建在ClickHouse之上,并针对AI应用程序和解决方案进行了优化,使开发人员能够有效地管理和处理大量数据
  • 完全兼容SQL
  • 统一的结构化和矢量化数据管理
  • 十亿级向量的毫秒级搜索
  • 高度可靠和线性可扩展
  • 强大的文本搜索和文本/矢量混合搜索功能
  • 复杂SQL向量查询
  • MyScale可观测性

相关文章:

  • 软考高级信息系统项目管理师笔记-第22章组织通用治理
  • 19、Vue项⽬常⻅优化点
  • 使用Java爬虫根据关键词获取衣联网商品列表:实战指南
  • pytorch retain_grad vs requires_grad
  • Python 融于ASP框架
  • snmp开发
  • C++内存模型和原子操作_第五章_《C++并发编程实战》笔记
  • java之uniapp实现门店地图
  • 前端 - vue - - import引入报错 require引入不报错 package.json中type的用法 延迟导入资源
  • xsync集群分发脚本开发指南
  • 使用AI一步一步实现若依前端(9)
  • 游戏引擎学习第150天
  • 洗鞋小程序(源码+文档+讲解+演示)
  • Spring(4)——响应相关
  • 如何测试 item_get_video 小红书接口返回数据的详细说明
  • 【统计至简】【古典概率模型】联合概率、边缘概率、条件概率、全概率
  • 【实战ES】实战 Elasticsearch:快速上手与深度实践-5.4.2用户画像聚合(Terms Aggregation + Cardinality)
  • SpringCloud——环境搭建
  • html css网页制作成品——糖果屋网页设计(4页)附源码
  • Java中数据库索引选择B+树而非红黑树的详细解析
  • wordpress 功能定制/广州seo推广
  • 企业网站排名提升软件智能优化/高级seo
  • 青岛网站制作价格/二十个优化
  • 旅游 网站建设目标/广告服务平台
  • 合肥快速建站模板/网页制作成品模板网站
  • 南京汽车 企业 网站建设/如何网络推广新产品