当前位置: 首页 > news >正文

Azure AI Search 探索总结

Azure AI Search 原名 Azure Cognitive Service,是Azure中用来给AI项目构建知识库的组件。

知识库本质和数据库很像,但是内部的存储结构和检索算法不一样。

比如并不是知识库的每一列都可以用来过滤、检索或group by,而是要根据实际情况配置。

Azure AI Search几个基本概念介绍:

  1. Index就是类似数据库的一张表,里面可以存放被检索的信息集合。
  2. Indexer索引生成器,从数据源读取并生成Index的生成器。
  3. 数据源,可以是Blob,Database
  4. Skillset,这个很有意思叫技能包,默认的索引生成器功能很简单,对于复杂文档,比如有大量图片的文档,视频或音频,在生成index时要动用到一些独特的技能包即Skillset

在Azure Portal里AI Search提供了Index的在线查询,使用的是它自己定义的一套JSON查询语法,这里给到几个经典查询介绍:

// 查询某个可以facet的字段,有哪些distinct值
{"search": "*",          // 或空字符串"top": 0,               // 不返回具体文档"facets": ["category"]  // 你想看 distinct 值的字段
}//限制返回字段content的上下文
{"search": "机器学习","highlight": "content-40",   // 40=返回前/后各 40 个字符"select": "title,url"        // 不返回整段 content
}//根据某个字段过滤,类似SQL中的where
{"filter": "category eq 'Electronics'","select": "id,name,price"
}

最后补充两点:

1. Azure AI Search Free-tier 只支持16MB以下的文档。

2. Azure Portal里的操作方式:  不支持自定义index结构,复杂场景还是要写代码导入。

3. Storage Blob里配置文件的元属性,AI Search也能自动读到。

http://www.dtcms.com/a/334654.html

相关文章:

  • 数据库索引视角:对比二叉树到红黑树再到B树
  • 【计算机视觉与深度学习实战】03基于Canny、Sobel和Laplacian算子的边缘检测系统设计与实现
  • DeepSeek-R1-深度解析-通过强化学习激励大语言模型的推理能力
  • Spring AI 玩转工具调用:模型帮你精确设闹钟
  • 九尾狐未来机械锂晶核
  • 盲盒抽谷机小程序系统开发:从0到1的完整方法论
  • 《从入门到精通:Kafka核心原理全解析》
  • 医院管理中的PythonAI编程:资源调配、质量监控、成本控制、医保监管与科研转化
  • 程序设计|C语言教学——C语言基础2:计算与控制语句
  • 登录与登录校验:Web安全核心解析
  • 【AndroidStudio修改中文设置】
  • 宋红康 JVM 笔记 Day03|内存结构概述、类加载器与类的加载过程、类加载器分类
  • java基础(九)sql
  • 复合机器人食品分拣生产线:一体化控制系统引领高效柔性新食代
  • Android Jetpack | Lifecycle
  • vscode的使用
  • FPGA实现I2C通信方案
  • 爬机 验证服务器是否拒绝请求
  • 第五章 大数定律与极限定理
  • 概率论基础教程第3章条件概率与独立性(一)
  • 搜索 AI 搜索 概率论基础教程第3章条件概率与独立性(二)
  • Tomcat Server 组件原理
  • Java 学习笔记(基础篇3)
  • 从零打造大语言模型2--编码注意力机制
  • 【基础-判断】可以通过ohpm uninstall 指令下载指定的三方库
  • 中国教育信息化演进历程与发展趋势研究报告
  • Bash常用操作总结
  • 解决html-to-image在 ios 上dom里面的图片不显示出来
  • 《Python 单例模式(Singleton)深度解析:从实现技巧到争议与最佳实践》
  • 【自动化运维神器Ansible】Ansible逻辑运算符详解:构建复杂条件判断的核心工具