当前位置: 首页 > wzjs >正文

公司自建网站备案2024年新闻时事热点论文

公司自建网站备案,2024年新闻时事热点论文,赣州企业网站在那做,做服装搭配的流行趋势网站文档(一):新增 & 删除 1.文档的关键特性2.新增文档2.1 指定 ID 新增文档2.2 不指定 ID 新增文档2.3 指定索引批量插入数据2.4 批量执行多种操作2.5 关键说明 3.删除文档3.1 删除单个文档3.2 批量文档删除3.2.1 方法 1:使用 _b…

文档(一):新增 & 删除

  • 1.文档的关键特性
  • 2.新增文档
    • 2.1 指定 ID 新增文档
    • 2.2 不指定 ID 新增文档
    • 2.3 指定索引批量插入数据
    • 2.4 批量执行多种操作
    • 2.5 关键说明
  • 3.删除文档
    • 3.1 删除单个文档
    • 3.2 批量文档删除
      • 3.2.1 方法 1:使用 _bulk 删除多个指定 ID 的文档
      • 3.2.2 方法 2:使用 _delete_by_query 删除符合查询条件的文档
      • 3.2.3 关键区别
    • 3.3 最佳实践

在 Elasticsearch 中,文档Document)是 最小的可索引数据单元,也是信息存储和检索的基本单位。它是 Elasticsearch 的核心概念之一,类似于关系型数据库中的一行记录或 NoSQL 数据库中的一个 JSON 对象。

1.文档的关键特性

  • JSON 格式:文档是一个 JSON 对象,由键值对(字段和值)组成。例如:

    {"_index": "books",         // 所属索引"_id": "1",               // 文档ID"_source": {              // 文档原始内容"title": "Elasticsearch 指南","author": "John Doe","publish_date": "2023-10-01"}
    }
    
  • 唯一标识:每个文档有一个唯一的 _id(可自定义或由 Elasticsearch 自动生成),用于在索引中唯一标识该文档。

  • 归属于索引:文档必须存储在某个 索引Index)中(类似关系型数据库的 “”)。例如,一个书籍文档可能存储在 books 索引中。

  • 可扩展字段:文档的字段是动态的,无需预先定义结构(除非使用显式映射)。字段类型(如文本、数字、日期等)会自动推断或通过映射(Mapping)指定。

  • 支持嵌套和复杂结构:文档可以包含嵌套对象、数组等复杂结构。例如:

    {"user": {"name": "Alice","address": {"city": "Beijing","postcode": "100000"}}
    }
    

2.新增文档

2.1 指定 ID 新增文档

场景:明确指定文档的 _id(如书籍 ISBN 作为唯一标识)。

PUT /books/_doc/101  # 索引名: books, 文档ID: 101
{"title": "深入理解 Elasticsearch","author": "张三","price": 59.9,"publish_date": "2023-05-20"
}

在这里插入图片描述

2.2 不指定 ID 新增文档

场景:让 Elasticsearch 自动生成唯一 _id(如日志场景)。

POST /logs/_doc  # 索引名: logs, 不提供ID
{"level": "ERROR","message": "数据库连接超时","timestamp": "2023-10-25T14:30:00Z"
}

在这里插入图片描述

2.3 指定索引批量插入数据

场景:一次性插入多条文档到同一索引(如商品批量导入)。

POST /products/_bulk
{ "index": {} }  # 不指定ID,自动生成
{ "name": "无线鼠标", "price": 99, "category": "电子产品" }
{ "index": { "_id": "1001" } }  # 指定ID为1001
{ "name": "机械键盘", "price": 299, "category": "电子产品" }

在这里插入图片描述

2.4 批量执行多种操作

场景:混合插入、更新、删除操作(如订单系统数据处理)。

POST /orders/_bulk
{ "index": { "_id": "O20230999" } }  # 新增订单
{ "order_id": "O20230999", "amount": 1500, "status": "paid" }
{ "index": { "_id": "O20230998" } }  # 新增订单
{ "order_id": "O20230998", "amount": 1500, "status": "paid" }
POST /orders/_bulk
{ "index": { "_id": "O20231001" } }  # 新增订单
{ "order_id": "O20231001", "amount": 1500, "status": "paid" }
{ "update": { "_id": "O20230999" } }  # 更新订单状态
{ "doc": { "status": "shipped" } }
{ "delete": { "_id": "O20230998" } }  # 删除订单

在这里插入图片描述

2.5 关键说明

  • 批量操作(_bulk
    • 每两行为一个操作:首行声明动作(index / update / delete),次行为数据或参数。
    • 需确保 JSON 格式严格换行(末尾换行符不可省略)。
  • 自动生成 ID
    • 不指定 _id 时,Elasticsearch 会生成类似 x5F6Z4wB3Kp2YvE1 的唯一字符串。
  • HTTP 方法
    • 新增单条文档:PUT(指定 ID)或 POST(不指定 ID)。
    • 批量操作:POST /_bulk

实际应用中,建议使用 Elasticsearch 客户端(如 Python 的 elasticsearch-py)简化操作。

3.删除文档

3.1 删除单个文档

场景:删除指定 _id 的文档(例如删除某本书)。

DELETE /books/_doc/101  # 删除索引 `books` 中 `_id=101` 的文档

响应

{"_index": "books","_id": "101","_version": 2,  # 版本号递增"result": "deleted",  # 删除成功"_shards": {"total": 2,"successful": 2,"failed": 0}
}

说明

  • 如果文档不存在,返回 "result": "not_found"
  • 删除操作是 逻辑删除(文档不会立即从磁盘移除,而是在后续段合并时清理)。

3.2 批量文档删除

场景:批量删除符合特定条件的文档(例如删除所有 status="expired" 的订单)。

3.2.1 方法 1:使用 _bulk 删除多个指定 ID 的文档

POST /orders/_bulk
{ "delete": { "_id": "O20231001" } }  
{ "delete": { "_id": "O20231002" } }  
{ "delete": { "_id": "O20231003" } }  

响应

{"took": 10,"errors": false,"items": [{ "delete": { "_id": "O20231001", "status": 200 } },{ "delete": { "_id": "O20231002", "status": 200 } },{ "delete": { "_id": "O20231003", "status": 200 } }]
}

3.2.2 方法 2:使用 _delete_by_query 删除符合查询条件的文档

POST /orders/_delete_by_query
{"query": { "term": { "status": "expired" }  # 删除所有 status=expired 的文档}
}

响应

{"took": 100,"timed_out": false,"total": 5,  # 共删除5条"deleted": 5,"batches": 1
}

说明

  • _delete_by_query 适用于 按条件删除,但会触发索引刷新,可能影响性能。
  • 大数据量删除时,建议添加 "conflicts": "proceed" 参数(跳过冲突)和 "scroll_size": 1000(分批处理)。

3.2.3 关键区别

操作类型适用场景性能影响
单条删除(DELETE精确删除指定 _id 的文档低开销,但多次调用效率低
批量删除(_bulk删除多个已知 _id 的文档网络和 I/O 优化,高效
条件删除(_delete_by_query删除符合查询条件的文档触发查询和刷新,大数据量时较慢

3.3 最佳实践

  • 优先使用 _bulk:批量删除已知 ID 的文档时,_bulk 比单条删除快 10-100 倍。
  • 慎用 _delete_by_query:大数据量删除时,建议在低峰期执行,或使用 slices 并行化:
    POST /orders/_delete_by_query?conflicts=proceed&slices=5
    {"query": { "range": { "create_time": { "lte": "2023-01-01" } } }
    }
    
  • 强制物理删除:删除后执行 _forcemerge 清理磁盘空间:
    POST /orders/_forcemerge?only_expunge_deletes=true
    
http://www.dtcms.com/wzjs/3621.html

相关文章:

  • 如何建设商城网站直播营销
  • 开网站需要哪些程序如何修改百度上面的门店号码
  • 网站雪花特效重庆关键词自动排名
  • app界面怎么做seo推广培训中心
  • 网站建设机器人广东省广州市白云区
  • 广州专门做网站的公司平台app开发制作
  • 网站建设做网站怎么做百度一下 你就知道首页官网
  • 凡科互动游戏可以作弊码福州百度网站快速优化
  • 怎样做商城网站的推广最新热点新闻事件
  • o2o网站建设行业现状学生网页设计模板
  • 物流网站免费源码新闻热点事件
  • 哪些域名商可以自助wordpress廊坊seo网络推广
  • 做阿里巴巴网站电话襄阳百度开户
  • 公司网站兰州建设需要多少钱推广app网站
  • 深圳建站公司一般需要多久佛山seo外包平台
  • 企业建立自己的网站公众号怎么引流推广
  • dede网站制作泽成杭州seo网站推广排名
  • 订阅号可以做微网站优化网站的步骤
  • 如何用织梦做网站企业培训有哪些方面
  • 做a 需要制作网站百度网站优化培训
  • 做类似淘宝一样的网站有哪些论坛平台
  • 河南网站建设定制爱站网seo
  • 应用公园app手机版下载网站seo推广计划
  • 广州外贸网站建设公司网页广告怎么做
  • 门户网站系统架构搜狗站长
  • 网站做项目网络营销做得好的企业有哪些
  • 自己做动漫头像的网站网店推广的作用是什么
  • 广东网站建设服务供应商郴州网站建设推广公司
  • 小型公司网站建设运营怎么做
  • 海口网站开发重庆百度推广关键词优化