当前位置: 首页 > wzjs >正文

宁夏众擎达网站建设网络推广服务费

宁夏众擎达网站建设,网络推广服务费,信阳建设企业网站,邢台网站制作报价多少钱在数仓团队,异步任务设计非常常见,主要原因就是数据量太大,不适合做成同步,在自动驾驶这个业务上,数据大到什么程度呢,单模块每天标签的上报数量就能达到5000W,如果算上车端挖掘、云端挖掘、标注…

       在数仓团队,异步任务设计非常常见,主要原因就是数据量太大,不适合做成同步,在自动驾驶这个业务上,数据大到什么程度呢,单模块每天标签的上报数量就能达到5000W,如果算上车端挖掘、云端挖掘、标注、数据生产、仿真等,每天标签上亿,那是太简单的事了,因此,为了高效完成数据的入库,一个稳定、高吞吐量的异步架构设计显得非常之重要。

配图:北魏家宴饭店  摄影 by 棉花糖

在之前的一篇文章中介绍过异步设计的思想:一个优秀的rabbitmq消费者(consumer)设计,可直接上线使用。这篇文章就是上一篇文章思想的具体落地:

这次就是把上面架构图中消费者部分的批量处理具体为批量写入elasticsearch,这是一种常见的行为,具体场景就是为自动驾驶入库数据创建索引,以支持检索,方便各业务低成本获取所需的数据。

1、RabbitMQ消费者实现

rabbitmq消费者实现的一个核心设计思想:数据消费与业务逻辑处理解耦,即接收数据只从mq中获取数据,不做任何其他事宜,业务逻辑处理放到其他线程中执行。

业务逻辑的处理放到主线程中进行,而且要批量化处理,这样才能实现高吞吐量。

上面数据接收,是把mq的消息放到了一个buffer中,业务获取数据就可以直接从该buffer中读取:

批量读取到数据后,就可以批量处理,比如建索引,写es。

2、Elasticsearch的批量写入

实现es批量写入的核心代码如下:

func (b *EsBatchInsert) BatchInSert(docs []Document) error {var json = jsoniter.ConfigCompatibleWithStandardLibrarybuf := bytes.Buffer{}for _, doc := range docs {meta := map[string]any{"index": map[string]any{"_index": doc.Index,"_id":    doc.ID,},}if err := json.NewEncoder(&buf).Encode(meta); err != nil {return err}if err := json.NewEncoder(&buf).Encode(doc.Source); err != nil {return err}}// resp, err := client.Bulk(&buf, client.Bulk.WithContext(context.Background()))req := esapi.BulkRequest{Body:   &buf,Pretty: true, // 格式化响应}resp, err := req.Do(context.Background(), b.client)if err != nil {fmt.Println(err.Error())return err}if resp.StatusCode != 200 {fmt.Println("error status code: ", resp.StatusCode)return fmt.Errorf("error status code: %d", resp.StatusCode)}return nil
}

需要重点说明的是代码的L11-L16,批量数据写入的最小单元是一条meta+一条业务数据,meta用于标识这条数据写入的索引以及id,类似下图说明:

这样有一个好处,文档之间解耦,不会相互影响,每条文档可以单独设置写入的索引和id,非常灵活、自由。

3、主程序业务逻辑实现

主程序的业务逻辑主要就是批量拿数据、组装数据、写入elastic:

编写一个生产者测试程序,一秒写入一条,内容即为当前时间,消费者消费到后,将时间写入到es中,生产者源源不断写入数据到mq中:

启动消费者,获取数据,并写入到es中:

至此,该异步架构就完成了,高效稳定,很完美。

全部的实现代码相对来说比较多,就不贴在文章中了,我会上传到github上,不知道怎么回事,github、gitee代码都传不上去,后面我再试试,如果有急需这部分代码的小伙伴,可以公众号里加微信联系,我单独发给你。

期待小伙伴们点个关注,聊聊技术,聊聊跑步,聊聊生活~~~~~~。

往期推荐:

历经沧桑的应县木塔,在风雨中已等你969年。

从北京到大同,走过600里,跨越1000年。

一个优秀的rabbitmq消费者(consumer)设计,可直接上线使用。

不告诉你Sanic Blueprints、Middleware是如此的优雅。

Python web框架sanic+tortoise服务框架搭建(MVP版本)

命令行参数的艺术:Python、Golang、C++技术实现

supervisor,你理应知道。

"谢广军女儿开盒"事件引关注,百度发声

跑步的第六年,才真正了解运动的意义

借助tritonserver完成gpt2模型的本地私有化部署

GRPC开发全攻略:从环境搭建到代码实现

武汉抗疫英雄汪勇:平凡人的非凡之举。

微信小程序文章列表焕新颜:从丑小鸭到白天鹅的华丽蜕变

趴菜就是趴菜,捯饬3天,才搞出小程序头部banner,还是个半成品

小程序实现文章列表点击跳转公众号详情页

前端小趴菜终于把公众号和开发的不能再磕碜的小程序首页关联上了

Elasticsearch高级检索对决:search_after+pit和scroll,谁才是最佳选择?

李白:为何两次选择做了上门女婿?

【续】开发triton客户端,访问clip-vit-large-patch14模型抽取图片特征。

NVIDIA tritonserver实现CLIP-ViT模型工程化:轻松获取图片特征(by grpc or http)

Elasticsearch的pit(point in time)到底是个啥玩意?

一文揭秘:Golang+Elasticsearch轻松搭建AI时代的图片搜索服务

2025年,我要做个自我介绍

http://www.dtcms.com/wzjs/487159.html

相关文章:

  • 网站排版怎么做产品营销推广方案
  • 城市分站seo湖南网站推广优化
  • 营销型网站建设哪家好今日全国疫情一览表
  • 毕业设计做网站难吗苏州百度 seo
  • 网站 繁体 js网站推广策划方案
  • 做网站工作量怎么算搜索引擎排名优化公司
  • 做仿牌网站被封网站推广的10种方法
  • 怎么买网站sem是什么?
  • 如何做免费企业网站最有效的100个营销方法
  • 公司备案号查询平台官网外贸建站seo
  • dw用ps切片做网站视频号视频怎么看下载链接
  • 南宁在那里推广网站google play谷歌商店
  • 大型网站建设公司 北京软件开发交易平台
  • 电子商务专业论文选题seo发帖网站
  • 网站底部广告代码专业公司网络推广
  • 建设银行网站会员注销重庆seo教程
  • 成品图片的网站在哪里找全网推广怎么做
  • 怎么看behance和其他设计网站平面设计主要做什么
  • 网站建设吧湖南疫情最新情况
  • phpcms v9怎么做网站c++线上培训机构哪个好
  • 网站推广怎么做的磁力链搜索引擎入口
  • 常熟网站建设icp备案互联网推广工作好做吗
  • 我要学电脑哪里有短期培训班seo文案范例
  • 网站建设开发服务费记账百度网盘下载
  • 为赌博网站做代理被判缓刑软文广告经典案例300
  • 建筑公司资质二级和三级的区别北京seo站内优化
  • 杭州仪器网站制作东莞seo计费
  • 站长交流网址导航怎样推广
  • 大淘客做网站视频石家庄百度关键词优化
  • 泉州市网站制作企业商业软文怎么写