当前位置: 首页 > wzjs >正文

江宁网站建设怎么做品牌推广和宣传

江宁网站建设,怎么做品牌推广和宣传,福田网站建设哪家好,网站建设具体日程安排VO语言还提供了一些个性化的高级语法特性,这些语法特性有别于传统的编程语言。但可以更好的帮助开发者实现高效、稳定的生产级数据流程。 调度运行 在现行的编程语言中,调度运行不在语法表示范围之内。这属于具体的代码实现逻辑。但在VO语言设计中&…

        VO语言还提供了一些个性化的高级语法特性,这些语法特性有别于传统的编程语言。但可以更好的帮助开发者实现高效、稳定的生产级数据流程。

调度运行

        在现行的编程语言中,调度运行不在语法表示范围之内。这属于具体的代码实现逻辑。但在VO语言设计中,调度运行是一种原生的特性。VO语言有别于图灵完备的通用开发语言,其属于面向数据科学的一种领域描述语言,是图灵不完备的,类似SQL语言。从诞生之日起,其就内置了算子调度运行的语义。VO语言解释器缺省为每个算子分配一个独立线程,确保数据流在算子间可并行执行,最大程度的确保程序的运行效率。这种语言设计可大大降低开发者的使用和学习成本,编写出的程序可直接满足数据科学类应用场景的性能需求。是VO语言带给开发者的一种语法糖。

        调度运行是通用容器算子流程算子提供的原生特性,在使用VO语言的开发过程中,你并不能拖拽一个流程算子,但流程算子始终存在。创建数据流程时,缺省会创建一个流程算子用于管理流程逻辑。当流程逻辑比较复杂,拖入了太多算子时,可以选中多个算子进行打包,形成一个内部函数,这个内部函数的容器就是一个流程算子。流程算子的外观如下图:

        通过点击流程算子的运行切换按钮来转换流程内的算子是以并行方式被调度,还是以串行方式被调度。串行方式执行时,容器内的所有算子共享同一个线程。是否选用串行方式运行时一般有2个前提,一是流程非常复杂,拥有几百个算子,如果并行运行势必会占用操作系统过多的线程资源。若同时有多个此类数据流程运行会导致物理机资源紧张,此时可以考虑是否切换为串行运行;二是被设计为串行运行的流程中不存在可能造成性能瓶颈的算子,算子逻辑都比较简单。此时可以考虑是否切换为串行模式,否则无需考虑切换运行方式。

水位线

        水位线是VO语言为数据集打上的数据标记。此概念与Spark、Flink中的水位线的概念基本一致,可以用来标记数据处理的进度。除此外,VO语言中的水位线还有类似事务边界的作用。VO语言中的任何算子在发现水位线变化时,都会从触发输出端口发出一个水位线变更的事件,从而触发后续算子的运行,形成一个类似事务的同步控制。被触发的算子会检查已收到的数据集的水位线是否包含触发事件中的水位线,若包含则触发算子运行。

        在数据流程中,可以通过“添加水位线”(AddWaterMark)算子和“清除水位线”( ClearWaterMark)算子来设置和清除水位线。这两个算子都无需参数配置。开发者在流程中加入“添加水位线”算子后,所有流经该算子的数据集都会被打上一个唯一的水位线标记。后续的算子对数据集的操作不会改变水位线标记。例如一个数据集拆分算子,若带水位线的集合被拆解成多个数据集,则每个数据集都有一个当前水位线的标记;如果是合并数据集,那么最后一个数据集的水位线会被标记在合并后的数据集上。

                        若算子有多个输入端口,需要对多个输入端口的数据集做聚合。VO没有强制语义要求两个数据入口的水位线必须相同才能做聚合。开发者应当自行确保参与计算的水位线的时序是相同的。合并后的数据集的水位线缺省使用的是算子图元最上面的那个数据端口的水位线。

水位线变量

        VO语言提供的开发场景中,目前只有数据集和算子参数。如果数据场景比较复杂,后续算子需要一个位置比较靠前的前置算子中信息时,就必须将这个信息放在数据集中向下传输。尽管这个信息可能对绝大多数算子来说都无用,但仍需耗费一定的存储和CPU时间去传递和复制这些信息。有一些Workflow及数据科学工具就采用了这种方案。但这种方案太过冗余。

        VO语言为解决此类问题,为水位线加入了一个水位线变量的概念。可以通过“添加水位线变量”(AddWaterMarkVariable)算子将数据流中需要的参数信息存入水位线变量,在后续的算子中,通过getWMV(paramName)函数获取水位线对应的参数值。在这里,可以视每个水位线都有一个自己的变量存储空间。当算子调用getWMV(paramName)时,获取的是当前水位线空间内的参数值。

        如上图,设置水位线变量把CSV读取算子输出的文件名(streamName)重新命名为fileName,保存在了水位线空间中,而后流程删除了streamName列,又使用列添加算子添加了streamName列,并用水位线变量中的fileName参数值作为列的缺省值。使用getWMV函数时需要注意,不能直接使用参数名fileName,必须使用'fileName'。因为,在算子的语境中,所有的变量都是指数据集的列名。由于水位线变量会占用一定的存储空间,对于数据量较大的数据流程,可以使用“清除水位线变量”(ClearWaterMarkVariable)算子清除掉不再有用的水位线变量。

数据复制

        VO语言的解释运行被设计为效率优先,即数据集在传输过程中,如果一个算子的输出端口同时接了多个算子的输入端口,那么每个算子收到的数据集是同一个数据集。如果后续算子都只是读取数据集而不对数据集进行维护,则不会有任何问题。否则,当多个算子同时维护同一个数据集时,就会引发数据不一致的问题。此时,开发者需要显示的加入数据集复制算子,确保后续的数据集操作彼此不产生冲突。

数据集复制

        数据集复制算子不需要配置参数,会根据连接的算子数自动为每一个数据集复制数据集,确保每个算子都获得一个独立的数据集。

数据流复制

        VO语言的算子中有一类特殊的数据集,就是数据流集合。这类数据集由于数据流本身的不可重读性,所以输出端口缺省只能有一个合法的数据连接。如果希望一个数据流集合可以同时被多个后续算子访问,需要在流程中加入一个数据流复制算子。该算子无需配置参数,与数据集复制算子一样,其也可根据输出端口连接的算子数量自动复制数据流集合。

http://www.dtcms.com/wzjs/453068.html

相关文章:

  • ppt超链接到网站怎么做友点企业网站管理系统
  • 网络营销推广方式思维导图合肥网站seo推广
  • 怎么用网站做文案网店怎么运营和推广
  • java实现大型门户网站开发经验淘宝关键词怎么选取
  • 网站首页像素广安网站seo
  • 网站建设销售销售流程杭州搜索引擎排名
  • 惠州网站建设哪里找360推广和百度推广哪个好
  • 甘肃 网站建设网店推广策划书
  • h5网站制作接单营销运营主要做什么
  • 网站建设建设公司哪家好搜索大全引擎地址
  • 做网站美工百度一下全知道
  • 溧阳做网站哪家好百度一下你就知道 官网
  • 在国外网站付款要怎么做宁波网站优化公司哪家好
  • 用模板搭建的网站备案吗网站后台管理系统
  • 免费ppt模板资源宁波seo网络推广软件系统
  • 关于政府网站建设推进落实情况什么是白帽seo
  • 有没有做翻译赚钱的网站怎么学seo基础
  • 大连网站建设方案维护郑州seo排名哪有
  • wordpress定时器东莞网站优化公司哪家好
  • 做的网站百度找不到了搜索推广渠道有哪些
  • 外国人爱做视频网站企业互联网推广
  • 全球50个大网站开发语言ue5培训机构哪家强
  • 做面点的网站哪个平台可以免费打广告
  • 延吉网站制作南宁seo推广服务
  • 国外成人做视频网站有哪些网盟推广平台
  • 中山市建设信息网站站长推广工具
  • 上海网站制作顾品牌营销
  • 网站建设优化服务精英重庆seo1
  • 打扑克软件直播app开发魔贝课凡seo
  • 个体户做网站是怎么备案北京优化靠谱的公司