当前位置: 首页 > news >正文

GeoScene 空间大数据产品使用入门(1)应用场景与基本流程

GeoScene空间大数据产品专注于地理信息数据的处理和分析,针对庞大体量和规模的时空数据,进行快速的分析计算。产品依托于分布式计算框架,提供数据治理、空间分析、在线建模、开发扩展等完整的解决方案,为用户提供从数据到知识的洞察挖掘过程,为业务系统建设提供GIS时空底座支撑。

它由两部分组成,分别是GeoAnalytics Plus和Intellect Server,其中GeoAnalytics Plus提供了交互式大数据分析的界面,可以理解其为大数据产品的前端,对于用户来说可以仅通过与该部分交互,完成对大数据的处理和分析;Intellect Server则提供了分布式分析计算底层能力支撑,并对算力等资源进行相关的配置和监听,主要是大数据的管理人员进行使用。

图片

图1. GeoScene空间大数据产品结构示意

本期的入门系列文章将从用户使用角度出发,探索如何快速上手GeoAnalytics Plus(以下简称GA Plus)。

图片

图2. GA Plus界面

本系列文章将分为大约8个篇章,计划内容为:

(1)应用场景与基本流程

(2)数据资源

(3)数据治理

(4)空间分析

(5)在线建模

(6)进阶模型

(7)笔记本Notebook的使用

(8)分析任务

什么时候使用GA Plus?

有什么样的需求时,才会用到GA Plus呢?

要回答这个问题,我们可以做一个类比,以桌面产品Pro为例,Pro软件可以处理并管理空间数据,可视化地图,进行空间分析,提供模型构建器用于简化重复任务、提高处理效率,还可以对上述的数据、分析以及模型构建器进行分享,并提供SDK及API便于二次开发和定制。

GA Plus同样提供了类似的功能,它提供了完整的针对时空大数据的建设流程,涵盖了时空数据接入治理和管理(处理并管理空间数据),时空数据分析挖掘(空间分析),在线交互式建模(模型构建器),多任务并发执行和调度策略,丰富的 API 开发接口和系统集成能力(开发API)。可以说几乎Pro所提供GIS通用能力,在GA Plus中都有对应。那二者的区别在哪里呢?

对用户来说,最显著的差别就在数据源上,GA Plus不仅支持常用空间数据类型(文件型、关系型数据库、文件地理数据库、shapefile等),特别是带有时间属性的空间数据,还支持分布式文件系统(HDFS)、NoSQL数据库等多类型时空数据存储。 

第二个显著的差别在于对数据的分析能力,GA Plus基于分布式框架重写了空间分析算法以及数据处理工具。一方面提高了大体量数据处理效率,另一方面提供了针对时空数据的洞察挖掘能力。

所以我们假设了以下几个场景来建议用户选择GA Plus或者Pro。

假设数据为常规数据(fileGDB、shapefile、CSV)而且体量也并不大,数据增长速度不快,所需要的分析任务在传统的GIS桌面软件中可以完成,且用户有一定GIS基础,那GA Plus的优势就体现不出来了,例如制作校园专题图,基于高程、污染或噪音采样点创建连续的栅格表面,使用Pro软件能够能好的实现上述功能。

如果数据体量比较大(通常是国家级/省级的百万级、千万级数据),所占空间大,常存储于类似HDFS等分布式存储中,随着时间变化频繁增加数据,需要多次复杂计算,且分析耗时, 开发难度大,强烈建议使用GA Plus。一个典型的应用就是在土地利用变化监测中,千万级与千万级的土地图斑数据进行叠加分析,任何一个传统的GIS桌面软件处理这个需求都是很困难的,这也正是GA Plus所擅长的。

数据体量不算特别大(市级、县级小规模数据的十万级),涉及多次复杂计算,想体验实时计算,希望闲置资源利用,有弹性扩展需求的情形,也可以选择GA Plus,针对上述体量的数据,GA Plus具有秒级/毫秒级处理效率,也能够高效利用闲置资源。

弱GIS应用行业,没有必要人均安装Pro软件,且用户对GIS基本知识了解不多,使用Pro有难度,也可以选择使用GA Plus,既能体验GIS的常用功能,使用门槛也相对较低,几乎没有维护成本。

GA Plus使用流程

图片

图3. 大数据产品体系结构

上图是大数据产品的体系结构,也包含GA Plus使用流程,首先是接入多源数据,将各种符合要求的数据接入到GA Plus中,其次是数据治理,对数据进行采集、处理、计算、存储、加工和治理,使其符合后续要求,再次是空间分析,挖掘空间分布规律、关联性、模式、以及演变态势,然后是在线建模,通过拖拽算子的方式提高分析效率,如果上述步骤仍不能满足业务需求,还可以进行开发扩展。这正好也对应了GA Plus产品界面的主要模块。

扩展学习:从体系结构中还可以发现,GA Plus产品具有强大的跨平台能力,支持不同的操作系统、CPU以及中间件,并全面适配国产化环境。同时可以对接第三方分布式计算框架,能够智能化调度分布式计算资源,具有高效、稳定、灵活的特性。

关于GA Plus基本的概念就讲到这里,从下一章开始,我们将根据使用流程顺序介绍其操作方法。本系列文章主要基于矢量数据,使用GA Plus5.1版本进行演示,主要针对普通用户介绍GA Plus的常用功能,不涉及用户管理、权限管理部分的内容以及软件安装。为了便于理解,将提供对应章节功能演示视频。

如果您有具体的大数据分析需求,可以直接联系公司各行业销售进行咨询。

http://www.dtcms.com/a/326055.html

相关文章:

  • 【接口自动化】-7- 热加载和日志封装
  • .NET Core MVC中CSHTML
  • 【测试】BDD与TDD在软件测试中的对比?
  • AI蛋白质设计学习主线
  • 【智能的起源】人类如何模仿,简单的“刺激-反应”机制 智能的核心不是记忆,而是发现规律并能迁移到新场景。 最原始的智能:没有思考,只有简单条件反射
  • 首涂模板第45套主题2.0修正版苹果CMS模板奇艺主题二开源码
  • 解决 VS Code 右键菜单丢失问题
  • calamine读取xlsx文件的方法比较
  • Spring Boot 2.0 升级至 3.5 JDK 1.8 升级至 17 全面指南
  • 计算机视觉CS231n学习(7)
  • 【Altium designer】解决报错“Access violation at address...“
  • 【代码随想录day 17】 力扣 617.合并二叉树
  • python魔法方法__str__()介绍
  • 【Lua】题目小练9
  • 从零构建自定义Spring Boot Starter:打造你的专属开箱即用组件
  • 爬虫与数据分析入门:从中国大学排名爬取到数据可视化全流程
  • Go语言构建高性能AI分析网关:原理与实战
  • 设计模式笔记_结构型_组合模式
  • React(四):事件总线、setState的细节、PureComponent、ref
  • Jenkins 搭建鸿蒙打包
  • 【k8s】k8s中的几个概念性问题
  • day48 力扣739. 每日温度 力扣496.下一个更大元素 I 力扣503.下一个更大元素II
  • 轻量级解决方案:如何高效处理Word转PDF?
  • k8s的calico是什么作用,举例一下
  • 【2025最新版】PDF24 Creator,PDF编辑,合并分割,格式转换全能工具箱,本地离线版本,完全免费!
  • 【C语言强化训练16天】--从基础到进阶的蜕变之旅:Day1
  • 【12-激活函数】
  • 【PRML】分类
  • 普通大学本科生如何入门强化学习?
  • 算法73. 矩阵置零