GIS是一种特定的十分重要的空间信息系统,应用于科学调查、资源管理、财产管理、发展规划、绘图和路线规划;能够在计算机硬、软件系统支持下,对整个或部分地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。
位置与地理信息既是LBS的核心,也是LBS的基础。一个单纯的经纬度坐标只有置于特定的地理信息中,代表为某个地点、标志、方位后,才会被用户认识和理解。用户在通过相关技术获取到位置信息之后,还需要了解所处的地理环境,查询和分析环境信息,从而为用户活动提供信息支持与服务。
GIS可以分为以下五部分:
人员,是GIS中最重要的组成部分。开发人员必须定义GIS中被执行的各种任务,开发处理程序。 熟练的操作人员通常可以克服GIS软件功能的不足,但是相反的情况就不成立。最好的软件也无法弥补操作人员对GIS的一无所知所带来的负作用。
数据,精确的可用的数据可以影响到查询和分析的结果。
硬件,硬件的性能影响到软件对数据的处理速度,使用是否方便及可能的输出方式。
软件,不仅包含GIS软件,还包括各种数据库,绘图、统计、影像处理及其它程序。
过程,GIS 要求明确定义,一致的方法来生成正确的可验证的结果。
• 自然资源领域
2018年4月,原国土资源部、国家海洋局、国家测绘地理信息局等相关部门进行了整合,组建了自然资源部,部门的职责涉及土地、海洋、测绘、不动产登记等诸多方向。
在自然资源领域,不断累积的数据存量和仍然不断增加的数据增量,使得数据量从GB、TB向PB级发展,用传统GIS的方式难以进行有效管理。例如,不动产登记业务是在各区县开展,但 需要在部委层面整合起来,建成全国不动产数据库,其单表的空间数据就多达5亿条以上;又如,某省级地理国情普查库由于历史数据的累计,存有多达410TB的数据,且还在不断增多。基于单节点模式的传统关系型数据库存储技术难以胜任这一任务。
与此同时,传统的空间分析运算所花费的时间会随数据量的增长而增长,有些比较复杂的空间运算还会随数据量的增长呈指数量级增长,即若数据量增长一倍,处理时间会增加好几倍。以空间连接为例,十万个对象的空间连接耗时约0.7分钟,百万个对象则需5.6分钟左右,千万个对象之间则骤增到97分钟,对于亿级数据量的空间连接,传统GIS根本就得不出结果,只能按照区域先人工分解数据,再分片计算,最后合并,费时费力,结果的准确性还无法得到保证。
在空间数据发布和浏览时,为提高地图浏览的效率,人们一般采用预先切片的技术路线。全国级别的数据切到18级,往往需要数天乃至数周的时间,无法满足数据快速上线的要求,而不切片又无法达到实时地图浏览性能要求。
大数据GIS在自然资源领域的应用将很好地解决上述痛点。分布式存储技术可以轻松管理单表上亿乃至数十亿的空间对象,并具备几乎无限的横向扩展能力;分布式空间分析大幅度降低了空间计算所花费的时间,使得上亿对象之间在1小时内完成全量的叠加分析;采用高性能分布式地图渲染技术,只需结合分布式存储技术,先把数据导入到分布式空间数据库中,就能实现数据的“免切片”发布与浏览。例如四川省测绘局基于分布式架构的时空大数据分析系统时空大数据基础支撑软件实现的千万量级植被覆盖图层快速可视化(图3)。
图片
图2 道路占用地类叠加分析
图片
图3 千万量级植被覆盖图层快速可视化
• 城市规划
城市规划是典型的业务驱动型应用大数据GIS的行业。在没有大数据GIS之前,城市规划所依赖的数据资料往往时效性差、粒度粗,很多时候就只能“拍脑袋”。有了大数据GIS的帮助,才能