导读:大数据”技术来自搜索、电子商务、科学推算等领域持久与海量数据打交路所堆集下的经验堆集,目前尚不存在公认的基础理论和解决规划。要真正理解大数据,用好大数据,必须跳出现有概想的窠臼。
大数据(Big Data)是将规模重大、结构复杂、动态演变的数据进行采集、筛选、治理、搜索、分析、挖掘与表白的技术统称,是连通讯息世界和知识世界的桥梁,也是数据科学(Data Science)的沉要钻研方向。
大数据的概想正本出自以谷歌为代表的新一代IT公司,利用数据密集型复杂挖掘技术处置海量数据,并创造惊人价值的景象,缔造之初就颇有“沙里取金”的夺人眼球的成效。
美国当局岁首颁发的“Big Data Initiative”,更是将其造成蕴含中国在内的全球列国炙手可热的新“掘金点”,Map Reduce迅速成为学术界、产业界反复炒作渲染的盛行词汇。
“大数据”技术来自搜索、电子商务、科学推算等领域持久与海量数据打交路所堆集下的经验堆集,目前尚不存在公认的基础理论和解决规划。要真正理解大数据,用好大数据,必须跳出现有概想的窠臼,一方面从底层数据科学动手,提炼和解答出数据背后的科学问题,寻找数据真正的意思和基础法规;另一方面必要遵循“从实际中来,到实际中去”的准则,在现实利用中相识大数据,钻研分歧领域的数据情况,明确大数据能够创造的主题价值与实现难点。
地理信息是天然大数据
从上世纪60年代诞生之日起,海量数据问题一向是地理信息领域的“阿基里斯之踵”。究其原因,重要是两方面:
第一,地理科学面对的是一个复杂巨系统。1986年钱学森院士在现代人类知识系统将地理科学综合为天然科学与社会科学之间的桥梁科学,钻研整个地球表表同人类息息有关的大气对流层、岩石圈上部、水圈、生物圈和人类圈环境。由于上至卫星遥感数据、下至地震传感数据,以及我们常见的统计、环境、水利、资源、地皮等领域数据都属于地理数据,所以地理信息技术必要处置的领域广,数据源多,数据类型多样,其数据量巨大是不言而喻的。
第二,地球表表的信息量巨大,感知伎俩多样。以谷歌地图使用Landsat TM影像为例,其空间分辨率为30米,则单一时相全球齐全覆盖其整体数据量约为2TB。2012年底,我国已对成功发射天绘、天链、天拓、遥赣注资源、形象、海洋等多系列卫星,成立起环境与灾害监测预报幼卫星星座,“嫦娥一号”对月观测也获得优良成效,而整个“十二五”期间我国打算发射百余颗卫星。以今年发射成功的资源三号为例,其几何定位精度为30米,沉访周期仅5天,则一年内的基础数据量就可达数百TB。傍边国遥感将来迈入国际上快鸟(Quick Bird)等高分辨率卫星达到1M分辨率的门槛后,则全球单次扫描的遥感影像了局数据量将至少超过1800TB,这对目前的数据处置能力来说是不成设想的,更别说还要思考多波段、多时相、多产品、汗青数据、中央数据、沉叠区、雷达、点云数据等问题。遥感数据之表,北斗定位系统的成立、移动互联网和物联网的急剧发展也会导致蕴含来自车辆、风力、雨量、温度、湿度等各类传感器以及幼我网络活动的高频空间关联信息的数据大水涌入,并且要求急剧处置响应。
地理数据蕴含巨大价值
随着谷歌地球等互联网电子地图的遍及,目前公家已逐步接受并熟悉了地位服务(LBS)、地图浏览查问、车辆导航等地理信息服务。地理信息已经创造了巨大的价值,但这只是诸多地理信息利用的冰山一角。
无论是遥感数据、物联网传感器数据、地图数据还是幼我网络活动数据,都能够看作是地理天然与人文环境的采样与纪录,只有使用相宜的分析步骤就可揭示其蕴含在背后的深刻而复杂的社会天然意思。
地理信息系统善于于进行空间分析及与其他领域模型的关联分析。例如:
利用遥感数据再分类的特点鉴别与提取技术,可急剧提取地表的水域、农田、城区、构筑等,对农业估产、城市规划蹬爪器拥有沉要作用; 城市传感器数据的建模、分析可用于相识区域温度、PM2.5等指标真实散布,辅助敌灾市民进行出行活动决策;将政区与耕地数据集进行叠加,通过格网分析即可急剧统计行政区域内的耕地面积,这对于地皮红线节造拥有沉要参考作用;空间关系分析针对当前互联网中产生的大量签到信息进行商区聚类分析,从而援手贸易选址、告白优化;网络分析更是利用宽泛,从现代物流仓储选址、配货调度,到公路网,铁路网、电力网、市政管网等设施的优化治理调度,再有水系分析,治理、应急、导航蹊径分析、交通规定处置等等,都是网络分析的用武之地;而时空分析则可用于区域环境变动监测,急剧发现地皮、构筑、气温、环境、水文的变动,从而积极响应。
目前国内地理信息产业成立了从数据出产、软件平台、利用服务的全产业链,上游有四维图新等专业图商;中游有超图软件等地理信息软件平台商;下游有世界图、百度地图、超图云服务等服务商。地理信息技术不仅已成功利用于水利环保、能源矿产、形象环保、河山房产等行业中,并且成为国度数字城市与智慧城市建设的主题平台。
大数据时期下,地理信息产业挑战与机缘并存。不仅需腹地理信息系统数据采集、筛选、存储、分析与显示技术的升级,并且要彻底旋转传统地理信息系统器沉数据治理与显示,不放在眼里数据分析的情况。大数据的意思只有将地理信息产业的主题关注转移到用户价值上之后能力得到体现,不然大数据不如幼数据,由于实现同样的价值前提下前者成本只会更高。
但是,若是在大数据海潮下,地理信息产业能够实现一次升级,那么就不仅意味着产业链高低游的齐全沉构,并且能够在物联网、移动互联网、河山、环保、水利领域,分析挖掘其纷繁数据的空间意思,产生巨大的经济社会价值。
三个关键问题亟待解决
“问渠那得清这样,为有源头活水来。”地理信息动态重大的数据流代表着一个巨大的价值宝藏,基于地理信息技术从多源大数据中获取对天然与人文环境的知识,从而提高当局、贸易与幼我生涯效能的美好将来并不遥远。要实现这一指标,有几个问题亟需解决:
一是钻研地理信息合用的大数据技术。目前盛行的MapReduce等技术只能看做是大数据技术示范,相比传统散布式推算、并行推算技术其合用的领域较窄,难以提高GIS中大部门运算效能,所以处置地理信息大数据必须成立自身的大数据技术系统。
二是解放沉睡的数据。大数据产业必要各个领域的数据融合能力更真实地对世界建模分析。美国当局已遵循Government 2.0建设理想颁布了Data.gov 网站,截至2012年11月已提供了来自联国当局各部门的392590个数据与工具,其中蕴含空间数据服务386429个;欧洲也相应提出Inspire打算。固然中国目前也推出了北京市敌灾数据资源网,推动蕴含地理信息数据在内敌灾数据资源的对表服务,但是各个部门行业数据被闲置、堆积、浪费而不共享的情况依然极度严沉,严沉造约了行业与利用的发展。
三是产学研结合,跨领域合作。大数据产业要成功,就必须实现从数据到知识再到价值的整个加工流程,这就必须充分融合企业和科研院所的各自优势。
此表,大数据分析是一个多领域知识结构化集成的了局,所以必须提倡跨领域合作。

关注公家号
关注抖音号
