摘要:随着空间数据采集技术的飞速 展开 ,复杂多样的空间数据日益收缩,迫切需求更新数据开掘的学问和方法。文章从空间数据开掘的基本概念动身,阐述了空间数据开掘的类型与过程,引见了空间数据开掘在GIS中的应用,分析了当前空问数据开掘面临的问题,并对空间数据开掘技术的展开中止了展望。
关键词:空间数据开掘;天文信息系统;研讨分析
随着数据采集技术的成熟和进步,大量的空间数据经过遥感、天文信息系统、多媒体系统、医学和卫星图像等多种方式汇集成庞大而丰厚的信息源。面对庞杂、繁多的数据类型,空间数据开掘技术应运而生,并在天文信息系统、遥感勘测、图像处置、 交通 管理、环境研讨等范畴得到普遍应用。
1 空间数据开掘研讨概述
空间数据开掘(spatial Data Mining,简称SDM),是指从空间数据库中提取用户感兴味的空间方式、普遍关系、数据特征的过程。空间数据开掘技术综合数据开掘技术与空间数据库技术,可用于对空间数据的理解、空间关系和空间与非空间关系的发现、空间学问库的构造以及空间数据库的重组和查询的优化等,其根本目的是把大量的原始数据转换成有价值的学问,发现大量的地学信息中所隐含的规则。
空间数据开掘是 计算 机技术、数据库应用技术和管理决策支持技术等多学科交叉展开的新兴边缘学科,普通来说,空间数据开掘可分红空间分类、空间聚类、空间趋向分析和空间关联规则四类。空间分类的目的是在空间数据库对象的空间属性和非空间属性之间发现分类规则,是近年来空间数据开掘范畴中比较生动的一个方向,常用的方法是决策树。空间聚类是在一个比较大的多维数据集中根据距离的度量找出簇或稠密区域,目前提出的空间聚类方法有基于分割的方法、基于层次的方法、基于密度的方法和基于棚格的方法。空间趋向分析指分开一个给定的起始对象时非空间属性的变化情况,例如,当离城市中心越来越远时 经济 形势的变化趋向,空间趋向分析需求运用回归和相关的分析方法。空间关联规则是指空间邻接图中对象之间的关联,空间关联开掘多采用逐步求精的优化思想,即首先用一种快速的算法粗略地对初始空间数据库中止一次开掘,然后再在裁剪过的数据库上用代价高的算法中止进一步精化开掘。
空间数据开掘过程普通可分为数据选择(消弭原始数据的噪声或不分歧数据)、数据集成(将多种数据源组合在一同)、数据选择(根据用户的恳求从空间数据库中提取与空间数据开掘相关的数据)、数据变换(将数据统一成适宜开掘的方式)、空间数据开掘(运用选定的学问发现算法,从数据中提取用户所需的学问)、方式评价(根据某种兴味度度量并识别表示学问的真正有趣的方式),学问表示(运用可视化技术和学问表示技术,向用户提供开掘的学问)等阶段(见图1)。空间数据开掘理论上是一个“人引导机器,机器辅佐人”的交互理解数据的过程。
2 空间数据开掘在GIS中的应用
空间数据开掘技术与天文信息系统(GIS)的别离具有非常普遍的应用空间。数据开掘与GIs集成具有三种方式:其一为涣散耦合式,也称外部空间数据开掘方式,这种方式基本上将GIS当作一个空间数据库看待,在G IS环境外部借助其它软件或计算机言语中止空间数据开掘,与GIS之间采用数据通讯的方式联络。其二为嵌入式,又称内部空间数据开掘方式,即在GIs中将空间数据开掘技术融合到空间分析功用中去。第三为混合型空间模型法,是前两种方法的别离,即尽可能应用GIS提供的功用,最大限度的减少用户自行开发的工作量和难度,又可以坚持外部空间数据开掘方式的灵活性。
应用空间数据开掘技术可以从空间数据库中发现如下几种主要类型的学问:普遍的几何学问、空间分布 规律 、空间关联规律、空间聚类规则、空间特征规则、空间区分规则,空间演化规则、面向对象的学问。目前,这些学问已比较成熟地应用于军事、土地、电力、电信、石油和自然气、城市规划、交通运输、环境监测和维护、110和1 20快速反响系统等资源管理和城市管理范畴。在市场分析、 企业 客户关系管理、银行保险、人口统计、房地产开发、个人位置效劳等范畴也正得到普遍关注与应用,理论上,它正在深化到人们工作和生活的各个方面。
3 空间数据开掘面临的问题
(1) 多数空间数据开掘算法是由普通的数据开掘算法移植而来,并没有思索空间数据存储、处置及空间数据本身的特性。空间数据不同于关系数据库中的数据,它有其特有的空间数据访问方法,因而传统的数据开掘技术常常不能很好地分析复杂的空间现象和空间对象。
(2) 空间数据开掘算法的效率不高,发现方式不精练。面对海量的数据库系统,在空间数据开掘过程中呈现不肯定性、错误方式的可能性和待处置问题的维数都很大,不只增大了算法的搜索空间,也增加了盲目搜索的可能性。因而必需应用范畴学问发现、去除与任务无关的数据,有效地降低问题的维数,设计出更有效的学问发现算法。
(3) 没有公认的标准化空间数据开掘查询言语。数据库技术飞速 展开 的缘由之一就是数据库查询言语的不时完善和展开,因此,要不时完善和展开空间数据开掘就必需展开空间数据开掘查询言语。为高效的空间数据开掘奠定基础。
(4) 空间数据开掘学问发现系统交互性不强,在学问发现过程中很难充分有效天时用范畴专家学问,用户不能很好掌控空间数据开掘过程。
(5) 空间数据开掘方法和任务单一,基本上都是针对某个特定的问题,因而能够发现的学问有限。
(6) 空间数据开掘与其他系统的集成不够,忽视了GIS在空间学问发现过程中的作用。一个方法和功用单一的空间数据开掘系统的适用范围必然遭到很多限制,目前开发的学问系统仅局限于数据库范畴,假设要在更宽广的范畴发现学问,学问发现系统就应该是数据库、学问库、专家系统、决策支持系统、可视化工具、 网络 等多项技术集成的系统。
上述问题使得从空间数据库中提取学问比从传统的关系数据库中提取学问更为困难,这给空间数据开掘研讨带来了应战。因此,空间数据开掘在未来的展开中,还有很多理论和方法有待深化研讨。
4 空间数据开掘的展开趋向
(1)空间数据开掘算法和技术的研讨。空间关联规则开掘算法、时间序列开掘技术、空间同位算法、空间分类技术、空间离群算法等是空间数据开掘研讨的热点,同时进步空间数据开掘算法的效率也很重要。
(2) 多源空间数据的预处置。空间数据内容包括数字线划数据、影像数据、数字高程模型和地物的属性数据,由于其本身的复杂性与数据采集的困难,空间数据中不可避免地存在着空缺值、噪声数据及不分歧数据,多源空间数据的预处置就显得格外重要。
(3)其他各种空间数据开掘及其相关技术研讨。如网络环境下的空间数据开掘、可视化数据开掘、栅格矢量-体化空间数据开掘、背景学问概念树的自动生成、基于空间不肯定性(位置、属性、时问等) 的数据开掘、递增式数据开掘、多分辨率及多层次数据开掘、并行数据开掘、遥感图像数据库的数据开掘、多媒体空间数据库的学问发现等。
5 小结
空间数据开掘可从大型空间数据库中提取感兴味和 规律 性的学问,可用于理解空间数据、发现空间数据与非空间数据的关系、树立空间学问库、优化查询,重组空间数据库等,空间数据开掘技术在广度和深度上的不时进步, 也将使GIs集成系统朝着智能化、网络化、全球化与大众化的方向展开。可以预见,空间数据开掘不只会促进空间 科学 、 计算 机科学的展开,而且必将增强人类认识世界、改造世界的才干,从而更好地效劳人类社会。 转载于 原上草职称论文网 www.yscbook.com
(教育.经济.管理.医学.计算机.文学.社科类)核心期刊,国家级,省级期刊,大学学报征稿,职称论文写作指导,快速发表!投稿邮箱:sccdysc@vip.163.com 咨询QQ:597400683 联系电话:13880243186(王老师)
|