教学工作的资源分享

第四章-GIS空间数据管理分解

icve智慧职教

icve智慧职教

第四章空间数据管理学习目标:

掌握数据的层次单位理解数据之间的逻辑关系了解常用的数据文件理解数据库的基本概念了解数据库的特征和结构了解数据库管理系统、数据安全和数据更新理解传统的数据库模型

重点:数据库模型的分类和特点难点:面向对象的数据库模型第四章空间数据管理数据分层结构和文件组织空间数据库

传统的数据库模型面向对象的数据库系统数据管理设计第四章空间数据管理

建立数据库不仅是为了存储数据和扩展人的记忆,而且主要是为了为了让人们能够管理和控制与这些数据相关的事情东西。 地理信息系统的数据库是专门化的数据库由于这种数据库具有明显的空间特征,有人将其是空间数据库。定义:数据库是为了一定的目的,在计算机系统中尤指的结构组织、存储、管理和APP应用相关的数据集。计算机数据管理经历了三个阶段。

方案管理阶段、文件管理阶段、数据库管理阶段第一节数据分层和文件组织数据库中的数据组织包括数据项、记录、文件和数据库。1、数据项:可定义数据的最小单位,又称元素、基本项目、字段等。2、记录:由若干相关数据项组成。

3、文件:文件是某一类型(逻辑)记录中所有具体值的聚在一起。

4、数据库:是大于文件的数据组织。 数据库是特定的连接数据的集合也可以认为是具有特定连接的多个种类类型记录的集合。 数据库的内部结构是文件的集合这些文件之间有某种联系,不能孤立存在。如何组织数据库中的数据第一节数据分层和文件组织

数据层次结构(数据项、记录、文件、数据库) )数据之间的逻辑联系(一对一、一对多、多对多) )。一般数据文件(顺序、直接、索引、排序文件) ) ) )。文件记录

数据项目

数据项的逻辑数据单位之间的关系物理单位:位、字节、字、块、物理记录、桶、卷逻辑单元:数据项、数据项组、记录、文件和数据库一.数据分层单位一.数据分层单位

1 .数据项、数据项组

数据项是定义数据的最小单位,也称为元素、字段等。用来表示物体属性的,是最基本的不可分割的数据单位。 具有独立的逻辑意义。数据项的值包括数字、字母、字母数字和

汉字的形状等。 数据项的物理特征是具有特定的东西理事长一般用字节数来表示。 几个字节构成一个字,字是计算机进行算术运算的基本单位。一些数据项可以构成诸如日期数据等数据项的组项目可以由数据项“年”、“月”、“日”构成。 数据项目组也可以有自己的名字,可以作为数据项来看。一.数据分层单位2 .记录

记录是数据项的命名集合。 那是关于一个真相身体数据的总和,是有意义的信息的集合,被制作文件访问操作的基本单位。

为了唯一地识别每个记录,需要记录的识别信息。也称为关键字。 记录标识符通常是记录中的前几个据项负责人说,识别记录的唯一关键词被称为主关键词。识别记录的关键字称为辅助关键字。一.数据分层单位3 .文件

文件是特定类型逻辑记录的所有具体内容值的集合。 用文件名识别。 用简单的句子中,每个逻辑记录包含相同数量的数据项。在复杂的文件中,由于重复组的存在,每个记录记录不同数量的数据项。一.数据分层单位4 .数据库

是比文件更大的数据组织

具有特定联系的多种类型记录的集合。 数据库的内部结构是文件的集合,位于这些文件之间有某种联系,不能孤立地存在。数据项目数据项组记录

文件

数据库

最基本的不可分割的数据表比特具有独立的逻辑意义逻辑上有某种共同的标志由几个数据项构成数据项或数据项组的集合、文件执行访问操作的基本单位指定类型的所有逻辑记录卷值的集合是文件的集合,文件之间存在某种联系。不能孤立地存在

二.数据之间的逻辑关系1 .一对一联系(1:1)。

这是一个相对简单的联系方式,意味着它将被保存在集合a中在一个元素i中,集合b中只有一个bj和一个bj取得联系。 在1:1的联系中,一个集合中的元素可以被识别另一个集合的元素。 例如,地理名称和相应的空间位置的关系是一对一的联系。••••••

A BA B1:1二.数据之间的逻辑关系

2 .一对多的联系(1:N ) ) ) ) )。在现实生活中一对多的联系很常见。 如图所示,这种联系如果集合a中存在i,则可以表现为集合b中存在子集联系b’=(bj1,bj2,bjn )。 通常,b’是b的子集。 行政区划具有一对多的联系,一个省对应多个市,一个市对应多个市县,一个县又有许多乡。••••••

A BA B•••

1:N

二.数据之间的逻辑关系

3 .多对多的联系(M:N ) )。

这是现实中最复杂的联系,针对集合a中的一个要素i,集合b中存在子集b’=(bj1,bj2,bjn )。 反措施这里,相对于b集合中一个要素Bj,集合a中有一个集合与a’=(i1,i2,i3,im )相关联,即与M:N相关联。 地理实体中多对多的联系有很多。 例如,土壤类型和种植的作物之间有多少对联系多,种同样的土壤类型不同的作物,同一种作物又可种植在不同的土壤类型上。••••••

A BA B•••

M:N•

三、常用数据文件 顺序文件 随机文件索引文件倒排文件它是物理顺序与逻辑顺序一致的文 件顺

序文件随机文件索引文件倒排文件

文件中的贮存是根据记录关键字的值,通过某种转换方法得到一个物理存贮位置,然后把记录存贮在该位置上。三、常用数据文件顺序文件随机文件索引文件倒排文件

科文教务系统

科文教务系统

三、常用数据文件顺

序文件随机文件索引文件倒排文件

按照一些辅关键字来组织索引称为辅索引,带有这种辅索引的文件称为倒排文件。三、常用数据文件第二节 空间数据库一、数据库的概念

数据库是随着计算机的迅速发展而兴起的一门新学科。通俗的讲,数据库是以一定的组织形式存贮在一起的互相有关联的数据的集合。但这种数据集合不是数据的简单相加,而是对数据信息进行重新组织,最大限度的减少数据冗余,增强数据间关系的描述,使数据资源能以多种方式为尽可能多的用户提供服务,实现数据信息资源共享。随着数据信息资源的多用户服务,以及用户对信息数据多种方式(如检索、分类、排序等)访问的需求,人们又研制了数据库管理系统(管理和控制程序软件)。

数据库是由两个最基本的部分所组成:一是原始信息数据库,即描述全部原始要素信息的原始数据,也是数据库系统加工处理的对象;二是程序库,即数据库软件,它存放着管理和控制数据的各种程序,是数据库系统加工处理的手段。数据存储数

据库

数据管理程序库

(数据库软件)原始信息数据库

二、数据库的特点

与文件管理相比,空间数据库有如下特点:1.实现数据集中管理和共享2.减小了数据冗余3.数据的独立性4.复杂的数据模型5.数据保护特性三、两种不同类型的数据库1.事务管理数据库

数据描述的是人、事、物一类的社会信息,由此类数据建成的数据库反映的是事物属性之间的抽象逻辑关系,它们的记录方式主要是文本和数表文件,在内容和形式上有较强的通用性,所以也把这种侧重于事务管理的数据库称为通用数据库。2.空间数据库

它描述的是地理要素的属性关系和空间位置关系。在空间数据库中,数据之间除了抽象的逻辑关系外,还建立了严谨的空间几何关系。总之,事务管理数据库是通用性较强的数据库,可以把它看作数据库技术入门的基础;空间数据库是具有空间定位特点的数据库,是地理信息系统的重要组成部分,也是我们研究的主要对象。概念模型物理数据库

外部模型A 外部模型B

用户A1 用户A1 用户B1 用户B1数据库管理系统

外部/概念映射A 外部/概念映射B概念/内部映射四数据库的系统结构

外部模式 外部模式概念模式内模式

四、数据库的系统结构

数据库是一个复杂的系统,数据库的基本结构分用户级、概念级和物理级三个层次,反映了观察数据库的三种不同角度。(1)用户级 用户使用的数据库对应于外部模式,它是用户与数据库的接口,也就是用户能够看到的那部分数据库,它是数据库的一个子集。(2)概念级 概念数据库对应于概念模式,简称模式,是对整个数据库的逻辑描述,也就是数据库管理员看到的数据库。(3)物理级 物理数据库对应于内模式,又称为存贮模式,内模式是数据在存贮介质上的物理配置与组织,是存放数据的实体,也是系统程序员才能看到的数据库。数据库管理系统是处理数据库存取和各种管理控制的软件,应用程序对数据库的操作全部通过DBMS进行。

五、数据库管理系统

1.数据库管理系统的功能数

据库定义数据库的装入数据管理数据库维护数据库通讯

提供书写各种模式的语言及其支撑软件,并把各种定义信息也存贮于系统之中。它勾画出数据库的框架。1.数据库管理系统的功能数

据库定义数据库的装入数据管理数据库维护数据库通讯应用数据装入数据库a)键盘输入;

b)接受另一个系 统的数据文件1.数据库管理系统的功能数

据库定义数据库的装入数据管理数据库维护数据库通讯运行控制

数据存取、更新数据完整性、有效性数据 共享1.数据库管理系统的功能数

据库定义数据库的装入数据管理数据库维护数据库通讯重新定义

数据重新组织性能监督与分析数据库整理故障恢复1.数据库管理系统的功能数

据库定义数据库的装入数据管理数据库维护数据库通讯操作系统接口处理各种语言接口

远程操做接口处理2.DBMS组成语言处理程序运行控制程序建立与维护程序数据描述语言(DDL)数据操作语言(DML)终端命令解译

系统控制数据存取数据更新并发控制数据完整性数据装入性能监控工作日志重新组织数据转储系统恢复SQL语言:数据查询

Data Query数据定义

Data Definition数据操纵Data Manipulation数据控制Data ControlOS

DBMS应用程序工作区系统缓冲区数据库

应用程序的外部模型模式存储模式(6)(3)

3.应用程序对数据库的访问六、数据字典

数据字典是数据库应用设计的重要内容。数据字典是描述数据库中各种数据属性与组成的数据集合,它是数据库设计和管理的有力工具。数据字典的内容包括:①.数据库的总体组织结构;

②.数据库总体设计的框架(如数据来源、地图投影、图幅匹配、拓扑关系等);

③.每个数据层的详细内容定义及结构(名称、类型、数据质量、文件、表、各表项的定义、各层编号系统、各层数据的使用等);④.数据命名的定义;⑤.元数据内容。七、数据安全

1.数据存贮安全

空间数据在信息系统内以文件或数据库方式存贮,为了防止信息被泄漏或信息丢失,必须采取有效措施对存贮数据加以保护。(1)文件加密(2)数据库加密2.数据存取控制

3.数据传输的安全与保密4.计算机病毒的预防与清除5.数据备份第三节传统数据库模型

数据模型是数据库系统中关于数据和联系的逻辑组织的形式表示。

每一种数据模型都以不同的数据抽象与表示能力来反映客观事物,有其不同的处理数据联系的方式。数据库领域采用的数据模型有层次模型、网状模型和关系模型,其中应用最广泛的是关系模型。第三节传统数据库模型1. 关系模型2. 层次模型3. 网状模型

关系模型是一种数学化的模型,它是将数据的逻辑结构归结为满足一定条件的二维表。实体本身的信息以及实体之间的联系均表现为二维表,在数学上把这种二维表叫做“关系”。这些关系表的集合就构成了关系模型。关系模型主要优点是:数据结构灵活、清晰,可以通过数学运算进行各种查询、计算和修改;数据描述具有较强的一致性和独立性。缺点是当关系很复杂时,计算机需要执行一系列的数据操作,比较费时。一、关系模型属性

实体 A1 A2 A3 … AnE1 V11 V21 V31 … Vn1E2 V12 V22 V32 … Vn2E3 V13 V23 V33 … Vn3Em V1m V2m V3m … Vnm………………关 系 结 构 表关 系 结 构 表Ⅰ Ⅱ

123456abcdefgMM Ⅰ ⅡⅠ

Ⅱacbecf gd

国家教学资源库

国家教学资源库

Ⅱ gb 2f 56 43e 3 56

d 4 1c 3 4地图多边形线

1 x1 y12 x2 y23 x3 y34 x4 y45 x5 t56 x6 y6点

关系数据库模型是以记录组或数据表的形式组织数据,以便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。从数据结构的观点看,层次模型采用的是树数据结构。层次模型所表达的基本联系是一对多的关系,或者当实体具有父子关系时,它把数据按其自然的层次关系组织起来,以反映数据之间的隶属关系。

层次模型中的记录都处于一定的层次上。如果把层次模型中的记录按照先上后下、先左后右的次序排列,就得到一个记录序列,称为层次序列码。层次序列码指出层次路径,按照层次路径存贮和查找纪录,是层次模型实现的方法之一。层次模型的优点是模型层次分明、结构清晰,较容易实现。缺点是数据的冗余度大,不适于表示数据的拓扑关系。二、层次模型12233441ab

cd3

43554cefⅠⅡM二层次模型a

dcfeb1243ⅠⅡ5M

网状模型基本特征是在记录之间没有明确的主从关系,任何一个记录可与任意其他多个记录建立联系,与层次模型相比较,大大压缩了数据的存贮量。可以表示实体的多种关系更为灵活,对确定的数据表示效率高,冗余小,表示关系复杂的地理数据和具有网络特征的地理实体效果较好。但网状结构数据指针比较复杂,数据更新较为繁琐。关系模型、层次模型和网络模型是表示实体之间联系的不同方法,不同模型不是完全独立的,而是具有某种联系,因而它们之间是可以互相转换的。

三、网状模型

网络模型用连接指令或指针来确定数据间的显式连接关系,是具有多对多类型的数据组织方式 。三、网状模型系名

化学系

教师数 学生数 研究生 系名地质系教师数49

学生数257研究生71学校名称贵州大学系名林学系教师数52

学生数300研究生70

系名 教师数 学生数 研究生 系名 教师数 学生数学号002312姓名

张三年级3籍贯

广东 系名 教师数 学生数 研究生 系名 教师数 学生数教师号66姓名

谢元礼年龄30职称教授

系名 教师数 学生数 研究生 系名 教师数 学生数课程号A01课程名GIS周学时4

学分

系名 教师数 5系名学号

002312课程号A01

a b c d1 2 3 4 5e fⅠ ⅡM

三、网状模型结构adcfeb1243Ⅰ Ⅱ 5M

三、网状模型结构优点:

能明确而方便地表示数据间的复杂关系数据冗余小缺陷:

网状结构的复杂,增加了用户查询和定位的困难。需要存储数据间联系的指针,使得数据量增大数据的修改不方便(指针必须修改)第四节 面向对象数据库系统⚫ 传统数据库管理地理空间数据的局限性⚫ 面向对象方法中的基本概念

⚫ 面向对象方法的数据抽象技术和数据抽象工具⚫ 面向对象的集合抽象类型⚫ 面向对象的属性数据模型⚫ 面向对象数据库系统的实现一、传统数据库管理空间数据局限性⚫ 传统数据库系统管理的是不连续的、相关性较小的数字和字符

⚫ 传统数据库系统管理的实体类型较少,并且实体类型之间通常只有简单、固定的空间关系⚫ 传统数据库系统存贮的数据通常为等长记录的原子数据⚫ 传统数据库系统只操纵和查询文字和数字信息二、面向对象数据模型的优点

(1)具有表示和构造复杂对象的能力。(2)封装性和信息隐蔽技术提供了模块化机制。(3)继承和类层次技术提供了重用机制。(4)滞后束定等技术为系统提供了扩充能力。三、面向对象数据库系统

面向对象(object-oriented,oo)的概念起源于程序设计语言——面向对象的编程语言(简称OOPL),强调对象概念的统—,引入对象、对象类、方法、实例等概念和术语,采用动态联编和单继承性机制。它以OOPL为核心,集各种软件开发工具为一体,建立OO计算环境,配有很强的图形功能和多窗口用户界面。基本出发点就是以对象作为最基本的元素,尽可能按照人类认识世界的方法和思维方式来分析和解决问题。

 对象:是对客观世界实体的抽象描述,由信息(数据)和对数据的操作组合而成。 类:是对多个相似对象共同特性的描述。

 消息:是对象之间通信的手段,用来指示对象的操作。分公有消息和私有消息。 方法:是对象接收到消息后应采取的动作序列的描述。 实例:是由一特定类描述的具体对象。 元类:是相似的类的共同属性的抽象,元类的实例是类,类的实例是对象。对象具有封装性和继承性,涉及到分类(classification)、概括

(generalization)、聚集(aggregation)、联合(association) 、继承(inheritance)和传播(propagation)等概念。基本概念基本概念

⚫ 协议:是一个对象对外服务的说明,它告知一个对象可以为外界做什么。⚫ 封装:是将某件实物包围起来,使外界不必知道其实际内容。

⚫ 继承:从某类对象得到另一类对象的特征和能力。如饭店子类从建筑物类继承地址、建筑日期等属性。引入类的继承,就出现了类的层次结构,也就有了超类(基类)、子类(派生类)的概念。基本概念概括:是把一组具有相同特征和操作的对象归纳在一个更一般的超类中。

联合:是相似对象的抽象组合,可看作是更高层次的集合对象。如贵阳市是云岩区、南明区、花溪区等区的联合。聚集:是类似于联合的抽象化概念,不强调整个对象的具体细节,例如建筑物是墙、窗、门、房顶和楼板几部分的聚集。

传播:作为联合和聚集的一种工具,通过一种强制性的手段将子对象的属性信息传递给复杂对象。例如贵阳市大学生数量可以由各个大学的学生数求和派生得到。面向对象的几何抽象类型GIS中的各种地物,在几何性质方面不外乎表现为四种类型,即点状地物、线状处物、面状地物以及由它们混合组成的复杂地物,因而这四种类型可以作为GIS中各种地物类型的超类。空间地物

点状地物 线状地物 面状地物 复杂地物电视塔桥梁车站道路水管电力线建筑物湖公园矿山大学县面向对象的属性数据模型

GIS中的地物可根据国家分类标准或实际情况划分类型。如一个大学GIS的对象可分为建筑物、道路、绿化、管线等几大类,地物类型的每一大类又可以进一步分类,如建筑物可再分成教学楼、科研实验楼、行政办公楼、教工住宅、学生宿舍、后勤服务建筑、体育楼等子类,管线可再分为给水管道、污水管道、电信管道、供热管道、供气管道等,另一方面,几种具有相同属性和操作的类型可综合成一个超类。面向对象数据库系统的实现方式

面向对象的数据模型从概念上将人们对GIS的理解提高到了一个新的高度。另一方面,面向对象数据模型在表达和处理属性数据时,又具有许多独特的优越性。目前,采用面向对象数据模型,建立面向对象数据库系统,主要有三种实现方式:

⚫ 扩充面向对象程序设计语言(OOPL),在OOPL中增加DBMS的特性⚫ 扩充RDBMS,在RDBMS中增加面向对象的特性⚫ 建立全新的支持面向对象数据模型的OODBMS第五节 数据管理设计⚫ 数据管理设计的目的是确定在数据管理系统中存储和检索数据的基本结构,其原则是要隔离数据管理方案的影响,不管该方案是普通文件、关系数据库、面向对象数据库或者是其他方式的。⚫ 目前,主要有三种数据管理方法,即文件、关系及文件结合关系数据库管理和面向对象。

第五节 数据管理设计一、文件管理

⚫ 文件管理是将所有的数据都存放于一个或者多个文件中,包括结构化的属性数据。

⚫ 采用文件管理数据的优点是灵活,即每个软件厂商可以任意定义自己的文件格式,管理各种数据,这一点在存储需要加密的数据以及非结构化的、不定长的几何体坐标记录时是有帮助的。⚫ 文件管理的缺点也是显而易见的,就是需要由开发者实现属性数据的更新、查询、检索等操作,利用文件管理增加了属性数据管理的开发量,并且也不利于数据共享。第五节 数据管理设计二、关系数据库管理

⚫ 在这种管理方式中,不定长的空间几何体坐标数据以二进制数据块的形式被关系数据库管理 。目前,关系数据库不论是理论还是工具,都已经成熟,它们提供了一致的访问接口(SQL)以操作分布的海量数据,并且支持多用户并发访问,安全性控制和一致性检查。⚫ 采用全关系空间数据管理,由于几何体坐标数据不定长,会造成存储效率低下,此外,现有的SQL并不支持空间数据检索,需要软件厂商自行开发空间数据访问接口,如果要支持空间数据共享,则要对SQL进行扩展。第五节 数据管理设计三、文件结合关系数据库管理

这是目前大多数GIS软件所采用的数据管理方案。考虑到空间数据是非结构化的、不定长的,而且施加于空间数据的操作需要GIS软件实现,这样就可以利用文件存储空间数据,而借助于已有的关系数据库管理系统管理属性数据。第五节 数据管理设计

四、面向对象数据库(OO-DBMS)管理如果应用面向对象数据库管理GIS空间数据,则可以扩充对象数据库中的数据类型以支持空间数据,包括点、线、多边形等几何体,并且允许定义对于这些几何体的基本操作。这样,通过面向对象数据库管理系统,提供了对于各种数据的一致的访问接口以及部分空间模型服务,不仅实现了数据共享,而且空间模型服务也可以共享,使GIS软件可以将重点放在数据表现以及开发专业模型上。地理数据库的设计过程定义数据库结构了解用户需求

确定研究区域范围组织和描述数据分区数据输入

标签

Tag