第一篇:空間數據庫知識點總結
空間數據庫知識點總結
1、數據:指客觀事物的屬性、數量、位置、及其相互關系等的符號描述。
2、信息:是數據的內容,信息=數據+數據處理
3、空間數據:是對空間事物的描述,實質上是指以地球表面空間位置為參照,用來描述空間實體的位置、形狀、大小及其分布特征諸多方面信息的數據。是帶有空間坐標的數據,包括文字、數字、圖形、影像、聲音等多種方式。
4、數據庫:長期儲存在計算機內的、有組織、可共享的數據集合。
5、空間數據庫是指描述與特定空間位置有關的真實世界對象的數據集合。
6、空間數據類型:地圖數據、影像數據、地形數據、屬性數據
7、空間數據特征:時空特征、多維特征、多尺度性、海量數據特征
8、空間數據庫的作用:①空間數據處理與更新②海量數據存儲與管理③空間分析與決策④空間信息交換與共享。
9、空間數據管理模式現狀(五種方式):文件管理方式、文件與關系數據庫混合型空間數據庫、全關系型空間數據庫、對象-關系型空間數據庫和面向對象空間數據庫。
10、空間數據模型現狀(三維數據結構分類):基于體描述的和基于面表示的數據模型及三維矢量、柵格、混合與面向對象的數據結構。
11、與傳統數據庫的差異:①信息描述差異②數據管理差異③數據操作差異④數據更新差異⑤服務應用差異。
12、空間認知:是對現實世界的空間屬性包括位置、大小、距離、方向、形狀、模式、運動和物體內部關系的認知,是通過獲取、處理、存儲、傳遞和解譯空間信息,來獲取空間知識的過程。
13、空間類型表現形式:①感知空間②認知空間③符號空間④物理空間⑤感覺運動空間。
14、空間認知模式:①空間特征感知:空間特征感知發生于感知空間;②空間對象認知:空間對象認知發生于認知空間;③空間格局認知:空間格局認知發生于符號空間。
15、現實世界認知過程:現實世界(是存在于人們頭腦之外的客觀世界)觀察抽象為概念世界(是現實世界在人們頭腦的反應)在經過定義編碼模型化為數字世界(是概念世界中的信息數據化)。
16、空間認知三層模型:①空間概念數據模型:是關于實體與實體間聯系的抽象概念集,有矢量數據模型、柵格數據模型,矢量-柵格一體化數據模型②空間邏輯數據模型:表達概念模型忠數據實體及其間關系,常用的有層次模型、網絡模型和關系模型③物理數據模型:描述數據在計算機中的物理組織、存儲路徑和數據庫結構。
17、空間實體:空間數據中不可再分的最小單元現象。分為點實體(表示零維空間實體)、線實體(表示一維空間實體)、面實體(表示二維空間實體)、體實體(表示三維空間實體)。
18、矢量數據描述特點:矢量方法強調離散現象的存在,把現實世界的空間實體抽象地看作是由平面上的點、線、面三種基本空間目標組成。①點:由一對地理坐標定義,可以用來代表位置信息。②線:用一連串有序的兩個或多個坐標對點集合來表達對于本身寬度在研究中可以忽略的線狀空間對象。③面:對于面狀區域則是通過對邊界線的定義來進行的。
19、矢量數據的結構主要有spaghetti結構(ESRI公司的shapefile格式)和拓撲矢量數據結構。
20、拓撲矢量數據結構:最基本的拓撲關系有:關聯、鄰接、包含。拓撲關系表示為:結點拓撲關系、線拓撲關系、多邊形拓撲關系。
21、柵格數據取值方法:中心歸屬法、面積占優法、長度占優法、重要性法。
22、柵格數據存儲方法:全柵格式存儲、鏈式編碼、行程編碼、塊式編碼、四叉樹編碼。
23、空間關系:空間目標之間在一定區域上構成的與空間特性有關的聯系,分為:拓撲關系、度量關系、順序關系。拓撲關系指:拓撲變化下的拓撲變量,如空間目標關聯、相鄰與連通關系;度量關系指:用某種度量空間中的度量來描述的目標間的關系,如長度、大小、面積、體積;方位關系用來描述目標在空間中整體和局部的某種順序關系,如前后、上下、左右等。
24、Geodatabase空間對象模型基本元素:對象類、要素類、要素數據集、關系類、幾何網絡類、Domains、Validation Rules、Raster Dataset、TIN Dataset。
25、TIN模型:由不規則分布的數據點連成的三角網組成,是一種基于三角形的空間鑲嵌模型,三角形的形狀和大小取決于不規則的觀測點或稱結點的密度和位置。
26、LOP優化原則:運用Delaunay三角網的性質對由兩個有一公共邊的三角形組成的四邊形進行判斷。
27、TIN生成的算法:逐點插入法、分治算法、三角形生長法。
28、Grid(規則格網)模型:每個網格的數值有兩種解釋:網格柵格觀點(網格單元的數值是其所有點的高程值)、點柵格觀點(網格單元的數值是網格中心點的高程或平均高程值)。
29、三維空間構模方法:面模型(不規則三角網、網格、線框)、體模型(三棱柱、廣義三棱柱、八叉樹)、混合模型。
30、四面體網格:是將目標空間用緊密排列單不重疊的不規則四面體形成的網格來表示,其實質是2D TIN結構在3D空間上的擴展。
31、文件系統中,數據按其組成分為:數據項、記錄、文件。
32、空間數據庫系統:帶有數據庫的計算機系統,采用現代數據庫技術來管理空間數據。
33、空間數據引擎:是用來解決如何在關系數據庫中存儲空間數據,實現真正的數據庫方式管理空間數據,建立空間數據服務器的方法。
34、空間數據引擎作用:①與空間數據庫聯合,為用戶提供空間數據服務;②提供開放的數據訪問;③SDE對于外提供了空間幾何對象模型。④快速的數據提取和分析;⑤SDE提供了連接DBMS數據庫的借口。⑥與空間數據庫聯合可以管理海量空間信息。⑦無縫的數據管理,實現空間數據與屬性數據統一存儲。⑧并發訪問。
35、空間數據引擎實例:mapinfo公司的spatialWare、arcgis空間數據引擎、supermap的XDSE。
36、ArcSDE的主要功能:高性能的DBMS通道;開放的DBMS支持;多用戶;GIS工作流和長事務處理;豐富的地理信息數據模型;連續、可伸縮的數據庫;靈活的配置。
37、空間數據組織:縱向分層組織、橫向分塊組織。
38、空間索引:在存儲空間數據時,依據空間對象的位置和形狀或空間對象之間的某種空間關系,按一定順序排列的一種數據結構,包含空間對象的概要信息。
39、空間索引分類:樹結構、線性映射、多維空間區域變換。從應用范圍可分為動態索引和靜態索引。典型空間索引技術包括R樹索引、四叉樹索引、網絡索引 40、R樹索引是一種高效的空間索引,是B樹在多維空間的擴展,也是平衡樹。采用空間聚集的方式把相鄰近的空間實體劃分到一起,組成更高一級的結點。
41、R樹索引的特點:典型的R樹索引每個結點所對應的存儲空間和外存頁面或其整數倍想對應,以此提高結點從外存到內存的交換效率。
42、R+樹:是兄弟區域之間沒有重疊的索引方法。特點:兄弟結點對應的空間區域沒有重疊,使空間搜索效率提高。根結點至少有兩個子結點;所有葉結點在同一層;葉結點中數據矩形允許并可能重疊。
43、SQL語言:標準的數據庫查詢語言,用于關系數據庫管理系統的一種常見商業查詢語言,是目前關系數據庫管理系統領域的主流查詢語言。功能:查詢、操縱、定義、控制。
44、關系模型的擴展:突破關系模型中關系、允許定義層次關系和嵌套關系;增加抽象數據類型;增加空間謂詞;增加適合于空間數據索引的方法。
45、關系模型擴展的優勢:可以用統一的DBMS管理圖形和屬性數據;圖形數據管理也可以享用DBMS在數據管理方面帶來的優越性;圖形數據的關系化表達,使其能享用客戶機/服務器的優勢。
46、空間選擇查詢:在地圖上劃出一個區域,查詢該區域內所有空間數據。包括點查詢、區域查詢、最鄰近查詢。
47、空間查詢步驟:過濾篩選步驟、細化步驟。
48、執行查詢分析的類型:屬性查詢、空間查詢、空間分析。
49、元數據:數據的數據。提供關于空間數據的信息,是關于數據和信息資源的描述信息。
50、空間元數據:各類空間數據描述的集合。描述地理信息數據集內容、表示、空間參考、質量以及管理的數據。
51、數據字典:描述數據集中的部分內容。
52、空間數據交換:將一種數據格式轉換為另外某種數據格式的技術。轉換內容包括:空間定位信息、空間關系信息、屬性信息。
53、空間數據交換方式:外部數據交換模式、直接數據訪問模式、基于空間數據轉換標準的轉換、空間數據互操作模式。
54、空間數據庫設計原則:①空間數據庫設計與應用系統設計相結合的原則;②數據獨立性原則;③共享度高、冗余度低原則;④用戶與系統的接口簡單性原則;⑤系統可靠性、安全性與完整性原則;⑥系統具有重新組織、可修改與可擴充性原則。
55、空間數據庫設計過程:需求分析、概念設計、邏輯設計、物理設計、數據庫的實現、數據庫運行和維護。
第二篇:空間數據庫總結
第一章:
1.簡述空間數據的結構特點及用傳統商用關系數據庫管理空間數據的局限性:
答:1.結構特點:(1)從數據組織和管理角度看,空間數據與一般的事務數據相比具有非結構化特征(2)相對于一般的事務數據而言,空間數據量大(3)用以描述事物或現象隨時間的變化2.局限性:(1)表示某種空間對象實體記錄的空間字段難于預先確定(2)空間信息有坐標系統(3)關系數據原有的功能不能滿足地理空間應用要求
2.空間數據管理的演化過程
答:1.人工管理階段(20世紀50年代中期)特點:(1)數據不保存(2)沒有數據管理軟件
(3)數據冗余2.文件系統階段(20世紀60年代中期)特點:(1)數據文件是大量數據的集合形式(2)面向用戶的數據文件(3)數據文件與對應的程序具有一定的獨立性(4)由初期的順序文件發展為索引文件、鏈接文件、直接文件等3.文件與數據庫系統混合管理系統(20世紀80年代初期)特點:(1)對用戶觀點的數據進行嚴格細致的描述(2)允許用戶以記錄或數據項作單位進行訪問(3)數據的物理存儲可以很復雜,同樣的物理數據可以導出多個不同的邏輯文件4.全關系型空間數據庫管理系統(20世紀80年代后期);5.對象關系數據庫管理系統;6.面向對象的數據庫系統
3..空間數據庫的研究內容:
答:1.地理空間數據的獲取與處理:(1)空間數據庫的準確性研究;(2)空間數據質量研究;
2.地理空間數據組織(1)空間數據的多種表達方式研究;(2)時空關系的研究;(3)海量空間數據庫的結構體系研究3.地理空間數據庫系統:(1)空間關系語言研究(2)分布處理和Client/Server模式4.地理空間數據共享的研究
4.松散雙元空間數據管理的結構及其弊端
文件與數據庫系統混合管理系統(20世紀80年代初期)特點:(1)對用戶觀點的數據進行嚴格細致的描述(2)允許用戶以記錄或數據項作單位進行訪問(3)數據的物理存儲可以很復雜,同樣的物理數據可以導出多個不同的邏輯文件
答:
第二章:
1.基于實體空間對象描述的基本特點:
答:基于對象的模型強調個體現象,對象之間的空間位置關系通過所謂拓撲關系進行連接,主要描述不連續的地理現象,適合表示有固定形狀的空間實體
2.基于場模型地理空間描述適應的地理變量的分布特點:
答:分布特點:在一定空間內連續分布。將地理空間的事物和現象作為連續的變量來看待。基于場模型可分為:圖斑模型、等值線模型、選擇模型
3.柵格數據操作的基本類型:
答(1)局部操作;(2)聚焦操作;(3)區域操作;(4)全局操作(5)圖像操作
4.矢量數據向柵格數據轉移的基本算法
答:(1)內部點擴散算法(2)復數積分算法(3)射線算法的掃描算法(4)邊界代數算法
5.矢量數據與柵格數據結構的區別:
答:(1)柵格數據結構具有“屬性明顯,位置隱含”的特點,它易于實現,操作簡單,有利于柵格的空間信息模型的分析,但柵格數據表達精度不高,數據存儲量大,工作效率低;(2)矢量數據結構具有“位置明顯,屬性隱含”的特點,它操作起來比較復雜,許多分析操作(如疊置分析)用矢量數據結構難于實現;但它的數據表達精度高,數據存儲量小,工作效率高。
6.非拓撲辯狀矢量層文件數據組織與拓撲矢量文件數據組織的區別:
答: 非拓撲辮狀矢量層文件的數據組織,它僅記錄空間目標位置坐標和屬性信息,而不記錄它的拓撲關系,它可能有兩種形式,一種是:每個點線面坐標直接跟隨它的空間坐標;另
一種方式是:點坐標作為一個文件,線和多邊形有點號組成。在非拓撲數據組織中,邊界線數據均獲取和存儲兩次,這就會產生裂隙或重疊,并產生數據冗余;為了消除裂隙,一般需要編輯。拓撲矢量層文件數據組織,實際上還僅僅是結點線面之間的關聯拓撲關系,這種關系通常有兩種表達關系:全顯示表達和半隱含表達,全顯示的表達是指結點弧段面塊相互之間的所有關聯拓撲關系,都用關系表顯示的表達出來,關系除了要明確表示出來從上到下的拓撲關系,還要用關系表列出結點弧段面塊之間的關系,但任然沒有包括點與面,面與點的關聯關系,這種關系是以弧段為橋梁建立的;半隱含表達則是用弧段—結點—弧段—面塊的表格表示幾何目標間的拓撲關系,建立空間目標之間的拓撲關系,這樣一來修改面塊—弧段的拓撲關系時,邊界上內點移動只需進行一次,且只需修改弧段坐標數據文件即可,可以方便的實現數據共享問題。
7.簡述線狀網絡數據模型設計的主要幾何對象,并說明其文件組織的基本思想
答:形狀網絡模型主要幾何要素:結點,幾何弧段,邏輯弧段;文件分為結點文件,弧段坐標文件、拓撲關系文件、邏輯網段文件。結點文件記錄坐標、關聯邊、結點其他屬性;弧段坐標文件記錄弧度中間點坐標拓撲關系文件記錄起、終點坐標、坐標指針、其他屬性;邏輯網段文件記錄網段中邏輯關系;結點文件中坐標決定拓撲文件中起、終點,結點中的關聯邊、弧段坐標文件、拓撲關系文件中坐標指針構成邏輯網段文件。
8.簡述基于polyvert的多邊形網絡拓撲數據結構的基本思想
答:polyvert包括結點文件、弧段中間坐標文件,多邊形文件、拓撲文件、拓撲索引文件。結點、弧度中間坐標文件記錄坐標;多邊形文件記錄多邊形弧段序列指針;拓撲文件包括弧段標志號,中間點坐標個數及其指針,起、終點,左、右多邊形;拓撲索引文件記錄地址指針。多邊形文件通過拓撲索引文件與拓撲文件相關聯;拓撲文件通過中間點坐標指針與弧段中間坐標文件相結合,通過起、終點與結點文件相結合。
第四章:
1.簡述數據的邏輯層次單位和物理層次單位,并給出邏輯記錄與物理記錄的定義:
答:(1)邏輯層次單位:數據項、記錄、文件、數據庫、數據倉庫;物理層次單位:bit、字節、字、塊;(2)邏輯記錄:
2.試述邏輯記錄的物理組織形式與各自的特點:
答:(1)定長記錄固定組塊:實現簡單,只須說明塊的體積和記錄的長度(2)變長記錄不跨界組塊:把不同長度的記錄存放到一個塊中,要識別它們就必須給個記錄時加一個長度指示器PR(3)變長記錄跨界組塊:一個記錄在意個塊中存放不下時,可以跨過邊界存到另一個塊中;(4)塊列:將若干個數據塊組成一個塊列,文件系統的軟件一次讀/寫整個塊列,記錄可跨越塊的邊界,但不允許跨越塊列的邊界。
3.在Hash文件組織中,何為碰撞?何為數據溢出?并說明處理桶數據溢出需用的方法 答(1)
5.空間索引的定義。它與傳統文件索引有何不同。對空間數據建立空間索引的目的答(1)空間索引:指依據空間對象的位置和形狀或空間對象之間的某種空間關系,按一定順序排列的一種數據結構(2)不同:
6.空間數據庫的靜態索引和動態索引有何不同,二者具有哪些優缺點。
答:(1)靜態索引是通過建立空間數據庫中的邏輯記錄與物理記錄之間的靜態索引表,使用各種查找算法,查找表結構,從而實現數據文件的索引。靜態索引的實現比較簡單,但修改很不方便,難以實現對數據文件實時的增加或刪除(2)動態索引是在數據操作的過程中動態生成的索引結構。使用動態索引方法可以很方便地實現數據文件實時改動,但索引結構的實現復雜,維護索引結構需要計算時間和空間。
7.從技術層面上,空間索引分為哪幾種形式,并說明每種形式各自特點:
答:(1)對象影射技術:該方法將K維對象轉移成2K維空間上的點(2)對象復制和裁剪技術:將空間劃分為不相交的子空間,并依據子空間的劃分,將落在多個子空間的對象劃分多個組成部分(3)重疊子空間方法:將地圖劃分為可以重疊的子空間,以便每個對象完全落在一個子空間。
8.簡述格網空間索引實施的基本原理。傳統格網索引與改進格網索引的區別:
答:網格空間索引基本原理是:將研究區域用橫豎線條劃分大致相等和不等的網絡,記錄每一個個網所包含的空間實體,當用戶進行空間查詢時,首先計算出用戶查詢對象所在的格網,然后再在該格網中快速查詢所選空間實體。這樣一來,就大大的加速了空間對象的查詢速度。區別:傳統式一維,改進是二維
第五章:
1.在面向對象空間數據模型中,地理要素的幾何抽象類型有哪些形式(拓撲形式與非拓撲形式兩種分析)
答:(1)拓撲形式:結點、弧段、多邊形、多面體
(2)非拓撲形式:點、線、面、表面、體
2.何為空間數據層的工作區?并簡述工作區的無縫數據庫與有縫數據庫的各自特點。
答:(1)工作區:為了使計算機能夠識別和處理地理要素,必須將連續地現實世界中地理實體及相互關系進行離散和抽象,建立若干以地理區域為界的認識地理空間的窗口。(2)無縫數據庫:有統一的坐標系、無縫隙、不受傳統圖幅劃分的限制,整個工作區域在數據庫中相當于一個整體;有縫數據庫:采用分塊存儲管理和處理,以數據塊作為基本單位,一個數據塊構成一個數據存儲單位。
3.在考慮了空間數據庫的分層及分塊情況下,空間物體關系對象有哪幾種形式?每一種形式主要表示何種空間關系?
答(1)結點和弧段之間的網絡關系,弧段和多邊形之間的多邊形關系。數據塊之間的相同空間物體連接關系、要素層之間的相關地理要素連接關系。
5.Coverage矢量數據模型的優缺點?
答:1.優點:(1)空間數據與屬性數據相結點;(2)能夠存儲矢量要素之間的拓撲關系2.缺點:(1)空間數據不能很多的與其行為相對應;(2)以文件方式保存空間數據,而將屬性數據存放在另外的DBMS中;(3)Coverage模型拓撲結構不夠靈活,局部變動后則必須對全局的拓撲關系重新建立;(4)在不同的Coverage之間無法建立拓撲關系。
6.Geodatabase數據模型結構主要涉及到哪些基本組成要素?這種數據模型具有哪些特點? 答:(1)基本組成要素:要素類、要素數據集、關系類、幾何網絡、域、有效規則、柵格數
1在同一數據庫中統一地管理各種類型的空間數據;據集、TIN datasets、定位器(2)特點:○
2.空間數據的錄入和編輯更加準確;3.空間數據更加面向實際的應用領域;4.可以表達空間○○○
5.可以更好的進行制圖;6.空間數據的表示更為準確;7可以管理連續的數據的相互關系;○○○
8支持空間數據的版本管理和多用戶并發操作 空間數據,無需分塊、分幅;○
第六章:
1.空間數據庫的內容組成答:從應用性質上空間數據庫可分為基礎地理空間數據庫和專題數據庫。基礎地理空間數據庫包括基礎地形要素矢量數據(DLG)數字高程模型(DEM)、數字正射影像(DOM)、數字柵格地圖(DRG)以及相應的元數據庫(MD)。專題數據庫(TD)包括土地利用書記、地籍數據、規劃管理數據、道路數據等。
2.何為數據庫的三級模式與兩級映射?數據定義語言的作用及形式
答:1.三級模式:外模式(子模式或用戶模式)、模式(概念模式或邏輯模式)、內模式(存
儲模式);兩級映射:子模式/模式映射、模式/存儲模式映射;2.作用:定義數據的各種特征:形式:(1)模式DDL—定義數據庫的全局邏輯結構;(2)子模式DDL—定義view(視圖);
(3)DML—數據處理;(4)物理DDL—定義數據的物理存儲方式。
3.基于文件系統的空間數據庫體系結構:
答:1.文件組織:(1)定長記錄(2)變長記錄(3)聚蔟文件組織;2.空間數據引擎:基于特定的空間數據模型,在特定的數據存儲、管理系統的基礎上提供對空間的存儲、檢索等操作,以提供在此基礎上的二次開發3.緩沖區管理:
4.基于數據庫管理主流的空間數據庫混合體系結構:
文件與數據庫系統混合管理系統(20世紀80年代初期)特點:(1)對用戶觀點的數據進行嚴格細致的描述(2)允許用戶以記錄或數據項作單位進行訪問(3)數據的物理存儲可以很復雜,同樣的物理數據可以導出多個不同的邏輯文件
5.分步式空間數據庫的模式結構?并說明其全局用戶視圖,全局概念模式,局部內容與數據庫的三級模式有何區別?在該模式的結構中,分布式空間數據庫管理系統與局部空間數據庫管理系統起的作用有何不同?實現多空間數據庫集成需要解決的主要問題是什么?
分步式空間數據庫的模式結構是:模式結構總體可以分為兩部分,一是集中式空間數據庫的模式,代表了各場地上參與空間數據庫系統的基本結構;二是,分布式空間數據庫系統增加的模式。
區別:一個分布式空間數據庫是由若干個已經存在的相關空間數據庫集成的,全局用戶視圖,全局概念模式,局部內容是針對于一個分布式空間數據庫而言的。數據庫的三級模式是針對于一個空間數據庫而言的,全局用戶視圖相當于數據庫的外模式,全局概念模式相當于數據庫的模式,局部內容相當于數據庫的內模式。
在該模式的結構中,對于用戶來說,在分布式空間數據庫管理系統中,智能進行基礎的操作,而不能定義自己的視圖,而在局部空間數據庫管理系統中用戶卻可以定義自己的視圖。實現多空間數據庫集成需要解決的主要問題:一:選擇全局統一的空間數據庫模型來描述全局概念模式和分片模式;二:選擇全局統一的空間查詢語言作為全局系統和用戶交互界面;三:解決分片的異構性,實現局部概念模式到全局分片模式的轉換,即異構同化;四:解決分片沖突問題,構造全局的概念模式,即同構整體化。
第三篇:2012年空間數據庫實習總結
空間數據庫實習總結
經過對空間數據庫的課堂教學的學習,我們對空間數據庫的建立有了理論上的基礎,于十八周進行了空間數據庫的課程設計實習。
此次實習主要在計算機上實現,在ArcCatalog和ArcGIS軟件平臺上進行。旨在讓學生在已基本掌握各種空間數據庫的存貯和管理技術的基礎上,進行空間數據維護和管理的訓練,在GIS原理、空間數據庫理論、常用軟件功能和相關專業知識之間建立起聯系,培養學生具有編寫實習報告的能力。
本實習可加深學生對各種空間數據庫的原理和方法的理解,為后續的GIS軟件設計課程及GIS科學研究打下良好的基礎。
在獨立完成《地理信息系統實習教程》第八篇“空間數據維護與管理”的所有練習后,我們基本上對拓撲規則有一定了解,對建立拓撲關系和應用拓撲關系對數據質量的檢驗的操作方法也有一定了解;對建立Geodatabase數據庫,將CAD的DWG文件轉換成可以被ArcGIS接受的線要素等,進而轉換成多邊形,再生成網格;具體操作了投影變換、坐標變換的練習,進行了坐標轉換、左邊拉伸、接邊、影像配準等等操作;還進行了對數據源和元數據的學習??在此基礎上我們可以建立基本的數據庫Geodatabase。
最后,進行了 “重慶交通大學空間數據庫” 設計,由于缺乏基本數據,所以此次“重慶交通大學空間數據庫”的設計只有基本的思路設計,即需求分析,概念設計(概念模型的建立,即“實體—關系”模型即E-R模型的建立),邏輯設計(邏輯數據模型即關系模型的建立),物理設計(物理數據模型的建立)。
在此次實習過程中,
第四篇:空間數據庫復習題
Chapter 1: Introduction to Spatial Databases
1、舉例說明什么是空間數據、非空間數據?如何理解空間查詢(spatial queries)和非空間查詢的區別(Non-spatial queries)?
答:河流的泛洪區,衛星影像數據、氣象氣候數據等都可以是空間數據
書店名稱 店員人數,去年的銷售量,電話號碼等是非空間數據
空間查詢是對空間數據的查詢或命令
2、什么是GIS,什么是SDBMS?請闡述二者的區別和聯系。
答:
1、GIS是一個利用空間分析功能進行可視化和空間數據分析的軟件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空間分析/統計、度量
GIS 可以利用SDBMS來存儲、搜索、查詢、分享大量的空間數據集
2、SDBMS是一個軟件模塊。它可以
①、利用一個底層的數據庫管理系統
②、支持多種空間數據模型、相應的空間抽象數據類型(ADT)以及一種能夠調用這些ADT的查詢語言
③、支持空間索引、高效的空間操作算法以及用于查詢優化的特定領域規則
3、區別與聯系:①、利用GIS可以對某些對象和圖層進行操作,而利用SDBMS則可以對更多的對象集和圖層進行更加簡單的操作
②、SDBMS可以在GIS不能使用的某些領域進行使用,例如基因組學、天文學、多媒體信息系統等
③、GIS可以作為SDBMS的前端,利用一個高效的SDBMS可以大大提高GIS的效率和生產率。
3、從GIS這一縮寫的三種含義來理解GIS的發展歷程。答:地理信息系統:為專業人員提供的軟件
地理信息科學:為地理信息系統和服務提供使用和發展的定義、框架和理論 地理信息服務:為普通用戶提供的網點和服務中心,例如PC機上的地理和空間服務
4、用傳統數據庫系統管理空間數據,存在什么不足之處?
答:1)無法用遞歸和嵌套的方式來描述復雜關系的層次和網狀結構,模擬和操作復雜地理對象的能力較弱;
2)用關系模型描述本身具有復雜結構和涵義的地理對象時,需對地理實體進行不自然的分解,導致存儲模式、查詢途徑及操作等方面均顯得語義不甚合理;
3)由于概念模式和存儲模式的相互獨立性,及實現關系之間的聯系需要執行系統開銷較大的聯接操作,運行效率不夠高
4)空間數據通常是變長的,而一般RDBMS只允許記錄的長度設定為固定長度,此外,通用DBMS難于存儲和維護空間數據的拓撲關系。
5)一般RDBMS都難以實現對空間數據的關聯、連通、包含、疊加等基本操作。
6)一般DBMS不能支持GIS需要的一些復雜圖形功能。
7)一般RDBMS難以支持復雜的地理信息,因為單個地理實體的表達需要多個文件、多條記錄,包括大地網、特征坐標、拓撲關系、屬性數據和非空間專題屬性等方面信息。
8)GIS管理的是具有高度內部聯系的數據,為了保證地理數據庫的完整性,需要復雜的安全維護系統,而這些完整性約束條件必須與空間數據一起存儲,由地理數據庫來維護系統數據的完整性。否則,一條記錄的改變會導致錯誤、相互矛盾的數據存在,而一般RDBMS難以實現這一功能。
5、What is a SDBMS ?
答:SDBMS是一個軟件模塊。它可以
①、利用一個底層的數據庫管理系統
②、支持多種空間數據模型、相應的空間抽象數據類型(ADT)以及一種能夠調用這些ADT的查詢語言
③、支持空間索引、高效的空間操作算法以及用于查詢優化的特定領域規則
6、什么是后關系數據庫模型?后關系數據庫模型有哪些?
答:后關系數據庫模型支持用戶定義抽象數據類型,空間數據的類型可以添加。
包括面向對象的數據庫模式OOBDMS和面向關系ORDBMS的數據庫模式。
7、SDBMS的三層體系結構(Three Layer Architecture)是什么?借此深入理解SDBMS的作用。
答:空間應用—空間數據庫—DBMS
教材P11的圖
8、空間數據庫主要涉及哪些內容?
答:數據模型、查詢語句、查詢處理與優化、文件組織和索引、數據挖掘
9、舉例說明單遍掃描查詢和多遍掃描查詢的概念。
答:單邊掃描查詢中,被查詢的表(關系)中的一條記錄(元組)最多只被訪問一次;例如“列出武大周圍5km內的書店的名字”。
多遍掃描查詢是被查詢的表(關系)中的一條記錄(元組)至少被訪問一次,例如“找出其代表的選取范圍大于200公頃并且在這區擁有公司的女議員的名字”
10、過濾-精煉策略的作用?兩個步驟的內容是什么?
提示:ppt : Efficient algorithms to answer spatial queries Common Strategyfast but content is lost when power is off主存:速度快,信息斷電丟失 Secondary storage-slower, retains content without power二級存儲器:慢,信息斷電不丟 Tertiary storage(如磁帶驅動器)-very slow, retains content, very large capacity脫機存儲器:非常慢,保存信息容量非常大。DBMS usually manage data
? ? ? on secondary storage, e.g.disks Use main memory to improve performance User tertiary storage(e.g.tapes)for backup備份, archival檔案 etc.4、磁盤存儲相關概念:磁道track、扇區sector、柱面cylinder?頁面的概念? 答:磁道:圓心磁盤片上向邊緣延伸的同心圓
扇區:每個磁道中被分成若干等份的區域 柱面:是磁盤上具有相同鐳的磁道的集合
頁面:又稱磁盤塊。是磁盤與主存之間的最小傳輸單位
5、訪問磁盤扇區數據的過程,哪個過程花費的時間最多? 提示:ppt: Accessing a sector has three major steps: ? ? ? Seek(尋道): Move head assembly to relevant track(ts)磁頭到達特定磁道所用的時間
Latency(延遲時間): Wait for spindle to rotate relevant sector under disk head(tl)塊旋轉到磁頭下方所用的時間 ? Transfer傳輸時間: Read or write the sector(tt)置于正確位置后讀寫塊中數據的實際時間 ? 1>2>3
6、如何有效利用磁盤硬件?
提示:ppt : Using Disk Hardware Efficiently
? Size of sectors扇區面積
? ? ? ? Larger sector provide faster transfer of large data sets 數據集大時大扇區提供更快的傳輸速度
But waste storage space inside sectors for small data sets 但浪費了小數據集的存儲空間
? Placement of most frequently accessed data items放置頻繁使用的數據
? ? ? On middle tracks rather than innermost or outermost tracks 在中間的磁道而不是最里面或最外面的磁道
Reason: minimize average seek time可以減少尋道時間
Placement of items in a large data set requiring many sectors放置一個需要很多扇區的大數據集
? ? Choose sectors from a single cylinder盡量放在同一個柱面
Reason: Minimize seek cost in scanning the entire data set.減少掃描全集花費的時間
7、域(filed)、記錄(record)、文件(file)的概念,提示: Mapping Records and files to Disk.? Records ? ?
? Often smaller than a sector Many records in a sector Files with many records文件是記錄的集合
? Many sectors per file
8、頁面的概念:磁盤與主存之間的最小傳輸單位。一個文件可能跨越多個頁面。一個頁面是槽的集合,一個槽包含一條記錄
9、文件結構的含義,舉例說明幾種常用文件結構—heap,Ordered、Hashed、Clustered。答:文件結構是指文件中記錄的組織形式。
堆:無序文件。記錄沒有特定的順序。,根據給定的關鍵碼(如name)查找一條記錄需要掃描文件中的記錄。在最壞情況下,文件的所有記錄都要被檢查,所有存儲該文件數據的磁盤
頁面都要被訪問。平均來說,需要檢索一半的磁盤頁面。優點是在進行插入操作時可以很容易地在文件末尾插入一條新記錄。存儲河流表
散列文件:使用散列函數吧記錄分到一系列散列單元中。可取之處在于它能夠把數量大致相同的記錄放入每個散列單元中。對于點查詢、插入、刪除都很有效。不適合范圍查詢。按字符個數存儲城市名稱。
有序文件:根據給定的主碼與對記錄進行組織。折半法非常有效。不能直接運用在空間領域例如,除非對多維空間中的點定義一個全序,否則無法對城市的位置排序。有序文件組織方式還可以根據對空間數據集的文件組織方式而概括成空間聚類。
聚類:聚類的目的就是降低響應常見的大查詢的尋道時間(ts)和等待時間(t1)。對于空間數據庫來說,這意味著在二級存儲中,空間上相鄰的和查詢上有關聯性的對象在物理上應當存儲在一起。
10、使用空間填充曲線組織空間數據的意義?
提示:Chapter 1,Organizing spatial data with space filling curves
? ? ? ?
11、掌握Z-曲線、hilbert曲線的生成。(要求給IJ號,能夠寫出對應Z碼和Hilbert碼的計Impose an ordering on the locations in a multi-dimensional space 加強了多維空間中的位置排序
Allow use of traditional efficient search methods on spatial data 允許在空間數據中使用傳統的有效搜索
算過程)
12、基于Z-曲線,如何進行區域匹配的?(匹配有效性?)
答:用z1和z2分別代表兩個z值,其中z1是較短的一個,并未失去一般性;對于相應的區域(比如塊)r1和r2,只有兩種可能:1)如果z1是z2的前綴(例如,z1=l***,z2=11**或z1=*l**,z2=11**),則r1完全包含r2;2)兩個區域不相交(例如,z1=*0**,z2=11**)。
13、什么是索引?索引文件的內容。主索引和二級索引。A table can have at most one primary index.Why? 答:索引文件是用來提高數據文件查詢效率的輔助文件。記錄的只有碼值和數據文件中的頁
面地址。索引記錄被排序,數據文件本身可以是不按關鍵碼排序。
主索引,如果數據文件的記錄是按照主碼排列的,那么索引就只需要保存數據文件的每個磁盤頁面第一個主碼域值。每個索引記錄一個數據頁面。
二級索引:堆數據文件,一個索引記錄一個數據。
一個磁盤最多只有一個主索引,因為主索引決定了數據在磁盤上的存儲順序。
14、什么是空間索引?有哪些空間索引方法?
答:空間索引結構用一組桶(通常對應二級存儲的頁面)來組織對象。
空間索引呢就是依據空間對象的位置和形狀或空間對象之間的某種空間關系按一定的順序排列的一種數據結構,其中包含空間對象的概要信息,如對象的標識、外接矩形及指向空間對象實體的指針。
方法:1)在系統中加入專門的外部空間數據結構,為空間屬性提供如同B樹之于線性屬性的功能。
2)使用空間填充曲線(如Z序、Hilbert曲線)將空間對象映射到一維空間,以便空間對象存儲在標準的一維索引(例如B樹)中。
15、網格文件包含哪兩部分內容?建立格網索引的思路和步驟?了解R樹索引和R+樹索引的思想?
答:包含n維網格目錄,目錄只能夠的每一項指向一個數據桶。第二部分是由稱為線性比例的一維數組組成的結構。
思路:是將研究區域用橫豎線條劃分大小相等或不等的格網,記錄每一個格網所包含的空間實體。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然后再在該網格中快速查詢所選空間實體,這樣一來就大大地加速了空間索引的查詢速度。
步驟:
劃分行列(M X N);
計算網格大小及每個格網的矩形范圍;
開辟目標空間(記錄目標穿過的網格)和格網空間(記錄格網內的目標); 注冊點、線、面、注記等目標,并記錄之;
提取窗口所覆蓋的目標關鍵字(采用數據位方法,以降低排序時間,及避免數據的繪制順序等);
提取目標所涉及的網格。
Chapter5 Query Processing and Optimization
1、從查詢處理的角度來看,空間數據庫與關系數據庫之間有哪些主要區別?
答:至少有三個主要區別:①、與關系數據庫不同,空間數據庫沒有固定的運算符集合可以充當查詢計算的基本構件
②、空間數據庫要處理非常大量的復雜對象,這些對象具有空間范圍,不能自然的排列成一維數組。
③、檢測空間謂語要用到計算量極大的算法,所以不能再假定I/O代價在CPU的處理代價中只能主導地位
2、空間查詢的基本構件有哪些?
提示:ppt5.1.2 Choice of building blocks,List of building blocks Point Query,Range Query,Spatial Join,Nearest Neighbor; 點查詢:給定一個查詢點P,找出所有包含它的空間對象O 范圍或區域查詢:給定一個查詢多邊形P,找出所有與之相交的空間對象O 空間鏈接:兩個表R和S基于一個空間謂語θ進行連接時,該連接成為空間連接。最近鄰居:空間聚集,即給定一個對象O,找出所有距離O最近的對象P
3、空間查詢處理的“過濾-精煉模式”是什么,其目的?(對象操作的兩步查詢處理)目的:用兩步算法高效地處理復雜的數據類型
過濾:尋找Q最終結果的超集S;精煉:利用GIS處理S來找到精確的Q的答案
4、空間查詢處理中,一般是采用什么(MBR))來替代不同類型的空間實體(如線、面)?這樣做有何好處?
提示:Ppt:Approximating spatial data types Minimum orthogonal bounding rectangle(MOBR or MBR)最小外接矩形 approximates line string, polygon, …近似的線串,多邊形 See Examples below(Black rectangle are MBRs for red objects)
MBRs are used by spatial indexes, e.g.R-treeM Algorithms for spatial operations MBRs are simple空間操作MRS的算法很簡單
5、舉例說明SDBMS是如何利用空間實體的MBRs來加快處理速度的? Ppt:Approximate Spatial Operations
6、對于點查詢、區域查詢、空間連接查詢操作,各自有哪些處理算法(策略)?它們與什么因素有關?
提示:Strategies for Point Queries,Strategies for Range Queries,Strategies for Spatial Joins 與包含待查詢的關系的文件的組織方式有關。
答:點查詢:數據未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語
建立空間索引:在索引中使用find操作;需要查找的磁盤扇區等于索引的深度
空間填充曲線散列:運用折半法尋找點;檢驗大約logB(n),的磁盤扇區
區域查詢:數據未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語
建立空間索引:在索引中使用范圍查詢操作
空間填充曲線散列:驗證Z值滿足范圍查詢要求;使用折半查詢找到最低的Z值;掃描前面的數據文件直至滿足查詢要求的最大的Z值 空間連接:嵌套循環,檢驗所有可能的空間謂語對;
基于空間分塊,只檢驗普通空間區域的對象對 樹匹配:從每張表中找出分層的的對象組
7、什么是查詢優化器?查詢優化器所承擔的主要任務是什么?
答:查詢優化器是數據庫軟件中的一個模塊,它用于產生不同計算計劃并確定適當的執行策略。主要任務:邏輯轉換、動態規劃。
8、查詢語言與查詢樹之間的互換? 語法分析器執行
9、對查詢樹進行邏輯轉換的目的和一般方法是什么? 答:方法:將非空間的選擇和投影操作下推
目的:減少連接操作所涉及的關系大小,從而減少計算代價。
10、Distributed Environments的概念?在分布式環境下,空間數據庫系統面臨哪些挑戰? 提示ppt:New issues for SDBMS)
答:自治異質計算機的集合,通過網絡連接,服務器框架:服務器提供定義明確的服務,用戶使用服務。
挑戰:概念模型上:不同種類模式之間的轉換
邏輯模式上:在其他SDBMS上命名、查詢表;其他SDBMS上的表要復制原始表
查詢過程與優化:通過網路的數據傳輸代價將會主導CPU和I/O代價,需要新的策略來控制數據的傳輸成本。
11、舉例說明分布式空間數據庫的半連接操作。(書上P161)答:1)只將連接屬性和主碼從站點1發送到站點2 2)只將有關元組從站點2發送到站點1.12、了解基于Web的空間數據庫系統的體系結構。(書上P162)
Chapter 6: Spatial Networks
1、舉例理解空間網絡、空間網絡查詢。鐵路網絡、密西西比河河網,查詢YW線沿途車站數量,最后一個車站,密西西比河的支流名稱
2、圖及其相關概念。
答:一個圖G=(V,E)是由一個有限頂點集V頂點之間的邊集E組成的。邊集E頂點集V的一個二元關系。
如果構成邊集的各個頂點對是有序的,那么圖G就是有向的(directed);否則該圖是無向的(undirected)。
頂點和邊有時也分別稱為結點(node)和鏈接(1ink)。
有序頂點對的第一個頂點稱為前驅(predecessor)或者源(source),第二個頂點稱為后繼(successor)、目的(destination)或匯點(sink)。
圖的結點和鏈接有時要添加標號(Label)和權重(weight),以便表示附加的信息。
如果兩條邊共享一個結點,那么它們是鄰接的(adjacent),一系列鄰接邊組成一條路徑(path)。例如,序列(v0,v1),(v1,v2),?,(vn-2,vn-1),(vn-1,vn)表示一條路徑,因為每條邊都與前一條邊或者后一條邊有一個公共結點。如果端點v0和vn是同一個結點,那么這條路徑稱為一個環(cycle)。河流網中沒有環,而在鐵路系統中,一條往返旅行線路構成一個環。
3、圖的物理存儲。鄰接矩陣、鄰接表(書上P182)
4、關系代數對于空間網絡查詢的主要缺陷?傳遞閉包的概念?
5、答:無法計算傳遞閉包。圖G(V,E)的傳遞閉包G*是滿足下列條件的圖,它與G有相同的頂點集V,但它的邊集則由G的所有路徑組成。
6、SQL2 Connect語句的使用,會書上的例子。
7、SQL3 With Recursive 語句的使用
8、路徑查詢處理的種類:單對、單源、所有對。
9、答:一個常用的圖操作就是確定道路網中兩個點A和B之間的最短路徑,路徑計算可以分為:
單對(single pair):給定一個圖G=(V, E)和N中的頂點u與v,找出u與v之間的最優路徑。單對的一個特例就是最短路徑問題。
單源(single source):給定一個源結點u,找出從u到G中所有可達結點之間的最優路徑。--部分傳遞閉包(partial transitive closure)問題。
所有對(all pairs):在G中找出y的所有結點u和v之間的最優路徑。--有關傳遞閉包的問題。
10、圖遍歷的含義,圖遍歷的方法--Breadth first search和Depth first search 答:圖遍歷(graph traversal)算法是所有路徑查詢的計算基礎,它沿著圖的邊,通過從一個結點到另一個結點的遍歷來搜索路徑。路徑搜索是一個遞歸的操作,需要不斷把結點的鄰接表從磁盤讀到內存緩沖區中。所以,為了使圖操作的查詢處理更加快速、有效,必須對圖算法進行特別的設計,以使其I/O代價達到最小。
? Breadth first search-給定一個圖G以及G中的一個源結點v,BFS算法訪問所有從v可以到達的結點。算法首先訪問源結點v的所有直接鄰居。一個結點的直接鄰居就是該結點的鄰接表中的元素。然后算法遞歸地訪問直接鄰居的鄰接表,如此循環下去.(P196)? 與BFS算法正好相反,DFS算法先訪問源結點的一個直接鄰居,然后,在訪問其他直接鄰居之前,遞歸地訪問其后繼鄰居。如此一來,DFS算法是先沿著邊走完一條“路徑”,然后再返回到頂層去走其他的“路徑”。
11、Shortest Path 算法--掌握Dijktra’s algorithm、了解Best first algorithm。(P197)
設A為源點,求A到其他各頂點(B、C、D、E、F)的最短路徑。線上所標注為相鄰線段之間的距離,即權值。
12、點線面空間實體的存儲方法是否適用于空間網絡?為什么?
13、空間網絡數據的存儲一般需要考慮什么因素?非分離邊、分離邊的概念,連通性剩余率的含義及其計算;
答:最小的I/O操作成本。非分離邊:一條邊的兩個端點位于同一個磁盤頁中; 分離邊:一條邊的兩個端點位于不同磁盤頁中。
第五篇:空間數據庫期末復習重點總結
一、數據管理的發展階段
1、人工管理階段
2、文件系統階段
3、數據庫管理階段
注意了解各階段的背景和特點
二、數據庫系統的特點
1、面向全組織的復雜的數據結構
2、數據的冗余度小,易擴充
3、具有較高的數據和程序的獨立性:數據獨立性
數據的物理獨立性 數據的邏輯獨立性
三、數據結構模型三要素
1、數據結構
2、數據操作
3、數據的約束性條件
四、數據模型反映實體間的關系
1、一對一的聯系(1:1)
2、一對多的聯系(1:N)
3、多對多的聯系(M:N)
五、數據模型:
是數據庫系統中用于提供信息表示和操作手段的形式構架。
數據庫結構的基礎就是數據模型。數據模型是描述數據(數據結構)、數據之間的聯系、數據語義即數據操作,以及一致性(完整性)約束的概念工具的集合。概念數據模型:按用戶的觀點來對數據和信息建模。ER模型
結構數據模型:從計算機實現的觀點來對數據建模。層次、網狀模型、關系
六、數據模型的類型和特點
1、層次模型:
優點:結構簡單,易于實現
缺點:支持的聯系種類太少,只支持二元一對多聯系
數據操縱不方便,子結點的存取只能通過父結點來進行
2、網狀模型:
優點:能夠更為直接的描述世界,結點之間可以有很多聯系
具有良好的性能,存取效率高 缺點:結構比較復雜
網狀模型的DDL、DML復雜,并且嵌入某一種高級語言,不易掌握,不易使用
3、關系模型:
特點:關系模型的概念單一;(定義、運算)關系必須是規范化關系;
在關系模型中,用戶對數據的檢索操作不過是從原來的表中得到一張新的表。優點:簡單,表的概念直觀,用戶易理解。
非過程化的數據請求,數據請求可以不指明路徑。
數據獨立性,用戶只需提出“做什么”,無須說明“怎么做”。堅實的理論基礎。
缺點:由于存儲路徑對用戶透明,存儲效率往往不如非關系數據模型
4、面向對象模型
5、對象關系模型 七、三個模式和二級映像
1、外模式(Sub-Schema):用戶的數據視圖。是數據的局部邏輯結構,模式的子集。
2、模式(Schema):所有用戶的公共數據視圖。是數據庫中全體數據的全局邏輯結構和特性的描述。
3、內模式(Storage Schema):又稱存儲模式。數據的物理結構及存儲方式。
4、外模式/模式映象:定義某一個外模式和模式之間的對應關系,映象定義通常包含在各外模式中。當模式改變時,修改此映象,使外模式保持不變,從而應用程序可以保持不變,稱為邏輯獨立性。
5、模式/內模式映象:定義數據邏輯結構與存儲結構之間的對應關系。存儲結構改變時,修改此映象,使模式保持不變,從而應用程序可以保持不變,稱為物理獨立性。
八、數據視圖
數據庫管理系統的一個主要作用就是隱藏關于數據存儲和維護的某些細節,而為用戶提供數據在不同層次上的抽象視圖,即不同的使用者從不同的角度去觀察數據庫中的數據所得到的結果—數據抽象。
九、規范化
1、幾個概念
候選碼(候選關鍵字):如果一個屬性(組)能惟一標識元組,且又不含有其余的屬性,那么這個屬性(組)稱為關系的一個候選碼(候選關鍵字)。碼(主碼、主鍵、主關鍵字):從候選碼中選擇一個唯一地標識一個元組候選碼作為碼 主屬性:任何一個候選碼中的屬性(字段)非主屬性:除了候選碼中的屬性外碼:關系模式R中屬性或屬性組X并非R的碼,但X是另一個關系模式的碼,則稱X是R的外部碼,簡稱外碼。
2、函數依賴
(1)設R(U)是一個屬性集U上的關系模式,X和Y是U的子集。若對于R(U)的任意一個可能的關系r,r中不可能存在兩個元組在X上的屬性值相等,而在Y上的屬性值不等,則稱 “X函數確定Y”或“Y函數依賴于X”,記作X→Y。X稱為這個函數依賴的決定屬性集(Determinant)。Y=f(x)
(2)在關系模式R(U)中,對于U的子集X和Y,如果X→Y,但Y ? X,則稱X→Y是非平凡的函數依賴 若X→Y,但Y ? X,則稱X→Y是平凡的函數依賴(3)在關系模式R(U)中,如果X→Y,并且對于X的任何一個真子集X’,都有X’/ →Y, 稱Y完全函數依賴于X,記作XF→Y。若X→Y,但Y不完全函數依賴于X,則稱Y部分函數依賴于X,記作XP→Y。
(4)在關系模式R(U)中,如果X→Y,Y→Z,且Y ?X,Y→X,則稱Z傳遞函數依賴于X。記為X傳遞→Z。注: 如果Y→X,即X←→Y,則Z直接函數依賴于X。
3、范式
范式是符合某一種級別的關系模式的集合
(1)范式種類:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式(BCNF)、第四范式(4NF)、第五范式(5NF)
1NF?2NF?3NF?BCNF?4NF?5NF(2)各種范式之間的聯系:
(3)定義:
1NF:如果一個關系模式R的所有屬性都是不可分的基本數據項,則R∈1NF。
存在的問題:插入異常、刪除異常、數據冗余度大、修改復雜
2NF:若關系模式R∈1NF,并且每一個非主屬性都完全函數依賴于R的碼,則R∈2NF。(所有非主屬性完全依賴每個候選關鍵字。)
3NF:關系模式R 中若不存在這樣的碼X、屬性組Y及非主屬性Z(Z ? Y), 使得X→Y,Y→Z成立,Y→X,則稱R ∈ 3NF。(所有非主屬性既不部分依賴于碼也不傳遞函數依賴碼。)
BCNF:設關系模式R∈1NF,如果對于R的每個函數依賴X→Y,若Y不屬于X,則X必含有候選碼,那么R∈BCNF。(每一個決定屬性集(因素)都包含(候選)碼,R中的所有屬性(主,非主屬性)都完全函數依賴于碼,R∈3NF。)性質:a、所有非主屬性都完全函數依賴于每個候選碼
b、所有主屬性都完全函數依賴于每個不包含它的候選碼 c、沒有任何屬性完全函數依賴于非碼的任何一組屬性
多值依賴:設R(U)是一個屬性集U上的一個關系模式,X、Y和Z是U的子集,并且Z=U-X-Y,多值依賴 X→→Y成立當且僅當對R的任一關系r,r在(X,Z)上的每個值對應一組Y的值,這組值僅僅決定于X值而與Z值無關
平凡多值依賴和非平凡的多值依賴:若X→→Y,而Z=φ,則稱X→→Y為平凡的多值依賴,否則稱X→→Y為非平凡的多值依賴。
4NF:關系模式R(U,F)∈1NF,如果對于R的每個非平凡多值依賴X??Y(Y不包含于X),X都含有候選碼,則R ∈ 4NF
范式關系:
十、數據庫
數據庫:數據庫就是為了一定的目的,在計算機系統中以特定的結構組織、存儲、管理和應用的相關聯的數據集合。空間數據庫:空間數據庫是存取、管理空間信息的數據庫。空間數據庫管理系統:空間數據庫管理系統是指能夠對物理介質上存儲的地理空間數據進行語義和邏輯上的定義;
1、提供必須的空間數據查詢、檢索和存取功能;
2、能夠空間數據進行有效的維護和更新的一套軟件系統。空間數據庫應用系統:提供給用戶訪問和操作空間數據庫的用戶界面,是應用戶數據處理需求而建立的具有數據庫訪問功能的應用軟件。一般需要進行二次開發。
數據庫系統組成:數據庫、數據庫管理系統、應用系統、數據庫管理員
空間信息的特征:
(1)幾何信息:描述了事物在空間中的位置及所占據的范圍
將地球表面以投影方式轉換為平面
通過平面幾何來抽象描述和研究事物的位置和范圍 用圖形和符號的方式來描繪這些空間相關的事物
(2)拓撲信息:研究空間相關的事物本身或者事物之間的在空間坐標變換下的不變性質
事物本身的內外關系
事物之間的相離、相接、相交 事物之間相連的布局
(3)屬性信息:與位置范圍無關的其它信息
描述了事物本身的內在性質和外在表現 事物之間的非位置關系
空間數據庫管理系統三層體系結構及每層的代表軟件:
標準DBMS存儲空間數據的局限性
(1)空間數據記錄是變長的(如點數的可變性),而一般的數據庫都只允許把記錄的長度設定為固定;
(2)在存儲和維護空間數據拓撲關系方面存在著嚴重缺陷;
(3)一般都難以實現對空間數據的關聯、連通、包含、疊加等基本操作;(4)不能支持復雜的圖形功能;
(5)單個地理實體的表達需要多個文件、多條記錄,一般的DBMS也難以支持;(6)難以保證具有高度內部聯系的GIS數據記錄需要的復雜的安全維護。
GIS的發展演化
空間數據庫管理系統與傳統數據庫的區別:(1)數據量大
(2)需要處理與傳統數據庫中數據性質相似的屬性數據和空間位置數據及它們之間的聯系 3)對數據的檢索涉及空間分析方法(4)數據應用廣泛,不局限于某個部門
GIS發展三個階段
1、第一代GIS(從60年代中期到80年代的中后期,是GIS軟件從無到有、從原型到產品的階段)
技術特點:以圖層作為處理的基礎
以系統為中心 單機、單用戶
全封閉結構支持二次開發能力非常弱
在主要實現技術上,以文件系統來管理幾何數據與屬性數據 應用領域基本上集中在資源與環境領域的管理類應用
2、第二代GIS(從80年代末到90年代中期,是GIS軟件成熟和應用快速發展的時期)技術特點:以圖層作為處理基礎
引入網絡技術,多機、多用戶 以系統為中心
支持二次開發的能力有所增強
以商用DBMS管理屬性數據,但幾何數據仍用文件系統管理 應用領域開始有較大范圍的擴展,但基本上是管理類應用。
3、第三代GIS(90年代中期開始,估計將延續10年或稍長的時間)技術特點:仍然以圖層為處理的基礎,但面臨不斷演化
引入了Internet技術,開始向以數據為中心的方向過渡,實現了初步的(瀏覽型或簡單查詢型)的B/S結構
開放程度大幅度增加,組件化技術改造逐步完成
逐漸重視元數據問題,空間數據共享、服務共享和GIS系統互連技術不斷發展 GIS的標準化問題備受重視
實現空間數據與屬性數據的一體化存儲和初步的一體化查詢,并將不斷完善 應用領域迅速擴大,應用深度不斷提高,開始具有初步的分析決策能力。
展望新一代GIS 面向空間實體及其時空關系的數據組織與融合 統一的海量存儲、查詢和分析處理 有效的分布式空間數據管理和計算 一定的三維和時序處理能力 強大的應用集成能力
靈活的操縱能力和一定的虛擬現實表達
空間數據庫管理系統與GIS的聯系和區別 空間數據庫管理系統一般由專業GIS軟件提供
GIS—處理地理數據——以地球表面為基本參照框架的空間數據
SDBMS——處理空間數據(空間數據包括地理數據,地理數據是空間數據的子集)GIS促進SDBMS的研究與發展
空間信息模型:
基于場的模型:用于表示具有連續的空間變化的情況,形狀不定的現象,采用柵格數據結構。
基于對象的模型:用于表示具有固定形狀的空間實體/概念,描述空間上離散的空間對象。采用矢量數據結構
空間數據庫設計的三個步驟
空間數據庫的設計是指在現在數據庫管理系統的基礎上建立空間數據庫的整個過程。概念模型:按用戶的觀點從現實應用中抽象出事物以及事物之間的聯系 邏輯建模:建立概念和聯系的邏輯結構
物理設計建模:對邏輯結構進行具體實現方面的安排和考慮;
存儲組織、索引、內存管理……
E-R圖:
實體:現實中或者概念上獨立存在的事物或者對象,用矩形表示 屬性:刻畫實體性質的數值或描述,用橢圓表示 聯系:表達實體間的關聯,用菱形表示 重點:E-R圖設計
擴展E-R模型:象形圖
1、實體象形圖:
象形圖:象形圖是一種將對象插在方框內的微縮圖表示,這些微縮圖用來擴展ER圖,并插到實體矩形框中的適當位置。
形狀:形狀是象形圖中的基本圖形元素,它代表著空間數據模型中的元素。
基本形狀: 復合形狀: 導出形狀: 備選形狀: 任意形狀:
用戶自定義形狀:
2、聯系象形圖:
聯系象形圖用來構建實體間聯系的模型
OGIS的4類幾何體(4類空間數據模型): 點——0維對象
線——1維對象,線串——2個或多個點表示 面——2維對象,多邊形
幾何體集合——表示復雜形狀,3類:
多點 多線 多面
幾何體集合——保證——幾何操作的閉合
常見拓撲屬性:
endpoint(point, arc)
點是弧的端點 simple-nonself-intersection(arc)
非自交的弧
on-boundary(point, region)
點在區域的邊界上 inside(point, region)
點在區域內部 outside(point, region)
點在區域之外
open(region)
區域是開域(不包括邊界)close(region)
區域是閉域(包括邊界)
connected(region)
區域是連通域(區域上任2點,都有路徑相連)inside(point, loop)
點在環中 crosses(arc, region)
弧穿過區域 touches(region, region)
區域與區域相鄰 touches(arc, region)
弧與區域相鄰 overlap(region, region)
區域與區域重疊 常見非拓撲屬性:
Euclidean-distance(point, point)
2點間的歐氏距離 direction(point, point)
點在點的東面
length(arc)
弧的長度(單位向量長度為1個單位)
perimeter(area)
區域的周長(單位正方形的周長為4個單位)area(region)
區域的面積(單位正方形的面積為1個平方單位)
九交模型:
定義平面上2對象之間的拓撲關系 對象的3個部分: 內部——A° 邊界——?A 外部——A-
九交矩陣:將兩個幾何形的內部、邊界、外部分別兩兩做相交操作,操作的結果記為矩陣元素取值
矩陣元素取值: ?A??B?A???BA??B????0——交為空 ?9(A,B)???A?B??A??B?A?B??1——交為非空 ?A??B?A???BA??B????
九交矩陣可確定的二元拓撲關系種類:29=512 可實現的二元拓撲關系種類:8(相離(disjoint)、相接(meet)、交疊(overlap)、相等(equal)、包含(contain)、在內部(inside)、覆蓋(cover)、被覆蓋(covered by))
關系代數(形式化的語言)
關系代數用到的運算符包括四類:集合運算符、專門的關系運算符、算術比較符、邏輯運算符。
并、差、交、笛卡爾積
選擇:滿足條件的元組,即行 投影:選取屬性列 連接:等值投影
自然連接(特殊的等值連接,要求兩個關系中進行比較的分量必須是相同的屬性組,在結果中把重復的屬性列去掉)
外連接:把舍棄的元組保存在結果中,在其他屬性值上填空值(NULL)左外連接:保留左邊關系要舍棄的元組 右外連接:保留右邊關系要舍棄的元組 除運算:了解象集
SQL標準每階段特點和增加的內容 SQL-86 SQL-89:“具有完整性增強的數據庫語言SQL”,增加了對完整性約束的支持
SQL-92:“數據庫語言SQL”,是SQL-89的超集,增加了許多新特性,如新的數據類型,更豐富的數據操作,更強的完整性、安全性支持等。
SQL-3/SQL99:正在討論中的新的標準,將增加對面向對象模型的支持
SQL中完成核心功能的9個動詞
數據定義:
常用完整性約束: 主碼約束:primary key 唯一性約束:unique 非空集約束:not null 參照完整性約束
數據查詢:
查詢滿足條件的元組:
%(百分號)代表任意長度(長度可以為0)的字符串 _(下橫線)代表任意單個字符 集函數包括:
COUNT([DISTINCT | ALL] *)統計元組個數
COUNT([DISTINCT | ALL] <列名>)統計一列中值的個數 SUM([DISTINCT | ALL] <列名>)計算一列值的總和 AVG([DISTINCT | ALL] <列名>)計算一列的平均值 MAX([DISTINCT | ALL] <列名>)計算一列的最大值 MAX([DISTINCT | ALL] <列名>)計算一列的最小值 連接查詢包括: 廣義笛卡爾積
等值(含自然連接)非等值連接; 自身連接; 外連接; 復合條件連接 嵌套查詢
等值連接與自然連接區別
等值連接:在連接條件中使用等于號(=)運算符比較被連接列的列值,其查詢結果中列出被連接表中的所有列,包括其中的重復列。
自然連接:在連接條件中使用等于(=)運算符比較被連接列的列值,但它使用選擇列表指出查詢結果集合中所包括的列,并刪除連接表中的重復列。嵌套查詢分類:
不相關子查詢:子查詢的查詢條件不依賴于父查詢 相關子查詢:子查詢的查詢條件依賴于父查詢 不相關子查詢:由里向外逐層處理 相關子查詢:首先取外層查詢中表的第一個元組,根據它與內層查詢相關的屬性值處理內層查詢
集合查詢:并(union)交(intersect)差(minus)
SELECT語句的一般格式: SELECT [ALL|DISTINCT] <目標列表達式> [別名] [,<目標列表達式> [別名]] … FROM <表名或視圖名> [別名] [,<表名或視圖名> [別名]] … [WHERE <條件表達式>] [GROUP BY <列名1> [HAVING <條件表達式>]] [ORDER BY <列名2> [ASC|DESC] 完整性規則: 實體完整性 參照完整性
用戶定義的完整性:對于有NOT NULL約束的屬性列是否提供了非空值
對于有UNIQUE約束的屬性列是否提供了非重復值
對于有值域約束的屬性列所提供的屬性值是否在值域范圍內
數據更新: 插入數據: INSERT INTO <表名> [(<屬性列1>[,<屬性列2 >…)]
VALUES(<常量1> [,<常量2>]
…)修改數據:
UPDATE <表名>
SET <列名>=<表達式>[,<列名>=<表達式>]…
[WHERE <條件>]; 刪除數據: DELETE
FROM
<表名>
[WHERE <條件>]; 視圖的特點
? 虛表,是從一個或幾個基本表(或視圖)導出的表 ? 只存放視圖的定義,不會出現數據冗余
? 基表中的數據發生變化,從視圖中查詢出的數據也隨之改變 視圖操作:(同表操作差不多)定義視圖 查詢視圖 更新視圖
視圖的可更新性:
SQL Server 2000規定:
① 如果一個視圖是從多個基本表使用連接操作導出的,則不允許對這個視圖執行更新操作。
② 如果在視圖定義中使用了聚集函數或DISTINCT短語或GROUP BY子句,則不允許對該視圖執行更新操作。
③ 如果視圖的列的值為表達式或常數,則不允許該這視圖執行更新操作。
④ 如果視圖為行列子集視圖,則可以對該視圖執行更新操作。視圖作用:
1.視圖能夠簡化用戶的操作
2.視圖使用戶能以多種角度看待同一數據
3.視圖對重構數據庫提供了一定程度的邏輯獨立性 4.視圖能夠對機密數據提供安全保護
數據控制
SQL提供了數據控制功能,能在一定程度上保證數據的安全性、完整性、并提供了一定的并發控制和恢復能力。1.完整性:定義庫結構
2.安全性:存取控制,規定不同用戶對于不同數據對象允許執行的操作,并控制各用戶它有權存取的數據。
3.并發控制和恢復:SQL支持事務、提交、回滾等概念。功能:
1、權限
2、授權
GRANT <權限>[,<權限>]… [ON <對象類型> <對象名>] TO <用戶>[,<用戶>]…[WITH GRANT OPTION];
3、收權
REVOKE <權限>[,<權限>]…
[ON <對象類型> <對象名>]
FROM <用戶>[,<用戶>]…;
SQL語言的空間擴展 OGIS類中操作分3類
1、用于所有幾何類型的基本操作
6個 SpatialReference()
返回幾何體的基本坐標系統
Envelope()
返回包含幾何體的最小外接矩形 Export()
返回以其他形式表示的幾何體 IsEmpty()
若幾何體為空集,則返回真
IsSimple()
若幾何體為簡單的(不自交的),則返回真 Boundary()
返回幾何體的邊界
2、用于空間對象之間拓撲關系的操作測試
8個
Equal
相等——若2個幾何體的內部和邊界在空間上都相等,則返回真 Disjoint
相離——若2個幾何體的內部和邊界都不相交,則返回真 Intersect
交疊——若2個幾何體相交,則返回真
Touch
相接——若2個面僅邊界相交,而內部不相交,則返回真 Cross
橫過——若一條線和面的內部相交,則返回真
Within
在內部——若給定的幾何體的內部不與另一個幾何體的外部相交,則返回真 Contains
包含——若給定的幾何體包含另一個幾何體,則返回真
Overlap
覆蓋/被覆蓋——若2個幾何體的內部有非空交集,則返回真
3、用于空間分析的一般操作
7個
Distance
求距離——返回2個幾何體之間的最短距離
Buffer
求緩沖區——返回到給定幾何體距離小于等于指定值的幾何體的點的集合
ConvexHull
求最小閉包—— 返回幾何體的最小閉包
Intersection
集合交——返回2個幾何體的交集構成的幾何體
Union
集合并——返回2個幾何體的并集構成的幾何體 Difference
集合差——返回幾何體與給定幾何體不相交的部分
SymmDiff
返回2個幾何體與對方互不相交的部分
OGIS標準的局限性
局限用于——對象模型
場模型的操作——正研究 僅支持——基本拓撲的、空間度量的操作
不支持——方位的、動態的、基于形狀的、基于可見性的操作 數據字典
定義:用于描述數據庫的整體結構、數據內容和定義等。一個好的數據字典可以說是一個數據的標準規范,它可使數據庫的開發者依此來實施數據庫的建立、維護和更新。用途:進行詳細的數據收集和數據分析所獲得的主要結果。內容:數據項、數據結構、數據流、數據存儲、處理過程 空間索引
索引文件——用來提高數據文件查詢效率的輔助文件 索引文件的組成:
2個域:主碼域
數據文件的頁面地址
主索引——數據文件的記錄按主碼域排序,索引文件中只需保存數據文件的每個磁盤頁面的第一個主碼域的值。一維搜索碼的索引:B樹與B+樹 多維索引:
類似散列表的結構
固定網格 網格文件
基于樹形的結構
四叉樹 R樹 R+樹
數據庫查詢語言
兩種:關系代數——形式化的語言
組成:1種運算對象——關系(表)
6種運算——選擇、投影、并、笛卡爾積、差、交
結構化查詢語言(SQL)
事務的概念
事務是并發控制的基本單位。所謂事務,就是一個操作序列,這些操作要么都執行,要么都不執行,它是一個不可分割的工作單位。SQL Server以下列事務模式運行(1)自動提交事務(2)顯式事務(3)隱式事務 事務的特性 原子性 一致性 隔離性 持久性
語法格式為:
BEGIN TRANSACTION COMMIT TRANSACTION ROLLBACK TRANSACTION 鎖的概念
鎖定是Microsoft SQL Server Database Engine用來同步多個用戶同時對同一個數據塊的訪問的一種機制。
鎖的類型(1)共享鎖
共享鎖也稱為S鎖,允許并行事務讀取同一種資源,這時的事務不能修改訪問的數據。當使用共享鎖鎖定資源時,不允許修改數據的事務訪問數據。(2)排他鎖
排他鎖也稱為X鎖,它可以防止并發事務對資源進行訪問。(3)更新鎖
更新鎖也稱為U鎖,它可以防止常見的死鎖。更新鎖用來預定要對資源施加X鎖,它允許其他事務讀,但不允許再施加U鎖或X鎖。
活鎖
如果事務T1封鎖了數據R,事務T2又請求封鎖R,于是T2等待。T3也請求封鎖R,當T1釋放了R上的封鎖之后系統首先批準了T3的請求,T2仍然等待。然后T4又請求封鎖R,當T3釋放了R上的封鎖之后系統又批準了T4的請求,...,T2有可能永遠等待,這就是活鎖的情形。
避免活鎖的簡單方法是采用先來先服務的策略 死鎖
在兩個或多個任務中,如果每個任務鎖定了其他任務試圖鎖定的資源,此時會造成這些任務永久阻塞,從而出現死鎖。
事務 A 獲取了行 1 的共享鎖。事務 B 獲取了行 2 的共享鎖。
現在,事務 A 請求行 2 的排他鎖,但在事務 B 完成并釋放其對行 2 持有的共享鎖之前被阻塞。
現在,事務 B 請求行 1 的排他鎖,但在事務 A 完成并釋放其對行 1 持有的共享鎖之前被阻塞。
事務 A 必須在事務 B 完成之后才能完成,但事務 B 被事務 A 阻塞。這種情況也稱為循環依賴關系:事務 A 依賴于事務 B,而事務 B 又依賴于事務 A,從而形成了一個循環。除非某個外部進程斷開死鎖,否則死鎖中的兩個事務都將無限期等待下去。
Microsoft SQL Server Database Engine死鎖監視器定期檢查陷入死鎖的任務。如果監視器檢測到循環依賴關系,將選擇其中一個任務作為犧牲品,然后終止其事務并提示錯誤。
減少死鎖的方法:
(1)按同一順序訪問對象(2)避免事務中的用戶交互
(3)保持事務簡短并處于一個批處理中(4)使用較低的隔離級別
(5)使用基于行版本控制的隔離級別(6)使用綁定連接 存儲過程
SQL Server提供了一種方法,它可以將一些固定的操作集中起來由SQL Server數據庫服務器來完成,以實現某個任務,這種方法就是存儲過程。
在SQL Server中存儲過程分為兩類:即系統提供的存儲過程和用戶自定義的存儲過程。
可以使用三種方法創建存儲過程 :
1、使用創建存儲過程向導創建存儲過程。
2、利用SQL Server 企業管理器創建存儲過程。
3、使用Transact-SQL語句中的CREATE PROCEDURE命令創建存儲過程。創建命令格式:
CREATE
PROCEDURE
存儲過程名
[參數
數據類型
長度] [參數
數據類型
長度
OUTPUT] AS
SQL語句 執行命令格式:
EXEC[ UTE ] 存儲過程名
[ 參數名= 參數值 ] [ 參數值1,參數值2,……] 刪除存儲過程
DROP procedure 存儲過程名 觸發器
是一種特殊類型的存儲過程,是通過事件進行觸發而被執行的,而存儲過程通過存儲過程名被直接調用。觸發器是一個功能強大的工具,它使每個站點可以在有數據修改時自動強制執行其業務規則。觸發器可以用于SQL Server約束、默認值和規則的完整性檢查。
觸發器是一種特殊類型的存儲過程,不由用戶直接調用。創建觸發器時會對其進行定義,以便在對特定表或列作特定類型的數據修改時執行。
當創建一個觸發器時必須指定:
⑴名稱;
⑵在其上定義觸發器的表;
⑶觸發器將何時激發;
⑷激活觸發器的數據修改語句。
使用命令創建觸發器
CREATE TRIGGER 觸發器名
ON 表/視圖名
[WITH
ENCRYPTION]:加密 syscomments 表中包含 REATE TRIGGER 語句文本的條目。使用 WITH ENCRYPTION 可防止將觸發器作為 SQL Server 復制的一部分發布,當使用“exec sp_helptext 觸發器名”時,查看不了語句
{ FOR|AFTER|INSTEAD OF }指定執行觸發器而不是執行觸發 SQL 語句,從而替代觸發語句的操作
{ [DELETE][,][INSERT][,][UPDATE] }
[ NOT FOR REPLICATION]表示當復制進程更改觸發器所涉及的表時,不應執行該觸發器。
AS
SQL 語句 刪除觸發器
DROP TRIGGER { trigger } [ ,...n ]
SQL Server2000安全機制(管理服務器的安全性、角色與用戶、管理權限)數據庫的安全性是指保護數據庫以防止不合法的使用所造成的數據泄漏、更改或破壞。系統安全保護措施是否有效是數據庫系統的主要指標之一。
安全機制:對于數據庫管理來說,保護數據不受內部和外部侵害是一項重要的工作。SQL Server 2005的身份驗證、授權和驗證機制可以保護數據免受未經授權的泄漏和篡改。
SQL Server 2005的安全模型分為3層結構,分別為服務器安全管理、數據庫安全管理和數據庫對象的訪問權限管理。
SQL Server 2005的身份驗證模式有兩種:Windows身份驗證模式和混合模式 SQL Server 2005數據庫管理系統利用角色設置,管理用戶的權限。這樣只對角色進行權限設置便可以實現對該角色中所有用戶權限的設置,大大減少了管理員的工作量。
在SQL Server 2005中,具有固定服務器角色、固定數據庫角色、用戶自定義數據庫角色和應用程序角色4種類型的角色
權限用來控制用戶如何訪問數據庫對象。一個用戶可以直接分配到權限,也可以作為一個角色中的成員來間接得到權限
SQL Server 2005中的權限分為3種:對象權限、語句權限和隱含權限。對象權限是用來控制一個用戶是如何與一個數據庫對象進行交互操作的,有5個不同的權限:查詢(Select)、插入(Insert)、修改(Update)、刪除(Delete)和執行(Execute)。
GIS數據庫的設計
數據庫設計的基本目標:(1)滿足用戶需求(2)良好的數據庫性能(3)準確模擬現實世界
(4)能夠被某個數據庫管理系統接受
概念設計應滿足的要求:
(1)提供一個非專家理解的系統結構框架
(2)包含豐富的結構類型,能夠盡可能完整地描述系統的復雜性(3)能夠轉換成與實施相關的模型,以便能夠設計和實施該系統 概念設計的核心內容:
(1)確定數據庫的數據組成(2)確定數據類型之間的關系(3)建立概念數據模型(4)形成書面文檔
概念設計的一般步驟和方法:(1)確定應用領域(2)確定用戶需求(3)選擇對象類型
(4)對象類型定義和屬性描述(5)對象類型的調整(6)幾何表示(7)關系(8)質量要求(9)編碼
空間數據分層依據:(1)專題內容(2)幾何表達形式(3)拓撲特征的差別
(4)不同部門的數據通常放在不同的圖層,便于維護(5)不同安全級別的數據也應該單獨存儲(6)使用目的不同的數據應該單獨存放 地理數據模型的發展階段(3個):(1)CAD數據模型
(2)Coverage數據模型(第二代地理數據模型)(3)GeoDatabase數據模型(第三代地理數據模型)
要素集:是具有同樣幾何類型和屬性的要素集合。——矢量圖層 對象類:是GeoDatabase中存儲數據庫表——表 要素數據集:具有相同空間參考的要素類的集合
子類:在要素類內部可以劃分若干個次一級的組,每個組是一個子類。每個子類有其自己的完整性規則和GIS行為。
拓撲關系:拓撲關系將參與拓撲的各個要素類集成在一個拓撲圖中作為一個拓撲單元來管理,規定同一個要素類中各個要素如何與其他要素共享幾何,或者不同要素類之間如何共享幾何。
ArcGIS中的三個數據庫:Personal Database、File Database、ArcSDE(ArcSDE+SQL構成空間數據庫)
選擇題(12‘)、填空題(10‘)、名詞解釋(20‘)、寫代碼(27‘)、簡答題(21‘)設計題(10‘)