第一篇:數據庫期末復習總結
數據庫原理綜合習題答案
1.1 名詞解釋
(1)DB:即數據庫(Database),是統一管理的相關數據的集合。DB能為各種用戶共享,具有最小冗余度,數據間聯系密切,而又有較高的數據獨立性。
(2)DBMS:即數據庫管理系統(Database Management System),是位于用戶與操作系統之間的一層數據管理軟件,為用戶或應用程序提供訪問DB的方法,包括DB的建立、查詢、更新及各種數據控制。DBMS總是基于某種數據模型,可以分為層次型、網狀型、關系型、面向對象型DBMS。
(3)DBS:即數據庫系統(Database System),是實現有組織地、動態地存儲大量關聯數據,方便多用戶訪問的計算機軟件、硬件和數據資源組成的系統,即采用了數據庫技術的計算機系統。
(4)1:1聯系:如果實體集E1中的每個實體最多只能和實體集E2中的一個實體有聯系,反之亦然,那么實體集E1對E2的聯系稱為“一對一聯系”,記為“1:1”。
(5)1:N聯系:如果實體集E1中每個實體與實體集E2中任意個(零個或多個)實體有聯系,而E2中每個實體至多和E1中的一個實體有聯系,那么E1對E2的聯系是“一對多聯系”,記為“1:N”。
(6)M:N聯系:如果實體集E1中每個實體與實體集E2中任意個(零個或多個)實體有聯系,反之亦然,那么E1對E2的聯系是“多對多聯系”,記為“M:N”。
(7)數據模型:模型是對現實世界的抽象。在數據庫技術中,表示實體類型及實體類型間聯系的模型稱為“數據模型”。它可分為兩種類型:概念數據模型和結構數據模型。
(6)概念數據模型:是獨門于計算機系統的模型,完全不涉及信息在系統中的表示,只是用來描述某個特定組織所關心的信息結構。
(9)結構數據模型:是直接面向數據庫的邏輯結構,是現實世界的第二層抽象。這類模型涉及到計算機系統和數據庫管理系統,所以稱為“結構數據模型”。結構數據模型應包含:數據結構、數據操作、數據完整性約束三部分。它主要有:層次、網狀、關系三種模型。
(10)層次模型:用樹型結構表示實體類型及實體間聯系的數據模型。
(11)網狀模型:用有向圖結構表示實體類型及實體間聯系的數據模型。
(12)關系模型:是目前最流行的數據庫模型。其主要特征是用二維表格結構表達實體集,用外鍵表示實體間聯系。關系模型是由若干個關系模式組成的集合。
(13)概念模式:是數據庫中全部數據的整體邏輯結構的描述。它由若干個概念記錄類型組成。概念模式不僅要描述概念記錄類型,還要描述記錄間的聯系、操作、數據的完整性、安全性等要求。
(14)外模式:是用戶與數據庫系統的接口,是用戶用到的那部
分數據的描述。
(15)內模式:是數據庫在物理存儲方面的描述,定義所有的內部記錄類型、索引和文件的組成方式,以及數據控制方面的細節。
(16)模式/內模式映象:這個映象存在于概念級和內部級之間,用于定義概念模式和內模式間的對應性,即概念記錄和內部記錄間的對應性。此映象一般在內模式中描述。
(17)外模式/模式映象:這人映象存在于外部級和概念級之間,用于定義外模式和概念模式間的對應性,即外部記錄和內部記錄間的對應性。此映象都是在外模式中描述。
(18)數據獨立性:在數據庫技術中,數據獨立性是指應用程序和數據之間相互獨立,不受影響。數據獨立性分成物理數據獨立性和邏輯數據獨立性兩級。
(19)物理數據獨立性:如果數據庫的內模式要進行修改,即數據庫的存儲設備和存儲方法有所變化,那么模式/內模式映象也要進行相應的修改,使概念模式盡可能保持不變。也就是對模式的修改盡量不影響概念模式。
(20)邏輯數據獨立性:如果數據庫的概念模式要進行修改(如增加記錄類型或增加數據項),那么外模式/模式映象也要進行相應的修改,使外模式盡可能保持不變。也就是對概念模式的修改盡量不影響外模式和應用程序。
(21)宿主語言:在數據庫技術中,編寫應用程序的語言仍然是一些高級程序設計語言,這些語言稱為宿主語言(host language),簡稱主語言。
(22)DDL:數據定義語言(Data Definition Language),用于定義數據庫的三級結構,包括外模式、概念模式、內模式及其相互之間的映象,定義數據的完整性、安全控制等約束。
(23)DML:數據操縱語言(Data Manipulation Language),由DBMS提供,用于讓用戶或程序員使用,實現對數據庫中數據的操作。DML分成交互型DML和嵌入型DML兩類。依據語言的級別,DML又可分成過程性DML和非過程性DML兩種。
(24)交互型DML:如果DML自成系統,可在終端上直接對數據庫進行操作,這種DML稱為交互型DML。
(25)嵌入型DML:如果DML嵌入在主語言中使用,此時主語言是經過擴充能處理DML語句的語言,這種DML稱為嵌入型DML。
(26)過程性DML:用戶編程時,不僅需要指出“做什么”(需要什么樣的數據),還需要指出“怎么做”(怎么獲得數據)。層狀、網狀的DML屬于過程性語言。
(27)非過程性DML:用戶編程時,只需要指出“做什么”,不需要指出“怎么做”。
Notice:以上關于DML的各個概念單獨出現時,首先要解釋DML的含義。
(28)DD:數據字典(Data Dictionary),數據庫系統中存放三級結構定義的數據庫稱為數據字典。對數據庫的操作都要通過訪問DD才能實現。
(29)DD系統:管理DD的實用程序稱為“DD系統”。
1.2 文件系統階段的數據管理有些什么缺陷?試舉例說明。
文件系統有三個缺陷:
(1)數據冗余性(redundancy)。由于文件之間缺乏聯系,造成每個應用程序都有對應的文件,有可能同樣的數據在多個文件中重復存儲。
(2)數據不一致性(inconsistency)。這往往是由數據冗余造成的,在進行更新操作時,稍不謹慎,就可能使同樣的數據在不同的文件中不一樣。
(3)數據聯系弱(poor data relationship)。這是由文件之間相互獨立,缺乏聯系造成的。
1.3 數據庫階段的數據管理有些什么特點?
(1)采用復雜的數據模型表示數據結構
(2)有較高的數據獨立性(數據結構分成用戶的邏輯結構、整體邏輯結構和物理結構三級)
(3)數據庫系統為用戶提供方便的用戶接口,可以使用查詢語言、終端命令或程序方式操作數據,也可以用程序方式操作數據庫。
(4)系統提供了四個方面的數據控制功能:數據庫的恢復、并發控制、數據完整性和數據安全性,以保證數據庫中數據是安全的、正確的和可靠的。
(5)對數據的操作不一定以記錄為單位,還可以數據項為單位,增加了系統的靈活性。
1.4 你怎樣理解實體、屬性、記錄、字段這些概念的類型和值的差別?試舉例說明。
實體(entity):是指客觀存在可以相互區別的事物。實體可以是具體的對象,如:一個學生,一輛汽車等;也可以是抽象的事件,如:一次借書、一場足球賽等。
屬性(attribute):實體有很多特性,每一個特性稱為屬性。每個屬性有一個值域,其類型可以是整數型、實數型、字符串型。比如,學生(實體)有學號、姓名、年齡、性別等屬性,相應值域為字符、字符串、整數和字符串型。
字段(field):標記實體屬性的命名單位稱為字段或數據項。它是可以命名的最小信息單位,所以又稱為數據元素或初等項。字段的命名往往和屬性名相同,比如,學生有學號、姓名、年齡、性別等字段。
記錄(record):字段的有序集合稱為記錄。一般用一個記錄描述一個實體,所以記錄又可以定義為能完整地描述一個實體的字段集。如:一個學生記錄,由有序的字段集(學號、姓名、年齡、性別等)組成。
1.5 邏輯記錄與物理記錄,邏輯文件與物理文件有些什么聯系和區別?
聯系:
(1)邏輯記錄與物理記錄都是記錄,是字段的有序集合;
(2)邏輯文件與物理文件都是文件,是同一類記錄的匯集。
區別:
(1)邏輯記錄與邏輯文件是邏輯數據描述,物理記錄與物理文件是物理數據描述。
(2)物理數據描述是指數據在存儲設備上的存儲方式,物理記錄、物理文件(還有物理聯系、物理結構等術語),都是用來描述實際存儲設備上的數據。
(3)邏輯數據描述是指程序員或用戶用以操作的數據形式,是抽象的概念化數據。邏輯記錄、邏輯文件(還有邏輯聯系、邏輯結構等術語),都是用戶觀點的數據描述。
1.6 為某百貨公司設計一個ER模型。
百 貨管轄若干個連鎖商店,每家商店經營若干商品,每家商店有若干職工,但每個職工只能服務于一家商店。實體類型“商店”的屬性有:商店編號,店名,店址,店經理。實體類型“商品”的屬性有:商品編號,商品名,單價,產地。實體類型“職工”的屬性有:職工編號,職工名,性別,工資。在聯系中應反映出職工參加某商店工作的開始時間,商店銷售商品的月銷售量。
試畫出反映商店、商品、職工實體類型及聯系類型的ER圖,并將其轉換成關系模式集。
實體:商店(商店編號,店名,店址,店經理)
商品(商品編號,商品名,單價,產地)
職工(職工編號,職工名,性別,工資)
聯系:SC(商店—商品之間1:N的聯系,聯系屬性為“職工參加商店工作的開始時間”。
SE(商店—職工之間1:N的聯系),聯系屬性為“月銷售量”。
關系模式集:商店模式(商店編號,店名,店址,店經理)
商品模式(商品編號,商品名,單價,產地,商店編號,月銷售量)
職工模式(職工編號,職工名,性別,工資,商店編號,開始時間)
1.7 試述ER模型、層次模型、網狀模型、關系模型和面向對象模型的主要特點。
ER模型的主要特點:
(1)優點:接近于人的思維,容易理解;與計算機無關,用戶容易接受。
(2)缺點:只能說明實體間語義的聯系,不能進一步說明詳細的數據結構。
層次模型的特點:
(1)優點:記錄之間的聯系通過指針實現,查詢效率較高。
(2)缺點:只能表示1:N聯系,實現M:N結構較復雜;由于層次順序的嚴格和復雜,引起數據的查詢和更新操作也很復雜。
網狀模型的特點:
(1)優點:記錄之間聯系通過指針實現,M:N聯系也容易實現(每個M:N聯系可拆成兩個1:N聯系),查詢效率較高。
(2)缺點:編寫應用程序比較復雜,程序員必須熟悉數據庫的邏輯結構。
關系模型的特點:
用關鍵碼而不是用指針導航數據,表格簡單,用戶易懂,編程時并不涉及存儲結構、訪問技術等細節。
1.8 試述概念模式在數據庫結構中的重要地位。
概念模式是數據庫中
全部數據的整體邏輯結構的描述。它由若干個概念記錄類型組成。概念模式不僅要描述概念記錄類型,還要描述記錄間的聯系、操作、數據的完整性、安全性等要求。數據按外模式的描述提供給用戶,按內模式的描述存儲在磁盤中,而概念模式提供了連接這兩級的相對穩定的中間觀點,并使得兩級的任何一級的改變都不受另一級的牽制。
1.9 數據獨立性與數據聯系這兩個概念有什么區別?
數據獨立性是指應用程序與數據之間相互獨立,不受影響。
數據聯系是指同一記錄內部各字段間的聯系,以及記錄之間的聯系。
1.10 試述DBMS在用戶訪問數據庫過程中所起的作用.用戶對數據庫進行操作,DBMS把操作從應用程序帶到外部級、概念級、再導向內部級,進而操作存儲器中的數據。
(結合P22“用戶訪問數據的過程”來理解)
1.11 試述DBMS的主要功能。
DBMS的主要功能有:
(1)數據庫的定義功能
(2)數據庫的操縱功能
(3)數據庫的保護功能
(4)數據庫的存儲管理
(5)數據庫的維護功能
(6)數據字典
1.12 試敘DBMS對數據庫的保護功能。
DBMS對數據庫的保護主要通過四個方面實現:
(1)數據庫的恢復。
(2)數據庫的并發控制。
(3)數據庫的完整性控制。
(4)數據庫的安全性控制。
1.13 試敘DBMS對數據庫的維護功能。
DBMS中有一些程序提供給數據庫管理員運行數據庫系統時使用,這些程序起著數據庫維護的功能。
主要有四個實用程序:
(1)數據裝載程序(loading)
(2)備份程序(backup)
(3)文件重組織程序
(4)性能監控程序
1.14 從模塊結構看,DBMS由哪些部分組成?
從模塊結構看,DBMS由兩大部分組成:查詢處理器和存儲管理器
(1)查詢處理器有四個主要成分:DDL編譯器,DML編譯器,嵌入型DML的預編譯器,查詢運行核心程序
(2)存儲管理器有四個主要成分:授權和完整性管理器,事務管理器,文件管理器,緩沖區管理器
(以上幾題具體可參照書上p20-21)
1.15 DBS由哪幾個部分組成?
DBS由四部分組成:數據庫、硬件、軟件、數據庫管理員。
1.16 什么樣的人是DBA?DBA應具有什么素質?DBA的職責是什么?
DBA是控制數據整體結構的人,負責DBS的正常運行。DBA可以是一個人,在大型系統中也可以是由幾個人組成的小組。DBA承擔創建、監控和維護整個數據庫結構的責任。
DBA應具有下列素質:
(1)熟悉企
業全部數據的性質和用途;
(2)對用戶的需求有充分的了解;
(3)對系統的性能非常熟悉。
DBA的主要職責有五點:
(1)概念模式定義
(2)內模式定義
(3)根據要求修改數據庫的概念模式和內模式
(4)對數據庫訪問的授權
(5)完整性約束的說明
1.17 試對DBS的全局結構作詳細解釋。
參照教材p24-25。
1.18 使用DBS的用戶有哪幾類? 使用DBS的用戶有四類:
1)DBA
2)專業用戶
3)應用程序員
4)最終用戶
1.19 DBMS的查詢處理器有哪些功能?
DBMS的查詢處理器可分成四個成分:
1)DML編譯器
2)嵌入型DML的預編譯器
3)DDL編譯器
4)查詢運行核心程序
(各成分功能參照P24)
1.20 DBMS的存儲處理器有哪些功能?
DBMS的存儲處理器提供了應用程序訪問數據庫中數據的界面,可分成四個成分:
1)授權和完整性管理器
2)事務管理器
3)文件管理器
4)緩沖區管理器
(各成分功能參照P25)
1.21 磁盤存儲器中有哪四類主要的數據結構?
數據文件:存儲了數據庫中的數據;
數據字典(DD):存儲三級結構的描述;
索引文件:為提高查詢速度而設置的邏輯排序手段;
統計數據組織:存儲DBS運行時統計分析數據。
(1)關系模型:用二維表格結構表示實體集,外鍵表示實體間聯系的數據模型稱為關系模型。
(2)關系模式:關系模式實際上就是記錄類型。它的定義包括:模式名,屬性名,值域名以及模式的主鍵。關系模式不涉及到物理存儲方面的描述,僅僅是對數據特性的描述。
(3)關系實例:元組的集合稱為關系和實例,一個關系即一張二維表格。
(4)屬性:實體的一個特征。在關系模型中,字段稱為屬性。
(5)域:在關系中,每一個屬性都有一個取值范圍,稱為屬性的值域,簡稱域。
(6)元組:在關系中,記錄稱為元組。元組對應表中的一行;表示一個實體。
(7)超鍵:在關系中能唯一標識元組的屬性集稱為關系模式的超鍵。
(8)候選鍵:不含有多余屬性的超鍵稱為候選鍵。
(9)主鍵:用戶選作元組標識的一個候選鍵為主鍵。(單獨出現,要先解釋“候選鍵”)
(10)外鍵:某個關系的主鍵相應的屬性在另一關系中出現,此時該主鍵在就是另一關系的外鍵,如有兩個關系S和SC,其中S#是關系S的主鍵,相應的屬性S#在關系SC中也出現,此時S#就是關系SC的外鍵。
(11)實體完整性規則:這條
規則要求關系中元組在組成主鍵的屬性上不能有空值。如果出現空值,那么主鍵值就起不了唯一標識元組的作用。
(12)參照完整性規則: 這條規則要求“不引用不存在的實體”。其形式定義如下:如果屬性集K是關系模式R1的主鍵,K也是關系模式R2的外鍵,那么R2的關系中,K的取值只允許有兩種可能,或者為空值,或者等于R1關系中某個主鍵值。這條規則在使用時有三點應注意: 1)外鍵和相應的主鍵可以不同名,只要定義在相同值域上即可。2)R1和R2也可以是同一個關系模式,表示了屬性之間的聯系。3)外鍵值是否允許空應視具體問題而定。
(13)過程性語言:在編程時必須給出獲得結果的操作步驟,即“干什么”和“怎么干”。如Pascal和C語言等。
(14)非過程性語言:編程時只須指出需要什么信息,不必給出具體的操作步驟。各種關系查詢語言均屬于非過程性語言。
(15)無限關系:當一個關系中存在無窮多個元組時,此關系為無限關系。如元組表達式{t|┐R(t)}表示所有不在關系R中的元組的集合,這是一個無限關系。
(16)無窮驗證:在驗證公式時需對無窮多個元組進行驗證就是無窮驗證。如驗證公式(u)(P(u))的真假時需對所有的元組u進行驗證,這是一個無窮驗證的問題。
2.2 為什么關系中的元組沒有先后順序?
因為關系是一個元組的集合,而元組在集合中的順序無關緊要。因此不考慮元組間的順序,即沒有行序。
2.3 為什么關系中不允許有重復元組?
因為關系是一個元組的集合,而集合中的元素不允許重復出現,因此在關系模型中對關系作了限制,關系中的元組不能重復,可以用鍵來標識唯一的元組。
2.4 關系與普通的表格、文件有什么區別?
關系是一種規范化了的二維表格,在關系模型中,對關系作了下列規范性限制:
1)關系中每一個屬性值都是不可分解的。
2)關系中不允許出現相同的元組(沒有重復元組)。
3)由于關系是一個集合,因此不考慮元組間的順序,即沒有行序。
4)元組中,屬性在理論上也是無序的,但在使用時按習慣考慮列的順序。
2.5 笛卡爾積、等值聯接、自然聯接三者之間有什么區別?
笛卡爾積對兩個關系R和S進行乘操作,產生的關系中元組個數為兩個關系中元組個數之積。
等值聯接則是在笛卡爾積的結果上再進行選擇操作,從關系R和S的笛卡兒積中選擇對應屬性值相等的元組;
自然連接則是在等值聯接(以所有公共屬性值相等為條件)的基礎上再行投影操作,并去掉重復的公共屬性列。當兩個關系沒有公共屬性時,自然連接就轉化我笛卡爾積。
2.8 如果R是二元關
系,那么下列元組表達式的結果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}
這個表達式的意思是:從關系R中選擇元組,該元組滿足:第1分量值或第2分量值至少有一個不等于其他某元組。由于R是二元關系,只有兩個分量,由于沒有重復元組,上述條件顯然滿足。所以,這個表達式結果就是關系R。
2.9 假設R和S分別是三元和二元關系,試把表達式π1,5(σ2=4∨3=4(R×S))轉換成等價的:(1)漢語查詢句子;(2)元組表達式;(3)域表達式。
(1)漢語表達式:
從R×S關系中選擇滿足下列條件的元組:
第2分量(R中第2分量)與第4分量(S中第1分量)值相等,或第3分量(R中第3分量)與第4分量(S中第1分量)值相等;并取第1列與第5列組成的新關系。
(2)元組表達式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])}(3)域表達式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))}
2.10 假設R和S都是二元關系,試把元組表達式{t|R(t)∧(u)(S(u)∧u[1]≠t[2])}轉換成等價的:(1)漢語查詢句子;(2)域表達式:(3)關系代數表達式。
(1)漢語表達式:選擇R關系中元組第2分量值不等于S關系中某元組第1分量值的元組。
(2)域表達式:{xy|(u)(v)(R(xy)∧S(uv)∧(u≠y))}(3)關系代數表達式:π1,2(σ2≠3(R×S))
2.11 試把域表達式{ab|R(ab)∧R(ba)}轉換成等價的:
(1)漢語查詢句子;(2)關系代數表達式;(3)元組表達式。
(1)漢語查詢句子:選擇R中元組第1分量值與第2分量值互換后仍存在于R中的元組。
(2)關系代數表達式:π1,2(σ1=4∧2=3(R×R));
(3)元組表達式:{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])}
試用關系代數表達式表示下列查詢語句。(見下一題)
2.14 試用元組表達式表示上題中各個查詢語句。
(1)檢索LIU老師所授課程的課程號、課程名。
πC#,CNAME(σTEACHER='LIU'(C))
{t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])}
(2)檢索年齡大于23歲的男學生的學號與姓名。
πS#,SNAME(σAGE>'23'∧SEX='男'(S))
{t|(u)(S(u)∧u[3]>'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])}
(3)檢索學號為S3學生所學課程的課程名與任課教師名。πCNAME,TEACHER(σS#='S3'(SCC))
{t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])}
(4)檢索至少選修LIU老
師所授課程中一門課程的女學生的姓名。
πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC))
{t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])}
(5)檢索WANG同學不學的課程號。
πC#(C)-πC#(σSNAME='WANG'(SSC))
或者,πC#(SC)-πC#(σSNAME='WANG'(SSC))(全部課程號減去WANG同學所學的課程號){t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])}
(從C中選擇滿足條件的元組:SC中的所有元組,如果學號與C中所選元組相同的話,其在S中對應的姓名肯定不是'wang'。)
Notice:“p1=>p2”的含義是:如果p1為真,則p2為真。
(6)檢索至少選修兩門課程的學生學號。
πS#(σ1=4∧2≠5(SC×SC))
SC自乘之后,再選擇(同一個學號中兩個課程號不同的元組),投影。
{t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]}
(7)檢索全部學生都選修的課程的課程號與課程名。
πC#,CNAME(C(πS#,C#(SC)÷πS#(S)))(涉及到全部值時,應用除法,“除數”是“全部”){t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])}
(8)檢索選修課程包含LIU老師所授課程的學生學號。
πS#(σTEACHER='LIU'(SCC))
{t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])}
如果LIU老師有多門課程,則選修課程包含LIU老師所授全部課程的學生學號為:
πS#,C#(SC)÷πC#(σTEACHER='LIU'(C))
2.15 在教學數據庫S、SC、C中,用戶有一查詢語句:檢索女同學選修課程的課程名和任課教師名。(1)試寫出該查詢的關系代數表達式;(2)試寫出查詢優化的關系代數表達式。
(1)πCNAME,TEACHER(σSEX='女'(SSCC))
(2)優化為:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S))))
(基本思路:盡量提前做選擇操作;在每個操作后,應做個投影操作,去掉不用的屬性值。
2.16 在2.15題中,(1)畫出該查詢初始的關系代數表達式的語法樹。
(2)使用2.4.4節的優化算法,對語法樹進行優化,并畫出優化后的語法樹。
該查詢初始的關系代數表達式的語法樹
優化后的語法樹
2.17 為什么要對關系代數表達式進行優化?
在關系代數運算中,各個運算所費時間和空間是不一樣的。如何安排若干關系的運算操作步驟,直接影響到整個操作所需要的時間和空間。對關系代數表達式進行優化,可以提高系統的操作效率,達到執行過程即省時間又省空間的目的。
3.1 名詞解釋
(1)SQL模式:SQL模式是表和授權的靜態定義。一個SQL模式定義為基本表的集合。一個由模式名和模式擁有者的用戶名或賬號來確定,并包含模式中每一個元素(基本表、視圖、索引等)的定義。
(2)SQL數據庫:SQL(Structured Query Language),即‘結構
式查詢語言’,采用英語單詞表示和結構式的語法規則。一個SQL數據庫是表的匯集,它用一個或多個SQL模式定義。
(3)基本表:在SQL中,把傳統的關系模型中的關系模式稱為基本表(Base Table)。基本表是實際存儲在數據庫中的表,對應一個關系。
(4)存儲文件:在SQL中,把傳統的關系模型中的存儲模式稱為存儲文件(Stored File)。每個存儲文件與外部存儲器上一個物理文件對應。
(5)視圖:在SQL中,把傳統的關系模型中的子模式稱為視圖(View),視圖是從若干基本表和(或)其他視圖構造出來的表。
(6)行:在SQL中,把傳統的關系模型中的元組稱為行(row)。
(7)列:在SQL中,把傳統的關系模型中的屬性稱為列(coloumn)。
(8)實表:基本表被稱為“實表”,它是實際存放在數據庫中的表。
(9)虛表:視圖被稱為“虛表”,創建一個視圖時,只把視圖的定義存儲在數據詞典中,而不存儲視圖所對應的數據。
(10)相關子查詢:在嵌套查詢中出現的符合以下特征的子查詢:子查詢中查詢條件依賴于外層查詢中的某個值,所以子查詢的處理不只一次,要反復求值,以供外層查詢使用。
(11)聯接查詢:查詢時先對表進行笛卡爾積操作,然后再做等值聯接、選擇、投影等操作。聯接查詢的效率比嵌套查詢低。
(12)交互式SQL:在終端交互方式下使用的SQL語言稱為交互式SQL。
(13)嵌入式SQL:嵌入在高級語言的程序中使用的SQL語言稱為嵌入式SQL。
(14)共享變量:SQL和宿主語言的接口。共享變量有宿主語言程序定義,再用SQL的DECLARE語句說明,SQL語句就可引用這些變量傳遞數據庫信息。
(15)游標:游標是與某一查詢結果相聯系的符號名,用于把集合操作轉換成單記錄處理方式。
(16)卷游標:為了克服游標在推進時不能返回的不便,SQL2提供了卷游標技術。卷游標在推進時不但能沿查詢結果中元組順序從頭到尾一行行推進,也能一行行返回。
3.2 對于教學數據庫的三個基本表
學生 S(S#,SNAME,AGE,SEX)
學習SC(S#,C#,GRADE)
課程 C(C#,CNAME,TEACHER)
試用SQL的查詢語句表達下列查詢:
(1)檢索LIU老師所授課程的課程號和課程名。
SELECT C#,CNAME
FROM C
WHERE TEACHER=‘LIU’
(2)檢索年齡大于23歲的男學生的學號和姓名。
SELECT S#,SNAME
FROM S
WHERE(AGE>23)AND(SEX=‘M’)
(3)檢索至少選修LIU老師所授課程中一門課程的女學生姓名。
SELECT SNAME
FROM S
WHERE SEX=‘F’ AND S# IN
(SELECT S#
FROM SC
WHERE C# IN
(SELECT C#
OM C
WHERE TEACHER=‘LIU’)
NOTICE:有多種寫法,比如聯接查詢寫法:
SELECT SNAME
FROM S,SC,C
WHERE SEX=‘F’ AND SC.S#=S.S#
AND SC.C#=C.C#
AND TEACHER='LIU' 但上一種寫法更好一些。
(4)檢索WANG同學不學的課程的課程號。
SELECT C#
FROM C
WHERE C# NOT IN
(SELECT C#
FROM SC
WHERE S# IN
(SELECT S#
FROM S
WHERE SNAME='WANG'))
FR
(5)檢索至少選修兩門課程的學生學號。
SELECT DISTINCT X.SNO
FROM SC X,SC Y
WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:對表SC進行自連接,X,Y是SC的兩個別名。
(6)檢索全部學生都選修的課程的課程號與課程名。
SELECT C#,CNAME
FROM C
WHERE NOT EXISTS
(SELECT *
FROM S
WHERE S# NOT IN
(SELECT *
FROM SC
WHERE SC.C#=C.C#))
要從語義上分解:(1)選擇課程的課程號與課程名,不存在不選這門課的同學。
其中,“不選這門課的同學”可以表示為:
SELECT *
FROM S
WHERE S# NOT IN
(SELECT *
FROM SC
WHERE SC.C#=C.C#)
或者
SELECT *
FROM S
WHERE
NOT EXISTS
(SELECT *
FROM SC
WHERE S.S#=C.S# AND
SC.C#=C.C#)
(7)檢索選修課程包含LIU老師所授課的學生學號。
SELECT DISTINCT S#
FROM SC
WHERE C# IN
(SELECT C#
FROM C
WHERE TEACHER='LIU'))
3.3 設有兩個基本表R(A,B,C)和S(D,E,F),試用SQL查詢語句表達下列關系代數表達式:
(1)πA(R)
(2)σB='17'(R)
(3)R×S
(4))πA,F(σC=D(R×S))(1)SELECT A FROM R
(2)SELECT * FROM R WHERE B='17'(3)SELECT A,B,C,D,E,F FROM R,S
(4)SELECT A,F FROM R,S WHERE R.C=S.D
3.4 3.4 設有兩個基本表R(A,B,C)和S(A,B,C)試用SQL查詢語句表達下列關系代數表達式:
(1)R∪S
(2)R∩S
(3)R-S
(4)πA,B(R)πB,C(S)
(1)SELECT A,B,C
FROM R
UNION
SELECT A,B,C
FROM S
(2)SELECT A,B,C
FROM R
INTERSECT
SELECT A,B,C
FROM S
(3)SELECT A,B,C
FROM R
WHERE NOT EXISTS
(SELECT A,B,C
FROM S
WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)
(4)SELECT R.A,R.B,S.C
FROM R,S
WHE
RE R.B=S.B
3.5 試敘述SQL語言的關系代數特點和元組演算特點。
(P61-62)
3.6 試用SQL查詢語句表達下列對教學數據庫中三個基本表S、SC、C的查詢:
(1)統計有學生選修的課程門數。
SELECT COUNT(DISTINCT C#)FROM SC
(2)求選修C4課程的學生的平均年齡。
SELECT AVG(AGE)
FROM S
WHERE S# IN
(SELECT S#
FROM SC
WHERE C#='C4')或者,SELECT AVG(AGE)
FROM S,SC
WHERE S.S#=SC.S# AND C#='004'
(3)求LIU老師所授課程的每門課程的學生平均成績。
SELECT CNAME,AVG(GRADE)
FROM SC ,C
WHERE SC.C#=C.C# AND TEACHER='LIU'
GROUP BY C#
(4)統計每門課程的學生選修人數(超過10人的課程才統計)。要求輸出課程號和選修人數,查詢結果按人數降序排列,若人數相同,按課程號升序排列。
SELECT DISTINCT C#,COUNT(S#)
FROM SC
GROUP BY C#
HAVING COUNT(S#)>10
ORDER BY 2 DESC, C# ASC
(5)檢索學號比WANG同學大,而年齡比他小的學生姓名。
SELECT X.SNAME
FROM S AS X, S AS Y
WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE (6)檢索姓名以WANG打頭的所有學生的姓名和年齡。 SELECT SNAME,AGE FROM S WHERE SNAME LIKE 'WANG%' (7)在SC中檢索成績為空值的學生學號和課程號。 SELECT S#,C# FROM SC WHERE GRADE IS NULL (8)求年齡大于女同學平均年齡的男學生姓名和年齡。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>(SELECT AVG(AGE)FROM S AS Y WHERE Y.SEX='女') (9)求年齡大于所有女同學年齡的男學生姓名和年齡。 SELECT SNAME,AGE FROM S AS X WHERE X.SEX='男' AND X.AGE>ALL(SELECT AGE FROM S AS Y WHERE Y.SEX='女') 3.7 試用SQL更新語句表達對教學數據庫中三個基本表S、SC、C的各個更新操作: (1)往基本表S中插入一個學生元組(‘S9’,‘WU’,18)。 INSERT INTO S(S#,SNAME,AGE)VALUES('59','WU',18) (2)在基本表S中檢索每一門課程成績都大于等于80分的學生學號、姓名和性別,并把檢索到的值送往另一個已存在的基本表STUDENT(S#,SANME,SEX)。 INSERT INTO STUDENT(S#,SNAME,SEX) SELECT S#,SNAME,SEX FROM S WHERE NOT EXISTS (SELECT * FROM SC WHERE GRADE<80 AND S.S#=SC.S#) (3)在基本表SC中刪除尚無成績的選課元組。 DELETE FROM SC WHERE GRADE IS NULL(4)把WANG同學的學習選課和成績全部刪去。 DELE TE FROM SC WHERE S# IN (SELECT S# FROM S WHERE SNAME='WANG') (5)把選修MATHS課不及格的成績全改為空值。 UPDATE SC SET GRADE=NULL WHERE GRADE<60 AND C# IN (SELECT C# FROM C WHERE CNAME='MATHS') (6)把低于總平均成績的女同學成績提高5%。 UPDATE SC SET GRADE=GRADE*1.05 WHERE GRADE<(SELECT AVG(GRADE)FROM SC)AND S# IN(SELECT S# FROM S WHERE SEX='F') (7)在基本表SC中修改C4課程的成績,若成績小于等于75分時提高5%,若成績大于75分時提高4%(用兩個UPDATE語句實現)。 UPDATE SC SET GRADE=GRADE*1.05 WHERE C#='C4' AND GRADE<=75 UPDATE SC SET GRADE=GRADE*1.04 WHERE C#='C4' AND GRADE>75 3.8 在第1章例1.4中提到“倉庫管理”關系模型有五個關系模式: 零件 PART(P#,PNAME,COLOR,WEIGHT) 項目 PROJECT(J#,JNAME,DATE) 供應商 SUPPLIER(S#,SNAME,SADDR) 供應 P_P(J#,P#,TOTOAL) 采購 P_S(P#,S#,QUANTITY) (1)試用SQL DDL語句定義上述五個基本表,并說明主鍵和外鍵。 CREATE TABLE PART (P# CHAR(4)NOT NULL,PNAME CHAR(12)NOT NULL,COLOR CHAR(10),WEIGHT REAL,PRIMARY KEY(P#)) CREATE TABLE PROJECT (J# CHAR(4)NOT NULL,JNAME CHAR(12)NOT NULL,DATE DATE,PRIMARY KEY(J#)) CREATE TABLE SUPLIER (S# CHAR(4)NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20),PRIMARY KEY(S#)) CREATE TABLE P_P (J# CHAR(4),P# CHAR(4),TOTAL INTEGER,PRIMARY KEY(J#,P#),FOREIGN KEY(J#)REFERENCE PROJECT(J#),FOREIGN KEY(P#)REFERENCE PART(P#)) CREATE TABLE P_S (P# CHAR(4),S# CHAR(4),QUANTITY INTEGER,PRIMARY KEY(P#,S#),FOREIGN KEY(P#)REFERENCE PART(P#),FOREIGN KEY(S#)REFERENCE SUPLIER(S#)) (2)試將PROGECT、P_P、PART三個基本表的自然聯接定義為一個視圖VIEW1,PART、P_S、SUPPLIER 三個基本表的自然聯接定義為一個視圖VIEW2。 CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL) AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL FROM PROJECT,PART,P_P WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J #CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY) AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUA NTITY FROM PART,P_S,SUPPLIER WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S# (3)試在上述兩個視圖的基礎上進行數據查詢: 1)檢索上海的供應商所供應的零件的編號和名字。 SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI' 2)檢索項目J4所用零件的供應商編號和名字。 SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4') 3.9 對于教學數據庫中基本表SC,已建立下列視圖: CREATE VIEW S_GRADE(S#,C_NUM,AVG_GRADE) AS SELECT S#,COUNT(C#),AVG(GRADE) FROM SC GROUP BY S# 試判斷下列查詢和更新是否允許執行。若允許,寫出轉換到基本表SC上的相應操作。 (1)SELECT * FROM S_GRADE 允許 SELECT S#,COUNT(C#),AVG(GRADE)FROM SC GROUP BY S# (2)SELECT S#,C_NUM FROM S_GRADE WHERE AVG_GRADE>80 允許 SELECT S#,COUNT(C#)FROM SC WHERE AVG(GRADE)>80 (3)SELECT S#,AVG_GRADE FROM S_GRADE WHERE C_NUM>(SELECT C_NUM FROM S_GRADE WHERE S#=‘S4’) 允許 SELECT S#,AVG(GRADE) FROM SC AS X WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#)FROM SC AS Y WHERE Y.S#='S4') GROUP BY S# (4)UPDATE S_GRADE SET C_NUM=C_NUM+1 WHERE S#=‘S4’ 不允許 (5)DELETE FROM S_GRADE WHERE C_NUM>4 不允許 3.10 預處理方式對于嵌入式SQL的實現有什么重要意義? 預處理方式是先用預處理程序對源程序進行掃描,識別出SQL語句,并處理成宿主語言的函數調用形式;然后再用宿主語言的編譯程序把源程序編譯成目標程序。這樣,不用擴充宿主語言的編譯程序,就能處理SQL語句。 3.11 在宿主語言的程序中使用SQL語句有哪些規定? 在宿主語言的程序中使用SLQ語句有以下規定: (1)在程序中要區分SQL語句與宿主語言語句 (2)允許嵌入的SQL語句引用宿主語言的程序變量(稱為共享變量),但有兩條規定: 1)引用時,這些變量前必須加“:”作為前綴標識,以示與數據庫中變量有區別。 2)這些變量由宿主語言的程序定義,并用SQL的DECLARE語句說明。 (3)SQL的集合處理方式與宿主語言單記錄處理方式之間要協調。需要采用 游標機制,把集合操作轉換成單記錄處理方式。 3.12 SQL的集合處理方式與宿主語言單記錄處理方式之間如何協調? 由于SQL語句處理的是記錄集合,而宿主語言語句一次只能處理一個記錄,因此需要用游標(cousor)機制,把集合操作轉換成單記錄處理方式。 2.13 嵌入式SQL語句何時不必涉及到游標?何時必須涉及到游標? (1)INSERT、DELETE、UPDATE語句,查詢結果肯定是單元組時的SELECT語句,都可直接嵌入在主程序中使用,不必涉及到游標。 (2)當SELECT語句查詢結果是多個元組時,此時宿主語言程序無法使用,一定要用游標機制把多個元組一次一個地傳送給宿主語言處理。 4.1 名詞解釋 (1)函數依賴:FD(function dependency),設有關系模式R(U),X,Y是U的子集,r是R的任一具體關系,如果對r的任意兩個元組t1,t2,由t1[X]=t2[X]導致t1[Y]=t2[Y], 則稱X函數決定Y,或Y函數依賴于X,記為X→Y。X→Y為模式R的一個函數依賴。 (2)函數依賴的邏輯蘊涵:設F是關系模式R的一個函數依賴集,X,Y是R的屬性子集,如果從F中的函數依賴能夠推出X→Y,則稱F邏輯蘊涵X→Y,記為F|=X→Y。 (3)部分函數依賴:即局部依賴,對于一個函數依賴W→A,如果存在XW(X包含于W)有X→A成立,那么稱W→A是局部依賴,否則稱W→A為完全依賴。 (4)完全函數依賴:見上。 (5)傳遞依賴:在關系模式中,如果Y→X,X→A,且XY(X不決定Y),AX(A不屬于X),那么稱Y→A是傳遞依賴。 (6)函數依賴集F的閉包F+: 被邏輯蘊涵的函數依賴的全體構成的集合,稱為F的閉包(closure),記為F+。 (7)1NF: 第一范式。如果關系模式R的所有屬性的值域中每一個值都是不可再分解的值, 則稱R是屬于第一范式模式。如果某個數據庫模式都是第一范式的,則稱該數據庫存模式屬于第一范式的數據庫模式。第一范式的模式要求屬性值不可再分裂成更小部分,即屬性項不能是屬性組合和組屬性組成。 (8)2NF: 第二范式。如果關系模式R為第一范式,并且R中每一個非主屬性完全函數依賴于R的某個候選鍵,則稱是第二范式模式;如果某個數據庫模式中每個關系模式都是第二范式的,則稱該數據庫模式屬于第二范式的數據庫模式。(注:如果A是關系模式R的候選鍵的一個屬性,則稱A是R的主屬性,否則稱A是R的非主屬性。) (9)3NF:第三范式。如果關系模式R是第二范式,且每個非主屬性都不傳遞依賴于R的候選鍵,則稱R是第三范式的模式。如果某個數據庫模式中的每個關系模式都是第三范式,則稱為3NF的數據庫模式。 (10)BCNF:BC范式。如果關系模式R是第一范式,且每個屬性都不傳遞依賴于R的候選鍵,那么稱R 是BCNF的模式。 (11)4NF:第四范式。設R是一個關系模式,D是R上的多值依賴集合。如果D中成立非平凡多值依賴X→→Y時,X必是R的超鍵,那么稱R是第四范式的模式。 (12)推理規則的正確性和完備性:正確性是指,如果X→Y是從推理規則推出的,那么X→Y在F+中。完備性是指,不能從F使用推理規則導出的函數依賴不在F+中。 (13)依賴集的覆蓋和等價:關系模式R(U)上的兩個函數依賴集F和G,如果滿足F+=G+,則稱F和G是等價的。如果F和G等價,則可稱F覆蓋G或G覆蓋F。 (14)最小依賴集:如果函數集合F滿足以下三個條件:(1)F中每個函數依賴的右部都是單屬性;(2)F中的任一函數依賴X→A,其F-{X→A}與F是不等價的;(3)F中的任一函數依賴X→A,Z為X的子集,(F-{X→A})∪{Z→A}與F 不等價。則稱F為最小函數依賴集合,記為Fmin。 (15)無損聯接:設R是一關系模式,分解成關系模式ρ={R1,R2...,Rk},F是R上的一個函數依賴集。如果對R中滿足F的每一個關系r都有r=πR1(r)πR2(r)...πRk(r)則稱這個分解相對于F是“無損聯接分解”。 (16)保持依賴集:所謂保持依賴就是指關系模式的函數依賴集在分解后仍在數據庫中保持不變,即關系模式R到ρ={R1,R2,...,Rk}的分解,使函數依賴集F被F這些Ri上的投影蘊涵。 (17)多值依賴:設R(U)是屬性集U上的一個關系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分別代表屬性集X,Y,Z的值,只要r是R的關系,r中存在元組(x,y1,z1)和(x,y2,z2)時,就也存在元組(x,y1,z2)和(x,y2,z1),那么稱多值依賴(MultiValued Dependency MVD)X→→Y在關系模式R中成立。 4.2 關系模式R有n個屬性,在模式R上可能成立的函數依賴有多少個? 其中平凡的函數依賴有多少個?非平凡的函數依賴有多少個? (要考慮所有可能的情況,數學排列組合問題。對于數據庫本身而言,本題沒多大意義) 所有屬性相互依賴時,函數依賴最多。 · 平凡的函數依賴:對于函數依賴X→Y,如果YX,那么稱X→Y是一個“平凡的函數依賴”。 4.3 建立關于系、學生、班級、社團等信息的一個關系數據庫,一個系有若干個專業,每個專業每年只招一個班,每個班有若干個學生,一個系的學生住在同一宿舍區,每個學生可以參加若干個社團,每個社團有若干學生。 描述學生的屬性有:學號、姓名、出生年月、系名、班級號、宿舍區。 描述班級的屬性有:班級號、專業名、系名、人數、入校年份。 描述系的屬性有:系名、系號、系辦公地點、人數。 描述社團的屬性有:社團名、成立年份、地點、人數、學生參加某社團的年份。 請給出關系模式,寫出每個關系模式的最小函數依賴集,指出是否存在傳遞函數依賴,對于函數依賴左部是多屬性的情況,討論函數依賴是完全函數依賴還是部分函數依賴。指出各關系的候選鍵、外部鍵,有沒有全鍵存在? 各關系模式如下: 學生(學號,姓名,出生年月,系名,班級號,宿舍區) 班級(班級號,專業名,系名,人數,入校年份) 系(系名,系號,系辦公地點,人數) 社團(社團名,成立年份,地點,人數) 加入社團(社團名,學號,學生參加社團的年份) 學生(學號,姓名,出生年月,系名,班級號,宿舍區) ●“學生”關系的最小函數依賴集為: Fmin={學號→姓名,學號→班級號,學號→出生年月,學號→系名,系名→宿舍區} ●以上關系模式中存在傳遞函數依賴,如:學號→系名,系名→宿舍區 ●候選鍵是學號,外部鍵是班級號,系名。 notice: 在關系模式中,如果Y→X,X→A,且XY(X不決定Y),A不屬于X,那么稱Y→A是傳遞依賴。 班級(班級號,專業名,系名,人數,入校年份) ●“班級”關系的最小函數依賴集為: Fmin={(系名,專業名)→班級號,班級號→人數,班級號→入校年份,班級號→系名,班級號→專業名} (假設沒有相同的系,不同系中專業名可以相同)●以上關系模式中不存在傳遞函數依賴。 ●“(系名,專業名)→班級號”是完全函數依賴。 ●候選鍵是(系名,專業名),班級號,外部鍵是系名。 系(系名,系號,系辦公地點,人數) ●“系”關系的最小函數依賴集為: Fmin={系號→系名,系名→系辦公地點,系名→人數,系名→系號} ●以上關系模式中不存在傳遞函數依賴 ●候選鍵是系名,系號 社團(社團名,成立年份,地點,人數) ●“社團”關系的最小函數依賴集為: Fmin={社團名→成立年份,社團名→地點,社團名→人數) ●以上關系模式中不存在傳遞函數依賴。 ●候選鍵是社團名 加入社團(社團名,學號,學生參加社團的年份) ●“加入社團”關系的最小函數依賴集為: Fmin={(社團名,學號)→學生參加社團的年份)●“(社團名,學號)→學生參加社團的年份”是完全函數依賴。 ●以上關系模式中不存在傳遞函數依賴。 ●候選鍵是(社團名,學號)。 4.4 對函數依賴X→Y的定義加以擴充,X和Y可以為空屬性集,用φ表示,那么X→φ,φ→Y,φ→φ的含義是什么? 根據函數依賴的定義,以上三個表達式的含義為: (1)一個關系模式R(U)中,X,Y是U的子集,r是R的任一具體關系,如果對r的任意兩個元組t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空屬性函數依賴于X。這是任何關系中都存在的。 (2)φ→Y表示Y函數依賴于空屬性。由此可 知該關系中所有元組中Y屬性的值均相同。 (3)φ→φ表示空屬性函數依賴于空屬性。這也是任何關系中都存在的。 4.5 已知關系模式R(ABC),F={A→C,B→C},求F+。 可以直接通過自反律、增廣律、傳遞律加以推廣: F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC} 4.6 試分析下列分解是否具有無損聯接和保持函數依賴的特點: (1)設R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。 首先,檢查是否具有無損聯接特點: 第1種解法--算法4.2: (1)構造表 (2)根據A→B進行處理 結果第二行全是a行,因此分解是無損聯接分解。 第2種解法:(定理4.8)設 R1=AB,R2=AC R1∩R2=A R2-R1=B ∵A→B,∴該分解是無損聯接分解。 然后,檢查分解是否保持函數依賴 πR1(F1)={A→B,以及按自反率推出的一些函數依賴} πR2(F1)={按自反率推出的一些函數依賴} F1被πR1(F1)所蘊涵,∴所以該分解保持函數依賴。 (2)設R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC} 首先,檢查是否具有無損聯接特點: 第1種解法(略) 第2種解法:(定理4.8)設 R1=AB,R2=AC R1∩R2=A R2-R1=C ∵A→C,∴該分解是無損聯接分解。 然后,檢查分解是否保持函數依賴 πR1(F2)={按自反率推出的一些函數依賴} πR2(F2)={A→C,以及按自反率推出的一些函數依賴} ∵F1中的B→C沒有被蘊涵,所以該分解沒有保持函數依賴。 (3)設R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}.首先,檢查是否具有無損聯接特點: 第1種解法: (1)構造表 (2)根據A→B進行處理 沒有一行全是a行。因此這個分解不具有無損聯接特性。 第2種解法:(定理4.8) 設 R1=AB,R2=BC R1∩R2=B R2-R1=C,R1-R2=A ∵B→C,B→A不在F3中 ∴該分解不具有無損聯接特性。 然后,檢查分解是否保持函數依賴 πR1(F3)={A→B,以及按自反率推出的一些函數依賴} πR2(F3)={按自反率推出的一些函數依賴} F1被πR1(F3)所蘊涵,所以該分解保持函數依賴。 (4)設R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC} 首先,檢查是否具有無損聯接特點: 第1種解法(略) 第2種解法:(定理4.8) 設 R1=AC,R2=BC R1(AC)∩R2(BC)=C R2-R1=B,R1-R2=A ∵C→B,C→A不在F4中 ∴該分解不具有無損聯接特性。 然后,檢查分解是否保持函數依賴 πR1(F2)={按自反率推出的一些函數依賴} πR2(F2)={B→C,以及按自反率推出的一些函數依賴} ∵F1中的A→B沒有被蘊涵,所以該分解沒有保持函數依賴。 4.7 設R=ABCD,R上的函數依賴集F={A→B,B→C,A→D,D→C},R的一個分解ρ={AB,AC,AD},求:(1)F在ρ的每個模式上的投影。(2)ρ相對于F是無損聯接分解嗎?(3)ρ保持依賴嗎?(1) πAB(F)={A→B,及按自反律所推導出的一些平凡函數依賴} πAC(F)={A→C,及按自反律所推導出的一些平凡函數依賴} πAD(F)={A→D,及按自反律所推導出的一些平凡函數依賴}(2) (1)構造表 (2)根據A→B,B→C,A→D,D→C進行處理 每一行都是a,ρ相對于F是無損聯接分解。 (3)πAB(F)∪πAC(F)∪πAD(F)={A→B,A→C,A→D}, 沒有滿足B→C,D→C函數依賴,因此ρ相對于F的這個分解不保持函數依賴。 4.8 設R=ABCD,R上的F={A→C,D→C,BD→A}, 試證明ρ={AB,ACD,BCD}相對于F不是無損聯接分解。 根據算法4.2 (1)構造表 (2)根據A→C,D→C,BD→A進行處理 沒有一行都是a,所以,ρ相對于F不是無損聯接分解。 4.9 設R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。 (1)若首先把R分解成{ACD,BD},試求F在這兩個模式上的投影。 (2)ACD和BD是BCNF嗎?如果不是,請進一步分解。 (1)πACD(F)={A→C} πBD(F)={D→B} (2)因為根據BCNF的定義,要求關系模式是第一范式,且每個屬性都不傳遞依賴于R的侯選鍵。BCD中(A,D)為候選鍵,可是(A,D)→A, A→C,所以它不是BCNF模式。 它可進一步分解為:{AC,DC},此時AC,DC均為BCNF模式。 BD是BCNF,因為R2(BD)是第一范式,且每個屬性都不傳遞依賴于D(候選鍵),所以它是BCNF模式。 4.10 設R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D}; (1)如果F1是R上的函數依賴集,此時ρ是無損聯接分解嗎?若不是,試舉出反例。 (2)如果F2是R上的函數依賴集呢? (1)不是無損聯接??捎伤惴?.2判斷或由定理4.8判斷。 根據算法4.2 (1)構造表 (2)根據A→B,B→C進行處理 結果沒有出現一行全a的情況,所以它不是無損聯接。舉例如下: 設模式R的一關系r為{(a1b1c1d1),(a2b2c1d2)} 則有:r1=πAB(r)={(a1b1),(a2b2)} r2=πBC(r)={(b1c1),(b2c1)} r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={(a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a,所以ρ不是無損聯接。 (2)如果F2是R上的函數依賴,則可以判斷,ρ是無損聯接。判斷過程同上。 4.11 設關系模式R(S#,C#,GRADE,TNAME,TADDR),其屬性分別表示學生學號、選修課程的編號,成績、任課教師地址等意義。如果規定,每個學生每學一門課只有一個成績; 每門課只有一個教師任教;每個教師只有一個地址(此處不允許教師同名同姓)。 (1)試寫出關系模式R基本的函數依賴和候選鍵。 (2)試把R分解成2NF模式集并說明理由。 (3)試把R分解成3NF模式集,并說明理由。 (1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR} 侯選鍵是(S#,C#)。 (2)在模式R中,TNAME不完全依賴于鍵(S#,C#),因此需進行分解,可分解為下列兩個關系。 SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后,SC中,GRADE完全依賴于侯選鍵(S#,C#),在C中,主屬性是C#,TNAME、TADDR均完全依賴于C#。因此,該分解符合2NF模式。 (3)3NF:若每個關系模式是2NF,則每個非主屬性都不傳遞于R的候選鍵。 按上述已分好的兩個模式,SC中已滿足“每個非主屬性都不傳遞于R的候選鍵”,已是3NF,而在C中,C#→TNAME,TNAME→TADDR,TADDR傳遞依賴于C#,因此還需分成兩個模式:CT(C#,TNAME), T(TNAME,TADD)。 分解后,總共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三個模式。 該分解符合3NF模式。 4.12 圖4.6表示一個公司各部門的層次結構,對每個部門,數據庫中包含部門號(唯一的)D#,預算費(BUDGET)以及此部門領導人員的職工號(唯一的)E#等信息。對每一個部門,還存有部門的全部職工,生產科研項目以及辦公室的信息。 職工信息包括:職工號,他所參加的生產科研項目號(J#),他所在辦公室的電話號(PHONE#)。 生產科研項目包含:項目號(唯一的),預算費。 辦公室信息包含:辦公室號(唯一的),面積。 對每個職工,數據庫中有他曾擔任過的職務以及擔任某一職務時的工資歷史。對每個辦公室包含此辦公室中全部電話號嗎的信息。 請給出你認為合理的數據依賴,把這個層次結構轉換成一組規范化的關系。 提示:此題可分步完成,先轉換成一組1NF的關系,然后逐步轉換成2NF,3NF,...。 先得到一個泛關系的模式如下: D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area} D#:部門號, Manager_E#:部門領導人員的職工號, E#:職工號, J#:生產科研項目號, Phone#:辦公室的電話號,Business:職工職務,Sa_History:工資歷史,Office#:辦公室號,Area:辦公室面積 根據所給信息,給出下列數據依賴: F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#,Office#→Area,Office→D#,#Phone#→Office#}(假設一個部門可能有多個辦公室,有多個項目,一個辦公室只屬于一個部門,有多部電話,一個員工只參加一個項目,一個項目可能屬于多個部門) 只要保證每個屬性值不可分割,以上范式即為1NF。候選鍵為(E#,Business,Phone#) 轉換成2NF關系(消除局部依賴): Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget) 對應 F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#} History(E#,Business,History) 對應 F={(E#,Business)→Sa_History} Phone(Phone#,Office#) 對應 F={Phone#→Office#} 轉換成3NF關系(消除非主屬性對侯選鍵的傳遞依賴): Department(D#,Manager_E#)Office(Office#,Area,D#)Emproee(E#,J#,Office#) History(E#,Business,History)Phone(Phone#,Office#)Project(J#,Budget) 注意:由于對題意理解的不同,可能答案不唯一。 4.13 設關系模式R(ABC)上有一個多值依賴A→→B。如果已知R的當前關系中存在三組(ab1c1)、(ab2c2)和(ab3c3),那么這個關系中至少還應存在哪些元組? 從多值依賴的定義可以得出,至少應存在下列元組: (ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2) 5.1 名詞解釋 (1)數據庫設計:數據庫設計是指對于一個給定的應用環境,提供一個確定最優數據模型與處理模式的邏輯設計,以及一個確定數據庫存儲結構與存取方法的物理設計,建立起既能反映現實世界信息和信息聯系,滿足用戶數據要求和加工要求,又能被某個數據庫管理系統所接受,同時能實現系統目標,并有效存取數據的數據庫。 (2)數據庫工程:指數據庫應用系統的開發,它是一項軟件工程,但有數據庫應用自身的特點。(3)評審:在數據庫設計過程中,評審的目的是為了確認某一階段的任務是否全部完成,避免重大的疏漏或錯誤,并在生存期的早期階段給予糾正,以減少系統研制的成本。 (4)數據字典:是對系統中數據的詳盡描述,它提供對數據庫數據描述的集中管理。它的處理功能是存儲和檢索元數據,并且為數據庫管理員提供有關的報告。對數據庫設計來說,數據字典是進行詳細的數據收集和數據分析所獲得的主要成果。數據字典主要包括四個部分:數據項、數據結構、數據流、數據存儲。 5.2 數據系統的生存期分成哪幾個階段?數據庫結構的設計在生存期中的地位如何? 分成七個階段 :規劃、需求分析、概念設計、邏輯設計、物理設計、實現、運行和維護。 數據庫結構的設計在生存期中的地位很重要,數據庫結構的設計包括邏輯設計、物理設計,邏輯設計把概念模式轉化為與選用的具體機器上的DBMS所支持的數據模型相符合的邏輯結構,而物理設計主要是設計DB在物理設備上的存儲結構與存取方法等。 5.3 什么是數據庫設計?數據庫設計過程的輸入和輸出有哪些內容? 數據庫設計是指對于一個給定的應用環境,提供一個確定最優數據模型與處理模式的邏輯設計,以及一個確定數據庫存儲結構與存取方法的物理設計,建立起既能反映現實世界信息和信息聯系,滿足用戶數據要求和加工要求,又能被某個數據庫管理系統所接受,同時能實現系統目標,并有效存取數據的數據庫。 數據庫設計過程的輸入包括四部分內容:1)總體信息需求;2)處理需求;(3)DBMS的特征;(4)硬件和OS(操作系統)特征。 數據庫設計過程的輸出包括兩部分: (1)完整的數據庫結構,其中包括邏輯結構和物理結構; (2)基于數據庫結構和處理需求的應用程序的設計原則。這些輸出一般以說明書的形式出現。 5.4 基于數據庫系統生存期的數據庫設計分成哪幾個階段? 分為5個階段:簡記為(規需概邏物):規劃、需求分析、概念設計、邏輯設計和物理設計五個階段。 5.5 什么是比較好的數據庫設計方法?數據庫設計方法應包括哪些內容? 一個好的數據庫設計方法應該能在合理的期限內,以合理的工作量產生一個有實用價值的數據庫結構。 一種實用的數據庫設計方法應包括以下內容:設計過程、設計技術、評價準則、信息需求、描述機制。 5.6 數據庫設計的規劃階段應做哪些事情? 數據庫設計中的規劃階段的主要任務是進行建立數據庫的必要性及可行性分析,確定數據庫系統在組織中和信息系統中的地位,以及各個數據庫之間的聯系。 5.7 數據庫設計的需求分析階段是如何實現的?目標是什么? 數據庫設計的需求分析通過三步來完成:即需求信息的收集、分析整理和評審。 其目的在于對系統的應用情況作全面詳細的調查,確定企業組織的目標,收集支持系統總的設計目標的基礎數據和對這些數據的要求,確定用戶的需求,并把這些要求寫成用戶和數據設計者都能夠接受的文檔。 5.8 評審在數據庫設計中有什么重要作用?為什么允許設計過程中有多次的回溯與反復? 評審的作用在于確認某一階段的任務是否全部完成,通過評審可以及早發現系統設計中的錯誤,并在生存期的早期階段給予糾正,以減少系統研制的成本。 如果在數據庫已經實現時再發現設計中的錯誤,那么代價比較大。因此應該允許設計過程的回溯與反復。設計過程需要根據評審意見修改所提交的階段設計成果,有時修改甚至要回溯到前面的某一階段,進行部分乃至全部重新設計。 5.9 數據字典的內容和作用是什么? 數據字典的內容一般包括:數據項、數據結構、數據流、數據存儲和加工過程。 其作用是對系統中數據做出詳盡的描述,提供對數據庫數據的集中管理。 5.10 對概念模型有些什么要求? 對概念模型一般有以下要求: (1)概念模型是對現實世界的抽象和概括,它應真實、充分地反映現實世界中事物和事物之間的聯系,具有豐富的語義表達能力,能表達用戶的各種需求,包括描述現實世界中各種對象及其復雜聯系、用戶對數據對象的處理要求和手段。 (2)概念模型應簡潔、明晰,獨立于機器、容易理解、方便數據庫設計人員與應用人員交換意見,使用戶能積極參與數據庫的設計工作。 (3)概念模型應易于變動。當應用環境和應用要求改變時,容易對概念模型修改和補充。 (4)概念模型應很容易向關系、層次或網狀等各種數據模型轉換,易于從概念模式導出也DBMS有關的邏輯模式。 5.11 概念設計的具體步驟是什么? 概念設計的主要步驟為: (1)進行數據抽象、設計局部概念模式; (2)將局部概念模式綜合成全局概念模式; (3)評審。 (具體解釋參見教材p131) 5.12 什么是數據抽象?主要有哪兩種形式的抽象?數據抽象在數據庫設計過程中起什么作用? 數據抽象是對人、物、事或概念的人為處理,它抽取人們關心的共同特性,忽略非本質的細節,并把這些特性用各種概念精確地加以描述,這些概念組成了某種模型。 數據抽象有兩種形式: (1)系統狀態的抽象,即抽象對象; (2)系統轉換的抽象,即抽象運算。 數據抽象是概念設計中非常重要的一步。通過數據抽象,可以將現實世界中的客觀對象首先抽象為不依賴任何具體機器的信息結構。 5.13 什么是ER圖?構成ER圖的基本要素是什么? ER圖是用來表示數據庫概念設計ER模型的工具,它提供了表示實體、屬性和聯系的方法。 構成ER圖的基本要素是實體、屬性和聯系。 5.14 試述采用ER方法的數據庫概念設計的過程.利用ER方法進行數據庫的概念設計,可分成三步進行: 首先設計局部ER模式,然后把各局部ER模式綜合成一個全局ER模式,最后對全局ER模式進行優化,得到最終的ER模式,即概念模式。 5.15 邏輯設計的目的是什么?試述邏輯設計過程的輸入和輸出 環境。 邏輯設計的目的是把概念設計階段設計好的基本ER圖轉換為與選用的具體機器上的DBMS所支持的數據模型相符合的邏輯結構(包括數據庫模式和外模式)。 邏輯設計過程中的輸入信息有: (1)獨立于DBMS的概念模式,即概念設計階段產生的所有局部和全局概念模式; (2)處理需求,即需求分析階段產生的業務活動分析結果; (3)約束條件,即完整性、一致性、安全性要求及響應時間要求等; (4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序語法的形式規則。 邏輯設計過程輸出的信息有: (1)DBMS可處理的模式; (2)子模式; (3)應用程序設計指南; (4)物理設計指南。 5.16 試述邏輯設計階段的主要內容。 邏輯設計主要是把概念模式轉換成DBMS能處理的模式。轉換過程中要對模式進行評價和性能測試,以便獲得較好的模式設計。 邏輯設計的主要步驟包括: (1)初始模式的形成(2)子模式設計 (3)應用程序設計梗概 (4)模式評價 (5)修正模式。 5.17 規范化理論對數據庫設計有什么指導意義? 在概念設計階段,已經把關系規范化的某些思想用作構造實體類型和聯系類型的標準,在邏輯設計階段,仍然要使用關系規范化的理論來設計模式和評價模式。規范化的目的是減少乃至消除關系模式中存在的各種異常,改善完整性,一致性和存儲效率。 5.18 什么是數據庫結構的物理設計?試述其具體步驟。 數據庫結構的物理設計是指對一個給定的邏輯數據模型選取一個最適合應用環境的物理結構的過程,所謂數據庫的物理結構主要指數據庫在物理設備上的存儲結構和存取方法。 物理設計的步驟為: (1)設計存儲記錄結構,包括記錄的組成、數據項的類型和長度,以及邏輯記錄到存儲記錄的映射; (2)確定數據存儲安排; (3)設計訪問方法,為存儲在物理設備上的數據提供存儲和檢索的能力; (4)進行完整性和安全性的分析、設計; (5)程序設計。 5.19 數據實現階段主要做哪幾件事情? 數據庫實現階段的主要工作有以下幾點: (1)建立實際數據庫結構 (2)試運行 (3)裝入數據 (具體解釋參見教材p150) 5.20 什么是數據的再組織設計?試述其重要性。 對數據的概念模式、邏輯結構或物理結構的改變稱作數據再組織。 數據再組織,通常是由于環境,需求的變化或性能原因而進行的,如信息定義的改變,增加新的數據類型,對原有的數據提出了新的使用要求,改用具有不同物理特征的新存儲設備以及數據庫性能下降等都要求進行數據庫的重新組織。 5.21 數據系 統投入運行后,有哪些維護工作? 數據系統投入運行后,主要維護工作有: (1)維護數據庫的安全性與完整性控制及系統的轉儲和恢復; (2)性能的監督、分析與改進; (3)增加新功能; (4)發現錯誤,修改錯誤 6.1 名詞解釋 (1)事務:事務是指一個操作序列,這些操作要么什么都做,要么都不做,是一個不可分割的工作單位,是數據庫環境中的邏輯工作單位,相當于操作系統環境下的“進程”概念。 (2)封鎖:封鎖就是事務可以向系統發出請求,對某個數據對象加鎖,此事務對這個數據對象有一定控制,而其他事務則不能更新數據直到事務釋放它的鎖為止。 (3)X封鎖:如果事務T對數據R實現X封鎖,那么其他的事務要等T解除X封鎖以后,才能對這個數據進行封鎖。只有獲準X封鎖的事務,才能對被封鎖的數據進行修改。 (4)PX協議:X封鎖的規則稱為PX協議,其內容為:任何企圖更新記錄R的事務必須先執行LOCK X(R)操作,以獲得對該記錄進行尋址的能力,并對它取得X封鎖。如果未獲得X封鎖,那么這個事務進入等待狀態,一直到獲準X封鎖,事務繼續進行。 (5)PXC協議:它由PX協議及一條規則“X封鎖必須保留到事務終點(COMMIT或ROLLBACK)”組成。(6)死鎖:有兩個或以上的事務處于等待狀態,每個事務都在等待另一個事務解除封鎖,它才能繼續執行下去,結果任何一個事務都無法執行,這種現象就是死鎖。 (7)串行調度:多個事務依次執行,稱為串行調度。 (8)并發調度:利用分時的方法,同時處理多個事務,稱為事務的并發調度。 (9)可串行化調度:如果某事務集的一個并發調度的結果與某個串行調度等價,則稱此并發調度是是可串行化調度。 (10)不可串行化調度:某事務集的一個并發調度結果,如果與任一串行調度均不等價,則該并發調度是不可串行化調度。 (11)S封鎖:共享型封鎖。果事務T對某數據R加上S封鎖,那么其它事務對數據R的X封鎖便不能成功,而對數據R的S封鎖請求可以成功。這就保證了其他事務可以讀取R但不能修改R,直到事務T釋放S封鎖。 (12)PS協議: 任何要更新記錄R的事務必須先執行LOCK S(R)操作,以獲得對該記錄尋址的能力并對它取得S封鎖。如果未獲準S封鎖,那么這個事務進入等待狀態,一直到獲準S封鎖,事務才繼續進行下去。當事務獲準對記錄R的S封鎖后,在記錄R修改前必須把S封鎖升級為X封鎖。 (13)PSC協議:由PS協議和“將S封鎖保持到事務終點”組成。任何更新記錄R的事務必須先執行LOCK S(R)操作,以獲得對該記錄尋址的能力并對它取得S封鎖。如果未獲準S封鎖,那么這個事務進入等待狀態,一直到 獲準S封鎖,事務才繼續進行下去。并將S封鎖保持到事務終點。 (14)兩段封鎖協議:(1)在對任何數據進行讀寫操作之前,事務首先要獲得對該數據的封鎖;(2)在釋放一個封鎖之后,事務不再獲得任何其他封鎖。 6.2 試敘事務的四個性質,并解釋每一個性質對DBS有什么益處? 事務的四個性質是:原子性、一致性、隔離性和持久性。 (1)原子性(具體含義見教材):事務中所有操作應視為整體,不可分割。 (2)一致性(具體含義見教材):一個事務獨立執行的結果將保證數據庫的一致性,即數據不會因事務的執行而遭受破壞。 (3)隔離性(具體含義見教材):隔離性要求在并發事務被執行時,系統應保證與這些事務先后單獨執行時結果一樣,使事務如同在單用戶環境下執行一樣。 (4)持久性(具體含義見教材):要求事務對數據庫的所有更新應永久地反映在數據庫中。 6.3 事務的COMMIT操作和ROLLBACK操作各做些什么事情? COMMIT操作表示事務成功地結束(提交),此時告訴系統,數據庫要進入一個新的正確狀態,該事務對數據庫的所有更新都已交付實施。 ROLLBACK操作表示事務不成功地結束,此時告訴系統,已發生錯誤,數據庫可能處在不正確的狀態,該事務對數據庫的更新必須被撤銷,數據庫應恢復該事務到初始狀態。 6.4 UNDO操作和REDO操作各做些什么事情? UNDO操作是反向掃描“日志”文件,撤銷對數據庫的更新操作,使數據庫恢復到更新前的狀態; REDO操作正向掃描日志文件,重新做一次更新,使數據庫恢復到更新后的狀態。 6.5 DBS中有哪些類型的故障?哪些故障破壞了數據庫? 哪些故障未破壞數據庫,但其中某些數據變得不正確? 數據庫系統故障有事務故障、系統故障、介質故障。 其中介質故障破壞數據庫,事務故障、系統故障未破壞數據庫但使其中某些數據變得不正確。 6.6 什么是“運行記錄優先原則”?其作用是什么? 在數據庫系統中,寫一個修改到數據庫中和寫一個表示這個修改的登記記錄到日志文件中是兩個不同的操作,在這兩個操作之間有可能發生故障。這時,如果先寫了數據庫修改,而在運行記錄中沒有登記這個修改,則以后就無法恢復這個修改,那么以后也就無法撤消這個修改。為了安全起見,采用“運行記錄優先原則”。它包括兩點: (1)至少要等相應運行記錄已經寫入“日志”文件后,才能允許事務往數據庫中寫記錄。 (2)直至事務的所有運行記錄都已寫入運行“日志”文件后,才能允許事務完成“END TRANSACTION”處理。 采用“運行記錄優先原則”,可以保證所做的操作都記錄在日志中,便于故障處理,維護數據庫的一致性。 6.7 什么是數據庫的恢復?恢復的基本原則是什么,恢復如何實現? 數據庫的恢復是指當數據庫系統發生故障時,通過一些技術,使數據庫從被破壞、不正確的狀態恢復到最近一個正確的狀態。 恢復的基本原則就是冗余,即數據的重復存儲?;謴偷某S梅椒ㄓ校海?)定期對整個數據庫進行復制或轉儲;(2)建立日志文件;(3)恢復。用REDO或UNDO處理。 6.8 數據庫的并發操作會帶來哪些問題?如何解決? 數據庫的并發操作會帶來三類問題: (1)丟失更新問題;(具體內容見教材P158) (2)不一致分析問題 (3)“臟數據”的讀出。 解決的辦法通常是采用“封鎖”技術。 6.9 有哪些“丟失更新”問題?如何處理? (1)并發調度引起的“丟失更新”問題。在并發調度中,如兩個事務同時對某數據庫進行更新操作,在操作中丟失了其中某個事務對某數據的更新操作。處理的辦法就是對并發操作采用X封鎖技術。 (2)由恢復引起的更新丟失現象。采用X封鎖以后,先執行事務T1,再執行事務T2,此時,如果T2做ROLLBACK操作,就把事務T2的更新丟失了。處理方式是采用PXC協議,不允許事務T1執行解鎖操作直到事務執行到終點(COMMIT或ROLLBACK)。 6.10 為什么DML只提供解除S封鎖的操作,而不提供解除X封鎖的操作? 為了防止由恢復引起的更新丟失現象,PXC協議規定:X封鎖必須保留到事務終點(COMMIT或ROLLBACK)。因此在DML中,COMMIT或ROLLBACK的語義中包含了X封鎖的解除,不用提供解除X封鎖的操作。 而對于S封鎖而言,它是一種共享型的封鎖(讀取但不能修改),其數據不可能是未提交的修改,封鎖不必等提交后才能解除,因此可以由事務用UNLOCK解除各自對數據的封鎖。 6.11 為什么有些封鎖需保留到事務終點,而有些封鎖可隨時解除? 因為有的封鎖需要更新數據,保留到終點才能確認是否提交或回退以避免臟數據的讀出,所以這些封鎖需要保留到事務終點。 而有些事務全部或部分操作只是讀取數據,不涉及更新數據操作,因此這一部分操作的封鎖可以隨時解除。 6.12 死鎖的發生是壞事還是好事?試說明理由。如何解除死鎖狀態? 死鎖的發生即是壞事又是好事。 (1)使并發事務不能繼續執行下去,造成時間開銷卻不產生結果。 (2)在某些時候我們要利用它來解決更新操作導致的數據庫不一致狀態。 解除死鎖狀態:抽出某個事務作為犧牲品,把它撤消,做回退操作,解除它的所有封鎖,并恢復到初始狀態。 6.13 試敘述“串行調度”與“可串行化調度”的區別。 串行調 度是多個事務按照一定的次序依次執行;在某一時刻只有一個事務在執行。 而可串行化調度是并發調度中的一個概念。在并發調度中,某一時刻有多個事務同時被處理。如果某事務集的一個并發調度的結果與某個串行調度等價,則稱此并發調度是是可串行化調度。 (以上幾題具體可參照書上p20-21) 6.14 什么是數據庫的完整性? DBMS的完整性子系統的功能是什么? 數據庫的完整性是指數據的正確性和相容性。DBMS完整性子系統的功能是: (1)監督事務的執行,并測試是否違反完整性規則; (2)如有違反,則采取恰當的操作,如拒絕、報告違反情況,改正錯誤等方法進行處理。 6.15 完整性規則由哪幾個部分組成?關系數據庫的完整性規則有哪幾類? 完整性規則由三部分組成: 觸發條件:即什么時候使用規則進行檢查; 約束條件:即要檢查什么樣的錯誤; ELSE子句:即查出錯誤后該如何處理。 完整性規則有以下三類: 域完整性規則,用于定義屬性的取值范圍; 域聯系的規則,定義一個或多個關系中,屬性值間的聯系、影響和約束。 關系完整性規則,定義更新操作對數據庫中值的影響和限制。 6.16 試詳述SQL中的完整性約束機制? SQL中的完整性約束規則有主鍵約束、外鍵約束、屬性值約束和全局約束等多種形式。 △主鍵約束。它是數據中最重要的一種約束。在關系中主鍵值不允許空,也不允許出現重復,體現了關系要滿足實體完整性規則。主鍵可用主鍵子句或主鍵短語進行定義。 △ 外鍵約束。根據參照完整性規則,依賴關系中外鍵或者為空值,或者是基本關系(參照關系)中的該鍵的某個值。外鍵用外鍵關系子句定義,并考慮刪除基本關系元組或修改基本關系的主鍵值的影響,依賴關系可按需要采用RESTRICT、SET NULL、CASCADE方式。 △屬性值約束。當要求某個屬性的值不允許空值時,那么可以在屬性定義后加上關鍵字:NOT NULL,這是非空值約束。還可以用CHECK子句對一個屬性值加以限制以及使用域約束子句CREAT DOMAIN 定義新域并加以屬性值檢查。 △全局約束。在關系定義時,可以說明一些比較復雜的完整性約束,這些約束涉及到多個屬性間的聯系 或不同關系間的聯系,稱為全局約束。主要有基于元組的檢查子句和斷言。前者是對單個關系的元組值加以約束,后者則可對多個關系或聚合操作有關的完整性約束進行定義。 6.17 參照完整性規則在SQL可以用哪幾種方式實現?刪除基本關系的元組時,依賴關系可以采取的做法有哪三種?修改基本關系的主鍵值時,依賴關系可以采取的做法有哪三種? 參照完整性規 則要求“不引用不存在的實體”,參照完整性規則在SQL可用以下幾種方式實現: (1)在SQL中采用外鍵子句定義外鍵,并考慮刪除基本關系元組或修改基本關系的主鍵值,對依賴關系產生的影響; (2)在屬性值上進行約束如基于屬性的檢查; (3)全局約束中的基于元組的檢查子句等。 刪除基本關系元組或修改基本關系的主鍵值時,依賴關系可以采用的做法有: △RESTRICT方式:只有當依賴關系中沒有一個外鍵值與基本關系中要刪除/修改的主鍵值相對應時,系統才能執行刪除/修改操作,否則拒絕刪除或修改。 △SET NULL方式:刪除基本元組時,將依賴關系中所有與基本關系中被刪除主鍵值相對應的外鍵值置為空值。修改基本關系的主鍵值時,將依賴關系中所有與基本關系中被修改主鍵值相對應的外鍵值置為空值。 △CASCADE方式:若刪除則將依賴關系中所有外鍵值與基本關系中要刪除的主鍵值相對應的元組一并刪除,若修改則將依賴關系中所有與基本關系中要修改的主鍵值相對應的外鍵值一并修改為新值。 6.18 試對SQL2中的基于屬性的檢查約束、基于元組的檢查約束和斷言 三種完整性約束進行比較:各說明什么對象?何時激活?能保證數據庫的一致性嗎? 約束形式 說明對象 激活條件 是否保證一致性 基于屬性的檢查 只對一個屬性值加以約束 插入或修改屬性值時 不一定 基于元組的檢查 對單個關系的元組值加以約束 在插入或修改元組時 不一定 斷言 多個關系或聚合操作 任何變動 保證 6.19 設教學數據庫的模式如下: S(S#,SNAME,AGE,SEX)SC(S#,C#,GRADE) C(C#,CNAME,TEACHER) 試用多種方式定義下列完整性約束: (1)在關系S中插入學生年齡值應在16~25歲之間 (2)在關系SC中插入元組時,其S#值和C#值必須分別在S和C中出現。 (3)在關系SC中修改GRADE值時,必須仍在0~100之間。 (4)在刪除關系C中一個元組時,首先要把關系SC中具有同樣C#的元組全部刪去。 (5)在關系S中把某個S#值修改為新值時,必須同時把關系SC中那些同樣的S#值也修改為新值。 (1)定義S時采用檢查子句: CREAT TABLE S(S# CHAR(4),SNAME char(10)NOT NULL ,AGE SMALLINT ,PRIMARY key(S#),CHECK(AGE>=16 and AGE<=25)) (2)采用外鍵子句約束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)REFERENCE C(C#)) (3)采用元組檢查 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)RE FERENCE C(C#),CHECK(GRADE>=0 and AGE<=100)) (4)采用外鍵約束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#),FOREIGN key(C#)REFERENCE C(C#)) 若改為:在刪除關系C中一個元組時,同時把關系SC中具有同樣C#的元組全部刪去,則為: ......FOREIGN key(C#)REFERENCE C(C#)ON DELETE CASCADE ......(5)采用外鍵約束 CREAT TABLE SC(S# CHAR(4),C# CHAR(4),GRADE SMALLINT,FOREIGN key(S#)REFERENCE S(S#)ON UPDATE CASCADE ,FOREIGN key(C#)REFERENCE C(C#)) 6.20 在教學數據庫的關系S、SC、C中,試用SQL2的斷言機制定義下列兩個完整性約束:(1)學生必須在選修Maths課后,才能選修其他課程。(2)每個男學生最多選修20門課程 (1) CREAT ASSERTION ASSE1 CHECK (NOT EXISTS (SELECT S FROM SC WHERE C# IN (SELECT C# FROM C WHERE CNAME<>'MATHS') AND S# NOT IN (SELECT S# FROM SC WHERE C# IN (SELECT C# FROM C WHERE CNAME='MATHS')));(2) CREAT ASSERTION ASSE2 CHECK (ALL(SELECT COUNT(SC.C#) FROM S,SC WHERE S.S#=SC.S AND SEX='M' GROUP BY S#)<=20); 6.21 什么是數據庫的安全性?有哪些安全措施? 數據庫的安全性是指保護數據庫防止不合法的使用,以免數據的泄漏、非法更改和破壞。 可以從以下方面設置數據庫的安全措施:環境級、職員級、OS級、網絡級和數據庫系統級。 (具體可參見教材P173) 6.22 對銀行的數據庫系統應采取哪些安全措施?分別屬于哪一級? 答案基本同上一題。 6.23 什么是“權限”?用戶訪問數據庫可以有哪些權限?對數據庫模式有哪些修改權限? 用戶使用數據庫的方式稱為權限。 用戶訪問數庫的權限有:讀權限、插入權限、修改權限、刪除權限。 用戶修改數據庫模式的權限有索引權限、資源權限、修改權限、撤銷權限。 6.24 試解釋權限的轉授與回收。 在數據庫系統中,為了保證數據的安全性,用戶對數據的操作必須首先從DBA處獲得權限,才能進行對數據的操作。同時數據庫系統也允許用戶將獲得的權限轉授給其他用戶,也允許把已授給其他用戶的權限再回收上來。但應保證轉授出去的權限能收得回來。 6.25 SQL 語言中的視圖機制有哪些優點? 視圖機制使系統具有三個優點:數據安全性、數據獨立性和操作簡便性。 6.26 SQL2中用戶權限有哪幾類?并作必要的解釋。 SQL2中定義了六類用戶權限,分別是: (1)SELECT :允許用戶對關系或視圖執行SELECT操作。 (2)INSERT :允許用戶對關系或視圖執行INSERT操作,如果還說明了一個屬性表,那么表示只能插入這些屬性的值,關系中其他屬性值將置為缺省值或為空值。 (3)DELETE:允許用戶對關系或視圖執行DELETE操作。 (4)UPDATE:允許用戶對關系或視圖執行UPDATE操作,如果還說明了一個屬性表,那么表示只能修改這些屬性的值,否則表示可以修改關系中任一屬性值。 (5)REFERENCES:允許用戶定義新關系時,引用其他關系的主鍵作為外鍵。 (6)USAGE:允許用戶使用定義的域。 6.27 數據加密法有些什么優點?如何實現? 數據加密可以更好地保證數據的完全性。加密采用一定的加密算法給把源文變為密文來實現。 常用的加密算法有“替換方法”和明鍵加密法。 7.1 名詞解釋 (1)集中式DBS:是指數據庫中的數據集中存儲在一臺計算機上,數據的處理集中在一臺計算機上完成。 (2)分布式DBS:是指數據存放在計算機網絡的不同場地的計算機中,每一場地都有自治處理能力并完成局部應用;而每一場地也參與(至少一種)全局應用程序的執行,全局應用程序可通過網絡通信訪問系統中的多個場地的數據。 (3)分布式DB:分布式數據庫,是指計算機網絡環境中各場地上數據庫的邏輯集合。 (4)分布式DBMS:分布式數據庫管理系統。是指分布式數據庫系統中的一組軟件,它負責管理分布環境下邏輯集成數據的存取、一致性、有效性和完備性。同時,由于數據的分布性,在管理機制還必須具有計算機網絡通信協議上的分布管理特性。 (5)局部自治性:是指有獨立處理能力并能完成的局部應用。 (6)數據分配(數據分布):是指數據計算機網絡各場地上的分配策略。 (7)數據復制:是指數據在每個場地重復存儲。 (8)數據分片:是指分布式數據庫中的數據可以被分割和復制在網絡場地的各個物理數據庫中。一般數據存放的單位不是關系而是片段,一個片段是關系的一部分。數據分片是通過關系代數的基本運算實現的。 (9)水平分片:是指按一定條件把全局關系的所有元組劃分成若干不相交的子集,每個 子集為關系的一個片段。 (10)垂直分片:把一個全局關系的屬性集分成若干子集,并在這些子集上做投影運算,每個投影為垂直分片。 (11)分布透明性:指用戶不必關系數據的邏輯分片,不必關系數據物理位置的細節,也不必關心各個場地上的數據庫的數據模型。 (12)分片透明性:分片透明性是最高層次的分布透明性,是指用戶或應用程序只對全局關系進行操作而不必考慮數據的分片。 (13)位置透明性:位置透明性位于分片視圖與分配視圖之間。是指用戶或應用程序應當了解分片情況,但不必了解片段的存儲場地。 (14)局部數據模型透明性:這個透明性位于分配視圖與局部概念視圖之間,指用戶或應用程序要了解分片及各片段存儲的場地,但不必了解局部場地上使用的是何種數據模型。 (15)復制透明性:即用戶不必關心數據庫在網絡中各個結點的數據庫復制情況,更新操作引起的波及由系統去處理。 7.2 試敘數據從集中存儲、分散存儲到分布存儲的演變過程。 早期的數據庫系統都是屬于集中式數據庫系統,數據集中存儲在一臺計算機上。該方式有一定優點,比如,價格合理,易于管理,數據冗余少等等。但是,隨著數據庫應用的不斷發展,數據庫規模不斷擴大,如采用集中存儲的數據庫,其系統的設計和操作都比較復雜,系統顯得不靈活而且安全性 也較差。因此采用了數據分散存儲的辦法,將數據庫分成多個,建立在多臺計算機上,此時的各個數據庫的管理和應用程序均是分開并獨立的。它們之間不存在數據通信聯系。隨著計算機網絡通信的發展,有可能把分散在各處的數據庫系統通過網絡通信連接起來,這樣形成的系統稱為分布式的數據庫系統,這時的數據庫雖然分別存在各地的計算機上,但它們之間通過分布式數據管理系統可以進行聯系。 7.3 與集中式DBS、分散式DBS相比,分布式DBS有哪些特點? 與集中式DBS相比,分布式DBS中數據庫的存儲是分布性的,即數據不是存儲在同一場地,而是分布存儲在多個場地。與分散式DBS相比,分布式DBS中數據庫具有“邏輯整體性”,即表面上看,分布式數據的數據庫分散在各個場地,但這些數據在邏輯上卻是一個整 體,如同一個集中式數據庫。 7.4 試解釋下列術語:同構同質型DDBS,同構異質型DDBS,異構DDBS。 (1)同構同質型DDBS:是指各個場地都采用同一類型的數據模型,并且是同一型號數據庫管理系統。 (2)同構異質型DDBS:是指各個場地都采用同一類型的數據模型,但是數據庫管理系統是不同型號的。 (3)異構型DDBS:是指各個場地的數據模型是不同的類型。 7.5 分布式數據庫系統有哪些優點和缺點? 分布式數據庫系統的優點: (1)具有靈活的體系結構 (2)適應分布式的管理和控制機構 (3)經濟性能優越 (4)系統的可靠性高、可用性好 (5)局部應用的響應速度快 (6)可擴展性好,易于集成現有系統 分布式數據庫系統的缺點: (1)系統開銷大,主要花在通信部分; (2)復雜的存取結構,原來在集中式系統中有效存取數據的技術,在分布式系統中都不再適用; (3)數據的安全生和保密性較難處理。 7.6 分布式數據庫中,“數據分配”有哪些策略?“數據分片”有哪些策略? 數據分片的準則是什么? 數據分配是指數據在計算機網絡各場地上的分配策略。包括: (1)集中式:所有數據均安排在同一個場地上。 (2)分割式:所有數據只有一份,分別被安置在若干個場地。 (3)全復制式:數據在每個場地重復存儲。 (4)混合式:數據庫分成若干可相交的子集,每一子集安置在一個或多個場地上,但是每一場地未必保存全部數據。 數據分片的方式有以下三種: (1)水平分片:按一定的條件把全局關系的所有元組劃分成若干不相交的子集,每個子集為關系的一個片段。 (2)垂直分片:把一個全局關系的屬性集分成若干子集,并在這些子集上做投影運算,每個投影為垂直分片。 (3)混合型分片:將水平分片與垂直分片方式綜合使用則為混合型分片。 數據分片應遵循的準則為: (1)完備性條件:必須把全局關系的所有數據映射到各個片段中,絕不允許發生屬于全局關系的某個數據不屬于任何一個片段。 (2)重構條件:劃分所采用的方法必須確保能夠由各個片段重建全局關系。 (3)不相交條件:要求一個全局關系被劃分后得到的各個數據片段互相不重 疊。 7.7 試敘述分布式DBS的體系結構,它有什么特征? 分布式DBS的體系結構分為四級:全局外模式、全局概念模式、分片模式和分配模式。 (1)全局外模式:它們是全局應用的用戶視圖,是全局概念模式的子集。 (2)全局概念模式:全局概念模式定義了分布式數據庫中所有數據的邏輯結構。 (3)分片模式:分片模式定義片段以及定義全局關系與片段之間的映象。這種映象是一對多的,即每個片段來自一個全局關系,而一個全局關系可分成多個片段。 (4)分配模式:片段是全局關系的邏輯部分,一個片段在物理上可以分配到網絡的不同場地上。分配模式根據數據分配策略的選擇定義片段的存放場地。 分布式DBS的分層體系結構有三個特征: (1)數據分片和數據分配概念的分離,形成了“數據分布獨立性”概念。 (2)數據冗余的顯式控制。 (3)局部DBMS的獨立性。 7.8 試敘述分布式DBMS的功能及組成。 主要功能有: (1)接受用戶請求,并判定把它送到哪里,或必須訪問哪些計算機才能滿足該請求。 (2)訪問網絡數據字典,或者至少了解如何請求和使用其中的信息。 (3)如果目標數據存儲于系統的多個計算機上,就必須進行分布式處理。 (4)通信接口功能,在用戶、局部DBMS和其他計算機的DBMS之間進行協調。 (5)在一個異構型分布式處理環境中,還需提供數據和進程移植的支持。這里的異構型是指各個場地的硬件、軟件之間存在一定差別。 DDBMS組成——應包括以下四個子系統: (1)查詢子系統 (2)完整性子系統 (3)調度子系統 (4)可靠性子系統 7.9 分布式系統中影響查詢的主要因素是什么? 分布式系統中,影響查詢的主要因素數據經網絡的傳輸時間,數據傳輸量是衡量查詢時間的一個主要指標,不同場地間的聯接操作和并操作是影響數據傳輸量的主要原因。 7.10 基于半聯接的查詢優化策略的基本思想是什么? 數據在網絡中傳輸時,如果以整個關系傳輸,則傳輸數據量大,是一種冗余的做法,而實際上,在聯接時并非每個數據都參與操作或有用。因此,考慮到不參與操作的值或無用的值不必經網絡來回傳輸,則可以減少傳輸的數據量。 15計科本《數據庫系統原理與應用》期末復習綱要 一、題型與分值分布1、2、3、4、單項選擇20題,計20分 填空題,每空1分,計10分 簡答題4小題,計20分 綜合應用題2題,計50分 (1)概念模型(ER圖),轉化成相關的關系模型并寫出主碼與外碼,并建立相關的關系表(20分)(2)T—SQL語名的作用,6小題,計30分 二、具體知識要點及課后習題 具體知識點: 第一章 1、數據庫中的數據具有哪些基本特點。(永久存儲、有組織、可共享) 2、數據庫系統具有哪些基本特點。(數據共享、數據完整性、數據獨立性及較小的冗余度) 3、4、數據庫系統與數據庫、數據庫管理系統之間的關系? 數據庫中的數據獨立性分為物理獨立性和邏輯獨立性,分別指的是什么?P11-125、6、模式 7、數據庫管理系統的功能結構為P16 數據庫系統的三級數據模式結構:邏輯模式、外模式、內數據庫系統的二級映象技術是指外模式與模式之間的映象,它不僅在三級數據模式之間建立了聯系,同時也保證了數據的獨立性。 8、數據的正確、有效和相容稱之為數據的完整性 第二章 1、信息的三種世界是指現實世界、信息世界和計算機世界(數據世界)。 2、數據庫系統的核心是數據模型,、概念模型是現實世界的第一層抽象,這一類模型中最著名的模型是實體-關系模型。 3、數據模型的三要素是:數據結構、數據操作和完整性約束條件。如“實體完整性”約束規則,要求關系中的“主碼”不允許取空值 4、數據庫系統中常見的數據模型有:層次模型、網狀模型和關系模型 5、概念模型的特點是:對現實世界的第一層抽象;與軟、硬件無關;從用戶觀點對數據建模。邏輯模型的特點是:對現實世界的第二層抽象;與硬件無關,與軟件有關;從計算機實現觀點對數據建模。第三章 1、數據庫的概念結構設計(E-R圖)P55-58: E-R模型是對現實世界的一種抽象,E-R圖的主要成分是實體、聯系和屬性;各分E-R圖之間的沖突主要有屬性沖突、命名沖突和結構沖突三類。 2、概念模型向關系模型的轉換(邏輯結構設計)P62 3、概念數據模型不依賴于任何數據庫管理系統。實體-關系模型是概念模型中最著名的一種。第四章 1、數據庫中關系的類型有基本表、視圖表和查詢表三種,它們各有何不同P91 2、關系中的基本名詞:元組、屬性、候選碼和主碼、全碼、主屬性和非主屬性P91 一個關系只有一個主碼 3、數據庫中基本關系的性質P92 4、關系的完整性 P95 5、關系操作語言的種類:關系代數語言、關系演算語言、基于映象的語言(如SQL是一種映象,是非過程化的)。SQL包含數據定義、數據操作和數據控制三種功能 5、關系模型的完整性約束有三類:實體完整性、參照完整性和用戶定義的完整性 P96 主要掌握主碼、外碼等 6、專門的關系運算:選擇、投影、連接 7、關系代數運算中,傳統的集合運算有笛卡爾積、并、交和差 8、數據庫數據具有永久存儲、有組織、可共享三個基本特點。重點掌握4.2.3用關系代數表示檢索的實例 第五章 1、SQL語句分類,按功能分為數據定義語句、數據操縱語句、數據控制語句 2、SQL的數據定義包括基本表、索引、視圖和數據庫(重點掌握視圖的建立和用SQL語句寫出查詢程序),如在關系數據庫系統中,為了簡化用戶的查詢操作,而又不增加數據的存儲空間,常用的方法是創建視圖 學會同時用SQL語言和關系代數實現下列相關操作 P119 例5- 1、5- 2、5-3 3、SQL的數據更新語句有插入(INSERT)、修改(UPDATE)與刪除(DELTE)三種 4、數據控制是系統通過對數據用戶的使用權限加以限制而保證數據安全的重要措施。SQL的數據控制語句包括授權(Grant)、收權(Revoke)和拒絕訪問(Deny)三種。用戶權限包含數據對象和操作類型兩個要素;而數據庫角色是被命名的一組與數據庫操作相關的權限,角色是權限的集合 5、利用游標進行查詢需要4種語句,分別是說明游標、打開游標、推進游標、關閉游標 第六章 1、數據庫對象包含哪些?P156 SQL Server2008的數據庫對象有很多,例如:表、視圖、角色、索引(或存儲過程、默認值、數據類型、觸發器、約束) 2、數據庫類別P157 3、數據庫對象是數據庫的邏輯文件。SQL Server2008的數據庫對象包括表、視圖、角色、索引、數據類型、默認值、存儲過程、觸發器和約束等。了解各自的含義。 4、SQL Server2008的數據庫中有3種物理文件:基本數據文件、輔助數據和日志文件 5、掌握視圖的創建和維護方法。視圖是根據子模式建立的虛擬表。視圖的有哪些優點呢? 如:視圖能夠簡化用戶的操作;視圖使用戶能以多種角度看待同一數據;視圖對重構數據庫提供了一定程度的邏輯獨立性;視圖能夠對機密數據提供安全保護 P247 6、掌握存儲過程和觸發器的創建和維護.P179 7、Trantsact-SQL語言:重點放在數據操縱語言P192 第七章 1、關系模式應滿足的基本要求P214 2、已知關系模式R及其上的相關函數依賴集合,會求出該關系模式對應的候選碼。 例1:已知關系模式R(A,B,C,D,E)及其上的函數依賴集合F={A→D,B→C,E→A },該關系模式 的候選碼是(BE) 例2:學生表(id,name,sex,age,depart_id,depart_name),存在的函數依賴是id→{name,sex,age,depart_id}; dept_id→dept_name,其滿足2NF 3、重點掌握課本習題P239 3 P240 15(1)第八章 1、數據庫安全性是指什么?P244 2、數據庫安全性控制的一般方法有哪些?P244 3、數據庫完整性是指數據的正確性和相容性。P259(1)數據完整性約束分為表級約束、元組約束和屬性約束 (2)SQL server使用約束、默認、規則和觸發器4種方法定義和實施數據庫完整性功能 4、數據庫并發控制。數據庫的并發控制就是控制數據庫,防止多用戶并發使用數據庫時造成數據錯誤和程序運行錯誤,保證數據的完整性。解決事務并發操作帶來的數據不一致性,常用封鎖機制。 5、事務的概念和特征P265 并發操作帶來的數據不一致性包括3類:丟失修改、不可重復讀和讀“臟”數據。 6、封鎖:封鎖機制作為并發控制的重要手段,利用封鎖的特性和封鎖協議,它在并發操作保證事務的隔離性,用正確的方式調度并發操作,使一個用戶事務的執行不受其他事務的干擾,從而避免造成數據的不一致。 (1)鎖的類型:排他鎖(X鎖)和共享鎖(S鎖),它們各自的特點是什么。P268(2)封鎖協議:一級封鎖協議、二級封鎖協議(如1:事務T對要修改數據必須先加X鎖,直到事務結束才釋放X鎖;對要讀取數據必須先加S鎖;如2:若事務T對數據對象A加上X鎖,則只允許T讀取和修改A,其他任何事務都不能再對A加任何類型的鎖)、三級封鎖協議; 封鎖出現的問題及解決的方法。舉例說明何謂活鎖,如何解決活鎖?P270 7、數據庫恢復技術 恢復機制涉及的兩個關鍵問題是:第一,如何建立備份數據;第二,如何利用這些備份數據實施數據恢復。建立備份數據最常用的技術是數據轉儲和登錄日志文件。 數據庫的備份方法通常有完整備份、差異備份、事務日志備份 8、何謂兩段鎖協議 P271 9、何謂“并發調度可串行化” P270;何謂“可串行化調度” P271 10、用戶權限是由兩個要素組成的,分別是數據對象和操作類型 11、數據庫角色是被命名的一組與數據庫操作相關的權限,角色是權限的集合。 課后習題1、2、3、第1章P19: 一、4;5;10 二、全部 第2章P42: 二、全部 第3章P85: 一、19、22、23 二、全部 4、第4章P111: 一、14、15、16 二、8、911、21、22、24、25、32、33 5、第5章 P127 46、7、8、第6章P176: 一、2、3 二、1、4、6、7、8、9、10、11、12 第7章P205: 二、1、6、7、8、9 第8章P252: 一、1、3、12、13、15、26 二、8、12、13、15、16、18 數據管理技術的發展經歷了3個階段:人工管理階段、文件系統階段、數據庫管理階段。數據庫的三級模式由[模式]、[外模式]、[內模式]組成。(模式又叫概念模式、邏輯模式,外模式又叫子模式、用戶模式,內模式又叫存儲模式)外模式/模式映像反映了數據的邏輯獨立性,模式/內模式映像反映了數據的物理獨立性 數據模型由數據結構、數據操作、和完整性約束三要素組成 關系模型是第二代數據庫的主要特征,其結構比較簡單,數據本身以二維表形式進行存儲,表之間的數據聯系是通過一個表的碼與另一個表的碼的連接來實現的。數據邏輯獨立性是指模式改變,外模式和應用程序不變。物理獨立性是指內模式改變,模式不變 數據庫系統中,用概念模式(即模式)描述全部數據的整體邏輯結構 數據庫系統中用戶使用的數據視圖用外模式描述,它是用戶與數據庫系統的接口 ∏是投影運算,倒寫的6字是選擇運算 笛卡爾積重點看一下P27中間部分舉的例子 記錄是字段的有序集合 字段:標記實體屬性的命名單位稱為字段如學生有學號、姓名、年齡、性別等字段 元祖:二維表中的行即記錄值稱為元祖 增刪改查語句對應的關鍵字分別為INSERT、DELETE、UPDATE、SELECT 修改表的結構使用的是ALTER TABLE語句添加一列用ADD關鍵字、修改一列用ALTER COLUMN 刪除一列用DROP COLUMN 如ALTER TABLE student ADD 身份證號 VARCHAR(18);表示修改student表的結構,在其中添加身份證號一列(主)數據文件的擴展名為.mdf ,日志文件的擴展名是.ldf 開啟事務:BEGIN TRANSATION 提交事務:COMMIT TRANSACTION 回滾事務:ROLLBACK TRANSACTION 主鍵:PRIMARY KEY 外鍵:FOREIGN KEY 實體之間的聯系有1: 1、1:m、m:n,即1對1,一對多、多對多 聚合函數: SUM:求和 MAX:求最大值 COUNT:計數 AVG:求平均值 GRANT:授權 REVOKE:收回權限 CONSTRAINT:約束 數據庫設計的步驟:需求分析階段、概念設計階段、邏輯設計階段、物理設計階段、數據庫實現階段、數據庫的運行與維護階段 事務具有四個特征原子性、一致性、隔離性、持久性 P116參考答案: 1. 題干:數據庫中有四張表客戶表:Customers、代理人表Agents、產品表Products和訂單表Orders; 其中客戶表Customers各屬性如下: Cid 客戶編號、Cname客戶名、City客戶所在城市 代理人表Agents各如下屬性 Aid代理人編號、Aname代理人姓名、City代理人所在城市 產品表Products中各屬性如下 Pid產品編號、Pname產品名稱、Quantity產品銷售數量、Price產品單價 訂單表Orders表中各屬性如下 Ord_no訂單號、Month訂單月份,Cid客戶編號、Aid代理人編號、Pid產品編號、Qty訂貨數量、Amount訂貨總金額; 根據以上四個表編寫存儲過程實現如下要求: ①給指定產品編號的單價增加0.5元 CREATE PROCEDURE pro_update_products @pid CHAR(10)AS UPDATE products SET price=price+0.5 WHERE pid=@pid GO ②插入一個新的產品記錄到產品表Products中 CREATE PROCEDURE pro_insert_products @pid CHAR(10), @pname VARCHAR(30), @quantity INT, @price FLOAT AS INSERT INTO products VALUES(@pid,@pname,@quantity,@price)GO ③查詢某客戶通過某代理訂購產品的訂貨總量 CREATE PROCEDURE pro_Query_Amount @cname VARCHAR(20), @aname VARCHA(20)AS SELECT Amount FROM Customers c,Orders o,Agents a WHERE c.cid=o.cid AND a.aid=o.aid AND c.cname=@cname AND a.anane=@aname GO 2.根據第一題的四個表用觸發器實現以下操作 ①當向產品表products插入數據時,規定產品單價不得低于0.5元,若低于0.5元則統一調整為0.5元,同時提示用戶“產品單價不得低于0.5元” CREATE TRIGGER tri_products ON products FOR INSERT AS DECLARE @pid CHAR(10),@price FLOAT SELECT @pid=pid,@price=price FROM INSERTED IF @price<0.5 BEGIN UPDATE products SET price=0.5 WHERE pid=@pid PRINT ‘產品單價不得低于0.5元’ END GO ②當訂單表Orders中的訂貨數量有變動時,觸發器自動修改該項訂單的訂貨總金額Amount CREATE TRIGGER tri_orders ON Orders FOR UPDATE AS DECLARE @ord_no CHAR(10),@pid CHAR(10),@Qty INT,@price FLOAT IF UPDATE(Qty)BEGIN SELECT @ord_no,@pid=pid,@Qty=Qty FROM INSERTED SELECT @price=price FROM products WHERE pid=@pid UPDATE Orders SET Amount=@price*@Qty WHERE Ord_no=@ord_NO END GO 第四章第2題的參考答案P91 設有三個關系 S(S#,SNAME,SEX,AGE)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER)用select語句完成下列查詢 ①檢索LIU老師所受課程的課程號和課程名 SELECT C#,CNAME FROM C WHERE TEACHER=’LIU’; ②檢索年齡大于23歲的男同學的學號和姓名 SELECT S#,SNAME FROM S WHERE SEX=’男’ AND AGE>23; ③檢索學號為S3的學生所學課程的課程名與授課老師名 SELECT CNAME,TEACHER FROM SC,C WHERE SC.C#=C.C# AND SC.S#=’S3’; ④檢索至少選修LIU老師所受課程中一門課程的女學生姓名 SELECT DISTINCT SNAME FROM S,SC WHERE S.SEX=’女’ AND S.S#=SC.S# AND SC.C# =ANY(SELECT C# FROM C WHERE TEACHER=’LIU’); ⑤檢索WANG同學不學課程的課程號 SELECT C# FROM C WHERE C# NOT IN(SELECT C# FROM SC,S WHERE SC.S#=C.C# AND S.SNAME=’WANG’); ⑥檢索至少選修兩門課的學生學號 SELECT S# FROM SC GROUP BY S# HAVING COUNT(C#)>=2; ⑦檢索全部學生都選修的課程的課程號和課程名 SELECT C#,CNAME FROM C WHERE C# IN(SELECT C# FROM SC WHERE S#=ALL(SELECT S# FROM S))⑧檢索選修課程包含LIU老師所受全部課程的學生學號 SELECT S# FROM SC WHERE C# =ALL(SELECT C# FROM C WHERE TEACHER=’LIU’) 第一章 數據庫系統概論 1.試述數據、數據庫、數據庫系統、數據庫管理系統的概念。 數據:描述事物的符號記錄稱為數據。數據的種類有文字、圖形、圖象、聲音、正文等等。數據與其語義是不可分的。 數據庫:數據庫是長期儲存在計算機內、有組織的、可共享的數據集合。數據庫中的數據按一定的數據模型組織、描述和儲存,具有較小的冗余度、較高的數據獨立性和易擴展性,并可為各種用戶共享。 數據庫系統:數據庫系統(DBS)是指在計算機系統中引入數據庫后的系統構成。數據庫系統由數據庫、數據庫管理系統(及其開發工具)、應用系統、數據庫管理員構成。 數據庫管理系統:數據庫管理系統(DBMS)是位于用戶與操作系統之間的一層數據管理軟件。用于科學地組織和存儲數據、高效地獲取和維護數據。DBMS主要功能包括數據定義功能、數據操縱功能、數據庫的運行管理功能、數據庫的建立和維護功能。 2.什么是數據獨立性?數據獨立性又分為哪兩個層次?為什么需要數據獨立性? 數據獨立性是用來描述數據與應用程序之間的依賴程度,包括數據的物理獨立性和數據的邏輯獨立性,依賴程度越低則獨立性越高 物理獨立性是指用戶的應用程序與存儲在磁盤上的數據庫的數據時相互獨立的。邏輯獨立性是指用戶的應用程序與數據庫的邏輯結構是相互獨立的。 作用:數據在磁盤上怎樣存儲由DBMS管理,用戶程序不需要了解,應用程序要處理的只是數據的邏輯結構,這樣當數據的物理存儲改變了,應用程序不用改變。數據獨立性是通過數據庫管理系統的兩層映像功能來實現 3.什么是數據模型?數據模型的基本要素有哪些?為什么需要數據模型? 數據模型是描述數據語義、數據與數據之間聯系(數據結構)、數據操作,以及一致性約束的概念和工具的集合數據模型的基本要素: ①數據結構:是所研究的對象類型的集合,是對系統的靜態特性的描述。 ②數據操作:是指對數據庫中各種對象(型)的實例(值)允許進行的操作的集合,包括操作及有關的操作規則,是對系統動態特性的描述。 ③數據的約束條件:是完整性規則的集合,完整性規則是給定的數據模型中數據及其聯系所具有的制約和依存規則,用以限定符合數據模型的數據庫狀態以及狀態的變化,以保證數據的正確、有效、相容。 作用:一般地講,數據模型是嚴格定義的概念的集合。這些概念精確地描述系統的靜態特性、動態特性和完整性約束條件。 4.為什么數據模型要分為概念模型,邏輯模型和物理模型三類?試分別解釋概念模型、邏輯模型和物理模型 為什么:數據模型應滿足3方面的要求:一是能比較真實的模擬現實世界;二是容易被人所理解;三是便于在計算機上實現。一種數據模型要很好地同時滿足這3個方面的要求是很困難的,因此,在數據庫管理系統中這對不同的使用對象和應用目的,采用不同的數據模型。 概念模型:指概念層次的數據模型,也稱為信息模型,它按用戶的觀點或認識對現實世界的數據和信息進行建模,主要用于數據庫設計。常用的概念模型有實體聯系模型(E-R模型)和面向對象OO模型 邏輯模型;用來描述數據庫數據的整體邏輯結構。傳統的邏輯數據模型有層次模型、網狀模型和關系模型,非傳統的邏輯數據模型有面向對象模型、XML模型等 物理模型用來描述數據的物理存儲結構和存取方法 5.關系模型中的主要概念有哪些,試分別解釋之。 關系模型由一組關系組成,每個關系的數據結構是一張規范化的二維表。關系模型中的常用術語有:關系、元組、屬性、碼、域、分量和關系模式等。關系模型要求關系必須是規范化的,即關系的每一個分量必須是一個不可分的數據項。關系數據模型的操作主要包括查詢、插入,刪除和修改(更新數據)。關系數據模型的完整性約束條件包括實體完整性、參照完整性和用戶自定義完整性 6.試解釋數據庫的三級模式結構和兩層映像。為什么數據庫管理系統要提供數據庫的三級模式結構和兩層映像? 數據庫管理系統的數據抽象一般包括物理層抽象、邏輯層抽象和視圖層抽象三個級別。對應于數據抽象的三個級別,數據庫管理系統一般也提供觀察數據庫的三個不同角度,以方便不同的而用戶使用數據庫的需要,這就是數據庫的三級模式結構;內模式、模式和外模式 為了能夠在系統內部實現三個抽象層次的數據之間的聯系和轉換,數據庫管理系統在數據庫的三級模式之間提供了兩層映像:外模式/模式映像、模式/內模式映像。正是這兩層映像保證了數據庫中的數據能夠具有較高的邏輯獨立性和物理獨立性 7.解釋模式、外模式、內模式、DDL、DML等概念 內模式也稱存儲模式,對應于物理層數據抽象,它是數據的物理結構和存儲方式的描述,是數據在數據庫內部的表示方式 模式也稱為邏輯模式,賭贏與邏輯層數據抽象,是數據庫中全體數據的邏輯結構和特征的描述,是所有用戶的公共數據視圖 外模式也成子模式或用戶模式,對應于視圖層數據抽象,它是數據庫用戶(包括應用程序員和最終用戶)能夠看見和使用的局部數據的邏輯結構和特征的描述,是數據庫用戶的數據視圖,是與莫以具體運用有關的數據的邏輯表示 數據庫模式定義語言DDL(Data Definition Language),是用于描述數據庫中要存儲的現實世界實體的語言。一個數據庫模式包含該數據庫中所有實體的描述定義。這些定義包括結構定義、操作方法定義等。 數據操縱語言DML,命令使用戶能夠查詢數據庫以及操作已有數據庫中的數據的計算機語言。具體是指是SELECT查詢、UPDATE更新、INSERT插入、DELETE刪除。 第二章 關系模型與關系代數 1.名詞解釋 域:一組具有相同數據類型的值的集合 笛卡爾積:兩個分別為N目和m目的關系R和S的笛卡爾積是一個n+m目元組的集合 超碼:屬性集A能唯一標識關系r中的一個元組,則稱A為關系R的一個超碼 候選碼:對于關系r中一個或多個屬性的集合A,若屬性集A中的任意真子集都不能成為關系r的超碼,則、、、、、主碼:在實體集中區分不同實體的候選碼。 外碼:用于建立和加強兩個表數據之間的關系而引用另一個關系的主碼。 關系模式:是型的概念,它定義了元組集合的結構,即定義了一個元組由哪些屬性構成 關系數據庫:在一個給定的應用領域中,所有實體以及實體之間的聯系所對應的關系的集合 空值:是所有可能的域的一個取值,表明值未知或不存在。 2.關系模式的完整性:實體完整性、參照完整性和用戶自定義完整性。實體完整性:若屬性A是關系r中的主碼,則A不能取空值 參照完整性:若屬性F是關系r的外碼,它與關系s的主碼Ks相對應,則對于關系r中的每一個元組在屬性F上的取值,要么為空值,要么等于關系s中的某個元組的值 3.自然連接和等值連接的區別于聯系 等值連接:是從兩個關系的笛卡爾積中選取連接屬性滿足相等條件的所有元組。 自然連接:是一種特殊的等值連接,它要求兩個參與連接的關系具有公共的屬性集,并且在結果中把重復的屬性列去掉 第四章 數據庫建模(實體-聯系模型) 1.請簡要解釋下列術語:實體、實體集、屬性、域、聯系、聯系集、角色、映射基數、超碼、候選碼、主碼、弱實體、類層次、聚合 實體是客觀世界中可區別于其他事物的“事物”或“對象”。實體既可以是有形的,實在的事物,也可以是抽象的、概念上存在的事物。相同類型的實體組成的集合稱為實體集 實體是通過一組屬性來描述的,其屬性是實體集中給每個實體都具有的性質。每個屬性所允許的取值范圍或集合稱為該屬性的域 聯系兩個或兩個以上實體之間的聯系。相同類型聯系組成的集合稱為聯系集。聯系也可擁有自身的描述性屬性 由于參與一個聯系的實體集通常是不同的,因而角色是隱含的并且常常不需聲明。但是,當參與聯系的實體來自相同的實體集,則需要聲明角色 映射基數指一實體集中的一個實體通過一個聯系集能同時與另一個實體集相聯系的實體數目。映射基數可決定聯系集的主碼屬性,甚至可能影響到一個事物是作為實體還是聯系的選擇 超碼是指能夠唯一的標識實體集或聯系集中的一個實體或一個聯系的一個或多個屬性的集合。當一個超碼的任意真子集都不能成為超碼時,稱該最小超碼為候選碼。候選碼和超碼是實體集客觀存在的特性,而主碼是被數據庫設計者主觀選中,用來區分同一實體集中不同實體的候選碼 當一個實體集的所有屬性都不足以形成主碼,就稱該實體集為弱實體集。相反,其屬性可以形成主碼的實體集稱為強實體集。弱實體集所以來的強實體集稱為標識實體集。標識實體集和弱實體集之間必須是一對多關系,并且弱實體集中的實體在聯系集中是全部參與的 E-R模型使用繼承和ISA聯系來描述實體集之間概念上的層次關系。當欲建立聯系間的聯系時,可使用聚合實現 聚合是一種抽象,它將一個聯系集及其相關聯的實體集抽象為一高層實體集對待,然后建立該高層實體集與其他實體集之間的聯系集 2.綜合題:需求分析----E-R圖---關系模式 第七章 數據庫存儲結構 1.數據庫系統的存儲訪問方式是什么?為什么要這樣? 一個數據庫映射為多個不同的文件,這些文件由底層的操作系統來維護,永久地存放在磁盤上,并且具有三級存儲介質上的備份。每個文件分成定長的存儲單元,稱為塊。塊是存儲分配和數據傳輸的基本單位 當數據庫系統中的程序需要磁盤上的塊時,它向緩沖區管理器發出請求(即調用)。如果這個塊已經在緩沖區中,緩沖區管理器將這個塊在主存儲器中的地址返回給請求者。如果這個塊不再緩沖區中,緩沖區管理器首先在緩沖區中為這個塊分配空間,如果需要的話會把其他塊移出主存儲器為這個新塊騰出空間,移出的塊僅當它在最近一次寫回磁盤后修改過才需要寫回磁盤;然后,換紅區管理器把這個塊從磁盤讀入緩沖區,并將這個塊在主存儲器中的地址返回給請求者。緩沖區管理器的內部動作對發出磁盤塊請求的程序是透明的。原因:數據庫系統的一個主要目標就是減少磁盤和主存儲器之間傳輸的塊數。減少磁盤訪問次數的一種方法是在主存儲器中保留盡可能多的塊,目的是最大化要訪問的塊已經在主存儲器中的幾率,這樣就不再需要訪問磁盤了 2.什么是聚集文件組織、什么是多表聚集文件組織?為什么需要多表聚集文件組織?為什么要慎用多表聚集文件組織? 聚集文件組織:很多關系數據庫系統將各個關系存儲在一個個獨立的文件中,不同關系中有聯系的數據是通過關系間的聯接操作得到的,但是當數據的數量比較大時,這種方法速度會很慢。而在聚集文件組織方式中,一個文件可以存儲多個關系的記錄,不同關系中有聯系的記錄存儲在一起可以提高查找速度。 多表聚集文件組織:在一個塊中存儲兩個或多個關系的相關記錄,以加速特定連接的處理。但是它將會導致其他類型查詢的處理變慢 3.為什么需要索引?什么是順序索引和散列索引?什么是主索引和輔助索引?稠密索引和稀疏索引有什么不同?什么是索引順序文件? 許多查詢只涉及到文件中的少量記錄,索引能使系統直接定位這些滿足查詢條件的記錄。DBMS首先會查找索引,找到對應記錄所在的位置(即所在磁盤的塊地址),然后讀取該磁盤塊,得到所需的記錄 順序索引是基于搜索碼的值的順序排列,用于支持快速地對文件中的記錄進行順序或隨機的訪問。散列索引時通過搜索碼值的散列函數的值將所有記錄平均、隨機地分布到若干個散列桶中,用于支持快速地對文件中的記錄進行隨機地訪問 如果索引文件中的記錄按照某個搜索碼值指定的順序物理存儲,那么該搜索碼對應的索引就稱為主索引,也叫聚集索引。與此相反,搜索碼值順序與索引文件中記錄的物理順序不同的那些索引稱為輔助索引或非聚集索引 如果索引文件中的每一個不同的搜索碼值,在索引中都有一個索引記錄(或稱為索引項),則該索引稱為稠密索引。如果只對索引文件中的部分搜索碼值,在索引中存在一個索引記錄,則該索引稱為稀疏索引。每一個索引項包含搜索碼值和指向具有該搜索碼值的第一個數據記錄的指針。利用稠密索引通??梢员认∈杷饕軌蚋斓囟ㄎ灰粭l記錄的位置,但是稀疏索引占用空間更小,插入、刪除和更新的開銷也會更小 建立了主索引的索引文件稱為索引順序文件:稠密索引、稀疏索引 4.B+樹索引的根結點,非葉結點和葉結點都具有相同的數據結構,那它們之間有什么不同? 非葉結點的結構與葉結點結構相同,只不過非葉結點中的所有指針都是指向B+樹種下一層節點的指針,根結點與其他非葉結點不同,它包含的指針書可以小于n/2,但至少包含兩個指針 5.散列文件組織和散列索引有什么不同? 在散列文件組織中,通過計算一條記錄的搜索碼值的散列函數值,可以直接獲得包含該記錄的磁盤塊(桶)的地址。在散列索引組織中,把搜索碼值以及與它們先關聯的記錄指針組織成一個散列文件結構 6.在考慮用索引時,是選擇B+樹索引還是散列索引?為什么? 散列其實就是一種不通過值的比較,而通過值的含義來確定存儲位置的方法,它是為有效地實現等值查詢而設計的。不幸的是,基于散列技術不支持范圍檢索。而基于B+樹索引技術能有效的支持范圍檢索,并且它的等值檢索效果也很好。但是,散列技術在等值連接中是很有用的,尤其是在索引嵌套循環連接方法中,基于散列的索引和基于B+樹的所以在代價上會有很大差別 7.數據庫物理設計的主要內容是什么?數據庫物理設計的目標是什么? 數據庫物理設計的目標是:提高數據庫性能,以滿足應用的性能需求;有效利用存儲空間;在性能和代價之間做出最優平衡 數據庫物理設計的內容包括:確定數據庫性能,以滿足應用的性能需求;有效利用存儲空間;在性能和代價之間做出最優平衡 第八章 查詢處理 1.查詢處理的過程分為哪幾個步驟 ?語法分析與翻譯?查詢優化?查詢執行 2.查詢代價如何度量?為什么? 查詢處理的代價可以通過該查詢對各種資源的使用情況進行度量,主要包括磁盤存取時間和執行一個查詢所用CPU時間以及在并行/分布式數據庫系統中的通信開銷等 3.如何實現選擇運算? 用于選擇運算的搜索方法?不用索引的搜索算法----文件掃描?使用索引的搜索算法---索引掃描 4.題見書(1)最壞情況下,緩沖區只能容納每個關系的一個數據塊,因而算法的代價為:EJ = nr * bs + br。這里,nr = 20000,bs =1500,br=800,所以所需要的塊存取數為20000*1500+800,約為30M個塊存取。最好情況下,兩個關系都能放到內存里,因而算法代價為:EJ = bs + br。大約需要2.3K個塊存取。 5.為什么需要查詢優化?什么是查詢執行計劃?查詢優化器的輸入和輸出分別是什么? 處理一個給定的查詢,尤其是復雜的查詢,通常會有許多種策略。查詢優化就是從這多種策略中找出最有效的查詢執行計劃的處理過程。 給定一個關系代數表達式,查詢優化器的任務就是產生一個查詢執行計劃,該計劃能獲得與原關系代數表達式相同的結果,并且執行代價是接近最小的 6.題見書:由于是計算三個關系的自然連接,且連接屬性中的C、E是各自關系的主碼,因此r1r2r3的大小最多為1000個元組。有效地計算這個連接的策略就是讓連接結果較小的連接運算先執行,即:(r1r2)r3。原因就是:由于A是r1的主碼,C是連接屬性,因此r1r2的最大結果為1000個元組;而C是r2的主碼,E是連接屬性,因此r2r3的最大結果為1500個元組。所以,要讓(r1r2)先做連接運算,以減少結果集的大小。7.畫樹 其它章節零散習題 列級約束和元組級約束的區別在哪里? 如果在定義屬性的同時定義約束條件,則為列級約束;如果單獨定義約束條件,則為元組級約束 什么是事物的ACID特性? ①原子性:事務的所有操作要么全部都被執行,要么都不被執行②一致性;即一個單獨執行的事務應保證其執行結果的一致性,即總是將數據庫從一個一致性狀態轉化到另一個一致性狀態③隔離性:即當多個事務并發執行時,一個事務的執行不能影響另一個事務,即并發執行的各個事務不能相互干擾④持久性:即一個事務成功提交后,它對數據庫的改變必須是永久的,即使隨后系統出現故障也不會受到影響 當前主流的數據庫訪問技術是ADO Web服務器的職責是什么?數據庫服務器的職責又是什么? Web服務器負責監聽客戶的請求,一旦收到客戶請求,數據庫服務器 三級數據庫考點分析之計算機基礎知識 1.1計算機系統組成與應用領域 考點1計算機系統組成 一個完整的計算機系統,包括硬件和軟件兩個部分。 硬件系統是指組成一臺計算機的各種物理裝置,它是計算機的物質基礎,由各種器件組成,如主板、CPU、硬盤、顯示器、內存和線路等。 軟件系統是運行在計算機硬件設備上的各種程序及相關資料的總稱。 以存儲程序原理為基礎的馮·諾依曼結構的計算機,一般由五大功能部件組成,它們是運算器、控制、存儲器、輸人設備以及輸出設備。 下面分別對各種設備進行介紹。 1運算器 運算器是用于對數據進行加工的部件,它可以對數據進行算術運算和邏輯運算。算術運算包括加、減、乘、除、求余及復合運算。邏輯運算包括一般的邏輯判斷和邏輯比較。 2控制器 控制器是計算機的控制部件。它控制計算機各部分自動協調地工作,用于對程序的指令進行解釋和執行,協調輸人、輸出設備,以實現數據輸人、運算和輸出等操作。 3存儲器 存儲器的主要功能是存放程序和數據,是計算機的記憶存儲裝置。它分為內部存儲器和外部存儲器。 4輸入設備 輸人設備是計算機從外部接收、獲取信息的裝置。其功能是將數據、程序及其他信息,從人們所熟知的形式轉換成計算機能識別的信息形式,并輸人到計算機內部。 常見輸人設備有鼠標、鍵盤、掃描儀、紙帶輸人機、模/數轉換器(A/D轉換器)等 5輸出設備 輸出設備的主要功能是將計算機處理過的二進制形式的信息轉換成人們所需要的形式或其他設備接受并可以識別的信息形式。常見的輸出設備有顯示器、打印機、聲音合成輸出、繪圖儀和數/模轉換器(D/A轉換器)等 一般把運算器和控制器合稱為中央處理器(Central Processor Unit,簡稱CPU),中央處理器與內存儲器統稱為主機.輸人設備、輸出設備和外存儲器合稱為外部設備,外部設備通過接口與主機相連??键c2計算機的應用領域 l 科學和工程計算 主要是用數值方法對一些數學問題的求解。計算機不僅可以提高計算的速度,還可以使一些人工不能解決的數學問題得到解決。在科學實驗和工程設計中,經常會遇到一些數學方程和函數問題,這些問題人們不能從理論上得出其準確解,但利用計算機可以得到它們的近似解。這種應用稱為科學和工程計算,其特點是計算量大,而邏輯關系相對簡單。 2數據和信息處理 數據處理是指對數據的收集、存儲、加工、分析和傳送的一系列過程。 計算機的一個非常重要的應用領域就是對數據和信息的處理。數據的含義是相當廣泛的,包括聲、像、文字和圖表等,它們都可以用計算機來進行處理。 3過程控制 過程控制是自動化技術的重要技術內容和手段.指計算機對所采集到的數據按一定的方法經過計算,然后輸出到指定的執行設備中去控制生產的過程。 4輔助設計 計算機輔助設計(Computer Aided Design,簡稱CAD)是用計算機來幫助設計人員進行產品、工程設計的重要技術手段,可以節省人力和物力,且速度快,質量高,能有效縮短產品的設計周期。 這里有必要提一下這幾個名詞:計算機輔助制造(Computer Aided Manufacturing,簡稱CAM)、計算機輔助測試(Computer Aided Testing,簡稱CAT)和計算機輔助教學(Computer Aided Instruction,簡稱CAI)。 5人工智能 人們把用計算機模擬人腦思維的過程稱為人工智能,并利用計算機程序來實現這些過程。 1.2計算機軟件 考點3計算機語言 計算機語言是面向計算機的人工語言,它是進行程序設計的工具,又稱為程序設計語言。現有的程序設計語言一般可分為機器語言、匯編語言及高級語言,下面分別加以介紹。 1機器語言 機器語言是最初級的計算機語言,它依賴于硬件,是由0,I組成的二進制編碼形式的指令集合。不易被人識別,但可以被計算機直接執行。 2匯編語言 匯編語言指使用助記符號和地址符號來表示指令的計算機語言,也稱之為符號語言。每條指令有明顯的標識,易于理解和記憶。 用匯編語言編寫的程序,直觀且易理解,這是匯編語言的優點。但是匯編語言仍是面向機器的,編程工作量大,程序可移植性差。計算機不能識別和直接運行匯編語言,必須翻譯成機器語言程序后才能識別并運行。這種翻譯程序即稱為匯編程序,其關系如圖l一1所示。 圖1-1匯編過程 高級語言 高級語言是一類面向問題的程序設計語言,且獨立于計算機的硬件,對具體的算法進行描述,所以又稱為算法語言,它的特點介紹如下: (I)脫離具體的計算機硬件。 (2)通用性及可移植性好。 下面介紹幾種常用的高級語言。 (I)BASIC語言:多用于教學及小型應用程序的開發工作。 (2)FORTRAN語言:多用于科學及工程計算程序的開發工作。 (3)PASCAL語言:多用于專業教學及應用程序的開發工作。 (4)C語言:多用于系統程序的開發。 (5)C十+語言:多用于面向對象程序的開發。 (6)COBOL語言:多用于商業、交通及銀行等應用程序的開發。 (7)PROLOG語言:多用于人工智能程序的開發。 (8)FoxPro語言:多用于專業教學及應用程序的開發。 高級語言程序一般又稱為源程序,不能直接在計算機上運行,需要翻譯成機器語言程序(又稱為目標程序)才可執行。這種翻譯是由編譯程序來完成的,翻譯過程如圖1-2所示。 圖1一2編譯過程 考點4系統軟件 系統軟件指負責管理、監控和維護計算機資源(含硬件資源和軟件資源)的程序。 1操作系統 操作系統(Operating System,簡稱OS)是系統軟件的核心,也是用戶同計算機之間的接口,是一組程序模塊的集合:它們有效地控制和管理計算機系統中的硬件和軟件資源;合理地組織計算機工作流程,以改善系統的性能;提供一個易于使用、功能強大的工作環境,從而在計算機和其他用戶之間起到接口的作用。 2語言處理程序 語言處理程序就是將各種語言編寫的源程序翻譯成機器語言表示的目標程序。按處理方式的不同可解釋型程序與編譯型程序兩大類。 3數據庫管理系統 數據庫管理系統(DataBase Management System,簡稱DBMS)是組織、管理和查詢計算機中的存緒數據并提供一定處理功能的大型系統軟件,是計算機信息系統和應用系統的基礎,可分為兩類: (1)基于微型計算機的小型數據庫管理系統可解決數據量不大且功能要求較簡單的數據庫應用。 (2)大型的數據庫管理系統功能齊全,安全穩定,支持對大數據量的管理并提供相應開發工具。 4服務性程序 服務性程序屬于輔助性的程序.比如用于程序的裝人、連接和編輯,調試用的裝人程序、連接程序、編輯程序及調試程序,以及故障診斷程序、糾錯程序等??键c5應用軟件 應用軟件是指人們為了解決某濘、領域的實際問題而編制的計算機程序。除了系統軟件以外的所有軟件都稱為應用軟件。隨著計算機應用在不同領域的深人發展,應用軟件的類型也不斷增多,如各種用于計算的軟件包、字處理軟件、CA D軟件、CAI軟件、CAM軟件,以及各種繪圖軟件等。 計算機硬件、軟件及汁算機系統的組成情況如圖1一3所示。 圖1-3計算機系統組成 考點6計算機網絡概述 1計算機網絡的基本概念 計算機網絡是通信技術與計算機技術緊密結合的產物,通過通信線路及通信設備將分布在不同地點的具有獨立功能的多個計算機系統連接起來,并在網絡軟件支持下實現相互的數據通信及資源共享的硬件系統。計算機網絡按規模大小可分為局域網、城域網和廣域網。 2計算機網絡的發展厲史 (l)具有通信功能的單機系統階段。 (2)具有通信功能的多機系統階段。 (3)計算機網絡階段。 3計算機網絡的主要特點 在不同的發展階段,人們對網絡的定義是不同的,這些定義大致可分為3類:廣義的觀點、資源共享的觀點和用戶透明性的觀點。從目前計算機網絡的特點來看,資源共享觀點能比較準確地描述計算機網絡的基本特征。下面簡單介紹一卜資源共享的含義: (1)資源共享。網絡用戶可以通過網絡訪問聯網的遠程計算機資源,也可以調用不同計算機共同完成任務。 (2)獨立的計算機。網絡中的計算機可以聯網工作,也可以脫離網絡獨立工作。 (3)遵循共同的網絡協議。為保證網絡中的計算機能有序地工作,每臺計算機在交換數據的過程中遵守共同的通信規則,一個網絡協議主要由語法、語義與時序組成。 考點7計算機網絡的分類 1分類方法 (1)根據傳輸技術分類:可分為廣播式網絡與點一點式網絡。 (2)根據網絡的覆蓋范圍與規模分類:可分為局域網、城域網及廣域網。 2廣域網 廣域網(Wide Area Network,簡稱WAN)也稱為遠程網,其覆蓋范圍從幾十千米到幾千千米甚至上萬千米,廣域網具有以下特點。 (1)適應大容量與突發性通信要求 (2)適應綜合業務服務要求 (3)開放的設備接口與規范化的協議 (4)完善的通信服務與網絡管理。 隨著通信技術的不斷發展,數據通信的環境也發生了變化,主要表現在以下3個方面。 (1)傳輸介質由原有的電纜逐步走向誤碼率很低且帶寬很寬的光纖 (2)局域網內部的數據傳輸速率已經達到IOMb/s一1 Gb/s,多個局域網之間高速互聯的要求越來越強烈。 (3)用戶設備性能大大提高,可以承擔部分原來由數據通信網承擔的通信處理功能 3局域網 局域網(Local Area Network,簡稱LAN)指網絡服務區域在一個局部的范圍內,可以有一臺或多臺計算及多個工作站通過其進行通信。它有以太網(Ethernet)、令牌總線(Token Bus)和令牌環(Token ring)3種工作原理。 局域網的技術特點主要表現在以下幾個方面。 (1)覆蓋范圍有限,多用于公司、機關、校園等范圍內的計算機終端與信息處理設備之間的聯網需求。 (2)提供高數據傳輸速率、低誤碼率、高質量數據傳輸環境。 (3)易于建立、維護與擴展,一般為一個單位所有。 (4)決定局域網特性的主要技術要素為網絡拓撲、傳輸介質與介質訪問控制方法。 (5)從介質訪問控制方法角度,可分為共享式與交換式局域網。 城域網 城域網(Metropolitan Area Network,簡稱MAN)是介于廣域網與局域網之間的一種高速網絡。早期的城域網主要采用光纖分布式數據接口(Fiber Distributed Data Interface,簡稱FDDI),它主要有以下幾個技術特點。 (1)使用基于IEEE 802.5的單令牌的環網介質訪問控制MAC協議。 (2)使用IEEE 802.2協議,與符合IEEE 802標準的局域網兼容。 (3)數據傳輸速率為100 Mb/s,聯網的節點數`1 000,環路長度為100 km,(4)可以使用雙環結構,具有容錯能力。 (5)可以使用多模或單模光纖。 (6)具有動態分配帶寬的能力,能支持同步和異步數據傳輸。 考點8Internet基礎 Internet的形成與發展 (1)TCP/IP協議與ARPAnet的結合,使ARPAnet成為Internet的主干網。 (2)NSFnet從一開始就使用TCP/IP協議,是第一個使用TCP/IP協議的廣域網。 (3)Internet實現了TCP/IP協議參考模型與協議的結合。TCP/IP協議使網絡不受主機、用戶微型計算機及所使用的操作系統的限制。 Internet的結構與組成 從技術角度上來看,Internet主要是由通信線路、路由器、主機、信息資源幾個主要部分組成的。 (1)通信線路。將Internet中的路由器與路由器、路由器與主機連接起來。 (2)路由器。是Internet中最重要的通信設備之一,它的作用是將Internet中的各個局域網、城域網或廣域網,以及主機互聯起來 (3)主機。是Internet中信息資源與服務的載體。 (4)信息資源是用戶最關心的問題,它會影響到Internet中站點受歡迎的程度。 TCP/IP協議、域名與IP地址 TCP/IP協議是為保證Internet正常工作而要求所有Internet中的主機都必須遵守的通信協議。它具有 以下幾個特點 (1)開放的協議標準,獨立于特定的計算機硬件與操作系統。 (2)獨立于特定的網絡硬件,可以運行在局域網和廣域網,更適用于互聯網中。 (3)標準化的高層協議,可以提供多種可靠的用戶服務。 (4)統一的網絡地址分配方字模,使得整個TCP/IP設備在網中都具有唯一的IP地址。 在TCP/IP參考模型中,應用層包括了所有的高層協議,且一直有新的協議加人。應用層協議主要有下面幾種。 (1)網絡終端協議TELNET,實現網絡互聯中遠程登錄的功能二 (2)文件傳送協議FTP,實現因特網中交互式文件傳送的功能。 (3)域名服務DNS,實現網絡設備名字與IP地址相互映射的網絡服務。 (4)路由信息協議RIP,網絡設備間交換路由信息的協議。 (5)電子郵件協議SMTP,實現網絡中電子郵件的傳送功能。 (6)HTTP協議,用于www.tmdps.cnF 1.第一范式(1NF)及進一步規范化 關系模式需要滿足一定的條件,不同程度的條件稱做不同的范式,最低要求的條件是元組的每個分量必須是不可分的數據項,這叫第一范式,簡稱1NF,是最基本的范式。對于各種范式之間的聯系有5NF C4NF仁BCNFC3NF仁2NFCINF成立。一個低一級范式的關系模式,通過模式分解可以轉換為若干個高一級范式的關系模式的集合,這個過程就叫規范化。2.第二范式(2NF)若R EINF,且每一個非主屬性完全函數依賴于碼,則R∈2NFo 2NF就是不允許關系模式的屬性之間有這樣的函數依賴X-.Y。其中X是碼的真子集,Y是非主屬性,也就是說,不允許有非主屬性對碼的部分函數依賴。3.第三范式(3NF)關系模式R,<U,F>中若不存在這樣的碼X,屬性組Y及非主屬性Z(Z不包含于均使得X→Y,(Y函數依賴于X)Y→Z成立,則稱R<U, F>∈3NF 4.Boyce一Codd范式(BCNF)若關系模式REINF,且對于每個非平凡的函數依賴X-} Y都有X包含碼,則R EBCNF。在函數依賴的范圍內,BCNF達到了最高的規范化程度。 考點35多值依賴和4NF 1.多值依賴 設R(U)是屬性集U上的一個關系模式X、Y,Z是U的子集,并且Z=U一X一Y}關系模式R(U)中多值依賴X→→Y成立,當且僅當對R(U)功的任一關系r,給定的一對(x,z)值有一組Y的值,這組值僅僅決定于x值而與z值無關。4.第四范式(4NF)關系模式R<U,F>司NF,如果對于R的每個非平凡多值依賴X→→Y(Y不包含于X),X都含有碼,則稱R<U,F>∈4NF。 如果一個關系模式是4NF,則必為BCNF。 4.14關系模式的分解 考點36模式分解的等價標準 常用的等價標準要求分解是具有無損連接性的,并且是保持函數依賴的。 考點37關于模式分解的幾個事實 (1)分解具有無損連接性和分解保持函數依賴是兩個互相獨立的標準。(2)若要求分解具有無損連接性,那么模式分解一定可以達到BCNF)。 (3)若要求分解保持函數依賴,刀廠么模式分解可以達到3NF,但不一定能達到BCNF。(4)若要求分解既具有無損連接性,又保持PA數依賴,則模式分解可以達到3NF,但不一定能達到BCNF。 4.15數據庫設計的內容、方法和步驟 考點38關于數據庫設計的概述 數據庫設計是指對于一個給定的應用環境,包括硬件環境、操作系統和數據庫管理系統(DBMS)等軟件環境,如何使用這個環境來表達用戶的要求,構造最優的數據庫模式,建立數據庫及圍繞數據庫展開的應用系統,使之能夠有效地收集、存儲、操作和管理數據,滿足企業組織中各類用戶的應用需求。 數據庫設計方法中比較著名的有新奧爾良(New Orleans)方法。它將數據庫設計過程分為4個階段:需求分析、概念結構設計 一、邏輯結構設計和物理設計。4.16需求分析 考點39需求分析的任務 需求分析的任務是通過詳細調查現實世界要處理的對象(組織、部門、企業等),充分了解原系統(手工系統或計算機系統)的下作概況,明確用戶的各種需求,然后在此基礎上確定新系統的功能。新系統必須充分考慮今后可能的擴充和改變,不能僅僅按當前應用需求來設計數據庫。需求分析的重點是調查、收集與分析用戶在數據管理中的信息要求、處理要求、安全性與完整性要求。需求分析的階段成果是產生系統需求說明書??键c40需求分析的基本步驟 需求分析的步驟有以下幾個方面: (1)需求的收集:數據,發生時間、頻率,發生的規則、約束條件、相關聯系、計劃控制及決策過程。 (2)需求的分析整理二包括數據流程分析、數據分析結果描述、數據分析統計及分析圍繞數據的各種業務處理功能,并以帶說明的系統功能結構圖形式給出。 4.17概念結構設計 考點41概念結構設計的目標和策略 概念結構是對現實世界的一種抽象,即對實際的人、物、事和概念進行人為處理,抽取人們關心的共同特性,忽略非本質的細節,并把這些特性用各種概念精確地加以描述。 設計概念結構通常有4類方法:自頂向下、自底向上、由里向外和混合策略。無論采用哪種設計方法,一般都以E-R模型為工具來描述概念結構。最常用的設計策略是自底向上設計策略。 考點42采用E-R方法的數據概念模型設計 1數據抽象與局部視圖設計 以自底向上設計概念結構的方法為例,它通常分為兩步: (1)根據需求分析的結果(數據流圖、數據字典等)對現實世界的數據進行抽象,設計各個局部視圖即E-R圖。(2)集成局部視圖。 設計E-R圖的步驟如下: (1)選擇局部應用(2)逐一沒計E-R圖二 2視圖的集成 集成局部E-R圖時需要兩步。 (1)合并E-R圖,生成初步E7R圖。 各E-R圖之間的沖突主要有3類:屬性沖突、命名沖突和結構沖突:(2)修改與重構,生成基本E-R圖。 修改、重構初步E-R圖以消除冗余,主要采用分析方法。除分析方法外,還可以用規范化理論來消除冗余。 4.18邏輯結構設計 考點43 E-R模型向關系數據模型的轉換 將E-R圖轉換為關系模型實際上就是要將實體、實體的屬性和實體之間的聯系轉化為關系模式,這種轉換的規則包括以下幾點:(1)一個實體型轉換為一個關系模式。(2)一個m: n聯系轉換為一個關系模式。 (3)一個1:n聯系可以轉換為一個獨立的關系模式,也可以與n端對應的關系模式合并。(4)一個1:1聯系可以轉換為一個獨立的關系模式,也可以與任意一端對應的關系模式合并。 (5)3個或3個以上實體間的一個多元聯系轉換為一個關系模式。 (6)同一實體集的實體間的聯系,即自聯系,也可按上述1: 1,1: n和m: n三種情況分別處理。 (7)具有相同碼的關系模式可以合并。 考點44關系數據庫的邏輯結構設計過程 關系數據庫的邏輯結構設計過程如下: (1)從E-R圖導出初始關系模式。(2)規范化處理。 (3)模式評價。(4)優化模式。(5)形成邏輯結構設計說明書。 4.19物理結構設計 考點45物理設計的內容 (1)存儲記錄的格式設計。對數據項類型特征進行分析,并對存儲記錄進行格式化 決定如何進行數據壓縮或代碼優化。 (2)存儲方法的設計。物理設計中最重要的一個考慮是把存儲記錄在全范圍內進行物理安排,包括順序存放、散列存放和聚列存放。物理設計的結果是物理設計說明書。(3)存取方法設計。存取方法設計為存儲在物理上的數據提供數據訪問的路徑。DBMS產品一般都提供了一些存儲分配參數,供數據人員和DBA對數據庫進行物理優化。 考點46物理設計的評價 數據庫物理設計過程中需要對時間效率、空間效率、維護代價和各種用戶要求進行權衡,其結果可以產生多種方案,數據庫設計人員必須對這些方案進行細致的評價,從中選擇一個較優的方案作為數據庫的物理結構。 在數據庫應用系統生存期中,總的開銷包括:規劃開銷、設計開銷、實施和測試開銷、操作開銷、運行維護開銷。評價物理數據庫的方法完全依賴于所選用的DBMS。 4.20實現和維護 考點47數據庫的實現 數據庫實現的主要工作有以下幾個方面:(1)定義數據庫結構。(2)編制與調試應用程序。(3)數據裝載。 (4)數據庫試運行。 考點48其他設計 其他設計工作包括加強數據庫的安全性、完整性控制,以及保證一致性、可恢復性等,總是以犧牲效率為代價的。設計人員的任務就是要在實現代價和盡可能多的功能之間進行合理平衡。其他設計包括數據庫的再組織設計、故障恢復方案設計、安全性考慮和事務控制等。 考點49數據庫的運行和維護 在數據庫運行階段,對數據庫經常性的維護工作主要是由DBA完成的,它包括以下幾個方面: (1)數據庫的轉儲和恢復。 (2)數據庫的安全性、完整性控制。(3)數據庫性能的監督、分析和改進。(4)數據庫的重組織和重構造。 4.21數據庫管理系統概述 考點50 DBMS的系統目標 數據庫管理系統(DBMS)是操作和管理數據庫的軟件系統,它由一組計算機程序構成,管理并控制數據資源的使用。數據庫管理系統是數據庫系統的核心DBMS的目標是用戶界面友好、結構清晰和開放性。 考點51 DBMS的基本功能 DBMS主要是實現對共享數據有效的組織、管理和存取。因此,DBMS具有如下幾個方面的基本功能。 (1)數據庫定義功能。(2)數據存取功能。 (3)數據組織、存儲和管理。(4)數據庫運行管理。(5)數據庫的建立和維護。 (6)通信功能和數據轉換功能等。 考點52 DBMS程序模塊的組成 大致來說,DBMS的程序模塊可按功能劃分為以下5個模塊:(1)數據定義方面的程序模塊。(2)數據操縱方面的程序模塊 (3)數據庫運行管理方面的程序模塊 (4)數據庫組織、存儲和管理方面的程序模塊。(5)數據庫建立、維護和其他方面的程序模塊。 考點53 DBMS的層次結構 可以將DBMS劃分成若干層次,這樣可以幫助我們更清晰地認識DBMS,更重要的是有助于DBMS的設計和維護。 (1)最上層是應用層位于DBMS核心之外。 (2)第二層是語言翻譯處理層它處理的對象是數據庫語言}A SQL,(3)第三層是數據存取層:該層處理的對象是單個元組。 (4)第四層是數據存儲層。該層處理的對象是數據頁和系統緩沖區。(5)操作系統是DBMS的基礎。它處理的對象是數據文件的物理塊。4.22新的應用需求對DBMS的挑戰 考點54新的應用需求對DBMS的挑戰 由于現在以關系型數據庫管理系統(RDBMS)為主流。這些新應用需求要求數據庫管理系統應該具有支持分布式操作、聯機事務處理能力、決策支持能力、支持多媒體、大容量、復雜數據應用、兼容性和集成能力、異種數據庫之間的互訪能力、系統可靠性、安全性、大型系統等方面的管理能力。 在我國,當前流行的數據庫管理系統絕大多數是關系型數據庫管理系統,一般可分為如下3類: (1)以PC機、微型機系統為運行環境的數據庫管理系統。(2)以Oracle為代表的數據庫管理系統,這類系統還有IBM DB2,Sybase等,也被稱為主流數據庫管理系統。 (3)以Microsoft SQI.Server為代表的介于以上兩類之間的數據庫管理系統。 4.23 Oracle數據庫系統 考點55Oracle數據庫系統簡介 Oracle關系型數據庫管理系統是美國Oracle公司的優秀軟件產品,它采用SQL語言作為數據庫語言。該公司于1979年推出了世界上第一個商業化的關系型數據庫系統。Oracle數據庫的特點包括兼容性、可移植性、可連接性及高的生產率。 考點56 Oracle的主要產品及其功能 1Oracle數據庫服務霖功能及其特色 Oracle數據庫服務器包括標準服務器和許多可選的服務器選件,選件用于擴展標準服務器的功能,以適應特殊的應用需求。 (1)標準服務器主要具有下列特色:多進程多線索的體系結構、高性能核心技術、高可用性和SQL的實現。 (2)并行服務器選件(paralle server option)和并行查詢選件(paralle query option)。 第1章 數據庫系統概述 1、基本概念 ? 數據庫、數據庫管理系統、數據庫系統 ? 數據庫系統的特點和功能 ? 數據抽象 – 三種數據抽象能力 – 三種數據庫模式 – 兩種數據獨立性 ? 數據庫系統的用戶 ? 數據模型、數據庫語言 ? 數據庫管理系統的結構 2、重點 ? 數據庫、數據庫管理系統、數據庫系統 ? 兩種數據獨立性 第2章 關系數據庫系統 1、知識點 ? 關系數據模型 – 數據結構 – 完整性約束 – 操作 ? 關系運算的安全性 ? 關系代數、元組關系演算、域關系演算的等價性 ? SQL – 交互式 – 嵌入式 2、基本概念 ? 關系、屬性、元組、關系模式、關系實例 ? 關系的性質 ? 候選鍵、主鍵、鍵屬性、非鍵屬性、外部鍵 ? 實體完整性約束、關聯完整性約束 ? 關系代數操作的定義 ? 關系代數的基本操作和附加操作 ? 專門的關系運算 ? SQL語言的子語言 ? 每個SQL語句的功能及語法格式 3、重點 ? 關系數據模型 ? 關系代數 ? SQL語句 第3章 數據庫的安全性與完整性 1、知識點 ? 安全性 – 定義 – 需要解決的問題 – 解決的方法 ? 完整性 – 定義 – 類型 – 定義和驗證方法 2、基本概念 ? 安全性的定義 ? 完整性的定義 ? 完整性的類型 第4章 數據庫設計概述與需求分析 1、基本概念 ? DB設計的任務 ? DB的生命周期 ? DB的設計過程 ? DB的需求分析的任務、目標、步驟 第5章 概念數據庫設計 1、知識點 ? 實體聯系模型(ER模型)? 實體、實體型 ? 實體的屬性、實體的屬性值、復合屬性、單值屬性、多值屬性、導出屬性、空值 ? 鍵、簡單鍵、復合鍵 ? 實體間的聯系 ? 實體對應約束(1: 1、1:n、m:n)、實體關聯約束(全域關聯約束、部分關聯約束) ? 弱實體型、弱實體、識別實體型、識別聯系 ? 弱實體型的部分鍵 ? ER圖 2、基本概念 ? 復合屬性、多值屬性、導出屬性 ? 1: 1、1:n、m:n聯系 ? 概念數據庫設計的任務 ? 概念數據庫設計的目標 ? 概念數據庫設計的步驟 ? 概念數據庫設計的方法、視圖綜合設計方法 ? 概念數據庫設計的策略 3、重點 ? ER圖 第6章 邏輯數據庫設計 1、知識點 ? 形成初始關系模式 – 普通實體、弱實體、多值屬性、各種聯系 ? 函數依賴、完全函數依賴、部分函數依賴、傳遞函數依賴 ? 給定關系實例,求函數依賴集 ? Armstrong公理系統、三條推理規則 ? 求屬性閉包、求候選鍵 ? 兩個函數依賴集等價的判定、求最小函數依賴集 ? 關系模式的規范形式 – 1NF、2NF、3NF、BCNF ? 關系模式的規范化方法 – 無損連接性、函數依賴保持性、判別方法 – 關系模式的分解算法 2、基本概念 ? 邏輯數據庫設計的任務 ? 邏輯數據庫設計的目標 ? 邏輯數據庫設計的步驟 ? 初始關系模式可能存在的問題 ? 函數依賴、完全函數依賴、部分函數依賴、傳遞函數依賴 ? Armstrong公理系統、三條推理規則 ? 1NF、2NF、3NF、BCNF ? 3、重點 ? 形成初始關系模式,并指出每個關系模式的主鍵和外鍵 ? 給定關系實例,求函數依賴集 ? 求屬性閉包、求候選鍵 ? 判斷兩個函數依賴集等價 ? 求與給定函數依賴集等價的最小函數依賴集 ? 判斷一個關系模式最高屬于幾范式 ? 判斷給定的分解是否具有無損連接性 ? 關系模式的3NF、BCNF分解算法 第7章 物理數據庫設計 1、知識點 ? 物理數據庫設計的任務 ? 物理數據庫設計的步驟 第8章 物理存儲結構 1、知識點 ? 物理存儲設備 – 磁盤的存儲特性和訪問特性 ? 磁盤冗余技術 ? 文件和文件記錄 ? 各種文件結構的存儲空間和查詢時間的計算 ? 各種索引的存儲空間和查詢時間的計算 2、基本概念 ? 記錄 ? 定長記錄文件、邊長記錄文件 ? 跨塊記錄、非跨塊記錄 ? 無序文件、有序文件 ? 索引域、索引文件、索引記錄 ? 稀疏索引、稠密索引 ? 主索引、輔助索引、聚集索引 ? B樹、B+樹 3、重點 ? 各種文件和索引占用的空間計算 ? 利用各種文件和索引的查詢時間的計算 第9章 數據庫管理系統的數據字典 1、重點 ? 數據字典的概念 ? 數據字典中存儲的信息 ? 把數據字典作為普通關系處理具有兩個優點 第10章 關系代數操作的實現算法 1、重點 ? 查詢處理的過程 ? 各個關系代數操作的算法及代價分析 第11章 查詢優化技術 1、知識點 ? 關系代數的等價變換規律 ? 啟發式代數優化規則 ? 初始關系代數表達式 ? 關系代數表達式到查詢樹的轉換 ? 啟發式關系代數優化算法 ? 基于復雜性估計的查詢優化算法 ? 語義查詢優化方法 2、重點 ? 關系代數的等價變換規律 ? 啟發式代數優化規則 ? 初始關系代數表達式 ? 關系代數表達式到查詢樹的轉換 ? 啟發式關系代數優化算法 第12章 并發控制技術 1、知識點 ? 事務 ? 不對并發事務進行控制導致的問題 ? 事務的性質 ? 事務的調度、串行調度、并行調度 ? 可串行的調度 ? 沖突 ? 沖突等價 ? 沖突可串行 ? 沖突可串行的測試方法 ? 兩段鎖協議 2、基本概念 ? 事務處理包括哪兩方面的內容 ? 不對并發事務進行控制導致的問題 ? 事務、事務的狀態、事務的性質、事務的原子性 ? 調度、串行調度、并行調度、可串行調度 ? 沖突、沖突等價、沖突可串行 3、重點 ? 基本概念 ? 沖突可串行的測試方法 ? 兩段鎖協議 第13章 數據庫恢復技術 1、知識點 ? 日志 ? 日志的內容 ? 日志的產生過程 ? 使用日志進行系統恢復的方法 2、重點 ? 使用推遲更新技術(REDO日志技術)和即時更新技術(UNDO/REDO日志)進行系統恢復的方法,包括恢復時所做的操作以及恢復后數據庫中數據項的值。第二篇:數據庫期末復習教案[定稿]
第三篇:數據庫復習總結
第四篇:數據庫復習總結
第五篇:數據庫考試期末總結