第一篇:數據庫復習總結知識點大全
《黃色填充區域是不確定區域
需要在找找》
1.數據庫有什么特點?
主要特點(1)實現數據共享。(2)減少數據的冗余度。(3)數據的獨立性。(4)數據實現集中控制。(5)數據一致性和可維護性,以確保數據的安全性和可靠性。主要包括:①安全性控制:以防止數據丟失、錯誤更新和越權使用; ②完整性控制:保證數據的正確性、有效性和相容性; ③并發控制:使在同一時間周期內,允許對數據實現多路存取,又能防止用戶之間的不正常交互作用; ④故障的發現和恢復:由數據庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞(6)故障恢復。由數據庫管理系統提供一套方法,可及時發現故障和修復故障,從而防止數據被破壞。
2.數據庫系統是數據庫、數據庫管理系統、硬件、操作人員的合在一起的總稱 數據庫管理系統,用來管理數據及數據庫的系統。數據庫系統包含數據庫管理系統、數據庫及數據庫開發工具所開發的軟件(數據庫應用系統)。
3.內模式 內模式也稱存儲模式,一個數據庫只有一個內模式。它是數據物理結構和存儲方式的描述,是數據在數據庫內部的表示方式。
4.外模式也稱子模式或用戶模式,是數據庫用戶(包括應用程序員和最終用戶)能夠看見和使用的局部數據的邏輯結構和特征的描述,是數據庫用戶的數據視圖,是與某一應用有關的數據的邏輯表示。
5.數據模型的三要素:數據結構、數據操作及完整性約束條件 1):數據結構,就是前面說的數據在數據區中的存儲結構,在關系模型中就是采用的關系模型了,就是“二維表”的形式
2):數據操作,指的是對數據的一些操作,包括查詢、刪除、更新、插入等等
3):數據的完整性約束:就是對所存數據的約束規則,有實體完整性、參照完整性等等,就是取值唯
一、不能為空等一系列操作
6.E-R圖即實體-聯系圖(Entity Relationship Diagram),是指提供了表示實體型、屬性和聯系的方法,用來描述現實世界的概念模型。
7.ER圖的基本要素:實體(即數據對象)、關系和屬性 8.概念數據模型是按用戶的觀點對數據和信息建模,是現實世界到信息世界的第一層抽象?;緮祿P褪前从嬎銠C系統的觀點對數據建模,是現實世界數據特征的抽象,用于DBMS的實現(層次模型,網狀模型,關系模型)(1)可以定制生成標準的模型報告;(2)可以轉換為面向對象模型(OOM);
(3)完成多種數據庫的詳細物理設計(涵蓋常用的各種數據庫的DBMS),并生成數據庫對象的.sql腳本;
9.數據流圖是結構化分析方法中使用的工具,它以圖形的方式描繪數據在系統中流動和處理的過程,由于它只反映系統必須完成的邏輯功能,所以它是一種功能模型。
→:數據流(流動的數據,有流向)
□:外部實體(不同于數據庫實體,指人,物,部門,科室,單位等)○:數據處理(對數據的加工,是對數據進行處理的單元,指功能模塊,能做什么)〒:數據存儲
(信息的靜態存儲)
10.數據字典(Data Dictionary,DD)各類數據描述的集合,它是關于數據庫中數據的描述,即元數據。
通常包括數據項、數據結構、數據流、數據存儲和處理過程五個部分。11.主鍵和外鍵的關系(案例題)
12.用T-SQL語句如何創建表 如何刪除表
ppt 6-2 13.笛卡爾積(Cartesian Product)通俗點說就是指包含兩個集合中任意取出兩個元素構成的組合的集合。
設:關系R為m列(m 個屬性),k1行(k1個元組); 關系S為n列(n個屬性),k2行(k2個元組)。
? 公式:R×S={tRtS │tR ∈R ∧ tS ∈S } ? 語義:笛卡爾積仍是一個關系,該關系的結構是R和S結構之連接,即前m 個屬性來自R,后n個屬性來自S,該關系的值是由R中的每個元組連接S中的每個元組所構成元組的集合。
? 注意:新關系的屬性個數等于m+n,元組個數等于k1*k2。
? 14.投影(Projection)
設:t是關系R中的一個元組,A是要從R中投影出的屬性子集。
? 公式:∏A(R)={ t.A│t ∈R } ? 語義:從關系R中按所需順序選取若干個屬性構成新關系。
? 注意:新關系的元組數小于等于原關系的元組數,新關系的屬性數不多于原關系中的屬性數。
? ∏是希臘字母,即π的大寫形式,在數學中表示求積運算或直積運算,形式上類似于Σ,有時也用來代表圓周率值,即讀作/pai/ ? 15.連接(Join)
設:A,B分別是關系R和S中的屬性,t是連接關系中的一個元組。
? 公式:
? 語義:兩個關系R和S按相應屬性值的比較條件連接起來,生成一個新關系,也稱為θ連接。
? 等值連接
– R×S+選擇(θ為=)
– 按照兩關系中對應屬性值相等的條件所進行的連接
? 自然連接
– 等值連接+去重復屬性 – 記作:R
S 16.第一范式(1NF):在關系模式R中的每一個具體關系r中,如果每個屬性值 都是不可再分的最小數據單位,則稱R是第一范式的關系。第二范式(2NF):如果關系模式R(U,F)中的所有非主屬性都完全依賴于任意一個候選關鍵字,則稱關系R 是屬于第二范式的。
第三范式(3NF):如果關系模式R(U,F)中的所有非主屬性對任何候選關鍵字都不存在傳遞信賴,則稱關系R是屬于第三范式的。
17.字符串的定界符可以用單引號,雙引號,和方括號,18.LEN 返回文本串的字符數.left:返回從字符串左邊開始指定個數的字符
19.索引的特點:有效組織表數據的方式它由表中一列或多列按照一定的排列順序組成。、用戶可以通過合理地創建索引大大提高數據庫的查找速度 索引也可以保證列的唯一性,從而確保表中數據的完整性
索引中包含鍵值,這些鍵值存儲在一種數據結構(B-樹)中,通過鍵值可以快速地找到與鍵值相關的數據記錄
索引創建原則:經常被查詢的列 需要排序的列 外鍵或主鍵列 值唯一的列
在下列情況下不適合建立索引。在查詢中很少被引用的列。
包含太多重復值的列。
數據類型為bit、varchar(max)、varbinary(max)等的列不能建立索引。
20.聚簇索引的特點:聚簇索引確定表中數據的物理順序。聚簇索引類似于電話簿,后者按姓氏排列數據。由于聚簇索引規定數據在表中的物理存儲順序,因此一個表只能包含一個聚簇索引。但該索引可以包含多個列(組合索引),就像電話簿按姓氏和名字進行組織一樣。漢語字典也是聚簇索引的典型應用,在漢語字典里,索引項是字母+聲調,字典正文也是按照先字母再聲調的順序排列。
聚簇索引對于那些經常要搜索范圍值的列特別有效。使用聚簇索引找到包含第一個值的行后,便可以確保包含后續索引值的行在物理相鄰。例如,如果應用程序執行的一個查詢經常檢索某一日期范圍內的記錄,則使用聚集索引可以迅速找到包含開始日期的行,然后檢索表中所有相鄰的行,直到到達結束日期。這樣有助于提高此類查詢的性能。同樣,如果對從表中檢索的數據進行排序時經常要用到某一列,則可以將該表在該列上聚簇(物理排序),避免每次查詢該列時都進行排序,從而節省成本。聚集索引根據鍵值的大小對行進行物理排序,所以每個表只能有一個聚集索引。
21.alter table 修改表 Update 更新表 為數據表創建索引的目的:a 提高查詢檢索的性能
23;創建索引的兩種方法:在【新建索引】窗口中創建索引(1 用索引創建向導創建索引;2 直接創建索引)
使用SSMS創建索引 使用T-SQL創建表的索引 24一對一關聯:在一對一關系中,A 表中的一行最多只能匹配于 B 表中的一行,反之亦然。如果相關列都是主鍵或都具有唯一約束,則可以創建一對一關系。25:什么是數據表:一個數據庫中可能包含若干個數據表。
數據表是數據庫中一個非常重要的對象,是其他對象的基礎。沒有數據表,關鍵字、主鍵、索引等也就無從談起。在數據庫畫板中可以顯示數據庫中的所有數據表(即使不是用PowerBuilder創建的表),創建數據表,修改表的定義等數據表是數據庫中一個非常重要的對象,是其他對象的基礎。
數據表(或稱表)是數據庫最重要的組成部分之一。數據庫只是一個框架,數據表才是其實質內容。根據信息的分類情況,一個數據庫中可能包含若干個數據表。26;sql: 結構化查詢語言(Structured Query Language)”
其關系數據庫管理系統SYSTEM R開發的一種查詢語言,它的前身是SQUARE語言。SQL語言結構簡潔,功能強大,簡單易學,SQL語言是一種數據庫查詢和程序設計語言,用于存取數據以及查詢、更新和管理關系數據庫系統;同時也是數據庫腳本文件的擴展名。
語言特點:一體化 使用反式靈活 非過程化 語言簡潔 語法簡單 好學好用
27:交叉連接查詢:交叉連接不帶WHERE 子句,它返回被連接的兩個表所有數據行的笛卡爾積,返回到結果集合中的數
據行數等于第一個表中符合查詢條件的數據行數乘以第二個表中符合查詢條件的數據行數。例,titles表中有6類圖書,而publishers表中有8家出版社,則下列交叉連接檢索到的記錄數將等 于6*8=48行。
28;什么情況下應該盡量創建索引:數據量大(建議分區)、數據插入刪除不是太頻繁、又需要經常按某些字段進行條件檢索的表。在一個或者一些字段需要頻繁用作查詢條件,并且表數據較多的時候,創建索引會明顯提高查詢速度,因為可由全表掃描改成索引掃描。(無索引時全表掃描也就是要逐條掃描全部記錄,直到找完符合條件的,索引掃描可以直接定位)索引并不是越多越好,太多索引會占用很多的索引表空間,甚至比存儲一條記錄更多。對于需要頻繁新增記錄的表,最好不要創建索引,沒有索引的表,執行insert、append都很快,有了索引以后,會多一個維護索引的操作,一些大表可能導致insert 速度非常慢 29:sql sever 中的數據類型
SQL中的五種數據類型:字符型,文本型,數值型,邏輯型和日期型
30:關系數據庫中的投影操作是指從關系中。A.去掉若干屬性列組成新的關系 B.選擇出若干屬性列組成新的關系 C.去掉滿足條件的諸元組 D.選擇滿足條件的諸元組(A 抽出特定的記錄 B抽出特定的字段 C建立相應的影像 D建立相應的視圖)31:關系數據模型有許多優點,但下面所列的條目中哪一條不是它的優點? A.結構簡單
B.適用于集合操作 C.有標準語言
D.可表示復雜的語義 正確答案:D 解析:關系模型由關系數據結構、關系操作集合和關系完整性約束3大要素組成。關系模型的數據結構單一,在關系模型中,現實世界的實體以及實體間的各種聯系均用關系來表示。關系操作的特點是集合操作方式,即操作的對象和結果都是集合。關系代數、元組關系演算和域關系演算均是抽象的查詢語言這些抽象的語言與具體的DBMS中實現的實際語言并不完全一樣,但它們能用作評估實際系統中查詢語言能力的標準或基礎。數據庫的數據完整性是指數據庫中數據的正確性和相容性,那是一種語義概念,包括兩個主要方面:與現實世界中應用需求的數據的相容性和正確性。數據庫內數據之間的相容性和正確性。32數據庫概念模型應具備(特點。Ⅰ.豐富的語言表達能力 Ⅱ.易于交流和理解 Ⅲ.易于變動 Ⅳ.易于向各種數據模型轉換 A.Ⅰ和Ⅱ B.Ⅰ、Ⅱ、Ⅲ C.Ⅱ、Ⅲ、Ⅳ D.全是
正確答案:D 概念模型應具有較強的語義表達能力,簡單,清晰,易于用戶理解。易于項其他數據模型轉換
(相關知識)組織、存儲和管理數據的倉庫
32關系數據庫的規范化理論指出,關系數據庫中的關系應滿足一定的要求,最起碼的要求是達到1NF,既滿足()。A: 主關鍵字唯一標識表中的每一行 B: 關系中的行不允許重復 C: 每個非關鍵字列都完全依賴于主關鍵字 D: 每個屬性都有是不可再分的基本數據項 33關系數據庫管理系統能實現的專門關系運算包括。A.排序、索引、統計 B.選擇、投影、連接C.關聯、更新、排序 D.顯示、打印、制表
34.概念結構設計階段得到的結果是______。A、包括存儲結構和存取方法的物理結構 B、某個DBMS所支持的數據模型 C、E-R圖表示的概念模型 D、數據字典描述的數據需求 35數據庫需求分析階段的主要任務:對現實世界要處理的對象(組織、部門、企業)等進行詳細的調查,通過對原系統的了解,手機支持新系統的基礎數據并對其進行處理,在此基礎上確定新系統的功能。
用戶需求分析階段的主要工作包括2方面:可行性分析
成本(資源)分析
哪個不是DBA數據庫管理員的職責
A完整性約束說明 B定義數據庫模式 C數據庫安全 D數據庫管理系統設計
下列工作中,不屬于數據庫管理員DBA的職責是()。A.建立數據庫
B.輸入和存儲數據庫數據 C.監督和控制數據庫的使用 D.數據庫的維護和改進
以下是公認的DBA職責:
1、監視數據庫。
2、記錄和統計系統和性能的表現技術信息。
3、構造數據庫框架、配置數據庫實例。
4、維護數據庫網絡安全,過濾非法查詢信息。
5、及時備份數據庫
6、利用備份,還原數據庫,甚至是遷移數據庫。
7、為開發人員定制、配置專用的測試服務器。
8、數據庫技術最新的研發方向。
9、數據庫調優。
10、完整熟悉數據庫操作流程。
11、診斷數據庫,找出數據庫的不足之處和生成數據庫解決方案。
12、完整培訓數據庫系統那個環境。
13、與系統管理員保持良好的合作關系。
14、創建有效的、定期維護的安全的數據庫。37:
數據庫系統的數據獨立性是指,當系統數據存儲結構與數據邏輯結構發生變化時,不會影響應用程序。
數據獨立性包括物理獨立性和邏輯獨立性。物理獨立性指應用程序與存儲在磁盤的數據庫中數據相互獨立,即數據物理存儲改變時應用程序不變。邏輯獨立性指應用程序與數據庫邏輯結構相互獨立,即數據邏輯結構改變時,應用程序可以不變。
38在數據管理技術發展階段中,文件系統階段與數據庫系統階段的主要區別之一是數據庫系統()。
A.數據可共享 B.數據可長期保存
C.采用一定的數據模型組織數據 D.有專門的軟件對數據進行管理 正確答案:C 解析:數據庫采用復雜的數據模型表示數據結構;數據共享性高、冗余度小、易擴充:有較高的數據獨立性;數據庫系統為用戶提供方便的用戶接口:系統提供數據庫的恢復、并發控制、數據完整性和數據安全性4個方面的數據控制功能。相對于文件系統管理數據的方式,它采用一定的數據模型來組織和管理數據。
39數據庫系統有哪些特點:
數據的結構化,數據的共享性好,數據的獨立性好,數據存儲粒度小,數據管理系統,為用戶提供了友好的接口。數據庫系統的核心和基礎,是數據模型,現有的數據庫系統均是基于某種數據模型的。數據庫系統的核心是數據庫管理系統。數據庫系統一般由數據庫、數據庫管理系統(DBMS)、應用系統、數據庫管理員和用戶構成。DBMS是數據庫系統的基礎和核心。
數據庫系統的主要特點有:1)實現數據共享,減少數據冗余2)采用特定的數據模型3)具有較高的數據獨立性4)有統一的數據控制功能另外,數據庫系統由5大部分組成:硬件系統,數據庫集合,數據庫管理系統及相關軟件,數據庫管理員和用戶
40:數據庫,是一個長期存儲在計算機內的、有組織的、有共享的、統一管理的數據集合。數據庫是依照某種數據模型組織起來并存放二級存儲器中的數據集合。
41:數據庫的發展歷史經歷了人工管理、文件系統和數據庫系統三個發展階段。人工管理數據具有如下特點
1、數據不保存
2、數據需要由應用程序自己管理沒有相應的軟件系統負責數據的管理工作
3、數據不共享
4、數據不具有獨立性數據的邏輯結構或物理結構發生變化后必須對應用程序做相應的修改這就進一步加重了程序員的負擔。
文件系統階段特點為
1、數據可以長期保存
2、由專門的軟件即文件系統進行數據管理
使應用程序與數據之間有了一定的獨程序和數據之間由軟件提供的存取方法進行轉換立性程序員可以不必過多地考慮物理細節將精力集中于算法。
3、數據共享性差
4、數據獨立性低
數據庫系統階段特點為
1、數據結構化
2、數據的共享性好冗余度低
3、數據獨立性高
4、數據由DBMS統一管理和控制
一、人工管理階段:特點
數據的管理者:人
數據面向的對象:某一應用程序
數據的共享程度:無共享,冗余度極大
數據的獨立性:不獨立,完全依賴于程序 數據的結構化:無結構
數據控制能力:應用程序自己控制
二、文件系統階段:特點
數據的管理者:文件系統
數據面向的對象:某一應用程序
數據的共享程度:共享性差,冗余度大
數據的獨立性:獨立性差
數據的結構化:記錄內有結構,整體無結構 數據控制能力:應用程序自己控制
三、數據庫系統階段:特點
數據的管理者:數據庫管理系統
數據面向的對象:整個應用系統
數據的共享程度:共享性高,冗余度小
數據的獨立性:具有高度的物理獨立性和邏輯獨立性
數據的結構化:整體結構化,用數據模型描述
數據控制能力:由數據庫管理系統提供數據安全性、完整性、并發控制和恢復能力(其中數據獨立性最高的階段是數據庫系統階段.)
未知:1關系數據模型三要素 2物理模式 內模式 子模式 3 Identify 的使用特點
4;在數據模型中的家族關系的特點 5.sql sever 2008的系統數據庫是什么 6什么是子數據表
上機操作:1、用select語句查詢前十行數據、用select語句查詢前20%的數據 3、用select語句查詢指定列數據
4、什么是查詢設計器
5、在select語句中如何使用GROUP BY
6、exists子查詢語句如何使用
7、insert into 插入語句如何使用 8 update delect語法格式
9、用select語句能夠進行模糊查詢 –like 如何使用
10、用select語句如何使用聚合函數進行統計 匯總 分組
11、在.sql sever中如何進行自動編號設計
什么是自動編號
12、not in 的使用 any some all 的使用、select can’(*)的使用
第二篇:【數據庫知識點總結】
數據庫概念總結
第一章 緒論
1、數據:描述事物的符號記錄稱為數據。可以是數字也可以是文字、圖形、圖像聲音、語言等。
2、數據庫:是長期儲存在計算機內、有組織的、可共享的大量數據的集合。具有永久存儲、有組織和可共享三個基本特點。
3、數據庫管理系統:位于用戶與操作系統之間的一層數據管理軟件。用于科學地組織和存儲數據,高效地獲取和維護數據。
4、數據庫管理系統主要功能:數據定義功能、數據組織存儲和管理、數據操縱功能、數據庫的事務管理和運行管理、數據庫的建立和維護功能、其他。
5、數據庫系統:是指在計算機系統中引入數據庫后的系統,一般由數據庫、數據庫管理系統(及其開發工具)、應用系統、數據庫管理員構成。
特點:數據結構化(與文件系統的本質區別)、數據的共享性高,冗余度低,易擴充、數據獨立性高(通過三級模式和二級映像功能來保證)、數據由DBMS統一管理和控制
6、DBMS須提供以下幾方面的數據控制功能:數據的安全性保護、數據的完整性檢查、并發控制、數據庫恢復。
7、數據管理技術的發展過程:人工管理階段、文件系統階段、數據庫系統階段
8、數據庫的體系結構為三級結構,它們是存儲層、概念層和外部層。
9、在數據庫中用數據模型這個工具來抽象、表示和處理現實世界中的數據和信息。通俗地講,數據模型就是現實世界的模擬。
兩類數據模型:概念模型、邏輯模型和物理模型。
10、數據模型的組成要素:數據結構、數據操作、數據的完整性約束條件。
11、模式:是數據庫中全體數據的邏輯結構和特征的描述,是所有用戶的公共數據視圖。
外模式/模式映像:保證了數據的邏輯獨立性 模式/ 內模式映像:保證了數據的物理獨立性。
12、什么是數據庫的邏輯獨立性?物理獨立性?為什么數據庫系統具有數據與程序的獨立性?
邏輯獨立性是指用戶的用程序與數據庫的邏輯結構是相互獨立的,使得當數據的邏輯結構變了,用戶程序可以不變。物理獨立性是指用戶的應用程序與存儲在磁盤上的數據是相互獨立的,使得當數據的物理結構改變了,應用程序也可以不變。數據庫系統的三級模式是對數據的三個抽象級別,將數據的具體組織留給DBMS 管理,使用戶能邏輯地組織數據,而不必關心數據在計算機上的具體表示方式和存儲方式。為了能夠在內部實現三個抽象層次的聯系和轉換,數據庫系統在三級模式之間提供了兩級映像:外模式/模式映像、模式/ 內模式映,保證了數據庫系統中的數據能夠具有較高的邏輯獨立性和物理獨立性。
13、數據庫系統的組成:硬件平臺及數據庫,軟件,人員
人員:數據庫管理員,系統分析員和數據庫設計人員,應用程序員,最終用戶
數據庫管理員:決定數據庫中的信息內容和結構,決定數據庫的存儲結構和存取策略,定義數據的安全性要求和完整性約束條件,監控數據庫的使用和運行,數據庫的改進和重組重構
第二章 關系數據庫
1、關系模型主要是用二維表格結構表達實體集,用外鍵表示實體間聯系。
2、選擇、投影、并、差、笛卡爾積是5 種基本操作。
3、專門的關系運算包括選擇、投影、連接、除運算等。
第三章 SQL
1、SQL 特點:綜合統一、高度非過程化、面向集合的操作方式、以同一種語法結構提供多種使用方式、語言簡潔,易學易用。
2、聚集函數:COUNT([DISTINCT|ALL]*)COUNT([DISTINCT|ALL]<列名>)SUM([DISTINCT|ALL]<列名>)AVG([DISTINCT|ALL]<列名>)MAX([DISTINCT|ALL]<列名>)MIN([DISTINCT|ALL]<列名>)
3、視圖的作用:
1、能夠簡化用戶的操作
2、使用戶能以多種角度看待同一數據
3、對重構數據庫提供了一定程度的邏輯獨立性
4、能夠對機密數據提供安全保護
5、適當的利用視圖可以更清晰的表達查詢
4、WHERE 子句與HAVING 短語的區別在于作用對象不同。前者作用于基本表或視圖,從中選擇滿足條件的元組。后者作用于組,從中選擇滿足條件的組。
5、=ANY 等價于IN 謂詞, 第四章 數據庫安全性 1、數據庫的安全性是指保護數據庫以防止不合法的使用所造成的數據泄露,更改或破壞。 2、計算機系統的三類安全性問題:技術安全、管理安全、政策法律。 3、常用的安全技術有:1.用戶識別和鑒別2.存取控制機制3.自主存取控制4.強制存取控制(MAC)5.視圖機制。6.審計(Audit)功能7.數據加密 4、視圖的好處:簡化用戶操作、使用戶能以多種角度看待同一數據、對重構數據庫提供了一定程度的邏輯獨立性、對機密數據提供安全保護、適當利用可以更清晰的表達查詢。 5、實現數據庫系統安全性的技術和方法 — 最重要的是存取控制技術、視圖技術和審計技術 第五章 數據庫完整性 1、數據庫完整性是指數據的正確性和相容性。 2、數據的完整為了防止數據庫中存在不符合語義的數據,即防止數據庫中存在不正確的數據。安全性是保護數據庫防止惡意的破壞和非法的存取。因此數據完整性防范的是合法用戶的無意操作導致的數據錯誤,數據安全性防范的是非法用戶的惡意操作導致的數據錯誤。 3、實體完整性:若屬性(指一個或一組屬性)A 是基本關系R 的主屬性,則A 不能取空值。 4、參照完整性:若屬性(或屬性組)F 是基本關系R 的外碼,它與基本關系S 的主碼K 相對應(基本關系R 和S 不一定是不同的關系),則對于R 中每個元組在F 上的值必須為: 或者取空值(F 的每個屬性值均為空值); 或者等于S 中某個元組的主碼值。 5、觸發器是用戶定義在關系表上的一類由事件驅動的特殊過程。 6、在參照完整性中,為什么外碼的屬性值也可以為空?什么時候可以為空? 若F 是基本關系R 的外碼,它與基本關系S 的主碼K,相對應(基本關系R 和S 不一定是不同的關系)則對于R 中每個元組在F 上的值可以取空值,或者等于S 中某個元組的主碼值。即,如果F 本身不是一個主屬性,則能取空值,否則不能取空值。 第六章 關系數據理論 1、數據依賴是一個關系內部屬性與屬性之間的一種約束關系。 2、函數依賴:設R(U)是屬性集U上的關系模式。X,Y 是U 的子集。若對于R(U)的任意一個可能的關系r,r 中不可能存在兩個元組在X 上的屬性值相等,而在Y 上的屬性值不等,則稱X 函數確定Y 或Y 函數依賴于X,記作X →Y。 3、多值依賴:設R(U)是屬性集U 上的一個關系模式。X,Y,Z 是U 的子集,并且Z=U-X-Y。關系模式R(U)中多值依賴成立,當且僅當對R(U)的任一關系r,給定的一對(x,z)值,有一組Y 的值,這組值僅僅決定于x 值而與z 值無關。4、1NF:每一個分量必須是不可分的數據項。2NF:R ∈1NF,且每一個非主屬性完全依賴于碼 3NF:關系模式R中若不存在這樣的碼X,屬性組Y 及非主屬性 Z(ZY)使得XY,YZ 成立,YX,則稱R3NF。 BCNF:關系模式R ∈1NF。XY 且YX 時X 必含有碼,則稱RBCNF。4NF :關系模式 R ∈1NF,如果對于R 的每個非多值依賴X Y(YX),X 都含有碼,則稱R4NF。 5、規范化小結:1NF—2NF 消除非主屬性對碼的部分函數依賴 ——3NF 消除非主屬性對碼的傳遞函數依賴—BCNF消除主屬性對碼的部分和傳遞函數依賴—4NF 消除非平凡且非函數依賴的多值依賴。 第七章 數據庫設計 1、數據庫設計定義:對于一個給定的應用環境,構造(設計)優化的數據庫邏輯模式和物理結構,并據此建立數據庫及其應用系統使之能夠有效地存儲和管理數據,滿足各種用戶應用需求,包括信息管理要求和數據操作要求。 2、特點:三分技術,七分管理,十二分基礎數據。結構(數據)設計和行為(處理)設計相結合。 3、基本步驟:需求分析、概念結構設計、邏輯結構設計、物理結構設計、數據庫實施、數據庫運行和維護。 4、需求分析階段任務:信息要求、處理要求、安全性與完整性要求。 5、需求分析階段:綜合各個用戶的應用需求 概念設計階段:形成獨立于機器特點,獨立于各個DBMS產品的概念模式(E-R圖)邏輯設計階段:將E-R圖轉換成具體的數據庫產品支持的數據模型,形成數據庫邏輯模式;再建立必要的視圖,形成數據的外模式 物理設計階段:進行物理存儲安排,建立索引,形成數據庫內模式 6、數據字典:系統中各類數據描述的集合,是進行詳細的數據收集和數據分析所獲得的主要成果。通常包括數據項、數據流、數據存儲和處理 5 部分。數據字典是關于數據庫中數據的描述,即元數據,而不是數據本身。 7、概念結構設計方法:自頂向下、自底向上、逐步擴張、混合策略。 8、確定數據庫物理結構:確定數據的存放位置和存儲結構,包括:確定關系、索引、聚簇、日志、備份等的存儲安排和存儲結構。確定系統配置。 第八章 數據庫編程 1、游標是系統為用戶開設的一個數據緩沖區,存放SQL 語句的執行結果,每個游標區都有一個名字。用戶可以通過游標逐一獲取記錄,并賦給主變量,交由主語言進一步處理。 2、嵌入式SQL語句與主語言之間的通信:向主語言傳遞SQL語句的執行狀態信息,使主語言能夠據此控制程序流程,主要用SQL通信區(SQLCA)實現。主語言向SQL語句提供參數,主要用主變量實現。將SQL語句查詢數據庫的結果交主語言處理,主要用主變量和游標實現。 3、存儲過程是由PL/SQL 語句書寫的過程,這個經編譯和優化后存儲在數據庫服務器中,因此稱它為存儲過程,使用時只要調用即可。優點:運行效率高、降低了客戶機和服務器之間的通信量、有利于集中控制,方便維護。 4、ODBC的工作流程:配置數據源,初始化環境,建立連接,分配語句句柄,執行SQL語句,結果集處理,中止 第九章 關系查詢處理和查詢優化 1、查詢處理步驟:查詢分析 對查詢語句進行掃描、詞法分析和語法分析。 查詢檢查 根據數據字典對合法的查詢語句進行語義檢查根據數據字典中的用戶權限和完整性約束定義對用戶的存取權限進行檢查 查詢優化 選擇一個高效執行的查詢處理策略 查詢執行 依據優化器得到的執行策略生成查詢計劃,由代碼生成器生成執行這個查詢計 劃的代碼。 2、連接操作的實現 嵌套循環方法 排序-合并方法 索引連接方法 Hash Join方法 3、查詢優化的總目標 是選擇有效的策略,求得給定關系表達式的值,使得查詢代價最小(實際上是較小)。 第十章 數據庫恢復技術 1、事務是用戶定義的一個數據庫操作序列,這些操作要么全做要么全不做,是一個不可分割的工作單位。特性:原子性、一致性、隔離性、持續性。 2、故障種類:事務內部故障、系統故障、介質故障、計算機病毒 3、數據轉儲是數據庫恢復中采用的基本技術即DBA 定期地將整個數據庫復制到磁帶或另一個磁盤上保存起來的過程。 4、日志文件是用來記錄事務對數據庫的更新操作的文件。主要有兩種格式:以記錄為單位的日志文件和以數據塊為單位的日志文件。 5、數據庫鏡像即根據DBA 的要求,自動把整個數據庫或其中的關鍵數據復制到另一個磁盤上。 第十一章 并發控制 1、并發控制機制的任務:對并發操作進行正確調度,保證事務的隔離性,保證數據庫的一致性 2、并發操作帶來的數據不一致性主要包括丟失修改、不可重復讀和讀“臟”數據等。 3、封鎖就是事務T 在對某個數據對象操作之前,先向系統發出請求,對其加鎖?;镜姆怄i類型在兩種:排它鎖(X 鎖,寫鎖)和共享鎖(S 鎖,讀鎖)。 4、預防死鎖的方法:一次封鎖法,順序封鎖法 死鎖的診斷與解除 超時法 等待圖法 5、可串行化調度:多個事務的并發執行是正確的,當且僅當其結果與按某一次序串行地執行這些事務時的結果相同,稱這種調度策略為可串行化的調度。 6、兩段鎖協議是指事務必須分兩個階段對數據項加鎖和解鎖。在對任何數據進行讀、寫操作之前,首先要申請該數據的封鎖;在釋放一個封鎖之后,事務不再申請和獲得任何其他封鎖.7、封鎖對象的大小稱為封鎖粒度。 8、選擇封鎖粒度的原則:需要處理多個關系的大量元組的用戶事務:以數據庫為封鎖單位; 需要處理大量元組的用戶事務:以關系為封鎖單元; 只處理少量元組的用戶事務:以元組為封鎖單位 文件處理系統存在問題:數據的冗余和不一致,數據訪問困難,數據孤立,完整性問題,原子性問題,并發訪問異常,安全性問題 數據庫三級抽象物理層:最低層次的抽象,描述數據實際上是怎樣存儲的。邏輯層:比物理層層次稍高的抽象,描述數據庫中存儲什么數據及這些數據間存在什么關系。視圖層:最高層次的抽象,只描述整個數據庫的某個部分 數據操縱語言DML:使用戶可以訪問或操作那些按其某種適當的數據模型組織起來的數據。過程化DML:要求用戶指定需要什么數據以及如何獲得這些數據。非過程化DML:只要求用戶指定需要什么數據,而不指明如何獲得這些數據 事務狀態圖 活動狀態:初始狀態;事務執行時處于這個狀態。部分提交狀態:最后一條語句執行后。失敗狀態:發現正常的執行不能繼續之后。中止狀態:事務回滾并且數據庫已恢復到事務開始執行前的狀態之后。提交狀態:成功完成后 事務進入中止狀態,系統有兩種選擇:重啟事務:事務中止是硬件錯誤或不是由事務的內部邏輯產生的軟件錯誤時。殺死事務:事務的內部邏輯錯誤,或者由于輸入錯誤,或所需數據在數據庫中沒有找到 可恢復調度:對于每對事務 數據管理技術的發展經歷了3個階段:人工管理階段、文件系統階段、數據庫管理階段。數據庫的三級模式由[模式]、[外模式]、[內模式]組成。(模式又叫概念模式、邏輯模式,外模式又叫子模式、用戶模式,內模式又叫存儲模式)外模式/模式映像反映了數據的邏輯獨立性,模式/內模式映像反映了數據的物理獨立性 數據模型由數據結構、數據操作、和完整性約束三要素組成 關系模型是第二代數據庫的主要特征,其結構比較簡單,數據本身以二維表形式進行存儲,表之間的數據聯系是通過一個表的碼與另一個表的碼的連接來實現的。數據邏輯獨立性是指模式改變,外模式和應用程序不變。物理獨立性是指內模式改變,模式不變 數據庫系統中,用概念模式(即模式)描述全部數據的整體邏輯結構 數據庫系統中用戶使用的數據視圖用外模式描述,它是用戶與數據庫系統的接口 ∏是投影運算,倒寫的6字是選擇運算 笛卡爾積重點看一下P27中間部分舉的例子 記錄是字段的有序集合 字段:標記實體屬性的命名單位稱為字段如學生有學號、姓名、年齡、性別等字段 元祖:二維表中的行即記錄值稱為元祖 增刪改查語句對應的關鍵字分別為INSERT、DELETE、UPDATE、SELECT 修改表的結構使用的是ALTER TABLE語句添加一列用ADD關鍵字、修改一列用ALTER COLUMN 刪除一列用DROP COLUMN 如ALTER TABLE student ADD 身份證號 VARCHAR(18);表示修改student表的結構,在其中添加身份證號一列(主)數據文件的擴展名為.mdf ,日志文件的擴展名是.ldf 開啟事務:BEGIN TRANSATION 提交事務:COMMIT TRANSACTION 回滾事務:ROLLBACK TRANSACTION 主鍵:PRIMARY KEY 外鍵:FOREIGN KEY 實體之間的聯系有1: 1、1:m、m:n,即1對1,一對多、多對多 聚合函數: SUM:求和 MAX:求最大值 COUNT:計數 AVG:求平均值 GRANT:授權 REVOKE:收回權限 CONSTRAINT:約束 數據庫設計的步驟:需求分析階段、概念設計階段、邏輯設計階段、物理設計階段、數據庫實現階段、數據庫的運行與維護階段 事務具有四個特征原子性、一致性、隔離性、持久性 P116參考答案: 1. 題干:數據庫中有四張表客戶表:Customers、代理人表Agents、產品表Products和訂單表Orders; 其中客戶表Customers各屬性如下: Cid 客戶編號、Cname客戶名、City客戶所在城市 代理人表Agents各如下屬性 Aid代理人編號、Aname代理人姓名、City代理人所在城市 產品表Products中各屬性如下 Pid產品編號、Pname產品名稱、Quantity產品銷售數量、Price產品單價 訂單表Orders表中各屬性如下 Ord_no訂單號、Month訂單月份,Cid客戶編號、Aid代理人編號、Pid產品編號、Qty訂貨數量、Amount訂貨總金額; 根據以上四個表編寫存儲過程實現如下要求: ①給指定產品編號的單價增加0.5元 CREATE PROCEDURE pro_update_products @pid CHAR(10)AS UPDATE products SET price=price+0.5 WHERE pid=@pid GO ②插入一個新的產品記錄到產品表Products中 CREATE PROCEDURE pro_insert_products @pid CHAR(10), @pname VARCHAR(30), @quantity INT, @price FLOAT AS INSERT INTO products VALUES(@pid,@pname,@quantity,@price)GO ③查詢某客戶通過某代理訂購產品的訂貨總量 CREATE PROCEDURE pro_Query_Amount @cname VARCHAR(20), @aname VARCHA(20)AS SELECT Amount FROM Customers c,Orders o,Agents a WHERE c.cid=o.cid AND a.aid=o.aid AND c.cname=@cname AND a.anane=@aname GO 2.根據第一題的四個表用觸發器實現以下操作 ①當向產品表products插入數據時,規定產品單價不得低于0.5元,若低于0.5元則統一調整為0.5元,同時提示用戶“產品單價不得低于0.5元” CREATE TRIGGER tri_products ON products FOR INSERT AS DECLARE @pid CHAR(10),@price FLOAT SELECT @pid=pid,@price=price FROM INSERTED IF @price<0.5 BEGIN UPDATE products SET price=0.5 WHERE pid=@pid PRINT ‘產品單價不得低于0.5元’ END GO ②當訂單表Orders中的訂貨數量有變動時,觸發器自動修改該項訂單的訂貨總金額Amount CREATE TRIGGER tri_orders ON Orders FOR UPDATE AS DECLARE @ord_no CHAR(10),@pid CHAR(10),@Qty INT,@price FLOAT IF UPDATE(Qty)BEGIN SELECT @ord_no,@pid=pid,@Qty=Qty FROM INSERTED SELECT @price=price FROM products WHERE pid=@pid UPDATE Orders SET Amount=@price*@Qty WHERE Ord_no=@ord_NO END GO 第四章第2題的參考答案P91 設有三個關系 S(S#,SNAME,SEX,AGE)SC(S#,C#,GRADE)C(C#,CNAME,TEACHER)用select語句完成下列查詢 ①檢索LIU老師所受課程的課程號和課程名 SELECT C#,CNAME FROM C WHERE TEACHER=’LIU’; ②檢索年齡大于23歲的男同學的學號和姓名 SELECT S#,SNAME FROM S WHERE SEX=’男’ AND AGE>23; ③檢索學號為S3的學生所學課程的課程名與授課老師名 SELECT CNAME,TEACHER FROM SC,C WHERE SC.C#=C.C# AND SC.S#=’S3’; ④檢索至少選修LIU老師所受課程中一門課程的女學生姓名 SELECT DISTINCT SNAME FROM S,SC WHERE S.SEX=’女’ AND S.S#=SC.S# AND SC.C# =ANY(SELECT C# FROM C WHERE TEACHER=’LIU’); ⑤檢索WANG同學不學課程的課程號 SELECT C# FROM C WHERE C# NOT IN(SELECT C# FROM SC,S WHERE SC.S#=C.C# AND S.SNAME=’WANG’); ⑥檢索至少選修兩門課的學生學號 SELECT S# FROM SC GROUP BY S# HAVING COUNT(C#)>=2; ⑦檢索全部學生都選修的課程的課程號和課程名 SELECT C#,CNAME FROM C WHERE C# IN(SELECT C# FROM SC WHERE S#=ALL(SELECT S# FROM S))⑧檢索選修課程包含LIU老師所受全部課程的學生學號 SELECT S# FROM SC WHERE C# =ALL(SELECT C# FROM C WHERE TEACHER=’LIU’) 第一章 數據庫系統概論 1.試述數據、數據庫、數據庫系統、數據庫管理系統的概念。 數據:描述事物的符號記錄稱為數據。數據的種類有文字、圖形、圖象、聲音、正文等等。數據與其語義是不可分的。 數據庫:數據庫是長期儲存在計算機內、有組織的、可共享的數據集合。數據庫中的數據按一定的數據模型組織、描述和儲存,具有較小的冗余度、較高的數據獨立性和易擴展性,并可為各種用戶共享。 數據庫系統:數據庫系統(DBS)是指在計算機系統中引入數據庫后的系統構成。數據庫系統由數據庫、數據庫管理系統(及其開發工具)、應用系統、數據庫管理員構成。 數據庫管理系統:數據庫管理系統(DBMS)是位于用戶與操作系統之間的一層數據管理軟件。用于科學地組織和存儲數據、高效地獲取和維護數據。DBMS主要功能包括數據定義功能、數據操縱功能、數據庫的運行管理功能、數據庫的建立和維護功能。 2.什么是數據獨立性?數據獨立性又分為哪兩個層次?為什么需要數據獨立性? 數據獨立性是用來描述數據與應用程序之間的依賴程度,包括數據的物理獨立性和數據的邏輯獨立性,依賴程度越低則獨立性越高 物理獨立性是指用戶的應用程序與存儲在磁盤上的數據庫的數據時相互獨立的。邏輯獨立性是指用戶的應用程序與數據庫的邏輯結構是相互獨立的。 作用:數據在磁盤上怎樣存儲由DBMS管理,用戶程序不需要了解,應用程序要處理的只是數據的邏輯結構,這樣當數據的物理存儲改變了,應用程序不用改變。數據獨立性是通過數據庫管理系統的兩層映像功能來實現 3.什么是數據模型?數據模型的基本要素有哪些?為什么需要數據模型? 數據模型是描述數據語義、數據與數據之間聯系(數據結構)、數據操作,以及一致性約束的概念和工具的集合數據模型的基本要素: ①數據結構:是所研究的對象類型的集合,是對系統的靜態特性的描述。 ②數據操作:是指對數據庫中各種對象(型)的實例(值)允許進行的操作的集合,包括操作及有關的操作規則,是對系統動態特性的描述。 ③數據的約束條件:是完整性規則的集合,完整性規則是給定的數據模型中數據及其聯系所具有的制約和依存規則,用以限定符合數據模型的數據庫狀態以及狀態的變化,以保證數據的正確、有效、相容。 作用:一般地講,數據模型是嚴格定義的概念的集合。這些概念精確地描述系統的靜態特性、動態特性和完整性約束條件。 4.為什么數據模型要分為概念模型,邏輯模型和物理模型三類?試分別解釋概念模型、邏輯模型和物理模型 為什么:數據模型應滿足3方面的要求:一是能比較真實的模擬現實世界;二是容易被人所理解;三是便于在計算機上實現。一種數據模型要很好地同時滿足這3個方面的要求是很困難的,因此,在數據庫管理系統中這對不同的使用對象和應用目的,采用不同的數據模型。 概念模型:指概念層次的數據模型,也稱為信息模型,它按用戶的觀點或認識對現實世界的數據和信息進行建模,主要用于數據庫設計。常用的概念模型有實體聯系模型(E-R模型)和面向對象OO模型 邏輯模型;用來描述數據庫數據的整體邏輯結構。傳統的邏輯數據模型有層次模型、網狀模型和關系模型,非傳統的邏輯數據模型有面向對象模型、XML模型等 物理模型用來描述數據的物理存儲結構和存取方法 5.關系模型中的主要概念有哪些,試分別解釋之。 關系模型由一組關系組成,每個關系的數據結構是一張規范化的二維表。關系模型中的常用術語有:關系、元組、屬性、碼、域、分量和關系模式等。關系模型要求關系必須是規范化的,即關系的每一個分量必須是一個不可分的數據項。關系數據模型的操作主要包括查詢、插入,刪除和修改(更新數據)。關系數據模型的完整性約束條件包括實體完整性、參照完整性和用戶自定義完整性 6.試解釋數據庫的三級模式結構和兩層映像。為什么數據庫管理系統要提供數據庫的三級模式結構和兩層映像? 數據庫管理系統的數據抽象一般包括物理層抽象、邏輯層抽象和視圖層抽象三個級別。對應于數據抽象的三個級別,數據庫管理系統一般也提供觀察數據庫的三個不同角度,以方便不同的而用戶使用數據庫的需要,這就是數據庫的三級模式結構;內模式、模式和外模式 為了能夠在系統內部實現三個抽象層次的數據之間的聯系和轉換,數據庫管理系統在數據庫的三級模式之間提供了兩層映像:外模式/模式映像、模式/內模式映像。正是這兩層映像保證了數據庫中的數據能夠具有較高的邏輯獨立性和物理獨立性 7.解釋模式、外模式、內模式、DDL、DML等概念 內模式也稱存儲模式,對應于物理層數據抽象,它是數據的物理結構和存儲方式的描述,是數據在數據庫內部的表示方式 模式也稱為邏輯模式,賭贏與邏輯層數據抽象,是數據庫中全體數據的邏輯結構和特征的描述,是所有用戶的公共數據視圖 外模式也成子模式或用戶模式,對應于視圖層數據抽象,它是數據庫用戶(包括應用程序員和最終用戶)能夠看見和使用的局部數據的邏輯結構和特征的描述,是數據庫用戶的數據視圖,是與莫以具體運用有關的數據的邏輯表示 數據庫模式定義語言DDL(Data Definition Language),是用于描述數據庫中要存儲的現實世界實體的語言。一個數據庫模式包含該數據庫中所有實體的描述定義。這些定義包括結構定義、操作方法定義等。 數據操縱語言DML,命令使用戶能夠查詢數據庫以及操作已有數據庫中的數據的計算機語言。具體是指是SELECT查詢、UPDATE更新、INSERT插入、DELETE刪除。 第二章 關系模型與關系代數 1.名詞解釋 域:一組具有相同數據類型的值的集合 笛卡爾積:兩個分別為N目和m目的關系R和S的笛卡爾積是一個n+m目元組的集合 超碼:屬性集A能唯一標識關系r中的一個元組,則稱A為關系R的一個超碼 候選碼:對于關系r中一個或多個屬性的集合A,若屬性集A中的任意真子集都不能成為關系r的超碼,則、、、、、主碼:在實體集中區分不同實體的候選碼。 外碼:用于建立和加強兩個表數據之間的關系而引用另一個關系的主碼。 關系模式:是型的概念,它定義了元組集合的結構,即定義了一個元組由哪些屬性構成 關系數據庫:在一個給定的應用領域中,所有實體以及實體之間的聯系所對應的關系的集合 空值:是所有可能的域的一個取值,表明值未知或不存在。 2.關系模式的完整性:實體完整性、參照完整性和用戶自定義完整性。實體完整性:若屬性A是關系r中的主碼,則A不能取空值 參照完整性:若屬性F是關系r的外碼,它與關系s的主碼Ks相對應,則對于關系r中的每一個元組在屬性F上的取值,要么為空值,要么等于關系s中的某個元組的值 3.自然連接和等值連接的區別于聯系 等值連接:是從兩個關系的笛卡爾積中選取連接屬性滿足相等條件的所有元組。 自然連接:是一種特殊的等值連接,它要求兩個參與連接的關系具有公共的屬性集,并且在結果中把重復的屬性列去掉 第四章 數據庫建模(實體-聯系模型) 1.請簡要解釋下列術語:實體、實體集、屬性、域、聯系、聯系集、角色、映射基數、超碼、候選碼、主碼、弱實體、類層次、聚合 實體是客觀世界中可區別于其他事物的“事物”或“對象”。實體既可以是有形的,實在的事物,也可以是抽象的、概念上存在的事物。相同類型的實體組成的集合稱為實體集 實體是通過一組屬性來描述的,其屬性是實體集中給每個實體都具有的性質。每個屬性所允許的取值范圍或集合稱為該屬性的域 聯系兩個或兩個以上實體之間的聯系。相同類型聯系組成的集合稱為聯系集。聯系也可擁有自身的描述性屬性 由于參與一個聯系的實體集通常是不同的,因而角色是隱含的并且常常不需聲明。但是,當參與聯系的實體來自相同的實體集,則需要聲明角色 映射基數指一實體集中的一個實體通過一個聯系集能同時與另一個實體集相聯系的實體數目。映射基數可決定聯系集的主碼屬性,甚至可能影響到一個事物是作為實體還是聯系的選擇 超碼是指能夠唯一的標識實體集或聯系集中的一個實體或一個聯系的一個或多個屬性的集合。當一個超碼的任意真子集都不能成為超碼時,稱該最小超碼為候選碼。候選碼和超碼是實體集客觀存在的特性,而主碼是被數據庫設計者主觀選中,用來區分同一實體集中不同實體的候選碼 當一個實體集的所有屬性都不足以形成主碼,就稱該實體集為弱實體集。相反,其屬性可以形成主碼的實體集稱為強實體集。弱實體集所以來的強實體集稱為標識實體集。標識實體集和弱實體集之間必須是一對多關系,并且弱實體集中的實體在聯系集中是全部參與的 E-R模型使用繼承和ISA聯系來描述實體集之間概念上的層次關系。當欲建立聯系間的聯系時,可使用聚合實現 聚合是一種抽象,它將一個聯系集及其相關聯的實體集抽象為一高層實體集對待,然后建立該高層實體集與其他實體集之間的聯系集 2.綜合題:需求分析----E-R圖---關系模式 第七章 數據庫存儲結構 1.數據庫系統的存儲訪問方式是什么?為什么要這樣? 一個數據庫映射為多個不同的文件,這些文件由底層的操作系統來維護,永久地存放在磁盤上,并且具有三級存儲介質上的備份。每個文件分成定長的存儲單元,稱為塊。塊是存儲分配和數據傳輸的基本單位 當數據庫系統中的程序需要磁盤上的塊時,它向緩沖區管理器發出請求(即調用)。如果這個塊已經在緩沖區中,緩沖區管理器將這個塊在主存儲器中的地址返回給請求者。如果這個塊不再緩沖區中,緩沖區管理器首先在緩沖區中為這個塊分配空間,如果需要的話會把其他塊移出主存儲器為這個新塊騰出空間,移出的塊僅當它在最近一次寫回磁盤后修改過才需要寫回磁盤;然后,換紅區管理器把這個塊從磁盤讀入緩沖區,并將這個塊在主存儲器中的地址返回給請求者。緩沖區管理器的內部動作對發出磁盤塊請求的程序是透明的。原因:數據庫系統的一個主要目標就是減少磁盤和主存儲器之間傳輸的塊數。減少磁盤訪問次數的一種方法是在主存儲器中保留盡可能多的塊,目的是最大化要訪問的塊已經在主存儲器中的幾率,這樣就不再需要訪問磁盤了 2.什么是聚集文件組織、什么是多表聚集文件組織?為什么需要多表聚集文件組織?為什么要慎用多表聚集文件組織? 聚集文件組織:很多關系數據庫系統將各個關系存儲在一個個獨立的文件中,不同關系中有聯系的數據是通過關系間的聯接操作得到的,但是當數據的數量比較大時,這種方法速度會很慢。而在聚集文件組織方式中,一個文件可以存儲多個關系的記錄,不同關系中有聯系的記錄存儲在一起可以提高查找速度。 多表聚集文件組織:在一個塊中存儲兩個或多個關系的相關記錄,以加速特定連接的處理。但是它將會導致其他類型查詢的處理變慢 3.為什么需要索引?什么是順序索引和散列索引?什么是主索引和輔助索引?稠密索引和稀疏索引有什么不同?什么是索引順序文件? 許多查詢只涉及到文件中的少量記錄,索引能使系統直接定位這些滿足查詢條件的記錄。DBMS首先會查找索引,找到對應記錄所在的位置(即所在磁盤的塊地址),然后讀取該磁盤塊,得到所需的記錄 順序索引是基于搜索碼的值的順序排列,用于支持快速地對文件中的記錄進行順序或隨機的訪問。散列索引時通過搜索碼值的散列函數的值將所有記錄平均、隨機地分布到若干個散列桶中,用于支持快速地對文件中的記錄進行隨機地訪問 如果索引文件中的記錄按照某個搜索碼值指定的順序物理存儲,那么該搜索碼對應的索引就稱為主索引,也叫聚集索引。與此相反,搜索碼值順序與索引文件中記錄的物理順序不同的那些索引稱為輔助索引或非聚集索引 如果索引文件中的每一個不同的搜索碼值,在索引中都有一個索引記錄(或稱為索引項),則該索引稱為稠密索引。如果只對索引文件中的部分搜索碼值,在索引中存在一個索引記錄,則該索引稱為稀疏索引。每一個索引項包含搜索碼值和指向具有該搜索碼值的第一個數據記錄的指針。利用稠密索引通常可以比稀疏索引能夠更快地定位一條記錄的位置,但是稀疏索引占用空間更小,插入、刪除和更新的開銷也會更小 建立了主索引的索引文件稱為索引順序文件:稠密索引、稀疏索引 4.B+樹索引的根結點,非葉結點和葉結點都具有相同的數據結構,那它們之間有什么不同? 非葉結點的結構與葉結點結構相同,只不過非葉結點中的所有指針都是指向B+樹種下一層節點的指針,根結點與其他非葉結點不同,它包含的指針書可以小于n/2,但至少包含兩個指針 5.散列文件組織和散列索引有什么不同? 在散列文件組織中,通過計算一條記錄的搜索碼值的散列函數值,可以直接獲得包含該記錄的磁盤塊(桶)的地址。在散列索引組織中,把搜索碼值以及與它們先關聯的記錄指針組織成一個散列文件結構 6.在考慮用索引時,是選擇B+樹索引還是散列索引?為什么? 散列其實就是一種不通過值的比較,而通過值的含義來確定存儲位置的方法,它是為有效地實現等值查詢而設計的。不幸的是,基于散列技術不支持范圍檢索。而基于B+樹索引技術能有效的支持范圍檢索,并且它的等值檢索效果也很好。但是,散列技術在等值連接中是很有用的,尤其是在索引嵌套循環連接方法中,基于散列的索引和基于B+樹的所以在代價上會有很大差別 7.數據庫物理設計的主要內容是什么?數據庫物理設計的目標是什么? 數據庫物理設計的目標是:提高數據庫性能,以滿足應用的性能需求;有效利用存儲空間;在性能和代價之間做出最優平衡 數據庫物理設計的內容包括:確定數據庫性能,以滿足應用的性能需求;有效利用存儲空間;在性能和代價之間做出最優平衡 第八章 查詢處理 1.查詢處理的過程分為哪幾個步驟 ?語法分析與翻譯?查詢優化?查詢執行 2.查詢代價如何度量?為什么? 查詢處理的代價可以通過該查詢對各種資源的使用情況進行度量,主要包括磁盤存取時間和執行一個查詢所用CPU時間以及在并行/分布式數據庫系統中的通信開銷等 3.如何實現選擇運算? 用于選擇運算的搜索方法?不用索引的搜索算法----文件掃描?使用索引的搜索算法---索引掃描 4.題見書(1)最壞情況下,緩沖區只能容納每個關系的一個數據塊,因而算法的代價為:EJ = nr * bs + br。這里,nr = 20000,bs =1500,br=800,所以所需要的塊存取數為20000*1500+800,約為30M個塊存取。最好情況下,兩個關系都能放到內存里,因而算法代價為:EJ = bs + br。大約需要2.3K個塊存取。 5.為什么需要查詢優化?什么是查詢執行計劃?查詢優化器的輸入和輸出分別是什么? 處理一個給定的查詢,尤其是復雜的查詢,通常會有許多種策略。查詢優化就是從這多種策略中找出最有效的查詢執行計劃的處理過程。 給定一個關系代數表達式,查詢優化器的任務就是產生一個查詢執行計劃,該計劃能獲得與原關系代數表達式相同的結果,并且執行代價是接近最小的 6.題見書:由于是計算三個關系的自然連接,且連接屬性中的C、E是各自關系的主碼,因此r1r2r3的大小最多為1000個元組。有效地計算這個連接的策略就是讓連接結果較小的連接運算先執行,即:(r1r2)r3。原因就是:由于A是r1的主碼,C是連接屬性,因此r1r2的最大結果為1000個元組;而C是r2的主碼,E是連接屬性,因此r2r3的最大結果為1500個元組。所以,要讓(r1r2)先做連接運算,以減少結果集的大小。7.畫樹 其它章節零散習題 列級約束和元組級約束的區別在哪里? 如果在定義屬性的同時定義約束條件,則為列級約束;如果單獨定義約束條件,則為元組級約束 什么是事物的ACID特性? ①原子性:事務的所有操作要么全部都被執行,要么都不被執行②一致性;即一個單獨執行的事務應保證其執行結果的一致性,即總是將數據庫從一個一致性狀態轉化到另一個一致性狀態③隔離性:即當多個事務并發執行時,一個事務的執行不能影響另一個事務,即并發執行的各個事務不能相互干擾④持久性:即一個事務成功提交后,它對數據庫的改變必須是永久的,即使隨后系統出現故障也不會受到影響 當前主流的數據庫訪問技術是ADO Web服務器的職責是什么?數據庫服務器的職責又是什么? Web服務器負責監聽客戶的請求,一旦收到客戶請求,數據庫服務器 三級數據庫考點分析之計算機基礎知識 1.1計算機系統組成與應用領域 考點1計算機系統組成 一個完整的計算機系統,包括硬件和軟件兩個部分。 硬件系統是指組成一臺計算機的各種物理裝置,它是計算機的物質基礎,由各種器件組成,如主板、CPU、硬盤、顯示器、內存和線路等。 軟件系統是運行在計算機硬件設備上的各種程序及相關資料的總稱。 以存儲程序原理為基礎的馮·諾依曼結構的計算機,一般由五大功能部件組成,它們是運算器、控制、存儲器、輸人設備以及輸出設備。 下面分別對各種設備進行介紹。 1運算器 運算器是用于對數據進行加工的部件,它可以對數據進行算術運算和邏輯運算。算術運算包括加、減、乘、除、求余及復合運算。邏輯運算包括一般的邏輯判斷和邏輯比較。 2控制器 控制器是計算機的控制部件。它控制計算機各部分自動協調地工作,用于對程序的指令進行解釋和執行,協調輸人、輸出設備,以實現數據輸人、運算和輸出等操作。 3存儲器 存儲器的主要功能是存放程序和數據,是計算機的記憶存儲裝置。它分為內部存儲器和外部存儲器。 4輸入設備 輸人設備是計算機從外部接收、獲取信息的裝置。其功能是將數據、程序及其他信息,從人們所熟知的形式轉換成計算機能識別的信息形式,并輸人到計算機內部。 常見輸人設備有鼠標、鍵盤、掃描儀、紙帶輸人機、模/數轉換器(A/D轉換器)等 5輸出設備 輸出設備的主要功能是將計算機處理過的二進制形式的信息轉換成人們所需要的形式或其他設備接受并可以識別的信息形式。常見的輸出設備有顯示器、打印機、聲音合成輸出、繪圖儀和數/模轉換器(D/A轉換器)等 一般把運算器和控制器合稱為中央處理器(Central Processor Unit,簡稱CPU),中央處理器與內存儲器統稱為主機.輸人設備、輸出設備和外存儲器合稱為外部設備,外部設備通過接口與主機相連。考點2計算機的應用領域 l 科學和工程計算 主要是用數值方法對一些數學問題的求解。計算機不僅可以提高計算的速度,還可以使一些人工不能解決的數學問題得到解決。在科學實驗和工程設計中,經常會遇到一些數學方程和函數問題,這些問題人們不能從理論上得出其準確解,但利用計算機可以得到它們的近似解。這種應用稱為科學和工程計算,其特點是計算量大,而邏輯關系相對簡單。 2數據和信息處理 數據處理是指對數據的收集、存儲、加工、分析和傳送的一系列過程。 計算機的一個非常重要的應用領域就是對數據和信息的處理。數據的含義是相當廣泛的,包括聲、像、文字和圖表等,它們都可以用計算機來進行處理。 3過程控制 過程控制是自動化技術的重要技術內容和手段.指計算機對所采集到的數據按一定的方法經過計算,然后輸出到指定的執行設備中去控制生產的過程。 4輔助設計 計算機輔助設計(Computer Aided Design,簡稱CAD)是用計算機來幫助設計人員進行產品、工程設計的重要技術手段,可以節省人力和物力,且速度快,質量高,能有效縮短產品的設計周期。 這里有必要提一下這幾個名詞:計算機輔助制造(Computer Aided Manufacturing,簡稱CAM)、計算機輔助測試(Computer Aided Testing,簡稱CAT)和計算機輔助教學(Computer Aided Instruction,簡稱CAI)。 5人工智能 人們把用計算機模擬人腦思維的過程稱為人工智能,并利用計算機程序來實現這些過程。 1.2計算機軟件 考點3計算機語言 計算機語言是面向計算機的人工語言,它是進行程序設計的工具,又稱為程序設計語言?,F有的程序設計語言一般可分為機器語言、匯編語言及高級語言,下面分別加以介紹。 1機器語言 機器語言是最初級的計算機語言,它依賴于硬件,是由0,I組成的二進制編碼形式的指令集合。不易被人識別,但可以被計算機直接執行。 2匯編語言 匯編語言指使用助記符號和地址符號來表示指令的計算機語言,也稱之為符號語言。每條指令有明顯的標識,易于理解和記憶。 用匯編語言編寫的程序,直觀且易理解,這是匯編語言的優點。但是匯編語言仍是面向機器的,編程工作量大,程序可移植性差。計算機不能識別和直接運行匯編語言,必須翻譯成機器語言程序后才能識別并運行。這種翻譯程序即稱為匯編程序,其關系如圖l一1所示。 圖1-1匯編過程 高級語言 高級語言是一類面向問題的程序設計語言,且獨立于計算機的硬件,對具體的算法進行描述,所以又稱為算法語言,它的特點介紹如下: (I)脫離具體的計算機硬件。 (2)通用性及可移植性好。 下面介紹幾種常用的高級語言。 (I)BASIC語言:多用于教學及小型應用程序的開發工作。 (2)FORTRAN語言:多用于科學及工程計算程序的開發工作。 (3)PASCAL語言:多用于專業教學及應用程序的開發工作。 (4)C語言:多用于系統程序的開發。 (5)C十+語言:多用于面向對象程序的開發。 (6)COBOL語言:多用于商業、交通及銀行等應用程序的開發。 (7)PROLOG語言:多用于人工智能程序的開發。 (8)FoxPro語言:多用于專業教學及應用程序的開發。 高級語言程序一般又稱為源程序,不能直接在計算機上運行,需要翻譯成機器語言程序(又稱為目標程序)才可執行。這種翻譯是由編譯程序來完成的,翻譯過程如圖1-2所示。 圖1一2編譯過程 考點4系統軟件 系統軟件指負責管理、監控和維護計算機資源(含硬件資源和軟件資源)的程序。 1操作系統 操作系統(Operating System,簡稱OS)是系統軟件的核心,也是用戶同計算機之間的接口,是一組程序模塊的集合:它們有效地控制和管理計算機系統中的硬件和軟件資源;合理地組織計算機工作流程,以改善系統的性能;提供一個易于使用、功能強大的工作環境,從而在計算機和其他用戶之間起到接口的作用。 2語言處理程序 語言處理程序就是將各種語言編寫的源程序翻譯成機器語言表示的目標程序。按處理方式的不同可解釋型程序與編譯型程序兩大類。 3數據庫管理系統 數據庫管理系統(DataBase Management System,簡稱DBMS)是組織、管理和查詢計算機中的存緒數據并提供一定處理功能的大型系統軟件,是計算機信息系統和應用系統的基礎,可分為兩類: (1)基于微型計算機的小型數據庫管理系統可解決數據量不大且功能要求較簡單的數據庫應用。 (2)大型的數據庫管理系統功能齊全,安全穩定,支持對大數據量的管理并提供相應開發工具。 4服務性程序 服務性程序屬于輔助性的程序.比如用于程序的裝人、連接和編輯,調試用的裝人程序、連接程序、編輯程序及調試程序,以及故障診斷程序、糾錯程序等??键c5應用軟件 應用軟件是指人們為了解決某濘、領域的實際問題而編制的計算機程序。除了系統軟件以外的所有軟件都稱為應用軟件。隨著計算機應用在不同領域的深人發展,應用軟件的類型也不斷增多,如各種用于計算的軟件包、字處理軟件、CA D軟件、CAI軟件、CAM軟件,以及各種繪圖軟件等。 計算機硬件、軟件及汁算機系統的組成情況如圖1一3所示。 圖1-3計算機系統組成 考點6計算機網絡概述 1計算機網絡的基本概念 計算機網絡是通信技術與計算機技術緊密結合的產物,通過通信線路及通信設備將分布在不同地點的具有獨立功能的多個計算機系統連接起來,并在網絡軟件支持下實現相互的數據通信及資源共享的硬件系統。計算機網絡按規模大小可分為局域網、城域網和廣域網。 2計算機網絡的發展厲史 (l)具有通信功能的單機系統階段。 (2)具有通信功能的多機系統階段。 (3)計算機網絡階段。 3計算機網絡的主要特點 在不同的發展階段,人們對網絡的定義是不同的,這些定義大致可分為3類:廣義的觀點、資源共享的觀點和用戶透明性的觀點。從目前計算機網絡的特點來看,資源共享觀點能比較準確地描述計算機網絡的基本特征。下面簡單介紹一卜資源共享的含義: (1)資源共享。網絡用戶可以通過網絡訪問聯網的遠程計算機資源,也可以調用不同計算機共同完成任務。 (2)獨立的計算機。網絡中的計算機可以聯網工作,也可以脫離網絡獨立工作。 (3)遵循共同的網絡協議。為保證網絡中的計算機能有序地工作,每臺計算機在交換數據的過程中遵守共同的通信規則,一個網絡協議主要由語法、語義與時序組成。 考點7計算機網絡的分類 1分類方法 (1)根據傳輸技術分類:可分為廣播式網絡與點一點式網絡。 (2)根據網絡的覆蓋范圍與規模分類:可分為局域網、城域網及廣域網。 2廣域網 廣域網(Wide Area Network,簡稱WAN)也稱為遠程網,其覆蓋范圍從幾十千米到幾千千米甚至上萬千米,廣域網具有以下特點。 (1)適應大容量與突發性通信要求 (2)適應綜合業務服務要求 (3)開放的設備接口與規范化的協議 (4)完善的通信服務與網絡管理。 隨著通信技術的不斷發展,數據通信的環境也發生了變化,主要表現在以下3個方面。 (1)傳輸介質由原有的電纜逐步走向誤碼率很低且帶寬很寬的光纖 (2)局域網內部的數據傳輸速率已經達到IOMb/s一1 Gb/s,多個局域網之間高速互聯的要求越來越強烈。 (3)用戶設備性能大大提高,可以承擔部分原來由數據通信網承擔的通信處理功能 3局域網 局域網(Local Area Network,簡稱LAN)指網絡服務區域在一個局部的范圍內,可以有一臺或多臺計算及多個工作站通過其進行通信。它有以太網(Ethernet)、令牌總線(Token Bus)和令牌環(Token ring)3種工作原理。 局域網的技術特點主要表現在以下幾個方面。 (1)覆蓋范圍有限,多用于公司、機關、校園等范圍內的計算機終端與信息處理設備之間的聯網需求。 (2)提供高數據傳輸速率、低誤碼率、高質量數據傳輸環境。 (3)易于建立、維護與擴展,一般為一個單位所有。 (4)決定局域網特性的主要技術要素為網絡拓撲、傳輸介質與介質訪問控制方法。 (5)從介質訪問控制方法角度,可分為共享式與交換式局域網。 城域網 城域網(Metropolitan Area Network,簡稱MAN)是介于廣域網與局域網之間的一種高速網絡。早期的城域網主要采用光纖分布式數據接口(Fiber Distributed Data Interface,簡稱FDDI),它主要有以下幾個技術特點。 (1)使用基于IEEE 802.5的單令牌的環網介質訪問控制MAC協議。 (2)使用IEEE 802.2協議,與符合IEEE 802標準的局域網兼容。 (3)數據傳輸速率為100 Mb/s,聯網的節點數`1 000,環路長度為100 km,(4)可以使用雙環結構,具有容錯能力。 (5)可以使用多模或單模光纖。 (6)具有動態分配帶寬的能力,能支持同步和異步數據傳輸。 考點8Internet基礎 Internet的形成與發展 (1)TCP/IP協議與ARPAnet的結合,使ARPAnet成為Internet的主干網。 (2)NSFnet從一開始就使用TCP/IP協議,是第一個使用TCP/IP協議的廣域網。 (3)Internet實現了TCP/IP協議參考模型與協議的結合。TCP/IP協議使網絡不受主機、用戶微型計算機及所使用的操作系統的限制。 Internet的結構與組成 從技術角度上來看,Internet主要是由通信線路、路由器、主機、信息資源幾個主要部分組成的。 (1)通信線路。將Internet中的路由器與路由器、路由器與主機連接起來。 (2)路由器。是Internet中最重要的通信設備之一,它的作用是將Internet中的各個局域網、城域網或廣域網,以及主機互聯起來 (3)主機。是Internet中信息資源與服務的載體。 (4)信息資源是用戶最關心的問題,它會影響到Internet中站點受歡迎的程度。 TCP/IP協議、域名與IP地址 TCP/IP協議是為保證Internet正常工作而要求所有Internet中的主機都必須遵守的通信協議。它具有 以下幾個特點 (1)開放的協議標準,獨立于特定的計算機硬件與操作系統。 (2)獨立于特定的網絡硬件,可以運行在局域網和廣域網,更適用于互聯網中。 (3)標準化的高層協議,可以提供多種可靠的用戶服務。 (4)統一的網絡地址分配方字模,使得整個TCP/IP設備在網中都具有唯一的IP地址。 在TCP/IP參考模型中,應用層包括了所有的高層協議,且一直有新的協議加人。應用層協議主要有下面幾種。 (1)網絡終端協議TELNET,實現網絡互聯中遠程登錄的功能二 (2)文件傳送協議FTP,實現因特網中交互式文件傳送的功能。 (3)域名服務DNS,實現網絡設備名字與IP地址相互映射的網絡服務。 (4)路由信息協議RIP,網絡設備間交換路由信息的協議。 (5)電子郵件協議SMTP,實現網絡中電子郵件的傳送功能。 (6)HTTP協議,用于www.tmdps.cnF 1.第一范式(1NF)及進一步規范化 關系模式需要滿足一定的條件,不同程度的條件稱做不同的范式,最低要求的條件是元組的每個分量必須是不可分的數據項,這叫第一范式,簡稱1NF,是最基本的范式。對于各種范式之間的聯系有5NF C4NF仁BCNFC3NF仁2NFCINF成立。一個低一級范式的關系模式,通過模式分解可以轉換為若干個高一級范式的關系模式的集合,這個過程就叫規范化。2.第二范式(2NF)若R EINF,且每一個非主屬性完全函數依賴于碼,則R∈2NFo 2NF就是不允許關系模式的屬性之間有這樣的函數依賴X-.Y。其中X是碼的真子集,Y是非主屬性,也就是說,不允許有非主屬性對碼的部分函數依賴。3.第三范式(3NF)關系模式R,<U,F>中若不存在這樣的碼X,屬性組Y及非主屬性Z(Z不包含于均使得X→Y,(Y函數依賴于X)Y→Z成立,則稱R<U, F>∈3NF 4.Boyce一Codd范式(BCNF)若關系模式REINF,且對于每個非平凡的函數依賴X-} Y都有X包含碼,則R EBCNF。在函數依賴的范圍內,BCNF達到了最高的規范化程度。 考點35多值依賴和4NF 1.多值依賴 設R(U)是屬性集U上的一個關系模式X、Y,Z是U的子集,并且Z=U一X一Y}關系模式R(U)中多值依賴X→→Y成立,當且僅當對R(U)功的任一關系r,給定的一對(x,z)值有一組Y的值,這組值僅僅決定于x值而與z值無關。4.第四范式(4NF)關系模式R<U,F>司NF,如果對于R的每個非平凡多值依賴X→→Y(Y不包含于X),X都含有碼,則稱R<U,F>∈4NF。 如果一個關系模式是4NF,則必為BCNF。 4.14關系模式的分解 考點36模式分解的等價標準 常用的等價標準要求分解是具有無損連接性的,并且是保持函數依賴的。 考點37關于模式分解的幾個事實 (1)分解具有無損連接性和分解保持函數依賴是兩個互相獨立的標準。(2)若要求分解具有無損連接性,那么模式分解一定可以達到BCNF)。 (3)若要求分解保持函數依賴,刀廠么模式分解可以達到3NF,但不一定能達到BCNF。(4)若要求分解既具有無損連接性,又保持PA數依賴,則模式分解可以達到3NF,但不一定能達到BCNF。 4.15數據庫設計的內容、方法和步驟 考點38關于數據庫設計的概述 數據庫設計是指對于一個給定的應用環境,包括硬件環境、操作系統和數據庫管理系統(DBMS)等軟件環境,如何使用這個環境來表達用戶的要求,構造最優的數據庫模式,建立數據庫及圍繞數據庫展開的應用系統,使之能夠有效地收集、存儲、操作和管理數據,滿足企業組織中各類用戶的應用需求。 數據庫設計方法中比較著名的有新奧爾良(New Orleans)方法。它將數據庫設計過程分為4個階段:需求分析、概念結構設計 一、邏輯結構設計和物理設計。4.16需求分析 考點39需求分析的任務 需求分析的任務是通過詳細調查現實世界要處理的對象(組織、部門、企業等),充分了解原系統(手工系統或計算機系統)的下作概況,明確用戶的各種需求,然后在此基礎上確定新系統的功能。新系統必須充分考慮今后可能的擴充和改變,不能僅僅按當前應用需求來設計數據庫。需求分析的重點是調查、收集與分析用戶在數據管理中的信息要求、處理要求、安全性與完整性要求。需求分析的階段成果是產生系統需求說明書??键c40需求分析的基本步驟 需求分析的步驟有以下幾個方面: (1)需求的收集:數據,發生時間、頻率,發生的規則、約束條件、相關聯系、計劃控制及決策過程。 (2)需求的分析整理二包括數據流程分析、數據分析結果描述、數據分析統計及分析圍繞數據的各種業務處理功能,并以帶說明的系統功能結構圖形式給出。 4.17概念結構設計 考點41概念結構設計的目標和策略 概念結構是對現實世界的一種抽象,即對實際的人、物、事和概念進行人為處理,抽取人們關心的共同特性,忽略非本質的細節,并把這些特性用各種概念精確地加以描述。 設計概念結構通常有4類方法:自頂向下、自底向上、由里向外和混合策略。無論采用哪種設計方法,一般都以E-R模型為工具來描述概念結構。最常用的設計策略是自底向上設計策略。 考點42采用E-R方法的數據概念模型設計 1數據抽象與局部視圖設計 以自底向上設計概念結構的方法為例,它通常分為兩步: (1)根據需求分析的結果(數據流圖、數據字典等)對現實世界的數據進行抽象,設計各個局部視圖即E-R圖。(2)集成局部視圖。 設計E-R圖的步驟如下: (1)選擇局部應用(2)逐一沒計E-R圖二 2視圖的集成 集成局部E-R圖時需要兩步。 (1)合并E-R圖,生成初步E7R圖。 各E-R圖之間的沖突主要有3類:屬性沖突、命名沖突和結構沖突:(2)修改與重構,生成基本E-R圖。 修改、重構初步E-R圖以消除冗余,主要采用分析方法。除分析方法外,還可以用規范化理論來消除冗余。 4.18邏輯結構設計 考點43 E-R模型向關系數據模型的轉換 將E-R圖轉換為關系模型實際上就是要將實體、實體的屬性和實體之間的聯系轉化為關系模式,這種轉換的規則包括以下幾點:(1)一個實體型轉換為一個關系模式。(2)一個m: n聯系轉換為一個關系模式。 (3)一個1:n聯系可以轉換為一個獨立的關系模式,也可以與n端對應的關系模式合并。(4)一個1:1聯系可以轉換為一個獨立的關系模式,也可以與任意一端對應的關系模式合并。 (5)3個或3個以上實體間的一個多元聯系轉換為一個關系模式。 (6)同一實體集的實體間的聯系,即自聯系,也可按上述1: 1,1: n和m: n三種情況分別處理。 (7)具有相同碼的關系模式可以合并。 考點44關系數據庫的邏輯結構設計過程 關系數據庫的邏輯結構設計過程如下: (1)從E-R圖導出初始關系模式。(2)規范化處理。 (3)模式評價。(4)優化模式。(5)形成邏輯結構設計說明書。 4.19物理結構設計 考點45物理設計的內容 (1)存儲記錄的格式設計。對數據項類型特征進行分析,并對存儲記錄進行格式化 決定如何進行數據壓縮或代碼優化。 (2)存儲方法的設計。物理設計中最重要的一個考慮是把存儲記錄在全范圍內進行物理安排,包括順序存放、散列存放和聚列存放。物理設計的結果是物理設計說明書。(3)存取方法設計。存取方法設計為存儲在物理上的數據提供數據訪問的路徑。DBMS產品一般都提供了一些存儲分配參數,供數據人員和DBA對數據庫進行物理優化。 考點46物理設計的評價 數據庫物理設計過程中需要對時間效率、空間效率、維護代價和各種用戶要求進行權衡,其結果可以產生多種方案,數據庫設計人員必須對這些方案進行細致的評價,從中選擇一個較優的方案作為數據庫的物理結構。 在數據庫應用系統生存期中,總的開銷包括:規劃開銷、設計開銷、實施和測試開銷、操作開銷、運行維護開銷。評價物理數據庫的方法完全依賴于所選用的DBMS。 4.20實現和維護 考點47數據庫的實現 數據庫實現的主要工作有以下幾個方面:(1)定義數據庫結構。(2)編制與調試應用程序。(3)數據裝載。 (4)數據庫試運行。 考點48其他設計 其他設計工作包括加強數據庫的安全性、完整性控制,以及保證一致性、可恢復性等,總是以犧牲效率為代價的。設計人員的任務就是要在實現代價和盡可能多的功能之間進行合理平衡。其他設計包括數據庫的再組織設計、故障恢復方案設計、安全性考慮和事務控制等。 考點49數據庫的運行和維護 在數據庫運行階段,對數據庫經常性的維護工作主要是由DBA完成的,它包括以下幾個方面: (1)數據庫的轉儲和恢復。 (2)數據庫的安全性、完整性控制。(3)數據庫性能的監督、分析和改進。(4)數據庫的重組織和重構造。 4.21數據庫管理系統概述 考點50 DBMS的系統目標 數據庫管理系統(DBMS)是操作和管理數據庫的軟件系統,它由一組計算機程序構成,管理并控制數據資源的使用。數據庫管理系統是數據庫系統的核心DBMS的目標是用戶界面友好、結構清晰和開放性。 考點51 DBMS的基本功能 DBMS主要是實現對共享數據有效的組織、管理和存取。因此,DBMS具有如下幾個方面的基本功能。 (1)數據庫定義功能。(2)數據存取功能。 (3)數據組織、存儲和管理。(4)數據庫運行管理。(5)數據庫的建立和維護。 (6)通信功能和數據轉換功能等。 考點52 DBMS程序模塊的組成 大致來說,DBMS的程序模塊可按功能劃分為以下5個模塊:(1)數據定義方面的程序模塊。(2)數據操縱方面的程序模塊 (3)數據庫運行管理方面的程序模塊 (4)數據庫組織、存儲和管理方面的程序模塊。(5)數據庫建立、維護和其他方面的程序模塊。 考點53 DBMS的層次結構 可以將DBMS劃分成若干層次,這樣可以幫助我們更清晰地認識DBMS,更重要的是有助于DBMS的設計和維護。 (1)最上層是應用層位于DBMS核心之外。 (2)第二層是語言翻譯處理層它處理的對象是數據庫語言}A SQL,(3)第三層是數據存取層:該層處理的對象是單個元組。 (4)第四層是數據存儲層。該層處理的對象是數據頁和系統緩沖區。(5)操作系統是DBMS的基礎。它處理的對象是數據文件的物理塊。4.22新的應用需求對DBMS的挑戰 考點54新的應用需求對DBMS的挑戰 由于現在以關系型數據庫管理系統(RDBMS)為主流。這些新應用需求要求數據庫管理系統應該具有支持分布式操作、聯機事務處理能力、決策支持能力、支持多媒體、大容量、復雜數據應用、兼容性和集成能力、異種數據庫之間的互訪能力、系統可靠性、安全性、大型系統等方面的管理能力。 在我國,當前流行的數據庫管理系統絕大多數是關系型數據庫管理系統,一般可分為如下3類: (1)以PC機、微型機系統為運行環境的數據庫管理系統。(2)以Oracle為代表的數據庫管理系統,這類系統還有IBM DB2,Sybase等,也被稱為主流數據庫管理系統。 (3)以Microsoft SQI.Server為代表的介于以上兩類之間的數據庫管理系統。 4.23 Oracle數據庫系統 考點55Oracle數據庫系統簡介 Oracle關系型數據庫管理系統是美國Oracle公司的優秀軟件產品,它采用SQL語言作為數據庫語言。該公司于1979年推出了世界上第一個商業化的關系型數據庫系統。Oracle數據庫的特點包括兼容性、可移植性、可連接性及高的生產率。 考點56 Oracle的主要產品及其功能 1Oracle數據庫服務霖功能及其特色 Oracle數據庫服務器包括標準服務器和許多可選的服務器選件,選件用于擴展標準服務器的功能,以適應特殊的應用需求。 (1)標準服務器主要具有下列特色:多進程多線索的體系結構、高性能核心技術、高可用性和SQL的實現。 (2)并行服務器選件(paralle server option)和并行查詢選件(paralle query option)。第三篇:數據庫知識點總結
第四篇:數據庫復習總結
第五篇:數據庫復習總結