第一篇:SAS復(fù)習(xí)資料
SAS復(fù)習(xí)資料 2013.6.20
說(shuō)明:根據(jù)老師給的Html版整理,如有錯(cuò)誤、遺漏敬請(qǐng)?jiān)彛⒓皶r(shí)指出,進(jìn)行改正。謝謝!
1.研究因子:對(duì)試驗(yàn)指標(biāo)有影響的,在試驗(yàn)中需要加以考察的條件。2.小機(jī)率原理:概率很小的事件,在一次試驗(yàn)中是不至于發(fā)生的。3.重復(fù):每個(gè)參試的品種或處理占有兩個(gè)或兩個(gè)以上的小區(qū)稱(chēng)有重復(fù)。
4.局部控制:通過(guò)對(duì)小區(qū)的合理安排,把試驗(yàn)誤差控制在一個(gè)局部的范圍內(nèi)。5.試驗(yàn)指標(biāo):試驗(yàn)中用來(lái)衡量試驗(yàn)效果的量。
6.復(fù)因子試驗(yàn):包含兩個(gè)或兩個(gè)以上的因子的試驗(yàn)。7.集團(tuán)(總體):根據(jù)研究目的確定的,凡符合指定條件的全部觀察對(duì)象。8.偶然誤差(機(jī)誤):由于機(jī)會(huì)不等所造成的偏差。9.可量資料:能夠以測(cè)量、稱(chēng)量的方法表示的資料。10.正交互作用(正連應(yīng)):某些因子綜合起來(lái)的效果大于這些因子單獨(dú)作用的效果之和。1.進(jìn)行隨機(jī)區(qū)組的統(tǒng)計(jì)分析,需用何種方差分析?:雙方面分類(lèi)的方差分析 2.進(jìn)行拉丁方的統(tǒng)計(jì)分析,需用何種方差分析?:三方面分類(lèi)的方差分析 3.進(jìn)行雙方面分類(lèi)的方差分析,總平方和分解為多少部份?:三部分 4.進(jìn)行三方面分類(lèi)的方差分析,總平方和分解為多少部份?:四部分
5.兩因素(含交互作用)的方差分析,處理組合平方和應(yīng)分解為多少部份?:四部分 6.三因素(含一級(jí)交互作用)的方差分析,處理組合平方和應(yīng)分解為多少部份?:七部分 7.在幾種常用的試驗(yàn)設(shè)計(jì)方法中,哪種精確度較高?:拉丁方 8.隨機(jī)區(qū)組設(shè)計(jì)的誤差自由度等于多少?:(m1)9.拉丁方設(shè)計(jì)的誤差自由度等于多少?:(n2)10.只有重復(fù)而末實(shí)行局部控制的試驗(yàn),應(yīng)采用何種方差分析?:?jiǎn)畏矫娣诸?lèi)的方差分析 1.樣本標(biāo)準(zhǔn)差的功用?:反映樣本的變異程度
2.樣本平均數(shù)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)的功用?:反映在同一個(gè)總體進(jìn)行抽樣,所得的樣本平均數(shù)間的差異,即抽樣誤差。
3.變異系數(shù)的功用?:用作兩類(lèi)事物的變異程度作比較
4.樣本平均數(shù)的功用?:指示資料的中心位置,反映資料的一般質(zhì)量水平,作為代表值同其它資料比較
5.協(xié)方差分析的功用?:用處理前的數(shù)據(jù)(基數(shù))矯正處理后的數(shù)據(jù),提高分析的精確度。6.樣本均數(shù)差異顯著性測(cè)驗(yàn)的功用?:在一定的概率保證下,判斷事物間有否本質(zhì)差異 7.總體均數(shù)區(qū)間估計(jì)的功用?:通過(guò)抽樣,由樣本的情況估計(jì)未知總體平均數(shù)的數(shù)值范圍 8.在試驗(yàn)設(shè)計(jì)中,局部控制的作用?:減少試驗(yàn)誤差
9.在試驗(yàn)設(shè)計(jì)中,重復(fù)的作用?:減少試驗(yàn)誤差,估計(jì)試驗(yàn)誤差,擴(kuò)大試驗(yàn)的代表性 10.在試驗(yàn)設(shè)計(jì)中,隨機(jī)排列的功用?:正確估計(jì)試驗(yàn)誤差 1.何謂試驗(yàn)指標(biāo)?:在試驗(yàn)中用來(lái)衡量試驗(yàn)效果的一個(gè)量
2.什么叫保護(hù)行?:防止試驗(yàn)材料受外來(lái)因素和周邊環(huán)境影響作物行
3.某個(gè)復(fù)因子試驗(yàn)的處理組合數(shù)應(yīng)如何計(jì)算?:等于有關(guān)因子的水平數(shù)乘積 4.在常用的試驗(yàn)設(shè)計(jì)中,哪種設(shè)計(jì)方法的精確度最高?:拉丁方 5.在常用的試驗(yàn)設(shè)計(jì)中,哪種設(shè)計(jì)方法的精確度最低?:間比法 6.試驗(yàn)設(shè)計(jì)三大原則是什么?:重復(fù),局部控制,隨機(jī)排列
7.作改良對(duì)比法設(shè)計(jì)時(shí),參試的品種或處理數(shù)一般不大于多少?:不受限制 8.作隨機(jī)區(qū)組設(shè)計(jì)時(shí),參試的品種或處理數(shù)一般不大于多少?:不大于18 9.作配對(duì)法設(shè)計(jì)時(shí),參試的品種或處理數(shù)一般不大于多少?:兩個(gè)
10.作拉丁方設(shè)計(jì)時(shí),參試的品種或處理數(shù)一般不大于多少?:不大于8 1.某個(gè)因子的自由度等于多少?:等于該因子的水平數(shù)減1 2.某兩因子試驗(yàn)中,其交互作用的自由度等于多少?:等于有關(guān)因子的自由度的乘積
3.一可量資料樣本均數(shù)與總體均數(shù)差異顯箸性進(jìn)行t檢驗(yàn)時(shí),其自由度為多少?:等于樣本含量數(shù)-1 4.正交表的總自由度等于多少?:等于參試的處理組合數(shù)-1 5.作回歸關(guān)系顯著性測(cè)驗(yàn)時(shí),回歸項(xiàng)的自由度等于多少?:等于自變量的個(gè)數(shù) 6.作簡(jiǎn)單相關(guān)系數(shù)顯著性測(cè)驗(yàn)時(shí),DF等于多少?:等于N-2 7.2*2聯(lián)卡平方測(cè)驗(yàn)時(shí),DF等于多少?:1 8.兩個(gè)配對(duì)法設(shè)計(jì)的可量資料樣本均數(shù)差異顯箸性進(jìn)行t檢驗(yàn),其自由度為多少?:試驗(yàn)資料的配對(duì)數(shù)-1 9.2*J聯(lián)卡平方測(cè)驗(yàn)時(shí),其自由度為多少?:J-1 10.作拉丁方設(shè)計(jì)時(shí),參試的品種或處理數(shù)一般不大于多少?:2 1.SS:平方和 2.N(0,1):標(biāo)準(zhǔn)正態(tài)分布 3.μ:總體平均數(shù)
4.CLM:平均數(shù)的置信區(qū)間 5.∑X :總和
6.VIF:方差膨脹因子 7.MSE:誤差均方 8.DF :自由度 9.CV:變異系數(shù) 10.V:方差
1.欲進(jìn)行聚類(lèi)統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc cluster 2.欲進(jìn)行回歸統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc reg 3.欲進(jìn)行方差統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc anova 4.欲進(jìn)行因子統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc factor 5.欲進(jìn)行典型相關(guān)統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc cancorr 6.欲進(jìn)行基本統(tǒng)計(jì)量統(tǒng)計(jì)分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc means 7.欲進(jìn)行主成分分析,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc princomp 8.欲進(jìn)行成組法T測(cè)驗(yàn),需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc ttest 9.欲進(jìn)行正態(tài)分布檢驗(yàn),需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Procunivariate 10.欲進(jìn)行作相關(guān)點(diǎn)式圖,需調(diào)用SAS系統(tǒng)的何種過(guò)程?:Proc plot 1.單因子隨機(jī)區(qū)組的方差分析模型(MODEL)是:Y=BLOCK T 2.單因子隨機(jī)區(qū)組協(xié)方差分析的模型是(MODEL):Y=BLOCK T X 3.三元線性回歸分析的模型是(MODEL):Y=X1 X2 X3 4.單方面分類(lèi)的方差分析模型(MODEL)是:Y=T
5.兩個(gè)因子變量的反應(yīng)面分析的模型(MODEL)是:Y=X1 X2
6.單因子隨機(jī)區(qū)組的多元方差分析的模型(MODEL)是:X1 X2 X3 =BLOCK T 7.3*4 復(fù)因子試驗(yàn)的方差分析模型(MODEL)是:Y=BLOCK A B A*B 8.拉丁方設(shè)計(jì)的方差分析模型(MODEL)是:Y=A B T 9.3*2*3復(fù)因子試驗(yàn)的方差分析模型(MODEL)是:Y=BLOCK A B C A*B A*C B*C A*B*C 10.正交隨機(jī)區(qū)組(不考查交互作用)的統(tǒng)計(jì)分析模型(MODEL)是:Y=BLOCK A B C D 1.協(xié)方差分析的功用?:用處理前的數(shù)據(jù)(基數(shù))矯正處理后的數(shù)據(jù),提高分析的精確度 2.主成分分析的功用?:將個(gè)數(shù)眾多、相互有關(guān)聯(lián)的變量,轉(zhuǎn)化為少數(shù)幾個(gè)相互獨(dú)立的變量 3.聚類(lèi)分析的功用?:把樣本或變量進(jìn)行分類(lèi)分
4.典型相關(guān)系數(shù)的功用?:反映兩組不同性質(zhì)的變量之間的關(guān)系密切程度 5.樣本平均數(shù)的功用?:反映資料的一般質(zhì)量水平,指示資料的中心位置 6.樣本平均數(shù)標(biāo)準(zhǔn)差(標(biāo)準(zhǔn)誤)的功用?:估計(jì)抽樣誤差
7.在回歸分析中,殘差的作用:反映實(shí)測(cè)值與預(yù)測(cè)值之間的偏差程度 8.在試驗(yàn)設(shè)計(jì)中,局部控制的作用?:減少試驗(yàn)誤差 9.在試驗(yàn)設(shè)計(jì)中,重復(fù)的作用?:估計(jì)試驗(yàn)誤差
10.變異系數(shù)的功用:用于兩組資料的變異程度作比較
1.多重比較的方法有很多種,課本介紹了其中的三種: 第一種、最小顯著差數(shù)法(Least Significant difference---LSD法或t測(cè)驗(yàn)法)第二種、Q測(cè)驗(yàn)法(最高顯著差數(shù)法═Tukey測(cè)驗(yàn)法)
第三種、新復(fù)極差法(Shortest Significant Range---SSR法或Duncan法)哪種測(cè)驗(yàn)法的精確度較高?TUKEY法
2.不服從正態(tài)分布的數(shù)據(jù)不能直接作方差分析,必須進(jìn)行數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)轉(zhuǎn)換常用的方法有:(1)、平方根代換(2)、對(duì)數(shù)代換(3)、反正弦代換
問(wèn)如果數(shù)據(jù)為二項(xiàng)分布的百分率,即可數(shù)百分?jǐn)?shù),且大于70%或小于30%,應(yīng)采用何種代換?反正弦代換
3.計(jì)算步驟為:
第一步、將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化; 第二步,求相關(guān)矩陣;
第三步,求相關(guān)矩陣的特征根、特征向量、各特征根的方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)。第四步,根據(jù)特征根的累計(jì)方差貢獻(xiàn)率保留前幾個(gè)公共因子。
第五步,用前幾個(gè)特征根的平方根乘相應(yīng)的特征向量,構(gòu)成因子載荷陣; 第六步,求相關(guān)系數(shù)矩陣的逆陣;
第七步,用因子載荷陣與相關(guān)矩陣的逆陣相乘,得回歸系數(shù)陣; 第八步,用回歸系數(shù)與標(biāo)準(zhǔn)化數(shù)據(jù)相乘得因子得分值。問(wèn)這是何種統(tǒng)計(jì)分析方法?因子分析
4.計(jì)算步驟為:
第一步,將數(shù)據(jù)進(jìn)行中心化; 第二步,求方差協(xié)方差矩陣; 第三步,求方差協(xié)方差矩陣的特征根、特征向量、各特征根的方差貢獻(xiàn)率和累計(jì)方差貢獻(xiàn)率。第四步,根據(jù)特征根的累計(jì)方差貢獻(xiàn)率保留前幾個(gè)主成分。
第五步,用中心化數(shù)據(jù)與前三個(gè)特征向量相乘,求得前三個(gè)主成分得分。
第六步,如果覺(jué)得有必要,用前三個(gè)特征根的平方根(即前幾個(gè)主成分的標(biāo)準(zhǔn)差,)除前幾個(gè)主成分得分值,得標(biāo)準(zhǔn)化主成分得分。第七步,如果有必要的話,利用這些標(biāo)準(zhǔn)化主成分得分作進(jìn)一步的分析。問(wèn)這是何種統(tǒng)計(jì)分析方法?主成分分析
5.計(jì)算步驟為:
第一步,計(jì)算X、Y、X*Y項(xiàng)的各種平方和(X為基數(shù),Y為處理后的實(shí)測(cè)值;
第二步,進(jìn)行X與Y項(xiàng)的回歸關(guān)系顯著性測(cè)驗(yàn),若相關(guān)不顯著,則進(jìn)行一般的方差分析; 第三步,若相關(guān)顯著,則扣除回歸關(guān)系后,再進(jìn)行方差分析; 第四步,用回歸系數(shù)矯正處理后的數(shù)據(jù)測(cè)驗(yàn),再進(jìn)行多重比較。問(wèn)這是何種統(tǒng)計(jì)分析方法?協(xié)方差分析
6.計(jì)算步驟為:
第一步,計(jì)算出k個(gè)類(lèi)別的方差協(xié)方差矩陣的逆陣。
第二步,計(jì)算出各個(gè)訓(xùn)練樣本到這k個(gè)類(lèi)別的馬氏距離,比較這k個(gè)距離,把訓(xùn)練樣本歸到距離最短的類(lèi)中。
第三步,計(jì)算在第二步中判別錯(cuò)誤的樣本數(shù)占總樣本數(shù)的百分率。第四步,如果還有新的待判樣本,計(jì)算各個(gè)新樣本到這k個(gè)類(lèi)別的馬氏距離,比較k個(gè)距離,把各個(gè)新樣本歸到距離最短的類(lèi)中,再計(jì)算在待判樣本中判別錯(cuò)誤的樣本數(shù)占待判樣本總數(shù)的百分率。
問(wèn)這是何種統(tǒng)計(jì)分析方法?判別分析
7.計(jì)算步驟為:
第一步,計(jì)算出Y的矯正數(shù)及各種平方和(Y為處理后的實(shí)測(cè)值)。第二步,列方差分析表并進(jìn)行F測(cè)驗(yàn)。第三步,若F測(cè)驗(yàn)顯著則進(jìn)行多重比較。第四步,寫(xiě)出統(tǒng)計(jì)結(jié)論。
問(wèn)這是何種統(tǒng)計(jì)分析方法?一元方差分析
8.計(jì)算步驟為:
第一步,按一定的原則選擇k個(gè)凝聚點(diǎn);
第二步,將所有事例點(diǎn)歸到最靠近它的凝聚點(diǎn)所代表的類(lèi)中,得到k個(gè)初始分類(lèi);
第三步,按最近距離的原則對(duì)初始分類(lèi)進(jìn)行修改;反復(fù)進(jìn)行,直至分類(lèi)合理為止。問(wèn)這是何種統(tǒng)計(jì)分析方法?動(dòng)態(tài)聚類(lèi)
9.計(jì)算步驟為:
第一步,將原始數(shù)據(jù)進(jìn)行中心化,按研究目的分為兩組,記變量數(shù)(m1)較少的那組為X1,記變量數(shù)(m2)較多的那組為X2。
第二步,求X1和X2的方差協(xié)方差矩陣S11、S12和S22以及S12的轉(zhuǎn)置陣S21,并利用它們構(gòu)成非對(duì)稱(chēng)的方陣。
第三步,求非對(duì)稱(chēng)的方陣的特征根和對(duì)應(yīng)的特征向量。
第四步,將這些特征向量除以非對(duì)稱(chēng)的方陣的特征根的平方根轉(zhuǎn)換為第一組的典型系數(shù)。第五步,利用兩個(gè)典型系數(shù)的關(guān)系式求出另一組的典型系數(shù)。第六步,將中心化數(shù)據(jù)和典型系數(shù)相乘得典型相關(guān)系數(shù)。問(wèn)這是何種統(tǒng)計(jì)分析方法?典型相關(guān)分析 10.用SAS系統(tǒng)作數(shù)據(jù)分析,首要的問(wèn)題是如何排列數(shù)據(jù),你熟悉SAS系統(tǒng)對(duì)各種統(tǒng)計(jì)分析方法的數(shù)據(jù)排列的要求嗎?問(wèn)單因子試驗(yàn)采用隨機(jī)區(qū)組設(shè)計(jì),有四個(gè)試驗(yàn)指標(biāo)時(shí),數(shù)據(jù)應(yīng)排多少列?。6列
:平方和
乘積和
合并樣本百分?jǐn)?shù)
樣本標(biāo)準(zhǔn)差
樣本平均數(shù)標(biāo)準(zhǔn)差
兩樣本百分?jǐn)?shù)之差的總體標(biāo)準(zhǔn)差
兩樣本平均數(shù)之差的樣本標(biāo)準(zhǔn)差
總體標(biāo)準(zhǔn)差
樣本變異系數(shù)
樣本差數(shù)平均數(shù)標(biāo)準(zhǔn)差
可量資料大樣本均數(shù)與總體均數(shù)差異顯箸性測(cè)驗(yàn)
可量資料兩大樣本均數(shù)差異顯箸性測(cè)驗(yàn) 可數(shù)資料樣本百分?jǐn)?shù)與總體百分?jǐn)?shù)差異顯箸性測(cè)驗(yàn)
可數(shù)資料兩大樣本百分?jǐn)?shù)差異顯箸性測(cè)驗(yàn)
可量資料小樣本均數(shù)與總體均數(shù)差異顯箸性測(cè)驗(yàn)
可量資料兩小樣本均數(shù)差異顯箸性測(cè)驗(yàn)(配對(duì)法)
可量資料兩小樣本均數(shù)差異顯箸性測(cè)驗(yàn)(成組法)
由可量資料大樣本對(duì)總體均數(shù)進(jìn)行估計(jì)
由可量資料小樣本對(duì)總體均數(shù)進(jìn)行估計(jì)
由可數(shù)資料大樣本百分?jǐn)?shù)對(duì)總體百分?jǐn)?shù)進(jìn)行估計(jì)
第二篇:SAS項(xiàng)目實(shí)驗(yàn)報(bào)告策劃書(shū)
SAS項(xiàng)目實(shí)驗(yàn)報(bào)告——
活
動(dòng)
策
劃
金融一班:第五組 二零一二年十月三十日
目錄
一. 采訪對(duì)象:四川三陽(yáng)汽車(chē)有限公司(市場(chǎng)部蔣俊紅經(jīng)理)..........3二. 采訪背景:...........................3
三. 采訪時(shí)間:...........................3
四、采訪地點(diǎn):綿陽(yáng)市科創(chuàng)園區(qū)創(chuàng)業(yè)大道中段242號(hào)............3五、采訪方式:此次活動(dòng)采取座談形式,面對(duì)面采訪,并分時(shí)間段進(jìn)行采訪。..........3六、采訪目的:采訪該公司影響汽車(chē)銷(xiāo)售的因素,以及各種因素間的關(guān)系。.......3七、采訪前期準(zhǔn)備:..........................31、提前預(yù)約:用電話的形式與被采訪者保持聯(lián)系,最好提前一周預(yù)約好。..........32、采訪工具準(zhǔn)備:必須證件,器材。如照相機(jī),錄音筆,采訪本,攝像機(jī)等。.........33、采訪交通工具:步行(后門(mén)左轉(zhuǎn)直走,過(guò)馬路即到達(dá)目的地)............34、采訪人員安排:......................3八、采訪內(nèi)容:...........................31、公司背景?............................32、公司客戶特征?....................33、公司汽車(chē)銷(xiāo)售狀況?..........................34、影響汽車(chē)銷(xiāo)售因素?..........................3九、采訪后期..........................3十、可行性分析及備注........................4活動(dòng)策劃
一.采訪對(duì)象:四川三陽(yáng)汽車(chē)有限公司(市場(chǎng)部蔣俊紅經(jīng)理)
二.采訪背景:
四川三陽(yáng)汽車(chē)有限公司成立于1998年2月23日,是東風(fēng)——雪鐵龍授權(quán)集整車(chē)銷(xiāo)售、備件供應(yīng)、售后服務(wù)、信息反饋四位一體特約服務(wù)網(wǎng)點(diǎn),能夠?yàn)閺V大東風(fēng)雪鐵龍轎車(chē)客戶提供完備的售前、售中及售后服務(wù)。公司成立之初便本著一切為客戶著想的服務(wù)理念,力爭(zhēng)為客戶提供購(gòu)車(chē)之外更多更周到的超值服務(wù)。公司成立了車(chē)友俱樂(lè)部對(duì)客戶的愛(ài)車(chē)提供保姆式服務(wù),亦是四川綿陽(yáng)最大的東風(fēng)雪鐵龍汽車(chē)文化傳播中心。公司現(xiàn)有員工80余人,其中研究生以上學(xué)歷8人,大學(xué)以上40人,高級(jí)技師3人,中級(jí)以上技師22人,專(zhuān)業(yè)銷(xiāo)售人員12人。
三.采訪時(shí)間:
2012年10月26日
2012年11月2日
四、采訪地點(diǎn):綿陽(yáng)市科創(chuàng)園區(qū)創(chuàng)業(yè)大道中段242號(hào)
五、采訪方式:此次活動(dòng)采取座談形式,面對(duì)面采訪,并分時(shí)間段進(jìn)行采訪。
六、采訪目的:采訪該公司影響汽車(chē)銷(xiāo)售的因素,以及各種因素間的關(guān)系。
七、采訪前期準(zhǔn)備:
1、提前預(yù)約:用電話的形式與被采訪者保持聯(lián)系,最好提前一周預(yù)約好。
2、采訪工具準(zhǔn)備:必須證件,器材。如照相機(jī),錄音筆,采訪本,攝像機(jī)等。
3、采訪交通工具:步行(后門(mén)左轉(zhuǎn)直走,過(guò)馬路即到達(dá)目的地)
4、采訪人員安排:
八、采訪內(nèi)容:
1、公司背景?
2、公司客戶特征?
3、公司汽車(chē)銷(xiāo)售狀況?
4、影響汽車(chē)銷(xiāo)售因素?
九、采訪后期
整理收集到的資料,整理訪談問(wèn)答記錄,完成書(shū)面表達(dá)報(bào)告,并傳給被采訪者進(jìn)行確認(rèn),保證修改無(wú)誤,成文。
十、可行性分析及備注
可行性分析:
1、由于現(xiàn)在大三本科生比較清閑,時(shí)間比較充足。
2、在該公司都熟人,故可行性較高,只要問(wèn)題提法得當(dāng),善于取舍,此次采訪易于實(shí)行。
3、已在該公司做過(guò)一次試探性采訪。
4、采訪地近,基本為零成本采訪。
備注:
1、采訪時(shí),以預(yù)備問(wèn)題作為基本問(wèn)題,也可即興追問(wèn)。
2、采訪流程中小組成員以安全為重。
第三篇:常用sas語(yǔ)句總結(jié)
Engine(引擎)是一種訪問(wèn)架構(gòu),SAS系統(tǒng)通過(guò)它迅速地對(duì)其它數(shù)據(jù)庫(kù)管理系統(tǒng)中文件進(jìn)行讀入和寫(xiě)出。
1.LIBNAME語(yǔ)句
1.1解讀
定義 SAS 邏輯庫(kù)。具體地說(shuō),它可以
(1)向 SAS 標(biāo)識(shí) SAS 邏輯庫(kù)
(2)將引擎與邏輯庫(kù)關(guān)聯(lián)
(3)讓您指定邏輯庫(kù)的選項(xiàng)
(4)為邏輯庫(kù)指定邏輯庫(kù)引用名
通俗得講,LIBNAME語(yǔ)句把一個(gè)libref(庫(kù)標(biāo)記名)和一個(gè)目錄聯(lián)系起來(lái),使用戶可以在SAS語(yǔ)句中使用庫(kù)標(biāo)記來(lái)指示這個(gè)目錄。提交該程序時(shí)自動(dòng)引用該 SAS 邏輯庫(kù) 1.2 語(yǔ)句格式
1、LIBNAME libref
2、LIBNAME libref Clear;
3、LIBNAME libref |_ All_ List;三種格式反映了LIBNAME語(yǔ)句的三種用法 選項(xiàng)說(shuō)明
LibrefEngineSas-Data-LibraryAccess=Readonly|TempClear_All_List
規(guī)定邏輯庫(kù)規(guī)定引擎規(guī)定主機(jī)系統(tǒng)下一個(gè)有效的物理地址規(guī)定邏輯庫(kù)為只讀或可修改屬性清除與庫(kù)標(biāo)記的聯(lián)系列出所有邏輯庫(kù)的屬性在Log窗口列出邏輯庫(kù)的屬性。2.length語(yǔ)句
SAS變量的基本類(lèi)型有兩種:數(shù)值型和字符型。數(shù)值型變量在數(shù)據(jù)集中的存貯一般使用8個(gè)字節(jié)。SAS的字符型變量缺省的長(zhǎng)度是8個(gè)英文字符,可以使用LENGTH語(yǔ)句指定變量長(zhǎng)度,LENGTH語(yǔ)句一般應(yīng)出現(xiàn)在定義變量的Input語(yǔ)句之前,格式為: LENGTH 字符型變量名 $長(zhǎng)度 例如:length name $20 ;
3.input 語(yǔ)句
3.1解讀
INPUT語(yǔ)句 用于向系統(tǒng)表明如何讀入每一條記錄。它的主要功能有:讀入由語(yǔ)句指定的數(shù)據(jù)列;為相應(yīng)的數(shù)據(jù)域定義變量名;確定變量的讀入模式(共有四種模式:column模式,formatted模式,list模式及named模式)。
input語(yǔ)句執(zhí)行后,SAS將讀取的數(shù)據(jù)暫時(shí)先保存在內(nèi)存緩沖區(qū),然后執(zhí)行后面的語(yǔ)句,后面的語(yǔ)句可以對(duì)暫存在內(nèi)存緩沖區(qū)中的變量值進(jìn)行修改,到最后才將整條數(shù)據(jù)寫(xiě)入數(shù)據(jù)集,寫(xiě)入數(shù)據(jù)集的數(shù)據(jù)就不能在當(dāng)前data步中再修改。
注意:INFILE語(yǔ)句用于確定一個(gè)包含原始數(shù)據(jù)的外部文件,必須在執(zhí)行INPUT語(yǔ)句前執(zhí)行,如果要在程序中直接嵌入數(shù)據(jù),就用CARDS語(yǔ)句代替INFILE語(yǔ)句。
3.2 語(yǔ)句格式(Column模式)
INPUT variable <$> start-column<-end-column><.decimals><@|@@>;
說(shuō)明: variable 變量名
$ 跟在變量后面,表明這個(gè)變量是字符型變量 start-column 起始列號(hào)
end-column 結(jié)束列號(hào),如果變量值只包含一列,則可省略
.decimals 如果輸入值中沒(méi)有包含一個(gè)隔開(kāi)整數(shù)部分與小數(shù)部分的小數(shù)點(diǎn),decimals用來(lái)顯性的指明小數(shù)部分 @ 單尾符 @@ 雙尾符
舉例說(shuō)明:input name $ 1-10 pulse 11-13 waist 14-15 gender $ 16;
4.SET 語(yǔ)句
Set語(yǔ)句可以用來(lái)讀取單個(gè)數(shù)據(jù)集中的數(shù)據(jù),也可以用來(lái)讀取多個(gè)數(shù)據(jù)集中的數(shù)據(jù)拼接SAS新的數(shù)據(jù)集。程序?yàn)椋?/p>
DATA 新數(shù)據(jù)集;
SET 輸入數(shù)據(jù)集1 輸入數(shù)據(jù)集2 ….; Run;如果不適用DROP=和KEEP=選項(xiàng),在新的數(shù)據(jù)集中將包含所有舊數(shù)據(jù)集的變量。
5.DO 循環(huán)語(yǔ)句
語(yǔ)句一:
DO WHILE(expression);...more SAS statements...END;語(yǔ)句二:
DO UNTIL(expression);...more SAS statements...END;語(yǔ)句三:
DO index-variable=start
DO item-1<,…item-n>
DO over array-name;...more SAS statements...END;例如: data test;
input sc01-sc05;
array s sc01-sc05;
do over s;
s= s*100;
end;
cards;0.95 0.88 0.57 0.90 0.65;這個(gè)語(yǔ)句也是SAS比較特殊的循環(huán)結(jié)構(gòu),專(zhuān)用于數(shù)組,將數(shù)組的每一個(gè)元素訪問(wèn)一遍。
6.IMPROT 語(yǔ)句
import過(guò)程可以讀取的數(shù)據(jù)有Access數(shù)據(jù)庫(kù)、Excel文件和帶分隔符的文件。
6.1語(yǔ)法格式
PROC IMPORT
DATAFILE=“filename” | TABLE=“tablename” OUT=
DATAFILE=“filename” 用來(lái)指定數(shù)據(jù)文件的位置,如果是Access則用TABLE=“tablename”指定需要讀取的數(shù)據(jù)表;
OUT= 指定輸出數(shù)據(jù)集的名稱(chēng);
DBMS=identifier 指定導(dǎo)入數(shù)據(jù)表的類(lèi)型;幾個(gè)常用的DBMS選項(xiàng)如下
ACCESS 讀取MS ACCESS2000/2002數(shù)據(jù)
EXCEL 讀取Excel2000/2002數(shù)據(jù)
CSV 讀取逗號(hào)分隔的文件
DLM 讀取分隔符文件,需要用DELIMITER=指明具體的分隔符
TAB 讀取Tab分隔的文件
REPLACE選項(xiàng)替換原來(lái)已經(jīng)存在的數(shù)據(jù)集,缺省情況下是不替換,并在LOG窗口中予以提示;
6.2 proc import讀取帶分隔符的文件 語(yǔ)法格式: PROC IMPORT DATAFILE= OUT= DBMS= REPLACE;(Data source statements:)DATAROW=n;DELIMITER=;GETNAMES=YES|NO;說(shuō)明:
DBMS= 需要指定DLM,逗號(hào)分隔文件可省略; DATAROW=n;指定從數(shù)據(jù)文件的第幾行開(kāi)始讀取,該選項(xiàng)缺省情況下,如果getnames=yes則從第二行開(kāi)始讀取,getnames=no從第一行開(kāi)始讀取; DELIMITER=;指定分隔符;
GETNAMES=;告訴SAS是否將數(shù)據(jù)文件的第一行作為變量讀取,該選項(xiàng)缺省為yes。
如果第一行是變量名,而該選項(xiàng)為no則會(huì)將列為數(shù)值型的第一行讀取為缺失值。
當(dāng)指定getnames=no時(shí),對(duì)于DLM文件,則SAS自動(dòng)將變量命名為VAR1, VAR2,...;對(duì)于Excel文件,則SAS自動(dòng)命名變量為F1, F2, … 舉例:
proc import datafile=“C:My Documentsmyfilesdelimiter.txt”
out=mydata
dbms=dlm
replace;
delimiter='&';
getnames=yes;run;6.3 proc import讀取Excel文件 語(yǔ)法格式: PROC IMPORT DATAFILE= OUT= DBMS= REPLACE;(Data source statements:)SHEET=;GETNAMES= YES|NO;注:讀取Excel時(shí),可以不指定DBMS=選項(xiàng)。舉例:
proc import datafile=“c:clinic filesdrug1.xls”
out=drug1;
sheet='lab';
getnames=yes;run;6.4 proc import讀取數(shù)據(jù)庫(kù)表(如Access)語(yǔ)法格式: PROC IMPORT TABLE= OUT= DBMS= REPLACE;(Data source Statements:)DATABASE= PWD= UID= WGDB= 說(shuō)明:
DATABASE= 指明數(shù)據(jù)庫(kù)存放的路徑及名字 UID= 數(shù)據(jù)庫(kù)用戶名 PWD= 密碼 WGDB= 工作組名稱(chēng) 舉例:
proc import table=“customers”
out=sasuser.cust
dbms=access97;
uid=“userid”;
pwd=“mypassword”;
database=“c:myfileseast.mdb”;
wgdb=“c:winntsystem32security.mdb”;run;通常情況下,proc import是可以不掌握的,通過(guò)視窗操作可能更方便,特不過(guò)用proc import能夠更精細(xì)的控制。在寫(xiě)import過(guò)程的時(shí)候,要特別注意分號(hào)的位置,從最開(kāi)始的語(yǔ)法格式那里可以看出,proc import后面的一般選項(xiàng)是連在一起寫(xiě)的,中間用空格隔開(kāi),最后才以分號(hào)結(jié)尾;而數(shù)據(jù)源選項(xiàng)則每一項(xiàng)都要以分號(hào)結(jié)束。這些地方往往容易出錯(cuò)。
7.CARDS語(yǔ)句
用于直接輸入數(shù)據(jù),標(biāo)志著數(shù)據(jù)塊的開(kāi)始。格式如下:
CARDS;
數(shù)據(jù)塊
;
8.SORT和BY語(yǔ)句
SORT語(yǔ)句將指定的數(shù)據(jù)集按指定變量排序。使用BY語(yǔ)句可以使生成的數(shù)據(jù)集按照某個(gè)變量排序,但輸入數(shù)據(jù)集必須預(yù)先按該變量排序。使用PROC SORT語(yǔ)句可以進(jìn)行排序,一般形式為:
PROC SORT DATA=數(shù)據(jù)集 OUT=排序后的數(shù)據(jù)集; BY 變量; RUN;
e.g.Proc sort date=stockreturn;
by firm date;run;
9.宏
在宏變量前加&來(lái)引用宏變量的值。
用一個(gè)百分號(hào)(%)加宏名稱(chēng)就可以調(diào)用該宏。%macro 宏變量名:定義宏變量
%DO
:條件處理至一個(gè)匹配的%END出現(xiàn) %If-%Then /%Else :有條件執(zhí)行宏
10.MERGE語(yǔ)句
用MERGE語(yǔ)句合并SAS數(shù)據(jù)集。但是,輸入數(shù)據(jù)集必須預(yù)先按該BY變量排序。語(yǔ)句一般形式為: 式為:
DATA 新數(shù)據(jù)集 ;
MERGE 輸入數(shù)據(jù)集1 輸入數(shù)據(jù)集2 … ; BY 變量; RUN;
e.g.下圖展示合并數(shù)據(jù)集A、B 的結(jié)果:
Data gooddata;Merge stockreturn sample(in=a);By firm;If a=1;Run;注意:這里merge語(yǔ)句使用了兩個(gè)選項(xiàng),當(dāng)一個(gè)SAS數(shù)據(jù)步同時(shí)讀入多個(gè)SAS數(shù)據(jù)集時(shí),可以使用IN=選項(xiàng)來(lái)確定本觀測(cè)來(lái)自哪個(gè)數(shù)據(jù)集,in=選項(xiàng)的一般形式是:SAS-data-set(IN=variable)。其中,variable是一個(gè)臨時(shí)的數(shù)值型變量; Variable=0 表示觀測(cè)不是來(lái)自本數(shù)據(jù)集; Variable=1表示觀測(cè)是來(lái)自本數(shù)據(jù)集;
在這里使用IN選項(xiàng)的目的就是把所有來(lái)自數(shù)據(jù)集sample的觀測(cè)輸出到新數(shù)據(jù)集gooddata中。
11.REG語(yǔ)句
REG過(guò)程用來(lái)進(jìn)行回歸分析。
在MODEL語(yǔ)句中有許多選項(xiàng),其中的幾個(gè)選項(xiàng)如下:
CLM
回歸估計(jì)值0.95置信區(qū)間的上界和下界。CLI
因變量預(yù)報(bào)值的0.95置信區(qū)間。
P
由輸入數(shù)據(jù)和回歸方程計(jì)算預(yù)報(bào)值。輸出觀測(cè)序號(hào),ID變量(需事先規(guī)定ID語(yǔ)句),實(shí)際值,預(yù)報(bào)值和殘差。如果已規(guī)定了CLM、CLI或R,選項(xiàng)P就不需要了。
R
要求殘差分析,輸出包括選項(xiàng)P的一切內(nèi)容外,還有其它一些分析
12.MEANS語(yǔ)句
MEANS對(duì)指定的數(shù)值變量進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)描述。13.OPTIONS語(yǔ)句
?
OPTIONS語(yǔ)句臨時(shí)改變SAS系統(tǒng)的選項(xiàng)設(shè)置。?
改變后的選項(xiàng)設(shè)置在以后的SAS會(huì)話或作業(yè)中保持有效,直到再次改變它們。
?
改變SAS系統(tǒng)選項(xiàng)可以用OPTIONS語(yǔ)句,或用顯示管理命令OPTIONS菜單。
語(yǔ)句格式:
OPTIONS option-1 <...option-n>;其中:
option規(guī)定要改變的SAS系統(tǒng)選項(xiàng)。
第四篇:SAS數(shù)據(jù)輸入總結(jié)
SAS學(xué)習(xí)總結(jié)
一、SAS的數(shù)據(jù)錄入
(1)直接輸入
data first;
input name $ salary;
datalines;a 12b 34c 56d 78
;
run;
注意:datalines的位置以及數(shù)據(jù)錄入后的分號(hào)
(2)借助infile可讀入文本格式為dat、txt、csv
A.最簡(jiǎn)單的形式
data first;
infile 'c:userslichaodesktopsasdatatoadjump.dat';
input Toadname $ Jump1 Jump2 Jump3 Jump4;
run;
proc print data=work.first;
run;
B.有空格的情況,需要數(shù)一下
data second;
infile 'c:userslichaodesktopsasdataonionring.dat';
input Name $ 1-19 Jump1 22-24 Jump2 25-28 Jump3 30-31 Jump4 33-34 Jump5 37 Jump6 40;
run;
proc print data=work.second;
run;
C.格式重復(fù)的情況
data third;
infile 'c:userslichaodesktopsasdataexercise.dat';
input Num1 Num2 Num3 @@;
run;
proc print data=work.third;
run;
注意:@@的用法
D.其他的格式
Ⅰ.輸出特定的行
data icecream;
infile 'c:userslichaodesktopsasdataicecreamsales2.dat' firstobs=3 obs=5;
input Flavor $ 1-9 Location Boxessold;
run;
proc print data=icecream;
run;
注意:firstobs和obs的位置不要改變,而且兩者可以單獨(dú)使用
Ⅱ.有缺失值
data class;
infile 'c:userslichaodesktopsasdataallscores.dat' missover;
run;
proc print data=class;
run;
注意:在有缺失值的情況下,如果輸出有錯(cuò)誤的話就用missover
Ⅲ.非正常的輸入:
data third;
infile 'c:userslichaodesktopsasdatapumpkin.dat';
input Name $16.num 3.type $2.date $11.(num1 num2 num3 num4 num5)(4.1);run;
proc print data=third;
run;
注意:16.和3.、4.1等的表示方法,都是表示寬度,相比較數(shù)列數(shù)的方法更有效;輸入格式相同的話可以加括號(hào)把格式寫(xiě)在后面的括號(hào)里。
Ⅳ.日期的輸入:
按照數(shù)值處理,根據(jù)情況,使用MMDDYYw.或者 DDMMYYw.(3)import 錄入其他格式的文件(可導(dǎo)入的格式非常多)
proc import datafile='c:userslichaodesktopsasdatasecond.xls' dbms=xls out=mydata replace;sheet=“sheet1$”;
range=“a1:b3”;
run;
proc print data=mydata;
run;
注意:sheet表示單元表的名字,range表示導(dǎo)入的數(shù)據(jù)范圍
input name $ test1 test2 test3 test4 test5;
第五篇:SAS基礎(chǔ)語(yǔ)法總結(jié)
一、DATA語(yǔ)句
DATA語(yǔ)句的作用是表明數(shù)據(jù)步的開(kāi)始并給出數(shù)據(jù)集 的名稱(chēng)。
DATA語(yǔ)句的格式為:
DATA 數(shù)據(jù)集的名稱(chēng);
數(shù)據(jù)集的名稱(chēng)必須以英文字母開(kāi)始,最長(zhǎng)不超過(guò)8個(gè)字符。
二、CARDS語(yǔ)句
CARDS語(yǔ)句的作用是與“;”呼應(yīng),標(biāo)志數(shù)據(jù)行的開(kāi)始與結(jié)束。
CARDS語(yǔ)句的格式為:
CARDS;數(shù)據(jù)行;如果使用CARS語(yǔ)句,在CARDS的后面必須緊跟數(shù)據(jù)行,并且在一個(gè)數(shù)據(jù)步中最多只能使用一個(gè)CARDS語(yǔ)句。
三、INPUT 語(yǔ)句
INPUT語(yǔ)句的作用是描述輸入記錄中的數(shù)據(jù),并把輸入值賦給相應(yīng)的變量。INPUT語(yǔ)句的格式為:
INPUT 數(shù)據(jù)的變量名、順序及類(lèi)型;
用INPUT語(yǔ)句是為了讀取外部文件的數(shù)據(jù)或跟在CARDS語(yǔ)句后面的數(shù)據(jù)。
SAS默認(rèn)用INPUT語(yǔ)句讀取的是數(shù)值類(lèi)型變量的值。若在變量后加’$’,則該變量為字符串類(lèi)型變量。
為從一行讀入多個(gè)觀測(cè)值,應(yīng)使用行保持符’@@’限制度數(shù)指針,使其保持在這一行上讀數(shù),知道數(shù)據(jù)讀完為止。
例如:
Input x y@@;
Cards;
8
;
四、INFILE語(yǔ)句
Infile語(yǔ)句的作用是指明外部數(shù)據(jù)文件的名稱(chēng),并從這個(gè)外部數(shù)據(jù)文件中讀取數(shù)據(jù)。
INFILE語(yǔ)句的格式為: INFILE ‘外部數(shù)據(jù)文件名’;
例如,在D盤(pán)上有一個(gè)名稱(chēng)為xiao.txt的數(shù)據(jù)文件,其中數(shù)據(jù)排列為:
A 3.16 B 2.9 B 5.8 B 3 A 4.9 A 4.17 用 INFILE語(yǔ)句讀取數(shù)據(jù)的代碼為:
Data ex;Infile ‘D:xiao.txt’;Input z$ x@@;Proc print;
Run;
五、SET語(yǔ)句
SET語(yǔ)句的作用是按照指定的條件從指定的數(shù)據(jù)集中讀取數(shù)據(jù)機(jī)那里新的數(shù)據(jù)集獲獎(jiǎng)兩個(gè)數(shù)據(jù)集中的觀測(cè)值縱向連接建立新的數(shù)據(jù)集。
SET語(yǔ)句的格式為:
SET 數(shù)據(jù)集名表;例如,從數(shù)據(jù)集EX中讀取數(shù)據(jù)建立新的數(shù)據(jù)集EX1,可編輯語(yǔ)句:
DATA EX1;SET EX;將兩個(gè)數(shù)據(jù)集D1和D2中的觀測(cè)值縱向連接建立新的數(shù)據(jù)集D3,可編輯語(yǔ)句:
DATA D3;SET D1 D2;
六、MERGE語(yǔ)句
MERGE語(yǔ)句的作用是將兩個(gè)數(shù)據(jù)集中的各個(gè)觀測(cè)值橫向合并建立新的數(shù)據(jù)集。
MERGE語(yǔ)句的格式為:
MERGE 數(shù)據(jù)集名表;例如,將數(shù)據(jù)集D1與D2中的觀測(cè)值橫向合并建立新的數(shù)據(jù)集D3,可編輯語(yǔ)句:
DATA D3;MERGE D1 D2;
RUN;
七、DROP語(yǔ)句
DROP語(yǔ)句的作用是指定不寫(xiě)到數(shù)據(jù)集中的變量。DROP語(yǔ)句的格式為:
DROP 變量名表;如果在DATA步中有DROP語(yǔ)句,那么DROP語(yǔ)句中一出現(xiàn)的變量的觀測(cè)值被刪除,未出現(xiàn)的變量的觀測(cè)值仍保留在新的數(shù)據(jù)集中。
八、KEEP語(yǔ)句
KEEP語(yǔ)句的作用是指定要寫(xiě)到數(shù)據(jù)集中的變量。KEEP語(yǔ)句的格式為:
KEEP 變量名表;如果在DATA步4中有KEEP語(yǔ)句,那么KEEP語(yǔ)句中未出現(xiàn)的變量的觀測(cè)值被刪除,已出現(xiàn)的變量的觀測(cè)值被保留在西你的數(shù)據(jù)集中。
九、IF語(yǔ)句
IF語(yǔ)句的作用是使SAS繼續(xù)處理符合IF條件規(guī)定的觀測(cè)值,因而所得到的數(shù)據(jù)集是原數(shù)據(jù)集的子集。IF語(yǔ)句的格式為:
IF 條件表達(dá)式;如果表達(dá)式的值為真,SAS處理當(dāng)前的觀測(cè)值,執(zhí)行DADA步中的語(yǔ)句,如果表達(dá)式的值是假,SAS馬上返回到DATA步的開(kāi)始,不處理當(dāng)前的觀測(cè)值,不執(zhí)行DADA步中的語(yǔ)句。
十、PROC語(yǔ)句
PROC語(yǔ)句的作用是指定需要調(diào)用的過(guò)程以及該過(guò)程的若干選擇項(xiàng)。PROC語(yǔ)句的格式為:
PROC SAS的過(guò)程名;例如,調(diào)用print過(guò)程,打印數(shù)據(jù)集ex的內(nèi)容:
PROC print data=ex;這里的data=數(shù)據(jù)集名,用來(lái)指定本過(guò)程所要處理的數(shù)據(jù)集名,如缺省則處理最新建立的數(shù)據(jù)集。在PROC步中,還必須確認(rèn)一些最基本的信息,包括:(1)處理的數(shù)據(jù)集名,格式為data=數(shù)據(jù)集名;(2)所涉及的變量名,格式為 var 變量名;(3)分組處理的標(biāo)志,格式為 by 組變量名;
十一、CLASS語(yǔ)句
class語(yǔ)句的作用是在分析的過(guò)程中定義分類(lèi)變量,再按分類(lèi)變量的值分組進(jìn)行數(shù)據(jù)分析。
Class語(yǔ)句的格式為:
CLASS 變量名;CLASS語(yǔ)句對(duì)數(shù)據(jù)分析所起的作用類(lèi)似于by語(yǔ)句,但是它們打印輸出的格式不相同,并且by語(yǔ)句要求先對(duì)變量排序后才能使用。
十二、FREQ語(yǔ)句
freq語(yǔ)句的作用是規(guī)定一個(gè)變量,以它的值作為數(shù)據(jù)集中觀測(cè)值出現(xiàn)的頻數(shù)。
FREQ語(yǔ)句的格式為:
FREQ 變量;假定某觀測(cè)值的FREQ變量的值為n,在分析時(shí),改數(shù)據(jù)集中這個(gè)觀測(cè)值出現(xiàn)的頻數(shù)便是n。
若n<1,則觀測(cè)值不參加分析
若n不是整數(shù),則自動(dòng)取整。觀測(cè)值的總數(shù)等于FREQ變量的和。
常用的SAS過(guò)程步
一、print過(guò)程
print過(guò)程可以打印一個(gè)SAS數(shù)據(jù)集中的全體或部分觀測(cè)值,還可以打印數(shù) 值變量的綜合或部分和。
print過(guò)程中經(jīng)常使用的語(yǔ)句有:
proc print [選擇項(xiàng)];
var 變量表;by 變量表;sum 變量表;在proc print 語(yǔ)句中可能出現(xiàn)的選擇項(xiàng)有
data=數(shù)據(jù)集名,如果省略這一選擇,則打印最新建立的數(shù)據(jù)集中的數(shù)據(jù)。
sum語(yǔ)句被用來(lái)求變量表中諸變量的總和。
二、sort過(guò)程
SORT過(guò)程將SAS數(shù)據(jù)集中的觀測(cè)值按一個(gè)或多個(gè)變量的值進(jìn)行排序,以便 其他的SAS過(guò)程利用by語(yǔ)句對(duì)這些觀測(cè)值進(jìn)行分組處理,排序后的觀測(cè)值存放在一個(gè)新的SAS數(shù)據(jù)集中或者代替原來(lái)的數(shù)據(jù)集。在SORT過(guò)程中經(jīng)常使用的語(yǔ)句有:
proc sort [選擇項(xiàng)];
by 變量表;在proc sort語(yǔ)句中可能出現(xiàn)的選擇項(xiàng)有:
data=數(shù)據(jù)集名,用來(lái)說(shuō)明要排序的數(shù)據(jù)集名,如果省略這一選擇,則指定最新建立的數(shù)據(jù)集。
out=數(shù)據(jù)集名,用來(lái)說(shuō)明要輸出的數(shù)據(jù)集名,如果省略這一選擇,則原來(lái)的數(shù)據(jù)集被輸出的數(shù)據(jù)集替換。sort過(guò)程默認(rèn)按升序排列,若要按降序排列,在對(duì)應(yīng)變量前增加選擇項(xiàng)descending。
三、FORMAT過(guò)程
format過(guò)程可以對(duì)字符或數(shù)值變量定義一個(gè)所需要的輸出格式,使data步以及含有format的語(yǔ)句的過(guò)程步中的變量都受到這一輸出格式的限制。
通過(guò)proc FORMAT過(guò)程所定義的格式包括:(1)將輸出值轉(zhuǎn)換成不同的值、數(shù)值可以變成字符,字符可以變成另外的字符。(2)使輸出值保留一定的小數(shù)位,否則輸出值將有8個(gè)小數(shù)位。FORMAT過(guò)程由下列語(yǔ)句控制:
PROC FORMAT;
VALUE 格式名 格式的定義;為便于識(shí)別,格式名通常是原變量名加fmt
如果原變量是字符串,則應(yīng)當(dāng)在格式名前加字符串符號(hào)。后面的過(guò)程中,如果涉及到某變量的輸出格式,必須有語(yǔ)句:
FORMAT 變量名 格式名
四、standard過(guò)程
standtard過(guò)程按給定的平均值和標(biāo)準(zhǔn)差對(duì)SAS數(shù)據(jù)集中的部分或全體變量進(jìn)行“標(biāo)準(zhǔn)化”變換,并形成新的數(shù)據(jù)集。
在standard過(guò)程中經(jīng)常使用的語(yǔ)句有:
proc standard [選擇項(xiàng)];
var 變量表;freq 變量表;by 變量表;在proc standard語(yǔ)句中可能出現(xiàn)的選擇項(xiàng)有:
data=數(shù)據(jù)集名,用來(lái)說(shuō)明要“標(biāo)準(zhǔn)化”變換的數(shù)據(jù)集名,如果省略這一選擇,則指定最新建立的數(shù)據(jù)集。
out=數(shù)據(jù)集名,用來(lái)說(shuō)明含有“標(biāo)準(zhǔn)化”變量的新數(shù)據(jù)集名,如果忽略這一選擇,SAS將按內(nèi)部程式給出新的數(shù)據(jù)集名。
此過(guò)程將打印輸出每個(gè)“標(biāo)準(zhǔn)化”變量的輸入頻數(shù)、平均值及標(biāo)準(zhǔn)差。
五、TRANSPOSE過(guò)程
transpose過(guò)程將一個(gè)數(shù)據(jù)集進(jìn)行轉(zhuǎn)置,使行變?yōu)榱卸凶優(yōu)樾校簿褪鞘乖瓟?shù)據(jù)集中樣品的觀測(cè)值變換成新數(shù)據(jù)集中變量的觀測(cè)值,而原數(shù)據(jù)集中變量的觀測(cè)值則變成新數(shù)據(jù)集中樣品的觀測(cè)值。transpose過(guò)程的格式為:
proc transpose [選擇項(xiàng)];var 變量表;by 變量表;在proc transpose語(yǔ)句中可以出現(xiàn)的選擇項(xiàng)有:
(1)data=數(shù)據(jù)集名,用來(lái)說(shuō)明要轉(zhuǎn)置的數(shù)據(jù)集名;如果忽略這一選擇,則指定最新建立的數(shù)據(jù)集。
(2)out=數(shù)據(jù)集名,用來(lái)說(shuō)明轉(zhuǎn)置所建立的心數(shù)據(jù)集名,如果省略這一選擇,SAS將按內(nèi)部程式給出新的數(shù)據(jù)集名。
(3)prefix=字母(指定一個(gè)新前綴,用來(lái)構(gòu)成新變量名)
(4)name=字母(為含有輸入數(shù)據(jù)集中被轉(zhuǎn)置的變量名的輸出數(shù)據(jù)集中的變量命名,如果省略這一選擇,SAS將按內(nèi)部程式指定)。
在var語(yǔ)句中應(yīng)列出要被轉(zhuǎn)置的變量名,否則原數(shù)據(jù)集中未在其他語(yǔ)句中列出的所有數(shù)值型變量都將被轉(zhuǎn)置,字符型變量必須在var語(yǔ)句中列出才能被轉(zhuǎn)置,未被轉(zhuǎn)置的變量不進(jìn)入新的數(shù)據(jù)集,除非它們已經(jīng)被列入copy或by語(yǔ)句。
by語(yǔ)句使輸入數(shù)據(jù)集分組轉(zhuǎn)置,分組變量被包括在輸出數(shù)據(jù)集中。