少妇人妻无码专区视频免费,狂野欧美性猛交免费视频,亚洲最大综合久久网成人

第一篇：高維數據統計分析

高維、相依和不完全數據的統計分析

李國英中國科學院數學與系統科學研究院系統科學所現代科學技術和社會經濟的許多領域都遇到高維、相依和不徹底數據的統計分析問題，它是目前統計學應用和理論中面臨困苦最多、挑戰最嚴峻，也是最有可能取得突破的研究領域之一。本文試就筆者個人的認識，分三部分介紹、討論與該領域有關的情況和問題。首先簡要講述統計學的發展情況，然后介紹我國學者在相干領域中的研究成果，最后探討該領域中一些值得注意的研究方向。本文旨在拋磚引玉，以期得到國內同仁對統計學發展更多的關心和反對。由于筆者程度和知識所限，定有疏漏和不妥之處，歡迎批評指正。

統計學（statistics 我國習慣上稱為數理統計）研究效地收集、分析和解釋數據，以提取信息、建立模型，并進行推斷、預測和決策的方式和理論。人類在社會、生產和科學活動中常常通過實驗、觀測和調查獲得數據（包括各種資料），再從數據中獲得知識。統計學正是在這樣的過程中產生和發展起來的。社會經濟、科學技術和工農業生產的發展是它的源泉和動力，也是它的目的和歸宿。統計學的本質性特征決定了它有廣泛的應用性和很強的交叉性。大致從十七世紀開始，由于天文、物理、生物、遺傳以及人口和社會調查等方面的需要而蒙發了統計學。例如，17 世紀中期，J.Graunt 在人口死亡等社會問題的研究中，發展了最早的描述統計； 18 世紀末 19 世紀初，A.M.Legendre 和 C.F.Gauss 在研究測地學和天體物理的數據分析中，提出了最小二乘法和誤差的正態分布理論； 19 世紀中期，F.Galton 在研究生物遺傳規律的過程中發明了相干分析和回歸分析方式。關于統計學的早期歷史可參閱陳希孺的文章《數理統計學小史》（《數理統計與管理》，1998 年第 2 期至 1999 年第 6 期）。進入二十世紀以后，相繼出現了幾位偉大的數學家和統計學家 K.Pearson、R.A.Fisher、A.N.Kolmogrov、N.Neyman、E.Pearson 和 A.Wald 等，由于他們的奠基性工作，統計學方式和理論都有了很大發展，到四十年代中期成為一門成熟的學科。近五十多年，突飛猛進的社會經濟和科學技術不斷提出各種各樣的統計學問題，計算機的急速發展為收集和分析數據提供了方便。這些都極大地推動了統計學的發展和應用。統計學的內容更加豐富，理論更加深刻，統計方式也越來越廣泛深入地滲透到社會經濟、科學技術和工農業生產的各個領域，對人類社會的繁榮進步起到了積極的推動作用。統計學也因此受到社會的承認和重視。例如，1984 年美國《科學》雜志把順計學列為1900年以來對人類生活影響最大的二十項科學成就的第十八項（第一項是塑料，第六項是電視，第十六項是計算機）。美國和印度等國家曾聘用統計學家作為國家元首的科學顧問。一些發達國家和地區的大部分大學設有統計系，許多大學還同時設有生物統計系或林業統計系等等；許多大企業聘用統計學家為其解決統計問題，例如美國的貝爾公司就擁有數十人的統計學家隊伍，著名統計學家J.W.Tukey生前在該公司任職長達數十年。現在，統計學已經成為許多學科領域必不可少的工具；它還與一些學科相結合形成了相應的專業統計，例如，生物統計、計量經濟、地質統計、氣象統計、農業統計、林業統計、心理統計和教育統計等。在當今的信息和知識經濟時代，人類研究的科學和社會問題更加高深、更加復雜、更加龐大，有效地收集和分析數據以提取信息和獲得知識變得更加須臾不可離。而且發達的信息技術和高性能的計算機使收集、儲存、傳輸數據和進行科學計算更加便捷。這就給統計學提出了許許多多更大、更難、更復雜的問題。例如，復雜系統的統計建模，經濟金融中的預測和決策，高維、定性和不徹底數據的統計分析，數據庫等巨型復雜數據的信息提取和知識發現，相依變量和動態系統的統計規律，小樣本和相干信息的統計推斷，信號和圖象的統計處理等等。因此，統計學正面臨著前所未有的巨大挑戰和機遇，其中高維、相依和不徹底等復雜數據的統計分析是一個帶有普遍墟履突出難題。例如，雷達網、信息網等接收和傳輸的信號數據，衛星遙感觀測的圖象數據，文字語焰履記錄數據，DNA和蛋白質構造的測試數據，全國乃至全球的氣象和環境數據，人口、企業、教育、科技、醫療衛生等社會調查數據，以及股市、保險、信用卡、房地產等經濟金融數據，都是維數很高（數

十、數百乃至上千維）、構造十分復雜的數據，許多數據還是前后相依（不獨立）的；在工業、國防、天文和醫學等領域存在大量的不徹底數據，即人們不能得到所關心的某些變量的數值，而只知道它們所在的區域，甚至徹底不知道部分變量鑰錕分場合的數值（即缺失數據）。而且在實際問題中，往往同時遇到多種情況。例如，來自復雜現象的數據一般是高維的，許多時候還是相依的、動態的，有時還含有不徹底數據；圖象和信號可以轉化為高維數據處理，而信號一般是前后相依的動態數據；許多高維數據（例如 DAN 和基因數據），相對其維數而言，樣本量相當小；許多小樣本問題中常常含有不徹底數據等等。對于這些問題，統計學工作者和實際領域中的數據分析工作者都進行了許多研究，有些方面已經形成了一些比較有效的方式，但很多方面還處在探索階段，缺乏系統有效的方式，更缺乏完整的統理論。近些年，特別是在發達國家中，有許多統計學家深入到實際領域，或與實際領域的專家合作，探索解決這些挑戰性問題的途徑。我們將在第三部分介紹一些有關的具體情況。二

我國的統計學起步較挽。解放前只有以許寶祿先生為代表的少數幾位統計學者，他們是四十年代從國外回來的。解放后，特別是在1956年的國家科學發展規劃的推動下，統計學有了較大的發展。改革開放以來，統計學有了新的發展，從事統計學研究、應用和教學的隊伍壯大了許多，先后成立了四個全國性學術團體，出版了幾種專業刊物，北京大學等七所綜合性或理工科大學成立了統計系（或概率統計系等），有近百所財經類高校設有統計系或統計專業；統計學的研究程度不斷提高，應用范圍不斷擴大。我國的統計工作者在理論和應用研究方面也取得了豐碩的成果，不少成果達到國際先進、甚至領先程度。這里僅簡要列舉與該方向有關的成果。由于時間所限，未能全面收集有關情況，定有疏漏和不當之處，敬請原諒。經典統計學中與高維數據分析直接相干的是多元分析和線性模型的統計分析。早在四、五十年代，這方面的理論研究還處在早期階段，我國統計學家許寶祿先生獲得了一系列開創性研究成果，是國際上公認的奠基人之一。改革開放以來，我國有不少學者從事這方面的研究，成果也很多。例如，中國科學院研究生院陳希孺和中國科學技術大學趙林城比較系統地研究了多元線性回歸的LS、和M估量的相合性、漸近正態性和線性表示等大樣本性質，在一些情況下得到了或幾乎得到了充分必要條件，有的問題得到了精確的階估量和理想的界限。他們的成果在國際上有較大反響和許多引用，國際著名統計學家、美國科學院院士C.R.Rao等在專著中把他們的主要成果列為6條定理。此外，中國科學院應用數學所方開泰和上海財經大學張堯庭等在橢球總體的多元分析方面，中國科學院系統科學所吳啟光和北京理工大學徐興忠等在多種線性模型估量的容許性和其他統計決策問題方面，北京工業大學王松桂在線性回歸的估量方面，以及東北師范大學史寧中在有約束的線性模型方面也都有不少好成果。比線性模型復雜的多元模型是非線性參數模型、半參數和非參數模型。在這些模型的理論方面我國統計學者也有許多工作。例如，中國科學院系統科學所成平等在研究半參數模型的漸近有效估量方面，陳希孺、趙林城和安徽大學陳桂景等在研究非參數回歸、密度估量和非參數判別方面，東南大學韋博成等在用微分幾何方式研究非線性（參數）回歸方面，以及南京大學王金德在非線性回歸估量的漸近性質方面均有一系列成果。在非參數理論的成果中，陳希孺和趙林城徹底解決了關于U統計量分布的非一致收斂速度問題，有關結果被美國《統計科學百科全書》以及美國和前蘇聯等出版的多本專著引述。自助法等重抽樣方式也是一類非參數方式，主要是用來逼近那些無法從理論上給出的統計量分布及有關的量。北京大學鄭忠國及其合作者與美國D.B.Rubin獨立提出了一種與自助法功能相似的隨機加權法。他們在多種模型下研究了統計量的隨機加權逼近，結果表明該類方式無需重抽樣也能達到用自助法的效果，在有些情況下還優于自助法。有關多元統計模型的另一類重要問題是模型的統計診斷，目的是了解實際數據與選用的模型能否吻合。韋博城、人民大學吳喜之以及云南大學王學仁和石磊等在模型和數據的統計診斷方面有許多好成果。云南大學的學者還把他們的成果用于地質探礦的數據分析等實際問題取得成功。解決數據與模型這一對矛盾的另一種途徑是使用對模型不敏感的統計方式，即當模型與數據吻合或不太吻合時都能給出比較正確的結論，這就是穩健統計方式。中國科學院系統科學所李國英和張健等在多元位置和散布陣的穩健估量及其性質，位置M估量的崩潰性質等方面也取得了一些好成果。在多維試驗設計方面，中國科學院數學所王元和應用數學所方開泰引進數論方式提出了均勻設計，能用于缺乏使用正交設計條件的情況。該設計方式已在國內的多個實際部門應用，效果良好。這一工作在國際上也受到重視。南開大學張潤楚等在研究計算機試驗設計方面也有一些好成果。

七十年代中期出現的投影尋蹤(projection pursuit簡稱PP)技術是分析高維數據的較好方式，到八十年代初文獻中還很少有理論研究。中國科學院系統科學所成祥和李國英領導的研究小組自八十年代中開始從事PP方式和理論的研究，構造了一些分析高維數據的新方式，研究了PP統計量的漸近性質和自助（Bootstrap）逼近，獲得了一系列重要結果。例如，成平、朱力行和張健研究了多種PP擬合優度統計量尾概率的估量，對有的統計量得到了精確的階，否定了前人的猜測；李國英和施沛德等對兩類應用普遍的PPU和PPL統計量作出了統一處理，研究了它們的漸近分布及其自助逼近；張健和成平給出了一個一般性結果，解決了大部分PP檢驗的功效問題；李國英和張健等分別用PP技巧構造了幾種多元質量控制圖，比原有的控制圖提高了檢測效果。他們的工作曾多次在有關的國際學術會議上作邀請報告，受到國際同行的好評，在國內外文獻中引用較多。有些成果還在國內的水文、氣象、醫學等方面得到了應用，解決了用傳統方式難以處理的問題。與相依數據的統計分析關系密切的是時間序列分析。在這方面我國學者也有很好的工作。北京大學江澤培是這方面最資深的學術帶頭人。改革開放以來，他和他的學生何書元等在多元平穩序列的譜估量方面取得了一系列重要成果。有些成果還被北京大學謝衷潔、程乾生等應用到天文、地質和醫學等實際數據的分析，獲得了有價值的發現。中國科學院應用數學所安鴻志在時間序列分析中的重對數律，自回歸的選元方式及其相容性，以及非線性和條件異方差模型的性質等方面有不少重要成果，有些成果在國際上有較多引用，受到好評。另一類重要的相依數據問題是統計信號處理。趙林城在信號檢測和疊加指數信號的估量及其性質方面有不少好成果，受到國際同行的重視。他提出的一個信號檢測準則被本國學者稱為有效檢測準則，在文獻中多次被人引用和仿效。

在我國較早從事不徹底數據分析研究的有北京大學陳家鼎和復旦大學鄭祖康。他們在刪失數據下的分布估量和參數估量理論方面作出了貢獻。近年來由于可靠性研究的需要，不徹底數據的統計方式和理論取得了很大進展。例如，陳家鼎及其合作者用樣本空間排序法對于可靠性中常用的壽命分布和一類增長模型，在多種不徹底數據情況下導出了在一定意儀舐的最優置信限。中國科學院系統科學所戴樹森、于丹、李國英等對于常用的壽命分布和不徹底數據類型，以及可靠性構造相當一般的系統，給出了利用部件數據對系統可靠度進行綜合評估的方式，對部件數據樣本量的要求比前人的方式明顯減少，而且評估精度也提高了。北大和系統所的工作顯著推進了前人的理論結果，在相當程度上解決了中小樣本情況下，單部件和系統的可靠性評估問題，很有實用價值，受到國防工業部門的歡迎和贊賞。戴樹森、于丹、華東師范大學茆詩松以及上海師范大學費鶴良等研究了不徹底數據情況下加速壽命試驗中的一些估量理論問題，有些成果已在電子元件篩選中得到應用，取得了較大的經濟效益。北京工業大學楊振海等關于無失效數據等可靠性中不徹底數據的統計分析也有一些好成果。近些年，我國還涌現出一批比較優秀的年輕統計學者，在高維、相依和不徹底數據的統計分析等方面獲得了可喜的成果。比較突出的有北京大學正直、何書元、施沛德，中國科學院應用數學所朱力行，系統科學所張健、于丹等。其中，正直關于定性和不徹底數據圖模型的研究，朱力行關于PP統計量尾概率和逆回歸理論的研究，張健關于PP理論、穩健估量噪檢驗的崩潰性質以及非參數回歸的研究，何書元關涌锘徹底數據總體分布估量漸近性質的研究，施沛德關于模型選擇問題的研究，以及于丹關于中小樣本下復雜系統可靠性評定和導彈貯存可靠墟履研究及應用均有不少好成果。此外，北京大學蔣建成，北京師范大學崔恒建，安徽大學胡舒合，中國科學院系統科學所石堅和鄒國華，應用數學所王啟華、周勇和陳敏，北京理工大學徐興忠，吉林大學宋立新，以及云南大學石磊和陳建寶等也有一些較好的工作。總之，改革開放以來我國統計學有很大發展，但總的說來，我國的統計學與發達國家相比差距還較大。首先，與我國經濟和科技發展對統計學的需求相比，與一個十多億人口的大國相比，我國統計學的隊伍還很小；其次，統計學的應用遠沒有達到應有的程度。有很多能夠應用統計學的行業領域，還不大了解統計學。因此在我國大力發展統計學非常重要。事實上，早在1984年，國務院[國發（1984）7號]文件《關于加強統計工作的決定》就指出“我國要實現工業、農業、科學技術和國防現代化，必須實現統計工作現代化”，“中國科學院要加強數理統計研究機構，要集中一批專門人材，開展統計科學研究，盡快提高我國統計學程度”。筆者深切感到我國統計工作者任重道遠。從戰略上講，我們需要大力發展統計教育，培養不同層次的統計學人才，擴簇銑計學隊伍提高研究程度；還需要在一切能應用統計學的部門與行業普及統計知識，使之成為實際部門的有力工具。這不僅將加速實際領域的發展，而且使我國統計學的發展有更廣闊的土壤和更強勁的動力。但這些已超出了本文的范圍，這里暫不討論。三

如前所述，現代科學技術的前沿領域和社會經濟的重大問題提出了許多高維、相依和不徹底等復雜數據的分析處理問題，以下僅就筆者的個人認識，扼要講述有關這方面的一些值得注意的研究動向。（1）統計模型

統計模型是對數據內在規律墟履數學描述，數據的復雜性必然帶來模型的復雜化。以描述變量之間關系的回歸分析為例，經典的統計模型是線性回歸函數和獨立同分布正態誤差。由于所研究的客觀現象越來越復雜，要求也越來越精細，回歸函數已從線性發展到各種非線性回歸函數、廣儀筮性、部分線性、比例驚險率等半參數回歸函數，以及可加、廣義可加和徹底非參數等非參數回歸函數；誤差模型也發展到獨立不同分布的正態誤差和污染誤差等參數和半參數模型，獨立不同分布的對稱誤差、相依弱構造誤差等半參數和非參數模型。類型的情況在統計學的各個分支都存在。近些年研究較多的統計模型還有：分層模型、多重線性模型、潛馬氏鏈模型、間接可加模型、網絡圖模型、時空序列模型和條件異方差模型等等。這些模型大多是在研究某類實際問題中提出，后來被推廣到更多的領域，成為有一定普遍墟履統計模型。還有一種情況，特別是較新領域中的數據，由于我們對該領域所知甚少，只好用半參數甚至非參數模型。近十多年半參數和非參數模型的統計方式和理論有很多討論。總之，由于人類所研究的問題和現象越來越復雜，所遇到的數據和相應的模型也將越來越復雜。對于實際中出現的各種復雜數據，找出和建立適當的模型，并針對不同的模型研究孕效的統計分析、推斷方式及其理論是統計學永遠要面舵履挑戰，也是它取之不盡、用之不竭的發展動力。（2）模型選擇、統計診斷和穩健方式

進行統計分析與推斷的第一步，就是對手中的數據建立適當的模型。對于一組數據，往往有好多類模型可供選擇；在同一類模型中，還要確定變量個數或某種“階數”，這就是所說的模型選擇。然后才是進一步的統計推斷，即參數的點估量、區間估量或假設檢驗等。早期的模型選擇主要是線性回歸中自變量的選取，方式也局限于最小二乘法導出的統計量和AIC準則等。隨著數據和模型的復雜化，模型選擇問題更為重要。面對一組數據，特別是一組新領域的復雜數據，往往有數十類模型可供選擇。這里最為困苦的是選擇哪一類模型，其次是在這一類模型中，選擇其“階數”或變量。到目前為止，對前一個問題還極少有討論。關于后一個問題，雖然取得了許多重要進展，但仍有許多方式和理論問題尚待解決，特別是關于時空序列、高階馬氏鏈和隱馬氏鏈的定階，以及廣儀筮性模型、生長曲線模型、含誤差的變量和協變量模型（EV模型）中的變量選取等較復雜的模型選擇問題。模型選擇問題在理論和應用上都很重要，是研究較多且有可能取得突破的研究方向。

統計診斷是研究所選定的模型與數據能否符合，找出明顯與模型不符的情況，包括少數“離群點”，對推斷結果影響大的“杠桿點”，以及其它不符合模型假定的地方（例如，常用的模型假定有：誤差等方差，回歸函數為線墟氯）。穩健方式則是從另一個角度解決模型與數據的關系問題，即研究在模型與數據相符或者不很相符（即少有偏離）的情況，都能給出比較符合實際的推斷結果的統計方式。統計診斷和穩健統計方式是在過去的三十多年里發展起來的統計分析方式，由于許多方式計算十分復雜，其發展曾一度減緩。近些年，隨著計算機的快速發展和普及，這兩個方向又再次受到的重視，對于比較復雜模型（參見后面的（1），（2）），的統計診斷和穩健方式，包括相應的理論問題研究較多。而且，新的數據類型和新的模型不斷出現，需要研究新的診斷和穩健方式、算法及理論。（3）降維技術

一方面由于高維數據分析十分困苦，另一方面高維數據中的信息往往主要包括在一個或幾個低維構造中，因此降維是分析高維數據的一個重要手段。傳統的主成分分析，Fisher判斷等都屬于降維方式，但它們只適用于有線性構造的簡單數據。七十年代中開始的投影尋蹤是具有一定普遍意義的較好的降維技術，九十年代初提出的切片逆回歸也是一種降維方式。近幾年關于投影尋蹤和其他降維方式討論較多。這里有幾個難點：（I）怎樣針對一類實際問題確定尋找低維構造的準則；（II）如何判斷所找到的低維構造能否真實；（III）計算問題，因為真正可用于高維復雜數據的降維方式（例如投影尋蹤）計算量都很大，而且往往不能一步到位，需要多次反復。（4）計算密集型方式

統計量及其分布是進行推斷的基礎。在許多復雜情況，所需要的統計量沒有顯表達式，有時即使有也很難計算。對此，往往提出適當的算法借助計算機求出所需要的量。而且，除了少量較簡單的參數模型外，無法得到統計量在有限樣本情況的精確分布（或某些分布特征），而這是進行統計推斷的關健。雖然許多情況有大樣本下的漸近分布，但在實際中用它作統計推斷精度較差，不能滿足要求。由此近二、三十年產生了許多計算密集型方式，益旅到所需要的統計量、統計量的近似分布或分布特征，或給出比基于大樣本理論精度更高的推斷結果。例如EM 算法及其各種推廣、投影尋蹤技術、偏最小二乘法（Partial least square）、自助法、重要抽樣和馬氏鏈蒙特卡洛（MCMC）等。其中有些方式，例如，偏最小二乘和MCMC等，首先出現在某個實際領域，后來被統計學家注意，并推廣發展成具有一般墟履方式。當前，還有一些處理和分析復雜數據的方式，已經在某些實際領域中應用，例如神經網絡、機器學習、數據采掘、數據庫知識發展和獨立成分分析等。一些統計學家已經開始參與這些方式的研究。這應該是一個非常值得重視的領域。（5）似然方式

鑰鏤數模型的統計推斷中，似然方式（極大似然估量和似然比檢驗等）占有十分重要的地位。近二、三十年，參數模型的似然方式有許多發展，出現了擬似然、偏似然、條件似然和懲罰似然等新方式。其中基于近似輔助統計量和條件似然的條件推斷尤為有目共睹。然而在半參數和非參數模型下，極大似然估量和似然比檢驗統計量或者不存在，或者很難計算。這一困苦近十年左右已有所突破。其中比較突出的是Sieve似然方式和利用各種輔助信息的經驗似然方式。在一些相對簡單的情況已獲得成功，并得到了一些理論成果。但總的說來，這方面的研究還在開始階段，有許多復雜情況還有待研究。例如，似然方式在半參數和非參數情況，能不能達到簡單參數情況的優良性質？怎么才能達到？這些問題均是研究的焦點。

（6）小樣本問題與信息融合在高新技術和國防科技中，由涌嵇品價格和試驗費用十分昂貴，在各種環境條件下所獲得的試驗數據中，能作為來自同總體樣本的樣本量相當小，而且大部分是不徹底數據。在許多復雜問題中，樣本量的絕對數也許不算小，但相對于數據的維數，或者參數個數而言，樣本量就相當小了。對這樣一些問題，經典的精確統計方式大多不適用，而大樣本理論的統計推斷又精度較差。于是近二、三十年出現了自助法、隨機逼近、鞍點逼近和其他高階漸近逼近的方式。對于較復雜的數據和模型，基于樣本量較小的數據本身，給出盡可能精確的統計推斷，仍然是一個重要的研究方向。另一方面，在實際問題中除了來自所研究的總體的直接數據之外，還可能有其他一些與之有關的數據，也包括一些有關所研究總體的信息。如何把這些數據充分利用起來，對于小樣本問題是十分重要的。貝葉斯分析是融合不同來源信息的較好方式。問題在于如何客觀地確定先驗分布，即避免先驗分布中的主觀成分。這就是近些年討論較多的客觀貝葉斯方式。

著名統計學家B.Efron（Statistical Science13(1998)95-122）以為，信仰（Fiducial）方式有可能在客觀貝葉斯分析中起重要作用。信仰方式是由A.R.Fisher于二十世紀三十年代提出，它是在沒有先驗信息的情況下，對參數給出類似于后驗分布的信仰分布。但該方式遇到很多困苦，沒有發展起來，而被以為是 Fisher 的一大失誤。Efron以為，信仰方式有可能在較復雜的問題中給出較好的近似信仰分布，從而有可能進行客觀的貝葉斯分析。顯然他把 Bayes 推斷和 Fiducial 推斷結合起來了。面對越來越大、越來越難、越來越復雜的實際問題，人們必然需要多種推斷方式，以及它們之間合理、有效的結合，并根據不同的實際問題，選用適當的推斷原理和方式。這里有許多需要深入研究的基礎性問題。結束語現代科學技術和社會經濟中的課題，一般都是交叉性綜合墟履，要涉及多個學科領域。同樣，在其數據的獲取和分析這一統計學方面，也不可能只涉及

一、兩個研究方向。面對各種實際領域中的統計學問題，特別是挑戰性強的困苦問題，應該有一些統計工作者與實際領域的專家相結合，在解決實際問題的過程中利用統計學的有關最新成果，同時探索新的統計概念、模型、方式和理論。以理論研究為主的統計學者，在關注國際統計學理論發展的同時，也應關心我國實際領域中的統計問題及其進展，提出和解決其中的理論問題。這樣，我國的統計學將在與國際接軌的同時，也將逐漸哺育起自己的肥沃土壤，為我國的現代化建設和國際統計學的發展都作出應有的貢獻。

致謝在本文形成的過程中，曾得陳希孺院士，張堯庭、陳家鼎、茆詩松、王學仁、安鴻志、趙林城和韋博成等教授的幫助，特致衷心的感謝！http://i.mtime.com/920665/blog/5653335/

高維數據分析蔡天文，沈曉彤編叢書名：出版社：高等教育出版社ＩＳＢＮ：9787040298512 出版時間：2010-10-01 over the last few years，significant developments have been taking place in high-dimensional data analysis，driven primarily by a wide range of applications in many fields such as genomics and signal processing.in particular，substantial advances have been made in the areas of feature selection，covariance estimation，classification and regression.this book intends to examine important issues arising from high-dimensional data analysis to explore key ideas for statistical inference and prediction.it is structured around topics on multiple hypothesis testing，feature selection，regression，classification，dimension reduction，as well as applications in survival analysis and biomedical research.the book will appeal to graduate students and new researchers interested in the plethora of opportunities available in highdimensional data analysis.Preface part i high-dimensional classification chapter 1 high-dimensional classification jianqing fan，yingying fan and yichao wu 1 introduction 2 elements of classifications 3 impact of dimensionality on classification 4 distance-based classification rules 5 feature selection by independence rule 6 loss-based classification 7 feature selection in loss-based classification 8 multi-category classification references chapter 2 flexible large margin classifiers yufeng liu and yichao wu 1 background on classification 2 the support vector machine： the margin formulation and the sv interpretation 3 regularization framework 4 some extensions of the svm： bounded constraint machine and the balancing svm 5 multicategory classifiers 6 probability estimation 7 conclusions and discussions references part ii large-scale multiple testing chapter 3 a compound decision-theoretic approach to large-scale multiple testing t tony cai and wenguang sun 1 introduction 2 fdr controlling procedures based on p-values 3 oracle and adaptive compound decision rules for fdr control 4 simultaneous testing of grouped hypotheses 5 large-scale multiple testing under dependence 6 open problems references part iii model building with variable selection chapter 4 model building with variable selection ming yuan 1 introduction 2 why variable selection 3 classical approaches 4 bayesian and stochastic search 5 regularization 6 towards more interpretable models 7 further readings references chapter 5 bayesian variable selection in regression with networked predictors feng tai，wei pan and xiaotong shen 1 introduction 2 statistical models 3 estimation 4 results 5 discussion references part iv high-dimensional statistics in genomics chapter 6 high-dimensional statistics in genomics hongzhe li 1 introduction 2 identification of active transcription factors using time-course gene expression data 3 methods for analysis of genomic data with a graphical str 4 statistical methods in eqtl studies 5 discussion and future direction references chapter 7 an overview on joint modeling of censored survival time and longitudinal data runze li and jian-jian ren 1 introduction 2 survival data with longitudinal covariates 3 joint modeling with right censored data 4 joint modeling with interval censored data 5 further studies references part v analysis of survival and longitudinal data chapter 8 survival analysis with high-dimensional covariates bin nan 1 introduction 2 regularized cox regression 3 hierarchically penalized cox regression with grouped variables 4 regularized methods for the accelerated failure time model 5 tuning parameter selection and a concluding remark references part vi sufficient dimension reduction in regression chapter 9 sufficient dimension reduction in regression xiangrong yin 1 introduction 2 sufficient dimension reduction in regression 3 sufficient variable selection（svs)4 sdr for correlated data and large-p-small-n 5 further discussion references chapter 10 combining statistical procedures lihua chen and yuhong yang 1 introduction 2 combining for adaptation 3 combining procedures for improvement 4 concluding remarks references subject index author index

Multivariate statistical analysis(多元統計分析-高維方法)作者：V.I.Serdobolskii.出版社：Springer出版日期：2000年1月

This book presents a new branch of mathematical statistics aimed at constructing unimprovable methods of multivariate analysis, multi-parametric estimation, and discriminant and regression analysis.In contrast to the traditional consistent Fisher method

高維生物學數據分析中的幾個統計問題論文作者荀鵬程著導師陳峰指導

學科專業流行病與衛生統計學研究領域研究方向學位級別博士

學位授予單位南京醫科大學學位授予日期2007 【中文摘要】

微陣列技術的發展給生物科學研究帶來了革命性的契機，成千上萬的基因(或蛋白等)的同時測定成為現實，這很快產生了龐大的微陣列數據。另一方面，隨著分子生物學相關學科的迅猛發展，基因序列數據亦呈現出迅猛增長的態勢。本研究借助統計學的方法和手段，從應用的角度出發，對微陣列數據的差異...>> 詳細

微陣列技術的發展給生物科學研究帶來了革命性的契機，成千上萬的基因(或蛋白等)的同時測定成為現實，這很快產生了龐大的微陣列數據。另一方面，隨著分子生物學相關學科的迅猛發展，基因序列數據亦呈現出迅猛增長的態勢。本研究借助統計學的方法和手段，從應用的角度出發，對微陣列數據的差異表達分析、判別分析以及基因序列代表性片段的篩選等問題進行了深入研究：第一部分，基于結腸癌數據庫設計了兩個模擬試驗，考察了四種FDR控制程序，主要結論如下：(1)在“假設獨立變量獨立但維持現實的方差結構”時，四種程序在大部分情形下，均能將FDR控制在既定的檢驗水準下，同時又具有較高的檢驗效能。FDR控制由強到弱的順序為BL≥BY≥BH≥ALSU，相應的檢驗效能從大到小的順序為ALSU≥BH≥BY≥BL。

(2)在保持變量間現實的協方差結構時，在大部分情形下，對FDR要么失控，要么以不同程度的犧牲檢驗效能為代價達到強控。每組樣本量在20及以下時，四個程序已均無檢驗效能可言。

通過對“正常成年男子和精子運動能力低下者精子蛋白表達差異研究”的蛋白質數據的分析，探索出了“變量粗篩→全局檢驗→單變量檢驗→局部多變量檢驗”的差異表達分析策略，發現了在組間差異表達的十個蛋白組合。第二部分，分別設計了高、中、低三個錯誤率水平的模擬試驗，考察了k-fold CV、BS、LOOBS等九種方法在判別分析預測誤差估計中的應用后認為：綜合考慮估計的“偏性”和“誤差均方”，3-fold CV和5-fold CV效果好且較穩健，推薦使用。

通過對結腸癌數據的分析，探索出了“初步選維→進一步降維→逐步判別篩選→判別建模→模型驗證”的判別分析策略，并通過另兩個數據集驗證了上述策略的實用性。

第三部分，將“HEV基因序列代表性片段的篩選”的專業問題轉化為奇異矩陣比較的統計問題，并從以下三個視角進行了方法學探索：(1)改進了Korin's統計量并用于片段的比較，得出“片段Ⅲ對全序列最具有代表性，可用于HEV基因分型”的結論，并用50％分層bootstrap抽樣驗證了方法的穩定性，用棄一法顯示了方法對毒株的穩健性，進一步說明了結論的可信性。

(2)用棄二法獲取了矩陣特征根分布陣，并通過馬氏距離直觀比較各片段的特征根分布陣與全序列者的距離，結果亦顯示片段Ⅲ最優。(3)構建了“記分統計量”，并通過Monte Carlo模擬獲取其經驗抽樣分布，作統計檢驗后認為片段Ⅲ對全序列有較好的代表性，可用于HEV基因分型。

最后，系統發育分析的結果顯示基于全序列和片段Ⅲ將71株HEV分為同樣的四型，并且基于片段Ⅲ的核甘酸平均差異性在型、亞型、株等三個水平上與基于全序列者取得了相似的結果，進一步從生物信息學的角度驗證了統計學結論。

綜合上述分析，本研究認為： 1．“變量粗篩→全局檢驗→單變量檢驗→局部多變量檢驗”是一個較為適用的微陣列差異表達分析策略。2．“初步選維→進一步降維→逐步判別篩選→判別建模→模型驗證”的判別分析策略不僅適用于兩類判別，而且可用于多類判別。3．“記分法”是一個思想樸素、易于實施的統計推斷方法，可用于基因序列代表性片段的篩選，指導病毒序列分型工作。

本研究提出的策略和方法，較好地回答了生物學工作者的問題，值得推廣應用。

關鍵詞微陣列數據差異表達假發現率統計策略判別分析預測誤差戊肝病毒基因分型全序列基因片段記分法

高維列聯表資料的統計分析與SAS軟件實現葛毅胡良平【摘要】：正在上一講中主要介紹了采用加權等措施合并原因變量的方法處理高維列聯表資料~[1],但如果列聯表維數較多,且希望將各原因變量對結果變量所產生的影響都明確地顯示出來時,加權X~2及CMH X~2分析就不能滿足研究的需要了。如果想系統地評價【作者單位】：后勤指揮學院;軍事醫學科學院生物醫學統計學咨詢中心;高維數據可視化在統計分析中的作用

在對社會、經濟、技術系統的認識過程中，都需要收集和分析大量表現系統特征和運行狀態的指標數據信息。例如，要衡量一個地區的經濟發展，需要觀測的指標有：地區生產總值、勞動生產率、稅收、人均GDP等；要衡量一個城市的綜合發展水平也需要觀測很多指標，如：工業總產值、非農業人口數、人均住房面積、工資總額、城鄉居民儲蓄率等等，高維統計推斷與隨機矩陣

Iain Johnstone 李國英（譯）石堅（校）美國斯坦福大學不詳多元統計分析所關心的是對于多個變量的觀察，這些變量具有某種程度的關聯．由遺傳學和社會科學中的問題所驅動，最初它是在上個世紀的前半葉中發展起來的．繼而，隨機矩陣論（RMT）最初在物理學中，更近些廣泛地在數學中發展起來了．雖然RMT與多元統計的主要研究對象是相同的，但是統計理論被揭示與其有關聯還是很啞B的事．海量數據采集在將來是很普通的，然而，現在數據集合的變量數目往往與觀察值的數目相當，甚至更多．在這樣的情形，RMT對多元統計提供了眾多的技術和結果，中法暑期學校-隨機矩陣理論及其在高維統計中的應用（2011年7月11-31日，長春）http://web.hku.hk/~jeffyao/ss/

本次會議由法國國家科學研究中心(CNRS)和中國國家自然科學基金委員會（NSFC）聯合主辦，東北師范大學承辦，旨在加強中法學術交流，聯合培養研究生，就目前國際的熱點問題之一：大維隨機矩陣理論及其在高維數據分析中的應用進行探討和交流。大會主席：

法國方面：Alice Guionnet Jianfeng Yao 中國方面：白志東組織委員會：

史寧中東北師范大學郭建華東北師范大學張寶學東北師范大學高巍東北師范大學陶劍東北師范大學鄭術蓉東北師范大學蘇中根浙江大學暑期學校的主題：

Topics in the probability theory of random matrices : Convergence of spectral measures of random matrices;universality;Large deviation theory for matrix ensembles;matrix-valued stochastic processes;Central limit theorems for linear functional of spectral measures;Tracy-Widom laws;Spiked population models, deformed matrix models;Random matrices with heavy-tailed entries;Free probability theory fee convolution Topics in high-dimensional statistics with random matrix theory: Limiting distributions of general sample covariance matrices, of F matrices;Estimation of the population covariance matrices from sample covariance matrices;Testing and estimation in presence of high-dimensional data;Signal detection;capacity analysis of telecommunication networks Signal detection;capacity analysis of telecommunication networks.聯系人信息：

蘇中根浙江大學數學系

Email: suzhonggen@zju.edu.cn 電話：0571-87953676 鄭術蓉東北師范大學數學與統計學院 Email：zhengsr1993@gmail.com 手機：***

Corrections to LRT on Large Dimensional Covariance Matrix by RMT 2010年7月15日下午，應“北航研究生學術論壇數學分論壇”邀請，第三世界科學院院士、中國概率統計學會常務理事、東北師大教授、博士生導師白志東為我校師生作了題為 “Corrections to LRT on Large Dimensional Covariance Matrix by RMT”的學術報告。白教授首先就古典的樣本均值概念談起，深入淺出地介紹了概率論數理統計中的極限理論在大維隨機矩陣的譜分析領域的發展與應用。他指出，他建立的線性譜統計量的中心極限定理，開創了極端特征根極限理論和精確譜分離定理等重要成果。除了直接的應用價值之外，其研究結果和經驗為高維統計分析開創了一個行之有效的新方法、新思路。另外，白教授還進一步介紹了近期的研究進展，對統計學在未來經濟領域的發展做出了實踐性的展望。他強調學生應勇于發現問題，分析問題，進而解決問題，敢于批判自己。整場報告十分精彩，吸引了很多專家學者、青年教師和研究生前來參加。白教授以他幽默的談吐，嚴謹的學風，縝密的思維給聆聽報告的師生留下了深刻的印象。

白志東教授畢業于中國科技大學數學系，1982年獲得我國首批博士學位。主要從事概率論數理統計中的極限理論方面的研究，特別是在大維隨機矩陣的譜分析、臨床試驗自適應的設計、算法中的應用概率、信號處理、模型選擇等領域里頗有建樹。他于1989年被選為第三世界科學院院士，1995年被選為美國數理統計研究院Fellow，2003年被選為中國概率統計學會常務理事。曾擔任多元分析雜志Editor，Journal of Probability and Statistics等雜志副主編。先后執教于中國科技大學，匹茲堡大學，賓州州立大學，臺灣中山大學，新加坡國立大學等國內外著名大學。目前在東北師大任教授，博士生導師，發表專著三部，學術論文180余篇。他開創了極端特征根極限理論和精確譜分離定理等重要成果，這些成果使他被稱為該領域里的國際領袖人物。在秩集抽樣方面，他完善了該領域的信息理論，最優抽樣設計等理論貢獻。在漸進展開方面，他還特別提出了部分Cramer條件，建立了包含離散變量時，統計量的Edgeworth展開。在應用方面，他參與了匹茲堡大學關于心臟造形的研究。

南京理工大學數學及其應用研究中心 http://cma.njust.edu.cn/index.asp

高維數據統計分析

主要研究方向及其特色和意義：

1、本研究方向的主要特色：

現代科學技術的前沿領域和社會經濟的重大問題提出了許多高維復雜數據的分析與處理問題。例如，復雜系統的統計建模，經濟金融中的預測和決策。高維、定性和不完全數據的統計分析，數據庫等巨型復雜數據的信息提取和知識發現。相依變量和動態系統的統計規律，小樣本和相關信息的統計推斷，信號和圖像的統計處理等等。本研究方向主要研究特色如下：(1)模式識別理論與應用。針對模式識別中的經典理論，包括最優判別分析、代數特征抽取、特征維數和人臉圖象識別、數字圖像高維數據統計分析理論等問題的研究，取得了顯著成績，在相關領域國際學術刊物及國際會議上發表論文近100 篇，其中被 SCI 收錄 50 篇。其研究成果主要發表在與模式識別理論與應用有關的所有重要國內外學術刊物上，如IEEE Trans.on Pattern Analysis and Machine Intelligence, IEEE Trans.on Computers, Pattern Recognition、Pattern Recognition Letters,Image and Vision Computing,Artificial Intelligence in Engineering, Pattern Recognition and Artificial Intelligence等。(2)多維數據統計方法下的數據挖掘理論與方法。基于多維數據統計方法下的數據挖掘理論與方法研究，近年來一直是數據挖掘的重要和熱點問題之一。我們在這個方面已具有很好的研究基礎，并將其理論與技術研究應用于高維數據處理，取得了很好的效果。目前已在國內外核心刊物發表論文近30篇，SCI與EI收錄近10篇。

2、本研究方向的學術地位：

(1)金忠教授發表在2001年《Pattern Recognition》上的關于統計不相關性的線性鑒別分析理論研究方面的論文“Face recognition based on the uncorrelated discriminant transformation”被廣泛引用，美國著名的科學評價機構THOMSON 于2002年發來了賀信，信中指出：根據“ Essential Science Indicators”的統計，你們的論文“Face Recognition Based on the Uncorrelated Discriminant Transformation” 被引用的次數位于同一領域的引用次數最高的百分之一以內，他們認為“該項工作具有高度的影響，對該研究領域的同行具有重要的影響”。(2)楊健教授近5年在IEEE TPAMI上發表的論文數3 篇，其引用次數也位居國內高校位居也前列。美國著名學者 Chellapa(Maryland University)教授在 IEEE 匯刊（Proceedings of The IEEE）發表的關于人臉識別的權威性綜述論文中，用大量篇幅引用和介紹了我們的研究成果。楊健教授在Pattern Recognition 等國際核心(SCI 收錄)期刊上發表論文 24 篇，合作出版英文專著一部，在 2DPCA, 鑒別分析及 kernel 方法方面的研究已引起國內外相關領域學者的較為廣泛的關注，楊健教授的國際期刊論文被SCI收錄的論文引用已逾380次，其中他引次數超過300次，單篇論文SCI引用次數超過60次的論文有3篇，單篇論文SCI引用次數超過10次的有10篇，單篇論文最高SCI引用次數為95次。根據Scholar Google的檢索結果，楊健教授的國際期刊論文被引用已逾1100次，其中單篇最高被引用次數為457次。楊健教授現為國際模式識別領域知名核心期刊 Pattern Recognition Letters 的編委(Associate editor)。

3、本研究方向的作用和意義：高維數據分析是目前統計學理論和應用面臨困難最多、挑戰最嚴峻的問題。本方向結合二維及三維人臉識別中高維特征下模式識別、多維數據統計方法下的數據挖掘、多元統計分析與缺失數據估計等方面的相關數學問題與工程實際應用技術，深入研究高維數據分析中理論與方法，具有十分重要的意義。http://cma.njust.edu.cn/Aboutus.asp?ID=3

圖像處理中數學建模、理論與算法研究

研究方向：圖像處理中數學建模、理論與算法研究主要研究方向及其特色和意義：

1、本研究方向的主要特色：

本研究方向多年來追蹤圖像處理國際研究熱點，結合圖像處理相關的數學理論和方法，主要包括變分偏微分方程理論及算法、幾何多尺度分析理論及方法、調和分析理論、統計分析理論與方法、基于人類視覺感知的稀疏編碼理論以及復雜系統建模理論與方法，針對圖像圖像處理中的問題進行數學建模、理論分析以及算法研究。主要研究特色有：（1）圖像超分辨率重構和涉及的包括圖像去噪、圖像放大、圖像修補、圖像增強等相關問題進行數學建模、理論與算法研究。（2）結合幾何多尺度分析理論及方法、基于人類視覺感知的稀疏編碼理論，對圖像稀疏表示、壓縮編碼、以及涉及信息安全的圖像隱藏、數字水印等問題進行數學建模、理論與算法研究。（3）針對醫學圖像的圖像分割、圖像重構、圖像（信號）奇異性檢測等問題進行數學建模、理論及算法的研究。經過多年努力，已形成實力雄厚的研究梯隊，在圖像處理各個熱點研究方向都取得了很好的成果，在國內已有一定的影響力和學術地位。

2、本研究方向的學術地位：

近5年來，主持或參與完成國家863項目2項，國家自然科學基金4項，省部級基金項目7項；發表論文120余篇，SCI(SCIE)收錄10余篇，EI收錄50余篇，在國內已有一定的影響力和學術地位。

（1）在圖像超分辨率重構問題的數學建模、理論與算法研究方面，目前研究項目有：SAR圖像超分辨反問題基礎理論與算法研究（國家高技術研究發展計劃(863)）；基于形態分量分析的圖像超分辨重建機理與算法研究（國家自然科學基金)；多幅紅外熱圖像超分辨重建算法（教育部高等學校博士點基金）。2003-2008年共發表論文50篇，其中SCI(SCIE)收錄10篇，EI收錄25篇。

（2）在圖像稀疏表示、壓縮編碼理論及算法研究方面，目前研究項目有：基于超小波變換的甚低比特率感知圖像編碼機理和算法研究（國家自然科學基金）；基于過完備稀疏表示的高效可伸縮圖像編碼機理與算法研究（高等學校博士學科點專項科研基金）。

（3）在信息安全與圖像隱藏技術研究方面，承擔和完成的研究項目有：信息隱藏的優化模型及其應用研究（國家自然科學基金）；基于超小波變換和視覺模型的穩健性水印（江蘇省自然科學基金）；超小波變換域穩健性數字水印理論與安全評測方法研究（中國博士后科學基金（一等））；2003-2008年共發表論文40篇，其中EI收錄10篇。（4）在醫學圖像數學建模、理論與算法研究方面，主要針對醫學圖像的圖像分割、圖像重構、圖像（信號）奇異性檢測等問題進行數學建模、理論及算法的研究。目前研究項目有：中國數字化虛擬人切片圖像分割研究（國家自然科學基金）。2003-2008年共發表論文27篇，其中SCI(SCIE)收錄1篇，EI收錄12篇。

3、本研究方向的作用和意義：在圖像處理發展過程中，數學始終起著舉足輕重的作用，并滲透在圖像處理的所有分支之中。一方面由于數學理論及方法的引入，大大促進了圖像處理理論與技術的豐富與發展，也使相關數學理論和應用得到很大的發展；另一方面，隨著圖像處理工程應用的進一步發展，提出了更多的數學問題值得去深入研究。大數學家Stéphane Mallat和David Mumford分別在1998年和2002年的國際數學家大會的報告中討論了許多與圖像處理相關的數學問題，對這類問題的研究已成為數學研究的一個熱點分支。因此，本方向研究圖像處理中的數學問題，并結合相關數學理論及方法，針對圖像處理問題進行數學建模、理論分析以及算法研究具有十分重要的理論意義和應用前景。http://cma.njust.edu.cn/Aboutus.asp?ID=4 非線性偏微分方程與幾何分析

研究方向：非線性偏微分方程與幾何分析主要研究方向及其特色和意義：

1、本研究方向的主要特色：本研究方向主要結合非線性分析、幾何測度論、微分幾何、調和分析和多復變函數等理論和方法研究非線性偏微分方程的現代理論以及黎曼和次黎曼流形上的幾何和分析問題：

（1）非線性偏微分方程解的存在性、正則性，特別是高階非線性方程、Boltzmann方程、自由不連續問題、隨機PED等的解之性質；（2）流形上的幾何分析，特別是黎曼和次黎曼流形上的幾何結構和分析，如次黎曼流形（包括CR流形）上的曲率、測地線、極小曲面等的刻畫、存在性，以及次黎曼度量的正則性問題、次調和函數的研究等；

（3）完全非線性方程的研究，特別是具有幾何、物理背景的復的橢圓型、雙曲型或退化的Monge-Ampere方程各類邊值問題、弱解的存在性、正則性等。在理論探討的同時并注重研究非線性偏微分方程在工程技術、數學物理、金融工程和控制論等方面的應用。

2、本研究方向的學術地位：幾何測度論及其應用是從上世紀六十年代得到迅速發展而形成一個完整的數學分支，特別是其在幾何分析、極小曲面、偏微分方程和變分學等中的完美應用以及與分形學等之間的關系，使得幾何測度論的理論和方法引起了幾何和分析學界的廣泛關注。我們和林芳華合作的《Geometric Measure Theory》專著，是國內關于幾何測度論的第一本專著，也是國外同類為數不多的幾本專著之一，引起了國內外同行的廣泛關注，被Caffarelli L.A.、Wang L-H、Chen G-Q、Chan T.等著名數學家多次引用，被國內外多所高校選為研究生、博士生的教材，特別是幾何測度論領域的國際知名數學家美國Rice大學的R.Hardt教授和芬蘭Jyv?skyl?大學的P.Mattila教授也使用此書作為教學和研究參考, 對此學科特別是在國內的發展產生了積極的推動作用。本研究方向在次黎曼流形上的幾何和分析方面取得了一系列成果，引起了同行的關注，如Heisenberg群上的BV函數的理論被著名數學家(國際數學家大會45分鐘特邀報告人)L.Ambrosio等引用，H型群上的等距變換群理論被德國波恩大學的A.Lytchak引用；Carnot群上的水平凸函數理論被A.Bonfiglioli等的專著引用。基于我們在非線性偏微和幾何分析方面的研究工作，我們在國內外舉辦的十余次PDE和幾何分析國際會議上作邀請報告。本研究方向主持了國家自然基金項目4項、省自然基金項目2項、教育部博士點基金項目1項，教育部回國人員基金項目3項等。

3、本研究方向的作用和意義：非線性偏微分方程與幾何分析是當今世界數學發展的一個非常重要和活躍的分支，2002年8月在北京召開的國際數學家大會（ICM）的二十個一小時大會特邀報告就有五個在此方向或與之有密切聯系，僅偏微分方程的四十五分鐘報告有十二個就可以說明這一點。次黎曼幾何與控制論、調和分析、多復變函數等有密切的聯系，具有廣泛的應用背景。非線性偏微分方程和幾何分析不但自身理論方面有很多重要問題有待解決，而且與很多其它數學研究方向如微分幾何、拓撲學、泛函分析、復分析和數學物理等緊密聯系和相互促進，在幾乎所有的自然科學、社會科學、金融工程、管理科學和軍事工程等領域都有廣泛的應用。幾何分析主要用分析的工具解決幾何問題，是當今數學研究的熱點之一，具有廣泛的發展背景。

白志東，男，1943年11月出生于河北省樂亭縣。于1982年5月在中國科學技術大學數學系獲得博士學位。1984年9月出國留學，先后在美國匹茲堡大學和濱州州立大學統計系擔任研究員，美國Temple大學統計系擔任副教授、中華民國國立中山大學應用數學系和新加坡國立大學概率統計系擔任教授。于1990年3月被評為第三世界院士。2002年5月回國，于東北師范大學數學與統計學院擔任特聘教授。曾擔任《Journal of Multivariate Analysis》主編, 《Statistica Sinica》副主編，《Journal of statistical planning and inference》副主編；現擔任中國概率統計學會常務理事，《Sankya》副主編。

自1982年參加工作以來，一直從事概率統計中極限理論方面的研究。至今已發表學術論文160余篇，其中近120篇為SCI檢索論文，另有10多篇乃應邀為各學術專著所寫的章節。論文已被SCI引用近1000余次。研究領域包括：大維隨機矩陣的譜分析理論，分布函數的漸進展開，模型選擇，信號處理，M-估計，深度估計，臨床試驗中的序貫設計，算法中的應用概率等。主要貢獻如下：

a.白志東不等式的建立與經驗譜分布收斂速度的估計。給經驗譜分布收斂速度的估計開創了一種方法，并且對Wigner矩陣和大維樣本協方差矩陣之經驗譜分布給出了初步的收斂速度之估計。

b.隨機矩陣極端特征值的極限。解決了極端特征值的極限之確立關系到極限譜分布的可應用性等一系列重大理論與實用問題。c.園律的證明。“園律”是大維隨機矩陣譜分析理論中一個最著名的猜想。經十多年努力，給出了一個可靠證明。d.線性譜統計量的中心極限定理。理論結果是在四階矩一致可積（不假定同分布）的條件下獲得的。為大維隨機矩陣譜分析理論在數理統計，無線通訊等領域中的應用奠定了理論基礎。e.Edgeworth展開。首次提出了Partial Cramer條件的概念，并于在Ann.Statist.、JMVA及Sankya等雜志上發表的一系列文章中解決了這個問題。填補了沒有Cramer條件不能漸進展開的空白。

f.最大深度估計。這是近二十年來統計界最熱門的研究領域之一，它的漸進分布一直是統計界研究的重點問題，1999年與他人合作在美國最權威的統計雜志Ann.Statist.上發表文章，給出了維數任意時最大深度估計的漸進分布是一個具有線性偏差高斯過程的最小最大解。其結果與方法對其他相關估計也是有益的。美國的《數學評論》對該成果作了很高的評價。g.模型選擇。提出了廣泛信息準則(GIC)，給出了強相合的條件。

h.計算方法中的應用概率。2001年在《Electronic Journal of Probability》上發表的文章解決了多維立方體中隨機點列的最大點個數的方差表達式及其中心極限定理的問題。

【學習工作簡歷】

一、畢業學校：

1982年中國科學技術大學，博士

二、工作簡歷：

1.2002年3月至今東北師范大學數學系

2.1999年至今

新加坡國立大學概率與統計系教授 3.1997-1999

新加坡國立大學數學系高級研究員

4.1994-1997

中華民國（臺灣）國立中山大學應用數學系教授 5.1990-1994

美國Temple 大學副教授

6.1988-1990

美國 Penn洲立大學多元分析中心 Senior Research Associate 7.1984-1988

美國Pittsburgh大學多元分析中心 Visiting research associate 8.1982-1984

中國科學技術大學數學系講師, 副教授

【社會學術兼職】

吉林省特聘教授, 第三世界科學院院士, 美國數理統計研究所特別研究員, 國際統計協會會員, IMS 會員, 中國數學協會會員, 中國概率統計協會常務理事, ICSA 會員,曾任《Journal of the Multivariate Analysis》編委;《Journal of Statistical Planning and Inference》編委《;Statistica Sinica》副主編 << Mathematical Review>> 評論員 << Zentralblatt Fur Mathematik>> 評論員

【教學工作】

講授課程: 時間序列分析多元分析非參數統計非參及穩健性統計測度論及概率矩陣論及在統計中的應用點估計假設檢驗助步法及應用高等統計概率中的極限定理數學分析實分析特征函數統計導論分析概率論

【主要科研方向】

1.大維隨機矩陣的譜分析 2.秩集抽樣

3.m-估計和穩健估計 4.模型選擇 5.時間序列分析 6.urn模型及其在臨床試驗中的應用 7.概率的極限定理 8.概率算法

9.edgeworth展開

【主要科研項目】

1.1998年至2000 年新加坡國立大學, Exact Separation of the Support of Limiting Spectral Distribution of Large Dimensional Sample Covariance Matrices;2.1999年至2001年新加坡國立大學(與陳澤華)Statistical methods based on ranks: The generalized ranked set sampling and mode estimation using order statistics;3.2000年至2001年新加坡國立大學 Stochastic type limiting theorems in spectral analysis of random matrice;4.2000年至2003年新加坡國立大學(與Hu Feifang), Optimal Sequential Designs for Medical Studie;5.2003年1月至2005年12月國家自然科學基金《大維隨機陣線性譜統計量的極限性質》;6.2006年1月至2008年12月國家自然科學基金《大維隨機矩陣理論及其在無線電通訊中的應用》.

第二篇：數據統計分析方法

數據統計分析方法

排列圖：

排列圖是由兩個縱坐標，一個橫坐標，若干個按高低順序依次排列的長方形和一條累計百分比折線所組的，為尋找主要問題或主要原因所使用的圖。

排列圖有以下優點：直觀，明了－－全世界品質管理界通用用數據說明問題－－說服力強用途廣泛：品質管理 / 人員管理 / 治安管理排列圖的作圖步驟收集數據(某時間)作缺陷項目統計表繪制排列圖畫橫坐標(標出項目的等分刻度)畫左縱坐標(表示頻數)畫直方圖形(按每項的頻數畫)畫右縱坐標(表示累計百分比)定點表數。

因果圖何謂因果圖：

對于結果（特性）與原因（要因）間或所期望之效果（特性）與對策的關系，以箭頭連接，詳細分析原因或對策的一種圖形稱為因果圖。因果圖為日本品管權威學者石川馨博士于1952年所發明，故又稱為石川圖，又因其形狀似魚骨，故也可稱其為魚骨圖，或特性要因圖作因果圖的原則采取由原因到結果的格式通常從‘人，機，料，法，環’這五方面找原因‘4M1E’, Man, Machine, Material, Method, Environment通常分三個層次：主干線、支干線、分支線盡可能把所有的原因全部找出來列上對少數的主要原因標上特殊的標志寫上繪制的日期、作者、有關說明等作因果圖應注意的事項問題(結果)應單

一、具體，表述規范最后細分出來的因應是具體的，以便采取措施；在尋找和分析原因時，要集思廣益，力求準確和無遺漏可召開諸葛亮會，采用頭腦風暴法層次要清，因果關系不可顛倒原因歸類正確作因果圖應注意的事項畫法按從左至右的貫例執行－－規范化在作因果圖前，可先從排列圖中找出主要問題，然后針對主要問題，召集相關人員進行討論，力求盡可能找出產生問題的原因，通過分析，確立主要原因。因果圖在今后可不斷進行修改，逐漸完善，反復使用。

直方圖：

是通過對數據的加工整理，從而分析和掌握品質數據的分布狀況和估算工序不合格率的一種方法。直方圖的作法作直方圖的三大步驟作頻數表畫直方圖進行有關計算作直方圖的步驟(例3)1.搜集數據作直方圖的步驟計算極差(Range),上表中最大值Xmax=48;最小值Xmin=1;R＝Xmax-Xmin=48-1=47適當分組(k)在本例中，取k=10確定組距(h)組距用字母 h 表示：h=R/k=47/10=4.7, Y約等于5。確定各組界限－－組的邊界值單位取最小測量單位的一半。作直方圖的步驟本例第一組的下限為：第一組的上限值為下界限值加上組距第二組的下界值為上界限值，第一組的上界值加上組距就是第二組上界限值，照此類推，定出各組的邊界。編制頻數分布表

分層法

分層的目的是把雜亂無章和錯綜復雜的數據，按照不同的目的、性質、來源等加以分類整理，使之系統化、條理化，能更確切地反映數據所代表的客觀事實，便于查明產品質量波動的實質性原因和變化規律，以便抓住主要矛盾，找到主要影響因素，從而對癥下藥，采取相應的措施。

分層的原則是使同一層內的數據波動盡可能小、而層與層之間的差別盡可能大。

為了達到目的，通常按操作者、機器設備、材料、工藝方法、測量手段、環境條件和時間等標志對數據進行分層。

調查表

調查表也叫檢查表或核對表，它是一種為了便于搜集數據而使用簡單記號并予統計整理，并作進一步分析或作為核對、檢查之用而事先設計的一種表格或圖表

控制圖

控制圖是一種帶有控制界限的反映過程質量的記錄圖形，圖的縱軸代表産品質量特性值(或由質量特性值獲得的某種統計量)；橫軸代表按時間順序(自左至右)抽取的各個樣本號；圖內有中心線(記爲CL)、上控制界限(記爲UCL)和下控制界限(記爲LCL)三條線(見下圖)

第三篇：職業病數據統計分析報告

公烏素公司近年來職業病數據

統計分析報告

作者：白建兵日期：2013年11月

用品管理制度、個人防護用品發放管理制度、職業危害事件應急救援預案、職業衛生健康監護制度、職工聽力保護管理制度、職業衛生防治措施、職業衛生安全操作規程等相關制度。按照該企業制定的勞動防護用品管理辦法，定期為作業人員發放防塵口罩、防噪耳塞等職業衛生防護用品。

2004年來，隨著我公司企業改制和神華總部政策的實施，潛在職業危害越來越多，從業人員的健康面臨更大的威脅。為了更好地保障工人職業健康，促進我公司工業持續健康發展，在我公司全面開展職業病防治工作愈顯重要。

2008年，通過職業病危害專項整治調查，我公司存在職業病危害因素在煤炭生產的整個過程中都伴隨著生產性粉塵(包括煤塵、混合性粉塵、巖塵)、生產性毒物(包括三硝基甲苯、鉛、苯、砷化氫、汞及其化合物等)、有害物理因素(包括地溫與高溫、噪聲與振動、放射線等)、有毒有害氣體(包括沼氣、一氧化碳、二氧化碳、氧化氨、二氧化硫、硫化氫、氨、磷化物)、不良氣象條件(包括通風、采光、照明、氣溫、濕度、風速)、水質(包括礦區水源、工業用水)等職業危害因素，造成了部分作業人員患有不同程度的矽肺、煤工塵肺、職業中毒、中暑、放射性疾病、局部振動病、噪聲聾等職業病。噪聲、粉塵、甲醛、游離二氧化硅苯系物等。

在生產作業的整個過程中都伴隨著生產性粉塵(包括煤塵、混合性粉塵、巖塵)、生產性毒物(包括三硝基甲苯、鉛、苯、砷化氫、汞及其化合物等)、有害物理因素(包括地溫與高溫、噪聲與振動、放射線

85%的老員工都是采掘一線人員，塵肺疑是人員非常多,2013年6月底我公司與能源公司職防所對在崗員工進行了崗中體檢，新增的塵肺病人有10人，其中有8人是2004年破產重組以前就參加了煤礦井工工作的人員（重組改制人員），兩人是山西大同2004年招聘人員，現在的職業健康監護是我們的重中之重。

（二）接觸危害因素作業點監測情況

1989～2003年，我公司前身是海勃灣礦務局公烏素煤礦，因當時屬國有統配煤礦，各種原因導致職業病監測工作未重點開展。2008年，我公司重點抽取7個采掘單位進行了職業衛生監測，監測結果顯示：噪聲強度超標率達20%，粉塵濃度超標率達80%，一氧化碳和二氧化碳濃度均符合國家職業衛生標準；同時根據烏海市安監局的要求，又對全公司采區場進行了作業場所環境衛生監測，合格率達80%以上。

2009年，根據烏海市安監局的要求，對全公司采區進行了作業場所環境衛生監測，合格率達90%以上。

2010年，在抽取的3個單位監測結果顯示：地面作業場所絞車房、壓風機房、變電所，噪聲強度超標，井下粉塵濃度超標率達38%，一氧化碳和二氧化碳濃度均符合國家職業衛生標準；根據烏海市安監局和神華集團烏海能源公司的要求，我們能源公司職防所對全公司9個采掘單位進行了作業場所衛生監測，合格率90%。

2012年，我能源公司職防所對我公司所有單位進行了職業衛生監測，監測結果顯示：噪聲強度超標率達20%，粉塵濃度（1604工作面）超標率達80%，一氧化碳和二氧化碳濃度均符合國家職業衛生標準；同

儀共六臺，同時限制或淘汰危害勞動者健康的落后技術、工藝、設備和材料，積極開發、推廣和應用有利于職業病防治的新技術、新工藝、新材料、新設備，從根本上減少和消除職業病危害。

杜絕產生源頭

我公司除嚴格勞保用品的使用，嚴格防護措施的執行外，有關部門還定期組織人員深入井下和作業現場督查，重點整治井下防塵設施，進一步完善通風系統，狠抓井下質量標準化建設，有效降低了人體攝入粉塵量和有毒有害氣體量；定期組織職工體檢，做到早發現、早治療、早鑒定；嚴格落實有關津貼補助的發放，解決了職工的后顧之憂。

四、降低職業發病率的主要作法

1、對新礦工人和在崗的工人進行職業健康檢查。這樣，企業可以了解和掌握勞動者的健康狀況，及早發現職業禁忌證的人員和及早發現化學毒物對健康的損害，通過調換患有職業禁忌證的人員的工作崗位和治理工作場所存在的職業危害，避免發生職業危害事故。降低職業病發病率。通過我公司與能源公司職防所對其進行健康監護體檢，能提前查出職業禁異證由于措施得力，程序規范，有效的促進了隊伍的壯大和建設。

2、做好個人衛生防護工作

我公司為落實好國家頒布《職業病防治法》第二十條規定用人單位“必須采用有效的職業病防護設施，并為勞動者提供個人使用的職業病防護用品。為勞動者我們的員工個人提供的職業病防護用品必須符合防治職業病的要求；不符合要求的，不得使用。我公司堅持按照規

勞動合同中未告知的存在職業病危害的作業時，我公司并如實告知勞動者從事職業存在職業安全健康危害及防護措施，真正體現了誠實信用、公平合理的基本原則。同時我們在入井井口做了四塊職業健康宣傳牌板包括（公告欄告知、警示告知、培訓告知、職業病危害等）

公告欄告知

我公司在礦區內醒目位置設置公告欄，公布有關職業病防治的規章制度、操作規程、職業病危害事故應急救援措施和工作場所職業病危害因素檢測結果。”實施公告欄告知，可讓勞動者熟悉我公司制定的各項職業衛生管理制度、操作規程，了解工作場所職業病危害的真實情況，增加管理的透明度，調動起工人的積極性，配合企業做好職業病防治工作。這有利于避免因勞動者不了解職業病危害而盲目操作，導致受害。

警示告知

我公司并在井下對產生嚴重職業病危害的作業崗位（特別是井下巖巷噴漿、采煤工作面作業等地區）醒目位置，設置警示標識和中警示說明。并載明產生職業病危害的種類、后果、預防以及應急救治措施等內容。”、“對可能發生急性職業損傷的有毒、有害工作場所，設置報警裝置，特別是瓦斯積聚地區和回風巷都懸掛風速傳感器、瓦斯檢測儀、一氧化碳檢測儀等設備，并在職工不可進入的盲巷設置警示欄，防止職工誤入，出現事故。

培訓告知

通過職業衛生培訓，告知勞動者有關的職業衛生知識，讓勞動者

職業健康監護工作包括職業健康檢查，健康狀況分析和建立健康監護檔案等工作。職業健康檢查包括：上崗前、在崗期間、離崗時和應急健康檢查。

5、加強職業危害宣傳培訓

防治職業病關鍵在于預防。為此，我公司加大宣傳力度，深入開展《職業病防治法》宣傳，2013年在能源公司職防所的組織下在工業廣場做了大力宣傳，特請3m職業健康系列產品對員工進行職業病防治知識、相關法律法規更加了解。同時，通過向全礦員工公開監督電話、設立舉報箱等形式，接受員工的職業衛生咨詢和舉報監督。通過宣傳教育，讓員工了解煤礦生產的特點、職業病的危害和防治常識，增強了員工的基本防護技能和健康保護意識。

源頭防范

地面環境保護

公司嚴格遵守國家環境保護法律法規，持有合法有效的排污許可證。排出的礦井水經過處理后成為灌溉水源；矸石集中堆積，并投入巨資將矸石山綠化改造，防止因有風天氣將粉塵到處飛揚，為解決該問題，給地面職工創造良好環境，減少每天吸入肺部粉塵量，我公司

康體檢、監督監測工作難度大、阻力大。

3、對職業病防治工作重視不夠大，經費投入相對不足，我公司在職業衛生工作方面的協調合作積極性不夠，《職業病防治法》等法規執行不夠到位，執罰疲軟。

4、職業病防治工作人才隊伍薄弱，經驗相對不足，技術層次較低，應對繁重的職業病防治工作還有待提高技術和積累經驗。

5、要切實有效貫徹《職業病防治法》。建設高素質的職業病防治工作隊伍，加大力度，對我公司職業病危害嚴重的問題加強監督檢查，促使我公司嚴格按照《職業病防治法》做好職業病防治工作。

6、針對我公司目前職業病防治工作的現狀，要進行生產場所職業病危害因素監督自查，組織接觸有毒有害工人進行定期身體健康檢查，以確保職業病危害因素監測工作的進一步得到全面落實，工人身體健康進一步得到保障。

公烏素煤業公司職業健康監護辦公室

二〇一三年八月八日

第四篇：用統計分析數據說話

用統計分析數據說話

中國醫藥報

【日期】2007-01-06 【期次】4(總第3312期)【版次】8 【版名】交流

【欄目】<專題>= 【類別】藥品監督

【作者】李軍

【特刊】<周刊期次>=<周刊類別>=法治周刊

【正文】點擊查看：本版 PDF

河北省保定市食品藥品監管局法規處從2005年8月開始對行政處罰案件、不合格藥品、舉報案件和藥品從業人員健康體檢情況等進行統計和深入分析，找出問題，提出具體的解決辦法，為執法工作及領導決策提供依據。

■統計分析工作內容

認真進行數字統計。該局法規處把統計項目細化成案源、案件性質、類別、涉案藥品、器械、沒收物品、罰款金額等內容，詳細地反映出案件全貌。除行政處罰案件實行月報告統計外，其他統計按進行。為保證統計數據的準確性和真實性，他們要求各縣局把數據統計作為一項重要任務落實到人。為防止數據的失真失實，法規處還將統計工作與案件檢查結合起來，通過案件檢查驗證統計數據，防止統計數據做假。

綜合進行數據分析。分析是對統計結果的進一步深化，是深入挖掘、揭示一般性規律的過程。通過分析比較，從中發現經驗和不足。如案件月統計分析，法規處做到“三看”，一是縱向看：看案件來源，了解日常監督檢查力度和監督網絡發揮作用情況；看案件類別，了解違法藥品種類和藥械監督檢查范圍；看案件性質，了解違法行為性質情節和社會危害程度；看案件數量，了解藥械市場監管情況和行政相對人違法情況。二是橫向看：將日常監督檢查和市場抽驗發現的案件與舉報和轉辦案件相比較，看日常監管是否到位；將藥品、醫療器械常見案件與藥包材、醫院制劑等案件相比較，看監管是否存在盲區。第三是交叉看：比較簡易程序項目和違法所得、違法物品項目，看是否存在違反法定程序問題；比較一般程序、聽證程序項目與罰沒金額項目，看是否存在沒有履行重大案件審查備案程序問題；比較貨值金額（違法所得）項目與罰沒金額項目，看是否存在濫用自由裁量權的問題；比較山區縣與山區縣之間，山區縣與平原縣之間，平原縣與平原縣之間的案件查處情況，看地域特點及藥械市場規范程度。

提出改進措施。在提出改進措施時，要注重針對性和可操作性。如法規處在對市區藥品從業人員參加健康體檢的情況進行統計分析后，發現存在不體檢或冒名體檢等許多不規范現象，針對這種狀況，該處起草制定了全市《醫藥行業工作人員健康體檢管理辦法》，在充分征求相關部門意見的基礎上正式印發并組織實施，使健康體檢實現了規范化管理。

■開展統計分析的成效

開展統計分析后，該局的執法質量得到進一步提升。通過行政處罰案件月統計分析，對程序違法、重罰款輕整改、監管不到位等8個方面的問題進行了糾正，至今該局已連續10個月沒有出現程序違法案件。針對處罰隨意性較大的問題，制定了《行政處罰自由裁量實施辦法》。針對統計中發現的問題，開展相關的法律法規培訓等。針對統計分析中發現的藥品送檢報告中存在著單位名稱書寫不規范、送檢藥品中化學藥數量偏低等問題，提出了建立假劣藥品展室，加大對假劣藥品鑒別培訓力度，加大對安國中藥材專業市場的監管力度等建議，還將不合格藥品抽驗情況每月在系統內進行公布，實現信息共享。對舉報案件進行統計，分析群眾舉報的內容、時間和所提的要求以及查處情況等，找出舉報動機、接報存在的問題等，提出了具體應對措施：對有明確地點、證據充分的舉報及時組織力量進行查處；對線索不明確，不能提供相關證據的舉報做耐心細致地解釋與了解；對不屬于本局管轄的舉報及時移交；由稽查處牽頭組建舉報案件快速反應中心。這些措施，有效提升了執法質量。

第五篇：大數據的統計分析方法

統計分析方法有哪幾種？下面天互數據將詳細闡述，并介紹一些常用的統計分析軟件。

一、指標對比分析法指標對比分析法

統計分析的八種方法

一、指標對比分析法指標對比分析法，又稱比較分析法，是統計分析中最常用的方法。是通過有關的指標對比來反映事物數量上差異和變化的方法,有比較才能鑒別。

指標分析對比分析方法可分為靜態比較和動態比較分析。靜態比較是同一時間條件下不同總體指標比較，如不同部門、不同地區、不同國家的比較，也叫橫向比較；動態比較是同一總體條件不同時期指標數值的比較，也叫縱向比較。

二、分組分析法指標對比分析法

分組分析法指標對比分析法對比，但組成統計總體的各單位具有多種特征，這就使得在同一總體范圍內的各單位之間產生了許多差別，統計分析不僅要對總體數量特征和數量關系進行分析，還要深入總體的內部進行分組分析。分組分析法就是根據統計分析的目的要求，把所研究的總體按照一個或者幾個標志劃分為若干個部分，加以整理，進行觀察、分析，以揭示其內在的聯系和規律性。

統計分組法的關鍵問題在于正確選擇分組標值和劃分各組界限。

三、時間數列及動態分析法

時間數列。是將同一指標在時間上變化和發展的一系列數值，按時間先后順序排列，就形成時間數列，又稱動態數列。它能反映社會經濟現象的發展變動情況，通過時間數列的編制和分析，可以找出動態變化規律，為預測未來的發展趨勢提供依據。時間數列可分為絕對數時間數列、相對數時間數列、平均數時間數列。

時間數列速度指標。根據絕對數時間數列可以計算的速度指標：有發展速度、增長速度、平均發展速度、平均增長速度。

動態分析法。在統計分析中，如果只有孤立的一個時期指標值，是很難作出判斷的。如果編制了時間數列，就可以進行動態分析，反映其發展水平和速度的變化規律。

四、指數分析法

指數是指反映社會經濟現象變動情況的相對數。有廣義和狹義之分。根據指數所研究的范圍不同可以有個體指數、類指數與總指數之分。

指數的作用：一是可以綜合反映復雜的社會經濟現象的總體數量變動的方向和程度；二是可以分析某種社會經濟現象的總變動受各因素變動影響的程度，這是一種因素分析法。操作方法是：通過指數體系中的數量關系，假定其他因素不變，來觀察某一因素的變動對總變動的影響。

用指數進行因素分析。因素分析就是將研究對象分解為各個因素，把研究對象的總體看成是各因素變動共同的結果，通過對各個因素的分析，對研究對象總變動中各項因素的影響程度進行測定。因素分析按其所研究的對象的統計指標不同可分為對總量指標的變動的因素分析，對平均指標變動的因素分析。

五、平衡分析法

平衡分析是研究社會經濟現象數量變化對等關系的一種方法。它把對立統一的雙方按其構成要素一一排列起來，給人以整體的概念，以便于全局來觀察它們之間的平衡關系。平衡關系廣泛存在于經濟生活中，大至全國宏觀經濟運行，小至個人經濟收支。平衡分析的作用：一是從數量對等關系上反映社會經濟現象的平衡狀況，分析各種比例關系相適應狀況；二是揭示不平衡的因素和發展潛力；三是利用平衡關系可以從各項已知指標中推算未知的個別指標。

六、綜合評價分析

社會經濟分析現象往往是錯綜復雜的，社會經濟運行狀況是多種因素綜合作用的結果，而且各個因素的變動方向和變動程度是不同的。如對宏觀經濟運行的評價，涉及生活、分配、流通、消費各個方面；對企業經濟效益的評價，涉及人、財、物合理利用和市場銷售狀況。如果只用單一指標，就難以作出恰當的評價。

進行綜合評價包括四個步驟：

1.確定評價指標體系，這是綜合評價的基礎和依據。要注意指標體系的全面性和系統性。

2.搜集數據，并對不同計量單位的指標數值進行同度量處理。可采用相對化處理、函數化處理、標準化處理等方法。

3.確定各指標的權數，以保證評價的科學性。根據各個指標所處的地位和對總體影響程度不同，需要對不同指標賦予不同的權數。

4.對指標進行匯總，計算綜合分值，并據此作出綜合評價。

七、景氣分析

經濟波動是客觀存在的，是任何國家都難以完全避免的。如何避免大的經濟波動，保持經濟的穩定發展，一直是各國政府和經濟之專家在宏觀調控和決策中面臨的重要課題，景氣分析正是適應這一要求而產生和發展的。景氣分析是一種綜合評價分析，可分為宏觀經濟景氣分析和企業景氣調查分析。

宏觀經濟景氣分析。是國家統計局20世紀80年代后期開始著手建立監測指標體系和評價方法，經過十多年時間和不斷完善，已形成制度，定期提供景氣分析報告，對宏觀經濟運行狀態起到晴雨表和報警器的作用，便于國務院和有關部門及時采取宏觀調控措施。以經常性的小調整，防止經濟的大起大落。

企業景氣調查分析。是全國的大中型各類企業中，采取抽樣調查的方法，通過問卷的形式，讓企業負責人回答有關情況判斷和預期。內容分為兩類：一是對宏觀經濟總體的判斷和預期；一是對企業經營狀況的判斷和預期，如產品訂單、原材料購進、價格、存貨、就業、市場需求、固定資產投資等。

八、預測分析

宏觀經濟決策和微觀經濟決策，不僅需要了解經濟運行中已經發生了的實際情況，而且更需要預見未來將發生的情況。根據已知的過去和現在推測未來，就是預測分析。

統計預測屬于定量預測，是以數據分析為主，在預測中結合定性分析。統計預測的方法大致可分為兩類：一類是主要根據指標時間數列自身變化與時間的依存關系進行預測，屬于時間數列分析；另一類是根據指標之間相互影響的因果關系進行預測，屬于回歸分析。

預測分析的方法有回歸分析法、滑動平均法、指數平滑法、周期（季節）變化分析和隨機變化分析等。比較復雜的預測分析需要建立計量經濟模型，求解模型中的參數又有許多方法。

久久99精品久久久久久琪琪,久久人人爽人人爽人人片亞洲,熟妇人妻无码中文字幕,亚洲精品无码久久久久久久

高維數據統計分析

第一篇：高維數據統計分析

第二篇：數據統計分析方法

第三篇：職業病數據統計分析報告

第四篇：用統計分析數據說話

第五篇：大數據的統計分析方法

相關范文推薦

飯店月度經營數據統計分析報告

2017年第二季度指標數據統計分析2

基層法律服務工作數據統計分析報告

分析報告、統計分析和數據挖掘的區別（精選5篇）

2010年全省學生體質與健康調研及數據統計分析

2011年河南省信陽市房地產市場廣告數據統計分析報告

高學生上網情況問卷調查數據分析[范文模版]

中國旅游統計分析