第一篇:論語言科學與語言技術
論語言科學與語言技術
一、“語言科技”新思維的提出
雖然計算機設計的初衷是緣于數值計算,但是英國數學家圖靈(a.m.turing)在《機器能思維嗎?》(1950)一文中已經預見到計算機和自然語言將結下不解之緣,并且提出檢驗計算機智能的最好方法就是對語言信息的處理能力。1977年,費根鮑姆(feigeaum)提出知識
工程,計算機信息處理出現了從“數據世界”向“知識世界”的轉移趨勢。知識世界的載體是語言符號系統,語言信息處理的需求促使語言研究過程和語言研究成果的技術化趨勢日益明顯,當代語言學已凸顯出“語言科學”與“語言技術”的二分互補格局,由此我在《南京師范大學語言科技系建設發展規劃》(2001年2月)中提出“語言科技”的新思維。“語言科學”主要指基礎性的描寫語言學和理論語言學。“語言技術”主要指面向信息處理的應用語言學或計算語言學,其研究任務可劃分為“文本處理技術”和“語言模擬技術”。簡而言之,語言文本處理技術是通過編輯和編程,將印刷文本轉化為可供計算機使用的電子文本的技術。語言系統模擬(simulation)或者語言能力仿真(emulation)技術是通過算法和編程,將自然語言的理解和生成能力輸入計算機的技術。獲得語言能力的計算機可以實現“人—機對話”而成為名實相符的“電腦”。為研制智能機服務的“語言系統模擬”,可比喻為“語言基因圖譜分析工程”和“語言能力移植工程”。強調語言研究的技術化,并非忽視傳統語言學研究存在技術性的一面,例如實驗語音學和方言語音調查等。之所以以往未能突出語言研究的技術化,其原因在于——除語音研究可借助聲學技術設備以外——語言研究的絕大多數領域還一直沒有相應的實驗性技術設備。
雖然當代語言學家不可能也不必要都轉向計算語言學研究,但具有一定的語言信息處理意識卻非常必要。早在1964年11月,美國科學院語言自動處理咨詢委員會就在《語言與機器》的報告中明確指出:機器翻譯遇到了難以克服的semanticbarrier(義障)。然而這一警告,除了致使機器翻譯研究熱的暫時消退以外,并沒有引起語言學界的足夠重視。1982年,日本制訂了一個為期10年面向ai(人工智能)的“第五代計算機”即智能機的研制計劃,其中包括自然語言處理裝置。1992年結束時,只部分達到了預定目標。隨后又公布了另一個為期10年的“真實世界計算機(rwc)計劃”即“新信息處理技術計劃”。(許萬增1996,p.61-62)據說,90年代后期日本不得不宣布暫停研制,其根本原因就在于未能穿過語言研究的“瓶頸”。自然語言處理裝置的任務無法實現,計算機談何“真實世界”或“人工智能”。時至今日,這一“義障”仍然沒有跨越。在《新世紀將對人類產生重大影響的十大科技趨勢》(新華社北京2000年12月30日電)的報道中,列出21世紀的“認知神經科學領域”和“信息技術領域”,并分別提出來“探索意識、思維活動的本質”和“計算機向智能化方向發展”的任務,然而沒有語言科技領域的合作——關鍵是認知語義結構網絡研究的根本性突破——則不可能實現。
無論從手段還是就目標,對準自然語言處理的當代語言學研究,其性質都應界定為“語言科技”。“語言科技”的內涵是以理論研究為指導,以描寫研究為基礎,以應用研究為樞紐,促使語言研究向計算機應用、數學、認知科學和現代教育技術領域延伸,溝通文理工相關學科以實現語言研究過程及其成果的技術化;“語言科技”的外延表現為語言工程科技、語言教育科技和語言研究科技。語言學和計算機科學等學科相結合的“語言工程科技”,研究領域是“人—機對話”,其目標主要是自然語言能力的模擬。語言學與現代教育技術相結合的“語言教育科技”,研究領域是“人—人對話”,其主要目標是實現語言教育的多媒體和網絡化。“語言研究科技”是將語言研究活動與計算機工具相結合,其主要目標是實現語言學自身的計算機化,包括語料庫、詞庫和句庫的研制,語言研究的分析性、統計性、比較性和實驗性軟件的開發等。這一新思維既突出了當代科技發展所要求的“語言學的技術化”,又體現了以語言學為本而溝通文理工相關學科的研究旨趣。
二、計算語言學的界定要突出技術性
20世紀50年代以后,在理論方法交叉滲透而形成諸多邊緣語言學的同時,語言學與計算機結合的趨勢開始出現。1954年,在美國喬治敦大學所進行的世界上首次機器翻譯試驗,標志著計算機科學與語言學的結合已經起步。在這一研究領域,立足于不同的學科視角或知識結構,先后出現了一系列名稱術語,如“語言工程”、“語言工程學”、“自然語言的計算機處理”(工科視角)、“語言信息處理”(信息學視角)、“數理語言學”(數學視角)等等。20世紀60年代以后,計算機和語言學的結合逐步深入到語言學的各個領域,形成了包括計算語音學、計算詞匯學、計算語法學、計算語義學等分支學科在內的計算語言學(computationallinguistics)。其中“計算語音學”等名詞,雖然計算語言學界沒人提過,因為已經存在著“言語識別”、“言語合成”等計算機應用專業術語,但是從“語言工程學”到“計算語言學”的術語演變中,透露出“語言學立場”在這門交叉學科中的日益強化。雖然目前的計算機運算速度已經
可以滿足語言信息處理的技術要求,但是之所以“人—機對話”尚未實現,其“瓶頸”就在于現有的語言研究成果無法滿足計算機處理的要求。歸根結底,語言信息處理的最終目標就是“計算機模擬語言能力工程”或“語言能力移植計算機工程”。探索語言能力的性質和描寫語言系統的結構,這些艱巨性工作還得由語言學家先來完成。語言信息處理或計算語言學務必以語言學為本而以計算機為用。語言學家必須具備“數字化”意識,了解計算機需要怎樣的語言描寫成果,然后才可能將研究目標對準語言工程。
迄今為止,正如許多發展中學科一樣,“計算語言學”的定義尚無一致認定,歸納起來蓋有四種觀點(侯敏1999,p.2—p.6):
第一種,計算語言學是以計算機為工具研究語言學。侯敏認為,任何一個學科在使用工具方面都是自由的,使用不同工具研究一個學科會帶來不同特點,但不因為使用了新工具就產生了新學科。雖然并不排除新工具的使用沒有導致新學科的產生,但同樣不能否認工具的變革有可能帶來學科體系的革命,以致于產生新的分支或交叉學科。現代自然科學之所以能夠建立,無疑得益于望遠鏡和顯微鏡的應用,前者打開了人類認知的宏觀世界之門,后者打開了人類認知的微觀世界之門。望遠鏡和顯微鏡帶來的不僅僅是“這一個工具”,而是人類認知方式的巨大變革,從而引起了天文學、生物學等自然科學的一系列革命,產生了一系列新學科。因此,問題在于如何使用新的工具或新認知方式。如果僅僅利用計算機做語言研究的統計工具,也許不會產生新的分支學科,但是利用計算機作為語音分析和合成的工具,則形成了計算語音學。
第二種,計算語言學是把語言學成果應用于計算機。侯敏認為,計算機的應用領域幾乎沒有限度,什么學科的成果都可以在計算機上應用,因此在計算機上應用語言學的研究成果不足以建立新學科。問題不在于在什么學科的成果能在計算機上應用,而在于在計算機上所應用的成果的性質。與其他學科研究對象的性質迥然不同,語言學科的研究對象——語言——是人類最重要的認知符號系統和知識載體,因此面向信息處理的語言成果應用于計算機足以建立新的學科。以往的語言學研究是面向人際交流,而計算語言學研究是面向人機交流,兩者具有截然不同的性質。好范文版權所有
第三種,計算語言學是研究語言中的可計算問題。侯敏認為,雖然利用可計算理論研究語言符號是建立了一個新學科,但是這種說法偏于保守,沒有把計算語言學推進語言學發展的作用充分體現出來。問題在于面向信息處理的計算語言學研究,其顯著特點就是語言的可計算性。“推進語言學發展的作用”這不是計算語言學的定義,強調“研究語言中的可計算問題”未必保守,反而突出了計算語言學的顯著特點。
第四種,計算語言學是建立基于計算機科學理論的語言學理論。侯敏認為,把計算機科學的基本思想和方法引進語言學領域,不但可以產生許多應用性課題,而且能夠促使研究者從新的角度觀察語言學,建立與傳統語言學不同的理論。因此計算語言學是一種基于計算機科學理論所建立的語言學理論。問題在于:一方面計算語言學需要理論但本質上不是一門理論科學,同時并非所有的計算語言學家都樂意或適合從事理論研究,另一方面計算語言學的應用性質決定了研究成果的技術性特征,而絕大多數人可能更適合于——實際上也更需要——語言信息處理的技術性研究。
第一種和第二種是歐洲流行的廣義定義,主張計算語言學是計算機和語言學的交叉,第三種和第四種是盛行于美國的狹義定義,主張計算語言學是計算機科學和語言學的交叉。也就是說,前者僅僅把計算機當成語言學研究中的一種新工具應用,而后者強調計算機學科的要求和理論對語言學的影響。陳小荷(2001)認為,計算語言學就是以計算機為手段來研究自然語言,較嚴格的定義是“通過建立形式化的計算模型來處理自然語言的一門科學”。要建立形式化的計算模型來處理自然語言,首先要完成適合于計算機使用的自然語言系統的描寫。這一面向“人—機對話”的機用語言系統,與以往面向“人—人對話”的日常語法系統不同。因此機用語言系統的描寫應當納入計算語言學的研究范圍,即完成了“機用語言系統”以后,才能“建立形式化的計算模型”使計算機獲得自然語言能力。綜上所論,計算語言學可以定義為——利用計算機作為工具研究語言、研究機用自然語言系統、研究語言系統或語言能力的計算性,同時建構基于計算機應用、數學模型、認知科學等相關學科基礎之上的語言理論的新學科。姑且圖示如下:
工具性:利用計算機研究語言
計算語言學描寫性:研究機用自然語言系統
技術性:研究語言系統的計算性
理論性:建構新的語言學理論
雖然計算語言學的關鍵任務是研究人機之間的語言交際問題,即“如何教計算機學會說話”。但是從本質上來說,研究語言系統或語言能力的可計算性和利用計算機工具來研究語言是相通的,只是前者探索的是適合于人-機對話的語言能力,而后者討論的是適合于人-人對話的語言規則。
依據目前的語言研究成果和信息處理技術路線,計算語言學包括應用基礎研究、應用研究和理論研究三個方面。(陳小荷2001)應用基礎研究指語言處理的基本技術研究。現階段的主要進展是:1.自動分詞技術:這是計算機理解自然語言的第一步。目前漢語書面語自動分詞的正確率達到95以上。2.詞語特征標注技術:現階段的詞語特征包括詞性和義項,這是句法結構理解的基礎。兩種標注可采用相似的計算模型但后者要復雜得多,目前尚無大規模的實驗結果報道。3.語句分析技術:句法結構和語義結構是自然語言理解的關鍵技術,目前分析真實文本句子的正確率僅在40左右。4.語料庫建設技術:語料庫是為特定目的而收集的言語作品集,包括語料處理和檢索。研究語句分析需要存放句法分析樹的“樹庫”,但目前的漢語語料庫加工程度較低,所建立的樹庫很少且規模不大。5.語言知識庫建設技術:語言知識包括詞匯知識、語法知識和語義知識等,事實性和規則性知識分別放在機讀詞典和規則庫中。語句分析技術之所以不能取得突破,主要原因就是目前尚無適合于中文信息處理的大規模語言知識庫。
應用研究指自然語言處理的應用工具的研制。現階段的熱點主要有:1.機器翻譯工具:半個多世紀過去了,機器翻譯的質量仍然令人失望。現在通行的是有限范圍翻譯和機器輔助翻譯。2.自動文摘工具:微軟公司的詞處理器word有用于英語的文摘功能,哈工大研制的hit-863i型中文自動文摘系統可按用戶設定的比例壓縮原文。3.自動校對工具:現在存在的主要問題是誤報率過高,并且深層錯誤難以發現。4.信息檢索工具:有主題詞檢索、全文檢索兩種。前者需要預先有一個主題詞表;后者任意字符串都可成為檢索對象。另外從語料庫中自動獲取各種知識的“信息抽取”在線工具的研究剛剛興起。5.言語識別和言語合成工具:言語識別(或語音識別)可分為詞語識別(計算機口語命令)、有限詞匯識別(電話訂票)和無限詞匯識別(將成段說話轉為文字)。言語合成(或語音合成)指用計算機將書面語轉換為口語即“文語轉換”,存在的問題主要是斷詞不當且語調刻板,仿真度亟待提高。
然而,如果以為應用性特征明顯的計算語言學僅僅是技術,則未免失之于偏頗。計算語言學有著相應的理論研究,大致包括人工智能理論(含計算模型理論。目前的人工智能研究,主要還是集中在人工體能、人工技能。在語言能力移植電腦過程未取得實質性進展以前,還談不上真正的人工智能)和語言學理論兩個方面。例如計算機如何或是否可以模擬人腦和語言能力,如何尋找合適的語言計算模型等,就是計算語言學家特別關心的理論問題。除此之外,還有對自然語言本質屬性的重新認定、面向信息處理的機用語法學理論、語言系統與數學模型的關系、語言結構和數理邏輯的關系、語言符號的數字化可能性及其局限性、語言的異質性和受限性或語域理論、元語言理論和研究方法等一系列問題。總體而言,一方面,由于牽涉的學科太多,計算語言學的理論研究還相當薄弱,另一方面,與科技發展息息相關的計算語言學不容過多地沉醉于理論探索。計算語言學的強大發展動力植根于鮮明的應用性,必須通過實踐推動理論探索。
三、語言系統的計算機模式化要求
從語言學家的立場出發,語言系統的計算機模式化要求,就是要了解計算機需要怎樣的語言描寫成果,傳統語言學(此處指非面向語言信息處理的語言學)的研究是經驗描寫解釋型,而計算語言學的研究是實驗操作技術型,自然語言系統要能進行操作技術化處理,首先必須實現語言的計算機模式化。馮志偉(1999,p.215)認為自然語言處理一般應經過三個過程:1.形式化,將所研究的自然語言問題以一定的數學形式表示出來;2.算法化,把自然語言的數學形式轉換為算法形式;3.程序化,根據自然語言的算法形式編寫計算機程序。侯敏(1999,p.30)認為語言系統的形式化或計算機模式化必須滿足三個要求:1.高度抽象化,即從語言現象中抽象出一般規則;2.元語言的形式化,即采取形式邏輯、數學公式、程序語言等形式語言作為元語言;3.運用過程的嚴密化,即運用過程必須具有數學與邏輯的嚴密性。
袁毓林(1993)認為形式語言至少具有三個特點:基本單元的明確性、基本運算和基本關系的明確性、運算優先級別的明確性,但是自然語言在這三方面皆不明確。具體而言,1.語法范疇的邊界不明,例如語素、詞和詞組之間、詞類之間的界限不明;2.結構關系難以定義,通常所說的結構關系,如主謂、動賓等往往很難明確界定;3.層次關系不外顯,人們通常根據語感和語境等來識別結構層次。侯敏(1999,p.36—40)不贊同這種分析,針鋒相對地提出:1.可以根據實際需要或應用目的來確立詞項或劃分詞類;2.結構關系分析需要深入到語義平面;3.形式語法已經給出了體現層次的結構樹,在分析歧義結構中可加入語義限制,至于有些連人都解決不了的層次歧義結構也不必要求計算機解決。侯敏的觀點是“理論追求的是完美,工程追求的是適用”,避開理論困難而采取工程方法,可以建立一個語言分析的近似模型。
所謂“語法范疇的邊界不明”,主要是因為這些“范疇”的設置從某種程度上肢解了語言事實;所謂“結構關系難以定義”,主要是因為這些“結構”難以反映語言的本質結構;而所謂“層次關系不外顯”,恰恰是語言結構的特點之一。這些探索和爭論,實際上反映了三個根本性的問題:1.漢語結構語法學中長期存在的一些困擾,不僅是套用西方語法學框架框范漢語事實所產生的齟齬,而且也是語形語法學自身無法克服的固有問題。幾千年來的西方語形語法學研究之所以能夠存在,就是因為人腦在發育過程中逐步自建構了與認知能力協同發展的語義結構網絡,為語形語法規則提供了語義選擇清單與路徑。雖然這些語形語法規則在人際交流中可以使用,但是在語言能力的計算機移植中卻頓時陷入困境,因為計算機不存在語義網絡結構的自建構功能,缺少語義激活路徑。根據語形語法規則,計算機造出來的符合自然語句標準的概率極低,多為與對象世界不存在一致性的隨機詞語串。2.計算語言學所要求的自然語言的形式化,是基于計算機運算模式的語言研究成果。移植進計算機的“定域受限語言系統”和自然語言系統并不完全相等,嚴格說來,只是一種接近自然語言的計算機模式化符號系統。3.計算語言學的理論和方法,必須建立在語言的本質共性語義性和和計算機數字化運算模式的基礎之上。如果對人類語言的認知語義性沒有足夠的認識,依然安居于語形語法窠臼而遲遲未能建構語義結構網絡,語言信息處理的目標則不可能實現。
中國信息科學界有一種看法,計算機對于形態結構的印歐語言處理具有良好的支撐能力,而對中文信息處理則不然(陳力為2000)。之所以計算機對印歐語文信息處理具有良好的支撐能力,是因為印歐語文結構類型便于建立計算機處理模型。從歷史上來看,谷登堡印刷術和打字機鍵盤都是基于字母的簡約性而發明的。一方面,字母系統的符號簡約性便于進行數據化處理,漢字符號的繁復性難以進行數據化處理;另一方面,印歐語的形態變化為形式化提供了識別標志,而漢語的孤立結構卻沒有明顯的標志。依據現在的計算機處理模型,漢字的繁復性和漢語的非形態性必然導致中文信息處理中存在一些特殊問題:1.中文信息處理的第一個“瓶頸”。漢語的常用漢字數量繁多,漢字需要解決鍵盤輸入、內部代碼、漢字識別和顯示、程序語言的數據類型、數據庫的排序和檢索等一系列問題。2.中文信息處理的第二個“瓶頸”。印歐書面語采取詞分寫形式,而漢語書面語采取單字連寫形式。由于采用西方詞法學框架,因此必須研制自動分詞技術。假定考慮以“字”和“字義塊”等作為漢語的結構單位,自動分詞技術將相應改為“字義塊”切分技術。3.印歐語的同音詞較少,而漢語的同音字較多,同義詞和量詞也十分豐富,這些都給中文信息處理帶來必須解決的難題。4.印歐語可以借助實詞的形態變化即在詞法層面上進行處理,漢語只有在句法和語義層面上進行處理,需要把語序和虛字的語法信息歸納出來再讓計算機掌握。5.印歐語的句子結構是以動詞性詞語為核心的“主—謂”結構,而漢語的句子結構是以體詞性詞語為核心的“話題—說明”結構。印歐語的句子結構劃一而句界分明,漢語的句子結構多樣、成分缺省并且前后句義纏綿。
如果說語言系統是一座“冰山”,那么以上這些語言信息處理中遇到的難題還都是語言系統浮在海水上面的那一小部分,真正的障礙是隱沒在海水下面的那一大部分。無論哪一種結構類型的自然語言系統的計算機模擬,包括形態語言,遲早會無可避免地碰撞上堅硬實在而又難以捉摸的“語義結構”。語言研究需要敢于在冰海下持續探索“語義結構”的潛水員。從自然語言系統來說,要讓計算機理解語言通常認為必須使電腦能夠解決三個問題:1.消除自然語言的一詞多義;2.揭示自然語言的潛在意義;3.掌握自然語言的聯想推理。這些問題都離不開語義分析,而語義分析技術尚處于探索階段。(侯敏1999,p.247)對于第一個問題,一詞多義可給出不同義項的清單。對于第二個問題,給出每一義項的顯性和潛性語義特征清單。對于第三個問題,給出義項或義場之間的語義關聯模式。由此可見,必須在以往的經驗語感法和先驗演繹法基礎上,引進實驗歸納法和結構優化法,消除語義“泥潭”情結,潛心于冰海中的語義“冰山”,才能逐步建構造語義結構網絡。
就世界各種語言來說,語言的計算機理解的深層次難點可能還在于:1.至今尚未揭示出人類理解語言的機制,計算機只能局部模擬自然語言理解的某些簡單過程;2.至今尚未完成人類理解語言所憑借的知識系統,建立人類進行語言表達的完整理論,計算機尚無從掌握人類語言的知識系統以及語言表達機制;3.至今尚未對人類語言所兼具的規則性和離散性、精確性和模糊性做出定量和定性的系統分析,計算機尚無從掌握語言系統的復雜性和語言使用的隨機性。(傅永和1999,p.238—239)既然語言的理解和表達是一個以知識系統為基礎的綜合性行為,因此語言系統的計算機模擬必須進行跨學科的研究,特別需要語言學、計算機科學、數學和認知科學以及百科知識學者的合作。與側重于面對自然人語言學習的語形語法學不同,如果面向語言信息處理,那么就需要以計算機智能模式來重新確定語言學的理論基礎、研究重點和研究方法。
面向自然語言處理的計算語言學理論基礎,目前主要有基于語言規則性的理性主義理論(即先驗主義)和基于語言隨機性的經驗主義理論。依據理性主義的語言學理論主要有:短語結構語法(g)、擴充轉移網絡(atn)、配價語法(vg)、格語法(cg)、范疇語法(cg)、概念從屬理論(cd)、多叉多標記樹形圖分析法(mmt)、詞匯功能語法(lfg)和蒙塔古語法(mg)等。這些理論和方法,因為從“理性”出發,因此不可能反映以感受性為基礎的自然語言的真實面貌,其缺失已經日益明顯。為了克服理性主義理論的不足,采取經驗主義理論處理大規模真實文本的語料庫語言學應運而生。在收集語言資源或建立語料庫的基礎上,運用統計方法進行語言信息處理,語言交際過程的隨機性由此得到關注。面對傳統語形語法學對自然語言過程的不相適應和語義研究的復雜性,甚至有人嘗試撇開語言學家的語言研究,以借助語料庫逐步實現自然語言系統模擬。雖然借助語料庫可以解決語言信息處理的一些問題,但是僅僅依賴語料庫實現自然語言系統模擬注定此路不通。因為自然語言不是一個語料倉庫,而是一個語義和語形復合性結構系統。無論是理性主義還是經驗主義,都必須意識到:語言信息處理中所處理的是定域受限語言。這一研究的理論基礎既不應是純粹基于語言規則性的理性主義,也不應是完全依賴語言隨機性的經驗主義,而應是突出語言受限性的實驗主義。世界語言學的發展經歷了從經驗科學到先驗科學的漫長過程,計算機的發明必將促使當代語言學成為一門實驗科學。強調計算語言學的實驗主義,并非一概否定理性主義和經驗主義,而是要在實驗主義的基礎上運用理性和經驗的理論方法。
自然語言處理的語言理論,目前主要有基于語形的語言理解系統和基于語義的語言理解系統。前者是以語形語法研究的成果為出發點,從句法形式入手;后者是以語義研究的成果為出發點,從語義關系入手。兩種理解系統在文本輸入、預處理和自動分詞等早期環節上基本相同,不同的是基于語形的理解系統先進行詞法和句法分析,后進行語義和語用分析,基于語義的理解系統先進行語義分析和語義結構生成,后進行目標語的形式組合。生成語義學認為句子的句法特點取決于語義,語義部分才具有生成能力。認知語義學把意義看作一個植根于知識網絡和信仰系統中的認知結構,理解一個語言形式的意義必須激發相關認知領域中的其他認知結構。既然語形結構只是語義結構的表層投影,既然基于語義的理解系統才符合語言的生成機制,既然語義處理才是語言信息處理的關鍵,那么只有基于語義的理解系統才能滿足計算機對自然語言的理解和生成。
李葆嘉:論語言科學與語言技術(下)
四、人腦語言和電腦語言的性質異同
根據與“人腦語言學”的對應關系,計算語言學也可以稱之為“電腦語言學”。從人腦角度出發,電腦語言學的研究是將人腦語言系統移植電腦工具的電子工程;從電腦角度出發,電腦語言學是電腦程序模擬人腦語言能力的仿生工程。
不管是系統移植還是能力仿生,首先必須認識到人腦和電腦的異同。1.構造機制的不同:人腦是生物神經系統,具有生物認知機制,而電腦是電子計算系統,具有電子運算程序。2.伴隨情感的有無:人腦具有驅動感覺、思維和表達進行的情感性,而電腦只具有執行程序運算的機械性。3.經驗基礎的有無:人腦具有以感受性為特征的經驗基礎以及知識系統,而電腦即使配備了一定的知識背景,也不可能具有人腦一樣的認知經驗基礎。4.認知理性的異同:人腦的感受和認知可以區別為非語言層次和語言符號層次,非語言層次包括直覺和感覺,語言符號層次包括知覺(游移性印象)、象覺(清晰性意象)和統覺(邏輯性抽象)。電腦的認知理性只能夠定位于語言符號的象覺和統覺層次,難以具備豐富的認知層級系統。5.交流對象的異同:人腦的交流對象分別為對象世界和人際關系之間,具有交流的二重性;而電腦的交流對象只有執行程序的人或“人—機對話”的一重性,所謂“機—機對話”的實質仍然是“人—機對話”的連網,互聯網交流仍然是執行者之間的交流。由于計算機永遠不可能直接認知人所面對的對象世界,必須以人類的認知為中介,因此計算機永遠不可能超越人類的智慧,計算機統治人類世界永遠是一種不必要的擔憂。
其次,必須認識人腦語言系統和電腦語言系統的差別。人腦語法或自然語言法則是在歷史上逐步形成的,具有隨機性、規約性、類推性和耗散性特點;而電腦語法或機用語言法則只是自然語法的再抽象化和再規范化,具有受限性、是否性、程序性和封閉性的特點。即使將來研究出適合于語言信息處理的機用語法,也不等同于自然語法。電腦所能獲得的語言能力,只是自然語言的一部分或有限語言能力。因此,移植進電腦的語言系統必須進行界定:1.定域化語言:因為人腦語言是一個可以分為不同語域的復合性層級系統,所以必須首先確定電腦語言與人腦語言的對應層級,最佳選擇就是規范性的日常語域。2.受限化語言:只能采取有限網絡模式,才能將自然語言裁剪成適合計算機運算模式的機用語言。3.形式化語言:必須將定域受限語言的語義結構和語形規則分別形式化。4.算法化語言:借助一定的數學模型,將形式化語義和語形系統數字化。5.編程化語言:依據一定的程序語言,將數字化語義和語形系統編程化。
語言信息處理的目標,就是在受限性語言層面上逐步實現人—機對話。歸根結底,自然語法≠電腦語法,電腦語言系統是通過建立形式化的計算模型進行處理的定域自然語言系統。電腦的運算速度可以遠遠超過人腦的思維速度,但是電腦不可能具備人的能動性認知行為。語形語法學面對是人—人對話,人們在語言習得過程中不知不覺地形成了建立在認知能力之上的語義結構網絡,為語形語法規則提供了一份語義可選性清單。語言信息處理面對的是人—機對話,而語言“白板”的計算機并不具備這份語義可選性清單。語形語法規則,在教計算機如何說話的過程中頓時陷入困境。幾千年來的西方語法學之所以能夠延續下來,全賴人們具有基于認知能力的語義結構網絡的自建構功能。反之,正是這一語義結構網絡的存在,致使以往的語言學家誤以為語形語法就是語法的全部或主要,而將語義結構法則長期放逐出語法學領域。
自然語言系統的計算機處理對西方具有兩千多年傳統的語形語法學提出了根本性的挑戰,也為東西方語言學的合流帶來了新的契機。回顧20世紀東西方語言學合流的歷程,之所以出現西方語法學框架和漢語事實的錯位,是因為合流基點的選擇陷入誤區。西語具有豐富的語形結構(這里指形態變化)而漢語基本沒有(漢語主要依靠語序、虛詞、韻律和語氣,另外對語境或語用具有極大依賴性)。選擇建立在形態變化基礎上的西方語法學框架作為合流的基點,必然導致這一過程的曲折。反思的結果顯示,東西方語言學合流的基點應當是建立在人類語言所共有的語義結構基礎上的語義語法學理論。隨著對語言能力研究的進一步深入和語言信息處理對傳統語言學的挑戰,傳統語義研究在新的形勢下得以復活。隨著世界語言學從20世紀60年代以來出現了從語形研究向語義研究的轉移,東西方語言學研究的合流將在新的基點上逐步實現。
五、面向語言系統模擬的語義語法學
盡管喬姆斯基理論認識到語言形式化的重要性,但生成語義學才是語言研究本體的轉向。雖然配價語法和格語法的引進和對漢語語法意合性的認定,促使語義句法研究成為當代中國語法學界的熱點,但迄今為止,中文信息處理應用系統自覺而全面地運用語義研究成果的鮮見。這一現狀的表象似乎是語義研究成果不多,其根源卻在于沒有徹底認識到——必須從人類(不限于印歐族群)普通(不限于歐洲唯理主義)語法(不限于形態語言)的高度,來解決語言理論和研究方法的創新。無論是語言信息處理,還是語言機制揭示,漢語研究都需要既能反映漢語個性又植根于人類語言共性的原創理論。
人類的認知表現為對象世界的符號化(認知對象的符號化形成語義單元)、范疇化(語義單元的范疇化形成語義類別)和關聯化(語義類別的關聯化形成語義結構)。西方語言中的詞法范疇原型是先民通過語音形式所表現出來的認知范疇或語義類別。語言的形態標記性、單位分布性和結構層次性都是語義類別關聯化在表達層面的投影或者制約。一方面,隨著人們認知的發展,反映原始認知足跡的形態范疇(如原始生物觀的“性”、原始計算法的“數”)的價值日益消解;另一方面,隨著語言系統的演化,表現原始認知足跡的語法手段又不可避免地合并、弱化和喪失。語序、功能詞等手段的補償,導致語言結構類型從綜合型向分析型方向嬗變。這一過程證明,原始詞法范疇在句法結構中并不具有充分必要性。一種語言可以沒有詞法形態變化,但不可能沒有語義結構規則。不同的自然語言之間之所以可能互譯,其基礎就是存在可互通性語義,盡管結構類型迥然不同。(李葆嘉2001)
由此可見,人類語言的本質屬性是語義性,其他屬性都是語義性的派生。人類語言的共性可以概括為:在人類感知對象世界的過程中,神經機制依據象似性模式促使對象世界語符化,音義一體化的語符具有實體性和范疇性,由此組成的語義結構具有語境性和關聯性,語義結構的語境性表現為語用、語義結構的關聯性投影為語形,而語義結構模式具有生成性。圖示如下:
神經機制語義實體語境-語用性
象似性認知過程語符語義結構生成性
對象世界語音范疇關聯-語形性
在自然語言能力移植工程中,計算機需要的是具有語言本質共性的語義結構網絡,由此有必要首先建構語義語法學。所謂“語義語法學”不是“語義+語法的學”,而是以語義為研究對象的語法學。把語義結構的表層投影——語形作為語法研究的純正對象,有悖于語言結構的真實本體。喬姆斯基試圖在語形結構進行數理化描寫的基礎上,建構反映語言能力的生成語法體系勢必捉襟見肘。這一初始思路必然導致“拋開語義——深層語義——語義解釋——邏輯表達——邏輯式”這樣的“不斷革命”。雖然喬姆斯基強調語言研究的目的在于揭示語言天賦,但依據其理論思路:普遍語法(研究對象)——語言能力(哲學基礎)——自然主義(學科性質)——數學方法(方法借鑒)——符號描寫(形式載體)——形式語法(研究成果),顯然缺少人類天賦中最關鍵的認知性語義能力這一環節。完全排斥語義的經典理論階段,其句法結構規則必然導致生成出一批語言事實中并不存在的語符串。即使在不得不引進語義解釋的標準理論階段,也沒有放棄把形式結構作為句法生成的基礎規則。然而,任何脫離語義的語法形式化注定流產,不可能達到揭示語言生成機制或普遍語法的目標。
如果說語義語法學的語言觀強調人類語言的本質共性是語義性,那么語義語法學的語法觀則突出語義結構是語法的主要研究對象。在歐洲傳統語文學中,“語法”主要指基于形態變化的詞法和句法規則。在歷史比較語言學時代,“語法”包括語音法則,因此才有“青年語法學派”之稱。20世紀的結構主義和描寫主義促使“語法”研究的對象日益窄化。依據語言是音義符號系統這一論斷,所謂“語法”即語言結構之法,當包括語音結構法和語義結構法。在語言系統的第一次劃分中沒有通常所說的“語法”即語形結構法的位置。語形結構是語義結構的表層投射或制約,語形結構法依附于語義結構法。語言系統的音義二分以及相關研究學科,圖示如下:
語音分析(生理語音學、物理語音學)
自然語音解析
語言(語音學)語音結構(音位系統學、語流節律學)
符號語形結構(語形語法學)
系統語義投影聚合性義場(詞類)
(語義學)語義結構(語義語法學)
組合性義場(句模)
以往的“語音、詞匯、語法”三分法,迷糊了研究者的視線。雖然語形語法研究在語言交際和語言教學中具有一定或者相當用途,但是從研究角度而言,卻避開了關鍵的語義結構法則。
人類認知的本質是對世界圖式的語義符號化,人所認識的世界就是存在于語言符號系統中的世界。語義結構網絡表現為“實體范疇化”(聚合性義場)和“關系模式化”(組合性義場)的相互交錯。廣義語義不僅包括實體范疇化的詞匯語義和關系模式化的結構語義,而且包括語境范疇化的語用語義。語法的真實本體或語法研究的切實對象應當是語義范疇及其關聯模式。結構語法和生成語言的不同之處,在于前者強調“語言系統”,而后者強調“語言能力”,但其共通之處卻在于皆以語義結構的虛象——語形作為研究實相,始終游離于語法真實本體之外。依據語形語法學的有限范疇和簡略框架(詞類劃分、語形成分、短語結構、句子成分等),既難以深入分析句法結構,更不可能有效駕馭語言結構的生成機制。從表達來說,語義編碼是一切語言編碼的基礎,要揭示語言的奧秘必須從語義入手。語形型語言(并非只有語形,而是語形隱含或遮蔽了語義語法)和語義型語言(并非沒有語法,而是沒有形態變化語法)的研究基礎,都應是語符的語義性。語義語法學的語法觀突出語義結構,表面上突出漢語的個性特征,實質上受制于人類語言的本質共性。關于語形型語言和語義型語言的大致異同,圖示如下:
語形型語言:形態手段
語義范疇——語義網絡(知識世界)——元語言(日常認知)
語義型語言:非形態手段好范文版權所有
人類的語言符號系統,本質上是一個意義隱喻系統。作為人類認知基本能力的隱喻,其更深層次是源于動物性感受的模仿(基于事物的相似性)與借代(基于事物的相關性)這兩種認知能力。關于語言符號系統的形成大致流程,圖示如下:
神經機制情緒模式
認知機制具體感受元語言(日常認知)——語義網絡(知識世界)
對象世界經驗框架
西方語法學源于古希臘的“語言·哲學·邏輯”混沌母體,西方哲人的邏輯研究基于思辯性語言活動。因為邏輯的基本單位是概念和命題,因此人們往往把注重語義的語法研究混同于邏輯的研究。漢語實詞的義類劃分不是根據邏輯意義,而是借助日常語義;漢語句讀之間的語法關系不是根據邏輯關系,而是遵循事理關系。雖然邏輯規則是語法規則的部分再抽象化,但泛邏輯主義卻致使人們誤以為語法規則都可以邏輯化。自然語言首先具有本能傳情性和日常認知性,語言結構法則主要依據廣泛存在于日常生活中的事理關系。這一事理關系包括:時序先后性、空間位置性、主觀因果性、主觀目的性和評估好惡性等等。不是日常語法以思辯邏輯為基礎,而是思辯邏輯以日常語法為基礎。同樣,雖然可以借用數理符號轉寫具有算法性的語言結構法則,但不可把語言法則混同于數理邏輯規則。
語義語法學的技術路線,是從建構現代漢語元語言系統到建構現代漢語語義網絡。雖然自然語言信息處理依賴于語義結構的形式化,但是一些語言學家往往視語義研究成果為“非語法”,并且對其形式化的可能性持懷疑態度。一方面語義單元不具備語形變化的顯著標記,而包含較多的意會性;另一方面語義單元并非沒有范疇標準,也具有感受或認知的一致性。所謂語義的客觀性和主觀性就是語義的集體認同性和個人聯想性,其本質是個體使用的“素單位”和集體認同的“位單位”之間的矛盾。語義語法學的研究對象首先是具有集體認同性的“義位”(標準體),然后才有可能是僅具個人使用性的“義素”(義位變體)。盡管語義單元或語元數量眾多,語義結構關系復雜,但它們以潛在的元語言系統為基礎。語義結構網絡由語元實體和語義關系組成。同類語元之間具有聚合性語義關系,異類語元之間具有組合性語義關系。換而言之,每一語元都具有兩種互相制約著的語義關系,一是同一義場內的各個“義位”之間的“義征”(語義特征)異同,一是不同義場的“義位”之間的“義聯”(語義關聯)異同。由此,可以依據義征和義聯的異同而建立聚合性義位系統和組合性義聯系統,在兩者基礎上在編織語義結構網絡。句法結構的形式化應當是語義結構的形式化,而語義結構的形式化就是義場關聯模式。
現代漢語語義語法的基礎研究是建立“現代漢語元語言系統”,這一研究可比喻為“語言基因圖譜分析工程”。其研究思路是:首先歸納出現代漢語詞典中用于釋義的最低限量詞匯,以建構釋義元語言系統;其次依據日常語言交際和語言教學中的用詞,參照釋義元語言以建立詞匯元語言系統;再次抽象出義征范疇以建立析義元語言系統,完成語義標記集。在以上成果基礎上,一方面可以結合認知心理學和神經語言學的成果進一步研究認知元語言系統,另一方面可以依據語言信息處理的要求,建立機用元語言系統。(李葆嘉等2002)
在現代漢語元語言系統這一基礎性工作完成以后,才可以逐步建構現代漢語語義結構網絡。研究程序和主要方法大致如下:1.義征對比法。依據有限網絡模型,借助析義元語言系統對義元進行形式化描寫即標注義征。給出義元在義場內的語義特征,其目標是建構聚合性義場。2.義聯配比法。依據有限網絡模式,對語義符號的配比關系進行形式化描寫即標注義聯,在分析和描寫過程中歸納出關聯性元語言系統和語義結構關聯框架。語義句法的本質是相關義場之間的配比,因此義聯標記體現著義場配比。給出義場之間的語義選擇或語義制約規則,其目標是建立組合性義場。3.語形標記法。漢語具有詞序、虛詞和韻律等形式手段。韻律手段屬于語音句法,可姑且不論。漢語的語形大致可以概括為兩種:附著在詞或詞組上的詞語級語形是完構成分;附著在句干上的句子級語形是完句成分。在進行漢語語形范疇化研究的同時,尋找語義關聯和語形成分之間的對應性,然后對語形系統進行層級性形式化描寫。4.合成建構法。在義征、義聯和語形研究成果的基礎上,通過相關標記的合成以建構語義結構句模系統。
“語言能力移植工程”的語言學部分主要是語義結構網絡研究。通過建立形式化的計算模型,可以將語義結構網絡進一步形式化、算法化和程序化。語義語法系統研究的每一結果,都可以也應當用計算機操作作為驗證。以往的語法學研究,除了執著于語形研究以外,還有一個根本性的缺憾,就是不具備自然科學研究中的實驗手段,因此難免經驗性、臆斷性和游移性等。采取計算機作為研究和驗證手段,從而使語法研究具有鮮明的技術性和可證偽性。人們常說,只有學會一門外語,人們才真正了解自己的母語。與此同理,只有計算機掌握了自然語言,人類才深入揭示出自然語言的奧秘。換而言之,根據語言學習對象的不同,可能存在三種教學語法:一種是母語教學語法(著重于語形語法,因為人類對語義結構網絡和語言知識庫具有自建構能力),一種是對外語言教學語法(需要在語形語法的基礎上增加與語言理解相關的社會文化知識,因為不同語言的語義結構網絡具有不同的文化性),一種是計算機模擬語言能力的語法(需要語義語法和語言知識庫,因為計算機不具備語義結構網絡自建構能力以及與語言理解相關的知識系統的自學習能力)。也只有揭示出語義結構網絡,語法學研究才能夠在語形語法研究的基礎上取得全面突破,語法形式、語形語法意義和語義語法意義,才能夠全面貫通。
盡管語義研究及其形式化相當困難,但是在語義語法學理論的指導下,根據定域(語言定域)、定量(詞語定量)、定性(義元定性)、定式(義聯定式)的“四定”原則逐層實施,自然語言的理解與生成有可能在單句模式系統中首先實現。只要對語言本質的探索和人腦語言移植電腦的目標不變,就必須穿越語義研究的沼澤地。如果說20世紀是語形語法學的世紀,那么可以預言21世紀將是語義語法學的世紀。
六、語言科技復合型人才的培養
自然語言的計算機理解和生成已經成為國際語言學研究的聚焦,語言信息處理的技術水平已經成為當前衡量一個國家現代化水平的重要標志之一,盡快培養兼通語言學、計算機科學、數學和認知科學的復合型人才迫在眉睫。據《美國計算語言學雜志》1986年統計,全球設置計算語言學博士學位的大學已有105所,其中美國63所。在英國曼徹斯特大學已有計算語言學的學士和碩士專業。(侯敏1999,p.27)
中國的機器翻譯在20世紀50年代啟動,但由于反復不斷的政治**停滯了近20年。1981年,成立了中文信息學會。1987年,隸屬于中文信息學會的計算語言學專業委員會成立。通過計算機專家和語言學家的努力,已經取得語言信息處理的一系列成果。但迄今為止,中國大陸計算語言學方向的研究生的培養,或附屬在漢語言文字學、語言學及應用語言學學位點,或附屬在計算機應用等學位點,專門性的本科專業迄今尚無設置。根據目前中國高等教育學科體系,一方面,語言學和計算機科學分屬不同專業,兼通語言學和計算機科學人才的培養如隔重山;另一方面,“中國語言文學”學科中,作為學術或準科學的“語言學”在前而作為藝術或教化工具的“文學”為重,兩者始終捏而不合。
依據南京師范大學文學院的發展規劃,2001年4月成立了語言科技研究所,6月成立了語言科學及技術系,現在正在建設一個包括教學功能、科研功能、開發功能和交流功能的語言科技實驗中心。在現有專業目錄內增設的漢語言專業,以“語言科技”為特色,課程設置以語言學、計算機科學、數學和認知科學為四大學科支柱,2002年開始招收首屆中文信息處理方向的本科生。這一舉措,為多年來倡導的文理工學科滲透,找到了一個準確的切入口。語言科技專業的培養目標是:立足當代語言科技領域,放眼未來相關科技前沿,以語言學與相關學科相的結合為導向,培養有利于促進21世紀科技進步和社會發展的復合型創新人才。通過堅持不懈的努力,南京師范大學語言學學科點擬在三五年內完善“本科生——研究生——博士后”的多層次人才培養體系,建構“教育性——科研性——開發性”的綜合型高等教育基地。
面對信息科技對當代語言學的挑戰,“語言科技”新思維應運而生。這是一個可以在描寫語言學、理論語言學和計算語言學之間,可以在語言學和相關學科之間,充分發揮溝通作用并引發許多思考的新概念。依據這一新思維,首先建構了面向語言工程的語義語法學理論,并進一步將這一工程具體化為“語言基因圖譜分析工程”和“語言能力移植工程”。當代信息科技的發展趨勢表明,研究對象的語義性和研究過程及其成果的技術化將成為21世紀的語言學精神。
第二篇:下周科學語言課
語言:豆豆收藏家
活動目標
1.理解收藏的含義,感受故事所表達的小朋友對幼兒園的留戀之情。2.樂于用語言、繪畫的方式與同伴交流自己內心世界的收藏。活動準備
1.課件:豆豆收藏家。2.投影儀及電腦。
3.教具——收藏盒,裝有石頭、樹葉、畫、橡皮、瓶蓋等等,樹木,石子,豆豆人物畫。
4.學具——剪有各種形狀的卡紙、筆、收藏盒與幼兒人數相同。活動過程
一、欣賞故事,理解收藏的含義。
二、結合畫面,進一步理解故事。演示畫面: 1.豆豆收藏了什么? 豆豆為什么要收藏石頭? 2.豆豆為什么要收藏樹葉? 3.豆豆為什么要收藏畫?
4.等豆豆畢業了,離開幼兒園了。她看到收藏的石頭樹葉畫,她會怎么想? 5.故事里的豆豆為什么要把幼兒園的東西當成寶貝收藏起來? 如果是你,你想收藏什么?為什么?
三、學做小小收藏家。
每位幼兒選一個自己喜歡的收藏盒,實地收藏。活動延伸 美工區提供筆、紙(若干),鼓勵幼兒畫畫自己的收藏。2.自由活動時請你們一起與同伴交流你的收藏品。附故事:
豆 豆 收 藏 家
豆豆是個收藏家,他有很多很多收藏。
你想瞧一瞧?那就瞧一瞧吧。瓶蓋,橡皮,尺子,小粘紙,玻璃球,還有好多好多呢。這些可都是豆豆的寶貝呀。
豆豆就要上小學了,可是他太喜歡幼兒園了,他想把幼兒園也收藏起來。豆豆真想收藏滑梯,滑梯上有豆豆的屁股印兒,有豆豆的笑聲。滑梯下面的小石子兒還把豆豆的屁股弄得好疼好疼呢!那小石子還留在那里,光溜溜,圓乎乎,好象一顆鳥蛋,豆豆撿起小石子兒,收藏起來,以后看見小石子,豆豆就會想起幼兒園的滑梯。
幼兒園的大樹,豆豆也想收藏。在這棵大樹下,豆豆和小伙伴講過許多悄悄話。樹葉有多少,講過的悄悄話就有多少。可是,留在幼兒園的弟弟妹妹,還要來這兒講悄悄話的呀。豆豆揀起一片樹葉收藏起來,只要看見樹葉,豆豆就會想起幼兒園的樹,想起小伙伴在一起講悄悄話。
豆豆最想收藏的是老師,豆豆喜歡老師的聲音,老師的笑,老師身上那股香香的味兒。豆豆拿出畫筆,畫上老師的眼睛,老師的鼻子,還有老師的嘴巴,以后,看見這張畫,豆豆就象又看見了老師。
豆豆是個收藏家,他要把幼兒園好好地藏起來,一直藏下去,永遠,永遠。
活動反思:
語言:畢業獻詞
活動目標
1.理解詩歌內容,能有感情的朗誦。
2.回憶美好的幼兒園生活,表達自己對老師的感謝之情。活動準備
1.師生一起收集幼兒3年來的活動照片,布置在教室專欄中 2.錄音機,錄音帶 活動過程
1.觀看照片,幫助幼兒積極回憶在園的生活、學習、游戲。T:還記得小班、中班的情況嗎?
T:小班、中班時我們怎么樣?現在我們又能干些什么? T:有哪些老師教過我們?幼兒園里還有誰幫助過、關心過我們?
T:再過幾天,我們就要告別幼兒園了,心情怎么樣?想對大家說些什么話? T:到小學后我們準備怎樣做呢? 2.欣賞和理解詩歌
(1)教師有感情的朗誦詩歌,幼兒初步理解詩歌內容(2)提問:
T:詩歌的名字是什么?
T:詩歌里對老師、叔叔、阿姨說了哪些感謝的話? T:到了小學又是怎樣做的? 3.學習詩歌。
(1)欣賞配樂詩歌錄音。
(2)分段學習詩歌。教師要注意幫助幼兒理解詩歌里每一段的內容,并學習朗誦,注意幼兒發音要準確。
(3)自由結合分小組練習(4)有感情的集體朗誦。
活動反思:
數學:數積木
活動目標:
1.在數積木的過程中,學習有序地觀察和統計數量的方法。
2.能清晰地表達觀察的內容,喜歡挑戰空間邏輯游戲。
活動準備:
正方體小積木;“積木房”圖片若干;記錄用紙和筆
活動過程:
一、話建筑,贏積木
T:在我們居住的城市里有各種各樣的老房子和新建筑,你喜歡怎樣的房子,為什么呢?
T:想不想造一幢喜歡的房子?
T:今天我們就用積木來造房子!每組的桌上有幾塊積木呀?夠不夠造一幢房子?
那就請你們就分成4組在數積木游戲中贏取更多的積木。
二、爭回答,數積木
(一)數數相同數量的積木房
T:聽清題目喲!(出示相同數量積木建造的不同房子)
T出題:我用積木造了4幢房子,請你們用好方法數一數,每幢房子各由幾塊積木建成的?
形式:將答案記錄在記錄紙上,呈現在每幢房子的下方,答對的為本組加上一塊積木。
驗證:移去屋頂,拆層演示
重點提問:房子有幾層?每層有幾塊?一共有幾塊?
小結:數量相同的積木能造出不同的房子,只是有的積木被其他積木擋住了,我們不容易發現,點數的時候我們可以一層一層的數清楚,不多數,也不漏數看不見的那些積木。
(二)找找躲起來的積木塊
T:有的小組領先了,有的小組暫時落后,不過沒關系,我又造了一幢房子,房子里有些積木很頑皮,像玩捉迷藏一樣躲了起來。讓我們仔細觀察,把藏起來的積木找出來。
T:準備好了嗎?請問這幢房子有幾層?每一層有幾塊?共有幾塊積木建成?
重點:移去屋頂,拆層演示,幫助幼兒學會數隱藏起來的積木塊。
小結:房子一層層往上造,如果上層有幾塊積木,那這些積木下一定也有幾塊積木
三、造房子,數“磚塊”
(一)造幢房子把分數
T:經過兩輪的比賽,哪一隊的領先了呢?請每組朋友用你們現有的積木造一幢房子,然后我們一起來數數你們的房子由幾塊積木建成,共得到了幾分。
(二)學做小小建筑師
T:(出示建房圖紙)你們造房子、數積木的本領都那么大。那你們能不能在根據圖紙上的建房要求,在5分鐘內造出與圖上一模一樣的房子,并一層一層的數清楚他是由幾塊積木建成的呢?
要求:每隊派一個代表挑選喜歡的圖紙,用積木搭出與圖中相同的房子,要造的又快又好!
重點觀察:每組搭的房子是否與圖紙上的一樣,各組搭建、點數的方法。
驗證:他們搭的房子與圖紙上的一樣嗎?記錄的對不對呢?
小結:雖然各隊拿到的圖紙看起來不一樣,其實是同一幢房子從不同的角度拍出的照片,所以搭出的房子是相同的。
四、延伸:
T:小小建筑師們讓我們回去建造更多獨特的房子,考考你的好朋友們你是用幾塊積木建成的好不好!
活動反思:
科學: 找空氣
活動目標: 1.讓幼兒感知空氣的存在,發現空氣無處不在。2.能運用語言清楚的表達自己的發現。活動準備: 1.各種塑料袋、皮筋、氣球
2.活動前與幼兒開展有關空氣的談話,了解幼兒對空氣的原有經驗,引發幼兒興趣。活動過程:
1.談話
教師出示吹好的氣球,提問:“小朋友,氣球娃娃來找你們玩來了,大家快跟它打個招呼吧!氣球娃娃想考考你們,?我的肚子為什么是鼓鼓的?? 引導幼兒說出氣球里是空氣,教師“空氣從哪里來?我們去捉空氣好不好?”com,請保留此標記。)
2.找空氣
請幼兒按自己想的用塑料袋去教室的各個地方找空氣,說一說“你在哪兒找到了空氣”。
教師指導幼兒實驗,并幫助幼兒將裝滿空氣的袋子系好。請幼兒互相介紹自己是在哪捉到空氣的。
教師將幼兒的發言匯總小結,引導幼兒思考:還有哪個地方我們沒有找?那里是否有空氣存在?
3.吹氣球
讓幼兒玩吹氣球的游戲,再次體驗空氣的存在。4.空氣作用大
引導幼兒討論空氣與人類生活的密切聯系 活動延伸:
在科學活動區提供有關的材料(如輪胎圖片,救生圈圖片等),從中發現哪些物品是利用空氣原理制成的。
提供氣球,讓幼兒游戲。
活動反思:
第三篇:音樂與語言
音樂與語言
傳統的《歌曲做法》大多很注重音樂技術層面的闡述,比如,先從音樂的主題入手,然后講到音樂的發展,其次再講述音樂的結構,最后講講音樂的體裁、前奏尾聲的寫作,等等。客觀地講,這種文體結構沒有什么不好,問題是它具有相當大的局限性——音樂創作是一個相當復雜的精神活動,需要許多方面的共同參與才能完成。比如,一個人的藝術經歷、生活閱歷、音樂才能、語言修養等諸多方的層次和水平決定其音樂創作的層次和水平。因此,作為一部專門講述歌曲創作的教課書就不能單單只講音樂技術,而其中非常重要的、與歌曲息息相關的語言學——為歌曲創作所用的語言學就顯得非常重要了。因為人的歌唱狀態與人在日常生活中的語言表達是沒有本質上的區別的。二者之間只是在某些方面略有不同,另外,歌曲創作也不是生活語言的簡單復制與模仿,從以上兩個方面可以看出語言在歌曲創作中的特殊地位。不拿出一定的章節來闡述關于語言與音樂的諸多問題的教科書——我個人認為——不能算是合格的教科書,尤其是在當
下,信息和資訊近乎爆炸的年代。
前面談到“為歌曲創作所用的語言學”的說法,其意義就在于它有別
于一般的語言學,這種在音樂藝術中存在的“語言”。
第四篇:語言與文化
【內容摘要】:數字,是人類認知世界的發現與工具,數字符合使人類進行抽象的邏輯思維變為可能,并通過它們記載對世界的認識及人類的發展史,從數字文化背后,我們可以發現,它們折射出了各個時期的歷史特點及人們的心里層面。本論文主要從數字的含義,數字的諧音,數字的成俗語幾個方面對數字文化進行了淺析。
【關鍵詞】:數字 數字文化 社會文化 諧音 成俗語
數字是文字語言中的一個奇葩,它有著獨特的文化蘊含和功能,它用自己的方式記載著人類思維的變化及對世界對認識,同時它也是文化發展過程中不可缺少的因素,數字與文化有著不可分割的聯系。在生活中,我們常常被數字包圍著,如:身份證號碼、手機號碼、護照號、車牌號、生日、結婚紀念日、準考證號、門牌號、學生證號、各種銀行卡號、各種節日日期等等,它們不僅僅只是一個數字,而且還是某些個體的標識,它記載著一件事情或一段故事,反映著各時期的社會文化,豐富著我們的文化生活。
一、從數字文化中透視中西文化——數字的內涵
“一”代表勝利,代表著最高,代表著萬物之源,代表著前無古人,后無來者,居高臨下,位居首位,是最小的自然數。無論是中國還是西方,人們都對數字“一”情有獨鐘,都非常崇拜它。在中國,人們注重做事的“有始有終”、“獨一無二”、“一馬當先”、“一日之計在于晨,一年之計在于春”,這在數字文化中表現出了對“一”的崇尚,尤其是人們對農歷一月一日(大年初一)的重視。數字文化被賦予一種神圣感,老子在《道德經》中說到:“道生一,一生二,三生萬物。”可見“一”是萬數之母,其它自然數是“一”累加的結果,都以“一”為基礎。在西方,“一”同樣很受崇拜,不同與我們的是,他們對出生日是一號的比較重視,他們認為出生日是一號的那個人就會被賦予一種獨立堅強的性格,敏銳的觀察力,他會努力地達到自己既定地目標。從中可透視出我們中國看重事論“漢語中的數字與社會文化”
情的開頭,而西方則看重人的獨立。
“二”僅此于“一”之后。在中國,“二”是雙,表示美滿之意,是人們喜愛的數字,有大吉大利之意,如:智勇雙全、雙喜臨門、兩全其美、舉世無雙都是美好的含義。但是隨著社會生活,社會文化的發展,“二”的含義發生了一些變化。在有些時候,我們常說“這個人好二”,這里“二”不再是美滿,而是說這個人有點傻,而且傻的可愛。而在西方,“二”是一個不吉利的數字,常被視為劣根,罪惡之源。可見,中西方文化有很大的差異。
“三”表示多的意思,如:三思而后行,三人行必有我師,垂涎三尺,余音繞梁三日不絕。在西方,人們對“三”很偏愛,認為它是一個神圣的數字。
“四”從外形上看方方正正,有棱有角,所以在中國它表示四方的意思,象征平穩,如:四平八穩,有東南西北四個方向,春夏秋冬四個季節。在西方它象征著公平、正義和力量。
“五”一個神秘而又抽象的數字。五行陣、五花八門三綱五常、三年五載、三令五申、三皇五帝等等似乎“五”在中國文化中有著很深的哲學思想。而在西方人們受基督教的影響很忌諱“五”,“星期五”因為是耶穌受難日,所以被認為是很不吉利的日子。
“六”可以說是最喜慶吉祥的數字之一,表示順利。如:六六大順、六畜興旺,象征吉祥如意,幸福安康。在春節,我們 常常在畜牲圈中貼上一副“六畜興旺”的對聯;在選擇電話號碼或汽車牌號時人們尤其鐘愛尾數是“66”的數字。因為他們象征著順利,健康和萬事如意。西方則不同,他們認為“六”是一個兇數,野獸數。如:在俄羅斯,“六六六”代表的是“惡魔”,所以人們一般很忌諱。
“七”是我在十個數字中最不喜歡的一個,它代表著復雜、凌亂,如:七竅生煙、七零八落、七上八下、七拼八湊、七嘴八舌、七扭八歪等都帶有貶義。給人送禮時忌七樣,飯桌上的菜絕不能是七盤,人們在挑選吉日良辰時不窕七、十七、二十七,這主要與中國人崇尚偶數的心里有關。在西方,“七”卻是個神圣的數字,西方人講究七種美德,七次圣餐,人生有七個時期,七種天罪,這是因為它與神圣有關,如:上帝用七天時間完成了創造世間萬物的
壯舉,用七天造了亞當,取亞當七根肋骨造了夏娃,圣靈有七件禮物。在西方童話故事中又有白雪公主和七個小矮人。
“八”民曰“要得發,不離八”是發達興旺之數,在中國文化中占有十分重要地位。八拜之交,八斗之才,八方之援,“八”已成為中國人最青睞的大吉數。在西方,“八”暗示著成功,幸福和滿足。
“九”象征神圣,最至高無上。古代帝王被稱作“九五之尊”,北京城有九個門,天安門城樓面闊九間,故宮房間有9999間等都體現了“九”的神圣與無尚。“九”與“久”諧音,故也常表示長久之意,在中國文化中“九”是代表最大,最深,最遠的數。在西方“九”同樣神圣和尊貴,天有九層,地獄有九層,可見,“九”在中西文化中特別被看重。
二、從數字文化中尋找趣味——數字的諧音
生活中,我們我們不難發現有些數字經過變調發音后會產生有趣的效果,有褒義也有貶義。隨著時代的發展,數字文化慢慢地走進我們的生活。“二”的諧音“愛”,“四”的諧音“死”,“五”的諧音“我”,“八”的諧音“發”,“九”的諧音“久”。
我們在選擇床位號、門牌號時常避開“14”、“54”,“14”諧音要死,“54”諧音我死都是不吉利的數字;男女雙方在表達愛意時常用“520”諧音“我愛你”,“131420”諧音“一生一世愛你”,“3344587”的諧音“生生世世不變心”,“8834760”的諧音“慢慢相思只為你”,“7708801314520”的諧音“親親你,抱抱你,一生一世我愛你”;人們在遇到要選擇數字時,常離不開“8”——“發”,如:“18”——“要發”、“168”——“一路發”、“518”——“我要發”、“888”——“發發發”,也常用“886”表示“拜拜了”;還有一些,如:“918”——“加油吧”、“282”——“餓不餓”、“70885”——“請你幫幫我”、“0487”——“你是白癡”、“786”——“吃飯了”,又如“二白五”——古代銀子五百是一對,二白五十是半封,所以“二白五”諧音“半瘋”表示傻氣,莽撞。是不是很有趣,突然間發現數字作為一種文化也很有魅力,雖然有些數字表示的意義含糊,甚至有時誤解某些數字,但也是因為這點,它給我們的生活增添了歡樂,豐富了中國文化,使之成為最深奧,最有影響的文化。
三、從數字文化中接受啟發——數字的成俗語 與西方國家相比,我國的數字文化雖然直接,單一,但如果將數字與數字之間相組合,將會不同凡響,其中蘊含的哲理也較為豐富,無論是在生活中還是書本中我們都可以感受到它們存在的氣息。
(一)珠算口決相關成語:①三下五除二:形容做事干脆利索。②二一添作五:指雙方平分或平均承擔責任或任務。③一退六二五:比喻將責任推卸干凈。④三一三十一:多指平均分成三份。
(二)民間數字成語:①不三不四:形容一個不正派,一個不像樣。②不管三七二十一:指做事考慮不周。③八九不離十:比喻差不多。④數九寒天:是極冷。⑤一不做,二不休:表示做事考慮不周到,做了在說。⑥十萬八千里:形容距離很遠。⑦九牛二虎之力:指做事不容易。⑧大小九九:某人大小算盤。
(三)書本中的成俗語:①一石二鳥:表示干事麻利。②一針見血:表示歸根到底。③千載難逢:指很不容易。④九霄云外、五湖四海:比喻距離很遠。⑤一日不見如隔三秋:形容思念過度。⑥信心百倍:指信心十足。⑦一桿子到底:表示做事要歸根到底。⑧眼觀六路,耳聽八方:形容某人神通廣大,辦事能力很強??
由此可見,數字文化已成為我國文化中不可缺少的一部分,它在我國文化中占有主要位置。
數字文化看起來似乎是人們司空見慣的瑣事,但它卻無時無刻不在規范著人們的行為。它隨著人類文明的產生和發展而演變的,是人類對物質世界的認識而總結出來的。人類文明始于創造文字,而文字的源頭又是數字,數字在造字史上起著基石的作用,對人類文化有著及其重要的影響。
第五篇:語言與公司
語言下的公司
公司的語言,是指一個公司的強勢語言或者公司權力人群慣常使用的語言。在晉江這個地方,許多公司員工普通話、閩南話、英語都能講個“溜溜轉”,但是,強勢語言最終決定公司的流行語言。一個講普通話的到了大講閩南語的環境,自我感覺肯定是個“異類”,他與熟悉業務同樣重要的自我暗示是“趕緊學閩南語”,直至融入公司主流語言,才會有一點融入公司主流的安全感。同樣,一個講閩南話、東北話、湖南話的老總新入主異類語言的公司,多半要找一些鄉親故舊來出任公司骨干和中層、幫手壓陣;而他找的這些骨干和中層同樣也得找得力的鄉親故舊幫手做事。于是,不知不覺中,一個公司的流行語言就從原來的系統切換過來,新的系統慢慢形成了。
管他白貓還是黑貓,能抓住老鼠的就是好貓。天下公司的宗旨其實并無二致,無論南腔還是北調,有效就是最美的調調。生意場上,東方話、西方話、南方話、北方話都不含糊,各色公司都生龍活虎。但是,我以為,以現實的角度看,操南方話包括閩南話、粵語等地方話的公司更容易“即刻”賺錢、更直接、務實;從發展的角度看,操普通話和英語的公司更宏觀一些、思辨一些、更長遠一些。
地方語言是最基礎的交易語言,而交易語言很直接;而普通話和英語這些近代才開始流行的普遍性的強勢語言帶有更多思維語言、抽象語言的質素,使用這些語言的公司和個人會比較理性一些、規范一些、更適應現代商務和管理潮流一些。
個人語言是經歷的積淀、體驗的積淀、文化和眼光的積淀,公司語言同樣如此。無論什么樣的語言都可以把生意做好,但若要把生意做大、做強,則必須超越地方語言與跨越地方業務而來。人們談到香港的成功,都說有很多因素,但是,很少聽到有人說這是香港公司粵語和英語交織運用的成功,是東方勤奮與西方管理文化交織的成功,我以為,這是一個缺憾。
說地方色彩的語言,可以做同鄉的生意;說普通話的公司,可以做全中國的生意;說英語的企業,可以做國際性的生意。可以說,有什么樣的語言,就有什么樣的公司。