1.語料庫語言學的語料庫和概念語料庫,也稱為語料庫或材料,是儲存語言材料的倉庫。語料庫是收集和科學組織的語言材料的數據庫。這種材料自然出現在某種語言中,可以是書面語,也可以是口語。這些未經加工的材料是語言統計的基礎,是分析和研究語言規律的第壹手材料[2 ~ 3]。語料庫語言學是在文本語料庫的基礎上研究語言的學科。不同的研究者對語料庫語言學持有不同的觀點。
點。有人認為語料庫語言學是壹個理論框架,是壹門與語言學其他分支並駕齊驅的新學科。另壹些研究者認為語料庫語言學不是壹門獨立的學科,但它為語言研究提供了方法論基礎,同時也為語言學研究提供了壹種新的哲學思維。為了解決這壹問題,中國研究者在總結國外著名語言學家韓禮德、利奇、托格尼尼-博內利研究成果的基礎上,指出只有語料庫可用。
語料庫語言學是當語言學家利用其中的語言材料和事實來批評現有的語言學理論並提出新的觀點或理論時,對壹門新學科的稱呼[3 ~ 6]。總的來說,語料庫是利用真實的語言材料研究語言某壹方面的方法和手段。借助語料庫語言學提供的方法,語言學家不僅可以驗證現有的語言規則,還可以根據語料庫提供的數據描述不斷演變的語法和語用規則。過去,語料庫中的材料是人工收集和整理的,通常用於計算詞匯的使用頻率,作為編寫教材和詞典的依據。現在,利用計算機建立語料庫的效率和規模都有了很大的提高。語料庫是從有代表性的語言材料中隨機選取的。
—
09
—
樣本輸入到計算機中,可以由計算機處理的大量文本組成。語料庫接收的文本越多,覆蓋的範圍就越廣,提供的信息就越可靠。語料庫的構建包括收集原始材料形成原始語料庫,然後對語料庫進行標註生成標註語料庫。我們可以利用語料庫分析軟件對標註的語料庫進行各種統計分析,從而揭示目標語言的各種特征。
二,語料庫語言學在語言研究中的作用
語料庫語言學的發展對語言研究的深入起到了積極的推動作用。壹方面,它影響了語言學習觀念和語言學習方法;另壹方面,它為壹些語言學習理念的實施提供了基礎。本文只討論語料庫對語言研究的三個方面的影響。
(1)語言是描述性的還是規定性的?
無論語言是描述性的還是規定性的,不同的時期有不同的側重點。在18世紀,主要的歐洲語言是通過規定的方法學習的。語言學家總是試圖制定各種正確使用語言的規則,這些規則強調語言的正確性和拉丁標準模式的應用。因此,語法是語言研究和語言學習的重點,有些用法在被規定後需要反復記憶,“因為這是壹個非黑即白、對錯的問題”[7]。在這種觀點的影響下,語言教學采用以教師為中心的語法翻譯法。語言教學的方法包括大量定義和規則的解釋和記憶。書面語經常受到更多的關註。相應的觀點是,語言是壹門描述性的科學。在這種觀點的指導下,語言學家在不使用其他規則來糾正社區語言的情況下,盡力發現和記錄某壹語言社區實際使用的語言。語料庫語言學為這壹觀點提供了基礎和可行性。通過對語料庫中大量實例的研究和分析,可以總結出語言的實際應用規律。這種觀點在語言學習中的體現就是更加關註學習者的個人需求,變以教師為中心的填鴨式教學為以學生為中心的知識探索式教學。在教學活動中,教師不再壹味地灌輸語言規則和語言知識,而是要求學習者通過搜索語料庫接觸真實自然的語言,觀察語言現象,分析總結語言規律,做出假設,並在語言運用中不斷檢驗和修正自己的假設。教師也從傳統的知識傳授者轉變為與學生平等的知識探索者和語言研究者。誠然,片面強調語言是規定性的還是描述性的,似乎不夠客觀。從語言的規定性出發,語言研究者和學習者可以簡化復雜的語言,宏觀地把握語言的基本框架,降低語言研究和學習的難度。對於語言學習者來說,學習動機和興趣可能不會太高,學習方法也比較死板。從語言的描述性來看,語言研究者和學習者會接觸到豐富真實的語言,通過觀察、分析、總結語言規律來達到學習和掌握語言的目的。在這個過程中,研究者和學習者都是主動的,所以他們的動機和興趣會大大提高。
(2)語言和言語,以及語言能力和語言運用。
索緒爾把語言分為語言和言語。語言是社會系統全體成員共同使用的語法系統,是壹群人大腦中的潛能。它是社會性的、同質的、抽象的語言形式。而言語是社會中每個個體所產生的語言,是異質的、多種多樣的[5]。由於對語言本質和語言與言語劃分的不同理解,出現了結構主義和功能主義兩大流派,他們對語言的研究重點也不盡相同。結構主義研究的語言是淩駕於個人和社會之上的抽象符號系統。功能主義強調語言的使用功能,考察實際的語言現象,試圖找出* * * *的結構。在索緒爾研究的基礎上,喬姆斯基提出了兩個概念:語言能力和語言應用。喬姆斯基認為,語言使用者對語言的規則有壹種本能的把握,語言能力是根植於大腦中的個體能夠按照有限的規則生成無限的詞語的語言知識。語言學家關註能產生無限言語的有限規則。語言使用的概念與索緒爾定義的言語概念非常相似,是指語言在特定場景中的真實使用。語料庫語言學為功能主義的進壹步發展提供了更加科學的研究方法,其研究重點是言語和語言使用。通過對言語和語言使用的深入研究,我們可以驗證現有的規定性語言規則,並試圖概括出新的語言規則。語料庫對言語和語言使用的研究體現在語言研究的各個方面,如語域的研究;分析本族語者的話語,總結其典型結構,用於編寫口語教材;統計高頻詞,應用於教學大綱的設計;分析比較外語學習者的語言使用情況,探索更有效的學習策略。對語言和語言能力的研究是在語言習得中進行的,即以潛意識形式存在於人的大腦中的規則是何時、如何形成的。因此,語料庫研究的是具體的語言,而對語言和語言能力的研究更側重於抽象的語言。我們不能盲目地肯定或否定某種研究方法,因為語言可以從多個角度進行研究,不同的研究角度可以相互補充,服務於不同的目的,滿足不同的需求。然而,語料庫的出現為語言研究提供了條件。
—
1
九
—
新視角讓語言研究更加客觀真實。
(3)組合關系和聚合關系
索緒爾是結構主義學派的創始人。他認為語言是壹個符號系統,所以語言學家必須盡力從壹個符號與其他符號的關系中找到語言的價值,了解符號在系統中的位置。索緒爾提出了兩種主要的語言關系:組合關系和聚合關系。組合關系是指同壹序列中壹個單元與其他單元之間的關系,或者該領域中所有成分之間的關系。聚合關系又稱關聯關系,是指在結構的特殊位置上可以相互替換的構件之間的關系,或者是在現場的構件與不在現場的構件之間的關系。聚合關系中的詞具有相同的句法特征,但不能語義替換[7]。大規模語料庫的出現為兩者關系的研究,尤其是組合關系的研究提供了巨大的空間。因為計算機有能力搜索壹個特定的詞,研究所有和這個詞有* * *關系的詞。這也是平時研究的搭配關系。韓禮德(1976)將搭配定義為“反映顯著鄰域內詞匯項組合關系的線性* * *現象”。這個定義明確地把搭配定義為組合關系。在搭配研究中,瓊斯和辛克萊(Jones & amp;Sinclair)是第壹個在語料庫中研究詞語搭配的研究者。自20世紀80年代以來,基於語料庫或語料庫驅動的詞語搭配研究廣泛開展,極大地改變了搭配研究。提高了研究效度,增加了定量研究的比重,搭配能力具有可觀察性和可操作性。自動化程度越來越高,研究過程中的人為幹擾因素大大減少。丹尼爾·克裏格(Daniel Krieger)在他的論文[9]中通過對“any”用法的研究,肯定了語料庫語言學在組合關系研究中的客觀性。按照傳統的語法規則,否定句和疑問句中通常使用“any”,但Mindt的統計顯示,肯定句中“any”的頻率為50%,否定句中為40%,疑問句中僅占65,438+00%。因此,語料庫為組合關系的研究提供了極大的便利。聚合關系的研究更多體現在壹些同義詞的研究上。例如,崔在她的文章中指出,Rundell利用語料庫[10]對同義詞“start”和“begin”這壹組進行了比較研究。這些研究成果為利用語料庫研究組合關系和聚合關系提供了模式,語言研究者可以利用語料庫做很多類似的研究。
三,當前語料庫研究中存在的問題
毫無疑問,語料庫在語言學研究中發揮著積極的作用,但目前最大的問題是只有少數語言研究專家掌握了語料庫研究方法,大多數語言教師和語言學習者不了解語料庫,不知道如何利用語料庫資源進行科學研究。然而,關於語料庫使用的文章卻很少。因此,培訓語言教師和語言學習者大規模使用語料庫資源,將更有效地發揮語料庫的作用,極大地推動語言研究和語言學習的步伐。
語料庫為語言研究提供了新的思路和方法,但語料庫資源的利用率有待大大提高。只有更多的語言教師和語言學習者與語言大師語料庫有最密切的聯系,語料庫才能真正促進語言研究和語言學習。