如何建語料庫 如何建立自己的語料庫?

2021-10-16 21:15:22 字數 1186 閱讀 9537

不知道題主具體問的是什麼考試的語料庫,我從自己考托福的角度出發,說說托福寫作語料庫的建立吧。

一、為什麼要建立自己的語料庫?

英語寫作雖然不要求像高考作文那樣寫800到1000字,但是對字數都還是有一定的要求的。要擺脫小學生作文,流水賬的作文,就必須給自己建立語料庫。

要麼,是給了你論點然後加上簡單的例子介紹(更適合口語)。比如說這樣乙個線上課程的語料:

如果不建議自己的語料庫的話,原封不動的套用,寫作根本拿不到高分。

二、如何建立自己的語料庫?

要建立自己的語料庫,首先要知道什麼樣的語料庫是自己的。我的建議是:論點千篇一律,例子貼近自己。

1、按照話題將語料庫分為論點和例子兩部分,在論點下面把自己能想到的例子都一句話總結在上面;

2、給例子都編上號碼,然後每乙個例子,都另起一頁,寫下具體內容。例如什麼時候發生了什麼事情,有哪些細節等等。

大概長這樣:

三、例子怎麼來?

解決了怎麼建立語料庫,那論點和例子要去**找?

1、論點

2、例子

例子可以說很讓人頭疼了,不同的論點舉什麼例子,側重點是什麼,都是不一樣的。記住:沒有所謂的萬能例子!寫作文套萬能例子,切論點還好,一旦和論點不切,很容易被判偏題或者抄襲。

那自己生活經驗有限,例子要怎麼來呢?

我的方式是:知乎和豆瓣

拿到乙個論點,有相關的經歷或者生活經驗,寫出來的例子更貼近自己的生活自然最好。如果沒有,我一般會去知乎或者豆瓣搜相關的話題,然後看各位知乎網友和豆友分享自己的經歷,覺得有意思的或者是我覺得能用的,我就會寫到我的語料庫裡。

當然,不侷限在知乎或者豆瓣,任何乙個分享經歷的平台都可以。比如跟旅遊相關的話題,我就會去查查驢友日記等等。

甚至,高考的作文素材幾百例都是有用的!

只要每個話題的每個論點,例子都是你自己建立的,在考試的時候你才能夠想起來,不至於出現上了考場,死活想不出例子的情況。

3、語料庫例子用中文還是英文?

英文!平時備考的時候對自己的要求高一點,不要偷懶。和我同期備考的乙個盆友,在做自己語料庫的時候,直接像上文我畫的草圖那樣,用中文寫。上了考場,中文在腦子裡打轉,但是一換成英文,寫出來的句子就非常的簡單。

而且在自己建立語料庫的時候,發現了不會寫的單詞或者是複雜句子的語法不確定,是能夠及時查及時糾正的,上了考場可就沒機會了!

所以平時備考的時候,千萬不要偷懶!!!一定要把中文的論點以及例子換成英文積累到自己的語料庫!

如何建語料庫 如何建立自己的語料庫?

謝邀。按照語料的語種,語料庫可以分成單語語料庫 雙語語料庫和多語語料庫。單語與雙語或多語語料庫之間的區別在於語料庫本身所包含的語言數量。凡語料僅為單一語言的語料庫屬於單語語料庫 語料為兩種語言的則稱為雙語語料庫 若兩種語言的文字互相是對方的譯文,則該語料庫屬於雙語平行語料庫 三種及三種以上的為多語語...

基於語料庫的工作

基於語料庫的工作 2013年11 月20日 21 28 詞幹化 諸如 sit,sits sat 這樣的詞是否應該被視作相同的詞?一般認為,這個想法在語義學上是有意義的。一般把這個過程成為詞幹化 ps 是否應該注意到 seated 和sit 之間的不強的關聯性呢?station 和stationary...

自然語言處理中語料庫的理解

語料庫中存放的是在語言實際使用中真實出現過的語言材料 語料庫是以電子計算機為載體承載語言知識的基礎資源 真實語料需要經過加工 分析和處理 才能成為有用的資源。語料庫 corpus,複數corpora 指經科學取樣和加工的大規模電子文字庫。借助計算機分析工具,研究者可開展相關的語言理論及應用研究 確定...