中華民國計算語言學學會
「中央研究院漢語平衡語料庫」申請說明書
中央研究院漢語平衡語料庫(簡稱Sinica Corpus)第4.0版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為1981年到2007年之間的文章。
本語料庫得中央研究院授權中華民國計算語言學學會發行,申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。本語料庫可透過網路查詢。
簡介及範例
申請文件:
- 由服務單位或就讀學校開立身份證明書,內文需言明本資料庫僅使用於個人或單位之學術研究,絕不使用於營利商業用途。
- 備妥一式兩份授權使用協議書(本會與申請人各執乙份)
工本費用:
- 國內學術研究機構-個人:NT$5,000元
- 國內學術研究機構-團體(2-10人使用):NT$25,000元
- 國內學術研究機構-團體(11人以上使用):NT$62,500元
付款方式:
- 郵政劃撥:帳號:19166251,戶名:社團法人中華民國計算語言學學會
- 支票:請加註『社團法人中華民國計算語言學學會』抬頭
- 信用卡:請填寫信用卡付款單
備妥申請文件後請郵寄至:
中華民國計算語言學學會
115022台北市南港區舊莊街一段3巷34號1樓
|
會址:115022台北市南港區舊莊街一段3巷34號1樓
電話:02-27881638, 傳真:02-26519386,電子信箱:[email protected]