中華民國計算語言學學會


「中央研究院漢語平衡語料庫」申請說明書


中央研究院漢語平衡語料庫(簡稱Sinica Corpus)第4.0版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為1981年到2007年之間的文章。 本語料庫得中央研究院授權中華民國計算語言學學會發行,申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。本語料庫可透過網路查詢
簡介及範例

申請文件:

  1. 由服務單位或就讀學校開立身份證明書,內文需言明本資料庫僅使用於個人或單位之學術研究,絕不使用於營利商業用途。
  2. 備妥一式兩份授權使用協議書(本會與申請人各執乙份)

工本費用:


付款方式:
  1. 郵政劃撥:帳號:19166251,戶名:社團法人中華民國計算語言學學會
  2. 支票:請加註『社團法人中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

備妥申請文件後請郵寄至:
中華民國計算語言學學會
115022台北市南港區舊莊街一段3巷34號1樓


會址:115022台北市南港區舊莊街一段3巷34號1樓
電話:02-27881638, 傳真:02-26519386,電子信箱:aclclp@aclclp.org.tw