中華民國計算語言學學會


「中央研究院漢語平衡語料庫」申請說明書


中央研究院漢語平衡語料庫(簡稱Sinica Corpus)第4.0版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為1981年到2007年之間的文章。語料庫得中央研究院及中華民國行政院國家科學委員會補助,由中央研究院中文詞知識庫小組執行、研究,並授權中華民國計算語言學學會發行。申請人需向學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。本語料庫可透過網路查詢簡介及範例

申請文件:

  1. 由服務單位或就讀學校開立身份證明書,內文需言明本資料庫僅使用於個人或單位之學術研究,絕不使用於營利商業用途。
  2. 備妥一式兩份授權使用協議書(本會與申請人各執乙份)

工本費用:


付款方式:
  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

備妥申請文件後請郵寄至:
中華民國計算語言學學會
台北市南港區研究院路二段128號
中央研究院資訊所(轉)


會址:115台北市南港區研究院路二段128號 中研院資訊所(轉),交通資訊
電話:02-27883799*1502, 傳真:02-27881638, 電子信箱:aclclp@hp.iis.sinica.edu.tw;aclclp@aclclp.org.tw