中華民國計算語言學學會


「中文分詞語料庫」申請說明書


中文分詞語料庫為一包含兩百萬詞、不含詞類標記的語料庫,每個文句皆根據分詞原則來斷 詞。而此分詞原則,乃是中華民國計算語言學學會在經濟部中央標準局委辦的「資訊處理用 中文分詞規範調查研究及草案研擬」計畫中所訂定的。本語料庫來源包括書面語和口語兩部 分,其中資訊類佔21%。

申請文件:

  1. 由服務單位或就讀學校開立身份證明書,內文需言明本資料庫僅使用於個人或單位之學術研究,絕不使用於營利商業用途。
  2. 備妥一式兩份授權使用協議書(本會與申請人各執乙份)

語料庫工本費用:


付款方式:
  1. 郵政劃撥:帳號:19166251,戶名:社團法人中華民國計算語言學學會
  2. 支票:請加註『社團法人中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

備妥申請文件後請郵寄至:
中華民國計算語言學學會
115022台北市南港區舊莊街一段3巷34號1樓


會址:115022台北市南港區舊莊街一段3巷34號1樓
電話:02-27881638, 傳真:02-26519386,電子信箱:[email protected]