中華民國計算語言學學會
「中文分詞語料庫」申請說明書
中文分詞語料庫為一包含兩百萬詞、不含詞類標記的語料庫,每個文句皆根據分詞原則來斷
詞。而此分詞原則,乃是中華民國計算語言學學會在經濟部中央標準局委辦的「資訊處理用
中文分詞規範調查研究及草案研擬」計畫中所訂定的。本語料庫來源包括書面語和口語兩部
分,其中資訊類佔21%。
申請文件:
- 由服務單位或就讀學校開立身份證明書,內文需言明本資料庫僅使用於個人或單位之學術研究,絕不使用於營利商業用途。
- 備妥一式兩份授權使用協議書(本會與申請人各執乙份)
語料庫工本費用:
- 國內學術單位-個人:NT$500
- 國內學術單位-團體(1-10人使用):NT$5,000
付款方式:
- 郵政劃撥:帳號:19166251,戶名:社團法人中華民國計算語言學學會
- 支票:請加註『社團法人中華民國計算語言學學會』抬頭
- 信用卡:請填寫信用卡付款單
備妥申請文件後請郵寄至:
中華民國計算語言學學會
115022台北市南港區舊莊街一段3巷34號1樓
|
會址:115022台北市南港區舊莊街一段3巷34號1樓
電話:02-27881638, 傳真:02-26519386,電子信箱:[email protected]