中華民國計算語言學學會
「中文分詞語料庫」申請說明書
中文分詞語料庫為一包含兩百萬詞、不含詞類標記的語料庫,每個文句皆根據分詞原則來斷
詞。而此分詞原則,乃是中華民國計算語言學學會在經濟部中央標準局委辦的「資訊處理用
中文分詞規範調查研究及草案研擬」計畫中所訂定的。本語料庫來源包括書面語和口語兩部
分,其中資訊類佔21%。
請備妥下列文件寄至:
中華民國計算語言學學會
台北市南港區研究院路二段128號
中央研究院資訊所(轉)
申請文件:
- 由服務單位開立身份證明書,內文需言明本資料庫僅使用於個人或單位之研究,絕不使用於商業用途。
- 備妥一式兩份授權使用協議書(本會與申請人各執乙份)
語料庫工本費用:
- 會員:免費申請(請出具『中華民國計算語言學學會』會員資格證明)
- 非會員:
- 國內:工本費NT$500
- 國外:工本費 US$50
- 國內團體(1-10人使用):工本費NT$5,000
- 國外團體(1-10人使用):工本費US$500
付款方式:
- 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
- 支票:請加註『中華民國計算語言學學會』抬頭
- 信用卡:請填寫信用卡資料
|
|
會址:115台北市南港區研究院路二段128號 中研院資訊所(轉),交通資訊
電話:02-27883799*1502, 傳真:02-27881638, 電子信箱:aclclp@hp.iis.sinica.edu.tw