中華民國計算語言學學會


「語音資料庫」申請說明書





國語語音資料庫 MAT-160

  • 資料庫名稱:國語語音資料庫 MAT-160
  • 語音檔編輯程式:VEDITOR 3.0
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在1片光碟上。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$200元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



國語語音資料庫 MAT-400

  • 資料庫名稱:國語語音資料庫 MAT-400
  • 語音檔編輯程式:VEDITOR 4.0
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在1片光碟上。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$400元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

國語語音資料庫 MAT-2000Edu

  • 資料庫名稱:國語語音資料庫 MAT-2000Edu
  • 語音檔編輯程式:VEDITOR 4.1p
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在2片DVD。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$20,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

國語語音資料庫 MAT-2000Com

  • 資料庫名稱:國語語音資料庫 MAT-2000Com
  • 語音檔編輯程式:VEDITOR 4.1p
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在2片DVD。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 簽妥之授權使用協議書一式兩份。
  2. 工本費NT$100,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

國語語音資料庫 MAT-2500ExtV-Edu

  • 資料庫名稱:國語語音資料庫 MAT-2500ExtV-Edu
  • 語音檔編輯程式:VEDITOR, VAT2WAV
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在1片DVD。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$10,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單

國語語音資料庫 MAT-2500ExtV-Com

  • 資料庫名稱:國語語音資料庫 MAT-2500ExtV-Com
  • 語音檔編輯程式:VEDITOR, VAT2WAV
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上國語語音資料庫,包含語音檔編輯程式,存放在1片DVD。

國語語音資料庫(MATDB)係行政院國家科學委員會補助計畫執行之研究成果,授權由中華 民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協 議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 簽妥之授權使用協議書一式兩份。
  2. 工本費NT$100,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



麥克風語料庫 TCC-300Edu

  • 資料庫名稱:麥克風語料庫 TCC-300Edu
  • 語音檔編輯程式:VEDITOR 5.0
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上麥克風語料庫,包含語音檔編輯程式,存放在1片數位影像光碟(DVD)上。

麥克風語料庫係國立台灣大學李琳山教授、國立成功大學王駿發教授及國立交通大學陳信宏 教授提供,授權由中華民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出 申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$1,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



麥克風語料庫 TCC-300Com

  • 資料庫名稱:麥克風語料庫 TCC-300Com
  • 語音檔編輯程式:VEDITOR 5.0p
  • 申請說明書 (PDF檔)
  • 簡介 (PDF檔)
以上麥克風語料庫,包含語音檔編輯程式,存放在1片數位影像光碟(DVD)上。

麥克風語料庫係國立台灣大學李琳山教授、國立成功大學王駿發教授及國立交通大學陳信宏 教授提供,授權由中華民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出 申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 簽妥之授權使用協議書一式兩份。
  2. 工本費NT$100,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



台灣口音英語語料庫(EAT)

EAT語料庫,依PSTN、MIC16K及GSM三組不同的CHANNEL共存放在三張DVD光碟中, 其中PSTN及GSM語料放在同一張光碟中並且標示為PSTN+GSM、 MIC16K語料,因SAMPLING RATE較高語料量較大, 故依英語系及非英語系分開存放在兩張不同的光碟上,分別標示Mic16K English及Mic16K NonEnglish。

EAT語料庫為中華民國計算語言學學會版權所有 。申請人需向中華民國計算語言學學會提出 申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務單位開立身份證明書,學術研究單位者申請內文需言明所申請之「台灣口音英語語料庫」確實僅用於研究,不作商業用途。
  2. 授權使用協議書(學術單位一般企業)一式兩份。
  3. 工本費
    • 國內非營利研究單位:NT$40,000元
    • 國內一般單位:NT$400,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



台灣口音英語語料庫(EAT-200)

EAT 200 語料,依PSTN,MIC16K及GSM三組不同的CHANNEL共存放在三個資料夾中並且標示為PSTN,GSM, MIC16K 且各性別目錄下的語料,則依提示卡號,每一個提示卡號皆有一個存放目錄,在提示卡號目錄下則存放聲音檔(.wav)及聲音內容標示檔(.lab), 其中.wav為標準的windows wave檔格式,其檔頭大小為56 bytes,而sampling rate依不同channel有不同的sampling rate, 取樣點則皆為16Bits解析度。

EAT-200語料庫為中華民國計算語言學學會版權所有 。申請人需向中華民國計算語言學學會提出 申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務單位開立身份證明書,學術研究單位者申請內文需言明所申請之「台灣口音英語語料庫」確實僅用於研究,不作商業用途。
  2. 授權使用協議書(學術單位一般企業)一式兩份。
  3. 工本費
    • 國內非營利研究單位:NT$10,000元
    • 國內一般單位:NT$100,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



中文廣播新聞語料庫 MATBN

民國90年8月至93年7月間,國內從事語音處理研究之相關學校及研究單位聯合執行國科會語料蒐集計畫-『中文自發性語音語料庫之建立』(Spontaneous Mandarin Speech: Corpus and Processing;計畫編號:NSC-90-2213-E-009-109, NSC-91-2219-E-009-039, NSC-92-2213-E-009-021),參與的單位共有國立交通大學電信工程學系、國立台灣大學電機工程學系、國立清華大學電機工程學系、國立成功大學電機工程學系、中央研究院資訊科學研究所、工研院前瞻研究中心及中華電信研究所。該計畫完成一個MATBN中文廣播新聞語料庫,語料來源是198個小時之公共電視晚間新聞,內容包括音檔、人工標記及文字轉寫(transcription)。為讓該項成果與國內外從事中文語音處理研究之單位分享,計畫執行團隊將MATBN語料庫技轉予本學會,授權本學會發行予各界使用。



申請文件及費用:

  1. 由服務單位開立身份證明書,學術研究單位者申請內文需言明所申請之「中文廣播新聞語料庫」確實僅用於學術研究,不作商業用途。
  2. 授權使用協議書(下載)一式兩份。
  3. 工本費:NT$40,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



口語韻律語料庫暨工具平台庫(COSPRO & Toolkit)

  • 資料庫名稱:口語韻律語料庫暨工具平台庫(COSPRO & Toolkit)
  • 簡介(DOC檔)

「中央研究院口語韻律語料庫暨工具平台」(Sinica Continuous Speech Prosody Corpora & Toolkit,簡稱COSPRO & Toolkit),係中研院語言所鄭秋豫教授多年從事語流韻律研究所收集的國語連續語流語料及依研究需要所發展的工具平台 (1994-2005)。基於學術資源共享之理念與促進語音科學研究與技術能有突破性發展之初衷,於2006年即釋出本語料庫與工具平台,原由民間公司—艾爾科技公司(L Labs Inc.)發行,現基於語料管理與學術能見度考量,於今(2011)年2月重新授權予中華民國計算語言學學會發行,僅供國內外學術研究單位使用。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協議書, 並同意確實遵守協議書上之約定條款。



申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之中央研究院口語韻律語料庫暨工具平台僅用於研究,不作商業用途。
  2. 授權使用協議書一式兩份。
  3. 工本費:國內非營利研究機構或單位:NT$1,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



亞洲口音英語跨國語音資料庫—中研院語言所台灣二語英語語料庫(AESOP-ILAS)

  • 資料庫名稱:亞洲口音英語跨國語音資料庫—中研院語言所台灣二語英語語料庫(AESOP-ILAS)
  • 資料庫簡介

AESOP-ILAS語料庫為「亞洲口音英語跨國語音資料庫AESOP(Asian English Speech cOrpus Project)國際聯盟」的台灣二語英語部分,語料蒐集計畫主持人為中研院語言所特聘研究員兼所長鄭秋豫。本語料庫不以音段或某特定或個別語音特徵為目標,而以音節、詞組、片語、短句與多短語語段等各級不同大小的語言層次及單位,強調較全面性、具溝通訊息的韻律現象及語音特徵,以期提供更豐富的語音分析與評量指標。基於學術資源公開共享之理念,於2015年4月釋出,提供國內外學術研究單位使用,可供英語教學、語音研究、語音建模、語音辨識與合成等多方面學術應用。

本資料庫之智慧財產權屬中央研究院,授權中華民國計算語言學學會發行,僅供國內外學術研究單位使用。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之亞洲口音英語跨國語音資料庫AESOP僅用於研究,不作商業用途。
  2. 授權使用協議書一式兩份。
  3. 工本費:國內非營利研究機構或單位:NT$1,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



中研院漢語對話語音語料庫(Sinica MCDC8)

中研院漢語對話語音語料庫(Sinica MCDC8)包含八個對話之聲檔與文字轉記檔。文字轉記檔以PRAAT格式儲存,具有人工驗證之段落時間標記。語料庫相關訊息請參考現代漢語語音語料庫研究網頁(http://mmc.sinica.edu.tw/)。中研院漢語對話語音語料庫係由中央研究院補助執行之研究成果,授權由中華民國計算語言學學會發行。申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協議書, 並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之「中研院漢語對話語音語料庫」僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式三份
  3. 工本費(已申購Sinica MCDC者,另有優惠)
    • 國內學術機構
      • 會員:NT$50,000元
      • 非會員:NT$52,000元
    • 國內一般機構
      • 會員:NT$150,000元
      • 非會員:NT$160,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



中研院具音段標記之中文對話語音資料庫
(Sinica Phone-aligned Chinese Conversational Speech Database)

  • 資料庫名稱:中研院具音段標記之中文對話語音資料庫
    (Sinica Phone-aligned Chinese Conversational Speech Database)
  • 資料庫簡介範例
「中研院具音段標記之中文對話語音資料庫(Sinica Phone-aligned Chinese Conversational Speech Database)」包含3.5小時,16人的帶音段標記之對話語音資料。包含音節與音段時間標記的文字檔案以PRAAT格式儲存 (.TextGrid)。所有標記邊界皆經過人工驗證。此資料庫為Sinica MCDC8的一部分。語料庫相關訊息請參考現代漢語語音語料庫研究網頁(http://mmc.sinica.edu.tw/)。本資料庫原始內容之智財權由中央研究院持有。公開授權資料以.wav與.TextGrid檔案儲存。本資料庫得到中央研究院授權由中華民國計算語言學學會發行。申請人需向學會提出申請,簽妥非營利授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之「中研院具音段標記之中文對話語音資料庫」僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式三份
  3. 工本費
    • 國內學術機構
      • 會員:NT$30,000元
      • 非會員:NT$30,500元
    • 國內一般機構
      • 會員:NT$300,000元
      • 非會員:NT$302,000元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



北科大電子書語音語料庫(NTUT-AB01)

  • 資料庫名稱:北科大電子書語音語料庫(NTUT-AB01)
  • 簡介(PDF檔)
  • 範例(ZIP檔)
北科大電子書語音語料庫(NTUT AB01)為台北科技大學廖元甫教授收集錄製,語料庫包含:
  1. 中文-幾乎全中文的書籍《理所當為:成就公平正義的社會》,作者為洪蘭,遠流出版公司。
  2. 英文-重新錄製 CMU(Carnegie Mellon University)-ARCTIC 語料庫,總共1132句全英文句子,此語料庫其音素資料量很平均,是一個標準英文語料庫。
  3. 中英夾雜-文本由工研院提供,主要是為了彌補中英轉換間的連貫文脈資訊,他們擷取網路上中英夾雜的句子,在此我們以人工選用3050句來錄製。
本語料庫已經由廖元甫教授授權中華民國計算語言學學會發行,申請人需向中華民國計算語言學學會提出申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務單位開立身份證明書,學術研究單位者申請內文需言明所申請之「北科大電子書語音語料庫」確實僅用於研究,不作商業用途。
  2. 授權使用協議書(非營利機構一般機構)一式兩份。
  3. 工本費用:
  • 國內非營利機構:NT$40,000元(三片光碟)
    1. 中文語料:NT$25,000元。
    2. 英文語料:NT$2,000元。
    3. 中英文夾雜語料:NT$13,000元。
  • 國內一般機構:NT$200,000元(三片光碟)
    1. 中文語料:NT$125,000元。
    2. 英文語料:NT$10,000元。
    3. 中英文夾雜語料:NT$65,000元。
  • 國外非營利機構:US$2,000元(三片光碟)
    1. 中文語料:US$1,250元。
    2. 英文語料:US$100元。
    3. 中英文夾雜語料:US$650元。
  • 國外一般機構:US$10,000元(三片光碟)
    1. 中文語料:US$6,250元。
    2. 英文語料:US$500元。
    3. 中英文夾雜語料:US$3,250元。
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



國語連續數字語音資料庫

  • 資料庫名稱:國語連續數字語音資料庫
  • 簡介 (doc檔)
國語連續數字為中華電信研究所版權所有 。申請人需向中華民國計算語言學學會提出 申請,簽妥授權使用協議書,並同意確實遵守協議書上之約定條款。 

申請文件及費用:

  1. 由服務機關開立身份證明書,內文需言明所申請之國語語音資料庫確實僅用於研究,不作商業用途。
  2. 簽妥之授權使用協議書一式兩份。
  3. 工本費NT$200元
 備妥申請文件後請郵寄至:
11529台北市研究院路二段128號中研院資訊所(轉)
中華民國計算語言學學會 收


付款方式:

  1. 郵政劃撥:帳號:19166251,戶名:中華民國計算語言學學會
  2. 支票:請加註『中華民國計算語言學學會』抬頭
  3. 信用卡:請填寫信用卡付款單



會址:115台北市南港區研究院路二段128號 中研院資訊所(轉),交通資訊
電話:02-27883799*1502, 傳真:02-27881638,電子信箱:aclclp@aclclp.org.tw