音素バランス文・語 一覧
音声分析・認識の研究で使われている各種の音素バランス文・語を集めたものです.できるだけ少ない語数・文数で音素出現のバランスをとるために,それぞれ工夫がなされています.
- ATR503文
- 2音素連鎖402種と3音素連鎖223種計625種をバランス良く含む.
- 磯健一,渡辺隆夫,桑原尚夫「音声データベース用文セットの設計」音講論(春) pp. 89-90 (1988.3).
- 匂坂芳典,浦谷則好「ATR音声・言語データベース」音響誌,48巻, 12号, pp. 878-882 (1992).
- 2音素連鎖402種と3音素連鎖223種計625種をバランス良く含む.
- ATR216語
- 3モーラ以上から成り,可能な2音韻の連鎖をすべて含む.
- 武田一哉,匂坂芳典,片桐滋,桑原尚夫「研究用日本語音声データベースの構築」音響誌,44巻, 10号, pp. 747-754 (1988).
- 3モーラ以上から成り,可能な2音韻の連鎖をすべて含む.
- 電総研492/1542語
- VCV等の3音素並びをできるだけ少ない語数でバランス良く含む.
- 1542語の方は492語を含みさらに促音を含む3音素並びも考慮している.
- 田中和世,速水悟「電総研の研究用音声データベース」音響誌,48巻, 12号, pp. 883-887 (1992.12).
- 東北大・松下212語
- すべての音素環境が出現するように選択したもの.
- 牧野正三,二矢田勝行,真船裕雄,城戸健一「東北大・松下単語音声データベース」音響誌,48巻, 12号, pp. 899-905 (1992.12).
- すべての音素環境が出現するように選択したもの.
- 東北大・松下3285語
- JRの駅名や鉄道路線名から選んだもの.
- 秋葉国夫,入間野孝雄,金指久則,真船裕雄「日本語音声認識研究用音声データベース」昭和57年度電子通信学会総合全国大会予稿1391, page 5-376 (1982).
- 牧野正三,二矢田勝行,真船裕雄,城戸健一「東北大・松下単語音声データベース」音響誌,48巻, 12号, pp. 899-905 (1992.12).
- JRの駅名や鉄道路線名から選んだもの.
- JEITA(梅田リスト準拠)
- 音素バランス2音節語と3音節語計1350語
- 音声入出力方式専門委員会「音声合成システム性能評価法」電子情報技術産業協会規格JEITA IT-4001 (社)電子情報技術産業協会(2003.2).
- 鳥井規子「日本語によるPBリスト」日本電信電話公社 電気通信研究所 経過資料 第484号(1956).
- 渡辺俊朗,長渕裕実,北脇信彦「規則合成音声の了解性評価に用いる単語リストの構成法」信学論A, Vol. J71-A, No. 3, pp. 616-623 (1988.3).
- 音素バランス2音節語と3音節語計1350語
- 名工大 英語文
- 小説・ニュース・会話・PCS・SUSの5ジャンルを含み,各ジャンル50文からなるもので,音声合成コンテストBlizzard Challengeで用いられた.
- PCS:
- Phonetically confusable sentences, 音声的に混同しやすい文
- SUS:
- Semantically unpredictable sentences, 合文法無意味文.
- A. Black, K. Tokuda, “The Blizzard Challenge- 2005: Evaluating corpus-based speech synthesis on common datasets,” Proc. Interspeech 2005, pp. 77-80, Lisbon, Portugal (Sep. 4-8, 2005).
- 小説・ニュース・会話・PCS・SUSの5ジャンルを含み,各ジャンル50文からなるもので,音声合成コンテストBlizzard Challengeで用いられた.
- 名工大 中国語文
- 英語と同様の趣旨で作成されBlizzard Challengeで使用されたもの.