音素バランス文・語 一覧

音声分析・認識の研究で使われている各種の音素バランス文・語を集めたものです.できるだけ少ない語数・文数で音素出現のバランスをとるために,それぞれ工夫がなされています.

  1. ATR503文
    • 2音素連鎖402種と3音素連鎖223種計625種をバランス良く含む.
      • 磯健一、渡辺隆夫、桑原尚夫「音声データベース用文セットの設計」音講論(春) pp. 89-90 (1988.3).
      • 匂坂芳典,浦谷則好「ATR音声・言語データベース」音響誌、48巻, 12号, pp. 878-882 (1992).
  2. ATR216語
    • 3モーラ以上から成り,可能な2音韻の連鎖をすべて含む.
      • 武田一哉、匂坂芳典、片桐滋、桑原尚夫「研究用日本語音声データベースの構築」音響誌、44巻, 10号, pp. 747-754 (1988).
  3. 電総研492/1542語
    • VCV等の3音素並びをできるだけ少ない語数でバランス良く含む.
    • 1542語の方は492語を含みさらに促音を含む3音素並びも考慮している.
      • 田中和世、速水悟「電総研の研究用音声データベース」音響誌、48, 12, 883-887 (1992.12).
  4. 東北大・松下212語
    • すべての音素環境が出現するように選択した.
      • 牧野正三、二矢田勝行、真船裕雄、城戸健一「東北大・松下単語音声データベース」音響誌、48, 12, 899-905 (1992.12).
  5. 東北大・松下3285語
    • JRの駅名や鉄道路線名から選んだ.
      • 秋葉国夫、入間野孝雄、金指久則、真船裕雄「日本語音声認識研究用音声データベース」昭和57年度電子通信学会総合全国大会予稿1391, page 5-376 (1982).
      • 牧野正三、二矢田勝行、真船裕雄、城戸健一「東北大・松下単語音声データベース」音響誌、48巻, 12号, pp. 899-905 (1992.12).
  6. JEITA(梅田リスト準拠)
    • 音素バランス2音節語と3音節語計1350語
      • 音声入出力方式専門委員会「音声合成システム性能評価法」電子情報技術産業協会規格JEITA IT-4001 (社)電子情報技術産業協会(2003.2).
      • 鳥井規子「日本語によるPBリスト」日本電信電話公社 電気通信研究所 経過資料 第484号(1956).
      • 渡辺俊朗、長渕裕実、北脇信彦「規則合成音声の了解性評価に用いる単語リストの構成法」信学論A, Vol. J71-A, No. 3, pp. 616-623 (1988.3).
  7. 名工大 英語文
    • 小説・ニュース・会話・PCS・SUSの5ジャンルを含み,各ジャンル50文からなるもので,音声合成コンテストBlizzard Challengeで用いられた.
      PCS:
      Phonetically confusable sentences, 音声的に混同しやすい文
      SUS:
      Semantically unpredictable sentences, 合文法無意味文.
      • A. Black, K. Tokuda, “The Blizzard Challenge- 2005: Evaluating corpus-based speech synthesis on common datasets,” Proc. Interspeech 2005, pp. 77-80, Lisbon, Portugal (Sep. 4-8, 2005).
  8. 名工大 中国語文
    • 英語と同様の趣旨で作成されBlizzard Challengeで使用されたもの.
  9. NTT-AT1000短文