9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
9-a. 雑音重畳日本語連続数字 音声認識評価環境 (CENSREC-1/AURORA-2J)
データDOI
https://doi.org/10.32130/src.CENSREC-1
提供機関, プロジェクト
(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ
コーパスの内容
- AURORA-2(雑音環境下連続英語数字音声認識タスクの共通評価基盤)の日本語版
- AURORA-2 と同じ各1〜7個の数字列のリストを日本人により日本語読みで収録
- 学習データ : 4種類の雑音を clean 及び 20, 15, 10, 5dB の各SNRレベルで重畳
- テストデータ : 8種類の雑音を clean 及び 20, 15, 10, 5, 0, -5dB の各SNRレベルで重畳
- 上記音声データを対象とした音声認識実験を評価するための評価ツール
話者数, 発声回数
- 学習データ :
- 110名(男女各55名),計 8,440発話
- テストデータ :
- 104名(男女各52名),計 4,004発話
音声ファイルフォーマット
RAW形式(8kHz・16bit・Mono・BigEndian)
配布媒体
DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究・開発目的に限る
配布価格
無償
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
AURORA-2 と同じ各1~7個の数字列のリストを日本語読みで収録
雑音種類:地下鉄
発話内容:/ichi/
Clean / SNR 20dB / SNR 15dB / SNR 10dB / SNR 5dB / SNR 0dB / SNR -5dB
更新履歴
2006/10/31 提供開始
2019/03/18 オンライン配布開始