9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)
9-f. 残響下日本語連続数字 音声認識評価環境 (CENSREC-4)
データDOI
https://doi.org/10.32130/src.CENSREC-4
提供機関, プロジェクト
(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ
コーパスの内容
- ハンズフリー環境下における遠隔発話音声認識の課題の中で,残響に着目した残響下音声認識の評価環境.
- 基本セットとエクストラセットの2種類のデータ群より構成される.発話内容はCENSREC-1に準じている.
- 基本セット : CENSREC-1のクリーン環境で収録された音声にインパルス応答を畳み込んだシミュレーション評価.残響下連続数字発声データと評価ツールより構成される.
- エクストラセット : 基本セットに加算性雑音を重畳したマルチコンディションに対する評価.残響・雑音下連続数字発声データと実環境データで構成される.
収録環境
In-car,Office(研究室),Meeting room,Lounge,Elevator hall,Living room,Japanese style room,Japanese style bath
(エクストラセットの実環境データは In-car,Office,Meeting room,Lounge の4環境)
話者数, 発声回数
- 基本セット
- 学習データ :
- 110名(男女各55名),計 8,440発話
- テストデータ :
- 104名(男女各52名),計 4,004発話
- エクストラセット
- シミュレーションデータ :
- 基本セットと同一
- 実環境下収録データ :
- 10名(男女各5名),計 2,536発話
音声ファイルフォーマット
RAW形式(16kHz・16bit・Mono・BigEndian)
配布媒体
DVD 1枚 もしくは オンライン配布 (※NII-IDRのサイトに飛びます)
利用範囲
研究・開発目的に限る
配布価格
無償
入手方法
CD/DVD版の郵送をご希望の場合:「入手方法」ページ の案内に従いメールでお申し込みください.
オンライン配布をご希望の場合:NII-IDRのサイト のフォームよりお申し込みください.
サンプル音声
基本セット : CENSREC-1のクリーン環境で収録された音声にインパルス応答を畳み込んだデータ.
発話内容 | クリーン音声 | テストセットA | テストセットB |
---|---|---|---|
/ichi/ | clean | Office | Lounge |
/ichizero/ | clean | Elevator hall | Japanese style room |
/go/ | clean | In-car | Meeting room |
/saN/ | clean | Living room | Japanese style bath |
更新履歴
2008/03/17 提供開始
2019/03/18 オンライン配布開始