9. IPSJ SIG-SLP 雑音下音声認識評価環境 (CENSREC)

9-c. マルチモーダル音声認識評価環境 (CENSREC-1-AV)

提供機関, プロジェクト

(社)情報処理学会 音声言語情報処理研究会 雑音下音声認識評価ワーキンググループ

コーパスの内容

話者数, 発声回数

学習データ :
42名(男性22名,女性20名),計3,234発話
テストデータ :
51名(男性25名,女性26名),計1,963発話

音声・画像ファイルフォーマット

音声 :
WAV形式(16kHz・16bit・Mono)
画像 :
Windows BMP形式(横81ピクセル×縦55ピクセル,口唇付近のみ) カラー画像-24bitRGB/近赤外線画像-8bitグレースケール

配布媒体

DVD 2枚

利用範囲

研究・開発目的に限る

配布価格

無償

詳細情報

http://www.slp.cs.tut.ac.jp/CENSREC/ja/CENSREC/CENSREC-1-AV/

サンプル音声・画像

音声: CENSREC-1と同様の連続数字1~7桁の読み上げ音声データ

画像: 音声とともに収録した口唇画像データ

画像データの一例(上:カラー画像,下:近赤外線画像)

コーパスリストへ