|
NTCIR-8 Meeting
言語資源展示
[English]
1 |
タイトル |
高度言語情報融合フォーラム |
団体名 |
高度言語情報融合フォーラム |
高度言語情報融合フォーラム (ALAGIN, http://www.alagin.jp) は音声・言語技術や、音声・言語資源を産学官で共有することを目指して2009年に設立されたフォーラムで、現在、企業約70社、大学関係者約100名のご参加をいただいております。本展示では、ALAGINで現在配信されている言語資源、言語資源構築の技術、および今後配信予定の言語資源、関連サービス、さらにセミナー等の活動についてご紹介します。 |
2 |
タイトル |
言語グリッド -世界の言語サービスを連携し、異文化コラボレーション活動を支援 |
団体名 |
京都大学大学院情報学研究科社会情報学専攻石田・松原研究室 |
言語グリッド(Language Grid)は、世界の言語資源(辞書、対訳、機械翻訳など)を登録し共有することができる、インターネット上の多言語サービス基盤です。
これまでの単体の機械翻訳システムと違い、利用者が開発した辞書や対訳を登録して連携させることができるため、利用の現場に応じた、より精度の高い翻訳結果が得られるという特徴を持っています。
この多文化共生社会や国際交流を支える多言語サービス基盤ソフトウェアは、独立行政法人情報通信研究機構(NICT)言語グリッドプロジェクトによって研究開発され、オープンソースとして公開しています。
詳しくは、次のサイトをご覧ください。http://langrid.nict.go.jp/
|
3 |
タイトル |
言語資源協会(GSK) |
団体名 |
言語資源協会(GSK) |
言語資源の普及・配布を推進するために言語資源協会(GSK)を運営しています。 GSKでは、言語に関する学術・教育・産業の発展に必要な言語資源(テキスト・音声
データ、辞書、専門用語集、音声・言語処理用ソフトウエアツール)の収集・配付お よび調査を行っています。個人では作成が困難である言語コーパス(データベース)
を組織的に大規模に整備・配付することにより、自然言語処理や音声処理を初めとす る、さまざまな研究の発展に寄与することができます。 |
4 |
タイトル |
『現代日本語書き言葉均衡コーパス』の設計および実装と予備的分析 |
団体名 |
国立国語研究所言語資源研究系・コーパス開発センター |
国立国語研究所言語資源系で開発中の『現代日本語書き言葉均衡コーパス』(BCCWJ)は、日本語に関する初めての均衡コーパスであり、2011年の公開を予定している。本発表では、BCCWJの設計と実装上のトピックを紹介するとともに予備的分析結果を報告する。予備的分析では特にブログテキストの言語的特性について報告する。 |
5 |
タイトル |
国立情報学研究所 情報学研究データリポジトリ |
団体名 |
国立情報学研究所 情報学研究データリポジトリ |
IDRでは、NIIの各組織・プロジェクトが提供している下記のデータセットの情報を集約して公開しています。本展示では、IDRが直接提供しているYahoo!データセットを中心に、これらをご紹介します。
・Yahoo!データセット
・NTCIRテストコレクション
・音声コーパス
・映像データベース |
6 |
タイトル |
国立情報学研究所 音声資源コンソーシアム |
団体名 |
国立情報学研究所 音声資源コンソーシアム |
我々が収集・配布を行っている、様々な機関やプロジェクトにより構築された音声コーパス(音声データやそのテキスト、ツール等を含む)についてご紹介します。言語資源の一つとして、情報アクセスの研究にもご活用下さい。 |
Last updated: June 01, 2010
|