[ENGLISH] [NTCIR ホーム][NTCIR データ home]
「タスクデータ」は、「MuST Corpus(タグなし)」「MuST Corpus」からなります。
MuST Corpus(タグなし)は、毎日新聞1998年、1999年の2年分より選ばれ、タスクデータ作成に用いた581記事です。この文書集合が動向情報の要約と可視化の元データになるという設定です。
動向情報の要約と可視化はユーザから関心が示されたトピックについてその動向を潔で平易な文章や視覚的なグラフで、もしくはそれらを協調させたマルチ
メディアプレゼンテーションで答えるものですから、ユーザの関心となるトピ ックが入力となります。 MuST Corpusとして提供される情報は、27のトピックについて
MuST Corpusは、「MuST:動向情報の要約と可視化に関するワークショップ」 ホームページにおいて、研究用データセットに含まれる動向情報コーパスとして参照されているものと同一物です。トピックの一覧、注釈の仕様及びサンプル、要約参考例のサンプルについては、そちらをご参照下さい。
*NIIからは、研究目的では「タスクデータ」(毎日新聞記事データ1998-1999より選ばれた581記事の文書セットおよびタスクセット)を配布します。
|
コレクション |
タスク |
文書データ |
タスク データ |
|||||||
|
ジャンル |
ファイル名 |
言語 |
年度 |
文書数 |
サイズ |
検索課題 |
タグ付けした 文書数 |
|||
|
言語 |
# |
|||||||||
|
NTCIR-6 MuST |
IE/analysis |
新聞記事 |
Mainichi |
J |
1998 1999 |
220,078 |
260MB |
J |
27 |
581 |
| (A) | -- NIIから研究利用目的でデータ提供 |
| (B) | --ワークショップ参加者以外の新規申込の方は日外アソシエーツ(株)および毎日新聞社より研究目的用CD-毎日新聞記事データが購入できます。 |
![]()
必要書類 ---
お問い合わせ ---
Email: idr-ntcir![]()
注意事項---