[ENGLISH] [NTCIR ホーム][NTCIR データ home]
「タスクデータ」は、「MuST Corpus(タグなし)」「MuST Corpus」からなります。
MuST Corpus(タグなし)は、毎日新聞1998年、1999年の2年分より選ばれ、タスクデータ作成に用いた581記事です。この文書集合が動向情報の要約と可視化の元データになるという設定です。
動向情報の要約と可視化はユーザから関心が示されたトピックについてその動向を潔で平易な文章や視覚的なグラフで、もしくはそれらを協調させたマルチ
メディアプレゼンテーションで答えるものですから、ユーザの関心となるトピ ックが入力となります。 MuST Corpusとして提供される情報は、27のトピックについて
MuST Corpusは、「MuST:動向情報の要約と可視化に関するワークショップ」 ホームページにおいて、研究用データセットに含まれる動向情報コーパスとして参照されているものと同一物です。トピックの一覧、注釈の仕様及びサンプル、要約参考例のサンプルについては、そちらをご参照下さい。
*NIIからは、研究目的では「タスクデータ」(毎日新聞記事データ1998-1999より選ばれた581記事の文書セットおよびタスクセット)を配布します。
コレクション |
タスク |
文書データ |
タスク データ |
|||||||
ジャンル |
ファイル名 |
言語 |
年度 |
文書数 |
サイズ |
検索課題 |
タグ付けした 文書数 |
|||
言語 |
# |
|||||||||
NTCIR-6 MuST |
IE/analysis |
新聞記事 |
Mainichi |
J |
1998 1999 |
220,078 |
260MB |
J |
27 |
581 |
(A) | -- NIIから研究利用目的でデータ提供 |
(B) | --ワークショップ参加者以外の新規申込の方は日外アソシエーツ(株)および毎日新聞社より研究目的用CD-毎日新聞記事データが購入できます。 |
お申込み --- テストコレクションの申込み方法は次の通りです。NIIから配布するものはいずれも無料です。
- まず、「テストコレクション利用申込書」を、E-mailで、 ntc-secretariat宛 に送付して下さい。
- その後、利用許諾に関する「覚書」をメールで送付しますので、2部、かならず両面印刷で出力し、必要事項を記入し、署名および押印を して、以下の送付先 に郵送してください。
NII側の押印後、データの利用許諾を示すものとして1部を利用申込者にお送りし、1部をNIIで保管します。必要書類 ---
参考書類 ---
- テストコレクション利用申込書
- 覚書 (メールで送付します)(NTCIR-7 MuST用)
- NTCIR-6MuSTタスク統括論文
- Expansion of Multimodal Summarization for Trend Information -- Report on the first and second cycles of the MuST Workshop,
「覚書」送付先 ---
〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)
Phone: 03-4212-2750
FAX: 03-4212-2751
注意事項---