第4回NTCIRワークショップ
タスク概要
[English] [NTCIR-4]
タスク − テストコレクション − 参加申込み − 成果報告会と会議論文集NEW! − 使用言語 − 日程NEW!

はじめに:

NTCIRは、情報検索、言語横断情報アクセス、テキスト要約、質問応答などの「情報アクセス技術」研究の評価ワークショップシリーズです。大規模な再利用可能なテストコレクション、評価の基盤、研究者のフォーラムを用意することによって、これらの研究を促進することを目的としています。「情報アクセス」は、伝統的な文書検索から、利用者による文書中の情報活用までを含みます。プロジェクトの初期から、日本語や東アジア言語のテキストを対象とした研究と、アジア諸言語と英語の間の言語横断応用に力をいれてきました。ワークショップは、およそ1年半に1回開催します。

タスクとテストコレクションの詳細は、参加者募集と各タスクのwebサイトでご案内します。

タスク:

第4回NTCIRワークショップは、次の5つの研究部門を「タスク」として選択しました。詳しくは下記のリンクから、各タスクの参加者募集をご覧ください。

1. 言語横断検索タスク (CLIR)
中国語(繁体字)、韓国語、日本語、英語の新聞記事を用いた多言語言語横断検索、二言語間言語横断検索、ピボット言語横断検索、単言語検索
2. 特許検索タスク (PATENT)
基本タスク:無効資料調査。実現可能性調査タスク:特許マップ自動作成を目指して(1)
3. 質問応答タスク (QAC)
タスク1:5つの回答候補を優先順位付きで提出
タスク2:全正解を1セットのみ提出(回答漏れ、不適切な回答はいずれも減点)
タスク3:連続して入力されたと想定される複数の質問(枝問)
4. テキスト要約 タスク(TSC)
複数文書要約の評価を計画中  参考:TSCのHPはこちら
5. Webタスク (WEB) (暫定版)
A. 情報指向検索
B. ナビゲーション指向検索
C. 地理情報
D. トピック分類


テストコレクション:

CLIRのテストコレクション中の文書データは、1998-1999年に出版された中国語(繁体字)、韓国語、日本語、(東アジアで刊行された)英語の新聞記事です。 英語と韓国語のデータ規模が拡大しました。韓国語は他の言語と同じ出版年のデータが利用できます。4言語ほぼ匹敵する規模の文書データを用いて評価を行います。NTCIR-3 CLIR (NTCIR-3のCLIRタスクで使用したテストコレクション)を、訓練用データとして配布します。

PATENTのテストコレクションは、特許と英文抄録10年分に拡張しました。 NTCR-3 PATENT(NTCIR-3の特許タスクで使用したテストコレクション)は、訓練用データして利用できます。

QACとTSCは、1998-1999年に出版された日本語新聞記事データを使用します。新聞の種類を増やし、同年代に出版された2紙の異なる新聞の記事データを使用すします。

WEBは、NW100G-01(NTCIR-3で使用したのと同じ文書データセット)を使用します。NTCIR-3 WEB(NTCIR-3のWeb検索タスクで使用したテストコレクション)は、訓練用データとして利用できます。

第4回NTCIRワークショップで使用するデータの詳細については、NTCIR-4データHomeをご参照ください。

参加申込み方法

タスク参加方法の説明をご参照ください。オンライン参加申込みは「タスク参加方法の説明」のページからリンクされています。

成果報告会と論文集:

正式版プロシーディングスのフォーマット -> Please click here for the instruction

WORKING NOTES のフォーマット -> Please click here for the instruction

使用言語:

重要な日程:

DATE   SCHEDULE NOTE
2003-02-10   タスク参加者募集(言語横断検索特許検索 Done
2003-02-21   タスク参加者募集(質問応答QAC Done
2003-02-20
2003-03-03
2003-03-06
  参加者用覚書配布 Done
2003-03-01   タスク参加者募集(詳細版) Done
2003-03-20   タスク参加申込み締め切り
Done
2003-03-24   タスク参加申込み締め切り期限を4/20まで延期
*4月20日以降にタスク参加申込みをされる場合は、プログラム委員長神門 典子(kando)またはNTCIR事務局ntc-secretariatまでご連絡ください。
Done 
2003-03-30   文書データ配布開始 Done
スケジュールは各タスクごとにことなります。概ね、評価は2003年の10月〜2004年1月の間になる予定です。
2004-02-20   評価結果を各参加者に返送  
2004-03-31 成果報告会用のWorking Notes のカメラレディ原稿しめきり**  
2004-06-02/04 成果報告会 (東京、国立情報学研究所)  
2004-07-31 NEW! 会議論文集(正式版)用カメラレディ原稿提出  
2004-10月 NEW! 会議論文集(正式版)公刊 (印刷版およびオンライン版)  
2005-03-31までに   タスクデータおよびテストコレクションの研究目的利用(ワークショップ参加者以外)  

**: 優秀な論文は、ACM Transaction on Asian Language Informarion Processing (ACM-TALIP)の特集号に推薦されます。


[English] [NTCIR-4]
ntc-admin
Last modified: 2004-07-06
modified: 2004-03-03
modified: 2003-07-16
modified on: 2003-03-25
Started on:2003-02-20