[Date Prev][Date Next][Date Index]
[ntcir:114] CFP: NTCIR Workshop 4 !
- To: ntcir@xxxxxxxxx
- Subject: [ntcir:114] CFP: NTCIR Workshop 4 !
- From: Noriko Kando <kando@xxxxxxxxx>
- Date: Tue, 04 Mar 2003 11:29:02 +0900
[English Announcement] March 4, 2003
Call for Participation
The 4th NTCIR Workshop
Evaluation of Information Access Technologies:
Information Retrieval, Question Answering, and Summarization
Meeting: Late May 2004
http://research.nii.ac.jp/ntcir-ws4/
The Online Registration for the 4th NTCIR Workshop has now started!
Participation is invited from anyone interested in research on
information access technologies, such as retrieval from large-scale
test collections various genres, cross-lingual information retrieval
of Asian languages, question answering and text summarization of
Japanese texts. NTCIR Workshops are periodical event which are held
once par one and half years.
TASKS: NTCIR-4 selected the following 5 areas of research as "Tasks".
1. Cross-Lingual Information Retrieval Task (CLIR)
Multilingual CLIR, Bilingual CLIR and Pivot Bilingual CLIR, and
Single language IR
Languages: Traditional Chinese, Korean, English and Japanese
2. Patent Retrieval Task (PATENT)
Main task: Invalidity Search
Feasibility study: a step for Patent Map Automatic Creation
3. Question Answering Task (QAC)
"5 Possible Answers", "Only One Answer" and "Follow-up Questions"
4. Text Summarization Task (TSC)
Multiple document summarization. The details to be announced later.
5. Web Task (WEB)
Informational retrieval, Navigational retrieval, Geographical
information, Topical classification
TEST COLLECTIONS:
CLIR collection includes Traditional Chinese, Korean, Japanese, English
documents published in East Asia in 1998-1999. The size of the English
and Korean document collections were increased than NTCIR-3, and the
Korean document collection published in the same year range is vailable.
PATENT collection has been extended to 10-year collection of Japanese
patent and English abstracts. NTCIR-3 PATENT, the test collection used
in PATENT at NTCIR-3 (2-year fulltext and 5-year English and
Japanese abstracts) is available for training as well as research
purpose use.
QAC and TSC use Japanese newspaper articles, published in 1998-1999,
and the number of the newspaper sources has been increased, i.e.,
using the news articles from two different newspapers.
WEB uses NW100G-01, the same Web document collection as those for
NTCIR-3. 100 GB web documents crawled in November 2001 in '.jp' domain.
OFFICIAL LANGUAGE:
The official language for the proceedings papers and the Workshop
meeting is English. Announcements will be in English, or English
and Japanese.
MEETING & PROCEEDINGS:
The final proceedings will be published online as well as printed-form.
The selected best papers will be recommended to a special issue on
NTCIR-4, ACM Transaction on Asian Language Information Processing
(ACM-TALIP).
IMPORTANT DATES:
2003-03-20: Registration Due
2003-03-30: Document Data Release
Each task's evaluation schedule varies. The formal run at each task
is planned sometime during October, 2003 -- January, 2004.
2004-02-20: Evaluation Results Release
2004-03-19: Deadline of Camera-ready manuscript for Working Notes of
the Meeting
Late May 2004: Meeting, NII, Tokyo, Japan
FOR DETAILS, PLEASE VISIT http://research.nii.ac.jp/ntcir-ws4/
You are most welcome!
Noriko Kando
ntcir project
---------------------------------------------------------------------
[Japanese Announcement] March 4, 2003
タスク参加者募集
第4回NTCIRワークショップ
情報アクセス技術の評価: 情報検索、質問応答、テキスト要約
成果報告会: 2004年5月下旬
http://research.nii.ac.jp/ntcir-ws4/work-ja.html
第4回NTCIRワークショップは、タスク参加登録を開始しました! WEB、特許、
新聞記事などの大規模なテストコレクションを用いた検索、アジア言語と英語の
言語横断検索、質問応答、テキスト要約に関心のある研究グループは、どなたで
も歓迎します。どうぞ、奮ってご参加ください。ワークショップは、およそ1年
半に1回開催します。
●タスク: 第4回NTCIRワークショップは、次の5つの研究部門を「タスク」と
して選択しました。
1. 言語横断検索タスク (CLIR)
多言語/二言語間言語横断検索、ピボット言語横断検索、単言語検索
言語:中国語(繁体字)、韓国語、日本語、東アジアで刊行された英語
2. 特許検索タスク (PATENT)
基本タスク:無効資料調査
実現可能性調査タスク:特許マップ自動作成を目指して(1)
3. 質問応答タスク (QAC)
5つの回答候補、全正解を1セット、連続質問(枝問)
4. テキスト要約タスク (TSC)
複数文書要約の評価 (詳細は後ほどお知らせします)
5. Webタスク (WEB)
情報指向検索、ナビゲーション指向検索、地理情報、トピック分類
●テストコレクション:
CLIRコレクションの文書データは、1998-1999年に出版された中国語(繁体字)、
韓国語、日本語、(東アジアで刊行された)英語の新聞記事です。 NTCIR-3と
くらべて英語と韓国語のデータ規模が拡大しました。韓国語は他の言語と同じ出
版年のデータが利用できます。4言語ほぼ匹敵する規模の文書データを用いて評
価を行います。
PATENTコレクションは、特許と英文抄録10年分に拡張しました。 NTCR-3 PATENT
(NTCIR-3の特許タスクで使用したテストコレクション)は、訓練用データして
利用できます。
QACとTSCは、1998-1999年に出版された日本語新聞記事データを使用します。新
聞を同年代の2種類に増やしました。
WEBは、NW100G-01(NTCIR-3で使用したのと同じ文書データセット)を使用しま
す。.jpドメインでクロールした100 GBの文書データです。
●成果報告会と論文集:
会議録は、電子版と冊子体の双方で刊行します。優秀な論文は、ACM
Transaction on Asian Language Information Processing (ACM-TALIP)の
NTCIR-4特集号に推薦されます。
●使用言語:
会議録論文集と成果報告会の使用言語は、英語です。
アナウンスは、英語、もしくは、英語と日本語の二カ国語です。
●日程:
2003-03-20: タスク参加申込み締め切り
2003-03-30: 文書データ配布開始
スケジュールは各タスクごとにことなります。概ね、評価は2003年の
10月〜2004年1月の間になる予定です。
2004-02-20: 評価結果を各参加者に返送
2004-03-19: 成果報告会用のWorking Notes paperのカメラレディ原稿しめきり
2004-05 下旬: 成果報告会 (東京、国立情報学研究所)
詳しくは、下記をご参照ください!
http://research.nii.ac.jp/ntcir-ws4/work-ja.html
よろしくお願いいたします。
神門 典子
ntcir project
------------------------------------------------------