NTCIR Project
ツール
xie2ntc.pl

[ENGLISH] [NTCIR Home] [NTCIR Tools Home]


xie2ntc.pl

入手したXinhua English新聞記事データのフォーマットをNTCIR 用に変換するためのスクリプトです。

1.Xinhua English 新聞記事データの入手方法
ワークショップ参加者以外の新規申込の方は、NTCIRテストコレクションで使用するXinhua English新聞記事データ(1998-2001)をLinguistic Data Consortium (LDC) より、研究目的用で購入できます。

Linguistic Data Consortium (LDC):http://www.ldc.upenn.edu/

2.NTCIR用記事データへの変換
 
1.で入手した記事データを、NTCIRテストコレクション用文書データとして使用するために、下記のURLよりスクリプトをダウンロードし、フォーマットをNTCIR用に変換してください。       
      
スクリプト: xie2ntc2.pl (Xinhua English 98-99, 00-01用)
http://research.nii.ac.jp/ntcir/tools/xie2ntc2.pl_txt
スクリプト: xie2ntc.pl (Xinhua English 98-99用)
http://research.nii.ac.jp/ntcir/permission/ntcir-4/script/xie2ntc.pl_txt
README
http://research.nii.ac.jp/ntcir/permission/ntcir-4/script/READMEforXinhuaScript.txt