NTCIR Project
NTCIR-8 PATMT(特許翻訳)評価サブタスクテストコレクション
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-8 PATMT (特許翻訳) 評価サブタスクテストコレクション



特許情報を対象として、日→英の機械翻訳を評価するためのテストコレクションです.
次のようなデータから成っています.
 


コレクション サブタスク フェーズ タスクデータ 件数 言語
NTCIR-8 PATMT AE* 訓練

原文データ

100文
(日本国公開特許公報) 
J

参照訳データ

100文
(米国特許庁特許データ)
E
機械訳データ 100文×11システム E
人手評価データ (adequacy) 100文×11システム×3人 -
人手評価データ (fluency) 100文×11システム×3人 -
課題

原文データ

100文
(日本国公開特許公報) 
J

参照訳データ

100文
(米国特許庁特許データ)
E
機械訳データ 100文×12システム E
人手評価データ (adequacy) 100文×12システム×3人 -
人手評価データ (fluency) 100文×12システム×3人 -
追加 追加参照訳 100文×3人 E

AE* 評価サブタスク

--- 全データをNIIから提供します.
 

入手方法

お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項 ---

テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで利用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での利用を許諾していただきました.我々研究者は,今後も継続して文書データが研究に利用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って利用してください