NTCIR Project
NTCIR-10 PatentMT(特許翻訳テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR ホーム] [NTCIR データ Home]


NTCIR-10 PatentMT (特許機械翻訳テストコレクション)



NTCIR-10 特許機械翻訳テストコレクションは,特許情報を対象とする中国語->英語 (C to E),日本語−>英語 (J to E),英語->日本語 (E to J)の機械翻訳を評価するためのテストコレクションです.

このテストコレクションは,次のようなデータから成ります.

文書データは,日本公開特許公報全文1993-2005年と米国特許庁特許全文1993-2005年です.いずれも図表情報は含みません.

コレクション 言語ペア 文書データ タスクデータ
ジャンル ファイル名 言語 年度 文書数 サイズ 評価
タイプ
翻訳課題 参照訳 人手判定 開発データ 訓練データ
言語 件数 言語 件数 件数 言語 件数 言語 件数
NTCIR-10 PatentMT C to E 特許全文 Patent grant data published from USPTO E 1993 - 2005     IE C 2300文 E 2300文 300文
*
adequacy: 16 システム
acceptability: 9システム
C-E 2000文対 C-E*** 約100万文対
PEE 29特許     3システム
ChE 2000文 E 2000文  
ME 2000文 E 2000文  
J to E   IE J 2300文 E 2300文 300文
*
adequacy: 18 システム
acceptability: 9システム 
J-E 2000文対 J-E 3,186,284文対
PEE 29特許     3システム
ChE/ME 2000文 E 2000文  
E to J 特許全文 Publication of unexamined patent applications J 1993 - 2005 IE E 2300文 J 2300文 300文
*
adequacy: 14 システム
acceptability: 9システム
ChE 2000文 J 2000文  

*** ワークショップタスク参加者以外の方:覚書の提出により、有料で入手することができます。使用目的その他関連するリクエストの詳細について、特許管理者 (Ms Janice Chong) [] 宛てにメールをお送りください。

ファイル名 年度 配布方法
Publication of
unexamined patent
applications
日本公開特許公報全文 1993-1997年 NTCIR-4 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
日本公開特許公報全文 1998-2002年 NTCIR-5 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
日本公開特許公報全文 2003-2005年 NTCIR-8 PATMT: ファイル転送等の電子的手段による配布
Patent grant
data published
from USPTO
米国特許庁特許全文 1993-2002年 NTCIR-6 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
米国特許庁特許全文 2003-2005年 NTCIR-8 PATMT: ファイル転送等の電子的手段による配布


文書データ, 検索課題および適合判定

 文書データ 

日本公開特許公報全文 1993-2005

1993〜2005年に特許庁から発行された日本語の公開特許公報全文データです.

米国特許庁特許全文 1993-2005

1993〜2005年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.


 


詳細は,NTCIR-10 PatentMTウェブサイトNTCIR-10 PatentMT Task Definition およびタスク統括論文 をご覧ください.

入手方法

お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項 ---

テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで利用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での利用を許諾していただきました.我々研究者は,今後も継続して文書データが研究に利用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って利用してください.