NTCIR Project
NTCIR-7 Patent Mining (特許マイニング)
テストコレクション
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR Home] [NTCIR DATA Home]


NTCIR-7 Patent Mining

Test Collection
本タスクでは,日本語または英語論文抄録に,特許分類体系のひとつである 国際特許分類(IPC)のコードを自動的に付与します.このテストコレクションは, 以下の4つのサブタスクを評価するためのものです.

文書データは,日本国公開特許公報全文1993-2002年,日本国公開特許英文抄録 データPAJ 1993-2002年,米国特許庁特許全文1993-2002年,国内65学会の発表論文著者抄録1988-1997年,論文著者抄録の追加データ1997-1999年,研究費成果報告書1988-1997年です.いずれも図表情報は含みません.
コレクション タスク 文書データ タスクデータ
ジャンル ファイル名 言語 年度 文書数 サイズ 検索課題 適合判定
言語 件数
NTCIR-7 PATMN MINING 特許全文 Publication of unexamined patent applications J 1993-2002 3,496,252 94.5GB J

日本語/
言語横断(E2J)
976


2
論文抄録 ntc1-je JE 1988-1997 339,483 577MB
ntc1-j J 332,918 312MB
ntc1-e E 187,080 218MB
ntc2-j J 1986-1999 400,248 600MB
ntc2-e E 134,978 200MB
特許抄録 Patent Abstracts of Japan (paj) E 1993-2002 3,496,252 5,482MB E

英語/
言語横断(J2E)
976


2
特許全文 Patent grant data published from USPTO E 1993-2002 1,315,470 52.6 GB
論文抄録 ntc1-je JE 1988-1997 339,483 577MB
ntc1-j J 332,918 312MB
ntc1-e E 187,080 218MB
ntc2-j J 1986-1999 400,248 600MB
ntc2-e E 134,978 200MB

*全データをNIIから提供します.

Publication of
unexamined patent
applications
NTCIR-4 PATENT および NTCIR-5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布
NTCIR-4 PATENT: 日本公開特許公報全文1993-1997年
NTCIR-5 PATENT: 日本公開特許公報全文1998-2002年
ntc1-je
ntc1-j
ntc1-e
NTCIR-1テストコレクション CD-ROMによる配布
ntc2-j
ntc2-e
NTCIR-2 テストコレクション CD-ROMによる配布:
Patent Abstracts of Japan (paj) NTCIR-4/5 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布
NTCIR-4/5 PATENT: 日本語公開特許英文抄録データ PAJ 1993-2002
Patent grant
data published
from USPTO
NTCIR-6 PATENT DVD-ROM, またはファイル転送等の電子的手段による配布
NTCIR-6 PATENT:米国特許庁特許全文1993-2002年
ntc1-je
ntc1-j
ntc1-e
NTCIR-1テストコレクション CD-ROMによる配布
ntc2-j
ntc2-e
NTCIR-1テストコレクション CD-ROMによる配布

文書データ, 検索課題および適合判定

日本公開特許公報全文 1993-2002

1993〜2002年に特許庁から発行された日本語の公開特許公報全文データです.


日本語公開特許英文抄録データ PAJ 1993-2002

JAPIO抄録(特許公報中の出願人抄録をもとに専門家が作成した抄録)を英訳した抄録です.


米国特許庁特許全文 1993-2002

1993〜2002年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.


NTCIR-1 言語横断検索タスクテストコレクション 1998-1997

1988〜1997年に発表された国内65学会の発表論文著者抄録データです.


NTCIR-2 言語横断検索タスクテストコレクション 1986-1999

1988〜1997年に発表された国内65学会の発表論文著者抄録データおよび1988〜2002年の研究費成果報告書データです.


(1) 日本語サブタスク / 言語横断サブタスク (J2E)

検索課題

ひとつの課題が日本語の論文表題と抄録で構成されており,計978課題あります.

適合判定

978課題は,非常に適合度の高いIPCコードが付与された525課題から成るグループAと,適合度の高いIPCコードが付与された451課題から成るグループBから構成されています.

(2) 英語サブタスク / 言語横断サブタスク (E2J)

検索課題

ひとつの課題が英語の論文表題と抄録で構成されており,計978課題あります.

適合判定

978課題は,非常に適合度の高いIPCコードが付与された525課題から成るグループAと,適合度の高いIPCコードが付与された451課題から成るグループBから構成されています.

[データ利用申込]

お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項---

テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで使用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での使用を許諾していただきました.我々研究者は,今後も継続して文書データが研究に使用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って使用してください.

[ENGLISH] [NTCIR ホーム] [このページの先頭] [NTCIR データ Home]

Updated on : 2010-11-06
ntc-admin