NTCIR Project
NTCIR-8 Patent Mining (特許マイニング テストコレクション)
データ利用手続き (研究目的用)

[ENGLISH] [NTCIR Home] [NTCIR DATA Home]


NTCIR-8 Patent Mining (特許マイニング テストコレクション)

Test Collection

本タスクは,論文と特許から技術動向マップを自動的に作成することを目的とし ています.本タスクには以下の2つのサブタスクが含まれます.

(1) 学術論文分類サブタスク

日本語または英語論文抄録に,特許分類体系のひとつである 国際特許分類(IPC)のコードを自動的に付与します.このテストコレクションは, 以下の4つの課題を評価するためのものです.

(2) 技術動向マップ作成サブタスク

日本語または英語の論文抄録および特許概要から,要素技術と効果に関する表現(文字列)を抽出します. このテストコレクションは,以下の2つの課題を評価するためのものです. 文書データは,日本国公開特許公報全文1993-2002年,日本国公開特許英文抄録データPAJ 1993-2002年,米国特許庁特許全文1993-2002年,国内65学会の発表論文著者抄録1988-1997年,論文著者抄録の追加データ1997-1999年,研究費成果報告書1988-1997年です.いずれも図表情報は含みません.


コレクション タスク 文書データ タスクデータ
ジャンル ファイル名 言語 年度 文書数 サイズ 検索課題 適合判定
judge
言語 件数
NTCIR-8 PATMN MINING 特許全文 Publication of unexamined patent applications J 1993-2002 3,496,252 94.5GB J

(1) 学術論文分類サブタスク
日本語
644/
言語横断(E2J)
624

(2) 技術動向マップ作成サブタスク
日本語
1000


1
論文抄録 ntc1-je JE 1988-1997 339,483 577MB
ntc1-j J 332,918 312MB
ntc1-e E 187,080 218MB
ntc2-j J 1986-1999 400,248 600MB
ntc2-e E 134,978 200MB
特許抄録 Patent Abstracts of Japan (paj) E 1993-2002 3,496,252 5,482MB E

(1) 学術論文分類サブタスク
英語624/
言語横断(J2E)
644

(2) 技術動向マップ作成サブタスク
英語
1000


1
特許全文 Patent grant data published from USPTO E 1993-2002 1,315,470 52.6 GB
論文抄録 ntc1-je JE 1988-1997 339,483 577MB
ntc1-j J 332,918 312MB
ntc1-e E 187,080 218MB
ntc2-j J 1986-1999 400,248 600MB
ntc2-e E 134,978 200MB

*全データをNIIから提供します.

ファイル名 年度 配布方法
Publication of
unexamined patent
applications
1993-1997年 NTCIR-4 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
1998-2002年 NTCIR-5 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
Patent Abstracts of Japan (paj) 1993-2002年 NTCIR-4/5 PATENT: DVD-ROMまたはファイル転送等の電子的手段による配布
Patent grant
data published
from USPTO
1993-2002年 NTCIR-6 PATENT: DVD-ROMによる配布
ntc1-je ntc1-j ntc1-e 1988-1997年 CD-ROM: NTCIR-1 Test Collection: CD-ROMによる配布
ntc2-j ntc2-e 1986-1999年 CD-ROM: NTCIR-2 Test Collection: : CD-ROMによる配布

文書データ, 検索課題および適合判定

日本公開特許公報全文 1993-2002

1993〜2002年に特許庁から発行された日本語の公開特許公報全文データです.


日本語公開特許英文抄録データ PAJ 1993-2002

JAPIO抄録(特許公報中の出願人抄録をもとに専門家が作成した抄録)を英訳した抄録です.


米国特許庁特許全文 1993-2002

1993〜2002年に米国特許庁から発行された特許全文データです.特許として成立した出願だけです.


NTCIR-1 言語横断検索タスクテストコレクション 1998-1997

1988〜1997年に発表された国内65学会の発表論文著者抄録データです.


NTCIR-2 言語横断検索タスクテストコレクション 1986-1999

1988〜1997年に発表された国内65学会の発表論文著者抄録データおよび1988〜2002年の研究費成果報告書データです.


(1) 学術論文分類サブタスク

(a) 日本語 / 言語横断 (J2E)

課題

ひとつの課題が日本語の論文表題と抄録で構成されており,計644課題あります.

(b) 英語 / 言語横断 (E2J)

課題

ひとつの課題が英語の論文表題と抄録で構成されており,計644課題あります.


(2) 技術動向マップ作成サブタスク

(a) 日本語

課題

ひとつの課題が日本語の論文表題と抄録で構成されており,計500課題あります.
ひとつの課題が日本語特許の発明の名称と概要で構成されており,計500課題あります.

(b) 英語

課題

ひとつの課題が英語の論文表題と抄録で構成されており,計500課題あります.
ひとつの課題が英語特許の発明の名称と概要で構成されており,計500課題あります.

[データ利用申込]


お申込み --- テストコレクションの申込み方法は次の通りです.NIIから配布するものはいずれも無料です.

必要書類 ---   

参考書類 ---   

「覚書」送付先 ---

〒101-8430
東京都千代田区一ツ橋2-1-2
国立情報学研究所  
NTCIR事務局 (1309号室)

Phone: 03-4212-2750
FAX: 03-4212-2751

注意事項 ---テストコレクションに含まれる文書データは,作成機関等から有償または無償でNTCIRで利用するために提供されたものです.いずれも,著作権があり,商品としての価値もあるものですが,情報アクセス研究におけるテストコレクションの重要性に鑑み,とくに,研究目的での利用を許諾していただいきました.我々研究者は,今後も継続して文書データが研究に利用できるように,文書データ作成・提供機関からの信頼に応え,良好な関係を保つことが重要です.そのため,覚書,利用申請書,利用規定等をよく理解し,文書データ作成・提供機関の権利を侵害しないように十分に配慮し,研究目的に限って利用してください.


[ENGLISH] [NTCIR ホーム] [このページの先頭] [NTCIR データ Home]

Updated on : 2010-08-18
ntc-admin