[Date Prev][Date Next][Date Index]

[ntcir:120] NTCIR-3 PATENT is available for research purpose use





[English Announcement]

Dear All,

We are grad to announce that the NTCIR-3 PATENT task Test collection
is available for research purpose.

For details, please consult:
http://research.nii.ac.jp/ntcir/permission/perm-en.html


It was used for the Patent Retrieval Task at the previous NTCIR
Workshop (NTCIR-3) and will be used as a training data for
the comming workshop (NTCIR-4).

It consists of the following document collections, 31 topics,
and relevance judgments of each of the 31 topics on the document
collection of (1), and so on.


DOCUMENT COLLECTIONS:

(1) Fulltext of "Publication of Unexamined Japanese Patent Application"
   (1998, 1999) (in Japanese)  697,262 documents (18GB)
(2) JAPIO Patent Abstracts
     (1995-1999) (in Japanese) 1,706,154 documents (18139MB)
(3) Patent Abstracts Japan 
     (1995-11999) (in English) 1,701,339 documents (2711MB)

Documents in "Patent Abstracts Japan" prepared by human experts
by translating the documents in "JAPIO Patent Abstracts". So the
documents in these files are exactly translated Japanese-English
pairs.


Topic creation and relevance judgments were done by professional
patent search intermediaries from the Japan Intellectual Property
Association as joint research project with NII.

Each topic contains a newspaper article reporting an invention or
technology as well as ordinary TREC-type topic compornents
like <TITLE>, <DESC>, <NARR>, etc. So the collection can be used
to test the search effectiveness of "cross-genre" retrieval, in which
the related patents are retrieved by given newspaper article, as
well as testing the effectivenss of ordinary topic-initiated
retrieval.


HOW TO OBTAIN THE COLLECTION:

To obtain the data, please send;
(a) application form by email, and
(b) two sets of signed, original user agreement forms by postal mail
to NII.

For details, please consult:
http://research.nii.ac.jp/ntcir/permission/perm-en.html

(a) application form:
http://research.nii.ac.jp/ntcir/permission/ntc3patenttc-app-e.txt

(b) user agreement form:
http://research.nii.ac.jp/ntcir/permission/ntc3patenttc-agrmnt-e.pdf


Please notice that the test collection can be used
"research purpose" only. It can not be used for "information
purpose" nor "commercial purpose". With various reasons,
small number of document records were discard from the original
database, therefore the completeness of the document collection
is NOT guaranteed.


This test collection has many unique characteristics, and we do hope
you will enjoy the research using this collection.



NTCIR-3 Patent Retrieval Task Organizers:
Makoto Iwayama, Atushi Fujii, Akihiko Takano, Noriko Kando

------

[Japnese Announcement]

NTCIR MLの皆さま

NTCIR-3 PATENT task Test collectionが、ワークショップ
参加者以外の方にも研究目的で利用可能となりました。


申込み手続きは下記をごらんください。

http://research.nii.ac.jp/ntcir/permission/perm-ja.html


これは、前回のNTCIRワークショップ(NTCIR-3)の特許検索タスク
で使用したテストコレクションです。現在、参加申込み受付中の
NTCIR-4の同タスクの訓練用データとして使用できます。



このコレクションには、下記の文書セット、31件の検索課題(検索質問)、
各検索課題について下記の(1)の文書セットの適合文書IDのリスト、
などが含まれます。

文書データ:

(1) 公開特許公報全文データ 
  (1998, 1999) (in Japanese) 697,262 documents (18GB)
(2) JAPIO出願抄録データ(1995-1999) (in Japanese)
    1,706,154 documents (18139MB)
(3) 日本国公開特許英文抄録データPAJ(1995-11999) (in English)
    1,701,339 documents (2711MB)


PAJの文書データは、JAPIO出願抄録データを人間の専門家が、翻訳
したものです。

検索課題と正解判定は、日本知的財産協会とNIIの共同研究として、
同協会の知的財産情報検索委員会メンバの特許専門家の協力により
構築されました。


各検索課題には、新聞記事が含まれており、新聞記事から関連する
特許を検索する「ジャンル横断検索」の有効性の評価実験に使用
できます。また、通常の情報検索用テストコレクションの検索課題
に含まれる<TITLE>, <DESC>, <NARR>などの項目も含まれており、
通常の検索質問からの検索の有効性評価にも使用することができます。




利用申請:

テストコレクションの研究利用目的の利用申請には、次の2点が必要です。
。
(a) 申込書(メイルで送る)application form by email, and
(b) データ使用許諾のための覚書。署名押印済みのものを2部。(郵送で)


詳しい手続きは下記をご覧ください。
http://research.nii.ac.jp/ntcir/permission/perm-ja.html

(a) 申込書:
http://research.nii.ac.jp/ntcir/permission/ntc3patenttc-app-j.txt

(b) データ使用許諾のための覚書:
http://research.nii.ac.jp/ntcir/permission/ntc3patenttc-agrmnt-j.pdf


注意事項:

このテストコレクションは、「研究目的」に限って使用することが
できます。情報源としての利用や営利目的での利用は認められて
いません。ご注意ください。

なお、様々な理由により、元の特許データベースから削除されている
文書レコードがあります。全出願特許を網羅していることは保証され
ていないことにもご留意ください。






NTCIR-3 特許検索タスクオーガナイザ:
岩山 真、藤井 敦、高野 明彦、神門 典子