[Date Prev][Date Next][Date Index]

[ntcir:133] NLC講習会のお知らせ



[Japanese Message only]

----------------------------------------------------------------------
(重複して受け取られた方はご容赦ください)

産総研の秋葉と申します。

電子情報通信学会『言語理解とコミュニケーション(NLC)』研究会では、下記
の通り、第2回情報科学技術フォーラム(FIT2003)にてチュートリアル講演を
企画しております。皆様ふるってご参加下さいますようご案内申し上げます。

######################################################################
              第2回情報科学技術フォーラム(FIT2003)
                   NLC主催チュートリアル企画
        「言語情報アクセス基盤技術としての機械学習」のご案内
######################################################################

1. 目的と内容

メディアの電子化、インターネット、そして近年のブロードバンドの普及に伴
い、電子化された言語データは増大し、膨大なデータの中から必要とする情報
にアクセスするための技術がますます重要となってきています。一方、機械学
習手法は、開発の省コスト性や手法の頑健さなどの利点から、近年自然言語処
理分野への適用が活発に研究され、機械翻訳、情報検索、データマイニング、
音声言語インターフェース等、種々の言語処理応用分野での共通の基盤技術と
して確立しつつあります。本チュートリアルは、当該分野の代表的研究者を講
師に迎え、言語処理研究や開発に携わる聴講者を対象に、機械学習の基礎と言
語処理技術への応用について、最近の研究から将来の展望までにわたり解説を
行ないます。

2. 開催日時: 2003年9月12日(金) 9:00〜12:00

3. 場所: 札幌学院大学(北海道江別市)
	メイン会場 (定員500人)

4. 主催: 電子情報通信学会, 情報・システムソサイエティ,
		言語理解とコミュニケーション研究会(NLC)

5. 参加費: 無料
	ただし、講演資料代(事前申し込み1500円, 当日3000円)
	資料数には限りがありますので、事前の申し込みをお願いします。
	(事前申し込みの締切は、9月5日(金)とさせていただきます。
	 また、FIT2003聴講参加費が別途必要です。
		http://www.ipsj.or.jp/katsudou/fit/fit2003.html)

6. プログラム

9:00〜10:00 村田昇 先生 (早稲田大学理工学部)
	「機械学習における統計的方法」

概要:
文字認識などの機械による認識問題は統計では判別分析の問題として一般には
定式化される.その学習能力はアルゴリズムによって実現される判別関数の表
現能力として解釈され,さまざまな方法によって統計的な性質を解析すること
ができる.計算量の爆発と汎化能力の低下を避ける手法として近年注目を集め
る集団学習のアルゴリズムは,統計モデルの作る空間をある適当な方向に拡大
していくアルゴリズムとして捉えられることができるが,こうした集団学習ア
ルゴリズムの中で特にベイズ統計と関連の深いバギングと,情報幾何学的に自
然な構造を持つブースティングを題材に,機械学習アルゴリズムを統計的な観
点から概説する.

10:00〜11:00 山西健司 先生 (NECインターネットシステム研究所)
	「テキストマイニング」

概要:
テキストマイニングはデータマイニング技術と自然言語処理技術が融合した技
術であり、大量のテキストデータから効率的に意味のある情報を抽出すること
を目指すものである。テキストマイニングの適用範囲は、 カスタマーサポー
トセンタでの問い合わせ分析や営業レポートの分析といったCRM分野を中心に、
マーケティング、ナレッジマネジメント、教育分野での知識構造化など幅広い
分野に渡っている。本講演では、テキストマイニングの要素技術の最新情報と
ビジネス応用に関する先端事例を紹介する。特に、以下の内容について概説す
る。1)テキスト分類技術とマーケティング応用: テキストマイニングの中で
も最も基本的な機能であるテキスト分類の手法の幾つかを説明し、マーケティ
ングにおける自由記述アンケート分析への応用事例を紹介する。2)評判分析
とWebマイニング: Webから評判情報を抽出して評判の原因を分析する「評判分
析ソリューション」について紹介する。Webからの知識発見の研究動向につい
ても紹介する。3)トピック分析: テキストデータの時系列から新しいトピッ
クを発見したり、情報潮流の形成を発見するための技術とそのモニタリングへ
の応用を紹介する。

11:00〜12:00 永田昌明 先生 (NTTサイバースペース研究所)
	「統計的自然言語処理」

概要:
本講演では、確率・統計的なアプローチによる自然言語処理の例として、形態
素解析・固有表現抽出・テキスト分類・機械翻訳の4つの要素技術を紹介する。
これらは、かな漢字変換・インターネット検索エンジン・迷惑メールフィルタ・
Webページ翻訳などの身近なアプリケーションの基盤技術であり、かつ、隠れ
マルコフモデル・最大エントロピーモデル・ブースティング・サポートベクト
ルマシンなどの代表的な機械学習アルゴリズムの典型的な応用例でもある。本
講演では、理論的な詳細よりも実際の応用例の説明を中心にして、機械学習理
論が言語情報アクセス技術にどのように応用されているかをできるだけ分かり
やすく解説したい。

7. 申し込み方法
	以下の申込書を電子メールで「NLC研究会秋葉(t-akiba@xxxxxxxxxx)」
	までお送り下さい。

---------- cut here ----------
FIT2003 NLCチュートリアル 参加申込書
住所:
所属:
氏名:
TEL:
FAX:
e-mail:
資料郵送先(郵送希望の場合):
---------- cut here ----------
(郵送希望の場合、講演後の発送となります。)

連絡先
	〒305-8568 つくば市梅園1-1中央2
		産業技術総合研究所 情報処理研究部門
		秋葉友良
		e-mail: t-akiba@xxxxxxxxxx


----------------------------------------------------------------------