パターン認識特論(2006年度)

授業科目, www.kameda-lab.org 2006/12/06

本授業について

本講義は2006年度2学期に、 筑波大学大学院システム情報工学研究科知能機能システム専攻の 1・2年生を想定して開講されます。

担当:掛谷英紀・亀田能成
教室:3B304
時間:火曜2、3時限目(10:10-11:25, 12:15-13:30)


日程

これは予定ですので、不意に変更されることがあります。

月/日担当概要
09/0501亀田・掛谷概要 クラスタリング(線形と非線形)
09/1202亀田パターン認識の基礎 高次元データにおける識別
09/1903掛谷
09/2604亀田SVM
10/0305亀田非線形SVM,次元の呪い
10/1006掛谷
10/1707亀田粒子フィルタ=逐次モンテカルロ=ConDensation
10/2408掛谷
10/3109掛谷
10/3110神嶌データマイニング
11/1411−−予備日(休講)
11/21(試験)(掛谷)実施します

第10回はデータマイニングの専門家である産業技術総合研究所の 神嶌敏弘 氏からのご講演です。


講義資料

ここに用意した講義資料(*.pdf)は、受講者が使用するためのものです。 再配布ならびに受講者以外の閲覧は理由の如何を問わず認めません。

【学外からのアクセス不可】*.tsukuba.ac.jpからアクセスできます。
(まだ学内から見えない場所があれば連絡してください。)


第10回講義

特別講義:データマイニングと機械学習

概要

計算機や通信技術の進展と,社会の情報化に伴って, 整理されていない膨大なデータが蓄積されている. こうした背景を基に,データマイニングは,1990年代に, 機械学習,統計,データベースなどの分野の中から生じた動きである. これは,膨大な情報の中から,再利用可能な高次の情報を抽出しようとする, 実用面を重視したデータの解析技術である. 本講義では,従来の機械学習や統計分野との違いや, データマイニング分野の性質を考慮した手法を紹介をする.

開催情報
2006/11/7(火), 10:10-, 3B304
本学大学院在籍者であれば聴講随意です。奮って来聴ください。


レポート課題

各自の計算機環境でSVMを実行し、その結果を示せ。

・線形、非線形の両方の実験結果を載せること。
 非線形の場合の関数モデルは多項式やRBF等どれを用いてもいいが、
 使用した関数モデルとその次数(制御変数)を明記すること。

・Soft Marginについても値を明記すること。

・Toolやパッケージを利用した場合、その説明をすると共に、
 出所が明らかになるようなURL等を示すこと。

・データについて
 2次元散布データを2セット各自で用意すること。
 Positive/Negative点は共に10個以上(程度)用意すること。
 セット1:線形分離可能な散布
 セット2:線形分離不可能な散布

・結果の表示について
 下記の6パターンについて結果を2次元散布図で示せ。
 境界を図示すること。
 なお、2Lについては当然Soft Marginを適切に設定する必要がある。
 (分離に失敗した点が含まれていてもよい。)
  (11/10以後の提出者は、それぞれの結果に対して解説をすること。)

   データ   線形   非線形(次数小) 非線形(次数大) 
   セット1  1L   1NA     2NB
   セット2  2L   2NA     2NB


・提出方法
 結果をpdf形式でレポートにまとめる。
 pdfファイルはkameda[at]iit.tsukuba.ac.jpまで送付すること。
 メールの題名は「パターン認識特論レポート」とすること。

・課題提出締切日(変更しました)
 2006/11/26, 24:00

試験情報

試験予定日:2006年11月21日(水)
試験時間:10:10-
場所:3B304
※遅刻は30分までしか認めません
※退出は30分後から認めます
※持ち込みは一切禁止


授業評価


SVM リンク集

皆さんが使ったSVMのツールおよびライブラリです。

http://svm.dcs.rhbnc.ac.uk/pagesnew/GPat.shtml
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
http://www.bi.a.u-tokyo.ac.jp/~tak/libsvm.html
http://www.procoders.net/en/Procoders/open_source/pcSVMdemo
http://www.cs.ucl.ac.uk/staff/M.Sewell/svmdark/
http://ida.first.fraunhofer.de/~anton/software.html
http://lmb.informatik.uni-freiburg.de/people/haasdonk/KerMet-Tools/index.en.html?1100001000100001


授業内容

2006/04/05現在の情報です。
英名               Advanced Pattern Recognition 

担当教員           掛谷英紀(かけやひでき)、亀田能成(かめだよしなり)
電子メール         kake [at] esys.tsukuba.ac.jp, kameda [at] iit.tsukuba.ac.jp
オフィスアワー     3M205/3M304, weekday (いつでも構いませんが、不在が多いので事前連絡して頂いたほうがよいです)
 
科目番号(前期)     01CD404
科目番号(一貫)     02CD024
分野               コミュニケーションシステム
授業形態           講義
 
履修年次           1・2
開講年度
学期               2
単位数             2単位
時限               火2、3
教室               未定
 
● 授業概要
 パターン認識の基本アルゴリズムを踏まえ、より理論的に高度な
手法を解説する。具体的には、時系列データの取り扱い、EMアル
ゴリズム、情報量基準とモデル選択、クラスタリング、並列計算手
法などについて学習する。

● 予備知識
パターン認識の基礎的知識があるほうがよい。

● 受講生の到達レベル
最近よく用いられるパターン認識の技術を習得し、その特徴を理解
できるようになる。

● キーワード
クラスタリング,データマイニング,EMアルゴリズム,隠れマルコフモデル

● 授業内容
(内容は変更される可能性があります)

クラスタリング(線形と非線形)
高次元データにおける識別
データマイニング
多数データエントリを前提にした識別
Expectation Maximization Algorithm
情報量基準とモデル選択
隠れマルコフモデルによる識別1
隠れマルコフモデルによる識別2
その他の時系列データ識別法

● 教科書
特に定めないが、授業中に必要な資料は配布する。

● 参考書 
授業中に適宜紹介する。

● 成績評価 
レポートを提出し、期末試験で所定の成績を収めること。

kameda [at] iit.tsukuba.ac.jp