担当:掛谷英紀・亀田能成
教室:3B304
時間:火曜2、3時限目(10:10-11:25, 12:15-13:30)
月/日 | 回 | 担当 | 概要 |
09/05 | 01 | 亀田・掛谷 | 概要 クラスタリング(線形と非線形) |
09/12 | 02 | 亀田 | パターン認識の基礎 高次元データにおける識別 |
09/19 | 03 | 掛谷 | − |
09/26 | 04 | 亀田 | SVM |
10/03 | 05 | 亀田 | 非線形SVM,次元の呪い |
10/10 | 06 | 掛谷 | − |
10/17 | 07 | 亀田 | 粒子フィルタ=逐次モンテカルロ=ConDensation |
10/24 | 08 | 掛谷 | − |
10/31 | 09 | 掛谷 | − |
10/31 | 10 | 神嶌 | データマイニング |
11/14 | 11 | −− | 予備日(休講) |
11/21 | (試験) | (掛谷) | 実施します |
第10回はデータマイニングの専門家である産業技術総合研究所の 神嶌敏弘 氏からのご講演です。
ここに用意した講義資料(*.pdf)は、受講者が使用するためのものです。 再配布ならびに受講者以外の閲覧は理由の如何を問わず認めません。
【学外からのアクセス不可】*.tsukuba.ac.jpからアクセスできます。
計算機や通信技術の進展と,社会の情報化に伴って, 整理されていない膨大なデータが蓄積されている. こうした背景を基に,データマイニングは,1990年代に, 機械学習,統計,データベースなどの分野の中から生じた動きである. これは,膨大な情報の中から,再利用可能な高次の情報を抽出しようとする, 実用面を重視したデータの解析技術である. 本講義では,従来の機械学習や統計分野との違いや, データマイニング分野の性質を考慮した手法を紹介をする.
開催情報
2006/11/7(火), 10:10-, 3B304
本学大学院在籍者であれば聴講随意です。奮って来聴ください。
各自の計算機環境でSVMを実行し、その結果を示せ。 ・線形、非線形の両方の実験結果を載せること。 非線形の場合の関数モデルは多項式やRBF等どれを用いてもいいが、 使用した関数モデルとその次数(制御変数)を明記すること。 ・Soft Marginについても値を明記すること。 ・Toolやパッケージを利用した場合、その説明をすると共に、 出所が明らかになるようなURL等を示すこと。 ・データについて 2次元散布データを2セット各自で用意すること。 Positive/Negative点は共に10個以上(程度)用意すること。 セット1:線形分離可能な散布 セット2:線形分離不可能な散布 ・結果の表示について 下記の6パターンについて結果を2次元散布図で示せ。 境界を図示すること。 なお、2Lについては当然Soft Marginを適切に設定する必要がある。 (分離に失敗した点が含まれていてもよい。) (11/10以後の提出者は、それぞれの結果に対して解説をすること。) データ 線形 非線形(次数小) 非線形(次数大) セット1 1L 1NA 2NB セット2 2L 2NA 2NB ・提出方法 結果をpdf形式でレポートにまとめる。 pdfファイルはkameda[at]iit.tsukuba.ac.jpまで送付すること。 メールの題名は「パターン認識特論レポート」とすること。 ・課題提出締切日(変更しました) 2006/11/26, 24:00
試験予定日:2006年11月21日(水) 試験時間:10:10- 場所:3B304 ※遅刻は30分までしか認めません ※退出は30分後から認めます ※持ち込みは一切禁止
皆さんが使ったSVMのツールおよびライブラリです。
http://svm.dcs.rhbnc.ac.uk/pagesnew/GPat.shtml
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
http://www.bi.a.u-tokyo.ac.jp/~tak/libsvm.html
http://www.procoders.net/en/Procoders/open_source/pcSVMdemo
http://www.cs.ucl.ac.uk/staff/M.Sewell/svmdark/
http://ida.first.fraunhofer.de/~anton/software.html
http://lmb.informatik.uni-freiburg.de/people/haasdonk/KerMet-Tools/index.en.html?1100001000100001
英名 Advanced Pattern Recognition 担当教員 掛谷英紀(かけやひでき)、亀田能成(かめだよしなり) 電子メール kake [at] esys.tsukuba.ac.jp, kameda [at] iit.tsukuba.ac.jp オフィスアワー 3M205/3M304, weekday (いつでも構いませんが、不在が多いので事前連絡して頂いたほうがよいです) 科目番号(前期) 01CD404 科目番号(一貫) 02CD024 分野 コミュニケーションシステム 授業形態 講義 履修年次 1・2 開講年度 学期 2 単位数 2単位 時限 火2、3 教室 未定 ● 授業概要 パターン認識の基本アルゴリズムを踏まえ、より理論的に高度な 手法を解説する。具体的には、時系列データの取り扱い、EMアル ゴリズム、情報量基準とモデル選択、クラスタリング、並列計算手 法などについて学習する。 ● 予備知識 パターン認識の基礎的知識があるほうがよい。 ● 受講生の到達レベル 最近よく用いられるパターン認識の技術を習得し、その特徴を理解 できるようになる。 ● キーワード クラスタリング,データマイニング,EMアルゴリズム,隠れマルコフモデル ● 授業内容 (内容は変更される可能性があります) クラスタリング(線形と非線形) 高次元データにおける識別 データマイニング 多数データエントリを前提にした識別 Expectation Maximization Algorithm 情報量基準とモデル選択 隠れマルコフモデルによる識別1 隠れマルコフモデルによる識別2 その他の時系列データ識別法 ● 教科書 特に定めないが、授業中に必要な資料は配布する。 ● 参考書 授業中に適宜紹介する。 ● 成績評価 レポートを提出し、期末試験で所定の成績を収めること。
kameda [at] iit.tsukuba.ac.jp