Memo of the Seminar for Young Researchers
Contents of this page are obsolete. This page is preserved and stored at this URL just from historical viewpoint. Original URL was http://www.mm.media.kyoto-u.ac.jp/members/kameda/...
Please visit www.kameda-lab.org for recent information. (2002/12/06, kameda@ieee.org)

若手セミナー'96メモ

亀田の研究, 亀田能成, 美濃研 1996/12/25
若手セミナー公式ページ, シーガイア案内
1996年12月11日(水)から13(金)まで、画像理解を研究する若手の人を対象としたセミナーが催されました。
ここで書いてあるメモは、私が個人的に書いたものです。もし発言者の意図とここに書いてある内容が違えば、それは私の偏向がかかっているからです。ですから、このページの内容は眉につばをつけてから読んでください。

一日目

Seagaiaに九州大学から車で到着。天気がよい。なんというか、今回の会場は贅沢な作りだと思った。前回の若手セミナーよりリッチな感じがした。出席者は60人弱ぐらいか。



講演:研究の心構え

上田博唯

  1. アプリケーション(方法が有効な用途)を明確に
  2. ノーマンのインターフェースモデル
  3. 認識を語る上での参考になる人々:河合隼雄、安西祐一郎
  4. Marrより前の人だけど、現在のCVの雛形が: Azriel Rosenfield, Avinash C. Kak, "Digital Picture Processing," 1976

講演:米国流研究テーマは如何にして決めるべきか?

佐藤宏介

  1. 参考にしてください: 生田哲, "サイエンティストを目指す大学院留学", アルク
  2. アメリカの方法がベストとは言わないけれど、週60時間近くも研究に勤しむアメリカの大学院生に対して、そんなに勉強しない日本の大学院生が研究で張り合うのは難しいのではないか
  3. 博士課程に要求される資質は、問題を設定して、解ける資質である。(プロポーサルにもっと力をいれましょう)

講演:実世界で使える画像処理

鷲見和彦

  1. CVの各要素技術はそれほど高度でなくても、組み合わせる際の知識を適切にすれば現実に応用できる(単体では売れないけれど‥)
  2. 現実社会で通用するTips:「誤り入力の想定」「撮影環境から方式に含める」「一撃型」

グループ討論という名の雑談
グループごとに別れて部屋に入る。私のいるE班のメンツは、角所亀田寺本中島西村松岡椋木山口だった(敬称略、中島さんは別室でした)。16部屋ほどが入った一つコンドミニアム(団体用?)建物の一部屋に入る。八人部屋だが、広い。台所には鍋や包丁まである。炊飯器まで貸してくれる。欧米風のスタイルで住め、てことだろうが、そんな奴日本にいるのか?トイレも洗面台も二つある。洗濯機も建物にある。ベットルームは4人ずつの二部屋だった(3LDK?)。
講演が終わったあと、深夜12時半ぐらいまで三次元画像計測と画像処理と画像理解についてだべっていた。個人的にキャリブレーションで今困っているので、同室の方(山口さん、角所さんありがとうございます)にも聞いてみたが、広い部屋(講義室みたいな)まるごとの精密なキャリブレーションは大変だよ、という話になった。うーみゅ。また、画像による三次元計測がCVの範疇に入れてもらえるかどうかについても延々と討論が続いた。
他に分かったことは、やはりCVをしている人にとっての目標は「人間の視覚系」だってこと。


二日目

いつももっと朝が遅いので、7時半に起床は若干しんどい。天気は曇りで、昼の休憩時間が心配(おいおい)。ちなみに、前回のセミナーでは全く休憩時間がなかったので雲泥の差である。全先生の差し金か?それとも幹事の中に話の分かる人がいるのか:-)

講演:CVから見た画像処理

栄藤稔

  1. 画像圧縮技術における符号化にはCV技術が利用されている。
  2. CVの特徴量は画像のエントロピーの圧縮ともとれる
  3. ソースモデルと符号化技術
    レベル ソースモデル 符号化情報 符号化技術
    画素 画素輝度値 PCM
    統計的に冗長な画素 画素輝度値または画素のブロック 予測符号化、変換符号化
    平行移動するブロック ブロック内輝度値、動きベクトル 動き補償+DCT符号化
    領域の構造 マッピングパラメータまたは形状と動き 領域・テクスチャ符号化
    構造が制約された動物体 形状、動きと各物体の色(輝度値) 分析合成符号化
    三次元構造が既知の動物体 形状、動きと物体の色(輝度値) モデルベース符号化
    以上が1990年代半ばまでの流れである。
  4. 領域分割を行う動き推定法が問う映像再構成の目的には不十分‥‥CVでは研究として「葬式論文」だしておしまい
  5. 動きベクトルを求めるのに最高の画像は「フラワーガーデン」(これで出なければまったく駄目)
  6. MPEG4には多重階層表現(Nitzberg&Mumford, etc)、モザイキング・スプライト(Szelski, etc)が採用されて最適パラメータつけて製品化されてくるでしょう
  7. 多重階層のレイヤーの生成は人手に任せる(符号化の世界では)
  8. DVDでもレート制御問題が画質に大きな影響を与える(下手するとVHSより汚くなる)
  9. シーンカットチェンジなどはdigital-Video作成現場では自動抽出されている
  10. 質疑:MDL基準使うことの是非:MDL基準の導入前提が論文などではっきりされていない
  11. 質疑:再利用むけ符号化?伝送量の削減?:個人的には前者、しかし商業ベースでは後者

講演:曲線と曲面の話

金谷健一資料

  1. 講義の気分で喋ってみます
  2. 共役勾配法:最急降下と違って、接線方向を保つ(共役)方向に解を改善
  3. 曲面:全曲率とある投影面上での平面曲線の曲率との関係
  4. アスペクトと余次元:
  5. アスペクトグラフ:同一の見えかたをするノードどうしを繋いで出来るグラフの双対グラフを指す
  6. 質疑:今回の話は平行投影が前提だが、透視投影でも話は通用する

講演:動画像認識におけるトップダウン解析

和田俊和

  1. 選択的注視に基づく動作識別法の解説
  2. 画像処理を簡約化しているので、ハードウェアが暇なほどリアルタイム処理できている
  3. 質疑:状態遷移モデルのイベントコード次第で状態認識
  4. 質疑:ドアの開閉(入退室)は注目点が重なって難しい問題
  5. 質疑:複数カメラの設置が解釈のコンパクト性を高められるでしょう
  6. 質疑:モデルを増やしていくと注目領域が重なっていって差分ベースで特徴抽出が重なってしまうと、学習が飽和する危惧は確かにある。ただ、これは特徴抽出にさらに別のを用意したりすれば容易に回避できると考えられる。
  7. 質疑:トップダウン・ボトムアップを言うなら、学習を動的にして更新していく方向性に進むの?‥‥まずは学習フェーズ・認識フェーズを分けて収束性等の考察に取り組んでいく。

4時間もある昼休み
昼食はオーシャン45の隣のパラダイスガーデンで食べた。シュロスコを食べましょうという長野さんの意見につられて10人以上がいつもはスカスカの巡回バスにぎゅうぎゅうに乗って行ったのだけれども、いってみると昼はシュロスコはやっていないという話で、残念。でも、宮崎が発祥の地というチキン南蛮を食べられたので満足。

その後、私と九大の有田くん米元くんと3人で青島へ。

青島の洗濯岩はなかなか壮観だった。横の砂浜はよく締まっていて、車でも走れそうだったが有田くんに拒否された。車は有田くんのだったのだ。帰りに、なぜか青島名物のういろうを買った。織田信長の残党がここまで流れ着いてういろう作りでも始めたのだろうか?ちなみに、部屋に持って帰って晩に食べようとしたら、同部屋のYさんが包み紙を見て「宮川ろう」と読んでました。人間の認識能力って偉いのだか、なんだか‥‥


パネル討論1:私にポリシーはある

こういう議論は発散しがちですが、やはり発散してましたね。ま、発散しても聞いている一人一人が何か感じるものがあればそれで有意義だと思います。
  1. 和田:はやりそうな一例には「Multi Agent on CV」なんかがありそう。チューリングマシンを複数合わせたら違うものになるんでは?(原理的にはチューリングマシンに見えるとしても)
  2. 上田:Multi Agentには人間要素を含めるべきでしょう

パネル討論2:流行に流された研究はダメ

  1. 技術流行:
  2. SNで比較評価するけれど、研究するときにはSNを上げるだけではだめなんではないかというジレンマ

グループ討論という名の雑談
メディアとロボティックスへのCVの応用の是非について。いろいろ話がでたが、結局のところ、メディアにCVを適用するのはEngineeringで、ロボティックスは人間の視覚系に繋がる話題だからScienceだろうという結論になった。メディアへの応用の目標は人間という主体が使うツールを極めることであるので、CVの「認識」への貢献度は低いのではないかという話になった。ただ、社会的貢献度はこれまでの応用に比べて高いのでは、という意見もあった。EngineeringからみたCVについては、問題設定条件(撮影環境やその変動許容範囲)を明らかにすることは方法のRobustnessを高めるのと同じ重要性をもつだろうという意見がでた。
メディア技術は人間の便利なツールを作るのが目的であり、その究極目的はCVの目指す「人間のコピー」とは異なる。ただ、CVの派生技術は常にメディア技術に応用可能であり、メディア技術で必要になるのがCVテクニックであるから、メディア技術にCVが取り組むのは足腰を鍛える上でいいいことだろう。また、[人間に便利なツール」を最後までつきつめていけば、それは遅かれ早かれ「人間の視覚系・感性」に対して造詣を深めていくことになるだろう。
応用分野としては、最終目的が「人間のコピー」だとするロボティックスや極限作業ロボットのほうがいいんではないかな、という話がでた。また、CVの工学的能力を高めるためには産業応用特に目視検査もするべきだという意見がでた(特に技術伝承という社会的要請が強い)。

懇親会
懇親会はグループ討論のあと、20:00-22:00の間に行われました。結構料理はよかったです。若い人の比率が高い割にはいくらか料理が残されたのは、昼休みにみんな食い漁っていたからかな?閉めの辞は上田さんの若い人に対する期待の苦言でした。

三日目

昨日の晩も遅くまで起きていたので、朝がつらい。8時前に朝御飯を食べるなんて、かえって健康に悪いような気がする。ともあれ、今日で最後だ。

雑談発表会

雑談を繰り返していたのをまとめて発表するのだから、とりとめがなくなるのは当然でしょう。E班からは山口先生(阪大)が代表として発表していただきました。E班の発表内容はこちらです。

その他のグループでもいろいろ話がでたようです。全部は書き留められないので、一部だけです。ただ、前回のように発表に対する優秀賞などがなかったので、期待していた私はちょっと拍子抜けでした。

でもって、講評がありました。全部を書き留められなかったので、ごく一部だけ紹介しておきます。

シーガイア
めでたく若手セミナーも終了し、もう行事は終わったので、こうなるとあとの心残りはシーガイアだけです。ということで、何はともあれシーガイアへレッツゴーしたのでした。九大の有田くん、米元くんと一緒にいきましたが、向こうで奈良先端技術大学院大学のグループと顔を合わせました。 (写真)
kameda@kuis.kyoto-u.ac.jp
引用部分の著作権は各発表者にあると思います。編集著作権は私にあるのかな?へんしゅーちょさくけんってなーに?