ホーム / 学科の紹介 / 研究室・教員 / 画像メディア分野

画像メディア分野(松山研究室)

本研究室では,ディジタル画像・映像の処理,認識,理解,生成,編集のためのハードウェア・ソフトウェアに関する基礎研究に加え,「視覚情報処理を通じた知能の解明と知能システムの構築」を研究目標としています.すなわち,人間は,感覚器を通して物事の様子や変化を認識・理解し,それに基づいて推論や思考を深めたり,状況に即した適切な行動を取るといった優れた知的能力を持っています.そこで本研究室では,主として視覚情報処理の観点から,人間の持つ知能の解明とそのモデル化,人間に匹敵する柔軟で高い能力を備えた知能システムの実現を目指して研究を行っています.

教員

松山 隆司 ( Takashi MATSUYAMA )

松山 隆司教授(情報学研究科 知能情報学専攻)

研究テーマ

画像・映像の処理・認識 / パターン認識 / 3次元ビデオ / 人物追跡 / マルチメディア統合 / ハイブリッド・ダイナミカル・システム / ヒューマンコミュニケーション / エコエネルギー・マネージメント・ネットワーク

連絡先

工学部3号館南館 3階 S303号室
TEL: 075-753-4891
FAX: 075-753-4769
E-mail: tm AT i.kyoto-u.ac.jp

川嶋 宏彰 ( Hiroaki KAWASHIMA )

川嶋 宏彰准教授(情報学研究科 知能情報学専攻)

研究テーマ

映像の処理・認識 / 時系列パターン認識 / マルチメディアの統合 / ヒューマン・コンピュータ・インタラクション (ヒューマンコミュニケーション) / ハイブリッド・ダイナミカル・システム

連絡先

工学部3号館 3階 I303号室
TEL: 075-753-3327
FAX: 075-753-3327
http://vision.kuee.kyoto-u.ac.jp/~hiroaki/index-j.html

延原 章平 ( Shohei NOBUHARA )

延原 章平講師(情報学研究科 知能情報学専攻)

研究テーマ

コンピュータビジョン/3次元形状・運動推定/3次元ビデオ

連絡先

工学部3号館南館I302
TEL: 075-753-5883
http://vision.kuee.kyoto-u.ac.jp/~nob/index.ja.html

研究テーマ・開発紹介

3次元ビデオの開拓

3次元ビデオは,コンピュータグラフィックスによる仮想的な3次元アニメーションではなく,ダンスやスポーツをする人間,自然界の動物などの生の姿・形・色 の時間的変化を3次元的にそのまま記録した実写立体映像です.3次元ビデオを誰もが利用できる映像メディアとして育てるために,以下の研究を行っています.

[多視点ビデオからの高精度実時間3次元形状計測]
多数の首振りビデオカメラを分散配置して,人間の動きを追跡しながらその動作を様々な角度から撮影し,得られた多視点ビデオから人間の3次元形状や運動を正確に計算します.

[3次元ビデオの生成]
計算された3次元形状の表面色や模様を撮影されたビデオから求め,それを対象表面に張付けることによって,人間の生の姿・形・色の時間的変化を記録した3次元ビデオが生成されます.

[照明環境の推定]
映 像から,それが撮影されたときの照明環境(光源の種類や位置)を推定し,撮影された映像から照明の影響を取り除くとともに別の照明で撮影された時の映像を 生成します.これによって,3次元ビデオに多様な照明効果(たとえば、かがり火や稲妻に照らされた人物映像)を与えることができます.

[3次元ビデオの圧縮]
3次元ビデオを蓄積・伝送するには,その膨大なデータ量を効率的に圧縮する必要があり,MPEGなど従来の2次元映像圧縮法とは異なった新たなデータ圧縮法を考える必要があります.

[無形文化財のディジタルアーカイブ]
以上の技術を用いて,人間国宝クラスの踊り手による日本舞踊や能を撮影し,後世に残します.

maiko

ヒューマンコミュニケーションの実現

現在の情報システムは,人間が命令したことを実行して応答を返すだけで,人間と自然なコミュニケーションを行うことは困難です.本研究室では,命令を与えな くても人間の意図や行動の意味を理解してその状況にあった反応を自律的・自発的に行う情報システムの実現を目指して以下の研究を行っています.

[多視点ビデオの解析による人間の行動理解]
人を取り囲むように配置された多くの視点から人間の動作を撮影し,その3次元的な動作パターン(たとえば指さし対象やジェスチャ,無意識の仕草)を解析して人の心的状態(興味の度合いや集中度)を認識します.

[動的パターン認識アルゴリズムの開発]
ビデオや音声データといったマルチメディアの時系列信号を解析して,人の表情や視線,発話状態,唇の動きや手話などの動的パターンを認識するためのアルゴリズムを考案します.

[息の合った対話の分析と設計]
状況にあった自然な情報提示や応答を設計するために,人の対話(会話,さらには漫才や落語)における発話や身体動作の時間的・空間的構造から,息の合った対話のコツを見つけ出します.

[実世界インタラクションシステムの実現]
上記の基本技術を総合化して,人(ユーザや運転者)の内部状態を推定しながら,状況に合わせた情報提示や応答を自律的かつ適切な間合いで行うインタラクショ ンシステムを実現します.実験基盤として,カメラや脳・生体計測装置を始めとするマルチセンサを配置したドライビングシュミレータ,大型情報提供ディスプ レイを用いてシステムの開発を進めています.

drivingsimulator displaysystem