最終更新日:2001.8.7

画像電子学会 研究会講演要旨
第186回 研究会(2001年 6月 1日)





オンライン研究会に関する検討

小町祐史(松下電送システム)

 学会の主要な活動の一つである研究会のありかたについて, 以前から検討が行われている。その一例としてオンライン研究会があり, 画像電子学会ではメディア統合技術研究会とその後継のVMA(Versatile Media Appliance)研究会とで試行が行われてきた。メディア統合技術研究会では, 年2回のface-to-face形式で行う従来型の研究会に加えて, Web技術を活用して時間的空間的制約をなくしたオンライン研究会を1996年から開催した。その運用は, オンライン研究会要綱に基づく。
 当時は研究会のWebを, (a) 研究会の開催通知, プログラム案内, 予稿執筆要領 (b) 予稿の電子的なレビュー (c) 予稿を最初のプレゼンテーションとするオンラインでの議論 を提供するものと位置付け, (b), (c)に基づく活動を広義のオンライン研究会, (c)の活動を狭義のオンライン研究会とした。まず第7回以降のface-to-face研究会の予稿をそのまま最初のプレゼンテーションとする狭義のオンライン研究会を開催し, Web上での議論を開始した。研究会Webのトップページから辿れる発表課題のページで, 発言が受け付けられる。
 サポートツールとしてHyperNewsを用い, Web上での議論の継続と展開をめざしたが, 予稿に対するエディトリアルな議論が掲載直後に行われることが多かった。これは, 学会の研究会が, どちらかというと一方向的な"発表"の場であるという意識が参加者の中にあり, オンライン研究会においてもその意識は変っていないことに基づく。そこでVMA研究会では, 予稿の電子的なレビューだけを対象とするオンライン研究会として, 運用している。
 オンラインでの議論は, ソフトウェア開発, 規格開発などの目的を特定したグループ間ではかなり定着しており, アクティブな議論が展開している。オンライン議論を主体とする研究会活動を狙うには, これまでとは幾分性格の異なる研究会活動を検討する必要がある。


関連メディアを用いた映像の記述・利用システム

張 文利(東京大学生産技術研究所)
柳沼 良知(メディア教育開発センター)
坂内 正夫(東京大学生産技術研究所)

 ディジタル放送の進展と伴い、映像を初めとするマルチコンテンツの量が急増している。このようなマルチコンテンツを効率的に利用するためには、映像に対して、例えば、ドラマ番組の場合、番組のカテゴリ、タイトル、出演者名などの参照情報を手動か自動的に付与することが必要不可欠である。したがって、抽象度が異なる記述を統合し、映像、音声、文書情報といった異なるメディアを管理利用するフレームワークが必要と考えられる。
 本研究では、ドラマ映像を対象に、ドラマ映像管理利用目的とするフレームワークVideo-Stream Description Language for TV movie show (VSDL-TV)を提案した[1]。本稿において、このようなフレームワークに基づいて、記述(図1)、検索(図2)、編集(図3)、ブラウジング(図4)、ハイパーメディアオーサリング(図5)などの利用を可能とし、ドラマ映像、音声及映像に付随しているシナリオ文書など複数メディアを用いた映像記述・利用システム-ドラマ映像管理システムについて述べる。


映像コーパスに基づく映像フィルタリングシステム

孟 洋(国立情報学研究所)
佐藤 真一(国立情報学研究所)

 放送の多チャンネル化、映像記録装置の大容量化などに伴い、多量の映像情報 の中から必要な映像情報の自動取得を可能とする映像フィルタリング技術の重 要性が増している。一般に、映像内容の判別を行うためには、映像内容を理解 するための認識モデルを用意する必要があるが、多種多様なシーンを扱う場合、 各々のシーンに対して認識モデルを作成することは困難である。そこで本稿で は、実際の映像をモデルとして利用可能な事例型の映像分類手法を利用した映 像フィルタリングシステムについて述べる。
 本システムでは、フィルタリングすべきシーンのモデルを各シーンをあらわす 代表的な映像を収集した映像コーパスにより定義し、映像の類似性を評価する ことにより対象映像とシーンモデルの対応付けを行うことで、映像のフィルタ リングを実現する。対象映像とシーンモデルの類似性の評価は、画像特徴から 構成される特徴空間上での距離に基づいて行うが、画面構成やオブジェクトの 多様性による画像特徴の変動に対応するため、その計算には、各シーンモデル に対するマハラノビス距離を用いる。また、通常、いくつかの画像特徴から構 成される特徴空間は、シーンの特徴を直接表現するものとはならないため、重 判別分析による線形変換を用いることで、同一のシーンの映像はなるべく近く、 異なるシーンの映像はなるべく遠くに配置されるようなシーン特徴空間を構成 して、距離の算出を行う。
 本システムの能力を検証するため、野球、サッカー、相撲など、8種目、計51 カットのスポーツ映像を対象としたプロトタイプシステムを実装した。プロト タイプシステムによる予備実験では、多くの場合、90%以上の再現率、及び適 合率を得ることができた。
 本システムは、典型的な画面構成を持つ映像のフィルタリングを対象としてお り、正確かつ詳細なシーンの判別が必要な用途には不向きであるが、実際の映 像を収集することで利用可能であるという大きな特徴を持つ。今後は、大規模 映像データベースシステムを用いた実証的かつ実践的な実験をとおして、放送 映像を対象とした実用システムの開発を目指していく予定である。


画像認識技術を用いた交通事象自動解析システム

西田 恒俊(東京大学生産技研究所)
上條 俊介(東京大学生産技研究所)
池田 克史(東京大学生産技研究所)
坂内 正夫(東京大学生産技研究所)

 様々な交通事象を分析し交通監視システムを構築することはITS(高度交通 システム)において非常に重要な事項である。しかし、従来はこのような大 量の交通映像の解析は人手によって行われていた。交通映像の自動解析が行わ れなかった主な理由は、交差点のような非常に混み合った状況に対応できるト ラッキングアルゴリズムが存在しなかったからである。この問題を解決するた めに、我々の研究室では、混雑した交差点における車両の重なり(オクルージョ ン)にも対応できる時空間 Markov Random Field モデル(ST-MRF)に基づいたト ラッキングアルゴリズムが開発された。このアルゴリズムでは混雑した状況に おいても個々の車両をトラッキングすることができるため、交通映像から詳細 な情報を自動的に得ることが可能になる。
 本研究では、方向別交通量・車両の速度・車両の軌跡などの交通事象に関し て自動的に統計を取るシステムを開発した。日別・時間帯別の交通量の変化な ども知ることができる。これらの統計は例えば、より効果的な信号制御を行う ために非常に有用である。また、各車両の走行経路の軌跡からは、車線の設定 が適切であるかどうかを計ることができる。
 現時点では1ヶ所の交差点のみを観測の対象としているが、将来は主要な交差 点にこのシステムを設置しネットワークで接続することにより、リアルタイム に交通統計を取り信号制御等の自動化も可能になると考えられる。また、各交 差点の通過時間を測定することにより任意の経路の旅行時間の予測もより正確 に行うことができるであろう。


画像フォーマットとそのネットワークでの利用

石川 智恵(キヤノン株式会社)
榎田 幸(キヤノン株式会社)
松本 健太郎(キヤノン株式会社)

 静止画像データをネットワーク配信する場合、JPEGやGIFの画像をHTTPで送信するなど、ファイル単位で一括転送するのが一般的である。しかしながら、高精細・高画質のデジカメの普及に伴い、ユーザのディジタル画像の利用形態が多様化しており、画像通信への要求も多様化している。その一例として、用途に応じた適切な画像サイズの配信、画像全体ではなく注目している部分領域のみの配信、そして、特に無線環境下においてはトラフィック量の削減という要求が挙げられるであろう。
 このような状況下において、サイズの大きいJPEG画像データをインターネット上で、より快適に配信する技術として、Flashpix(以下、FPX)と呼ばれる画像ファイルフォーマットと、その通信プロトコルであるInternet Imaging Protocol(以下、IIP)が知られている。FPX/IIPを利用することで、ユーザは解像度の指定や部分領域のみの要求が可能になる。したがって、ファイル単位の一括転送よりも柔軟な画像配信が実現できる。
 今年1月に次世代画像符号化技術として、JPEG2000が新たに標準化された。様々な機能を符号データ自身が有しているJPEG2000であるが、画像データの配信においては、空間解像度/SNRスケーラビリティとタイル分割の機能が有用である。JPEG2000の空間解像度スケーラビリティは、各空間解像度間の差分データからできているため、各解像度が独立した符号データであるFPXに比べて、ファイルサイズは小さい。また、FPXにはないSNRスケーラビリティの機能を使うことで、少ない符号データ量で画像全体の把握が可能になっている。さらに、各タイルは独立に符号化されているため、部分領域へのランダムアクセスが可能である。これらの機能を利用すると、適切な画像サイズの配信や、受信符号データ量の調整、画像の部分領域のみの配信が可能になる。
 そこで、本発表では、JPEG2000のネットワーク配信を想定し、従来技術のFPX/IIPと比較・評価した。その結果、サーバ側のコンテンツ管理の優位性、クライアント側へ提供されるサービスの柔軟性、およびデータの転送量の削減により予想されるレスポンス時間の短縮という点で、ネットワーク上の画像コンテンツとして、JPEG2000を利用することで得られるメリットは大きなものであることを示した。


Webインターフェースを用いた動画検索・配信システム

鈴木 清詞(株式会社リコー)
國枝 孝之(株式会社リコー)
脇田 由喜(株式会社リコー)
高橋 望(株式会社リコー)
大内 茂樹(株式会社リコー)
井田 裕子(株式会社リコー)

 近年、高速なネットワーク接続サービスが比較的安価に提供されるようにな り、また、中央処理装置の性能向上、記憶装置の大容量化、低価格化が進んだこ とで、コンピューター上で、映像を編集し、再生することは容易になった。さら に、「マルチメディアコンテンツの内容記述インターフェース」であるMPEG-7が 2001年10月には標準となる予定である。
 我々は、従来から映像の内容やその構造を記述するデータモデルや、内容の自 動構造化手段などの研究・開発を行ってきたが、以上に述べたようなインフラス トラクチャの整備に伴い、Webブラウザをユーザーインターフェースとして用い た映像検索・配信システムを開発した。このシステムは、MPEG-7の DDL(Description Definition Language)を用いて独自に拡張を施した内容記述イ ンターフェース、さらに映像ファイルの配信(視聴)にSMIL (Synchronized Multimedia Integration Language)を用い、希望の映像を容易に検索、視聴する ことができる。
 Webをユーザーインターフェースとして用いる場合、Webが使用するHTTPのセッ ションの単位は、クライアントの要求とそれに対するサーバーの応答の組毎のた め、データベースへのアクセスに必要なセッション維持やシーケンスの一貫性を 確保するのが困難である。我々はこれらの問題をHTTP CookieとHTMLのHIDDENタ グを組み合わせることで、シーケンスの乱れを検出し、処理することができるよ うにした。
 本システムは、2000年10月21日から稼動し、アエロバティックス(曲芸飛行)の 国際グランプリの映像をコンテンツとして公開実験しており、本発表では実際に このWebサイトにアクセスし、デモンストレーションを行った。



All Rights Reserved, Copyright(c) Institute of Image Electronics Engineers of Japan
本講演要旨に関してご意見がありましたら学会事務局までご連絡下さい。
E_Mail:iieej@ma.kcom.ne.jp