@article{oai:nagoya.repo.nii.ac.jp:00021710, author = {中村, 彰吾 and 出口, 大輔 and 高橋, 友和 and 井手, 一郎 and 村瀬, 洋 and NAKAMURA, Shogo and DEGUCHI, Daisuke and TAKAHASHI, Tomokazu and IDE, Ichiro and MURASE, Hiroshi}, issue = {353}, journal = {電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解}, month = {Dec}, note = {Web上の大量の動画像を効率よく検索するための重要な要素技術の一つとして,動画像に映っている物体を認識する技術が挙げられる.従来,静止画像を対象とした一般物体認識は盛んに研究が行われてきたが,動画像を対象とした一般物体認識の研究はほとんど行われていない.動画像を対象とした一般物体認識では,動画像中の様々なフレームから得られる形状特徴と動き特徴の双方を効果的に利用することが重要となる.本報告では,歩行者検出などで高い性能を持つCoHOG (Co-occurrence Histograms of Oriented Gradients)を時間方向に拡張した時空間CoHOG特徴を提案する.時空間CoHOG特徴は,動画像中の局所領域での時空間勾配方向の共起ヒストグラムである.認識には,BoF (Bag of Features)表現とカーネルSVMを用いる.実験では,Web上から収集した10カテゴリ,計1,000本の動画像を用い,オプティカルフロー特徴およびSIFT特徴と比較することにより,時空間CoHOG特徴の有効性を確認した., Recognizing objects in videos is one of the important technologies to search a large amount of videos efficiently on the Web. Recently, generic object recognition has been actively studied for still images, but almost not for videos. As for the generic object recognition in a video, it is important to use both the shape features and the motion features obtained from multiple frames in the video efficiently. In this paper, we propose spatio-temporal CoHOG (Co-occurrence Histograms of Oriented Gradients) features. This is an extension of CoHOG features that provide a high performance for pedestrian detection and others. The spatio-temporal CoHOG features are co-occurrence histograms of oriented spatio-temporal gradients in local regions in a video. In the recognition, a BoF (Bag of Features) representation and a kernel SVM are employed. We conducted an experiment on 1,000 videos including 10 categories collected from the Web. The experimental results showed the effectiveness of the spatio-temporal CoHOG features compared with conventional optical flow features and SIFT features., IEICE Technical Report;PRMU2011-124}, pages = {1--6}, title = {動画像を対象とした一般物体認識のための時空間CoHOG特徴量の検討(テーマセッション,実世界文字認識と理解)}, volume = {111}, year = {2011} }