WEKO3
アイテム
{"_buckets": {"deposit": "a5bdcd0a-3a6d-4615-a5d2-aa4b01f88b20"}, "_deposit": {"id": "21697", "owners": [], "pid": {"revision_id": 0, "type": "depid", "value": "21697"}, "status": "published"}, "_oai": {"id": "oai:nagoya.repo.nii.ac.jp:00021697", "sets": ["314"]}, "author_link": ["64273", "64274", "64275", "64276", "64277", "64278", "64279", "64280", "64281", "64282", "64283", "64284"], "item_10_alternative_title_19": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio : An Application to News Video and its Evaluation", "subitem_alternative_title_language": "en"}]}, "item_10_biblio_info_6": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2011-05-06", "bibliographicIssueDateType": "Issued"}, "bibliographicIssueNumber": "38", "bibliographicPageEnd": "80", "bibliographicPageStart": "75", "bibliographicVolumeNumber": "111", "bibliographic_titles": [{"bibliographic_title": "電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎", "bibliographic_titleLang": "ja"}]}]}, "item_10_description_4": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら2つの実験から,提案手法の有効性および有用性を確認した.", "subitem_description_language": "ja", "subitem_description_type": "Abstract"}, {"subitem_description": "Speech scenes in news videos contain a wealth of multimedia information, and are valuable as archived material. In order to extract speech scenes from news videos, there is an approach that uses the position and size of a face region. However, it is difficult to extract them with only the approach, since news videos contain scenes where the speakers are not the subjects such as in narration scenes. To solve this problem, we have been proposing a method to detect the inconsistency between face and speaker focusing on the co-occurrence of the lip motion and the speech. However, the evaluations for the proposed method were performed in an ideal condition without much noise. In this paper, we report the investigation on the performance of the proposed method not only with videos captured in ideal conditions but also with actual broadcasted news videos. Their results showed the effectiveness and the usefulness of our method.", "subitem_description_language": "en", "subitem_description_type": "Abstract"}]}, "item_10_description_5": {"attribute_name": "内容記述", "attribute_value_mlt": [{"subitem_description": "IEICE Technical Report;MVE2011-12", "subitem_description_language": "en", "subitem_description_type": "Other"}]}, "item_10_identifier_60": {"attribute_name": "URI", "attribute_value_mlt": [{"subitem_identifier_type": "URI", "subitem_identifier_uri": "http://ci.nii.ac.jp/naid/110008726196/"}, {"subitem_identifier_type": "HDL", "subitem_identifier_uri": "http://hdl.handle.net/2237/23846"}]}, "item_10_publisher_32": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "一般社団法人電子情報通信学会", "subitem_publisher_language": "ja"}]}, "item_10_relation_40": {"attribute_name": "シリーズ", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "IEICE Technical Report;MVE2011-12"}]}]}, "item_10_relation_43": {"attribute_name": "関連情報", "attribute_value_mlt": [{"subitem_relation_type": "isVersionOf", "subitem_relation_type_id": {"subitem_relation_type_id_text": "http://ci.nii.ac.jp/naid/110008726196/", "subitem_relation_type_select": "URI"}}]}, "item_10_rights_12": {"attribute_name": "権利", "attribute_value_mlt": [{"subitem_rights": "(c)一般社団法人電子情報通信学会 本文データは学協会の許諾に基づきCiNiiから複製したものである", "subitem_rights_language": "ja"}]}, "item_10_select_15": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_select_item": "publisher"}]}, "item_10_source_id_7": {"attribute_name": "ISSN", "attribute_value_mlt": [{"subitem_source_identifier": "0913-5685", "subitem_source_identifier_type": "PISSN"}]}, "item_1615787544753": {"attribute_name": "出版タイプ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_access_right": {"attribute_name": "アクセス権", "attribute_value_mlt": [{"subitem_access_right": "open access", "subitem_access_right_uri": "http://purl.org/coar/access_right/c_abf2"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "熊谷, 章吾", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64273", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "道満, 恵介", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64274", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "高橋, 友和", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64275", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "出口, 大輔", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64276", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "井手, 一郎", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64277", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "村瀬, 洋", "creatorNameLang": "ja"}], "nameIdentifiers": [{"nameIdentifier": "64278", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "KUMAGAI, Shogo", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64279", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "DOMAN, Keisuke", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64280", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "TAKAHASHI, Tomokazu", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64281", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "DEGUCHI, Daisuke", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64282", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "IDE, Ichiro", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64283", "nameIdentifierScheme": "WEKO"}]}, {"creatorNames": [{"creatorName": "MURASE, Hiroshi", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "64284", "nameIdentifierScheme": "WEKO"}]}]}, "item_files": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_date", "date": [{"dateType": "Available", "dateValue": "2018-02-21"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "110008726196.pdf", "filesize": [{"value": "997.2 kB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "licensetype": "license_note", "mimetype": "application/pdf", "size": 997200.0, "url": {"label": "110008726196.pdf", "objectType": "fulltext", "url": "https://nagoya.repo.nii.ac.jp/record/21697/files/110008726196.pdf"}, "version_id": "e5e01f4d-5aef-4bea-8056-e0ebdc45346f"}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "発言シーン抽出", "subitem_subject_scheme": "Other"}, {"subitem_subject": "視聴覚統合", "subitem_subject_scheme": "Other"}, {"subitem_subject": "ニュース映象", "subitem_subject_scheme": "Other"}, {"subitem_subject": "口唇動作特徴", "subitem_subject_scheme": "Other"}, {"subitem_subject": "speech scene extraction", "subitem_subject_scheme": "Other"}, {"subitem_subject": "auditory-visual integration", "subitem_subject_scheme": "Other"}, {"subitem_subject": "news video", "subitem_subject_scheme": "Other"}, {"subitem_subject": "lip motion feature", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "journal article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)", "subitem_title_language": "ja"}]}, "item_type_id": "10", "owner": "1", "path": ["314"], "permalink_uri": "http://hdl.handle.net/2237/23846", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2016-03-15"}, "publish_date": "2016-03-15", "publish_status": "0", "recid": "21697", "relation": {}, "relation_version_is_last": true, "title": ["口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)"], "weko_shared_id": -1}
口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ)
http://hdl.handle.net/2237/23846
http://hdl.handle.net/2237/23846c1630e06-20bf-4bdd-ab31-0f7c19f83ba6
名前 / ファイル | ライセンス | アクション |
---|---|---|
110008726196.pdf (997.2 kB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2016-03-15 | |||||
タイトル | ||||||
タイトル | 口唇動作と音声の共起に着目した被写体と話者の不一致検出 : ニュース映像への適用と評価(萌芽セッション,エンタテインメントのためのメディアとリアリティ) | |||||
言語 | ja | |||||
その他のタイトル | ||||||
その他のタイトル | Detection of Inconsistency between Face and Speaker Focusing on the Co-occurrence of Lip Motion and Audio : An Application to News Video and its Evaluation | |||||
言語 | en | |||||
著者 |
熊谷, 章吾
× 熊谷, 章吾× 道満, 恵介× 高橋, 友和× 出口, 大輔× 井手, 一郎× 村瀬, 洋× KUMAGAI, Shogo× DOMAN, Keisuke× TAKAHASHI, Tomokazu× DEGUCHI, Daisuke× IDE, Ichiro× MURASE, Hiroshi |
|||||
アクセス権 | ||||||
アクセス権 | open access | |||||
アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||
権利 | ||||||
言語 | ja | |||||
権利情報 | (c)一般社団法人電子情報通信学会 本文データは学協会の許諾に基づきCiNiiから複製したものである | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 発言シーン抽出 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 視聴覚統合 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | ニュース映象 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 口唇動作特徴 | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | speech scene extraction | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | auditory-visual integration | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | news video | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | lip motion feature | |||||
抄録 | ||||||
内容記述 | ニュース映像中の人物の発言シーンはマルチメディア情報を豊富に含み,資料価値が高い.発言シーンの抽出には顔領域の位置や大きさを利用するアプローチが考えられる.しかし,ナレーションシーンのように被写体と話者が一致していないシーンも存在するため,それだけでは発言シーンを必ずしも抽出できない.そこで我々は,発生する音とそれに伴う口唇動作から得られる複数の音声特徴と画像特徴の相関を利用して被写体と話者の一致・不一致を識別する手法を提案してきた.しかしながら,理想的な環境で撮影した映像に対する評価のみで,実際に放送されるニュース映像に対する評価にとどまっていた.本稿では,理想的な環境で撮影した映像を用いた実験とその結果,および実際に放送されたニュース映像を用いた実験とその結果について報告する.これら2つの実験から,提案手法の有効性および有用性を確認した. | |||||
言語 | ja | |||||
内容記述タイプ | Abstract | |||||
抄録 | ||||||
内容記述 | Speech scenes in news videos contain a wealth of multimedia information, and are valuable as archived material. In order to extract speech scenes from news videos, there is an approach that uses the position and size of a face region. However, it is difficult to extract them with only the approach, since news videos contain scenes where the speakers are not the subjects such as in narration scenes. To solve this problem, we have been proposing a method to detect the inconsistency between face and speaker focusing on the co-occurrence of the lip motion and the speech. However, the evaluations for the proposed method were performed in an ideal condition without much noise. In this paper, we report the investigation on the performance of the proposed method not only with videos captured in ideal conditions but also with actual broadcasted news videos. Their results showed the effectiveness and the usefulness of our method. | |||||
言語 | en | |||||
内容記述タイプ | Abstract | |||||
内容記述 | ||||||
内容記述 | IEICE Technical Report;MVE2011-12 | |||||
言語 | en | |||||
内容記述タイプ | Other | |||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 一般社団法人電子情報通信学会 | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプresource | http://purl.org/coar/resource_type/c_6501 | |||||
タイプ | journal article | |||||
出版タイプ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
関連情報 | ||||||
関連タイプ | isVersionOf | |||||
識別子タイプ | URI | |||||
関連識別子 | http://ci.nii.ac.jp/naid/110008726196/ | |||||
ISSN | ||||||
収録物識別子タイプ | PISSN | |||||
収録物識別子 | 0913-5685 | |||||
書誌情報 |
ja : 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎 巻 111, 号 38, p. 75-80, 発行日 2011-05-06 |
|||||
著者版フラグ | ||||||
値 | publisher | |||||
シリーズ | ||||||
関連名称 | IEICE Technical Report;MVE2011-12 | |||||
URI | ||||||
識別子 | http://ci.nii.ac.jp/naid/110008726196/ | |||||
識別子タイプ | URI | |||||
URI | ||||||
識別子 | http://hdl.handle.net/2237/23846 | |||||
識別子タイプ | HDL |