2024-03-28T08:24:53Z
https://nagoya.repo.nii.ac.jp/oai
oai:nagoya.repo.nii.ac.jp:00018757
2023-01-16T04:07:35Z
320:321:322
Twitterにおけるユーザの興味と話題の時間発展を考慮したオンライン学習可能なトピックモデルの提案
A Proposal of Online Topic Model for Twitter : Considering Temporal Dynamics of User Interests and Topic Trends
佐々木, 謙太朗
吉川, 大弘
古橋, 武
SASAKI, KENTARO
YOSHIKAWA, TOMOHIRO
FURUHASHI, TAKESHI
open access
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan. Comments are welcome. Mail to address editj@ipsj.or.jp, please.
トピックモデル
Twitter
時間発展
オンライン学習
topic model
time evolution
online learning
Latent Dirichlet Allocation (LDA) は,様々な分野で応用されているトピックモデルであり,Twitter におけるユーザ属性の推定や話題の要約などに適用した研究も数多く報告され始めている.LDA をツイート集合に適用する場合,1 ツイートを 1 文書とすると,文書の短さやノイズの多さにより,LDA が有効に機能しないことが多いため,1 ユーザの全ツイートを 1 文書とする方法が一般的に用いられる.これに対して,1 ツイートが 1 トピックから成るという仮定に基づいたトピックモデルである Twitter-LDA が提案され,前者の方法に比べて,トピックの意味のまとまりの面で優れていると報告されている.しかし一方で Twitter-LDA は,オンライン学習ができないという課題がある.本論文では,Twitter-LDA を改良し,Twitter に適したオンライン学習可能なトピックモデルを提案する.提案モデルでは以下の二点について Twitter-LDA を拡張する.第一に,一般語とトピック語との比率をユーザごとに推定することで,より高精度にツイートの生成過程をモデル化する.第二に,ユーザの購買行動をモデル化した Topic Tracking Model (TTM) の機構をモデルに加えることで,Twitter におけるユーザの興味と話題の時間発展をオンラインで学習可能とする.
Latent Dirichlet Allocation (LDA) is a topic model which has been applied to various fields. It has been also applied to user profiling or event summarization on Twitter. In the application of LDA to tweet collection, it generally treats aggregated all tweets of a user as a single document. On the other hand, Twitter-LDA which assumes a single tweet consists of a single topic has been proposed and showed that it is superior to the former way in topic semantic coherence. However, Twitter-LDA has a problem that it is not capable of online inference. In this paper, we extend Twitter-LDA in the following two points. First, we model the generation process of tweets more accurately by estimating the ratio between topic words and general words for each user. Second, we enable it to estimate temporal dynamics of user interests and topic trends in online based on Topic Tracking Model (TTM) which models consumer purchase behaviors.
一般社団法人情報処理学会
2013-09
jpn
journal article
VoR
http://hdl.handle.net/2237/20853
https://nagoya.repo.nii.ac.jp/records/18757
http://id.nii.ac.jp/1001/00095217/
0919-6072
情報処理学会論文誌: MPS, 数理モデル化と問題解決研究報告
2013-MPS-95
3
1
6
https://nagoya.repo.nii.ac.jp/record/18757/files/43_A_Proposal_of_Online_Topic_Model_for_Twitter.pdf
application/pdf
1.3 MB
2018-02-21