rohaniのブログ

ゆるっと自然言語処理奴。ときどき工作系バイト。

Rumor Detection on Twitter with Tree-structured Recursive Neural Networks

輪講で紹介するにあたって、整理のためにまとめた。せっかくなのでシェア。

0. 出典

P18-1184,
author = "Ma Jing and Gao Wei and Wong Kam-Fai",
title = "Rumor Detection on Twitter with Tree-structured Recursive Neural Networks",
booktitle = "Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)",
year = "2018",
publisher = "Association for Computational Linguistics",
pages = "1980--1989",
location = "Melbourne, Australia",
url = "http://aclweb.org/anthology/P18-1184"

1. 論文の概要(ひとことでいうと)

Automatic rumor detection(自動的な噂検出)の研究.

ツイートの非構造的な伝播経路情報をツリー構造を持った再帰NNでモデリングすることによって,ツイートテキストから自動的に弁別的な特徴を学習すること、及び噂の種類を識別するためのより強力な表現を生成することを試みた。

具体的には,ツイートの伝播経路に自然に適合するような、噂表現の学習と分類のための,ボトムアップトップダウン木構造ニューラルネットワークに基づく2つの再帰的ニューラルモデルを提案した。

そして,提案モデルを二つの公なTwitterデータセットにいて検証した結果、

  1. 最先端のアプローチより良い性能を達成した
  2. 非常に早い段階での噂検知において優れた能力を発揮した

2. 問題設定と解決した点(先行研究と比べてどこが凄い?)

事実に反する噂は最悪の場合社会に大きな影響を与える可能性があり,ソーシャルメディアが普及してきた現代では悪意ある発信者によってそのような噂が発信される事例が増えている.人手による噂の発見はコストが高いので,自動的に噂を検出するシステムが求められている.

自動噂検出の先行研究の多くは,投稿内容,ユーザプロフィール,伝播経路といった幅広い特徴を用いて教師あり学習の分類器を学習することを目的としていた.本研究では,投稿内容だけ・伝播経路だけを特徴にした分類器では不十分であると考え,かつ,伝播経路を特徴量として与えるのではなく木構造ニューラルネットワークを用いて自然に学習させることで,投稿内容と伝搬構造を自然に統合するモデルを提案している.

3. 技術や手法のキモ

筆者らは,ある噂が事実か否かということは,その噂に対するTwitterユーザの一連の反応から分かると考えている.すなわち,

  • 返信する人は,偽りの噂を支持する人や真実の噂を否定する人に対して異を唱えたり疑問を抱く傾向がある.
  • 返信する人は,偽りの噂を否定する人や真実の噂を支持する人に対して賛成する傾向がある

というアイディアに基づき,噂ツイートに紐づく一連のツイートの伝播構造をRecursiveNeuralNetworkで表現した.具体的には,ノードをツイート本文,エッジを参照関係とすることで,経路を順に訪れながらツイート本文のベクトル表現から噂検出に役立つ特徴を抽出していくという仕組み. 伝播構造は,以下の2つを提案.

  1. 引用構造をモデル化するBottomUpなツリー構造
  2. 情報の流れをモデル化するTopDownなツリー構造

このような形で(RvNNを用いて)噂の伝播構造とツイート本文の両方を学習に組み込んだのはこの研究が初めて.

4. 主張の有効性検証

  • データセット:Twitter15(1,381の伝播ツリー),Twitter164(1,181の伝播ツリー).1ツリー:1ラベル,5交差検証.
  • 比較用モデル:8
  • 結果(噂検出)
    • 事実に反する噂,事実の噂,不明確な噂クラスについては,TD-RvNNが他のモデルよりも優れた結果となった
    • 非噂クラスについては,それを判別するための情報が欠けていると考察している
  • 結果(噂早期検出)
    • ルートツイートが投稿されてからの経過時間 及び ルートツイートが投稿されてから投稿されたツイートの数 を遅延時間の測定尺度としたときの,各時点での噂検出精度
    • 他のモデルよりも早い時点で高い精度を出した

(RTを削っているらしいが,RTも重要な手がかりとして本文中では上げていなかっただろうか?) (データセット内のクラスの内訳も気になる.)

5. 議論すべき点

RvNNの更新式のあたり,入力と子ノードの状態ベクトルの統合の具合をよしなに調節する部分が複数ある.こんなにいるのかな?

6. 次に読むべき論文は?

7. 参考文献

8. 補足(Appendix)