modeling irony in twitter
DESCRIPTION
Modeling Irony in TwitterTRANSCRIPT
![Page 1: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/1.jpg)
文献紹介
修士1年
松本宏
![Page 2: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/2.jpg)
Modeling Irony in Twitter
• Title: Modelling Irony in Twitter
• Author: Barbieri, Francesco and Saggion, Horacio
• Journal: EACL 2014
• Pages: 56
• Year: 2014
![Page 3: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/3.jpg)
概要
• Tweetデータ内からのironyとなる文の検出
• Irony検出には機械学習の2値分類
• 様々な素性を試す
–今回の内容については素性の選択理由について
![Page 4: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/4.jpg)
単語ironyについて
• Ironyとは?
–皮肉
• 日本語の皮肉とは若干異なる
–日本語の皮肉: sarcasm
– Ironyの皮肉: ユーモア溢れるモノ
![Page 5: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/5.jpg)
Frequency
• 皮肉な文は意外性により生まれる
• 意外性を頻度を利用して検出
→頻出単語と反頻出単語が利用されている同
文での使用が不均衡を生み意外性へとつながる
![Page 6: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/6.jpg)
Written-Spoken
• Twitterは書き言葉が多い
• 皮肉な文は意外性により生まれる
• 話し言葉で記述されている文から書き言葉に書き換わる意外性
• または、その逆も
![Page 7: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/7.jpg)
Structure
• この素性はツイート構造を知るためのもの
• ツイートが– 長いのか短いのか、
– 長い単語か短いのか、
– どのような記号が利用されているか
– この素性の利用においては皮肉ツイートの傾向として他のツイートと比べ、
• 理由:– 長い文字列ツイートかつ、固有の記号、絵文字が使われていることが多い
![Page 8: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/8.jpg)
Intensity
• 皮肉のテクニック
–意味裏腹な言葉
• 形容詞、副詞で脚色
– (“Do we hike that tiny hill now?” 実際は大きな山へ挑む直前のツイートだったり)
• 言葉に度合い付けされたツールの利用
![Page 9: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/9.jpg)
Synonyms
• 皮肉には2つのメッセージがある
• リテラルな意味と比喩
• 比喩的意味の伝達のためにも語彙選択は重要
• 例えば:
–空が暗く雨が振りそうなとき、”sublimeな天気だね!“
• よって、言い換え可能数を素性
![Page 10: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/10.jpg)
Ambiguity
• 皮肉においての曖昧性
• 皮肉コーパス: 皮肉文で集められたコーパス
• 単語の語義数:皮肉コーパス > 非皮肉コーパス
![Page 11: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/11.jpg)
Sentiments
• 皮肉は感情分析によって調べられると仮定
• 感情の不均衡による意外性
![Page 12: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/12.jpg)
データセット
• 実験は3種類のツイート・コーパス
• (ハッシュ・タグに#irony, #education, #humor, #politicsとある物を各10,000ツイートずつ)
• 10分割交差検定
![Page 13: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/13.jpg)
Experiments
• 3種類のツイート・コーパス
– (#irony, #education, #humor, #politics ハッシュタグ付を各10,000ツイートずつ)
– 10分割交差検定
![Page 14: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/14.jpg)
実験結果
• セルはベースライン/提案手法
![Page 15: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/15.jpg)
実験結果
![Page 16: Modeling Irony in Twitter](https://reader033.vdocuments.site/reader033/viewer/2022052412/55961daf1a28ab7b0e8b46a9/html5/thumbnails/16.jpg)
実験結果