一個科研項目正在通過推特詞匯來判斷人們的幸福指數

「你幸福嗎?」

這是一個深不可測、無比玄妙的問題。影響「幸福」的因素有很多,如果是在虛擬世界中,問題會簡單很多。因為它會被類似「飢餓度」、「娛樂值」或者「心情指數」這樣的系統衡量,反饋到玩家的眼里,就是一張張「笑臉」或者「哭臉」。

一個科研項目正在通過推特詞匯來判斷人們的幸福指數

但是很遺憾,現實中沒有這麼方便的設定,一張微笑的臉蛋除了能代表「你好」,還很有可能暗含「呵呵快滾」的意思,如果沒有學習專門的知識,哪怕是身經百戰的骨幹教師,都有可能鬧出誤會:

一個科研項目正在通過推特詞匯來判斷人們的幸福指數現實太復雜!

既然還有如此多單身狗在今天,這個特殊的日子被搾乾錢包,正說明了想看透一個人的內心是一件多麼困難的事情,更不用說准確判斷一群人,或者一整個國家的人到底「幸不幸福」了。

不過有這麼一群科研人員,正試圖通過社交網絡來衡量人們的「幸福指數」。

一個科研項目正在通過推特詞匯來判斷人們的幸福指數

上面這張圖片取自數據網站「hedonometer」,這張統計表記錄了今年1月1日到現在,社交網站推特上「用戶幸福指數」。

根據該圖的信息,可以看到今年的「新年」、「情人節」、「母親節」都是一個階段內人們心情最愉悅的時候;而當「新冠疫情爆發」、「喬治·弗洛伊德身亡」以及「美國總統大選」這些事情發生時,人們的心情值一度跌落到了谷底。

這是美國佛蒙特大學的一個長期研究項目,科研人員們試圖通過分析推特上出現各種關鍵詞語的頻率來推斷當前用戶的整體幸福程度。

這個網站的基本邏輯是這樣的:當推特上頻繁出現一些正面詞語,比如「愛」、「開心」、「健康」、「美麗」時,就會提高系統判斷的幸福值;而一些負面單詞,比如「謀殺」、「死亡」、「災難」、「毒品」則會降低系統的幸福值。

當然,這只是最基本的規則。根據介紹,「hedonometer」網站每天都會在推特的上億條新推文中隨機抽取10%,再對照給定的詞匯表,分析樣本推文究竟是表達積極含義還是消極信息。

如果當天檢測出了更多的積極詞匯,則會提高相應的心情指數,反之亦然,不過想要界定詞匯的真正含義同樣是一件困難的事情,在雙關語和抽像話氾濫的網絡尤為如此。

該系統的研究人員曾舉過一個例子:「Thirsty」(口渴)是一個不那麼愉快的單詞,但在推特的某個時間段內,更多的人會用這個單詞來表達自己「飢渴」(通常指性方面)的含義,這就會給最終的結果帶來一定的誤差。

所以研究人員需要不斷地修改詞匯表和詞匯的權重,以求反應美國人真實的心情水平。

雖然該系統的准確率有待考證,但我們也能從一些特殊的日子中找到些有趣的信息。比如2016年11月9日,特朗普贏得美國總統選舉時,網站顯示當天推特用戶的幸福值跌到了最低谷:

一個科研項目正在通過推特詞匯來判斷人們的幸福指數

當天「對抗」、「怨恨」、「種族主義」等關鍵詞的出現頻率大幅提高。

而當四年後,拜登贏得總統選舉時正好相反,當天的幸福值是近一個月來的最高點,出現的關鍵詞變成了「勝利」、「祝賀」、「偉大」(當然我很好奇他們怎麼區分真人用戶和可能存在的Bot)。

一個科研項目正在通過推特詞匯來判斷人們的幸福指數

如果你對這個「推特幸福指數」網站也感興趣,不妨點擊看看電子遊戲式的情緒量表是如何實現的。

來源:遊研社