算法比你還了解自己?胡扯

網絡沖浪時,你一定曾刷到過這樣的測試題,根據輸入習慣來測性格,比如輸入「ysbg」,候選詞是一絲不苟還是一絲不掛,前者證明是個正經人,後者則不是。

測試的原理很簡單,手機輸入法會記住你的輸入偏好,因此候選詞一定程度上可以反映一個人的性格,算法比你自己更懂你。

算法比你還了解自己?胡扯

我勸你別信,這不過是新時代的「電子迷信」罷了,打出「一絲不掛」不一定是不正經,這個鍋應該算法來背。

輸入法的候選詞預測功能,原本是為了提高輸入效率,但在算法的介入下走向了「歧路」。

算法預測,不一定和你有關

經歷過功能機時代的人,可能都會有這樣一個共同回憶,老師在黑板上揮動粉筆,你在課堂下揣兜,發出輕微的抖動。

嗡嗡嗡,一條簡訊就這樣發出去了,盲打手機鍵盤是高階手機玩家的專屬技能,也是學校朋友圈的社交門檻之一,這背後就輸入預測功能。

手機輸入法從計算機延伸而來,全鍵盤的輸入效率很高,但要求輸入完整拼音,對於手機這種小巧且經常單手操作的設備而言,並不是非常合適。

算法比你還了解自己?胡扯

▲ 黑莓全鍵盤手機,曾以效率高聞名.

手機出貨量越來越高,輸入麻煩的問題就越發嚴峻,好在永遠有人能從產品體驗中找到賺錢機會,Tegic Communications 公司開發出 T9 輸入法,摩托羅拉為了與之競爭推出了 iTab 輸入法。

這兩種輸入法的共同特徵是都為手機鍵盤設計,支持 9 鍵,同時帶有輸入預測功能,不僅能根據已經輸入的文字調整候選詞,還能根據人們的輸入習慣調整候選詞順序。

比如按下 7 鍵(wxyz)和 9 鍵(qprs),候選詞會出現「我是」,進而候選詞又會優先顯示姓名。

算法比你還了解自己?胡扯

根據輸入習慣調整候選詞順序的認知,在功能機時代就已經形成,今天社交平台上的「輸入法測試」,不過是又一次社交輪回,我們還在重復十年前的事。

有趣的是,隨著簡訊被各種網際網路服務取代,讓你打字更快的輸入法,在輸入預測方面進化出了新功能——算法預測和熱詞推薦,且破壞了自功能機時代就形成的認知,輸入候選詞不一定和你的輸入習慣有關。

比如「yyds」的候選詞原本應該是一衣帶水等詞,在網絡文化的影響下,「永遠滴神」在候選詞中排序越來越靠前,這和你的輸入習慣沒有任何關系。

算法比你還了解自己?胡扯

熱詞推薦選取的熱詞,往往來自各種網絡流行文化,今天是 YYDS,明天是絕絕子,之後還會有更多。

iPhone 默認輸入法的輸入預測功能,甚至會參考 Safari 瀏覽器的瀏覽記錄。

算法比你還了解自己?胡扯

▲ iPhone 鍵盤. 圖片來自:9to5Mac

輸入「ysbg」,候選詞中有一絲不掛,並不是你不正經,可能是陳奕迅的歌太火,又或是作為陳奕迅的粉絲,你聽過這首歌。

為了讓你輸入更快,輸入預測越來越智能,但人們的固有認知並沒有及時更新,導致不少人替算法背了鍋。

如果不想某天輸入候選框,竄出奇奇怪怪的詞,還是直接關閉熱詞推薦等功能比較好。

信息流的誤解

比起輸入法預測,信息流資訊應用和短視頻應用更像是「算法比你更懂你自己」的原教旨信徒,每一款信息流應用都力爭將如山如海般的內容,通過算法算法推薦,准確地推送每一個人的手機螢幕上。

算法比你還了解自己?胡扯

然而,理想和現實總是會有距離,你可能有過類似的遭遇,刷著新聞或短視頻,信息流突然出現一條一言難盡的八卦內容,剛好又被朋友看見了。

不出意外,朋友臉上很快會浮現「原來你是這樣的人」的表情,滿是調侃與嬉笑。

又一次,你替算法背了鍋,它並沒有那麼懂你。

算法比你還了解自己?胡扯

信息流算法推薦只是在推測你的喜好,它並不能完全真實反饋出喜好,尤其是初使用期間,當沒有用戶數據參考,算法會如何推薦內容呢?

作為日常接觸大量電子設備的編輯,我有一個切身體驗,每次換不同型號的手機,第一次打開 B 站必然會推薦相關機型的內容,有時是評測,有時是產品介紹。

算法推薦內容和平台氛圍、熱門內容也有不小的關系,UC 震驚體、標題黨的認知,很大程度上來自平台部分熱門內容,即便後續有所改善,但印象一旦形成要再改變,可能要付出數十倍的努力。

算法比你還了解自己?胡扯

▲信息流資訊應用里的標題黨文章

算法推薦,最終還是要平台內容供應。

即便是算法推薦廣為吐槽的問題信息繭房,也有有著兩面性。

美國學者凱斯·桑斯坦在《信息烏托邦》一書中提出了信息繭房的概念,即人們關注的信息領域會受個人興趣引導,豐富的內容不一定能擴大認知,反而會讓人持續形成偏見,陷入到「繭房」當中。

算法比你還了解自己?胡扯

▲ 凱斯·桑斯坦. 圖片來自:wiki

人的興趣是不斷變化的,主動訓練算法其實可以帶來意想不到的效果,編輯部就有一位梁姓編輯,將小紅書用成了「插畫靈感」平台。

她有意地不點擊吃喝玩樂類內容,而只會點贊、關注、進一步瀏覽插畫類內容,且保持每日 30 分鍾,很快小紅書信息流主頁就基本都是各式各樣的插畫了,便於學習了解。

算法比你還了解自己?胡扯

▲ 梁編輯的小紅書首頁

在梁編輯看來:純粹依靠算法推薦餵養自己接收到的信息無疑是有風險,極有可能陷入到盲從、偏見當中,主動從興趣出發選擇內容,是擴展信息領域和自我認知的新方法。

算法推薦上癮,其實比信息繭房更嚴重。

算法黑盒不開,誤解不止

算法就像是一個黑盒,我們只能遠遠的看見黑盒表面,無法看破其中的奇妙之處,一知半解再加上算法推薦的高效,自然會不斷引發誤解。

算法比你還了解自己?胡扯

▲ 圖片來自:TechTalk

微博被廣泛認為是娛樂八卦中心,吃瓜群眾不亦樂乎時,也有不少人選擇逃離,但其實微博也是社會新聞的集散點,大量社會新聞在微博發出、發酵、影響。

提及小紅書,吃喝玩樂是大多數人的第一印象,但正如上文梁編輯的親身經歷一樣,通過持續主動地訓練,小紅書也可以成為一個質量頗高的插畫創作靈感平台。

2018 年,字節跳動曾向公眾揭開了算法黑盒的神秘一角,公布了《今日頭條》的推薦系統原理。

算法比你還了解自己?胡扯

▲ 圖片來自:環球網

算法基於三個維度的數據調整內容分發,比如內容特徵指的是系統分析圖文、視頻、微頭條等類型內容的特徵;用戶特徵則包括興趣標簽、職業、年齡、性別、機型等;而環境特徵則包含地點環境,人們的行為(工作、旅遊)等。

點贊、關注、閱讀都會影響算法最後分發到每一個人螢幕上的內容

聽起來似乎很好理解,但這不過是一個定性的介紹,而非定量分析,三大特徵影響占比總是在不斷變化,一套算法也不能滿足所有內容的個性化分發。

算法比你還了解自己?胡扯

內容推薦算法是一個內容平台的核心,同時也是其商業命脈,技術和原理雙門檻,能攔住不少試圖猜測算法謀利的黑產,做號黨一旦完全了解平台的算法,完全可以通過內容賺取大量流量收益,這並不是平台所想看見的。

即便打開了一角,內容平台的推薦算法對於絕大部分人而言,還是一個黑盒,只能遠觀表面,而不能深入了解,未知帶來的誤解也就不會停止。

但至少,下次你可以甩鍋給算法,一個工具,怎麼可能比你還了解自己呢。

來源:愛范兒