Tag: 生成式 AI
蘋果每天花幾百萬美元,只為了讓 Siri「更聰明」
如果要評選一個現在科技公司的主流敘事關鍵詞,那一定是「人工智慧」,這一點即便是硬體巨頭蘋果也不例外。
據知情人士透露,蘋果把用於人工智慧研究的預算增加至數百萬美元一天(一星期花掉一個小目標)。作為對比,Open AI 公司的 CEO 薩姆·奧特曼 ( Sam Altman ) 曾表示, Open AI 在幾個月里花費了超 1 億美元來訓練 Chat GPT 4.0 。
蘋果人工智慧研究的其中一個目的就是加強 Siri 的能力。讓 iPhone 用戶能通過一句簡單的話,命令 Siri...
17 萬本盜版書,是「ChatGPT 們」變聰明的秘密
「實錘」終於來了。
今年 7 月,OpenAI 和 Meta 被三位美國作家 Sarah Silverman、Christopher Golden 和 Richard Kadrey 起訴,稱兩家公司在未經作者同意的情況下,把他們的書用作素材訓練大模型。
▲ 演員、作者 Sarah Silverman 和她的自傳,圖片來自 Vulture
證據?
在 OpenAI 案件里,原告們輸入提示詞後,ChatGPT 能夠總結出他們的書的內容。
在 Meta 案件中,Meta 大模型...
拒絕「白嫖」!數千名作家發聲:生成式 AI 也得付版權費
基於大語言模型的生成式 AI 終究還是「惹眾怒」了!
近日,8500 多名小說、非小說和詩歌作者聯合簽署了一份致生成式 AI 領導者的公開信,呼籲 OpenAI、Alphabet、Meta、Stability AI、IBM 和 Microsoft 的執行長就在訓練 AI 時使用受版權保護的材料的作者徵得同意、認可並給予公平補償。
信中寫道:「基於大型語言模型的生成式 AI 技術的存在歸功於我們的著作。這些技術模仿並反省我們的語言、故事、風格和想法。」
這樣的說法可能有失偏頗,但是當我們細究生成式 AI 技術的工作原理之後,倒也是不無道理。
具體來說,生成式 AI 的工作原理就是利用機器學習模型,學習人工創建的內容數據集中的模式和關系,然後再利用學習的模式生成新內容。其中預訓練的數據資料便充當著「石油」燃料的作用。
以當前火爆的 ChatGPT 為例,公開數據顯示,ChatGPT 的訓練數據量為 8000 億個單詞的語言料庫,包含了...