百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

最近 AI 真是火得沒邊了。

OpenAI 靠著 ChatGPT 實力吸睛,Google 帶著 Bard 緊隨其後,就在昨天,GPT-4 模型又搶盡風頭。你方唱罷我登場的 AI 領域,今天,輪到了百度了。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

就在今天下午,備受期待的百度文心一言如期而至。不過在發布會一開場,百度 CEO 李彥宏先給大家打了一劑預防針:

從某種意義上說百度為此(發布文心一言)已經准備了多年,我們十幾年前就開始投入 AI 研究,2019 年就推出了文心大語言模型,今天的文心一言是過去多年努力的延續。

但也不能說我們完全 ready 了,文心一言要對標 ChatGPT、甚至是對標 GPT-4 的門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個。我自己測試感覺還是有很多不完美的地方。

姍姍來遲的文心一言表現如何?和 ChatGPT 的差距有多少?能滿足市場對中文大語言模型的需求嗎?我們對它做了一次全方位解析。

申請內測網站我們也一並放出來 👉 https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

新一代大語言模型、生成式 AI 產品文心一言,能做什麼?

五大要點:

  • 文學創作;
  • 商業文案的創作;
  • 數理邏輯的推算;
  • 中文的理解;
  • 多模態生成。

針對這五大場景,李彥宏分別進行了演示。值得一提的是,這些演示並非現場操作,而是錄播。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

首先是文心一言的文學創作能力,李彥宏連續對文心一言提出了與《三體》相關的若干問題。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

首先從演示視頻看來,文心一言的回答速度很快,比 ChatGPT 快很多,另外出來的內容都挺不錯的,後面我們也會把相同的問題扔給 ChatGPT 和必應 Chat,看看三者之間的區別。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

▲動圖未加速

針對商業文案創作,李彥宏向文心一言提問:

如果要成立一個用大模型服務中小企業數位化升級的科技服務公司,可以起個什麼公司名?

以下是它的問答。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

別說,還挺像樣的。

還能用它生成新聞稿,可以說是把 AI 從頭用到腳,很符合這家公司的定位。

在數理邏輯推演環節,百度問了個雞兔同籠的問題,文心一言先是發現了題目出錯,後來換了個題目,它就能准確回答出來。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

文心一言發布前,已經有人猜測這個語言模型會比 OpenAI、Google、微軟做得更好,因此百度也在這部分炫了個技,文心一言不僅准確回答了成語「洛陽紙貴」的含義,還對背後的金融現象進行了解釋,最後還用這個成語寫了首藏頭詩。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

李彥宏在現場也提到,中文是文心一言的優勢,反過來說,對英文素材的解析則成了它的劣勢。

最後介紹了文心一言的多模態生成能力,畫圖、寫長文、根據文字生成短視頻內容,它都一一完成,這是 ChatGPT 所不具備的能力。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

▲還能用生成方言語音

李彥宏還提到,百家號已經在利用文心一言的多模態生成能力,把文字內容視頻化。

會後,首批用戶通過百度提供的內測碼,可以搶先體驗到文心一言,我們已經提交內測申請,未來將在第一時間給大家帶來體驗內容。

在這之前,我們把會上演示的幾個場景,分別餵給了 ChatGPT(3.5 版)和 Bing Chat,看看他們輸出的結果如何。

對比 ChatGPT&Bing Chat,文心一言體驗如何?

演示過程中,李彥宏多次強調百度在中文語言的處理上,處於獨一無二的位置。

相比 ChatGPT 和 Bing Chat,現在的最大的不同點在於多模態生成,即可以通過語言生成海報、語音甚至視頻內容。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

發布會演示中,李彥宏展示了使用文心一言生成活動海報、方言語音,並根據提問內容生成與活動相關的視頻。不過生成視頻的成本較高,現階段尚未對所有用戶開放。

圖片、視頻的生成能力確實讓我們眼前一亮,李彥宏也表示,「多模態生成式 AI 是一個明確的發展趨勢」。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

除了這一特色功能,我們也很好奇其他能力相比 ChatGPT、Bing Chat 孰強孰弱,所以就用發布會中演示的內容去詢問了 ChatGPT(3.5 版)以及 Bing Chat。先說結論:文心一言在中文領域的表現,確實要優於 ChatGPT、Bing Chat 這兩個前輩。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

首先是關於《三體》的提問,Bing Chat 和文心一言均能正確回答作者是誰、來自哪里的問題,而 ChatGPT 則把劉慈欣的籍貫錯標成了山東。

有趣的是,Bing Chat 的信息來源是百度百科。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

而在關於 2023 年初上演的《三體》電視劇版演員的問題中,信息庫停留在 2021 年的 ChatGPT 再次吃癟,表示《三體》電視劇暫未開拍,而 Bing Chat 則在豆瓣中找到了答案。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

在商業文案創作方面,三者均可以給出它們的看法,ChatGPT 還貼心的附上了英文名,方便我們進行步入國際市場。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

而 Bing Chat 則在第一次詢問時識別錯了問題含義,沒有給我准確的公司名,而是提供了如何起一個公司名的解決方案。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

至於三家起的名字哪個更好,就留給大家評判了。

不論是 ChatGPT 還是 Bing Chat,它們在做數學題時並不能讓我們完全放心,不過百度發布會中提到的雞兔同籠問題並沒有難倒二者,均准確的做出了解答。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

相比之下,我更喜歡 Bing Chat 的解讀,它更像是一位循循善誘的老師,而文心一言的回答則有點像課後的參考答案。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

中文理解方面,文心一言的優勢就體現出來了。

在詢問「當時洛陽的紙到底有多貴」時,ChatGPT 誤以為我詢問的是唐代的物價,告訴我洛陽的紙一點都不貴,Bing Chat 識別上沒有問題,但也沒有給出准確數據。

而文心一言給出兩三千文的價格,至少與我搜索得到的數據是一致的。

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

百度文心一言首次亮相!還對標不了 ChatGPT,但別急著失望

相信你也注意到了,且不說寫的內容如何,ChatGPT 和 Bing Chat 都沒有理解什麼是藏頭詩,相比下來,百度文心一言的表現確實出色。

當然,這樣的比較對 ChatGPT 和 Bing Chat 是不公平的,畢竟我們還沒有正式體驗到文心一言,只是與發布會演示比較而已。獲得測試機會後,我們會第一時間體驗文心一言,表現如何到時再見分曉。

李彥宏在發布會中也提到,雖然中文方面優勢明顯,但文心一言針對英文語種、代碼場景的訓練還不夠多,表現也不夠好,相信接下來百度會迅速提升。

腳踏實地,仰望星空

毫無疑問,文心一言的發布對於中文網際網路來說是個標志性的事件。

正如李彥宏開場時所言,百度是首個做出可以對標 ChatGPT 的產品的大廠,實現了中文語言大模型 AI 生成式產品從無到有的突破。

但另一方面,我們也需要正確看待文心一言與 ChatGPT 之間的差距。

我們今天所說的 ChatGPT,或者其背後的 GPT-4 語言模型,是一個花了 5 年時間、經歷了 4 次疊代,完成了從量變到質變過程。想讓文心一言在這麼短的時間內實現趕超,幾乎是不可能的事情。

從今天的發布會來看,文心一言並不是人們預期中那樣具有革命性的產品,而更像是對百度 AI 技術儲備的一次中期考驗,展現百度也有追逐最先進人工智慧產品的研發能力。

面向公眾開放後,文心一言可以通過用戶們大量的搜索請求進行學習和改進,從而提升處理相應問題的准確性和速度。在 ChatGPT 上,我們已經見識過 AI 語言模型進化的速度。

如果你也期待見到一個真正的「中文版 ChatGPT」,不妨再給文心一言時間和耐心。士別三日,當刮目相看,對於 AI 模型更是如此。

來源:愛范兒