為什麼總是先看到閃電再聽到打雷聲?
小時候的答案可能是,眼睛在耳朵前面。而開始接觸物理學之後,答案則成為,光傳播速度要比聲音快得多。甚至,也根據這個基本常識做了許多物理解答題。
▲ 圖片來自:unsplash
先有畫面,後有聲音,這個看似不成規律的一個現象,也普遍出現在許多行業領域里。
像是電影行業,最開始出現的就是默片,光有畫面,後續才發展將音軌刻在膠片上,於是才出現了有聲電影。
如今,視頻(畫面)、音頻(聲音)的發展程度亦出現了一些差距。
4K、8K,HDR,10bit 等等視頻規格正在快速普及,幾乎成為當下電視、手機影音體驗的標配。
而聲音,則要曲折坎坷一些。它遇到了一個魚與熊掌的抉擇問題,魚就好似「便攜」,熊掌則是「音質」。
在 TWS 真無線耳機潮流席捲全球之後,大部分人都因便攜而妥協了音質。時至如今,發展多年的藍牙傳輸速率仍然還未能徹底解鎖無損音質。
在剛結束 INNO DAY 上,OPPO 通過了一枚自研藍牙音頻晶片 MariSilicon Y(馬里亞納 Y),徹底解決了縈繞在音頻發展路上「便攜」與「質量」兼得的棘手問題。
高質量音頻,有必要嗎?
或者換個說法,高質量音頻對於普通人來說有意義嗎?
此前,獲得 HiFi、無損這類高品質音頻門檻並不低,需要在前端、解碼、傳輸、功放上下足功夫,這麼一整套下來,才會得到無損的音質。
除了一些發燒級玩家外,普通人其實很少能夠享受得到。但隨著 HiFi、無損音樂的普及,以及小型化設備的出現,越來越多的人開始接觸無損這類高品質音頻。
正所謂「由奢入儉難」,經過對比之後,人們對於高品質音樂蜂擁而至,這其實跟 4K、8K 畫質的普及有些類似。
隨著音頻內容消費量級不斷地提升,期待更好的音頻體驗也逐步成為主流消費群體的一個期許。
在《2022 音頻產品使用現狀調研報告》里,接近 6 成的受訪者希望能獲得高解析度和無損音質,並且超過 6 成消費者認定無損音質會決定他們的購買行為。
同時,主流的流媒體音樂平台們也悄悄地擴充著無損曲庫,Spotify 推出了 Spotify HiFi,Apple Music 也在近年上線了無損音頻。網易雲、QQ 音樂早已上線了 HiRes(高解析音頻)、無損音頻等高音質服務,且也在不斷擴充曲庫。
不論是行業大勢,還是消費群體的意願,高品質音樂的普及或者流行,都是一個音頻發展的大潮,蓄勢待發,只欠東風。
而這個東風,就是如何把無損與當下已成主流聽音習慣的 TWS 真無線便攜相結合。
無線的大趨勢,藍牙傳輸速率的高低成為直接影響音質的一大因素。但相對於 TWS 耳機的普及速度,藍牙標準的發展就顯得有點慢。
直到如今,公有的藍牙標準也沒能達到無損音頻所需要的 2.25Mbps 最低速率。
即便主流流媒體平台有著大量的無損資源,但聽到他們就有些逆潮流,依然需要有線並且外接一個 DAC(轉換器)。
鑒於此,許多廠商或者消費群體都在期望出現新的公有更高標準的藍牙協議,去打破這個速率屏障。
但 OPPO 的做法要更極致一些,直接從晶片、藍牙標準上解決「無損音質困在有線」中的難題。
MariSilicon Y(馬里亞納 Y)帶來了 12Mbps 的超高速藍牙,能夠覆蓋到目前最高規格的 192kHz/24bit 無損音頻,達到了標準藍牙的 4 倍。
另外,OPPO 為了能釋放 MariSilicon Y 的藍牙速率,還定製了 URLC 音頻編碼技術,配合 12Mbps 高速藍牙,就好似硬體與軟體協同,開啟了無損音頻傳輸。
MariSilicon Y 的定位是連接屬性的 SoC。他可以在耳機側當主角,因為它是一個完全獨立的晶片,可以搭配不同型號的手機使用;當在手機端,他也可以與主 SoC 相互協同。
OPPO 通過自研晶片和獨立的音頻編碼,打通了無線無損共存的壁壘,高質量的音頻幾乎隨手可得。此時,高質量音頻是否有必要這個熱議的問題,嘗試過後就會不攻自破了。
MariSilicon Y 超前音頻體驗,豈止於無線無損
2021 年,OPPO 發布首款自研晶片 MariSilicon X。
在 2022 年,專注於影像的 MariSilicon X 正式完成商用,Reno、Find 等系列大部分 OPPO 新品當中都有著 MariSilicon X 的存在,它造就了與眾不同的 OPPO 影像。
首枚自研晶片瞄向影像領域,其實是 OPPO 對於行業及用戶需求洞察。可以說既符合 OPPO 產品一貫的特質,也符合用戶們對手機拍攝能力的一個需求。
MariSilicon Y 亦是如此。
在打破無線與無損不兼容的傳統的同時,OPPO 也賦予了 MariSilicon Y 更多更深層次的用途和布局。
與電影行業類似,稍晚於影像方向的計算攝影,音頻領域近年以來也開始向 AI 算法領域靠攏。
目前,音頻處理依然用的是主 SoC 中的 DSP(數位訊號處理器)完成,當下流行的「空間音頻」和「主動降噪」其實也是基於此,暫時還未調用主 SoC 當中的 NPU,算力不斷提升的 AI,並沒有參與到音頻的處理當中。
可以說,在 MariSilicon Y 發布之前,「計算音頻」其實還未真正的拉開序幕。
MariSilicon Y 在具有 12Mbps 高速藍牙以及 URLC 獨立編碼同時,還內置了 NPU 單元,旨在探索或者布局計算音頻的浪潮。
從客觀數據來看,其內置 DSP 算力達到 25GOPS,內置 NPU 單元算力達到 590GOPS,即 590 GOPs = 每秒實現 590 億次計算,而蘋果 AirPods Pro(第一代)H1 晶片算力約為 9 GOPS 算力,MariSilicon Y 是其 65 倍,這二者均要領先當下音頻領域的同類型產品,有著一定的冗餘設計。
未來,計算音頻能為聽音體驗和聲音呈現方式帶來何種突破暫時難以預測,但可以肯定的是音頻與圖片一樣,會賦予更多的「個性」元素。
MariSilicon Y 會利用更強的 NPU 算力,去分析音頻數據,將人聲與特定樂器分離,實現不同音色的定製化。
目前在 OPPO 的測試當中,MariSilicon Y 已經實現分離人聲、貝斯、鼓聲與其他四條獨立音軌。
相較於傳統多軌音頻才能分離來說,NPU 的加入已大幅簡化與減負。
在分離出不同音軌後,MariSilicon Y 帶來了對聲音「個性化」的一次嘗試,並帶來了自定義全景聲和萬能全景聲。
自定義全景聲能夠自定義不同音軌(如人聲)的空間位置,創造一個全新的「空間音頻」,它有些類似於之前對音樂調整的 EQ 值。
而萬能全景聲,其實算是一個對聲音的萬能後期。全景聲、立體聲這些效果需要音樂製作時採用獨特的格式,否則幾乎無緣全景聲。
MariSilicon Y 便可以利用 AI 算力分離出多重音軌,並重新渲染空間,轉化成立體聲全景聲這種新的聽覺使用體驗。
而對 MariSilicon Y 的強 AI 算力,OPPO 還有著更多的探索和想像空間,像是通過 AI 分離人聲來獨特降噪或者增強等等。
MariSilicon Y 其實跟 MariSilicon X 類似,超強的算力和能力,更像是一種提前布局。它的能力要遠超我們現在對於計算音頻能力的預測或者想像。
晶片的疊代,並不像是硬體或者軟體,有著很高的頻率,往往需要兩年或者三年的部署,再落地到常規更迭當中。而 OPPO 的 MariSilicon 計劃也不過剛剛起步,才剛開始布局。
在 MariSilicon Y 中引入一些超前理念,比如 AI 算力,NPU 的運用等等,實際上是一個頗為嚴謹和沉穩的做法。
從當下來看,MariSilicon Y 帶來的不止是無線、無損的超前音頻體驗,也不止是對計算音頻的嘗試,而更像是對未來幾年 AI 在影音體驗提升上的一個超前布局。