全球首款音樂推理模型Mureka O1亮相,AI音樂迎來變革
在AI技術飛速發展的當下,音樂創作領域也迎來了重大突破。昆侖萬維發布的全球首款音樂推理大模型Mureka O1,引發了行業的廣泛關注,這一創新成果讓AI音樂邁入了新的階段。
更多AI好文請關注【程序員導航】公眾號或訪問:https://www.panziye.com/ai
Mureka O1的出現,打破了AI音樂市場的原有格局。它一舉超越Suno等同類模型,在各大評測中表現優異,成功登頂。該模型之所以如此強大,關鍵在于融入了思維鏈(CoT)技術。這項技術就像是給模型賦予了“思考”能力,讓它在生成音樂前,能像人一樣進行多步驟推理和自我檢查,進而提升了歌詞與旋律的契合度、演唱準確性以及藝術表現力 。
Mureka O1并非憑空誕生,它基于全新的基座模型Mureka V6進行升級。Mureka V6引入了上下文學習(ICL)技術,優化了聲場效果,使人聲和混音更加出色。同時,它還支持10種語言的音樂創作,覆蓋了全球主要國家和地區的用戶,為音樂創作提供了更多可能。

Mureka O1背后的核心技術是MusiCoT框架,這是CoT技術在音樂領域的首次應用,具有開創性意義。以往的音樂生成模型,在創作時可能缺乏系統性,而MusiCoT框架改變了這一現狀。它會先從整體規劃音樂結構,比如確定主歌、副歌和過渡段的大致框架,再逐步填充音頻細節,就像搭建一座房子,先有框架,再進行內部裝修。
而且,MusiCoT框架是基于CLAP模型構建的,不需要大量人工標注就能不斷擴展功能。這使得生成的音樂不僅更具解釋性,還能提升藝術感染力。用戶只要輸入簡單的場景描述,Mureka O1就能在幾秒內創作出專業水準的音樂作品,并且還支持多軌輸出,方便用戶進行混音和二次創作。

為了推動AI音樂的發展,Mureka向企業和開發者開放了豐富的API服務。
- 音樂API:
- 標準音樂生成API:支持多種輸入方式,如文本提示、音色參考和音頻參考。通過這些不同的輸入,用戶可以創作出各種風格的音樂,無論是用于內容創作、游戲配樂,還是短視頻制作,都非常方便。
- 精調私有曲庫API:用戶可以上傳自己的曲庫,模型會根據這些曲庫的風格特點進行調整,幫助用戶打造專屬的品牌音樂或個人專輯,即使沒有專業音樂知識也能輕松操作。
- 語音API:Mureka提供了AI語音播客、精品說話人、音色克隆等功能的API。其開發的Mureka TTS在與ElevenLabs、OpenAI、微軟等的評測中表現出色,在聊天對話場景下的語音合成效果與一線廠商相當。
此外,Mureka還是全球首個開放模型微調的AI音樂平臺,開發者可以上傳私有數據訓練專屬模型,并且數據會嚴格保密,保障了用戶的權益
AI音樂市場正呈現出爆發式增長的態勢。據Fortune Business Insights數據,2023年全球數字音頻工作站(DAW)市場規模約為30億美元,預計到2026年,70%的DAW企業將借助AI技術輔助音樂創作。GlobeNewswire也預測,到2032年全球DAW市場規模將超過66.2億美元,2024年 - 2032年的復合年增長率達8.6%。
昆侖萬維憑借敏銳的市場洞察力,以“All in AGI與AIGC”戰略布局AI音樂領域。Mureka作為其中的關鍵一環,商業化前景十分廣闊。此前昆侖萬維推出的K歌產品Star Maker在海外取得了巨大成功,注冊用戶突破3.1億?;趦热莺蛫蕵焚惖赖奶攸c,用戶對AI輸出的接受度較高,Mureka有望在全球范圍內吸引大量用戶,創造可觀的收入。
Mureka O1的出現,為AI音樂帶來了新的發展方向。它不僅讓音樂創作變得更加高效、多樣化,還為開發者和企業提供了廣闊的發展空間。隨著技術的不斷進步,相信Mureka會在未來的音樂市場中發揮更大的作用,讓更多人體驗到AI音樂的魅力。

浙公網安備 33010602011771號