IDG、哈勃、元禾,聯(lián)手投了復(fù)旦知名教授邱錫鵬
微信視頻號:sph0RgSyDYV47z6
快手號:4874645212
抖音號:dy0so323fq2w
小紅書號:95619019828
B站1:UID:3546863642871878
B站2:UID: 3546955410049087
教授創(chuàng)業(yè)再次獲得頂級VC支持。
投中嘉川CVSource顯示,上海模思智能科技有限公司(簡稱“模思智能”)完成首輪融資。投資方為IDG資本、華為哈勃、元禾控股和智譜系機構(gòu)星連資本。
模思智能由復(fù)旦大學(xué)知名教授邱錫鵬和他的學(xué)生創(chuàng)辦。邱錫鵬是國內(nèi)AI領(lǐng)域最知名的教授之一。他的專著《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》是國內(nèi)“人工智能入門必讀書”。2023年,他還帶領(lǐng)團隊發(fā)布了大模型MOSS,成為最早破圈的開源中文大語言模型。
模思智能主要從事語音大模型研發(fā),近期發(fā)布了MOSS-Speech。按其官方說法,這標(biāo)志著國產(chǎn)AI邁入了“真語音到語音交互”的新階段。
01.
誰是邱錫鵬?
復(fù)旦教授,人工智能的布道者
2024年11月,模思智能(Moss Intelligence)在上海成立。這家年輕的公司立志于推動多模態(tài)交互與具身智能的產(chǎn)業(yè)化落地,希望通過更“懂人”的AI交互系統(tǒng),重塑語音與視覺的結(jié)合方式。
模思智能的核心技術(shù)方向,是通過對用戶提供的上下文與情境進(jìn)行深度理解,構(gòu)建自然、擬人的交互體驗。公司當(dāng)前的主營業(yè)務(wù)聚焦在語音大模型應(yīng)用領(lǐng)域,產(chǎn)品主要服務(wù)于游戲解說、直播電商、新聞播報等語音內(nèi)容密集型場景。
能讓模思智能在天使輪階段就吸引IDG資本、華為哈勃、元禾控股等頂級機構(gòu)投資的,離不開公司創(chuàng)始人復(fù)旦大學(xué)計算機學(xué)院教授邱錫鵬。
邱錫鵬1997年考入復(fù)旦大學(xué),先后獲得理學(xué)學(xué)士和博士學(xué)位,并自2007年起留校任教。目前,他是復(fù)旦大學(xué)計算機學(xué)院教授、博士生導(dǎo)師,也是中國自然語言處理(NLP)領(lǐng)域的重要推動者。
有趣的是,邱錫鵬最初的本科專業(yè)并非計算機。在進(jìn)入復(fù)旦大學(xué)之前,他幾乎沒有接觸過編程。正是在復(fù)旦的通識課程中,他第一次接觸到計算機科學(xué),并因此深受吸引,最終轉(zhuǎn)入該領(lǐng)域。
根據(jù)復(fù)旦大學(xué)官網(wǎng)信息,邱錫鵬主要研究方向包括自然語言處理與深度學(xué)習(xí)。他在ACL、EMNLP、AAAI、IJCAI 等國際頂級會議和期刊上發(fā)表論文50余篇,是國內(nèi)外學(xué)界高度認(rèn)可的學(xué)者。他主持開發(fā)的開源自然語言處理工具 FudanNLP 與 FastNLP,至今仍被廣泛使用。
2015年邱錫鵬入選首屆“中國科協(xié)青年人才托舉工程”;2018年則榮獲中國中文信息學(xué)會“錢偉長中文信息處理科學(xué)技術(shù)獎——漢王青年創(chuàng)新獎”。
話說2015年時,復(fù)旦大學(xué)首次開設(shè)“神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)”課程。由于當(dāng)時沒有合適的教材,邱錫鵬便決定親自編寫講義。后來,這份講義被擴寫成專著《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》,成為國內(nèi)AI教育領(lǐng)域的經(jīng)典讀物,被譽為“人工智能入門必讀書”。邱錫鵬也由此成為中國人工智能領(lǐng)域布道者式的人物。
不過真正讓邱錫鵬“出圈”的,是在2023年春節(jié),他帶領(lǐng)團隊迅速推出了開源中文大語言模型MOSS。這款以科幻電影《流浪地球2》中量子超級計算機命名的模型,一經(jīng)發(fā)布便登上微博熱搜。
當(dāng)時,OpenAI發(fā)布ChatGPT不久,國內(nèi)大模型尚處于空白。邱錫鵬團隊的成果是國內(nèi)首個開放式中文對話大模型,不僅填補了中文語境下的技術(shù)空白,也推動了國內(nèi)大模型的開源研究生態(tài)。
而這次創(chuàng)辦的模思智能,其中文名“模思”,正是“MOSS”的音譯。可見這家公司正是此前科研成果的轉(zhuǎn)化項目。
02.
最新發(fā)布 MOSS-Speech
讓機器人說話更自然
從工商信息看,邱錫鵬目前擔(dān)任模思智能首席科學(xué)家,同時也是最大股東,持股約29%。
圖片來源:投中嘉川CVSource
公司聯(lián)合創(chuàng)始人兼CEO李世民,則是邱錫鵬的學(xué)生,復(fù)旦大學(xué)計算與智能創(chuàng)新學(xué)院2022級的碩博連讀研究生。
這位與唐朝皇帝同名的年輕人,在學(xué)術(shù)界已嶄露頭角——據(jù)復(fù)旦大學(xué)官方公眾號今年6月報道,李世民作為第一作者在CCF-A類國際會議上發(fā)表了3篇論文,并深度參與科技部“新一代人工智能2030”重點研發(fā)項目,在擬人化人機交互領(lǐng)域取得重要突破。
在創(chuàng)業(yè)之前,他主導(dǎo)推出了SpeechGPT——國內(nèi)首個離散化端到端語音交互模型。該模型打破了傳統(tǒng)語音系統(tǒng)“語音識別→對話模型→語音合成”的三級串聯(lián)架構(gòu),實現(xiàn)了“語音輸入→語音輸出”的直接交互方式,被視為“語音版GPT”的早期雛形。
2024年,李世民還帶領(lǐng)團隊開發(fā)跨學(xué)科協(xié)作平臺“學(xué)橋”。這款產(chǎn)品“學(xué)橋”整合了學(xué)校信息辦和圖書館提供的10萬余篇官方論文、數(shù)千名教師以及學(xué)生達(dá)人信息,打破學(xué)科交叉合作的信息壁壘。
在接受復(fù)旦大學(xué)公眾號采訪時,他說“將前沿技術(shù)真正轉(zhuǎn)化成具有社會價值的產(chǎn)品,是我們的目標(biāo)。”可見,李世民是邱錫鵬的得意門生,不論是在科研還是產(chǎn)品上,延續(xù)了導(dǎo)師對學(xué)術(shù)的探索與面向應(yīng)用的技術(shù)導(dǎo)向。
目前,模思智能正圍繞其核心技術(shù)打造對標(biāo)谷歌Gemini Pro 的多模態(tài)大模型與智能體內(nèi)容創(chuàng)作平臺,涵蓋高表現(xiàn)力的音視頻理解與生成能力。最新進(jìn)展顯示,在邱錫鵬和李世民的帶領(lǐng)下,模思智能近期發(fā)布了MOSS-Speech。
據(jù)官方介紹,這款模型標(biāo)志著語音AI正式進(jìn)入“語音到語音”的交互階段。它與傳統(tǒng)“語音識別—文本生成—語音合成”的級聯(lián)方案不同,MOSS-Speech 實現(xiàn)了直接從語音理解到語音生成,無需文本中介。該模型可在生成回答的同時捕捉語調(diào)、情緒、笑聲等非文字信號,使機器“說話”更自然、更具人性。
2023年,在接受復(fù)旦大學(xué)專訪時,邱錫鵬說:“長遠(yuǎn)來看,我們期待把MOSS作為一個通向通用人工智能的基座,讓它變成一個像科幻片角色的真實存在。我覺得通用人工智能由科幻步入現(xiàn)實,應(yīng)該不會很遠(yuǎn),也許5到10年。”
從科研到創(chuàng)業(yè),邱錫鵬和他的學(xué)生們,正以商業(yè)的力量,把“未來”一點點拉近現(xiàn)實。
微信視頻號:sph0RgSyDYV47z6
快手號:4874645212
抖音號:dy0so323fq2w
小紅書號:95619019828
B站1:UID:3546863642871878
B站2:UID: 3546955410049087
參考文獻(xiàn)鏈接
1.CIPS大模型與生成,真-語音到語音交互:MOSS-Speech 正式發(fā)布
2.復(fù)旦大學(xué),研究成果將會開源!復(fù)旦MOSS團隊深度訪談來了
3.復(fù)旦大學(xué),青年五四獎?wù)拢》艞墶按髲S”,他的選擇是……

浙公網(wǎng)安備 33010602011771號