了不起的青年·創(chuàng)投實(shí)錄|風(fēng)語智能:瞄準(zhǔn)開源情報(bào)新藍(lán)海,實(shí)現(xiàn)大語言模型的商業(yè)化
發(fā)布時(shí)間:
2024-05-13
來源:
2023年ChatGPT的問世被認(rèn)為是人類科技發(fā)展史上重要的里程碑事件,短短幾個(gè)月里席卷全球,速度之快超出想象,也由此帶動(dòng)包括AI算法、大模型和大數(shù)據(jù)等的迅猛發(fā)展。
作為有著突出處理大規(guī)模數(shù)據(jù)集能力的自然語言處理(NLP)大模型(簡稱“大語言模型”),便隨著ChatGPT的橫空出世走向全新的高度,市場呈現(xiàn)出產(chǎn)品和應(yīng)用百花齊放的盛況,并通過與各行各業(yè)的應(yīng)用結(jié)合,探索能夠有效落地的商業(yè)模式。其中開源情報(bào)便是因大語言模型的引入迎來重大變革和進(jìn)步、并與人工智能融合形成商業(yè)閉環(huán)的行業(yè)。這一行業(yè)模式的探索者者是來自南京大學(xué)電子科學(xué)與工程學(xué)院的博士生,南京風(fēng)語智能信息技術(shù)有限公司(以下簡稱“風(fēng)語智能”)創(chuàng)始人路思遠(yuǎn)。
緣起科研項(xiàng)目,思考商業(yè)前景
風(fēng)語智能是一家專注于運(yùn)用先進(jìn)人工智能技術(shù)開展開源情報(bào)分析的公司,創(chuàng)辦于2023年9月,目前已獲得南京市創(chuàng)新投資集團(tuán)、奇跡創(chuàng)壇的兩輪投資。
“大三時(shí)開始我就跟隨芯片設(shè)計(jì)和人工智能領(lǐng)域里的國際頂尖專家王中風(fēng)教授從事新一代人工智能技術(shù),特別是深度學(xué)習(xí)加速器設(shè)計(jì)的研究??忌涎芯可?,我也正式加入了王教授領(lǐng)銜的集成電路與智能系統(tǒng)(ICAIS)實(shí)驗(yàn)室,主攻語音識(shí)別和自然語言處理技術(shù)(NLP),有幸成為國內(nèi)最早關(guān)注大模型技術(shù)研究者中的一員。”路思遠(yuǎn)在介紹自己求學(xué)歷程時(shí)展現(xiàn)出對(duì)于行業(yè)的激動(dòng)與熱情,當(dāng)2017年Google顛覆性地提出基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu)時(shí),路思遠(yuǎn)在和實(shí)驗(yàn)室老師同學(xué)們的交流中,就認(rèn)識(shí)到這一架構(gòu)在深度學(xué)習(xí)領(lǐng)域具備顛覆性的潛質(zhì)。相比傳統(tǒng)深度神經(jīng)網(wǎng)絡(luò),Transformer更加高效與簡潔,如果與醫(yī)療、金融、情報(bào)等行業(yè)結(jié)合,又可以進(jìn)一步推動(dòng)相關(guān)技術(shù)的發(fā)展,大大提升信息處理和決策效率。
隨著對(duì)技術(shù)的不斷挖掘與研究,路思遠(yuǎn)開始對(duì)高效支持Transformer模型計(jì)算的硬件架構(gòu) “發(fā)起挑戰(zhàn)”,不斷地通過研發(fā)平衡計(jì)算效率、存儲(chǔ)訪問、能效比和靈活性等多方面需求,以適應(yīng)不斷發(fā)展的AI模型和技術(shù)趨勢。讀博期間,他發(fā)表了第一篇Transformer硬件架構(gòu)工作論文,并獲得2020年IEEE片上系統(tǒng)年會(huì)的最佳論文獎(jiǎng),也由此成為了國際上最早設(shè)計(jì)出Transformer硬件架構(gòu)人員之一。
2022年11月,當(dāng)搭載了GPT3.5的ChatGPT橫空出世,憑借逼真的自然語言交互與多場景內(nèi)容生成能力一鳴驚人時(shí),也讓路思遠(yuǎn)對(duì)大模型和商業(yè)相結(jié)合的前景有了更多期待。他坦言:“我一直有創(chuàng)業(yè)的夢(mèng)想和念頭,也希望能夠抓住大模型技術(shù)迅速發(fā)展的風(fēng)口,讓自己的研究能夠產(chǎn)生商業(yè)價(jià)值。”在王中風(fēng)教授的支持下,他與深度學(xué)習(xí)數(shù)據(jù)壓縮方向的施禹伯博士組成團(tuán)隊(duì),從系統(tǒng)、算法、硬件三個(gè)維度入手,解決最新深度之習(xí)NLP算法部署難、落地難的問題,并希望可以實(shí)現(xiàn)RiSE架構(gòu)和NPU部署工具鏈的自主設(shè)計(jì),在研發(fā)過程中找到競爭優(yōu)勢和商業(yè)轉(zhuǎn)化機(jī)遇。
寧聚計(jì)劃留人才,校地融合促發(fā)展
2023年3月,在導(dǎo)師王中風(fēng)教授和南京大學(xué)國際創(chuàng)新創(chuàng)業(yè)學(xué)院的支持下,風(fēng)語智能在南京大學(xué)大學(xué)生創(chuàng)業(yè)園正式成立。
“‘風(fēng)’象征著流動(dòng)和快速傳播,‘語’則與語言、交流相聯(lián),以‘風(fēng)語智能’命名公司,是希望公司的產(chǎn)品可以像風(fēng)一樣高效且自然流暢地傳遞和處理信息。所以我們集中精力去做研發(fā),但是很快也發(fā)現(xiàn)初創(chuàng)公司資金、資源、人才是不得不面對(duì)的現(xiàn)實(shí)問題。”雖然是連續(xù)創(chuàng)業(yè)者,但是當(dāng)真正作為創(chuàng)始人肩負(fù)公司的發(fā)展責(zé)任后,路思遠(yuǎn)不得不思考和鉆研得更多一些。隨著寧聚計(jì)劃的深入貫徹落實(shí),更多青年創(chuàng)客選擇留寧展業(yè)。為了獲得更多的支持與關(guān)注,路思遠(yuǎn)決定攜手團(tuán)隊(duì)參加了由市人社局主辦、南京市創(chuàng)新投資集團(tuán)支持的2023年“贏在南京”青年大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽。經(jīng)過激烈的廝殺拼搏,路思遠(yuǎn)的“風(fēng)語智能”從3500多個(gè)創(chuàng)業(yè)項(xiàng)目脫穎而出,獲得評(píng)委一致認(rèn)可,斬獲了這屆大賽的一等獎(jiǎng)桂冠,憑此得到了南京市創(chuàng)新投資集團(tuán)天使基金的專項(xiàng)資金支持與財(cái)政獎(jiǎng)勵(lì),“南京大學(xué)在創(chuàng)業(yè)場地上、創(chuàng)業(yè)教育上給了我們很多支持,同事創(chuàng)投集團(tuán)的天使投資與財(cái)政補(bǔ)助在資金上給與我們助力,創(chuàng)投集團(tuán)專業(yè)的投后孵化服務(wù),也讓我們?cè)谒伎籍a(chǎn)品與市場間關(guān)系上有了更多的專業(yè)助力,讓我們的創(chuàng)業(yè)之路走的更穩(wěn)更安心。”同年,路思遠(yuǎn)向知名AI天使投資機(jī)構(gòu)奇績創(chuàng)壇提交了圍繞語言大模型應(yīng)用的創(chuàng)業(yè)項(xiàng)目申請(qǐng),得到創(chuàng)始人陸奇博士青睞,成為2023年春季創(chuàng)業(yè)營60個(gè)入選項(xiàng)目之一,自此邁開市場化融資的第一步。
瞄準(zhǔn)開源情報(bào),聚焦打造高性能產(chǎn)品
2023年4月,貝哲斯咨詢對(duì)外發(fā)布了《2023-2029年中國開源情報(bào)行業(yè)市場發(fā)展趨勢調(diào)研報(bào)告》,報(bào)告內(nèi)容覆蓋行業(yè)概況、上下游情況、行業(yè)頭部企業(yè),主要競爭力產(chǎn)品等,體現(xiàn)出開源情報(bào)對(duì)政企單位策略部署、戰(zhàn)略制定、趨勢判斷、風(fēng)險(xiǎn)預(yù)知等的重要意義。
路思遠(yuǎn)和團(tuán)隊(duì)敏銳地捕捉到開源情報(bào)行業(yè)的發(fā)展前景以及在大量商業(yè)情報(bào)檢測、搜集和分析過程中,對(duì)數(shù)據(jù)高效精準(zhǔn)獲得、抓取、交互和大量文本快速總結(jié)的需求。“目前開源情報(bào)業(yè)持續(xù)以6.23%的CAGR增長,預(yù)計(jì)2028年市場規(guī)??赏_(dá)到395.89億元,對(duì)于人工智能應(yīng)用落地而言,這是一片具有極大發(fā)展空間且與大語言模型優(yōu)勢高度匹配的藍(lán)海市場。所以我們?cè)诋a(chǎn)品研發(fā)和市場開拓上做了大膽地嘗試。”
深度思考,謀定而動(dòng),風(fēng)語智能聚焦開源情報(bào)業(yè),立足Transformer神經(jīng)網(wǎng)絡(luò)高性能計(jì)算、深耕深度學(xué)習(xí)數(shù)據(jù)壓縮等領(lǐng)域,將AI大模型在文字工作方面的優(yōu)勢充分發(fā)揮,結(jié)合大規(guī)模預(yù)訓(xùn)練模型壓縮算法和高性能計(jì)算方案上的優(yōu)勢,打磨產(chǎn)品力,最終研發(fā)出在垂直領(lǐng)域集推理速度快、回答準(zhǔn)確率高、響應(yīng)速度快、吞吐率強(qiáng)、外掛數(shù)據(jù)庫容量大、數(shù)據(jù)可交互治理、能私有化部署等多重優(yōu)勢的“高性能智庫Agent”產(chǎn)品。大模型時(shí)代,訓(xùn)練數(shù)據(jù)獲取和復(fù)用成本的降低,效率卻顯著提升。
“智庫Agent相較于傳統(tǒng)產(chǎn)品來說,性能更高、響應(yīng)更快、保密性好,擁有針對(duì)多模態(tài)數(shù)據(jù)(視頻圖片、文字)的RAG算法且對(duì)上傳文件的數(shù)量沒有限制,能夠能快速分析上傳的文件內(nèi)容,實(shí)現(xiàn)各類數(shù)據(jù)統(tǒng)一治理加個(gè)性化推送。優(yōu)點(diǎn)足夠突出,用戶體驗(yàn)感才能好。”路思遠(yuǎn)介紹道。“但是大模型技術(shù)成本高,且最新深度學(xué)習(xí)NLP算法更是部署難、落地難。我們?cè)贜LP的算法、硬件、云端、嵌入式端部署等方面積累關(guān)鍵技術(shù)使得產(chǎn)品在軟件與硬件方面有突出優(yōu)勢,從而大大降低成本。”高性能智庫Agent產(chǎn)品屬性能很好地應(yīng)用于開源情報(bào)領(lǐng)域,風(fēng)語智能通過人工智能與開源情報(bào)的結(jié)合,在大模型產(chǎn)品落地方面上探索出一條新路徑,推動(dòng)了該領(lǐng)域邁向智能化、自動(dòng)化時(shí)代。
目前風(fēng)語智能團(tuán)隊(duì)已與5家客戶簽訂項(xiàng)目合作協(xié)議、與十余家進(jìn)入探討合作,包括江蘇頭部政府智庫、博智安全、南京云創(chuàng)大數(shù)據(jù)等。其中為某醫(yī)院建立精神疾病問診的大模型知識(shí)庫已得到有效推進(jìn),通過提升醫(yī)院的數(shù)據(jù)分析能力與水平,實(shí)現(xiàn)病案智能生成,輔助醫(yī)生診治,達(dá)到醫(yī)院問診速度與準(zhǔn)確性提升的目的。
團(tuán)隊(duì)緊密合作,開創(chuàng)產(chǎn)品新未來
“創(chuàng)業(yè)征途,團(tuán)隊(duì)為舵,齊心協(xié)力,行必致遠(yuǎn)。”路思遠(yuǎn)博士作為發(fā)起人,聯(lián)合深度學(xué)習(xí)數(shù)據(jù)壓縮方向的施禹伯博士組成團(tuán)隊(duì),邀請(qǐng)導(dǎo)師王中風(fēng)教授和南大信息管理學(xué)院裴雷院長等學(xué)界與業(yè)界大咖擔(dān)任首席科學(xué)家和技術(shù)顧問,背靠南京大學(xué)ICAIS實(shí)驗(yàn)室,在雄厚的技術(shù)研發(fā)背景和實(shí)力下,團(tuán)隊(duì)緊密配合,分工明確,借鑒大模型技術(shù)迅速研發(fā)新產(chǎn)品。
“接下來,我們希望為客戶提供實(shí)際應(yīng)用中所需的軟硬結(jié)合解決方案,實(shí)現(xiàn)產(chǎn)品軟硬一體”。談到規(guī)劃,路思遠(yuǎn)表示將持續(xù)研發(fā)和迭代高性能的硬件設(shè)備,為風(fēng)語智能產(chǎn)品的安全性能提供重要的保障,以確保產(chǎn)品接入網(wǎng)絡(luò)獲取外部信息時(shí)用戶內(nèi)部數(shù)據(jù)不外泄。與此同時(shí),讓公司的產(chǎn)品服務(wù)在軟硬件一體的加持下,壁壘更高、競爭力更強(qiáng)。
如今,風(fēng)語智能已研發(fā)出了針對(duì)情報(bào)行業(yè)細(xì)分需求的軟硬件一體化產(chǎn)品,申請(qǐng)了多項(xiàng)知識(shí)產(chǎn)權(quán),并與多家公司達(dá)成項(xiàng)目合作,榮獲多個(gè)優(yōu)秀項(xiàng)目獎(jiǎng)項(xiàng)……取得傲人成績的背后是風(fēng)語智能團(tuán)隊(duì)的創(chuàng)業(yè)投入和激情,以及對(duì)商業(yè)市場的敏銳度和拓展能力。
南京市創(chuàng)新投資集團(tuán)大創(chuàng)投資團(tuán)隊(duì)表示,“贏在南京”青年大學(xué)生創(chuàng)新創(chuàng)業(yè)大賽我們關(guān)注到了風(fēng)語智能。風(fēng)語智能作為開源情報(bào)業(yè)與人工智能領(lǐng)域的創(chuàng)新公司,作為來自南京大學(xué)的年輕創(chuàng)業(yè)團(tuán)隊(duì),擁有扎實(shí)的技術(shù)背景,助力產(chǎn)品落地開源情報(bào)領(lǐng)域。作為國有創(chuàng)投機(jī)構(gòu),我們將持續(xù)關(guān)注早期科技企業(yè)的發(fā)展,并圍繞資本、管理、資源、人才等給予團(tuán)隊(duì)更多投后助力。未來,我們將不斷加強(qiáng)與在寧高校科研院所的合作聯(lián)動(dòng),切實(shí)落實(shí)南京市校地融合發(fā)展要求,支持更多如風(fēng)語智能一樣的青年創(chuàng)業(yè)企業(yè),大力促進(jìn)更多高校青年科研成果轉(zhuǎn)化落地。”
“經(jīng)過探索,我們已經(jīng)瞄準(zhǔn)賽道,逐步實(shí)現(xiàn)產(chǎn)品研發(fā)到落地的商業(yè)閉環(huán),”路思遠(yuǎn)介紹說。“選擇開源情報(bào)行業(yè)深挖大語言模型的應(yīng)用也是幾番思索的結(jié)果。大國博弈,情報(bào)是重要決策的基礎(chǔ),科技實(shí)力是最直接的競爭。缺乏高質(zhì)量、及時(shí)準(zhǔn)確的情報(bào)或許將讓企業(yè)乃至國家面臨極其被動(dòng)的局面。所以,我們也想在自己擅長的領(lǐng)域,為中華民族偉大復(fù)興貢獻(xiàn)一份力量,至少在開源情報(bào)這條賽道上,助力國家建立自己的核心競爭力!”路思遠(yuǎn)在談及對(duì)于深耕開源情報(bào)業(yè)的愿景時(shí),目光堅(jiān)定。
來源:創(chuàng)投集團(tuán)
審核:薛瑤
發(fā)布:尤異
相關(guān)附件