緊握根技術(shù)競速大模型

6月16日，在上海舉行的人工智能框架生態(tài)峰會上，上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動，首批22家單位正式入駐。資料照片

編者按

以大模型為代表的人工智能賽道上，根技術(shù)正在成為決勝的關(guān)鍵。作為當(dāng)前全球科技發(fā)展的重要專項(xiàng)，人工智能也是我國的重要戰(zhàn)略先導(dǎo)機(jī)遇。隨著大模型等技術(shù)的商業(yè)化應(yīng)用，人工智能已深度融入生產(chǎn)生活，全球各國都在孵化和孕育各類通用的行業(yè)大模型，要在這一賽道上實(shí)現(xiàn)領(lǐng)先，就必須以底層技術(shù)突破帶動上下游要素集聚，不斷提升核心競爭力。

AI框架：支撐人工智能產(chǎn)業(yè)創(chuàng)新

今年以來，大模型帶火通用人工智能（AI）賽道。作為人工智能領(lǐng)域的根技術(shù)，AI框架相當(dāng)于AI領(lǐng)域的操作系統(tǒng)。6月16日，以“一起昇思，無盡創(chuàng)新”為主題的人工智能框架生態(tài)峰會在上海舉行，業(yè)界圍繞大模型與科學(xué)智能領(lǐng)域AI框架技術(shù)展開深度交流，共同探討AI技術(shù)創(chuàng)新與行業(yè)融合大背景下的AI框架生態(tài)模式與場景應(yīng)用，力圖推動人工智能產(chǎn)業(yè)創(chuàng)新。

大模型展現(xiàn)產(chǎn)業(yè)應(yīng)用前景

“我是昇思開源社區(qū)的一名開發(fā)者，‘紫東太初’能否以中國國畫的形式現(xiàn)場生成一幅竹林圖片？”當(dāng)一位現(xiàn)場觀眾提出要求，幾秒鐘后大屏幕上就出現(xiàn)了一幅竹林水墨畫……峰會上，中科院自動化研究所發(fā)布的全模態(tài)大模型“紫東太初”2.0現(xiàn)場展示的圖像生成能力令人驚嘆。

除了支持圖像生成，“紫東太初”2.0還支持多輪問答、文本創(chuàng)作、3D理解、信號分析等跨模態(tài)任務(wù)，例如在三維場景里實(shí)現(xiàn)精準(zhǔn)定位、通過圖像與聲音的結(jié)合完成場景分析等。

中科院自動化研究所所長徐波介紹，“紫東太初”全模態(tài)大模型是在多模態(tài)大模型“紫東太初”1.0基礎(chǔ)上升級打造的2.0版本，在語音、圖像和文本三模態(tài)的基礎(chǔ)上，加入視頻、信號、3D點(diǎn)云等模態(tài)數(shù)據(jù)，突破了認(rèn)知增強(qiáng)的多模態(tài)關(guān)聯(lián)等關(guān)鍵技術(shù)，具備全模態(tài)理解能力、生成能力和關(guān)聯(lián)能力。

“紫東太初”2.0可以理解三維場景、信號等數(shù)字物聯(lián)時(shí)代的重要信息，完成了音樂、圖片和視頻等數(shù)據(jù)之間的跨模態(tài)對齊，能夠處理音樂視頻分析、三維導(dǎo)航等多模態(tài)關(guān)聯(lián)應(yīng)用需求，并可實(shí)現(xiàn)音樂、視頻等多模態(tài)內(nèi)容理解和生成。本屆峰會首次對外實(shí)時(shí)展示了該模型在音樂理解與生成、三維場景導(dǎo)航、信號理解、多模態(tài)對話等方面的全新功能。

“從1.0到2.0，‘紫東太初’大模型打通了感知、認(rèn)知乃至決策的交互屏障，使人工智能進(jìn)一步感知世界、認(rèn)知世界，從而延伸出更加強(qiáng)大的通用能力。”徐波說。

目前，“紫東太初”大模型在神經(jīng)外科手術(shù)導(dǎo)航、短視頻內(nèi)容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領(lǐng)域展現(xiàn)出一定的產(chǎn)業(yè)應(yīng)用前景。例如在醫(yī)療場景，“紫東太初”大模型部署于神經(jīng)外科機(jī)器人MicroNeuro，可實(shí)現(xiàn)在術(shù)中實(shí)時(shí)融合視覺、觸覺等多模態(tài)信息，協(xié)助醫(yī)生對手術(shù)場景進(jìn)行實(shí)時(shí)推理判斷。

據(jù)徐波介紹，基于“紫東太初”2.0的全棧國產(chǎn)化、低代碼一站式開發(fā)的“紫東太初”開放服務(wù)平臺已上線，支持公有云、私有云一鍵部署，使能行業(yè)大模型高效率開發(fā)。“未來3至5年，包括‘紫東太初’在內(nèi)的我國大模型技術(shù)，將在促進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展方面發(fā)揮重要作用，進(jìn)一步提升各行業(yè)的勞動生產(chǎn)率。”

AI框架支撐大模型“快跑”

“從算法到硬件、算力，‘紫東太初’都是‘中國造’。”中科院自動化研究所紫東太初大模型研究中心常務(wù)副主任王金橋介紹，大模型算法為中科院自動化研究所自研，以國產(chǎn)化人工智能硬件和框架作為基礎(chǔ)，算力則由武漢人工智能計(jì)算中心提供支持，“在國產(chǎn)軟硬件的支撐下，我們的大模型一樣能跑得很好、很快。”

支撐“紫東太初”的人工智能框架正是華為公司的昇思。據(jù)昇思開源社區(qū)理事長丁誠介紹：“人工智能框架是人工智能技術(shù)體系的核心中堅(jiān)，向下賦能多樣化算力，通過高效調(diào)度發(fā)揮系統(tǒng)最佳性能；向上孵化各類創(chuàng)新算法模型，給用戶提供便捷的操作接口。”

本屆峰會上，上海昇思人工智能框架和大模型創(chuàng)新中心正式啟動。該創(chuàng)新中心的定位是以華為公司的人工智能框架昇思為基礎(chǔ)，支持全國范圍的人工智能技術(shù)企業(yè)、高校與科研院所孵化大模型、研究科學(xué)智能技術(shù)，進(jìn)而在互聯(lián)網(wǎng)、金融、教育等關(guān)鍵產(chǎn)業(yè)方向上打造富有競爭力的人工智能應(yīng)用場景，推動產(chǎn)業(yè)集聚。上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)、中國商飛上海飛機(jī)設(shè)計(jì)研究院、中國科學(xué)院上海藥物研究所、云從科技等首批22家單位正式入駐創(chuàng)新中心。入駐單位將聯(lián)合昇思開源社區(qū)進(jìn)行大模型創(chuàng)新與人工智能產(chǎn)學(xué)研轉(zhuǎn)化，助力創(chuàng)新中心成為人工智能技術(shù)與應(yīng)用創(chuàng)新的“發(fā)源地”。

數(shù)據(jù)顯示，華為昇思自2020年3月28日開源以來，社區(qū)已累計(jì)1.3萬貢獻(xiàn)者、474萬下載量，服務(wù)企業(yè)數(shù)量5500家、開源模型400多個(gè)，與240家科研院所展開合作，發(fā)表頂級會議論文超過900篇。具體來看，昇思一方面依托大模型和科學(xué)智能創(chuàng)新成果，成立了遙感、流體、多模態(tài)三大產(chǎn)業(yè)聯(lián)合體，加速技術(shù)成果轉(zhuǎn)化；另一方面向端、邊、云全場景開放，適配國內(nèi)主流的人工智能芯片和硬件設(shè)備超過20款。

峰會上，丁誠介紹了昇思開源社區(qū)面向未來的四大創(chuàng)新方向，包括基于“構(gòu)建大模型全流程使能、科學(xué)計(jì)算新范式”的技術(shù)創(chuàng)新，以加速AI新應(yīng)用的孵化；基于“大模型平臺、Study Group、極客周、全球開源生態(tài)”的運(yùn)營創(chuàng)新，讓社區(qū)成果更高效地推廣到用戶；基于“面向?qū)W習(xí)、成長、研究的不同階段開發(fā)者提供不同培養(yǎng)模式”的人才創(chuàng)新，培育AI產(chǎn)業(yè)土壤；以及基于“建立產(chǎn)業(yè)聯(lián)合體、行業(yè)專區(qū)等新手段，持續(xù)完善多樣化算力和硬件支持”的生態(tài)創(chuàng)新。

“科學(xué)智能”成下一個(gè)“爆點(diǎn)”

“作為后發(fā)框架，要想技術(shù)超越或者領(lǐng)先，核心就是找到AI技術(shù)變革的下一條新賽道，只有當(dāng)新賽道出現(xiàn)的時(shí)候才有超車的機(jī)會。”丁誠表示。

相對于國際上較早開源的AI框架，昇思的確是后來者。早在三年之前，昇思就開始布局大模型技術(shù)，也獲得了一系列大模型原生生態(tài)創(chuàng)新成果。那么在下一個(gè)時(shí)代，新賽道是什么？答案很可能是“科學(xué)智能”。

“在每一個(gè)科學(xué)問題里可能都包含著一個(gè)基本的數(shù)學(xué)方程。例如在流體力學(xué)計(jì)算中會大量消耗算力，但其實(shí)數(shù)學(xué)原理很簡單，就是一個(gè)納維-斯托克斯方程的求解。如果用傳統(tǒng)方法計(jì)算可能需要幾十年、上百年算不完的問題，用AI的方式就有可能10倍或者100倍地加速求解。”丁誠解釋。

據(jù)業(yè)內(nèi)人士介紹，從最新的國際頂級期刊不難發(fā)現(xiàn)，從人工智能驅(qū)動的蛋白質(zhì)功能機(jī)理探索和理性設(shè)計(jì)，到基于人工智能的藥物發(fā)現(xiàn)和藥物優(yōu)化，從酶改造與生物基化學(xué)品的生成，再到科學(xué)育種與氣象預(yù)測——不論是微觀世界的多尺度探索，還是宏觀、微觀科學(xué)成果的應(yīng)用，人工智能求解高維函數(shù)、解決復(fù)雜問題的優(yōu)勢正在持續(xù)釋放。從生命體的基本組成到世界工業(yè)的基本要素，人工智能不僅是解決具體問題的有力工具，更成為重新定義科學(xué)問題的系統(tǒng)性思路。

本屆峰會上，中國科學(xué)院張東輝院士的主題演講《關(guān)于昇思MindSpore在計(jì)算化學(xué)中應(yīng)用的設(shè)想》介紹了與昇思團(tuán)隊(duì)合作研發(fā)高性能水團(tuán)簇分子勢能模型，借助AI之力揭示水的種種特性。

“在昇思發(fā)布的2.0版本當(dāng)中提出了科學(xué)計(jì)算融合架構(gòu)，目的就是在這個(gè)新賽道里獲得更多的技術(shù)領(lǐng)先機(jī)會，打造自己的原生生態(tài)。”丁誠表示。

大模型：加快創(chuàng)新策源賦能實(shí)體經(jīng)濟(jì)

科技部新一代人工智能發(fā)展研究中心等機(jī)構(gòu)發(fā)布的數(shù)據(jù)顯示，中國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。這一席卷科技界的AI革命，將如何改變世界？大模型又將如何一手促進(jìn)創(chuàng)新策源，一手服務(wù)實(shí)體經(jīng)濟(jì)？

大模型探索大應(yīng)用

在位于上海臨港新片區(qū)的商湯科技智算中心一樓展示大廳，可以和大模型“商量”，用中文“商量”一下。

記者在現(xiàn)場感受發(fā)現(xiàn)，作為千億級參數(shù)的自然語言處理模型“商量”，它不僅可以進(jìn)行多輪對話、人機(jī)共創(chuàng)童話故事，還可以自動生成簡單代碼、進(jìn)行“文生圖”等。例如，在輸入了20張“港風(fēng)”照片后，生成式AI就可以自動生成一張類似風(fēng)格的“氛圍感”圖片。

“無論是讓大模型寫出一首質(zhì)量過關(guān)的古詩，還是根據(jù)描述生成圖像，都要求其對中文語言的理解足夠深刻。這需要經(jīng)過多輪對話的訓(xùn)練，包括輔助語料的投喂，才能逐漸讓模型理解漢語的規(guī)律。”商湯科技首席科學(xué)家王曉剛說。

語言類大模型不是唯一形態(tài)，多種通用大模型正在持續(xù)拓展應(yīng)用場景�？萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心等機(jī)構(gòu)發(fā)布的《中國人工智能大模型地圖研究報(bào)告》顯示，中國研發(fā)的大模型數(shù)量排名全球第二，僅次于美國。

一方面大模型從辦公、生活、娛樂向醫(yī)療、教育、設(shè)計(jì)等行業(yè)加速滲透；另一方面，一些垂直專業(yè)類大模型不斷深化落地，生物制藥、遙感、氣象等大模型正在發(fā)揮縱深優(yōu)勢。

4月初，上海人工智能實(shí)驗(yàn)室聯(lián)合中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)、南京信息工程大學(xué)、中國科學(xué)院大氣物理研究所及上海中心氣象臺發(fā)布全球中期天氣預(yù)報(bào)大模型“風(fēng)烏”，30秒生成未來10天全球氣象高精度預(yù)報(bào)結(jié)果。

在氣象氣候預(yù)報(bào)任務(wù)中，全球中期天氣預(yù)報(bào)是重要預(yù)測任務(wù)之一，它以預(yù)測未來14天內(nèi)的大氣系統(tǒng)狀態(tài)為目標(biāo)。“風(fēng)烏”在預(yù)報(bào)精度上降低了誤差，在時(shí)效上突破了10天，而且僅需單GPU（圖形處理器）便可運(yùn)行。

上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家歐陽萬里說：“‘風(fēng)烏’取名自秦漢時(shí)期的‘相風(fēng)銅烏’，是世界上最早的測風(fēng)設(shè)備。天氣預(yù)報(bào)大模型‘風(fēng)烏’承載中國古人的智慧，也寓意實(shí)驗(yàn)室致力于在以氣象為代表的人工智能服務(wù)科學(xué)領(lǐng)域不懈探索。”

大算力搭建新“底座”

出臺支持舉措、整合創(chuàng)新資源、布局新興賽道……近段時(shí)間以來，各地都在為人工智能的創(chuàng)新策源“鋪路”。

5月30日，北京發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案（2023-2025年）》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》等方案；深圳發(fā)布關(guān)于加快推動人工智能高質(zhì)量發(fā)展高水平應(yīng)用行動方案；上海市經(jīng)信委表示，超大規(guī)模預(yù)訓(xùn)練模型是人工智能從專業(yè)智能走向通用智能的關(guān)鍵技術(shù)，未來將加快研究打造大模型生態(tài)集聚和創(chuàng)新應(yīng)用高地，推進(jìn)算力資源統(tǒng)一調(diào)度。

算力是研發(fā)大模型必不可少的基礎(chǔ)設(shè)施，已成為不少城市爭相布局的焦點(diǎn)。“近期生成式人工智能等應(yīng)用大爆發(fā)，推動了算力需求激增。很多企業(yè)在落戶前都會問，算力需求能否被滿足，這已是一種稀缺資源。”上海臨港新片區(qū)管委會高科處處長陸瑜說，這也是臨港發(fā)力構(gòu)建更為完善的算力產(chǎn)業(yè)生態(tài)、搭建公共平臺的初衷。

瞄準(zhǔn)產(chǎn)業(yè)痛點(diǎn)，智能算力更需要一體化調(diào)度、經(jīng)濟(jì)化使用。專家認(rèn)為，“東數(shù)西算”工程的全面實(shí)施，將一手促進(jìn)東部數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)鏈向西部延伸拓展，一手讓算力資源精準(zhǔn)配置和按需獲取，有效降低能源消耗。

“我們將在貴安新區(qū)共同合作建設(shè)新的產(chǎn)業(yè)園區(qū)，來打造滬黔科技創(chuàng)新成果的轉(zhuǎn)化中心。”貴陽市市長馬寧宇說，貴安正在規(guī)劃建設(shè)全國規(guī)模最大，存算能力一流的高安全、高可靠、高可用的數(shù)據(jù)中心集群，為大數(shù)據(jù)、大算力、大模型的技術(shù)發(fā)展和應(yīng)用提供廣闊空間。

“東西合作有更多想象空間。”優(yōu)刻得科技股份有限公司副總裁劉杰認(rèn)為，“東數(shù)西算”工程可以解決算力問題，在GPU運(yùn)算中，西部成本比東部便宜一半。業(yè)內(nèi)其實(shí)也在探索“東數(shù)西訓(xùn)”，把非實(shí)時(shí)計(jì)算的AI訓(xùn)練過程放在西部進(jìn)行，涉及需要實(shí)時(shí)運(yùn)算的推理過程則在東部直接完成，更好地調(diào)度算力、節(jié)約成本。

設(shè)規(guī)則促進(jìn)“好模型”

既為創(chuàng)新“加油”，也為發(fā)展“立規(guī)”。專家認(rèn)為，目前大模型總體人才不足，不少應(yīng)用領(lǐng)域還未有成熟開發(fā)，數(shù)據(jù)治理也有待提升，這既需要政府部門為創(chuàng)新的落地搭平臺、找場景，也需要為其安全探索設(shè)置好邊界。

今年4月，國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法（征求意見稿）》，對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出明確要求。從治理原則到倫理規(guī)范，近年來我國一直加強(qiáng)對人工智能行業(yè)“立規(guī)”。

“大模型推動人工智能實(shí)現(xiàn)一次歷史性跨越，中國經(jīng)濟(jì)社會高質(zhì)量發(fā)展為大模型創(chuàng)新提供豐富場景和數(shù)據(jù)基礎(chǔ)。”中國科學(xué)技術(shù)信息研究所所長、科技部新一代人工智能發(fā)展研究中心主任趙志耘認(rèn)為，未來需要在四個(gè)方面著力：加強(qiáng)資源和研發(fā)力量統(tǒng)籌，促進(jìn)產(chǎn)學(xué)研合作與開源開放；加強(qiáng)大模型技術(shù)研發(fā)，提升學(xué)術(shù)和開源影響力；強(qiáng)化大模型發(fā)展中的場景牽引作用，打造大模型標(biāo)桿項(xiàng)目；強(qiáng)化政策支持和配套服務(wù)，加快推動大模型應(yīng)用落地。

從更深層次看，助力大模型走深走透，還需要更高質(zhì)量的數(shù)據(jù)庫。“未來對數(shù)據(jù)的高質(zhì)量和多維度要求都會更高。”中國人工智能開源軟件發(fā)展聯(lián)盟副理事長王健宗說，比如以前標(biāo)注一張圖，只需要說這是“一個(gè)公園”；但現(xiàn)在標(biāo)注就需要詳細(xì)描述為“母親和小孩在公園里散步”，標(biāo)注難度和工作數(shù)量級呈指數(shù)上升。

“數(shù)據(jù)變成必要的生產(chǎn)要素后，怎么安全合理地使用，是政府必須考慮的問題。以后對數(shù)據(jù)的質(zhì)量要求、使用門檻都會越來越高，需要規(guī)則的提前制定。”趙志耘說。

大算力：為大模型搭建“高速路”

以ChatGPT為代表的人工智能技術(shù)發(fā)展，引發(fā)了全球算力需求的進(jìn)一步增長。迎接新一輪人工智能熱潮，中國的算力增長點(diǎn)在哪里？什么樣的算力更精準(zhǔn)高效？記者日前采訪業(yè)內(nèi)專家，前瞻算力發(fā)展趨勢。

在全球新一輪人工智能技術(shù)發(fā)展浪潮中，大模型是一個(gè)關(guān)鍵詞。ChatGPT等正是通過大模型來“學(xué)習(xí)”海量數(shù)據(jù)，并由此取得突破。

中國科學(xué)院院士陳潤生表示，人工智能大模型在應(yīng)用層面正在發(fā)生巨大變化，未來將在多個(gè)領(lǐng)域引發(fā)變革，同時(shí)也會消耗大量算力。

中國工程院院士鄭緯民說，做大模型必須要有“大算力”，ChatGPT正是基于大規(guī)模算力基礎(chǔ)設(shè)施的產(chǎn)物。

不久前舉行的中關(guān)村論壇上，科技部新一代人工智能發(fā)展研究中心發(fā)布了《中國人工智能大模型地圖研究報(bào)告》。報(bào)告顯示，我國研發(fā)的大模型數(shù)量排名全球第二。

中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心研究員陸忠華表示，全社會對算力的需求日益增長，人工智能應(yīng)用的算力需求更加突出，要迎接好這一趨勢。

近年來，我國人工智能算力的占比在升高。“根據(jù)估算，人工智能算力過去幾年大體上年均增長率為70%，其他算力大概增長30%左右。”中國信息通信研究院院長余曉暉說。

清華大學(xué)計(jì)算機(jī)系教授陳文光也觀察到，隨著人工智能的滲透程度加深，相比傳統(tǒng)超算中心，智算中心的利用率變得更高。

國家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任曹振南則表示，雖然算力常被分為超算和人工智能計(jì)算，但二者有許多相像之處，最大區(qū)別在于對計(jì)算精度的要求不同。

“目前人工智能算力的缺口較大，一些人工智能應(yīng)用為追求計(jì)算性能而降低了精度要求。但如果算力變得易得、便宜，一些人工智能應(yīng)用可能又會對精度提出一些高要求。”曹振南說。

專家認(rèn)為，“通用算力+專用算力”將成為人工智能算力基礎(chǔ)設(shè)施的建設(shè)關(guān)鍵。一方面要滿足廣泛的應(yīng)用場景，具備普適性，實(shí)現(xiàn)通用；另一方面也能支持部分對計(jì)算精度、效率要求高的個(gè)性化應(yīng)用場景，具備高效性，實(shí)現(xiàn)專用。

在專家看來，將已有的、不同體系架構(gòu)的算力中心通過網(wǎng)絡(luò)連接起來，可以合理配置、共享、調(diào)度、釋放更多算力，并降低應(yīng)用門檻。

在科技部高新技術(shù)司的牽頭下，國家超算互聯(lián)網(wǎng)工作已經(jīng)啟動。按照規(guī)劃，到2025年底，國家超算互聯(lián)網(wǎng)將成為支撐數(shù)字中國建設(shè)的“高速路”。

曹振南介紹，超算互聯(lián)網(wǎng)平臺的建設(shè)目標(biāo)之一，正是致力于解決算力設(shè)施分布不均衡的問題，實(shí)現(xiàn)算力資源的互聯(lián)互通、資源共享。

中國科學(xué)院院士錢德沛表示，算力基礎(chǔ)設(shè)施提供的應(yīng)當(dāng)不僅是算力，更要有用戶所需的軟件或應(yīng)用服務(wù)，這樣才能將算力資源最大化。

“希望超算算力未來能像電力一樣走進(jìn)千家萬戶，任何地方、任何時(shí)間都可以獲得大數(shù)據(jù)算力來支持相關(guān)應(yīng)用。”錢德沛說。（記者吳蔚周琳楊有宗潘德鑫董瑞豐）

亚洲中文字幕在线一区二区三区|精品在免费线中文字幕久久|成人精品一区二区三区电影免费|中文字幕av一区中文字幕

緊握根技術(shù)競速大模型