政府工作報(bào)告首次提及“支持大模型廣泛應(yīng)用”,推動(dòng)AI落地還要靠什么?
2023年、2024年連續(xù)兩年將“人工智能+”列為發(fā)展新興產(chǎn)業(yè)與數(shù)字經(jīng)濟(jì)的重點(diǎn)行動(dòng)后,今年兩會(huì)的政府工作報(bào)告進(jìn)一步把“支持大模型廣泛應(yīng)用”納入“人工智能+”的行動(dòng)規(guī)劃中。
國(guó)務(wù)院政府工作報(bào)告中提到,要因地制宜發(fā)展新質(zhì)生產(chǎn)力,建設(shè)現(xiàn)代化產(chǎn)業(yè)體系。而在將科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新的融合過(guò)程中,一方面實(shí)現(xiàn)高新科技、數(shù)字經(jīng)濟(jì)等新動(dòng)能積累,另一方面推動(dòng)制造業(yè)、服務(wù)業(yè)等傳統(tǒng)經(jīng)濟(jì)動(dòng)能的升級(jí)。
而人工智能一直被看作國(guó)家發(fā)展數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)的核心技術(shù),也是新質(zhì)生產(chǎn)力的代表。政府工作報(bào)告提及“支持大模型廣泛應(yīng)用”,要推動(dòng)大模型在各個(gè)行業(yè)的廣泛應(yīng)用,促進(jìn)數(shù)字技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合。
今年開(kāi)年,來(lái)自杭州的人工智能公司DeepSeek引發(fā)全球科技圈震動(dòng),使得“AI”與“大模型”成為了兩會(huì)熱詞。十四屆全國(guó)人大三次會(huì)議大會(huì)發(fā)言人婁勤儉稱(chēng),DeepSeek代表著一批中國(guó)公司在人工智能領(lǐng)域的崛起。同時(shí),又因?yàn)镈eepSeek堅(jiān)持開(kāi)源的技術(shù)路線,開(kāi)源共享推動(dòng)了人工智能技術(shù)在全球的普遍應(yīng)用,為世界貢獻(xiàn)了“中國(guó)智慧”。
多個(gè)行業(yè)的政協(xié)委員也在提案與接受媒體采訪時(shí),分享了AI大模型聊天機(jī)器人產(chǎn)品應(yīng)用在影視劇本寫(xiě)作、醫(yī)療問(wèn)診、金融咨詢(xún)等行業(yè)領(lǐng)域的使用體驗(yàn)。
此外,將硬件與大模型技術(shù)結(jié)合、開(kāi)發(fā)新型智能設(shè)備也是行業(yè)看好推動(dòng)AI落地應(yīng)用的一個(gè)方向。政府工作報(bào)告也強(qiáng)調(diào),“人工智能+”行動(dòng)要大力推動(dòng)智能終端和裝備發(fā)展,發(fā)展智能網(wǎng)聯(lián)新能源汽車(chē)、人工智能手機(jī)和電腦、智能機(jī)器人等新一代智能終端,以及應(yīng)用在工廠產(chǎn)線上的智能制造裝備。
但大模型相關(guān)的生成式人工智能作為一項(xiàng)新技術(shù),2023年前后才真正引發(fā)全球范圍關(guān)注,目前要落地普及仍然需要一些條件作基礎(chǔ)。
全國(guó)政協(xié)委員、中科院計(jì)算所研究員張?jiān)迫衲晏峤坏氖且环蓐P(guān)有關(guān)高端智算中心建設(shè)的提案。算力是支持AI大模型的底層基礎(chǔ)設(shè)施,以提供智能算力為主的數(shù)據(jù)中心也是全球科技公司、各國(guó)政府投入AI基建的重點(diǎn)項(xiàng)目。
張?jiān)迫邮芙缑嫘侣劜稍L表示,雖然2024年國(guó)務(wù)院工作報(bào)告提出“適度超前”建設(shè)算力基礎(chǔ)設(shè)施,去年一年國(guó)內(nèi)算力中心市場(chǎng)也在快速擴(kuò)容,但目前算力建設(shè)仍然存在供需結(jié)構(gòu)性失衡、高端智算供給嚴(yán)重不足等問(wèn)題。
以近期馬斯克創(chuàng)辦的AI公司xAI發(fā)布Grok3大模型舉例,xAI為支持模型開(kāi)發(fā)建成了十萬(wàn)張H100組成的超大規(guī)模模型訓(xùn)練集群,總算力達(dá)到200Eflops(flops為衡量算力規(guī)模的基本單位,此處以業(yè)界通用的BF16 浮點(diǎn)數(shù)統(tǒng)計(jì)),而我國(guó)目前公開(kāi)報(bào)道的最大單體智算中心僅為萬(wàn)卡,最大算力規(guī)模只有6.6Eflops,與國(guó)際領(lǐng)先水平相差兩個(gè)數(shù)量級(jí)。此外,國(guó)內(nèi)的智算中心絕大多數(shù)單個(gè)規(guī)模僅在100-1000Pflops之間,而高端智算中心的性能要求需要達(dá)到10Eflops(1Eflops為1000 Pflops)。
并且國(guó)內(nèi)智算中心的算力利用率也相對(duì)低下。據(jù)其調(diào)研,能夠支撐大模型訓(xùn)練的高端算力中心極為稀少且訓(xùn)練效率不超過(guò)30%。
基礎(chǔ)設(shè)施的代際差異直接制約大模型迭代的創(chuàng)新速度。張?jiān)迫J(rèn)為,DeepSeek今年出現(xiàn)通過(guò)算法創(chuàng)新和工程優(yōu)化,實(shí)現(xiàn)了以低算力成本達(dá)到世界先進(jìn)水平的性能,展示了算法技術(shù)創(chuàng)新重要性。但無(wú)法忽視的現(xiàn)實(shí)是,國(guó)內(nèi)高端算力基礎(chǔ)設(shè)施的短缺仍是短板。
來(lái)自人工智能產(chǎn)業(yè)界的企業(yè)家代表也在提案中強(qiáng)調(diào)算力建設(shè)的重要性。科大訊飛董事長(zhǎng)劉慶峰在提案中寫(xiě)到,目前多數(shù)全民可下載的大模型均基于英偉達(dá)卡訓(xùn)練,國(guó)產(chǎn)算力芯片廠商的產(chǎn)品普遍存在生態(tài)薄弱、適配困難等問(wèn)題。而受限于美國(guó)針對(duì)高端算力芯片的出口禁令,國(guó)內(nèi)要加快構(gòu)建國(guó)產(chǎn)算力平臺(tái)上的大模型及產(chǎn)業(yè)生態(tài)。
對(duì)于新的一年算力市場(chǎng)的建設(shè)方向,政府工作報(bào)告中明確提到,要優(yōu)化全國(guó)算力資源布局。
張?jiān)迫J(rèn)為,在算力市場(chǎng)在保持高速擴(kuò)張的背景下,迫切需要優(yōu)化資源分配,確保AI基建的效率。他建議,國(guó)內(nèi)一方面要推動(dòng)建設(shè)更多國(guó)家級(jí)大算力集群,引入先進(jìn)算力調(diào)度和管理技術(shù),提高利用率。另一方面,又把中小算力中心算力融入到大計(jì)算“資源池”。在AI公司模型訓(xùn)練任務(wù)的分配上投入上下功夫,使不同算力資源能夠滿足不同階段的需求,產(chǎn)生更大經(jīng)濟(jì)價(jià)值。
有了算力作基礎(chǔ),大模型要探索更廣泛的應(yīng)用,可以嘗試在金融、醫(yī)療、教育、政務(wù)等互聯(lián)網(wǎng)科技領(lǐng)域之外的非AI行業(yè)尋找落地機(jī)會(huì)。
張?jiān)迫嬖V界面新聞?dòng)浾?,大模型行業(yè)此前一直存在滲透率低、與產(chǎn)業(yè)應(yīng)用脫節(jié)的現(xiàn)象。產(chǎn)業(yè)界過(guò)于注重模型訓(xùn)練和參數(shù)規(guī)模,而忽視了與行業(yè)應(yīng)用場(chǎng)景的需求相結(jié)合。
今年要推廣大模型的應(yīng)用,政府和產(chǎn)業(yè)界需要加強(qiáng)合作。在產(chǎn)業(yè)層面,可在許多行業(yè)場(chǎng)景有更多嘗試,放寬應(yīng)用準(zhǔn)入,特別是無(wú)人駕駛、生物醫(yī)藥、材料設(shè)計(jì)、高端制造等AI典型領(lǐng)域,開(kāi)展行業(yè)試點(diǎn)與示范推廣,打開(kāi)應(yīng)用市場(chǎng);政府層面則可以繼續(xù)出臺(tái)政策支持營(yíng)造寬松環(huán)境,央國(guó)企也可嘗試開(kāi)放更多應(yīng)用場(chǎng)景,加大資金投入和效益考核等制度供給。