引言
人工智能(AI)已成為全球科技創(chuàng)新的核心驅(qū)動力之一。開源軟件(Open Source Software, OSS)以其開放協(xié)作、快速迭代的特性,在AI技術(shù)的發(fā)展中扮演著不可或缺的角色。在中國,隨著政策支持、資本投入和技術(shù)社區(qū)的壯大,人工智能開源軟件(AIOSS)生態(tài),尤其是基礎(chǔ)軟件層面,正迎來蓬勃發(fā)展的關(guān)鍵時期。本白皮書旨在梳理中國AIOSS,特別是人工智能基礎(chǔ)軟件的發(fā)展現(xiàn)狀、核心挑戰(zhàn)與未來趨勢。
一、 人工智能基礎(chǔ)軟件的核心地位
人工智能基礎(chǔ)軟件是構(gòu)建整個AI技術(shù)棧的基石,主要包括深度學(xué)習(xí)框架、編譯器、運行時環(huán)境、算子庫、模型部署工具以及大規(guī)模分布式訓(xùn)練平臺等。它們向上支撐各類AI模型與應(yīng)用的高效開發(fā)與部署,向下屏蔽底層硬件(如CPU、GPU、NPU)的復(fù)雜性。
- 深度學(xué)習(xí)框架:如百度的PaddlePaddle(飛槳)、華為的MindSpore、一流科技的OneFlow等,已成為中國AI開源生態(tài)的標(biāo)志性成果。它們提供了模型構(gòu)建、訓(xùn)練和推理的全流程工具鏈。
- 編譯器與運行時:針對AI計算圖的優(yōu)化編譯器(如PaddlePaddle的Paddle Lite、阿里的MNN)和高效運行時,是實現(xiàn)模型跨平臺、高性能部署的關(guān)鍵。
- 算子庫與高性能計算:針對特定硬件優(yōu)化的基礎(chǔ)算子庫(如華為的CANN),是釋放AI芯片算力的核心軟件層。
- 開發(fā)與部署工具鏈:涵蓋模型壓縮、自動化機器學(xué)習(xí)(AutoML)、可視化調(diào)試、服務(wù)化部署等環(huán)節(jié)的工具集,提升開發(fā)效率與模型落地能力。
二、 中國AI基礎(chǔ)軟件開源發(fā)展現(xiàn)狀
- 政策與生態(tài)支持:國家層面將人工智能和開源軟件列為戰(zhàn)略重點。《“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》等政策明確支持開源生態(tài)建設(shè)。地方政府、高校和研究機構(gòu)積極參與,形成了產(chǎn)學(xué)研聯(lián)動的良好氛圍。
- 企業(yè)主導(dǎo),社區(qū)共建:中國AI基礎(chǔ)軟件開源主要由頭部科技企業(yè)(如百度、華為、阿里巴巴、騰訊、商湯等)發(fā)起和主導(dǎo)。這些企業(yè)將自身在業(yè)務(wù)中錘煉的技術(shù)開源,并積極建設(shè)開發(fā)者社區(qū),吸引全球貢獻者參與。例如,飛槳PaddlePaddle已匯聚數(shù)百萬開發(fā)者。
- 技術(shù)特色與創(chuàng)新:中國AI框架在易用性、產(chǎn)業(yè)落地(如與國產(chǎn)硬件深度適配)、特定場景(如大模型訓(xùn)練)等方面形成了差異化優(yōu)勢。部分框架在動態(tài)圖/靜態(tài)圖統(tǒng)一、分布式訓(xùn)練效率、端側(cè)部署輕量化等領(lǐng)域?qū)崿F(xiàn)了技術(shù)突破。
- 應(yīng)用驅(qū)動,賦能千行百業(yè):中國豐富的應(yīng)用場景(如智慧城市、智能制造、金融科技、互聯(lián)網(wǎng)服務(wù)等)為AI基礎(chǔ)軟件的迭代與優(yōu)化提供了海量數(shù)據(jù)和現(xiàn)實需求,推動了軟件快速成熟。
三、 面臨的主要挑戰(zhàn)
盡管發(fā)展迅速,中國AI基礎(chǔ)軟件開源仍面臨諸多挑戰(zhàn):
- 全球生態(tài)影響力待提升:與國際主流框架(如TensorFlow、PyTorch)相比,中國框架的全球開發(fā)者基數(shù)、第三方庫/模型生態(tài)豐富度、學(xué)術(shù)研究采用率仍有差距,建立全球性的技術(shù)標(biāo)準(zhǔn)與事實規(guī)范任重道遠(yuǎn)。
- 底層核心技術(shù)依賴:在編譯器、編程語言、高性能數(shù)學(xué)庫等更底層的基礎(chǔ)軟件領(lǐng)域,以及對國際開源項目(如LLVM、CUDA)的深度依賴,仍是潛在的“卡脖子”風(fēng)險點。自主可控的硬軟件協(xié)同技術(shù)棧構(gòu)建尚需時日。
- 開源治理與可持續(xù)性:如何建立更加開放、中立、透明的開源治理模式,平衡企業(yè)戰(zhàn)略與社區(qū)利益,保障項目的長期健康發(fā)展,是需要持續(xù)探索的課題。商業(yè)化路徑與開源模式的結(jié)合也需更多創(chuàng)新。
- 人才結(jié)構(gòu)性短缺:既精通AI算法又深諳系統(tǒng)軟件(編譯、分布式、高性能計算)的頂尖復(fù)合型人才嚴(yán)重匱乏,制約了底層技術(shù)的深度創(chuàng)新。
四、 未來發(fā)展趨勢與建議
- 深耕底層,強化自主創(chuàng)新:加大對編譯器、編程模型、異構(gòu)計算中間件等“根技術(shù)”的研發(fā)投入,構(gòu)建從硬件指令集到上層應(yīng)用的完整、自主、高效的軟件棧,降低對單一技術(shù)路徑的依賴。
- 擁抱大模型與科學(xué)智能新范式:基礎(chǔ)軟件需適應(yīng)超大模型訓(xùn)練與推理、AI for Science等新范式,在超大尺度分布式訓(xùn)練、內(nèi)存優(yōu)化、稀疏計算、新型算子等方面持續(xù)演進。
- 構(gòu)建開放共贏的全球化生態(tài):鼓勵中國開源項目更深度地融入全球開源體系,積極參與國際標(biāo)準(zhǔn)制定。以更加開放的心態(tài)運營社區(qū),吸引全球開發(fā)者,共同解決共性技術(shù)難題。
- 深化產(chǎn)學(xué)研用協(xié)同:加強高校在系統(tǒng)軟件領(lǐng)域的教育與科研,設(shè)立聯(lián)合實驗室,培養(yǎng)跨學(xué)科人才。推動基礎(chǔ)軟件在關(guān)鍵行業(yè)(如工業(yè)、生物醫(yī)藥)的深度應(yīng)用與反饋迭代。
- 完善開源治理與知識產(chǎn)權(quán)體系:探索符合中國國情與國際慣例的開源基金會治理模式,明晰知識產(chǎn)權(quán)與貢獻者協(xié)議,保護貢獻者權(quán)益,促進健康、可持續(xù)的社區(qū)發(fā)展。
###
人工智能基礎(chǔ)軟件的開源發(fā)展,是中國能否在AI時代掌握技術(shù)主動權(quán)的關(guān)鍵一環(huán)。當(dāng)前,我們已建立起初具規(guī)模且富有活力的本土生態(tài)。面向唯有堅持長期主義,在核心技術(shù)上攻堅克難,在開放合作中匯聚智慧,才能推動中國AI開源基礎(chǔ)軟件從“可用”走向“好用”乃至“領(lǐng)先”,為全球人工智能技術(shù)進步貢獻中國智慧與中國方案。