自ChatGPT引發(fā)新一波人工智能熱潮以來,全球人工智能產(chǎn)業(yè)一度形成了“堆算力”的路徑依賴。然而,隨著中國人工智能企業(yè)DeepSeek發(fā)布開源模型,通過優(yōu)化算法降低算力需求,達到與ChatGPT比肩的性能。這也提出了新問題:推動人工智能產(chǎn)業(yè)發(fā)展,是否依舊有必要大規(guī)模投資算力?
市政協(xié)委員、華東師范大學計算機科學與技術(shù)學院副院長賀樑認為,這次DeepSeek開源模型的問世對于我國在人工智能領域突破西方的科技封鎖意義重大,但這并不代表算力不再重要。訓練新的進階模型和將模型用于全行業(yè),擁有更強的算力基礎設施依舊是成功的關鍵要素之一。算力依舊是重要戰(zhàn)略資源,在很長一段時間里需求仍將持續(xù)增長,而美國將用各種手段“卡算力”,以影響我們的人工智能科研進度。
“DeepSeek開源模型的出現(xiàn),標志著通過算力來限制中國人工智能發(fā)展的策略并不成功。在有限算力的‘非公平競爭’下,中國不再抄作業(yè),中國的年輕人提出了我們自己的原創(chuàng)技術(shù),成果震動全球并向全球開源?!辟R樑說,“但算力還是非常重要的戰(zhàn)略資源,我們需更堅定地加以儲備,支撐優(yōu)秀的團隊開展研究,更優(yōu)的算力儲備意味著研發(fā)下一代模型的時間成本優(yōu)勢,為此國產(chǎn)算力芯片自主制造和生態(tài)能力必須爭分奪秒地迎頭趕上?!?/p>
相關論文表明,DeepSeek-V3的訓練總成本約為557.6萬美元。其訓練成本雖較同類產(chǎn)品大幅降低,但母公司為了這次訓練所付出的前期試錯成本,外界則不得而知。有報道稱,DeepSeek母公司幻方量化曾囤積上萬張GPU芯片。沒有這些算力的儲備,DeepSeek的這次突破是不太可能的。
同時,訓練大模型所需算力下降,不意味著社會總的算力需求下降。一個好用的模型帶來的是千行萬業(yè)的大規(guī)模應用,在不遠的將來,使用大模型將嵌入生活的方方面面,模型后訓練和推理需求會大幅超過預訓練算力需求。
賀樑還認為,算力基礎設施的投入回報要用長遠的、發(fā)展的眼光。“政府需要科學評估著眼未來的硬件情況和市場需求,更多考慮如何為有創(chuàng)造力的科研團隊提供算力保障,降低創(chuàng)新成本,提高創(chuàng)新速度,即使不賺錢、折舊快,依然要堅定地加速建設智能算力功能性公共服務設施?!?/p>
Copyright ? 2001-2025 湖北荊楚網(wǎng)絡科技股份有限公司 All Rights Reserved
營業(yè)執(zhí)照 - 增值電信業(yè)務許可證 - 互聯(lián)網(wǎng)出版機構(gòu) - 網(wǎng)絡視聽節(jié)目許可證 - 廣播電視節(jié)目許可證
關于我們 - 版權(quán)聲明 - 合作咨詢
版權(quán)為 荊楚網(wǎng) m.texasrealestateconsultants.com 所有 未經(jīng)同意不得復制或鏡像