人工智能爆發(fā)式增長或?qū)е滤懔θ笨谠龃?br />
近日,中國電信研究院胡緋緋、孫浩等發(fā)表文章指出,由于ChatGPT帶來的人工智能爆發(fā)式增長,擁有巨大參數(shù)量的超大規(guī)模人工智能模型,對智能算力的需求顯著提升,未來算力可能存在巨大的缺口。同時智能算力需求的高速增長,對未來數(shù)據(jù)中心、云計算等算力基礎(chǔ)設(shè)施也將產(chǎn)生巨大的影響。
目前人工智能對算力需求增長的速度要快于算力供給增長的速度。據(jù)OpenAI的分析,自2012年以來,最大規(guī)模的人工智能訓(xùn)練中使用的計算量以3.4個月的倍增時間呈指數(shù)增長。未來人工智能將進一步推動算力需求爆炸式增長,據(jù)OpenAI推算,GTP-5的參數(shù)量將是GTP-3的100倍,需要的計算量則是GTP-3的200~400倍。
近期,全球頭部云廠商、數(shù)據(jù)中心提供商紛紛發(fā)布規(guī)劃及預(yù)算,加速數(shù)據(jù)中心布局。Meta預(yù)計2023年資本支出390億美元,主要投資服務(wù)器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。NTT于2023年宣布計劃在未來五年內(nèi)向數(shù)據(jù)中心、人工智能和其他“增長領(lǐng)域”投資590億美元,其中至少110億美元將用于擴大或升級其數(shù)據(jù)中心。
數(shù)據(jù)中心的設(shè)計建設(shè)模式需適應(yīng)人工智能產(chǎn)生的需求,下一代數(shù)據(jù)中心需要投資人工智能專用硬件,采用新的數(shù)據(jù)中心設(shè)計,主要體現(xiàn)在四個方面,第一,人工智能數(shù)據(jù)中心通過異構(gòu)計算突破算力瓶頸,包括CPU、GPU以及專用硬件如ASICs和FPGAs在數(shù)據(jù)中心的綜合部署。第二,人工智能和機器學(xué)習(xí)可能需要三倍于傳統(tǒng)數(shù)據(jù)處理的功率密度,冷卻是人們廣泛關(guān)注的主題,液體冷卻和浸泡冷卻可能是發(fā)展趨勢。第三,高速的存儲訪問對于人工智能工作負(fù)載至關(guān)重要,數(shù)據(jù)中心需要擴展其存儲能力來滿足不斷增長的需求。第四,人工智能數(shù)據(jù)中心的效率與其網(wǎng)絡(luò)的性能直接相關(guān),零丟包、低時延、高吞吐的智能無損網(wǎng)絡(luò)將成為人工智能數(shù)據(jù)中心的網(wǎng)絡(luò)解決方案。
近日,中國電信研究院胡緋緋、孫浩等發(fā)表文章指出,由于ChatGPT帶來的人工智能爆發(fā)式增長,擁有巨大參數(shù)量的超大規(guī)模人工智能模型,對智能算力的需求顯著提升,未來算力可能存在巨大的缺口。同時智能算力需求的高速增長,對未來數(shù)據(jù)中心、云計算等算力基礎(chǔ)設(shè)施也將產(chǎn)生巨大的影響。
目前人工智能對算力需求增長的速度要快于算力供給增長的速度。據(jù)OpenAI的分析,自2012年以來,最大規(guī)模的人工智能訓(xùn)練中使用的計算量以3.4個月的倍增時間呈指數(shù)增長。未來人工智能將進一步推動算力需求爆炸式增長,據(jù)OpenAI推算,GTP-5的參數(shù)量將是GTP-3的100倍,需要的計算量則是GTP-3的200~400倍。
近期,全球頭部云廠商、數(shù)據(jù)中心提供商紛紛發(fā)布規(guī)劃及預(yù)算,加速數(shù)據(jù)中心布局。Meta預(yù)計2023年資本支出390億美元,主要投資服務(wù)器和網(wǎng)絡(luò)基礎(chǔ)設(shè)施。NTT于2023年宣布計劃在未來五年內(nèi)向數(shù)據(jù)中心、人工智能和其他“增長領(lǐng)域”投資590億美元,其中至少110億美元將用于擴大或升級其數(shù)據(jù)中心。
數(shù)據(jù)中心的設(shè)計建設(shè)模式需適應(yīng)人工智能產(chǎn)生的需求,下一代數(shù)據(jù)中心需要投資人工智能專用硬件,采用新的數(shù)據(jù)中心設(shè)計,主要體現(xiàn)在四個方面,第一,人工智能數(shù)據(jù)中心通過異構(gòu)計算突破算力瓶頸,包括CPU、GPU以及專用硬件如ASICs和FPGAs在數(shù)據(jù)中心的綜合部署。第二,人工智能和機器學(xué)習(xí)可能需要三倍于傳統(tǒng)數(shù)據(jù)處理的功率密度,冷卻是人們廣泛關(guān)注的主題,液體冷卻和浸泡冷卻可能是發(fā)展趨勢。第三,高速的存儲訪問對于人工智能工作負(fù)載至關(guān)重要,數(shù)據(jù)中心需要擴展其存儲能力來滿足不斷增長的需求。第四,人工智能數(shù)據(jù)中心的效率與其網(wǎng)絡(luò)的性能直接相關(guān),零丟包、低時延、高吞吐的智能無損網(wǎng)絡(luò)將成為人工智能數(shù)據(jù)中心的網(wǎng)絡(luò)解決方案。