人工智能爆發(fā)式增長或導致算力缺口增大
近日,中國電信研究院胡緋緋、孫浩等發(fā)表文章指出,由于ChatGPT帶來的人工智能爆發(fā)式增長,擁有巨大參數(shù)量的超大規(guī)模人工智能模型,對智能算力的需求顯著提升,未來算力可能存在巨大的缺口。同時智能算力需求的高速增長,對未來數(shù)據(jù)中心、云計算等算力基礎設施也將產生巨大的影響。
目前人工智能對算力需求增長的速度要快于算力供給增長的速度。據(jù)OpenAI的分析,自2012年以來,最大規(guī)模的人工智能訓練中使用的計算量以3.4個月的倍增時間呈指數(shù)增長。未來人工智能將進一步推動算力需求爆炸式增長,據(jù)OpenAI推算,GTP-5的參數(shù)量將是GTP-3的100倍,需要的計算量則是GTP-3的200~400倍。
近期,全球頭部云廠商、數(shù)據(jù)中心提供商紛紛發(fā)布規(guī)劃及預算,加速數(shù)據(jù)中心布局。Meta預計2023年資本支出390億美元,主要投資服務器和網絡基礎設施。NTT于2023年宣布計劃在未來五年內向數(shù)據(jù)中心、人工智能和其他“增長領域”投資590億美元,其中至少110億美元將用于擴大或升級其數(shù)據(jù)中心。
數(shù)據(jù)中心的設計建設模式需適應人工智能產生的需求,下一代數(shù)據(jù)中心需要投資人工智能專用硬件,采用新的數(shù)據(jù)中心設計,主要體現(xiàn)在四個方面,第一,人工智能數(shù)據(jù)中心通過異構計算突破算力瓶頸,包括CPU、GPU以及專用硬件如ASICs和FPGAs在數(shù)據(jù)中心的綜合部署。第二,人工智能和機器學習可能需要三倍于傳統(tǒng)數(shù)據(jù)處理的功率密度,冷卻是人們廣泛關注的主題,液體冷卻和浸泡冷卻可能是發(fā)展趨勢。第三,高速的存儲訪問對于人工智能工作負載至關重要,數(shù)據(jù)中心需要擴展其存儲能力來滿足不斷增長的需求。第四,人工智能數(shù)據(jù)中心的效率與其網絡的性能直接相關,零丟包、低時延、高吞吐的智能無損網絡將成為人工智能數(shù)據(jù)中心的網絡解決方案。
近日,中國電信研究院胡緋緋、孫浩等發(fā)表文章指出,由于ChatGPT帶來的人工智能爆發(fā)式增長,擁有巨大參數(shù)量的超大規(guī)模人工智能模型,對智能算力的需求顯著提升,未來算力可能存在巨大的缺口。同時智能算力需求的高速增長,對未來數(shù)據(jù)中心、云計算等算力基礎設施也將產生巨大的影響。
目前人工智能對算力需求增長的速度要快于算力供給增長的速度。據(jù)OpenAI的分析,自2012年以來,最大規(guī)模的人工智能訓練中使用的計算量以3.4個月的倍增時間呈指數(shù)增長。未來人工智能將進一步推動算力需求爆炸式增長,據(jù)OpenAI推算,GTP-5的參數(shù)量將是GTP-3的100倍,需要的計算量則是GTP-3的200~400倍。
近期,全球頭部云廠商、數(shù)據(jù)中心提供商紛紛發(fā)布規(guī)劃及預算,加速數(shù)據(jù)中心布局。Meta預計2023年資本支出390億美元,主要投資服務器和網絡基礎設施。NTT于2023年宣布計劃在未來五年內向數(shù)據(jù)中心、人工智能和其他“增長領域”投資590億美元,其中至少110億美元將用于擴大或升級其數(shù)據(jù)中心。
數(shù)據(jù)中心的設計建設模式需適應人工智能產生的需求,下一代數(shù)據(jù)中心需要投資人工智能專用硬件,采用新的數(shù)據(jù)中心設計,主要體現(xiàn)在四個方面,第一,人工智能數(shù)據(jù)中心通過異構計算突破算力瓶頸,包括CPU、GPU以及專用硬件如ASICs和FPGAs在數(shù)據(jù)中心的綜合部署。第二,人工智能和機器學習可能需要三倍于傳統(tǒng)數(shù)據(jù)處理的功率密度,冷卻是人們廣泛關注的主題,液體冷卻和浸泡冷卻可能是發(fā)展趨勢。第三,高速的存儲訪問對于人工智能工作負載至關重要,數(shù)據(jù)中心需要擴展其存儲能力來滿足不斷增長的需求。第四,人工智能數(shù)據(jù)中心的效率與其網絡的性能直接相關,零丟包、低時延、高吞吐的智能無損網絡將成為人工智能數(shù)據(jù)中心的網絡解決方案。