中國福建網(wǎng)

當前位置:中國福建網(wǎng) > 國內(nèi) > 正文

寒武紀通用型智能芯片產(chǎn)品完整支持商用大模型部署

作者: 編輯 來源:互聯(lián)網(wǎng) 發(fā)布時間:2023-08-31

┊文章閱讀:

數(shù)字經(jīng)濟時代,算力是核心生產(chǎn)力,算法是重要生產(chǎn)工具,數(shù)據(jù)是關鍵生產(chǎn)資料。算力決定了數(shù)據(jù)處理能力的強弱。算力芯片是算力的具體載體。而AIGC大模型是在智能算力驅(qū)動下最為典型的重大創(chuàng)新。

AIGC全稱為 AI-Generated Content人工智能生成內(nèi)容,指基于生成對抗網(wǎng)絡 GAN、大型 預訓練模型等人工智能技術,通過已有數(shù)據(jù)尋找規(guī)律,并通過適當?shù)姆夯芰ι上嚓P內(nèi)容的技術。AIGC 能夠以優(yōu)于人類的制造能力和知識水平承擔信息挖掘、素材調(diào)用、復刻編輯等基礎性機械勞動,從而大幅降低內(nèi)容生成的邊際成本,目前已經(jīng)在文字、語音、代碼、圖像、視頻、機器人動作等多模態(tài)場景上有了范例。它被認為是繼 PGC、UGC 之后的新型內(nèi)容創(chuàng)作方式,2022 年 AIGC 發(fā)展迅猛。

AIGC 的技術底座是“大型語言模型Large Language Models,簡稱為“大模型””。隨著大模型的迭代,所需的參數(shù)呈指數(shù)級增長。各模態(tài)智能數(shù)據(jù)的訓練到推理均需要算力的加持,隨著模型逐漸復雜化,所對應的算力需求也水漲船高,智能芯片市場有望迎來增量需求的支撐。

提及智能芯片,國內(nèi)不少企業(yè)正在崛起,寒武紀便是其中之一。

自成立以來,寒武紀一直專注于人工智能芯片產(chǎn)品的研發(fā)與技術創(chuàng)新,致力于打造人工智能領域的核心處理器芯片,讓機器更好地理解和服務人類。寒武紀的主營業(yè)務是應用于各類云服務器、邊緣計算設備、終端設備中人工智能核心芯片的研發(fā)、設計和銷售,以及為客戶提供豐富的芯片產(chǎn)品。目前,寒武紀的主要產(chǎn)品線包括云端產(chǎn)品線、邊緣產(chǎn)品線、IP 授權及軟件。

縱觀過去幾年,寒武紀快速實現(xiàn)了技術的產(chǎn)業(yè)化輸出,先后推出了用于終端場景的寒武紀 1A、寒武紀 1H、寒武紀 1M 系列智能處理器;基于思元 100、思元 270、思元 290 芯片和思元 370 的云端智能加速卡系列產(chǎn)品;基于思元 220 芯片的邊緣智能加速卡。其中,寒武紀智能處理器 IP 產(chǎn)品已集成于超過 1 億臺智能手機及其他智能終端設備中,思元系列產(chǎn)品也已應用于浪潮、 聯(lián)想等多家服務器廠商的產(chǎn)品中。此外,思元 270 芯片、思元 290 芯片還分別獲得第六屆世界互聯(lián)網(wǎng)大會、世界人工智能大會頒布的獎項。思元 220 自發(fā)布以來,累計銷量突破百萬片。

2022年寒武紀持續(xù)加大產(chǎn)品研發(fā)力度。硬件方面,寒武紀基于思元 370 云端智能芯片,推出了新款智能加速卡 MLU370-X8/M8、訓練整機玄思 1001 智能加速器MLU-X1001。

MLU370-X8/M8兩款加速卡均支持寒武紀 MLU-Link 芯片間互聯(lián),可滿足多樣化人工智能模型的訓練和推理需求。而寒武紀玄思 1001 智能加速器,在 2U 機箱內(nèi)集成 4 張 MLU370-M8 智能加速卡,MLU-Link 互聯(lián)接口,實現(xiàn)智能算力在數(shù)據(jù)中心縱向擴展;可廣泛支持 FP16、FP32 等不同數(shù)據(jù)精度的智能算力,提供大容量內(nèi)存,支撐智能模型的分布式訓練需求,是智能算力的高集成度平臺,已在生物信息、醫(yī)療影像、語言模型等行業(yè)及科研場景廣泛應用。

據(jù)寒武紀2022年度報告顯示,在互聯(lián)網(wǎng)行業(yè),寒武紀的思元 370 芯片及加速卡與數(shù)家頭部互聯(lián)網(wǎng)企業(yè)在視覺、語音、圖文識別、自然語言處理等場景下完成適配工作后,已經(jīng)進入了批量銷售環(huán)節(jié)。此外,寒武紀與某互聯(lián)網(wǎng)企業(yè)進行了大模型訓練的初步合作,目前仍處于技術探索和測試階段。

2022年寒武紀也在持續(xù)推進通用性訓練軟件棧的研發(fā)和改進工作。功能上,支撐了寒武紀新的硬件平臺以及 FP19 數(shù)據(jù)精度,支撐了新的 PyTorch 版本,算子覆蓋度達到 80,TensorFlow 的算子數(shù)量及交付網(wǎng)絡模型均有所增加。性能上,PyTorch 框架層通過 IO 類算子融合等優(yōu)化方式,顯著提升了帶寬密集類模型的性能;TensorFlow 通過支持 XLA,對 Bert 模型實現(xiàn)了近兩倍的性能提升。在大語言模型領域,提升了單機多卡、多機多卡的混合分布式訓練效率,完整支持了商用大模型部署,達到業(yè)界領先水平。

值得注意的是,寒武紀所研發(fā)的通用型智能芯片產(chǎn)品,具備靈活的指令集和精巧的處理器架構(gòu),技術壁壘高但應用面廣,可覆蓋人工智能領域高度多樣化的應用場景如視覺、語音、自然語言理解、傳統(tǒng)機器學習、生成式人工智能等。與 CPU、GPU 等芯片相比,通用型智能芯片能夠更好地匹配和支持人工智能算法中的關鍵運算操作,在性能和功耗上存在顯著優(yōu)勢。

  • 軟文發(fā)布平臺
  • 帆布水池
  • 運維開發(fā)網(wǎng)
  • IT新聞
  • 淘寶erp
  • 植物提取物網(wǎng)
  • 站長網(wǎng)
  • 青島月子會所
  • 辦公家具
  • 呱呱贊小程序
  • 盈江新財網(wǎng)
  • 工程拍照軟件
  • 包裝新聞
  • 甘州文化網(wǎng)
  • 客服寶
  • andon系統(tǒng)
  • 系統(tǒng)
  • 奢侈品回收
  • 中國市場經(jīng)濟網(wǎng)
  • 黑客視野新聞