AI霸主輝達(Nvidia)的AI人工智慧年度盛會「GTC 2024」,於美國聖荷西(San Jose)盛大開幕,由於這是5年來首度舉行實體活動,加上執行長黃仁勳及AI專家都將發表AI趨勢,引起全球關注。
《數位時代》記者邱品蓉也前進輝達GTC大會現場,為讀者帶來第一手觀察。
「我們需要更大的GPU。」黃仁勳站在GTC展台上,不斷重複這句話。手中握著的,是輝達最新的AI超級晶片「GB200」。
GB200能運轉數兆參數規模的語言模型,也意味著LLM(大型語言模型)進入「兆級參數」的時代。分析師指出,在歷經對手英特爾(Intel)和超微(AMD)的反擊後,輝達火力展示意味十足。
隨著大語言模型不斷進化,參數量勢必持續上升,產業分析師指出,於此同時HBM記憶體的數量勢必增加,GPU體積也會因此長大。
LLM進入「兆級參數」時代!輝達最新GB200有多強?
在黃仁勳的演講中,「GB200」無疑是全場焦點。「G」代表輝達的Grace系列CPU,為既有產品;「B」則是以次世代架構Blackwell打造而成的全新GPU「B200」,採台積電4奈米製程,內含2080億個電晶體,根據輝達公布的數據,效能為H100的2.5倍。
GB200則是將CPU和GPU組合在一起的超級晶片,含有一顆CPU和兩顆B200的GPU,可視為一個解決方案。為容納更多的參數量,GB200中還內含1.7TB的HBM3e容量。
輝達也針對GB200推出「DGX SuperPOD」,簡單來說就是數個內含八個GB200系統的機櫃相連。黃仁勳形容:「 這是我想像中GPU的樣子 。」他認為,未來的語言模型只會更大,推論時每個結果(token)的產生將耗費更多能源,GB200相較前代產品,在能源消耗和營運成本上,最多可降低25倍。
GB200今年量產,盤點15家台廠供應鏈
輝達預計將在今年稍晚開始供應GB200,包含Google、微軟(Microsoft)和亞馬遜(Amazon)等三大雲端巨頭皆為客戶,Meta、OpenAI和特斯拉(Tesla)也將採用。
多家台廠也因此受惠,據悉,GB200台灣供應鏈包含台積電、日月光、穎崴、奇鋐、雙鴻、緯穎、雲達、鴻海、和碩、華碩、英業達、廣達、技嘉、緯創和華擎。
先前多家媒體曾預期,輝達會在本屆GTC介紹同為GPU新品的B100。分析師認為,對輝達來說GB200是本次的旗艦級產品,「加上現在缺貨很嚴重,輝達賣一個解決方案,會比單賣B100一顆GPU來得更加划算。」相較B100,將重心放在GB200,更能秀出肌肉力量。
不要叫我半導體公司!輝達朝「AI平台」企業進化
不過輝達偏好被稱為「AI平台企業」而非「硬體公司」,這點從輝達針對Omniverse和數位孿生的大力行銷即可看出端倪。
黃仁勳多次以台灣產業作為案例。首先,他以伺服器大廠緯創為例,強調公司運用數位孿生產品打造工廠的成果亮眼,讓原先要5個月的工期縮短至2.5個月,「他們也將數位孿生用於新產線的打造。」
其次,黃仁勳提到台灣交通部中央氣象署,運用氣象模擬的數位孿生,預測颱風登陸的精確位置,以降低傷亡人數。現場可見大大的台灣地圖展示於螢幕之上。
輝達Omniverse和數位孿生,帶進Vision Pro!
值得一提的是,輝達也將Omniverse和數位孿生帶進蘋果(Apple)最新穿戴裝置Vision Pro。在GTC上,黃仁勳也展示未來車商能如何透過Vision Pro模擬並設計車輛。分析師認為:「輝達的數位孿生有地方可以落地;蘋果也可增加使用場景,達成雙贏。」
輝達GTC直擊:
AI人才將有專業認證了,鴻海劉揚偉將站台?兩大亮點一次看
責任編輯:林美欣