2023年,以ChatGPT為代表的生成式人工智能(AIGC)大火,標志著生成式AI元年的到來。生成式AI技術(shù)已經(jīng)在建筑、藝術(shù)、工程編程等行業(yè)中展現(xiàn)出顯著的應用潛能,這些技術(shù)通過深度學習和神經(jīng)網(wǎng)絡,學習并模仿人類的語言和視覺藝術(shù)模式。例如,ChatGPT能基于輸入的文本生成連貫且有創(chuàng)意的回答,而Stable Diffusion則能根據(jù)簡單的描述創(chuàng)造出精美的圖像和視頻。
據(jù)行業(yè)初步預估,生成式AI市場規(guī)模將達到1萬億美元,并驅(qū)動新一輪內(nèi)容生成、搜索和生產(chǎn)力相關(guān)用例的發(fā)展。例如,在傳媒和娛樂行業(yè),生成式AI正在重塑內(nèi)容的生產(chǎn)和消費方式;在教育領(lǐng)域,生成式AI提供了個性化學習材料和交互式學習體驗;在商業(yè)領(lǐng)域,生成式AI助力廣告創(chuàng)意、產(chǎn)品設(shè)計和市場分析;甚至在醫(yī)療健康領(lǐng)域,生成式AI也開始展現(xiàn)出在疾病診斷和治療計劃制定中的潛力。
隨著技術(shù)的發(fā)展,AIGC也在逐漸從云端向終端側(cè)轉(zhuǎn)移,并引起了移動終端芯片廠商的廣泛重視。包括高通在內(nèi)的各大移動芯片商都在積極推動AIGC在智能手機、PC、汽車、XR設(shè)備以及物聯(lián)網(wǎng)等多種終端品類的普及。
在智能手機領(lǐng)域,生成式AI的應用正在推動算力的實質(zhì)性增長,特別是在搜索方面。超過100億次的日搜索量中,移動端占據(jù)主導地位?;谏墒紸I的查詢能提供令人滿意的答案,引發(fā)用戶搜索方式的變化。隨著對話式搜索功能的不斷強化,智能手機正逐漸成為真正的數(shù)字助手。這些設(shè)備不僅能夠理解文字和語音,還能處理圖像和視頻等多種輸入模式,并提供準確、貼切的回答。
在PC領(lǐng)域,生成式AI應用正變革著生產(chǎn)力。例如,Microsoft Office 365通過集成生成式AI,使日常工作流程更加高效。Microsoft 365 Copilot利用大語言模型和用戶數(shù)據(jù),將提示轉(zhuǎn)化為生產(chǎn)力工具,支持大語言模型在Outlook、Word、PowerPoint、Excel和Teams中工作。Office用戶可以通過大語言模型進行文檔編寫、電子郵件撰寫、數(shù)據(jù)分析等任務,極大地提高了工作效率。
在汽車領(lǐng)域,AI正在提供高度個性化的體驗。車載數(shù)字助手支持駕駛員和乘客通過免提界面保持無縫互聯(lián),同時為汽車生態(tài)系統(tǒng)創(chuàng)造新的收入機會。這些助手不僅能訪問個人數(shù)據(jù),還能處理來自車輛傳感器的數(shù)據(jù),提供增強的導航體驗、自動化提醒和個性化娛樂內(nèi)容。在自動駕駛系統(tǒng)中,生成式AI還有助于模擬極端駕駛情況,改進駕駛策略和安全性。
在XR領(lǐng)域,生成式AI正開拓3D內(nèi)容創(chuàng)作和沉浸式體驗的新前景。下一代AI渲染工具能夠幫助內(nèi)容創(chuàng)作者基于文本、語音等提示生成3D物體和場景,創(chuàng)造完整的虛擬世界。同時,文本到文本的大語言模型能為虛擬化身生成自然對話,圖像生成模型則為虛擬化身創(chuàng)造外觀和服裝。未來,人們將能夠利用語音提示、圖像或視頻生成逼真、全動畫、智能、可量產(chǎn)的類人虛擬化身。
在物聯(lián)網(wǎng)領(lǐng)域,行業(yè)正在利用生成式AI改進決策質(zhì)量,優(yōu)化運營效率,并創(chuàng)造競爭優(yōu)勢。例如,在零售業(yè),生成式AI可以幫助提升客戶和員工體驗,通過簡單提示幫助商店經(jīng)理進行商品規(guī)劃、庫存管理和促銷活動預測;在能源和公共設(shè)施領(lǐng)域,生成式AI有助于創(chuàng)建極端負荷場景,預測電力需求和潛在電網(wǎng)故障,提供優(yōu)質(zhì)的客戶服務。
從云側(cè)到端側(cè),生成式AI正在進入終端和云端協(xié)同工作的混合AI時代,這也是當今AI領(lǐng)域的一個關(guān)鍵趨勢。
混合AI的核心優(yōu)勢在于其架構(gòu),它通過在云端和終端之間有效分配計算任務,解決了傳統(tǒng)云端集中處理模式的計算需求和成本挑戰(zhàn)。這種分布式處理機制不僅節(jié)省了成本,降低了能耗,還提高了可靠性、隱私保護、安全性和個性化體驗。例如,對于簡單的推理任務,如日常對話或基本查詢,終端側(cè)AI可以獨立處理;而對于復雜的數(shù)據(jù)分析或大規(guī)模模型訓練,則需要云端的強大計算能力。在混合AI架構(gòu)下,終端設(shè)備處理相對簡單的推理任務,而更復雜的任務則由云端處理。隨著終端AI處理能力的提升,更多的云端負載可以轉(zhuǎn)移到終端。
混合AI在適當?shù)膱鼍昂蜁r間下分配AI計算的工作負載,以提供更好的體驗,并高效利用資源,這其中5G承擔著連接云端算力和終端應用的關(guān)鍵橋梁。在5G的加持下,混合AI架構(gòu)使AI在云端、邊緣云和終端側(cè)協(xié)同運行,使整個系統(tǒng)中的計算和處理能力能夠以最有效的方式重新分布,實現(xiàn)更強大、更便利、更高效、更優(yōu)化的AI。
高通在其發(fā)布的《混合AI是AI的未來》白皮書中提到,混合AI將支持生成式AI開發(fā)者和提供商利用邊緣終端的計算能力降低成本。不僅如此,混合AI架構(gòu)或終端側(cè)AI還能夠在全球范圍帶來高性能、個性化、隱私和安全等優(yōu)勢。

混合AI的發(fā)展離不開終端側(cè)AI能力的提升。隨著AI處理逐漸向邊緣轉(zhuǎn)移,越來越多的AI推理工作在智能手機、筆記本電腦、XR頭顯等設(shè)備上進行。這些設(shè)備通過利用終端側(cè)AI支持多種日常功能,如暗光拍攝、降噪和人臉解鎖等,從而推動了混合AI和生成式AI的規(guī)?;瘮U展。終端側(cè)AI的持續(xù)演進,使更多性能強大的生成式AI模型能夠在終端上運行。
混合AI不僅標志著生成式AI用例的持續(xù)演進和主流化,更預示著未來AI技術(shù)的新方向。當然,混合AI也面臨不少技術(shù)挑戰(zhàn),包括提升生成內(nèi)容的準確性和質(zhì)量,處理和優(yōu)化龐大的模型等。不過,隨著終端側(cè)AI處理能力的提升,未來有望看到更多性能強大的生成式AI模型在終端設(shè)備上運行。這一進展將在成本、能耗、性能、隱私、安全和個性化等方面為用戶帶來優(yōu)勢。
作為全球邊緣側(cè)終端領(lǐng)域的領(lǐng)導者,高通正積極推動混合AI的發(fā)展。從市場規(guī)模來看,高通部署的驍龍和高通平臺終端數(shù)量已達數(shù)十億臺,每年還有數(shù)億新終端的加入。這樣的生態(tài)規(guī)模,能讓高通的AI創(chuàng)新技術(shù),規(guī)模化地應用于數(shù)億臺、甚至數(shù)十億臺終端上,這對于推動終端側(cè)AI的規(guī)模化發(fā)展是巨大優(yōu)勢。
在不久前舉辦的驍龍峰會上,高通總裁兼CEO安蒙強調(diào)了生成式AI帶來的巨大機遇。他指出,終端側(cè)生成式AI將重塑終端使用方式、創(chuàng)新方法、搜索和與終端的互動方式。預計到2024年,將出現(xiàn)上千個相關(guān)用例,而驍龍平臺在實現(xiàn)這一未來中將發(fā)揮核心作用。此外,高通在峰會期間還帶來了在終端側(cè)AI領(lǐng)域的最新進展,發(fā)布了兩款重磅產(chǎn)品——針對PC市場的驍龍X Elite平臺和針對移動市場的第三代驍龍8移動平臺。
據(jù)悉,驍龍X Elite平臺搭載了高通Oryon CPU,采用先進的4nm工藝技術(shù)和三叢集架構(gòu),包含12個高性能內(nèi)核,主頻高達3.8GHz,雙核可增強至4.3GHz,這為持續(xù)性計算和密集型工作負載提供了卓越性能;42MB的總緩存和136GB/s的內(nèi)存帶寬是多任務處理和高效能力的關(guān)鍵;平臺內(nèi)集成的Hexagon NPU實現(xiàn)了45TOPS的AI性能,微切片推理技術(shù)和張量加速器優(yōu)化使其高效處理AI工作負載,支持超過130億參數(shù)的生成式AI模型,為用戶提供快速準確的AI查詢結(jié)果和個性化體驗。
在連接方面,驍龍X Elite支持最新的5G和Wi-Fi 7系統(tǒng),確保用戶在移動狀態(tài)下保持高效連接。作為高通在Windows平臺上的旗艦產(chǎn)品,驍龍X Elite強調(diào)性能、移動性和電池續(xù)航能力,高效處理器和調(diào)度器能有效處理多線程任務,先進電源管理設(shè)計確保長時間電池續(xù)航,提供靈活持久的移動計算體驗。
高通高級副總裁兼計算與游戲業(yè)務總經(jīng)理Kedar Kondap強調(diào),驍龍X Elite不僅代表著計算技術(shù)創(chuàng)新的巨大飛躍,也為消費者帶來驚人的能效,提升創(chuàng)造力和生產(chǎn)力。其強大的終端側(cè)AI支持無縫多任務處理和直觀用戶體驗,推動消費者和企業(yè)的創(chuàng)作和發(fā)展。OEM廠商預計于2024年中推出搭載驍龍X Elite的PC,預計對消費級和商用市場產(chǎn)生深遠影響,標志著AI和移動計算領(lǐng)域的重大突破。
面向移動市場,高通則推出了首個專為生成式AI打造的移動平臺——第三代驍龍8。該平臺將高性能AI注入整個平臺系統(tǒng),為下一代旗艦智能手機帶來生成式AI。第三代驍龍8具有迄今為止高通在智能手機平臺中集成的最強大終端側(cè)智能,其搭載的高通AI引擎采用了增強架構(gòu)以提高能效,并面向生成式AI應用大幅提升Hexagon NPU性能,支持大語言模型、大視覺模型以及生成式AI應用。第三代驍龍8能夠支持在終端側(cè)運行高達100億參數(shù)的生成式AI模型,并以每秒生成20個token的速度運行大語言模型。
此外,第三代驍龍8也刷新了生成式AI的推理和運行速度。在今年2月底巴塞羅那召開的世界移動通信大會上,高通演示了如何在手機上實現(xiàn)10億參數(shù)的交互式AI,通過約15秒的時間完成20步的推理,把輸入的一段文字轉(zhuǎn)成想要的圖像。而現(xiàn)在,第三代驍龍8能在不到一秒的時間內(nèi),就能實現(xiàn)年初需要15秒才能實現(xiàn)的推理,展現(xiàn)了交互式AI在終端側(cè)實現(xiàn)的可能性和進步速度。
高通高級副總裁兼手機業(yè)務總經(jīng)理Chris Patrick表示,第三代驍龍8將開啟生成式AI新時代,支持用戶創(chuàng)作獨特內(nèi)容,幫助生產(chǎn)力提升,并實現(xiàn)其他突破性的用例。目前,搭載第三代驍龍8的全新小米14系列、iQOO 12系列智能手機已經(jīng)發(fā)布,第三代驍龍8還在陸續(xù)支持全球更多OEM廠商和智能手機品牌的終端,包括華碩、榮耀、魅族、蔚來、努比亞、一加、OPPO、真我realme、Redmi、紅魔、索尼、vivo和中興。
據(jù)安蒙介紹,在5G時代剛開始的時候,高通就已經(jīng)將5G和AI視為驅(qū)動下一代創(chuàng)新浪潮的“源動力”技術(shù);當看到5G和個人移動計算的發(fā)展時,高通預計5G+AI將會重新定義用戶體驗。實際上,高通在5G和AI領(lǐng)域已經(jīng)有多年的布局。

在高通超過15年的AI研發(fā)歷程中,其AI研究團隊在生成式AI領(lǐng)域進行了深入探索。憑借一系列基礎(chǔ)研究,以及跨AI應用、模型、硬件與軟件的全棧終端側(cè)AI優(yōu)化,高通始終處于終端側(cè)AI解決方案的最前沿。
在硬件方面,高通AI引擎是高通在終端側(cè)AI的核心優(yōu)勢,它在驍龍平臺和高通其他眾多產(chǎn)品中發(fā)揮了重要作用。高通AI引擎能夠以極低功耗提供業(yè)界領(lǐng)先的終端側(cè)AI性能,支持當前和未來的用例。此外,高通的硬件加速技術(shù)提供了異構(gòu)計算架構(gòu),包括Hexagon處理器、Adreno GPU和Kryo CPU,為終端側(cè)AI應用提供高效運行能力。
在軟件方面,高通AI軟件棧將高通所有相關(guān)的AI軟件產(chǎn)品集成在統(tǒng)一的解決方案中。OEM廠商和開發(fā)者可在高通的產(chǎn)品上創(chuàng)建、優(yōu)化和部署AI應用,充分利用高通AI引擎性能,讓AI開發(fā)者創(chuàng)建一次AI模型,即可跨不同產(chǎn)品部署。高通AI軟件棧全面支持主流AI框架,集成了推理軟件開發(fā)包和工具,并支持多種操作系統(tǒng)和基礎(chǔ)設(shè)施。
此外,高通的全棧AI研究和優(yōu)化集中于應用、神經(jīng)網(wǎng)絡模型、算法、軟件和硬件。其異構(gòu)計算方法結(jié)合了CPU、GPU和AI加速器以及軟件工具。在AI模型效率方面,高通致力于提高能效和性能,采用量化、壓縮、條件計算、神經(jīng)網(wǎng)絡架構(gòu)搜索和編譯等策略。特別是量化方面,高通的技術(shù)能將FP32模型壓縮到INT4,實現(xiàn)顯著的性能和能效提。
作為5G研發(fā)、商用與實現(xiàn)規(guī)?;闹匾苿恿α?,高通也在不斷推進移動技術(shù)的發(fā)展,并積極推動5G+AI布局。例如,高通將在5G和AI領(lǐng)域的技術(shù)積累,分享給汽車生態(tài)的合作伙伴,共同塑造智能網(wǎng)聯(lián)汽車用戶體驗。在過去兩年里,高通已經(jīng)與40多個中國汽車品牌合作推出超過100款新車型,這些車型里使用了高通的驍龍數(shù)字底盤,使汽車的數(shù)字化、智能化程度得到快速提升。
總結(jié)來看,高通的混合AI架構(gòu)結(jié)合了終端和云端處理能力,為大語言模型提供了高效解決方案,優(yōu)化資源利用和用戶體驗;而高通的AI軟件棧和硬件加速等技術(shù),如Hexagon處理器、Adreno GPU和Kryo CPU,則增強了終端側(cè)AI應用的運行效率,同時高通在AI模型效率上采用量化和壓縮策略,顯著提升性能和能效。
從最初的率先支持Stable Diffusion等大模型在終端側(cè)的使用,到發(fā)布AI白皮書公布混合AI愿景,從推動終端側(cè)AI快速應用至多類終端,到賦能生態(tài)廠商和開發(fā)者,高通正支持開發(fā)者、OEM廠商和其他生態(tài)系統(tǒng)創(chuàng)新者快速且經(jīng)濟高效地構(gòu)建全新生成式AI應用和解決方案,并通過數(shù)十億臺搭載驍龍平臺的終端,推動生成式AI的規(guī)?;瘮U展,持續(xù)引領(lǐng)PC、可穿戴設(shè)備、汽車等多類型終端邁向5G+AI新紀元。
編輯:芯智訊-浪客劍
18030183032