中文字幕亚洲一区二区三区-魅惑三区，中文字幕亚洲欧美在线尽情畅享！

作者(zhe)：中文字幕久久波多野结衣av電子發(fa)表(biao)時(shi)間：2023-11-25

以生成式(shi)模型(xing)（generative model）為代表的下(xia)一代(dai)AI正在席(xi)卷(juan)科技(ji)行業乃至(zhi)整(zheng)個(ge)人(ren)類社(she)會(hui)。目(mu)前，人們(men)對於(yu)生成式模型的關注(zhu)還主要在於以OpenAI和(he)穀(gu)歌(ge)為(wei)代表的(de)人工智(zhi)能(neng)巨頭(tou)運(yun)行(xing)在雲(yun)端(duan)服務器(qi)的模型，這些模型需要(yao)巨大(da)的算力，並且(qie)一般(ban)運行在GPU上。然而(er)，隨著技術(shu)的發展(zhan)，中文字幕亚洲欧美在线不卡認為生(sheng)成式模型運行在手機端已(yi)經到(dao)了(le)一個轉折(zhe)點.

（圖(tu)文部(bu)分來(lai)源微(wei)信(xin)公(gong)眾(zhong)號(hao)"半(ban)導(dao)體行業觀(guan)察(cha)"

像(xiang)這樣的人工智能對(dui)話(hua)應(ying)用並不需(xu)要真正(zheng)運行在手(shou)機終端——讓ChatGPT完(wan)成文稿(gao)設(she)計這樣(yang)的需求(qiu)的最(zui)佳(jia)使用(yong)場景(jing)還(hai)是(shi)在接入(ru)互(hu)聯網(wang)的電(dian)腦(nao)上(shang)，而不是運行在手機本地。某(mou)行業人士認(ren)為，最適(shi)合(he)生成(cheng)式模(mo)型運行在手機(ji)終端芯(xin)片(pian)上的第一是拍(pai)攝(she)增(zeng)強，包(bao)括超(chao)分(fen)辨、去模糊、照片補全等(deng)，這些(xie)應用需要模型能在任何(he)時候(hou)都能低延(yan)遲地運行，因此需要在本地執(zhi)行。另(ling)一個任(ren)務是智能助理，指(zhi)的是通過(guo)運行一個大模型去(qu)檢(jian)索(suo)所(suo)有(you)用戶本地的備(bei)忘(wang)錄(lu)、短(duan)信記(ji)錄等，通(tong)過綜(zong)合用戶所有的個人信息(xi)來實現智能助(zhu)理的功(gong)能——例如如果(guo)檢測(ce)到用戶和某個聯係人最近(jin)的短信是關於約(yue)在飯(fan)店(dian)吃(chi)飯，助理可以(yi)自動設置(zhi)一個提(ti)醒(xing)信息，等等。由於涉及(ji)到用戶(hu)隱(yin)私(si)，因此這類模型也需要運行在手機本(ben)地的芯片上。

對於用於拍攝增強(qiang)的生成式模型主(zhu)要是以擴散（）模型為代表的圖像生成式模型。擴(kuo)散(san)模型在去年一年中取得了長(zhang)足(zu)的進步(bu)，其生成內容(rong)的質(zhi)量(liang)足以改變(bian)用戶的拍攝體驗，包括(kuo)：

1、超分辨：使用擴散模型可(ke)以把(ba)低(di)分辨(bian)率的圖片以很高的質量轉(zhuan)換(huan)成高分辨率圖像，其(qi)質量遠高於目前(qian)已有的其他(ta)模型。

(對比圖來源(yuan)網絡(luo))

2、圖像修(xiu)補：包括把圖像中不想(xiang)要的內容去除更換（即inpainting），或(huo)者把圖片內容進一步補(bu)全（即outpainting）

對於基於擴散模型的生成式圖像模型，自(zi)從Stable Diffusion從去年(nian)下半年發布(bu)之後，已經獲(huo)得(de)了業界(jie)極(ji)大的關注。擴散模型一般的模型都(dou)較(jiao)大，而且需要運行多步的采(cai)樣過程(cheng)，之前雖(sui)然(ran)也(ye)有運行在手機上的例子(zi)，但(dan)是因為運行時間(jian)過程（10秒左右(you)），尚(shang)未(wei)得到真(zhen)正大規模應用。然而，隨(sui)著今(jin)年10月(yue)份(fen)中國清(qing)華(hua)團隊(dui)發表了latent consistency model（LCM）的研究論(lun)文，在手機上運行高(gao)性能圖像生成式模型已經不再(zai)遙不可及。

模型和Stable Diffusion的模型結構類(lei)似，但是LCM通過數學上的優(you)化(hua)，可以把一次生成需要的模型執行次(ci)數(shu)從Stable Diffusion的50次降低到2-4次，相(xiang)當於把端到端的運行速度(du)提升(sheng)了10倍，而且生成圖像的質量和Stable Diffusion接(jie)近。目前，LCM已經(jing)在人工智能社區(qu)得到了廣泛(fan)的關(guan)注和應用，中文字幕亚洲欧美在线不卡認為很快LCM就(jiu)會成為手機上運行圖像生成式模型的首選，而且LCM的低延遲可以真正實現全(quan)新(xin)的用戶體(ti)驗；例如(ru)，高質量的實(shi)時超分辨可以讓數字變焦(jiao)得到的拍攝質量和光(guang)學(xue)變焦相似(shi)，但是同(tong)時又(you)避(bi)免(mian)了厚(hou)重(zhong)的鏡(jing)頭；又如，inpainting/outpainting可以讓用戶快(kuai)速(su)編(bian)輯(ji)拍攝的照片並分享(xiang)，能實現(xian)在手機上擁(yong)有和photoshop相似的效果，這(zhe)也將(jiang)會大大提升用戶體驗。

對於智能助理(li)應用來說(shuo)，目前主要還處於探索階(jie)段(duan)，如何將多模態的信息（包括用戶的短信、備忘錄、日(ri)曆(li)等等）整合在一起(qi)並不容易(yi)，但是中文字幕亚洲欧美在线不卡認為最終模型的形(xing)態(tai)最有可能還是類似這樣的大語言模型，通過海(hai)量數據(ju)與訓(xun)練(lian)來實現對於用戶數據的深(shen)入理解(jie)並且給(gei)出相應幫(bang)助。這類智能助手的第一步落(luo)地應用可能是用戶消息編輯和改寫，例(li)如用戶可以讓智能助手去改(gai)寫(xie)一條短信以改變語(yu)氣，這樣的應用預(yu)計在明年就會落地。

手機生成式模型需要什麽(mo)樣的芯片

首(shou)先(xian)，中文字幕亚洲欧美在线不卡從用於拍攝增強的圖像生成式模型（）開(kai)始(shi)分析，因為這類模型的應用較為明(ming)確(que)。

中文字幕亚洲欧美在线不卡對於模型芯片支持的分析(xi)可以從(cong)算符、算(suan)力(li)和內(nei)存(cun)三方(fang)麵(mian)來入手。從算符(fu)來看(kan)，或者Stable Diffusion模型使用的算符主要是常(chang)用的卷積(ji)和注意(yi)力（attention）層(ceng)，這些算符在目前的手機芯片人工(gong)智能加(jia)速器中已經得到了非(fei)常好(hao)的支持(chi)。而在算力和內存方麵，圖像生成式模型的複(fu)雜(za)度和模型尺(chi)寸(cun)都比(bi)現有的運行在手機上的人工智能模型要大一到兩(liang)個數量級(ji)：LCM的參(can)數量達(da)到了10億以上，而相對而言目前主流(liu)手機人工智能模型的參數量都在千(qian)萬(wan)左(zuo)右。如中文字幕亚洲欧美在线不卡之(zhi)前所說的，手機需要能實時執行這樣的模型，因(yin)此需要在算力上滿(man)足模型的需求。

算力能滿足需求可以從兩方麵來考(kao)慮(lv)，首先是增加人工智能加速器的峰(feng)值(zhi)算力，主要的方法(fa)就是增加計算單元的數量。但是，計(ji)算單元(yuan)數量的增加是以更大的芯片麵積（即(ji)更高的成本）為代價的，為了能在成本和性能之間得到一個較好的折衷(zhong)，需要能使用“性價(jia)比”更好的計算單元。在服(fu)務(wu)器的LCM版(ban)本中，使用的計算是基於32位或者16位浮(fu)點(dian)數的，但是在手機端執行時32/16位浮點數計算單(dan)元太(tai)貴(gui)，因此(ci)絕(jue)大多數的計算必(bi)須(xu)使用更低精(jing)度，例如8位定點數，或者8位浮點數9甚至是4位浮點數）。這裏就涉(she)及到了一個軟硬件協同設計的問題(ti)，即如何在使(shi)用低精度計算的條(tiao)件(jian)下同時確保(bao)模型輸(shu)出質量不受(shou)太大影(ying)響，具(ju)體是使用8位浮點數還是8位定(ding)點數性價比更(geng)高等等，因此需要模型設計團隊和芯片設計團(tuan)隊合作(zuo)才(cai)能完成。另外(wai)，由於模型的尺寸遠(yuan)大於之前的主流模型到達了GB數量級，因此很(hen)可能需要手機的DRAM容量進(jin)行升級才能較好的支(zhi)持。

除(chu)了容量之外，模型參數量大也意味(wei)著(zhu)對於內存接口(kou)的壓力更大（否則(ze)可能會陷(xian)入內存牆(qiang)問(wen)題，讓(rang)內存訪(fang)問成為整體模型執行速度的瓶(ping)頸(jing)）。從這個角(jiao)度，一方麵可望(wang)將會推(tui)動(dong)手機芯片加速使用下一代內存接口（例如LPDDR6），而在另一方麵也推動SoC使用更多的片上內存（SRAM）來緩(huan)解DRAM訪問的壓力。最後(hou)，在Stable Diffusion和LCM模型中廣(guang)為使用的U-Net神(shen)經網絡結(jie)構(gou)也擁有更多的中間結果（activation），為了能確保最佳的延遲(chi)和能效(xiao)比，這也需要SoC片上有更多的SRAM來滿足需求。

對於大語言模型來說，其對於手機芯片的需求也可以從算符、算力和內存來看。同樣，算符方麵大語言模型使用的主要算符是，目前已經得到廣泛支持；主要挑(tiao)戰則是大語言(yan)模型的參數量甚(shen)至比擴散模型/LCM更大一個數量級，到了百億(yi)數量級，這對於手機內存容量和接口速度都將造成巨(ju)大的挑戰(zhan)，而如果大語言模型真的能在手機得到大規(gui)模應用，預計將會大大推動手機芯片內存容量和內存接口的發展。此外，由(you)於大語言模型的參數量太大，很有可能需要多級緩存，每(mei)次隻會有一部分模型參數加載(zai)在DRAM中，還會有一部分會留(liu)在非易失(shi)性存儲(chu)器中，因此內存和非易失性(xing)存儲器的接口速度提升可能也會得到推動。

生成式模型對手機芯片市場(chang)的潛在影響

目前，中文字幕亚洲欧美在线不卡看到手機係統廠(chang)商(shang)已經越(yue)來越重視(shi)生成式模型在手機端的應用。在最近的發布會上，知名(ming)手機廠商和Oppo都把這類生成式模型作為下一代新手機的主要賣(mai)點，原(yuan)因很簡(jian)單，因為目前生成式模型已經到了能夠真正成為核心(xin)用戶體驗(yan)的時刻(ke)了，而且模型技術也足夠(gou)成熟(shu)，爆發在即。

手機芯片格(ge)局(ju)也可能會在這次的生成式模型熱潮(chao)中發生微妙(miao)的改變。生成式模型的支持能力可能會成為和手機鏡頭一樣重要的核(he)心硬(ying)件賣點，但是生成式模型的最終(zhong)解決方案(an)其實是一個軟(ruan)硬件結合設計的方案，這樣來說，其實對於有自研芯片能力的手機廠商來說是非常有利(li)的，因為這些手機廠商可以通過同時掌(zhang)握(wo)模型和硬件的設計，從而實現最高效率(lv)的解決(jue)方案，或者換句(ju)話說有可能通過深度的協(xie)同優化，即使在芯片實現工藝(yi)和性能較為落後的情(qing)況(kuang)下，仍(reng)然實現很好的用戶體驗，這一點對於一些中國(guo)的手機廠商例如華為來說尤(you)其有利，因為他們同時擁有深度的人工智能模型開發、手機係統優化和芯片開發能力，通過在自研的第(di)一方應用（例如拍照(zhao)以及照片瀏覽(lan)）應用中加入自研的模型跑(pao)在自研(yan)的芯片上，有機會充分利用端到端優化的機會。

對於為手機係統(tong)提供(gong)芯片平(ping)台(tai)的公司(si)例如高通和聯(lian)發科(ke)來說，則需要提供完整的參考設計。在這方麵，高通已經把手機端生成式模型提到了核心位置，在最近發布的中，高通宣(xuan)布可以實現以低於一秒(miao)的延遲實現Stable Diffusion圖像生成，未來可望進一步提升質量並降(jiang)低延遲，接下來就看使用高通芯片的手機係(xi)統廠商如何利用這樣的算力了。聯發科也基(ji)於億級參數大語言模型的特(te)性，開發了混(hun)合精度 INT4 量化技術，結合公司特有的內存硬件壓(ya)縮(suo)技術NeuroPilot Compression，以更高效地(di)利用內存帶(dai)寬(kuan)，大幅(fu)減少(shao)AI大模型占用終端內存，為端側運行AI大語言模型突(tu)破(po)手機內存限製(zhi)，助力更大參數模型在端側(ce)落地。

另一個疑問是，雲端生成式模型芯片領(ling)域(yu)目前的統治(zhi)者會如何看待(dai)手機生成式模型的機會？Nvidia在移動端的嚐(chang)試(shi)自從十(shi)多年前的Tegra係列(lie)之後似乎就停(ting)滯(zhi)了，但是今年年中Nvidia傳(chuan)出(chu)和聯發科合作並(bing)且下一代聯發科旗(qi)艦(jian)手機SoC可能會使用Nvidia GPU的消息，可見(jian)Nvidia在手機生成式模型領域還是有機會能切(qie)入。Nvidia在這個領域的優勢(shi)主要在於模型開發生態，但是在手機生態（包括第一方應用）中是否(fou)繼(ji)續(xu)這樣的優勢，還需要聯合SoC廠商以及使用該(gai)SoC的手機係統廠商深度合作

中文字幕亚洲一区二区三区

新聞資訊