国产98在线 | 传媒麻豆,久久―日本道色综合久久,久久久精品久久久久久久久久久,国产成人精品免费久久久久,五月综合色婷婷影院在线观看,久久久亚洲精品视频

手機版

虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體

Meta新推Llama 3.2量化版，1B/3B模型功耗再降低！

時間：2024-10-27 15:15 來源：ITBEAR作者：陸辰風

meta公司近日宣布，繼9月推出Llama 3.2的1B與3B模型后，他們于10月24日發(fā)布了這兩個模型的量化版本。通過量化，模型大小平均縮減了56%，RAM使用量降低了41%，并且模型運行速度提升了2至4倍，功耗也有所下降，這使得模型更易于部署在移動設(shè)備上。

meta采用了兩種量化方法：量化感知訓(xùn)練（QAT）和后訓(xùn)練量化（SpinQuant）。前者注重模型的準確性，后者則強調(diào)模型的可移植性。

針對Llama 3.2的1B和3B模型，meta分別推出了兩款量化版本。這些量化模型相較于非量化的Llama BF16模型，速度更快，RAM占用更少，功耗更低，同時保持了與Llama BF16版本相近的精度。

盡管量化后的模型支持的Token上下文有所減少，但meta的測試顯示，量化版本的基準測試結(jié)果與原版相差無幾。

meta已在一加12、三星S24+/S22及蘋果iOS設(shè)備等移動平臺上測試了這些量化模型，并計劃未來通過神經(jīng)處理單元（NPU）進一步提升模型性能。

更多>同類內(nèi)容

國產(chǎn)手機電池容量飆升，7000mAh時代即將到來，為何越來越大？

11-24

短劇演員熱度榜揭曉：戴琪軒女榜居首，何健麒男榜奪冠

11-24

小米Redmi新機“2409BRN2CC”獲進網(wǎng)許可，詳細配置曝光！

11-24

華擎發(fā)布Mars RPL迷你主機，輕薄設(shè)計搭載12/13代英特爾處理器

11-24

SoundSlide實體音量鍵亮相：15美元為筆記本添“聲”彩

11-24

《超凡雙生》Steam國區(qū)特惠，僅需17元體驗好萊塢級冒險游戲！

11-23

微軟Edge Game Assist上線：游戲中也能輕松瀏覽，支持多款熱門游戲

11-23

鴻蒙生態(tài)沖刺10萬應(yīng)用目標，徐直軍：未來半年至一年是關(guān)鍵

11-23

華為Mate 60系列部分機型下市，Mate 70系列蓄勢待發(fā)！

11-23

抖音11月22日帶貨日榜揭曉：陳三廢姐弟奪冠，銷售額高達2830萬

11-23

漫步者花再Zero Clip耳夾耳機上市，藍牙5.4續(xù)航35小時僅售359元

11-23

于東來直言：企業(yè)家虧損源于能力不足，低價競爭是不道德行為

11-23

北漂青年35萬首付擁抱“超級老破小”，北京樓市松綁下的安家夢

11-23

短劇界新星閃耀！22日女演員戴琪軒、男演員柯淳熱度登頂

11-23

電池巨頭Northvolt陷困境，CEO彼得·卡爾松辭職并申請破產(chǎn)保護

11-22

點擊查看更多 +

推薦圖文

國產(chǎn)手機電池容量飆升，7000mAh時代即將到	短劇演員熱度榜揭曉：戴琪軒女榜居首，何健
小米Redmi新機“2409BRN2CC”獲進網(wǎng)許可，	華擎發(fā)布Mars RPL迷你主機，輕薄設(shè)計搭載12

推薦內(nèi)容

點擊排行

虎科技 - 領(lǐng)先的互聯(lián)網(wǎng)科技媒體 - 聚合優(yōu)質(zhì)的創(chuàng)新信息與人群,捕獲精選、深度、犀利的商業(yè)科技資訊，不錯過互聯(lián)網(wǎng)的每個重要時刻。
合作微信：netspread，添加時務(wù)必注明虎科技
Copyright ? 2010-2021 HUKEJI.COM - All rights reserved. 魯ICP備11015305號-21

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群