<var id="fnfpo"><source id="fnfpo"></source></var>
<rp id="fnfpo"></rp>

<em id="fnfpo"><object id="fnfpo"><input id="fnfpo"></input></object></em>
<em id="fnfpo"><acronym id="fnfpo"></acronym></em>
  • <th id="fnfpo"><track id="fnfpo"></track></th>
  • <progress id="fnfpo"><track id="fnfpo"></track></progress>
  • <tbody id="fnfpo"><pre id="fnfpo"></pre></tbody>

  • 愛芯通元NPU完成Llama 3和Phi-3大模型適配,推動AI大模型技術應用普及

    發布時間:2024-4-29 18:27    發布者:eechina
    關鍵詞: Llama 3 , Phi-3 , NPU , AX650N
    愛芯元智宣布,近日,Meta、Microsoft相繼發布具有里程碑意義的Llama 3系列和Phi-3系列模型。為了進一步給開發者提供更多嘗鮮,愛芯元智的NPU工具鏈團隊迅速響應,已基于AX650N平臺完成 Llama 3 8B和Phi-3-mini模型適配。

    Llama 3

    上周五,Meta發布了Meta Llama 3系列語言模型(LLM),具體包括一個8B模型和一個70B模型在測試基準中,Llama 3模型的表現相當出色,在實用性和安全性評估中,與那些市面上流行的閉源模型不相上下。


    官方網址:https://llama.meta.com/llama3

    在架構層面,Llama 3選擇了標準的僅解碼(decoder-only)式Transformer架構,采用包含128K token詞匯表的分詞器。Llama 3使用了超過15T的公開數據進行訓練,其中5%為非英文數據,涵蓋30多種語言,訓練數據量是前代Llama 2的七倍。

    根據Meta的測試結果,Llama 3 8B模型在MMLU、GPQA、HumanEval等多項性能基準上均超過了Gemma 7B和Mistral 7B Instruct,70B模型則超越了名聲在外的閉源模型Claude 3的中間版本Sonnet,和谷歌的Gemini Pro 1.5相比三勝兩負。


    實際上板結果:目前AX650N已經完成了Llama 3 8B Int8版本的適配,若采用Int4量化,每秒token數還能再翻一倍,能滿足正常的人機交流。

    Phi-3

    Llama 3剛發布沒多久,競爭對手就來了,而且是可以在手機上運行的小體量模型。

    本周二,微軟發布了自研小尺寸模型Phi-3。盡管Phi-3-mini被優化至可部署在手機上,但它的性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。微軟表示,該創新主要在于用了質量更好的訓練數據集。


    在線DEMO:https://ai.azure.com/explore/mod ... /2/registry/azureml



    實際上板結果:目前AX650N已經完成了Phi-3-mini Int8版本的適配,已能滿足正常的人機交流。

    其他成果

    AX650N能第一時間完成Llama 3和Phi-3的適配,源于今年以來相關團隊悄悄完成了現有NPU工具鏈針對大語言模型的支持和調優。目前除了Llama 3之外,已經完成了Llama 2、TinyLlama、Phi-2、Qwen1.5、ChatGLM3等國內外主流的開源大語言模型適配。


    相關成果已釋放到開發者社區(https://github.com/AXERA-TECH/ax-llm)歡迎嘗鮮。

    后續計劃

    今年是AIPC的元年,愛芯元智將針對AIPC的常見應用提供更多的解決方案。充分發揮愛芯通元NPU高能效比的技術優勢,讓各種有趣的大模型實現高性價本地化部署,做到“人人都用得起大模型”,深入實踐“普惠AI,造就美好生活”。

    本文地址:http://www.portaltwn.com/thread-856258-1-1.html     【打印本頁】

    本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
    您需要登錄后才可以發表評論 登錄 | 立即注冊

    廠商推薦

    • Microchip視頻專區
    • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
    • Dev Tool Bits——使用條件軟件斷點宏來節省時間和空間
    • Dev Tool Bits——使用DVRT協議查看項目中的數據
    • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監視
    • 貿澤電子(Mouser)專區
    關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
    電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
    快速回復 返回頂部 返回列表
    精品一区二区三区自拍图片区_国产成人亚洲精品_亚洲Va欧美va国产综合888_久久亚洲国产精品五月天婷