近日,Meta公司發布了其最新研發成果——開源大模型Llama 3,共包含Llama 3 8B和Llama 3 70B兩種規格,參數量級分別為80億與700億,并表示這是目前同體量下性能最好的開源模型。相較于前代產品Llama 2,Llama 3在預訓練數據上擴大了整整7倍(達到15T tokens),并且在數據質量與訓練方式上也進行了深度優化,這無疑為開源大型語言模型(LLM)領域發展再次書寫了輝煌篇章。
為了方便廣大AI技術愛好者與從業者快速上手學習與使用大語言模型技術,天翼云基于開源的Meta-Llama-3-8B-Instruct模型以及text-generation-webui框架,搭建了一鍵部署、開箱即用的云主機鏡像。同時,天翼云CPU/GPU云主機近期即將上線Llama 3大模型學習機,期望能夠成為幫助用戶打開大模型領域之門的第一把鑰匙,讓更多用戶從此了解大模型、學習使用大模型,并利用大模型創造更多可能。
天翼云彈性云主機具備快捷易用、配置豐富、專有網絡、安全穩定、多種鏡像、高效管理和高性價比等優勢,能夠為用戶提供優質服務體驗。云主機支持動態調整計算資源,提供多種實例規格和存儲類型,滿足用戶多元化業務需求;擁有靈活自定義的網絡空間,以及多重安全防護,全面保障數據可靠性,助力業務批量快速部署。用戶可以通過多種管理方式和多維度監控實現高效管理,并可根據需要靈活選擇計費模式,享受專業運營團隊的7*24小時服務。此外,天翼云還提供多樣異構芯片和計算模型,為用戶提供更優算力選擇。
通過以下步驟,用戶即可基于天翼云主機快速搭建Llama 3的推理或微調環境:
(1)登錄天翼云主機控制臺 https://console.ctyun.cn/console/index/#/ecm/ecmList;
(2)創建云主機,使用指定的規格與Llama 3鏡像,具體可參考部署文檔 https://www.ctyun.cn/document/10026730/10495072;
(3)從瀏覽器登錄到學習機頁面,使用Llama 3模型。
天翼云Llama 3大模型學習機在一鍵部署的基礎上還提供以下各類功能,戳官網還有更詳細的幫助文檔和教學視頻哦!
(1)模型加載:支持加載主流基于transformers框架的模型,只需將模型下載并放置到指定目錄下,無需其他操作,鏡像內已預裝Llama 3模型;
(2)模型推理:支持使用大語言模型進行多輪對話與文本生成,且支持多人同時使用;
(3)推理參數修改:支持修改大語言模型在推理時控制結果走向的temperature,top_k,top_p等參數;
(4)模型微調:支持基于基礎大模型和私有數據,微調訓練自己的LoRA小模型,使用小模型進行推理。
訪問下方網址解鎖更多相關功能! https://www.ctyun.cn/document/10026730/10495063
通過天翼云大模型學習機即可實現Llama 3的絲滑應用
除了目前已發布的兩種規格,Meta公司宣布一個參數量超過400B的巨量Llama 3也在訓練中,并可能會在接下來的幾個月內發布。可以預期,Llama 3-400B將會繼續推動大語言模型發展邁上新臺階。
在通用人工智能領域蓬勃發展的今天,天翼云將持續堅持科技創新,為行業用戶提供可快速搭建大型模型推理或微調環境的解決方案,以及高性能的AI算力集群,助力AIGC產業實現降本增效,進而推動整個行業的繁榮發展。