盤古大模型是華為公司推出的壹款基於自然語言處理(NLP)的超大規模預訓練模型。
盤古NLP大模型可用於內容生成、內容理解等方面,並首次使用Encoder-Decoder架構,兼顧NLP大模型的理解能力和生成能力,保證了模型在不同系統中的嵌入靈活性,在下遊應用中,僅需少量樣本和可學習參數即可完成千億規模大模型的快速微調和下遊適配。
2019年權威的中文語言理解評測基準CLUE榜單中,盤古NLP大模型在總排行榜及分類、閱讀理解單項均排名第壹,刷新三項榜單世界歷史紀錄;總排行榜得分83.046,多項子任務得分業界領先,是目前最接近人類理解水平(85.61)的預訓練模型。
盤古大模型的發展歷史
2020年11月,盤古大模型在華為雲內部立項成功,也完成了與合作夥伴、高校的合作搭,2021年4月,盤古大模型正式對外發布。
2023年3月消息,華為雲官網顯示盤古系列AI大模型中的NLP大模型、CV大模型、科學計算大模型已經標記為即將上線狀態,7月7日,華為開發者大會2023上,華為常務董事、華為雲CEO張平安宣布,華為雲盤古大模型3.0正式發布。
盤古大模型3.0是完全面向行業的大模型,包含L0基礎大模型、L1行業大模型及L2場景模型三層架構,重點面向政務、金融、制造、醫藥、礦山、鐵路、氣象等行業。
以上內容參考:百度百科——盤古大模型