近日,聯想百應智能體正式宣布引入國產AI大模型DeepSeek 。DeepSeek憑借技術上的高度創新備受關注,相比ChatGPT等模型,DeepSeek采用混合專家模型,可將任務拆分給多個專用子模塊處理,資源利用率更高,大幅降低了大模型訓練所需的算力要求。作為國內首個面向中小企業的IT服務智能體,聯想百應智能體與DeepSeek實現深度融合,能為萬千企業的智能化轉型和發展提供助力。

聯想百應智能體是基于智能IT引擎“擎天3.0”所打造的一站式服務平臺。這次與DeepSeek在技術上實現深度融合,將有效幫助聯想百應智能體豐富技術“武器庫”,多模態交互、可視化思維鏈、多方案博弈、多智能體協作、全鏈路安全五大技術能力都將得到進一步增強。
在算力調度方面,DeepSeek 的漸進式分層知識蒸餾技術獨具優勢,它能夠把大型模型蘊含的知識,精準遷移到更為輕量化的模型之中。這樣一來,在保證模型性能不受影響的前提下,還能顯著降低對計算資源的消耗。當這項技術與擎天 3.0 的混合架構調度能力相結合,就能最終實現 “端 - 邊 - 云 - 網 - 智” 的高效協同運作。這對于企業而言意義重大,企業可以在邊緣設備上輕松部署輕量化模型,減少對云端算力的依賴,從而進一步降低運維成本。
在模型架構層面,百應服務大模型的 MoE 架構由多個專門的 “專家模型” 構成。這些專家模型各自針對特定任務進行了優化,比如 IT 問題診斷、AI 辦公等場景,這種設計能有效減輕計算負載。而 DeepSeek 同樣具備全球領先的模型架構,其 DeepSeek R1 模型就采用了 MoE(稀疏混合專家模型)架構。引入 DeepSeek 后,能為百應服務大模型 MoE 的動態調度提供更有力的支持。具體來說,它可以依據輸入特征,智能選擇最為匹配的專家模型,進而提升處理效率與輸出質量,充分滿足企業級場景對于資源高利用率的嚴格要求。

和封閉源代碼的國際大模型不同,DeepSeek R1 有著開源、性能卓越、成本低廉這三大突出長處。DeepSeek 依據 MIT 許可協議,毫無保留地開放其多模態、多規格的模型,這種開源舉措極大地推動了相關技術在各個領域的擴散。在這樣的技術生態環境里,企業可以按照自身的實際需求,從眾多選項中挑選出適配的模型與智能體。不僅如此,企業還能夠依托自身業務所積累的數據,進行定制化的模型訓練與推理操作,塑造出更符合自身業務特性的專屬崗位智能體。
DeepSeek只是新一輪大模型熱潮的起點,相信聯想百應智能體將持續深化探索強化學習、多模態融合等前沿技術,進一步提升模型定制化能力。