中國AI正掀起全球"算力平權"革命。
當中國AI初創公司DeepSeek以557.6萬美元的訓練成本,在數學推理、代碼生成等核心指標上追平硅谷巨頭耗資數億美元打造的模型時,這場由算法創新與開源生態共同驅動的技術革命,正在將科技巨頭壟斷的算力資源轉化爲普惠化基礎設施。
在這場由中國企業主導的變革中,本土生態的構建正在提速。儘管與國際先進水平仍存差距,但政策支持與市場倒逼的雙重驅動下,從國產硬件到端側應用的自主化鏈條逐步成型。同時,隨着推理側算力成本的降低,“算力平權”將有望加速端側AI和Agent應用的落地,同時落地應用也將帶來信創建設需求,相關板塊將迎來新的投資佈局機會。
在這一背景下,AI技術的普惠化和應用場景的拓展成爲行業關注的焦點。2025年2月23日,以“模塑全球 無限可能”爲主題的全球開發者先鋒大會(GDC)圓滿落幕。在這場匯聚全球開發者與創新者的大會上,星環科技(688031.SH)正式發佈"三位一體"的DeepSeek全場景解決方案,涵蓋省力版、高階版和端側版,全面覆蓋個人用戶、企業客戶及行業場景需求,爲用戶提供從個人到企業、從雲端到本地的全方位AI應用支持。
這種覆蓋個人用戶到企業級場景的全棧能力,正在爲這場算力平權運動提供關鍵基礎設施。
一、雲端協同新範式
在AI技術快速普及的當下,星環科技通過雲端協同與端側智能的結合,爲用戶提供了即開即用的高效體驗。針對輕量化需求場景,星環科技推出了網頁版及小程序服務,用戶無需下載或配置,即可直接調用DeepSeek 671B滿血版模型的AI搜索能力。這種“打開即AI”的模式,讓普通用戶能夠快速體驗大模型的語義理解、信息檢索等核心功能。
然而,純在線模式存在一些侷限性。首先,在線模式需要將用戶數據上傳至雲端處理,高度依賴網絡穩定性。弱網環境可能導致響應延遲或服務中斷,影響對實時性要求較高的場景,如實時翻譯和AR交互。其次,用戶原始數據(如照片、語音)需傳輸至雲端,存在被截獲或濫用的風險,尤其在金融、醫療等敏感領域難以滿足合規要求。此外,部分場景因政策或物理限制無法聯網,純在線模式無法提供服務。
爲解決這些問題,星環科技推出了“無涯問知 AI PC”版,並接入DeepSeek,實現大模型在個人電腦端的本地化流暢運行。通過分層知識蒸餾技術,星環科技將參數量高達6710億的原始大模型壓縮至輕量級版本。這一技術並非簡單縮小模型,而是通過保留核心能力,攻克了終端部署的三大瓶頸——存儲空間、算力消耗與推理延遲,使端側AI從“能用”進階爲“好用”。
星環科技的解決方案不僅讓端側AI“好用”,更在隱私與效能之間找到了完美的平衡。數據全程封閉處理,結合本地RAG(檢索增強生成)技術,用戶可以離線分析敏感文件。某律所的實測結果顯示,法律案例解析效率提升了50%,且數據零出網,充分保障了用戶隱私。同時,通過Intel Ultra處理器的專項優化,性能提升了30%,徹底打破了“AI必須依賴高端硬件”的固有認知,僅需8GB內存即可運行大模型。此外,星環科技還實現了雲端協同的“雙模智能”。這種動態調度能力,讓一臺普通筆記本電腦同時具備了安全性與高階智能,兼顧了實時體驗與功能深度。
星環科技的這一佈局,填補了國產AI本地化部署的空白,並爲金融、法律等數據敏感行業提供了安全可控的解決方案。
市場分析人士指出,端側AI的“iPhone 4時刻”已經到來。未來,隨着分佈式計算與Agent技術的深化,終端設備將逐步具備自主任務處理能力,推動AI從工具向智能化基石的質變,背後可能是萬億級的市場空間。
星環科技正與硬件廠商深度合作,未來將有更多預裝AI模型的終端設備面世。
2025年,星環科技與宏碁合作開發了宏碁專屬的AI助手——A星人專業版,並定製推出了全新的AIPC產品——宏碁優躍PRO。該產品預裝了無涯問知AI系統和單機版向量數據庫。此前,星環科技已與惠普合作,推出了預裝無涯問知AI系統的AI PC套裝,旨在爲個人電腦用戶提供本地化AI服務。目前,內置星環科技AI PC服務的AI PC電腦已在各大電商平臺上線,標誌着星環科技在端側AI領域的佈局已初見成效。
二、全棧技術與場景化服務融合
AI浪潮席捲全球,企業智能化轉型已成大勢所趨。在這場變革中,星環科技憑藉“全棧技術+國產化生態”的雙重壁壘,構建了企業級AI部署的核心競爭力。其戰略佈局圍繞全棧技術閉環與場景化服務能力兩大支點,成功打破傳統AI在企業級部署時的碎片化困局。
1. 技術壁壘:全鏈路能力構建護城河
星環科技的核心武器,是其自主研發的Sophon LLMOps平臺。與僅聚焦模型訓練或推理的競品不同,該平臺覆蓋了從語料處理、提示工程、模型訓練調優到應用落地的全生命週期管理。例如,在語料處理環節,平臺支持多模態數據從多源接入,通過轉換、過濾、去重及安全隱私處理,解決企業數據分散、質量參差的痛點。
國產化適配能力,則是另一道護城河。星環科技的解決方案支持國內外GPU/NPU的混合調度,爲企業提供了靈活的算力選擇。此外,平臺針對國產GPU(如寒武紀、海光、昇騰等)進行底層優化,充分發揮硬件性能,支持FP8等混合精度計算。這不僅提升了資源利用效率,還使得企業能夠在國產化硬件平臺上實現高性能計算。這一自主可控的算力底座,可以滿足了不同行業對數據安全與合規的要求。
憑藉這些技術優勢,Sophon LLMOps平臺實現了全棧能力覆蓋,支持開源、商業化及自研模型的統一管理。它已成功幫助客戶搭建大模型管理平臺,納管超過30種開閉源的生成式大模型及70餘個大模型服務。平臺提供基於671B參數規模大模型(R1版本)的訓練、推理及應用開發服務,支持FP8混合精度計算,顯著提升訓練效率並降低顯存佔用,實現了“滿血”性能釋放。這種從底層硬件到上層應用的全方位優化,不僅提升了技術的實用性,更爲企業級AI部署提供了高效、安全、可控的解決方案。
2、場景化服務能力:垂直場景的“外科手術式”適配
技術優勢向商業價值的轉化,則依託於場景化服務能力的精耕細作。
然而,下遊應用場景日益碎片化與縱深化,技術提供商需要對垂直場景進行深度解構,以實現技術與業務的深度融合。這意味着他們不僅要具備通用化的技術能力,更需要深入理解各行業的Know-How,從而爲客戶提供真正貼合業務需求的解決方案。
星環科技的Sophon LLMOps平臺正是基於這一理念而構建,以打造"技術解耦+知識融合"的雙輪驅動模式。
平臺內置高效的分佈式訓練框架、微調工具鏈及模型壓縮技術,能夠支持企業快速適配業務數據,顯著降低大模型的應用門檻。這種場景化開發支持能力,使得企業能夠在短時間內將AI技術落地到實際業務中,提升運營效率。
此外,Sophon LLMOps平臺還結合金融、政務、醫療等行業知識庫,打造領域專屬的大模型。這些模型針對特定行業的需求進行了優化,能夠在業務場景中提供更高的準確性和實用性。例如,在金融領域,專屬模型可以精準識別風險並輔助投資決策;在醫療領域,模型能夠支持輔助診斷,提高診斷效率和準確性。
展望未來,Sophon LLMOps平臺將繼續拓展其應用場景,面向研發、採購、生產、HSE、營銷、綜合辦公等多個領域提供集約化的平臺服務。通過這種一站式的服務模式,平臺將助力企業核心業務實現智能化轉型升級,爲企業帶來更高效、更智能的運營體驗。
在技術優勢與場景化服務能力的雙重加持下,企業智能化轉型似乎已步入快車道。然而,當AI技術真正觸及數據主權與成本效益的深水區時,一個更爲複雜的挑戰浮出水面——如何破解企業級AI部署中的"不可能三角"?
三、破解企業級AI部署中的“不可能三角”
在AI技術加速普及的浪潮中,企業級AI部署正面臨一場前所未有的挑戰。政府機構、央國企以及金融、醫療等數據敏感型行業,需要在保障數據主權安全的同時,實現AI應用的高效落地,並有效控制成本。這一難題被形象地稱爲企業級AI部署的“不可能三角”。
據第三方測試數據顯示,傳統雲端AI方案的平均響應延遲高達1.2秒,難以滿足實時風控、智能客服等對時效性要求極高的業務場景。與此同時,政府、央國企以及金融、醫療等行業涉及大量公民隱私、國家安全和商業機密數據。隨着《關鍵信息基礎設施安全保護條例》等法規的落地,私有化部署的合規性需求愈發凸顯。在此背景下,浙商證券預估,隨着DeepSeek等大模型帶動的快速部署需求增長,約80%的央國企大模型使用場景將轉向私有化部署。然而,自建算力中心的高昂顯性成本——動輒千萬級的投入,以及私有化部署的隱性成本——高築的技術門檻與時間投入,讓衆多中小機構乃至大機構望而卻步。因此,第三方服務商的支持成爲破局的關鍵。
46萬家央國企的存量需求正在引爆一個千億級市場,吸引衆多企業入局。星環科技就是其中的範例。
星環科技如何破解這一“不可能三角”?
星環科技通過其Sophon LLMOps平臺,爲企業提供了一站式的私有化部署解決方案。企業可以利用該平臺快速部署DeepSeek R1模型,實現具備深度思考能力的服務和應用開發。通過將知識庫和工具調用集成到企業內部,星環科技加速了基於大模型的企業級應用落地,滿足了數據安全與合規的嚴格要求。
此外,星環科技還提供全棧私有化交付服務,支持將R1大模型及其配套工具鏈部署到企業本地數據中心或專屬雲環境中。這種定製化服務可根據企業需求提供硬件選型指導、性能調優以及模型輕量化適配,確保在私有環境下實現高效運行。
以某頭部券商爲例:通過應用Sophon LLMOps建設自有大模型管理平臺,該券商成功納管了超過30種開閉源的生成式大模型及70餘個大模型服務。平臺的易用性和系統穩定性極高,恢復時間目標(RTO)不超過4小時,恢復點目標(RPO)不超過5分鐘。基於分佈式和容器化的部署架構,該平臺持續穩定地爲招商證券創意中心、研報助手、託管助手和金投客戶智能詢價等場景提供服務,並通過建設國產算力池,實現了國產NPU算力與GPU的統一管理。
據悉,該項目是國內較早完成國產化推理引擎、國產化GPU、國內外GPU混合部署統一管理、卡切分及多級多卡、大/小模型統一納管監控等前沿技術的案例。
星環科技在金融場景的深度突破,得益於其在金融、政企等場景的深厚的Know-How積累。
截至2024年6月,星環科技已擁有約1600家終端用戶,覆蓋金融、政府、能源、交通、製造等衆多國民經濟支柱領域;其中公司服務超過300家金融機構。2024年上半年,金融行業客戶收入佔公司主營業務收入的39.69%。
而金融領域是企業私有化部署的先行場景。截至2024年2月12日,已有近20家券商完成DeepSeek的本地化部署,多家券商正積極推進部署工作。國泰君安、國金證券、廣發證券等券商均已接入DeepSeek系列模型,加速企業智能化轉型。
隨着大模型技術的滲透率提升,其應用場景將更加廣泛。
券商接入DeepSeek大模型後,可應用於智能客服、智能系統運維、行業研究、風險管理、智能辦公和智能投顧等多個場景。同時,DeepSeek還能深入行業研究、投資分析和軟件開發等業務部門,助力業務部門實現智能化轉型。在銀行領域,本地化部署的DeepSeek大模型,可應用於智能合同管理、智能風控、資產託管與估值對賬、客服助手和智庫等多個場景。在保險行業,智能客服、銷售賦能、日程管理、產品培訓和智能覈保等多個AI應用場景將顯著提升了保險從業者的工作效率。
隨着大模型私有化部署需求的增加,星環科技憑藉其技術優勢和豐富的客戶資源,有望進一步擴大市場份額。
結語
星環科技的實踐只是冰山一角。
它生動地展示了AI技術如何跨越雲端與端側的界限,深入企業級應用與個人生活的每一個角落。在這場由算法創新與開源生態共同推動的技術革命中,越來越多的企業彷彿智能革命的神經元節點,正以前所未有的速度和規模生長,並推動AI的觸角延伸至社會的各個層面。
人與智能世界的互動模式正經歷着翻天覆地的變化,算力平權的理想正逐步從理想照進現實,開啓了一個全新的智能時代篇章。