創(chuàng)澤機器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 人工智能應(yīng)用 > 基于大模型的云平臺智能運維系統(tǒng)-支撐云平臺多個應(yīng)用方向的智能運維管理

基于大模型的云平臺智能運維系統(tǒng)-支撐云平臺多個應(yīng)用方向的智能運維管理

來源:--     編輯:創(chuàng)澤   時間:2024/7/11   主題:其他 [加盟]

系統(tǒng)基于大模型的開發(fā)訓(xùn)練方法,完成大模型開發(fā)訓(xùn)練環(huán)境的搭建,并特別針對企業(yè)典型的云平臺運維需求,結(jié)合領(lǐng)域業(yè)務(wù)數(shù)據(jù)完成運維大模型的調(diào)試工作,實現(xiàn)了大模型在云平臺運維領(lǐng)域的應(yīng)用。

1、技術(shù)路徑:基于大模型的云平臺智能運維系統(tǒng)以淵亭大模型開發(fā)訓(xùn)練平臺、大模型數(shù)據(jù)治理平臺為基礎(chǔ),消納用戶已有的運維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),結(jié)合淵亭科技的智能模型開發(fā)和調(diào)優(yōu)經(jīng)驗,支撐云平臺多個應(yīng)用方向的智能運維管理。

2.技術(shù)架構(gòu):基于大模型的云平臺智能運維系統(tǒng)從下至上,分為基礎(chǔ)設(shè)施層、資源支撐層、能力供給層、能力生成層和應(yīng)用服務(wù)層。

基于大模型的云平臺智能運維系統(tǒng)典型應(yīng)用場景有運維數(shù)據(jù)管理、異常告警管理、故障分析、故障預(yù)測等。

云平臺運維工作是一項繁瑣、高要求的工作,除了常規(guī)的日常運維服務(wù)之外,在當(dāng)前海量數(shù)據(jù)場景下,自動發(fā)現(xiàn)故障和自動異常檢測的需求甚為迫切,如何能極大地簡化研發(fā)策略配置成本,提高告警的準(zhǔn)確率,減少告警風(fēng)暴和誤告,從而提高運維效率是運維工作面臨的重大挑戰(zhàn)之一。另外,如何解決當(dāng)前海量數(shù)據(jù)場景下人工配置和運營告警策略、告警風(fēng)暴和準(zhǔn)確率不高等問題也是運維工作的核心痛點。

本項目由淵亭科技針對同方有云重點運維業(yè)務(wù)的痛點進(jìn)行行業(yè)大模型建設(shè)。具體的,處理大量的云平臺運維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),利用開源大模型訓(xùn)練運維基座模型,并結(jié)合業(yè)務(wù)需求,孵化面向不同場景的專業(yè)運維大模型,能夠進(jìn)行自動發(fā)現(xiàn)故障和自動異常檢測,探索了基于運維大模型的智能運營。同時,設(shè)計了數(shù)據(jù)回流機制,能夠在運維過程中從海量運維數(shù)據(jù)中不斷進(jìn)行處理加工和提煉,反哺專業(yè)運維大模型,形成數(shù)據(jù)飛輪。

基于大模型的云平臺智能運維系統(tǒng)以淵亭大模型開發(fā)訓(xùn)練平臺、大模型數(shù)據(jù)治理平臺為基礎(chǔ),消納用戶已有的運維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),結(jié)合淵亭科技的智能模型開發(fā)和調(diào)優(yōu)經(jīng)驗,支撐云平臺多個應(yīng)用方向的智能運維管理。

基于大模型的云平臺智能運維系統(tǒng)從下至上,分為基礎(chǔ)設(shè)施層、資源支撐層、能力供給層、能力生成層和應(yīng)用服務(wù)層,如下突所示。

3.系統(tǒng)功能

(1)向量知識庫管理功能:提供一站式的向量庫建立手段,能夠?qū)胫R圖譜、文檔等,快速進(jìn)行向量化,并對向量化細(xì)節(jié)提供細(xì)粒度的調(diào)整手段,能夠測試和預(yù)覽向量知識庫效果。

(2)向量知識庫應(yīng)用功能:支持多樣化的編排模版,實現(xiàn)對話鏈、溯源等典型場景的快速構(gòu)建。并能夠結(jié)合提示詞模版支撐高匹配度的領(lǐng)域問答。

(3)數(shù)據(jù)回流功能:支持將終端/服務(wù)器過程監(jiān)控數(shù)據(jù)/操作數(shù)據(jù)/日志數(shù)據(jù)定期/手動的加密、壓縮至訓(xùn)練平臺,進(jìn)行回流處理后,觸發(fā)大模型再訓(xùn)練/微調(diào),并且支持回流數(shù)據(jù)的準(zhǔn)確溯源。
(4)數(shù)據(jù)標(biāo)注功能:提供豐富的數(shù)據(jù)標(biāo)注工具,能夠?qū)ξ⒄{(diào)數(shù)據(jù)集進(jìn)行快速維護(hù),提供任務(wù)化的標(biāo)注管理能力,以支持團(tuán)隊協(xié)同標(biāo)注。
(5)數(shù)據(jù)集管理功能:實現(xiàn)各類數(shù)據(jù)集的統(tǒng)一管理。
(6)模型微調(diào)功能:提供SFT微調(diào)優(yōu)化能力,支持LoRA、P-Tuning等典型微調(diào)算法,并提供可視化的參數(shù)調(diào)整操作引導(dǎo)。內(nèi)置模型評估維度,能夠自動評估特定角度模型的能力。
(7)模型管理功能:適配多個開源、商用大模型,能夠快速基于模型進(jìn)行應(yīng)用和微調(diào)(如支持),并對調(diào)整的模型進(jìn)行版本化管理。
(8)模型服務(wù)功能:支持服務(wù)化的發(fā)布大模型能力,并且對使用性能進(jìn)行監(jiān)控和約束。
(9)集群管理功能:支持對計算資源進(jìn)行集群化管理,并對資源使用進(jìn)行細(xì)致的監(jiān)控。
(10)內(nèi)置基礎(chǔ)組件庫:包括數(shù)據(jù)源接入、通用代理、知識庫代理、問答鏈、緩存、提示詞模版、定制開發(fā)入口等。
(11)自定義插件功能:開發(fā)接口,支持第三方業(yè)務(wù)系統(tǒng)快速接入,作為訓(xùn)練/微調(diào)數(shù)據(jù)集或支撐知識庫。
(12)運維應(yīng)用沉淀:平臺結(jié)合運維大模型應(yīng)用需求,內(nèi)置多種針對運維場景的常用應(yīng)用,用戶可直接引用。
(13)應(yīng)用編排功能:提供編排引擎能力,支持拖拉拽的可視化能力編排。
(14)提示詞庫功能:支持提示詞模版,并可自定義提示詞。支持提示詞的創(chuàng)建、優(yōu)化、評估等細(xì)節(jié)功能。
4.系統(tǒng)性能

• 支持至少10GB級別的大規(guī)模數(shù)據(jù)集的接入,包括連接數(shù)據(jù)源、加載數(shù)據(jù)、解析數(shù)據(jù)、數(shù)據(jù)處理等能力;

• 支持加載多種精度(如float64、float16或int8等)的模型;

• 支持使用至少2種常見的微調(diào)算法開展微調(diào);

• 支持微調(diào)后模型保存時間為分鐘級;

5.應(yīng)用場景

基于大模型的云平臺智能運維系統(tǒng)典型應(yīng)用場景有運維數(shù)據(jù)管理、異常告警管理、故障分析、故障預(yù)測等。

(1)異常告警監(jiān)控

通過對異常數(shù)據(jù)進(jìn)行打標(biāo)、微調(diào),能夠自動發(fā)現(xiàn)IT系統(tǒng)中的異常行為,并提供及時的警報和響應(yīng)。利用溯源功能、知識庫功能,快速定位異常點,進(jìn)而完成海量數(shù)據(jù)精確匹配、時序類別多樣性分析和實時處理等工作。

(2)運維故障分析 能夠快速分析處理多種類型的海量數(shù)據(jù),如Trace、Metric和Log等類型,輔助進(jìn)行故障診斷和分析,形成推測的事件根因,供人工二次復(fù)核。結(jié)合運維系統(tǒng)其他功能,實現(xiàn)從異常檢測到根因定位、故障分類、故障分析和修復(fù)建議的全流程自動化處理,提高故障分析效率。

(3)故障預(yù)測

引入正常數(shù)據(jù)、異常數(shù)據(jù),開展運行數(shù)據(jù)的特征挖掘,聚焦其中的異常因素,形成模型基礎(chǔ)認(rèn)知。在實際問題即將發(fā)生前,大模型自主快速的進(jìn)行提示,通過人機結(jié)合的確認(rèn)審核手段,預(yù)測未來事件,防止?jié)撛诘墓收稀?

系統(tǒng)運維工作是一項繁瑣、高要求的工作,且對可靠性具有很高的要求,基于大模型的云平臺智能運維系統(tǒng)可以提高信息化系統(tǒng)運維效率,降低運維成本,增強預(yù)測性維護(hù)能力,并能實現(xiàn)運維個性化服務(wù)。

1.提高運維效率:系統(tǒng)引入運維大模型,自動化處理海量運維數(shù)據(jù),進(jìn)行快速、高質(zhì)量判斷,能夠代替運維人員進(jìn)行大量判斷,實現(xiàn)風(fēng)險的預(yù)防、發(fā)現(xiàn)、定位和處理,從而大幅提高運維工作的效率。

2.降低運維成本:隨著系統(tǒng)復(fù)雜化,傳統(tǒng)的人工運維成本不斷上升。系統(tǒng)通過構(gòu)建具備自適應(yīng)性的功能大模型,減少人工維護(hù)工作量,進(jìn)而有效降低這部分成本,是降本增效的有效手段。

3.增強預(yù)測性維護(hù):增強的預(yù)測性維護(hù)能力,使得設(shè)備的可靠性、生命周期得到大大的提升,系統(tǒng)的穩(wěn)定性也得到增強。





光子·慧營-資管運營智能助手-資管運營智能助手

項目支持超過300個API的理解學(xué)習(xí),基座大模型擴展識別能力強,支持動態(tài)增加API,冷啟動準(zhǔn)確率在90%以上,逐步擴大其在證券托管及其他金融領(lǐng)域的應(yīng)用探索范圍

豐登種業(yè)大語言模型-拓展了大模型助力生物育種的探索路徑

針對4000個主要栽培品種的每一個基因變異鑒定,針對250份核心品種的農(nóng)藝性狀和表型問答,對水稻15個關(guān)鍵發(fā)育階段的空間組學(xué)測序和單細(xì)胞組學(xué)測序數(shù)據(jù)。

法律大模型在智能合同場景中的應(yīng)用實踐-每年節(jié)約了約130萬分鐘的審查時間

基于最新的人工智能技術(shù)手段,通過智能合同審查算法和合同知識圖譜,能夠?qū)崿F(xiàn)智能風(fēng)險識別、自動比對兩份合同間的差異及為法務(wù)同事提供一系列智能輔助功能

山海多模態(tài)大模型-基于自建300P算力的Atlas智算平臺

山海大模型的出現(xiàn),推動了國內(nèi)AGI 的進(jìn)一步發(fā)展和應(yīng)用,為相關(guān)產(chǎn)業(yè)帶來了巨大變革,從效率、成本、體驗等多角度,助力千行百業(yè)的智慧升級

得物AI查驗鑒別系統(tǒng)-鑒別結(jié)果吻合度在99.9999%以上

得物AI查驗鑒別系統(tǒng)與得物鑒別專家的鑒別結(jié)果吻合度在99.9999%以上,已覆蓋箱包、手表、鞋類、服飾、配飾、奢侈品、戶外運動、美妝等眾多品類

大模型賦能長三角教育現(xiàn)代化典型案例的應(yīng)用研究-實現(xiàn)個性化的案例推薦和應(yīng)用

案例庫還能更好發(fā)揮典型案例的引領(lǐng)示范作用,通過總結(jié)長三角地區(qū)豐富的教育改革實踐,向世界更好展示長三角教育發(fā)展實踐和治理實踐的顯著成效

達(dá)觀數(shù)據(jù)智能知識庫系統(tǒng)-實現(xiàn)機器人和知識庫的后臺知識智能化采編的統(tǒng)一管理

系統(tǒng)埋點數(shù)據(jù)應(yīng)用統(tǒng)計功能,為建立評價指標(biāo)提供基礎(chǔ)數(shù)據(jù),包括用戶滿意率、系統(tǒng)訪問量、知識熱度、賬號活躍度等;知識庫可以對接各業(yè)務(wù)系統(tǒng),

創(chuàng)新奇智工業(yè)大模型賦能制造業(yè)-一款生成式企業(yè)私域數(shù)據(jù)分析應(yīng)用

大模型支持的制造企業(yè)私域AIGC應(yīng)用有助于客戶提高生產(chǎn)力和效率。長期來看,模型的自我學(xué)習(xí)能力可以顯著減少人工更新和維護(hù)的需要

車輛智能運維助手-汽車數(shù)字化運維的重要組成部分

以每年新增150萬用戶數(shù)為基礎(chǔ),預(yù)估產(chǎn)品滲透率為20%,即可售出約30萬套產(chǎn)品 License及各項服務(wù)。社會效益方面,項目在就業(yè)、知識產(chǎn)權(quán)、服務(wù)創(chuàng)新等領(lǐng)域具有顯著的效益

保險行業(yè) AI 大模型助手產(chǎn)品-保險代理人提供了一個強大的支持工具

通過 LLM+RAG架構(gòu)嵌入外部保險知識庫數(shù)據(jù),助手能夠提供高度定制化的問答服務(wù);還擴展了多項功能,包括常見保險知識問答、保險產(chǎn)品信息檢索、保險數(shù)據(jù)計算器

百秋AIGC零售全鏈路數(shù)智洞察平臺-幫助品牌獲得3%-5%的銷售增長

提升價值密度,優(yōu)化商品均價與贈品價值策略,有效提升商品吸引力及銷售效率。通過深入分析真實的凈客單價,幫助品牌方精準(zhǔn)定位價格策略,制定相應(yīng)的市場對策

AIPC與云端聯(lián)動的星環(huán)無涯問知大模型-支持與企業(yè)知識庫的云邊算力聯(lián)動

配備了自研的RAG模塊,該模塊可在AIPC上本地化運行,為豐富的知識庫應(yīng)用提供強大的支持;保障了用戶知識和應(yīng)用的隱私性和高效性
資料獲取
人工智能應(yīng)用
== 最新資訊 ==
基于大模型的云平臺智能運維系統(tǒng)-支撐云平
光子·慧營-資管運營智能助手-資管運營智
豐登種業(yè)大語言模型-拓展了大模型助力生物
法律大模型在智能合同場景中的應(yīng)用實踐-每
山海多模態(tài)大模型-基于自建300P算力的
得物AI查驗鑒別系統(tǒng)-鑒別結(jié)果吻合度在9
大模型賦能長三角教育現(xiàn)代化典型案例的應(yīng)用
達(dá)觀數(shù)據(jù)智能知識庫系統(tǒng)-實現(xiàn)機器人和知識
創(chuàng)新奇智工業(yè)大模型賦能制造業(yè)-一款生成式
車輛智能運維助手-汽車數(shù)字化運維的重要組
保險行業(yè) AI 大模型助手產(chǎn)品-保險代理
百秋AIGC零售全鏈路數(shù)智洞察平臺-幫助
AIPC與云端聯(lián)動的星環(huán)無涯問知大模型-
Alaya NeW 智算操作系統(tǒng)-包含國
AI智能采編系統(tǒng)-一站式媒體新聞發(fā)布解決
== 機器人推薦 ==
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

智能消毒機器人

機器人開發(fā)平臺

機器人開發(fā)平臺


機器人底盤 Disinfection Robot 消毒機器人  講解機器人  迎賓機器人  移動機器人底盤  商用機器人  智能垃圾站  智能服務(wù)機器人  大屏機器人  霧化消毒機器人  紫外線消毒機器人  消毒機器人價格  展廳機器人  服務(wù)機器人底盤  核酸采樣機器人  機器人代工廠  智能配送機器人  噴霧消毒機器人  圖書館機器人  導(dǎo)引機器人  移動消毒機器人  導(dǎo)診機器人  迎賓接待機器人  導(dǎo)覽機器人 
版權(quán)所有 創(chuàng)澤智能機器人集團(tuán)股份有限公司 中國運營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728