本技術(shù)涉及云計(jì)算,尤其涉及一種模型訓(xùn)練方法、故障預(yù)測(cè)方法、裝置、介質(zhì)及產(chǎn)品。
背景技術(shù):
1、隨著云計(jì)算的發(fā)展,越來(lái)越多的企業(yè)開(kāi)始將基礎(chǔ)設(shè)施和應(yīng)用遷移至云環(huán)境,以實(shí)現(xiàn)更高的靈活性、可擴(kuò)展性和成本效益。盡管云環(huán)境為企業(yè)的管理提供了遍歷,但是帶來(lái)了運(yùn)維復(fù)雜度的增加,多云和混合云的普及,是的資源管理、性能監(jiān)控以及安全保障這些運(yùn)維工作變得更加復(fù)雜。
2、為了解決云計(jì)算環(huán)境中的運(yùn)維管理問(wèn)題,現(xiàn)有技術(shù)中普遍采用自動(dòng)化運(yùn)維管理的方式實(shí)現(xiàn)高效運(yùn)維管理,該方式主要為:利用監(jiān)控平臺(tái)針對(duì)云計(jì)算環(huán)境中的云服務(wù)進(jìn)行實(shí)時(shí)監(jiān)控,并獲取云服務(wù)的運(yùn)維數(shù)據(jù),利用預(yù)設(shè)的故障響應(yīng)規(guī)則,對(duì)運(yùn)維數(shù)據(jù)進(jìn)行分析,從而針對(duì)運(yùn)維數(shù)據(jù)進(jìn)行自動(dòng)化的故障響應(yīng)。
3、現(xiàn)有技術(shù)中利用預(yù)設(shè)的故障響應(yīng)規(guī)則對(duì)運(yùn)維數(shù)據(jù)進(jìn)行分析,從而得到每種故障對(duì)應(yīng)的響應(yīng)策略。導(dǎo)致現(xiàn)有技術(shù)中存在自動(dòng)化運(yùn)維管理效率低的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例提供模型訓(xùn)練方法、故障預(yù)測(cè)方法、裝置、介質(zhì)及產(chǎn)品,用以達(dá)到提升自動(dòng)化運(yùn)維管理效率的技術(shù)效果。
2、第一方面,本技術(shù)實(shí)施例提供一種模型訓(xùn)練方法,包括:
3、生成訓(xùn)練集,訓(xùn)練集包括多個(gè)歷史時(shí)刻的歷史性能指標(biāo)數(shù)據(jù)以及每個(gè)歷史時(shí)刻對(duì)應(yīng)的標(biāo)簽,標(biāo)簽用于表示歷史時(shí)刻存在的故障;
4、基于訓(xùn)練集進(jìn)行模型訓(xùn)練,獲取故障預(yù)測(cè)模型。
5、在一種可能的實(shí)施方式中,生成訓(xùn)練集,包括:
6、獲取樣本云環(huán)境在多個(gè)歷史時(shí)刻的初始?xì)v史性能指標(biāo)數(shù)據(jù);
7、針對(duì)每個(gè)初始?xì)v史性能指標(biāo)數(shù)據(jù),將初始?xì)v史性能指標(biāo)數(shù)據(jù)中預(yù)設(shè)性能指標(biāo)對(duì)應(yīng)的數(shù)據(jù),確定為歷史性能指標(biāo)數(shù)據(jù),預(yù)設(shè)性能指標(biāo)為預(yù)先設(shè)定的與樣本云環(huán)境的異常狀態(tài)的相關(guān)度高于預(yù)設(shè)相關(guān)度的性能指標(biāo);
8、獲取每個(gè)歷史時(shí)刻對(duì)應(yīng)的標(biāo)簽;
9、基于樣本云環(huán)境在每個(gè)歷史時(shí)刻的歷史性能指標(biāo)數(shù)據(jù)以及標(biāo)簽,生成訓(xùn)練集。
10、在一種可能的實(shí)施方式中,基于訓(xùn)練集進(jìn)行模型訓(xùn)練,獲取故障預(yù)測(cè)模型,包括:
11、基于訓(xùn)練集對(duì)多個(gè)相同的初始模型分別進(jìn)行模型訓(xùn)練,獲取多個(gè)初始故障預(yù)測(cè)模型;
12、根據(jù)驗(yàn)證集對(duì)每個(gè)初始故障預(yù)測(cè)模型進(jìn)行驗(yàn)證,確定每個(gè)初始故障預(yù)測(cè)模型的預(yù)測(cè)性能;
13、將預(yù)測(cè)性能最優(yōu)的初始故障預(yù)測(cè)模型,確定為故障預(yù)測(cè)模型。
14、第二方面,本技術(shù)實(shí)施例提供一種故障預(yù)測(cè)方法,包括:
15、獲取待預(yù)測(cè)云環(huán)境當(dāng)前的性能指標(biāo)數(shù)據(jù);
16、將當(dāng)前的性能指標(biāo)數(shù)據(jù)輸入故障預(yù)測(cè)模型,獲取故障預(yù)測(cè)模型輸出的故障信息,故障信息用于說(shuō)明待預(yù)測(cè)云環(huán)境是否存在故障,在故障信息說(shuō)明待預(yù)測(cè)云環(huán)境存在故障時(shí),故障信息還包括故障標(biāo)識(shí),故障預(yù)測(cè)模型是基于第一方面任一項(xiàng)方法進(jìn)行模型訓(xùn)練得到的。
17、在一種可能的實(shí)施方式中,方法還包括:
18、在故障信息說(shuō)明待預(yù)測(cè)云環(huán)境存在故障時(shí),基于故障標(biāo)識(shí)以及故障映射關(guān)系,確定故障等級(jí)和故障類型,故障映射關(guān)系用于表示故障的標(biāo)識(shí)、等級(jí)以及類型三者之間的對(duì)應(yīng)關(guān)系,故障等級(jí)與故障對(duì)待預(yù)測(cè)云環(huán)境的破壞程度相關(guān);
19、基于故障標(biāo)識(shí)、故障等級(jí)以及故障類型,生成模型提示詞;
20、將模型提示詞輸入至大語(yǔ)言模型中,獲取大語(yǔ)言模型輸出的故障解決策略;
21、在待預(yù)測(cè)云環(huán)境中執(zhí)行故障解決策略。
22、在一種可能的實(shí)施方式中,方法還包括:
23、在待預(yù)測(cè)云環(huán)境中執(zhí)行完故障解決策略后,基于故障解決后的性能指標(biāo)數(shù)據(jù),確定資源使用狀態(tài);
24、根據(jù)資源使用狀態(tài)以及預(yù)設(shè)資源分配策略,生成資源調(diào)整信息;
25、根據(jù)資源調(diào)整信息,對(duì)待預(yù)測(cè)云環(huán)境進(jìn)行資源調(diào)整。
26、在一種可能的實(shí)施方式中,性能指標(biāo)數(shù)據(jù)包括目標(biāo)服務(wù)的子性能指標(biāo)數(shù)據(jù)和目標(biāo)資源的子性能指標(biāo)數(shù)據(jù),方法還包括:
27、基于資源調(diào)整信息,確定新的目標(biāo)服務(wù)和/或新的目標(biāo)資源。
28、在一種可能的實(shí)施方式中,方法還包括:
29、在對(duì)待預(yù)測(cè)云環(huán)境進(jìn)行資源調(diào)整后,獲取資源調(diào)整后的性能指標(biāo)數(shù)據(jù);
30、確定資源調(diào)整后的性能指標(biāo)數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽,資源調(diào)整后的性能指標(biāo)數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽用于表示待預(yù)測(cè)云環(huán)境當(dāng)前無(wú)故障;
31、根據(jù)資源調(diào)整后的性能指標(biāo)數(shù)據(jù)以及對(duì)應(yīng)的標(biāo)簽,對(duì)故障預(yù)測(cè)模型進(jìn)行更新,獲取更新后的故障預(yù)測(cè)模型。
32、第三方面,本技術(shù)實(shí)施例提供一種模型訓(xùn)練裝置,包括:
33、第一處理模塊,用于生成訓(xùn)練集,訓(xùn)練集包括多個(gè)歷史時(shí)刻的歷史性能指標(biāo)數(shù)據(jù)以及每個(gè)歷史時(shí)刻對(duì)應(yīng)的標(biāo)簽,標(biāo)簽用于表示歷史時(shí)刻存在的故障;
34、第二處理模塊,用于基于訓(xùn)練集進(jìn)行模型訓(xùn)練,獲取故障預(yù)測(cè)模型。
35、在一種可能的實(shí)施方式中,第一處理模塊還用于:
36、獲取樣本云環(huán)境在多個(gè)歷史時(shí)刻的初始?xì)v史性能指標(biāo)數(shù)據(jù);
37、針對(duì)每個(gè)初始?xì)v史性能指標(biāo)數(shù)據(jù),將初始?xì)v史性能指標(biāo)數(shù)據(jù)中預(yù)設(shè)性能指標(biāo)對(duì)應(yīng)的數(shù)據(jù),確定為歷史性能指標(biāo)數(shù)據(jù),預(yù)設(shè)性能指標(biāo)為預(yù)先設(shè)定的與樣本云環(huán)境的異常狀態(tài)的相關(guān)度高于預(yù)設(shè)相關(guān)度的性能指標(biāo);
38、獲取每個(gè)歷史時(shí)刻對(duì)應(yīng)的標(biāo)簽;
39、基于樣本云環(huán)境在每個(gè)歷史時(shí)刻的歷史性能指標(biāo)數(shù)據(jù)以及標(biāo)簽,生成訓(xùn)練集。
40、在一種可能的實(shí)施方式中,第二處理模塊還用于:
41、基于訓(xùn)練集對(duì)多個(gè)相同的初始模型分別進(jìn)行模型訓(xùn)練,獲取多個(gè)初始故障預(yù)測(cè)模型;
42、根據(jù)驗(yàn)證集對(duì)每個(gè)初始故障預(yù)測(cè)模型進(jìn)行驗(yàn)證,確定每個(gè)初始故障預(yù)測(cè)模型的預(yù)測(cè)性能;
43、將預(yù)測(cè)性能最優(yōu)的初始故障預(yù)測(cè)模型,確定為故障預(yù)測(cè)模型。
44、第四方面,本技術(shù)實(shí)施例提供一種故障預(yù)測(cè)裝置,包括:
45、第一獲取模塊,用于獲取待預(yù)測(cè)云環(huán)境當(dāng)前的性能指標(biāo)數(shù)據(jù);
46、第二獲取模塊,用于將當(dāng)前的性能指標(biāo)數(shù)據(jù)輸入故障預(yù)測(cè)模型,獲取故障預(yù)測(cè)模型輸出的故障信息,故障信息用于說(shuō)明待預(yù)測(cè)云環(huán)境是否存在故障,在故障信息說(shuō)明待預(yù)測(cè)云環(huán)境存在故障時(shí),故障信息還包括故障標(biāo)識(shí),故障預(yù)測(cè)模型是基于第一方面任一項(xiàng)方法進(jìn)行模型訓(xùn)練得到的。
47、在一種可能的實(shí)施方式中,該裝置還包括第一處理模塊,第一處理模塊用于:
48、在故障信息說(shuō)明待預(yù)測(cè)云環(huán)境存在故障時(shí),基于故障標(biāo)識(shí)以及故障映射關(guān)系,確定故障等級(jí)和故障類型,故障映射關(guān)系用于表示故障的標(biāo)識(shí)、等級(jí)以及類型三者之間的對(duì)應(yīng)關(guān)系,故障等級(jí)與故障對(duì)待預(yù)測(cè)云環(huán)境的破壞程度相關(guān);
49、基于故障標(biāo)識(shí)、故障等級(jí)以及故障類型,生成模型提示詞;
50、將模型提示詞輸入至大語(yǔ)言模型中,獲取大語(yǔ)言模型輸出的故障解決策略;
51、在待預(yù)測(cè)云環(huán)境中執(zhí)行故障解決策略。
52、在一種可能的實(shí)施方式中,該裝置還包括第二處理模塊,第二處理模塊用于:
53、在待預(yù)測(cè)云環(huán)境中執(zhí)行完故障解決策略后,基于故障解決后的性能指標(biāo)數(shù)據(jù),確定資源使用狀態(tài);
54、根據(jù)資源使用狀態(tài)以及預(yù)設(shè)資源分配策略,生成資源調(diào)整信息;
55、根據(jù)資源調(diào)整信息,對(duì)待預(yù)測(cè)云環(huán)境進(jìn)行資源調(diào)整。
56、在一種可能的實(shí)施方式中,性能指標(biāo)數(shù)據(jù)包括目標(biāo)服務(wù)的子性能指標(biāo)數(shù)據(jù)和目標(biāo)資源的子性能指標(biāo)數(shù)據(jù),該裝置還包括第三處理模塊,第三處理模塊用于:
57、基于資源調(diào)整信息,確定新的目標(biāo)服務(wù)和/或新的目標(biāo)資源。
58、在一種可能的實(shí)施方式中,該裝置還包括第四處理模塊,第四處理模塊用于:
59、在對(duì)待預(yù)測(cè)云環(huán)境進(jìn)行資源調(diào)整后,獲取資源調(diào)整后的性能指標(biāo)數(shù)據(jù);
60、確定資源調(diào)整后的性能指標(biāo)數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽,資源調(diào)整后的性能指標(biāo)數(shù)據(jù)對(duì)應(yīng)的標(biāo)簽用于表示待預(yù)測(cè)云環(huán)境當(dāng)前無(wú)故障;
61、根據(jù)資源調(diào)整后的性能指標(biāo)數(shù)據(jù)以及對(duì)應(yīng)的標(biāo)簽,對(duì)故障預(yù)測(cè)模型進(jìn)行更新,獲取更新后的故障預(yù)測(cè)模型。
62、第五方面,本技術(shù)實(shí)施例提供一種電子設(shè)備,包括:存儲(chǔ)器,處理器;
63、存儲(chǔ)器存儲(chǔ)計(jì)算機(jī)執(zhí)行指令;
64、處理器執(zhí)行存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)執(zhí)行指令,使得處理器執(zhí)行如上第一方面或第二方面中各種可能的實(shí)施方式。
65、第六方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)執(zhí)行指令,計(jì)算機(jī)執(zhí)行指令被處理器執(zhí)行時(shí)用于實(shí)現(xiàn)如上第一方面或第二方面中各種可能的實(shí)施方式。
66、第七方面,本技術(shù)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上第一方面或第二方面中各種可能的實(shí)施方式。
67、本技術(shù)實(shí)施例提供的模型訓(xùn)練方法、故障預(yù)測(cè)方法、裝置、介質(zhì)及產(chǎn)品,通過(guò)生成訓(xùn)練集,基于生成的訓(xùn)練集進(jìn)行模型訓(xùn)練,獲取故障預(yù)測(cè)模型。該預(yù)測(cè)模型在故障預(yù)測(cè)中,利用獲取的待預(yù)測(cè)云環(huán)境當(dāng)前的性能指標(biāo)數(shù)據(jù),可以得到故障預(yù)測(cè)模型輸出的故障信息,故障信息用于說(shuō)明當(dāng)前的待預(yù)測(cè)云環(huán)境是否存在故障。利用生成的訓(xùn)練集數(shù)據(jù)進(jìn)行故障預(yù)測(cè)模型的訓(xùn)練,從而得到可以基于云環(huán)境性能指標(biāo)數(shù)據(jù)預(yù)測(cè)云環(huán)境中是否存在故障的故障預(yù)測(cè)模型,該故障預(yù)測(cè)模型可以基于實(shí)時(shí)的性能指標(biāo)數(shù)據(jù)預(yù)測(cè)待預(yù)測(cè)云環(huán)境中是否存在故障。和現(xiàn)有技術(shù)中利用預(yù)設(shè)的故障響應(yīng)規(guī)則進(jìn)行故障響應(yīng)的方式相比,本技術(shù)結(jié)合深度學(xué)習(xí)的方式進(jìn)行模型訓(xùn)練,利用模型訓(xùn)練實(shí)現(xiàn)快速精準(zhǔn)的故障響應(yīng),從而達(dá)到了提升自動(dòng)化運(yùn)維管理效率的技術(shù)效果。