近年來運維技術(shù)飛速發(fā)展,運維團隊大多建設(shè)好了各種系統(tǒng),虛擬化、容器化、持續(xù)集成等等。但是如何有效的利用這些系統(tǒng)最終實現(xiàn)站點的高可用、高性能、高可擴展?隨著智能化技術(shù)的發(fā)展,為了解決上述運維領(lǐng)域的問題,智能運維的呼聲越來越高。
在日志易產(chǎn)品總監(jiān)饒琛琳看來,目前國內(nèi)智能運維發(fā)展還處于一個探索階段,要想盡快在智能運維領(lǐng)域有所突破,首先要重點做好監(jiān)控系統(tǒng)和告警系統(tǒng),并利用機器學(xué)習(xí)算法進行快速監(jiān)控和排障。
饒琛琳對智能運維的發(fā)展,做了三個階段的預(yù)測:
智能地判斷告警
傳統(tǒng)的 IT 運維需要管理大量的告警,極大地分散了企業(yè)的注意力,消耗運維人員大量的時間和創(chuàng)新力。想辦法高效地解決一天收到幾千封告警郵件的情況,把運維人員從紛繁復(fù)雜的告警和噪音中解脫出來, 是一個能夠迅速產(chǎn)生價值的思路。
智能地判斷告警,而不是依據(jù)經(jīng)驗設(shè)定閾值,設(shè)定告警閾值是一項耗時耗力的工作,需要運維人員在充分了解業(yè)務(wù)的前提下才能進行,還得考慮業(yè)務(wù)是不是平穩(wěn)發(fā)展?fàn)顟B(tài),否則一兩周改動一次,運維工程師將會疲于奔命。
日志易剛剛發(fā)布的1.10.1版本,對告警的管理和統(tǒng)計做了很大改進,不同顏色代表不同等級告警,用戶可以非常直觀的看到不同優(yōu)先級別的告警數(shù)量占比與處理進程。另外,為了應(yīng)對告警風(fēng)暴,日志易設(shè)有一套告警規(guī)則,根據(jù)告警屬性分類收起,保證用戶能夠直觀瀏覽到最新告警的概況。
日志易饒琛琳:運維的未來是智能運維
日志易的告警機制,不僅提供了豐富的告警類型,如基線告警、SPL(搜索處理語言Search Processing Language)告警,還針對企業(yè)版用戶提供了告警轉(zhuǎn)發(fā)接口,將日志易系統(tǒng)的告警通過HTTP接口POST給接收機器,從而非常方便的與客戶現(xiàn)有的告警監(jiān)控系統(tǒng)相集成。
智能地定位故障
現(xiàn)在的故障定位完全依賴于人的經(jīng)驗和CMDB的完備性,但維護一個復(fù)雜的CMDB本身又是大難題。智能運維應(yīng)該可以從相關(guān)性分析等方面,輔助運維人員快速定位故障。
日志易1.10.1版本發(fā)布了一個新功能——基于聚類算法的日志模式發(fā)現(xiàn)。借助機器學(xué)習(xí)技術(shù)讓運維更智能。
新版本在搜索界面上,添加了一個切換標(biāo)簽“模式”。根據(jù)搜索結(jié)果的數(shù)據(jù)間相似度,該功能采用聚類算法對日志進行聚類合并,形成一個個包含相似數(shù)據(jù)的數(shù)據(jù)集,方便用戶在查看種類繁多的搜索結(jié)果時,進行快捷的模式行為分析。
通過算法快速幫助使用者找到數(shù)據(jù)中隱藏的規(guī)律,這將大大節(jié)省工作量,提高分析效率。
日志易饒琛琳:運維的未來是智能運維
基于自然語言處理的自動反饋機制
利用一些 NLP(自然語言處理)技術(shù),對自然語言寫成的故障報告進行處理,自動反饋到智能運維系統(tǒng)里。這一點可能是更遙遠(yuǎn)的一個設(shè)想,但會是將來發(fā)展的一條道路。
到日志易官網(wǎng)了解更多智能運維文章。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!