開篇:“智能+”時代網絡智能化的必要性
随着人(rén)類社會第四次工(gōng)業革命的到來,各行各業的數字化和智能化轉型提到了前所未有的高度。2019年(nián)中國政府工(gōng)作(zuò)報告更是首次提出“智能+”作(zuò)爲國家戰略。Gartner的技術曲線也表明,用新一代智能技術爲傳統産業轉型升級進行賦能乃大(dà)勢所趨,例如(rú)智慧城(chéng)市和工(gōng)業4.0等。網絡作(zuò)爲智能化時代的基礎設施和支撐底座,其本身(shēn)也急需進行智能化的演進和升級。
數字化轉型的驅動力和
對網絡管理(lǐ)的挑戰
》數字化轉型的驅動力
業務數據化。企業數字化轉型意味着進行業務、流程和組織再造,把企業的核心資産、流程和管理(lǐ)等全部上網,即進行業務數據化。而網絡是業務運行和數據承載的基礎,因此網絡平均故障發生(shēng)間隔(MTTF)面臨更高的要求;同時,要求具備一定的網絡故障預判預測能力,故障後業務恢複更加迅速。
數據業務化。企業的數據是企業的重要資産,借助數據綜合分(fēn)析,更好地發揮價值爲企業業務目标服務,即數據業務化。數據業務化要求信息系統能夠更好地理(lǐ)解和承載業務目标。
業務需求和信息系統之間的縫隙需要彌合。意圖網絡(IBN,Intent-Based Network)的出現提供了一種很好的方式,把業務意圖轉變爲系統策略,并下發給網絡等基礎設施執行。
》傳統網絡管理(lǐ)的挑戰
傳統網絡管理(lǐ)系統的挑戰來自(zì)于多個方面,主要表現在:
對于業務意圖(Intent)的解析和轉化存在不足。傳統網絡管理(lǐ)系統多是基于網元的管理(lǐ)操作(zuò)系統,對于意圖的轉化和自(zì)動化處理(lǐ)在最初的系統設計上欠考慮。
其次,囿于數據采集和計算處理(lǐ)手段有限,傳統網絡管理(lǐ)系統的快(kuài)速反應能力和大(dà)數據分(fēn)析處理(lǐ)能力受限,基本上屬于被動反應式(Reactive)處理(lǐ)系統。存在救火(huǒ)式維護、問題定位難、恢複難以閉環等諸多明顯弊端。
數據驅動智能,數字化轉型有了數據,爲業務智能化奠定了基礎。ABC技術(指AI,Big Data,Cloud)的出現,爲綜合性的智能分(fēn)析洞察提供了支撐。社會各行各業,正在“智能+”思路(lù)的指引下迅猛發展。網絡,也在遵循這個趨勢進行快(kuài)速革新和演進。
新華三新一代網絡AI架構和實踐
》基于AI的先知網絡管理(lǐ)框架
新華三在網絡領域對解決方案、技術創新和運維管理(lǐ)等有近三十年(nián)的經驗和積累。正是基于對網絡行業的深厚理(lǐ)解,結合AI和大(dà)數據等技術,創新性地提出了先知網絡管理(lǐ)框架。該框架總體上包括三個大(dà)的組成部分(fēn),即雲端先知服務中心(SeerService Center)、局端(企業本地)先知網絡中心(SeerNetwork Architecture Center,簡稱SNA Center)和移動端先知精靈App(SeerGenie)。
移動端先知精靈App主要功能包括園區無線接入診斷、設備版本分(fēn)析和關鍵信息推送等。其出發點是基于移動優先策略,給最終用戶或者運維人(rén)員提供一個便攜工(gōng)具,提升使用體驗。
局端先知網絡架構中心,通常安裝在客戶本地,包括SNA Center、SeerEngine(先知控制器)和SeerAnalyzer(先知分(fēn)析器)三個組件(jiàn)。主體功能劃分(fēn)上Center負責意圖翻譯,控制器負責自(zì)動化,分(fēn)析器負責智能化。
客戶業務意圖通過控制器轉譯爲策略,并最終轉換成設備能理(lǐ)解的配置指令。
從系統論的角度,網絡可(kě)當作(zuò)一個動态系統來考慮。動态系統過程包括健康度判斷、問題故障定位、修複措施計算和配置動作(zuò)關聯等,其後面的關鍵之處在于基于數據的AI/ML學習和分(fēn)析。一個完整的流程包括:數據感知、存儲計算、智能分(fēn)析、可(kě)視化展示和優化閉環;優化後的數據進行新一輪的感知,并依此循環,如(rú)圖3所示。對于SNA架構來說,先知分(fēn)析器實現從數據的感知到分(fēn)析洞察,先知控制器實現優化閉環動作(zuò)。
新一代智能網絡分(fēn)析+動作(zuò)系統,從面向業務的數據感知到主動智能分(fēn)析,以及仿真預測和動作(zuò)閉環,提供基于意圖的智能管理(lǐ)能力。
》面向業務的數據感知
數據是新時代的石油。于網絡而言,數據是網絡新時代—網絡智能化時代的石油。一方面,數據驅動業務的發展,數據的重要性不言而喻;另一方面,業務拉動數據的開采,對于網絡業務智能化系統而言,需要兼顧成本和效益,數據采集并非來者不拒。因此,應更加重視面向業務進行數據采集,數據服務于業務,從而更好地服務于用戶。結合先知網絡架構,從深度、廣度和精度三個方面進行闡述。
深度數據感知服務于業務。Zoom-In方向,從Underlay物理(lǐ)管道,到Overlay邏輯管道,到會話應用,再到報文隊列。Zoom-Out方向,從鏈路(lù),到設備,到區域網絡,到企業全局網絡。例如(rú)對于隊列報文的丢包和時空信息,綜合分(fēn)析丢包對客戶具體應用的影(yǐng)響,并将影(yǐng)響在對應的應用層、邏輯層和物理(lǐ)層上呈現出來。
廣度數據感知服務于業務。時間維度從曆史旅程到現在,範圍維度從網絡本身(shēn)到周邊上下文,過程維度從單一系統到綜合聯動。通過采集5W1H數據,多維度關聯分(fēn)析後,對于SeerAnalyzer-Campus場景,實現數據感知。
精度數據感知服務于業務。精度可(kě)從時間精度和空間精度兩方面來看(kàn)。通過流式Telemetry/GRPC進行高速數據采集,例如(rú)以毫秒級的速度感知芯片buffer的變化,來分(fēn)析網路(lù)的流量擁堵/暢通程度,真正明察秋“毫”。Telemetry/GRPC是先知分(fēn)析器支持的标配技術(需芯片支持),而傳統的SNMP做不到。通過INT(In-Band-Telemetry)方式,對應用路(lù)徑沿途的時空(時間戳和鏈路(lù)/端口)信息進行精準測量和分(fēn)析後,可(kě)以呈現全路(lù)徑,消除路(lù)徑盲區,實現沿途時延的可(kě)視化,有效幫助故障根因分(fēn)析。
》先知分(fēn)析器的主動分(fēn)析
主動(Proactive)智能分(fēn)析是指SeerAnalyzer對感知和采集到的數據,基于智能模型和邏輯算法在後台不間斷地進行多維綜合計算,及時發現網絡當前故障和隐患,并基于時序數據的動态學習,進行異常檢測和趨勢預測。
設備健康度是一個典型的主動分(fēn)析計算的例子,通過對交換機系統平面、控制平面和數據平面關鍵指标的綜合計算,以打分(fēn)形式展現單台設備健康度;綜合計算可(kě)得(de)到整個網絡健康度。系統平面包括常見的CPU、内存、電源、風扇和溫度等子項指标;數據平面包括鏈路(lù)狀态、轉發表、ACL資源、芯片Buffer等子項指标;控制平面,包括BGP到RR連通狀态等。這些指标,根據新華三的多年(nián)網絡經驗賦予不同的算子權重。同時,這是一個可(kě)擴充的指标體系,針對網絡場景可(kě)以增加或更新指标項。
主動分(fēn)析追求故障發現的及時性和準實時性,有别于傳統意義上的被動式事(shì)後處理(lǐ),一方面降低MTTK(MeanTime-To-Know),另一方面增強在線檢測和預測水平,提升網絡管理(lǐ)智能化水平。
》預測仿真以及先知先覺
對網絡中不同網元設備的時序數據進行周期性采集,基于模型主動計算,可(kě)以建立客戶場景環境相(xiàng)關的動态基線,并對異常進行檢測;或實現趨勢預測,如(rú)光(guāng)學器件(jiàn)壽命預測,流量趨勢預測,系統容量預測等。
網絡仿真,可(kě)在新業務上線前仿真對當前在網業務的影(yǐng)響,分(fēn)析出設備和鏈路(lù)故障對現有業務的影(yǐng)響、網絡變更的影(yǐng)響範圍等,從而分(fēn)析制定必要的應對措施,保證業務的可(kě)靠運行。其原理(lǐ)基礎是whatif分(fēn)析,作(zuò)爲一種統計分(fēn)析工(gōng)具,在網絡中結合控制平面和數據平面變化因素分(fēn)析,有利于提前做好網絡變更的模拟并制定預案。
》融合分(fēn)析器+控制器的網絡優化機制
WAN鏈路(lù)的帶寬是一種寶貴的資源,同時對可(kě)靠性也提出非常高的要求, WAN鏈路(lù)優化是一個曆久彌新的關鍵問題。在SD-WAN中,可(kě)以借助于SNA架構的分(fēn)析器SeerAnalyzer和控制器SeerEngine組合提供一種新的解決方案。
形象地說,分(fēn)析器實現大(dà)腦思考過程,控制器實現手眼配合等執行過程。
借助于分(fēn)析器,對WAN鏈路(lù)狀态進行主動計算,同時根據時序數據建立鏈路(lù)的動态AI基線,綜合判斷給出鏈路(lù)優化和切換依據。控制器基于分(fēn)析器提供的 “依據”自(zì)動化的下發和調整相(xiàng)關設備 配置;新的鏈路(lù)狀态依然會重複這個過程,從而實現了一種負反饋的閉環機制,園區的WiFi優化場景等也是如(rú)此。
總結起來看(kàn),借助于SNA架構,可(kě)以從數據采集開始,到事(shì)前、事(shì)中和事(shì)後不同時間,到網絡、用戶和應用不同角度,進行多維度分(fēn)析和洞察,并通過可(kě)視化展示和優化聯動,促進網絡智能化管理(lǐ)水平提升。
網絡智能化的演進
網絡智能化的發展是一個循序漸進的過程,目前仍然處在比較初級的階段。面向未來,一方面,網絡智能運維将借助于相(xiàng)關技術的發展繼續提升;另一方面,自(zì)動駕駛網絡是一個更加激動人(rén)心和更具業務價值的方向。這裏面包括業務場景的豐富和技術的進步,也包括行業标準的建立和客戶價值提升等。
就(jiù)智能運維來說,當前更多地是基于數據爲主的感知智能的作(zuò)用,這裏的數據主要是指網絡設備軌迹數據以及相(xiàng)關的周邊上下文數據。從網絡系統的複雜度、管理(lǐ)效率和人(rén)機友好等角度看(kàn),專家知識和業務經驗将是一個有待深挖的寶藏,也預示着認知智能将在這一過程中發揮更大(dà)的作(zuò)用。
就(jiù)自(zì)動駕駛網絡來說将會分(fēn)階段演進,從輔助駕駛、部分(fēn)自(zì)動化、有條件(jiàn)自(zì)動化到高度自(zì)動化和最終的全自(zì)動。就(jiù)像車輛的自(zì)動駕駛,一輛傳統的車,由于機制原理(lǐ)從一開始不具備智能部件(jiàn),即使全方位運維保養做得(de)再到位,也實現不了自(zì)動駕駛。網絡的智能運維和網絡自(zì)動駕駛也是類似的情況。
“智能+”的浪潮席卷全球,也在革新網絡行業的發展。新華三希望借助SNA架構,通過網絡智能驅動客戶業務智能化的發展,大(dà)力推動智慧城(chéng)市建設和工(gōng)業4.0等方向的數字化轉型。