摘要:在LTE/EPC大規(guī)模網絡部署時,我們需要注意哪些問題和風險,以及相關的解決方案。
目前中國運營商正處于LTE/EPC規(guī)模部署的前夜, 基于中國龐大的用戶基數,在今后的兩三年內,LTE/EPC的使用用戶數,數據流量會變得十分巨大,因此中國的網絡建設者需要在網絡部署初期,研究國外大型運營商的前車之鑒,未雨綢繆,節(jié)省網絡開銷,提升網絡安全性。
在Pool的基礎上進一步提高核心網安全性
目前組pool技術已經用在了MSC和SGSN上,在一定程度上提高了網絡的安全性,在LTE的核心網EPC上,也有類似的MME-pool和SGW-pool技術,同樣可以起到負荷分擔,網元之間冗余備份的作用。但是在國外大規(guī)模的LTE商業(yè)部署過程中,我們發(fā)現對于系統(tǒng)安全性,依然有提高的空間。
1.在MME pool的基礎上提高安全性
當一個MME宕機時,根據國際規(guī)范的規(guī)定,該MME上附著的用戶會到pool中的另一個MME上重新進行強制附著。
而附著流程本身包含十分復雜的信令交互,當一個MME宕機時,數以萬計的用戶在pool內的另一個MME上做附著操作,對MME甚至HSS的信令壓力會很大,甚至會把pool內其他原本正常工作的MME擊垮,引發(fā)的雪崩效益導致網絡的大規(guī)模癱瘓。
為了應對這一問題,上海貝爾創(chuàng)新性地增加一臺小型備份服務器(SRS),它平時只需收取pool內各個MME中附著用戶的動態(tài)數據(UE context),即可保留pool內所有用戶的信息。
有了備份服務器之后,當一個MME宕機時,終端用戶根據規(guī)范要求,到pool內的其他MME上做附著操作,而MME則可以從備份服務器中(SRS)讀取用戶的動態(tài)信息(UE context),只需要一次消息來回就可以代替很復雜的附著信令流程,從而大大降低了MME和HSS的瞬時信令壓力,提高網絡的總體安全性。如下圖所示。
2. 在SGW pool的基礎上提高安全性
對于SAE-GW,除了使用SGW-Pool技術提高系統(tǒng)的安全性,還可以更進一步,使用SAE-GW的地理冗余技術。具體解決方案如下圖所示。
SAE-GW冗余方案使用了兩種技術:
VRRP技術
使用了VRRP技術,當主用的SAE-GW退出服務時,備用的SAE-GW依舊可以使用主用的IP地址對外通信,繼續(xù)工作,那么周邊的網元(MME,eNodeB)就感知不到SAE-GW網元實體進行了倒換,于是SAE-GW的倒換對周邊網元沒有影響。
Multi-Chassis Synchronization (MCS)技術
這是上海貝爾獨有的技術,可以在兩個SAE-GW之間同步LTE用戶的動態(tài)數據,備用SAE-GW不停地獲取當前的用戶信息,當主用設備退出服務時,備用設備已經有了相關的用戶信息,可以很平滑地繼續(xù)提供服務,于是SAE-GW的倒換對在線用戶也沒有影響。
應對信令風暴的沖擊
國外運營商在大規(guī)模部署LTE/EPC網絡時,都碰到了信令風暴的問題,即信令流量的激增,消耗了大量的網絡系統(tǒng)資源,極端的情況下,過大的信令量會引起系統(tǒng)設備的癱瘓。
信令的激增主要由以下幾個方面引起:
推送業(yè)務,VoIP業(yè)務導致大量尋呼消息。
b.長在線業(yè)務,小包業(yè)務,M2M業(yè)務導致大量的無線/核心網鏈路資源的刪創(chuàng),引發(fā)鏈路控制消息數目的激增。
c.LTE/EPC的扁平化架構,沒有RNC做收斂,MME、GW直接面對成千上萬個eNodeB,它們之間的信令消息幾何級數地增加。
應對信令風暴的沖擊,核心網側可以從以下幾個方面來應對。
1. 核心網設備本身提高健壯性
對于信令處理的主設備MME,板卡要做到1:1冗余備份,每對板卡之間再做負荷分擔,這樣才能盡量避免單點故障,整個的系統(tǒng)安全性比N+1板卡備份要高很多。
2. 智能的尋呼策略
尋呼消息是MME發(fā)給eNodeB的,由eNodeB在其覆蓋范圍內搜尋相關的終端,因此會占用eNodeB的無線資源。如果MME發(fā)出的尋呼消息越多,范圍越大,肯定會消耗更多的無線資源,但是尋呼成功率就會高,終端用戶的業(yè)務體驗就比較好。MME上應該提供靈活的尋呼策略,讓運營商在終端用戶的尋呼體驗和網絡資源的消耗上取得良好的平衡,防止尋呼消息產生的信令風暴。
首先對于尋呼的范圍,可以有如下的選擇:
Last Seen eNodeB
Last Seen TA
Last Seen TA + Neighboring TAs (TA List)
Last Seen eNB + (N) eNBs
運營商可以根據網絡的忙閑狀態(tài),選擇不同的尋呼范圍:網絡空閑時可以選擇比較大的范圍,反之則選擇比較小的范圍,防止無線和EPC的過載。
其次對于尋呼的次數,對第一次尋呼,第二次尋呼,第n次尋呼的范圍,都是可以動態(tài)配置,于是運營商可以根據現網的情況進行尋呼參數的修正,從而在終端用戶的尋呼體驗和網絡資源的消耗上找到適合的平衡點。
對于不同服務等級的用戶(比如金銀銅牌用戶),通常是網絡側分配不同的接入帶寬和QoS參數,但是尋呼的范圍也會直接影響到相關業(yè)務體驗,因此尋呼的范圍大小的確定還可以參考EPC承載的QCI參數(此QCI參數表明了用戶使用業(yè)務的相關QoS特性參數),于是用戶在業(yè)務體驗的各個方面都和其服務等級相匹配,同時也確保網絡資源向高等級業(yè)務的傾斜,在網絡忙時降低對低等級業(yè)務的資源消耗,從而降低忙時的設備負荷。
3. 減少位置更新的信令消息
LTE中位置信息可以用Tracking Area來表示,它的概念類似于電路域中的Location Area,但它的覆蓋范圍比較小。如果按照23G的思路,當終端進入到新的位置區(qū)域時就發(fā)起位置更新消息,那么在LTE中相應的位置更新消息就太多了。因此,3GPP國際標準組織引入了TA list的功能,MME發(fā)送一個Tracking Area的列表給終端,終端記錄下列表中所有的Tracking area,只要它位于列表中任何一個Tracking Area,都不會發(fā)送位置更新消息,只有終端到了列表外的的Tracking area時,才會發(fā)起位置更新(Tracking area update)流程。
如果給用戶分配一個含有很多TA的列表,當然可以大大地減少位置更新的次數,但是也會大致大量的尋呼消息。因此TA list里的Tracking Area要精確地表示終端可能位于的區(qū)域,用戶始終沒有到過的Tracking area盡量不要放在列表中,以防止對這些Tracking area進行無意義的尋呼。因此根據用戶的歷史運動軌跡推導出一個TA列表,既可以減少位置更新消息,從而減少終端和MME之間的信令消息,減少終端電池的消耗,又不會增加今后尋呼的資源開銷。
對于歷史軌跡,我們舉個簡單的例子,有些用戶由于自身需要會做來回的乒乓運動甚至環(huán)形運動。我們需要探測出這種運動規(guī)律,把環(huán)形運動中所經過的TA,即TA(n),TA(n-1),TA(n-2)都列入TA list中,這樣的TA list就能真實地反映出終端運動軌跡,更好地減少終端的位置更新的消息次數。
上海貝爾的MME,SAE-GW設備在國外的大型LTE/EPC網絡中有廣泛的應用,積累了豐富的經驗。
對于MME設備,采用板卡間1:1冗余備份,每對板卡之間再做負荷分擔,盡可能地提高系統(tǒng)安全性。此外還設計了特有的備份服務器,在單局出現故障的情況下,保障了業(yè)務平穩(wěn)地遷移到其他MME上。同時智能尋呼策略,動態(tài)TA list生成策略可以減少信令消息,降低信令風暴的沖擊。
對于SAE-GW設備,采用十分穩(wěn)定的7750路由平臺,板卡間也是采用1:1冗余備份,每對板卡之間做負荷分擔,系統(tǒng)安全性比N+1備份高出很多。在北美成功商用的SAE-GW地理冗余方案,讓整體系統(tǒng)更加地安全可靠,從容應對大網絡的挑戰(zhàn)。
作者:柳晶 上海貝爾股份有限公司