RDMA網卡在實際環(huán)境中的應用
近些年來,RDMA網卡的技術應用在全球以太網通訊市場上刮起一股旋風,特別是在阿里、騰訊等一些互聯(lián)網巨頭企業(yè)在服務器上大量部署RDMA網卡。2019年,據(jù)官方數(shù)據(jù)報道,天貓雙11當天成交額達到2684億元,訂單創(chuàng)新峰值達到54.4萬筆/秒,單日數(shù)據(jù)處理量達到970PB,這個驚為天人的數(shù)值出現(xiàn),再一次將RDMA網卡的應用推上話題的頂峰。但是很多用戶表示,看著這數(shù)據(jù)很牛逼,但是RDMA網卡到底在實際環(huán)境中是如何應用的,則是表示一臉懵逼。哈哈哈,其實對于RDMA網卡的實際應用,并沒有大家想象中的那么神秘,RDMA網卡的出現(xiàn),實際上是為了解決服務器端數(shù)據(jù)處理延遲而產生的,也就是說,RDMA網卡誕生的使命,就是降低CPU負荷,提高網絡吞吐量,降低網絡延遲。那么,在實際中,RDMA網卡到底是如何應用的,下面,就像小編帶領著大家一層一層揭開RDMA網卡的神秘面紗。提到RDMA網卡,首先就不得不提RDMA是個什么東東?
一、RDMA概念
RDMA(英文全稱:Remote Direct Memory Access),意思是遠程直接內存訪問,這種技術是一種最早應用于高性能計算領域的網絡通訊協(xié)議,目前已在數(shù)據(jù)中心逐漸普及。RDMA允許用戶程序繞過操作系統(tǒng)內核,直接和網卡交互進行網絡通信,從而提供高帶寬和極小時延。所以RDMA網卡的工作原理是,與傳統(tǒng)的TCP/CP網卡相比,RDMA網卡省略了內核(CPU)的參與,所有數(shù)據(jù)的傳輸直接從應用程序到達網卡。
第二、RDMA三種網絡協(xié)議
目前,RDMA大體有Infiniband、RoCE、iWARP三種網絡協(xié)議
1.Infiniband是一種專為RDMA量身定做的網絡協(xié)議,可以從硬件級別上保證數(shù)據(jù)傳輸?shù)目煽啃浴km然InfiniBand技術規(guī)格及標準規(guī)范在2000年正式發(fā)表,但InfiniBand Architecture(IBA)在集群式超級計算機上得到廣泛應用的時間卻是在2005年以后。發(fā)展緩慢的最大原因就是Infiniband要求從L2到L4到需要自己的專用硬件,企業(yè)成本非常高,現(xiàn)在做InfiniBand網絡的廠商主要是Mellanox。
2.RoCE是一個允許在以太網上執(zhí)行RDMA的網絡協(xié)議,很多網友認為RoCE本身的架構是InfiniBand嫁接過來的,因為RoCE較低的網絡標頭是以太網標頭,較高的網絡標頭是InfiniBand標頭。是Mellanox為符合市場需求推出的低成本的InfiniBand網絡。RoCE網絡要求有無損以太網才能實現(xiàn)低延遲運行,也這意味著集成到網絡中的以太網交換機必須支持數(shù)據(jù)中心橋接(DCB)和優(yōu)先流控制(PFC)機制,以此才能維持無損流量,但無損以太網的難點在于,在現(xiàn)代化的企業(yè)環(huán)境中,配置是一個復雜的流程,并且可擴展性會受到很大的局限,不過這對于財力雄厚的企業(yè)來說不是問題。
3.iWARP 是一個允許在TCP上執(zhí)行RDMA的網絡協(xié)議,它的優(yōu)點是能夠運行在當今的標準TCP/IP網絡中,只需要采購支持iWARP的網卡就可以采用RDMA,對于財務預算略低的小企業(yè)來說,尤為適用。但它的缺點就是在性能上略差于RoCE,畢竟一分價錢一分貨,這個道理從古至今一直適用。
第三、RDMA網卡品牌如何選擇
常言道,貨比三家,對于RDMA網卡品牌選擇的同樣適用??v觀全球市場,現(xiàn)在做RDMA網卡的品牌廠商主要有三大巨頭企業(yè),分別是Marvell、intel、Mellanox,其中Marvell是收購的Qlogic品牌。對于Qlogic品牌,相信大家都不陌生,Qlogic一家擁有悠久歷史的專業(yè)提供光纖通道主機適配器(HBAs)、嵌入式光纖通道交換機、堆疊式光纖通道交換機為一體的頂級高速存儲網絡解決方案提供商,它的產品組合一直是全球企業(yè)數(shù)據(jù)中心首選,比如IT行業(yè)中的思科、戴爾、EMC、惠普、IBM、NEC公司等都一直采用QLogic的方案。
話說回來,我們最終應該如何選擇RDMA網卡品牌廠商?且聽我細細給大家分析,Mellanox的Infiniband網絡是RDMA網卡性能最好的代表,可以從硬件傳輸上保證可靠性,但要求整個生態(tài)環(huán)境必須配備專用的硬件,成本昂貴,就這一項,已將絕大多數(shù)數(shù)據(jù)中心企業(yè)排除在門外。剩下的就只有RoCE和iWARP,intel是美國一家主要做CPU處理的公司,其最新的以太網產品系列中部分高速率網卡已支持RDMA性能,但其要求在使用RDMA網卡協(xié)議的時候,需要對相應的硬件進行升級,否則會在一定程度上影響RDMA性能,產品價格也相對較高。Marvell我們前面講過,他是收購的Qlogic品牌,QLogic品牌在光纖通道市場擁有絕對的話語權,全球眾多企業(yè)客戶都采用QLogic的方案,在RDMA上,QLogic有效地做到對RoCE和iWARP不存在任何偏見,客戶能夠在同一個適配器上同時使用RoCE和iWARP協(xié)議,從客戶的立場來說這一點非常重要。
第四、國內首家自主研發(fā)生產RDMA網卡廠商
2019年,深圳市聯(lián)瑞電子有限公司(以下簡稱:LR-LINK聯(lián)瑞)與Marvell達成戰(zhàn)略合作關系,憑借Qlogic在光纖通道的強大實力,打造專供于服務器領域的RDMA網卡。同時,LR-LINK聯(lián)瑞也成為國內第一家自主研發(fā)生產RDMA網卡的廠商。LR-LINK聯(lián)瑞RDMA網卡采用Qlogic主控方案,可支持RoCE、RoCE v2、iWARP功能協(xié)議,與intel X520,X710,XX710主控芯片相比,Qlogic主控方案是業(yè)界唯一可實現(xiàn)通用RDMA技術,并行RoCE和iWARP協(xié)議的10/25GBE網卡。
在性能上具有低延遲,高網絡吞吐量,節(jié)約CPU開銷等優(yōu)異特性,在研發(fā)測試中,實時遷移成本,使用RDMA網卡的CPU占有率是TCP/IP的1/4倍。在國內市場上,LR-LINK聯(lián)瑞目前推出的RDMA網卡主要是雙口/四口萬兆網卡(型號:LRES1004PF-2SFP+,LRES1005PF-4SFP+)。未來,伴隨企業(yè)領域對數(shù)據(jù)中心數(shù)據(jù)處理需求的高速飛漲LR-LINK聯(lián)瑞將向25G、40G,甚至更高速率的RDMA網卡研發(fā)道路發(fā)展,致力為全球客戶提供卓越性能的以太網卡解決方案。