数据中心网络如何发展成为无损数据中心网络?
作者:袁冬至
公众号:救命的药
研究方向:数据中心网络
欢迎交流,学习!
数据中心网络如何实现无丢包、低时延、高吞吐的能力?
为解决上述问题,传统原生TCP/IP协议栈网络又遇到哪些问题,急需解决?
0 自己的理解及概括
为了建设高性能数据中心,计算和存储都发展很好,但是网络发展不好。传统TCP/IP网络在数据中心里有2个大问题:1TCP/IP协议栈处理时延大,2 服务器CPU负载高;为了解决这个问题,RoCE技术诞生了。RoCE它的发展过程是远程直接内存访问(RDMA)技术可以解决网络延迟,CPU负载高的问题;RDMA最初用在Infiniband网络中,Infiniband网络里面一切都是专用的,无丢包的无损网络;当RDMA技术应用在以太网中就不行了,因为以太网缺乏完善的丢包保护机制,所以有丢包RDMA就不好用了;为了能用RDMA把原生以太网通过PFC,ECN,DCBX,ETS技术改造成为无丢包的网络;RoCE是基于以太网的RDMA技术。
当然无损网络还有许多其它的问题需要解决,比如:线头阻塞,死锁等!
1 传统TCP/IP网络发展困境
建设高性能数据中心的传统思路,一方面是推动数据中心网络带宽升级进而带动组网架构升级(即10G/40G模型向25G/100G组网模型演进,进而向100G/400G模型演化);另外一方面则是引入基于SDN Telemetry等智能管理技术使数据中心网络实现自动化、智能化运维管理,最终实现数据中心网络“管控析”业务融合升级。
数据中心基础设施三大件:计算、存储和网络。计算和存储技术近些年都有长足的进步。
计算:在CPU基础上,出现了像GPU、TPU等为特定场景、特定业务而生的处理器芯片,计算效率成百上千的提升。
存储:在HDD机械硬盘的基础上,出现了SSD全闪存产品,存取效率也得到质的飞跃。
网络:虽然出现了SD