1/11/2019

Unbalanced Hashing vs DLB vs RECMP

Broadcom introduced Dynamic Load Balancing in Trident 3 product. 

https://www.youtube.com/watch?v=1y25OTyFFrs


里面提到了Unblanced Hashing的3个Reasons:

1. Elephant Flow
2. Link Failures, Why?
3. Hash Polarization 

可能based在MIT一个flowlet paper


  • 这个原理不难,多根线路,计算Maximum和Minimum Delay,之差就是一个timeout value;
  • 如果后续packet timeout之后到,就不必hash到固定的线路,而是严格Load Balancing. 

一个相关的Arista EOS feature - Resilient ECMP
  • 说起来很简单,就是一根线路断了,不要re-hashing区别的sessions,这样会teardown TCP. 而是just re-hash 故障线路上的session
  • CLI: ip hardware fib ecmp resilience 10.14.2.0/24 capacity 6 redundancy 4
  • 解释:
    • network 10.14.2.0/24有6个NextHop
    • 但是建立一个24 Entries的ECMP
    • 如果其中一个NH断了,就把表中这个NH用其他NH替换,其他ECMP NH没有变化
    • Redundancy = 4,应该就是一根断了,有4个来LB

No comments:

Post a Comment