https://www.youtube.com/watch?
里面提到了Unblanced Hashing的3个Reasons:
1. Elephant Flow
2. Link Failures, Why?
3. Hash Polarization
可能based在MIT一个flowlet paper
- 这个原理不难,多根线路,计算Maximum和Minimum Delay,之差就是一个timeout value;
- 如果后续packet timeout之后到,就不必hash到固定的线路,而是严格Load Balancing.
一个相关的Arista EOS feature - Resilient ECMP
- 说起来很简单,就是一根线路断了,不要re-hashing区别的sessions,这样会teardown TCP. 而是just re-hash 故障线路上的session
- CLI: ip hardware fib ecmp resilience 10.14.2.0/24 capacity 6 redundancy 4
- 解释:
- network 10.14.2.0/24有6个NextHop
- 但是建立一个24 Entries的ECMP
- 如果其中一个NH断了,就把表中这个NH用其他NH替换,其他ECMP NH没有变化
- Redundancy = 4,应该就是一根断了,有4个来LB
No comments:
Post a Comment