Bonjour,

On en a causé sur l'IRC, le sujet a été abordé sur NANOG, mais
bizarrement, on a rien vu passer ici.

Que c'est il passé vendredi 27 de 11h15 à 12h30 ?

Ce qu'on a vu :
- Free a été coupé du monde pendant 30 à 45 minutes
- On m'a rapporté la même chose sur OVH et Renater
- Un creux de 100Gbps a été constaté sur les stats de l'AMS-IX
(quelqu'un a le screenshot ?)

Ce qui s'en est dit :
- Le RIPE a testé des annonces particulières qui auraient levé un bug
dans certaines implémentations de BGP
- Les principaux routeurs touchés sont des cisco
- Le facteur déclenchant serait la présence de confédérations BGP
(mouais, pas tant que ça après lecture de l'explication officielle)




Plus en détail :

L'anomalie est la présence d'un attribut BGP expérimental (numéro 99).

D'après les explications du RIPE :

The experimental attribute was part of an experiment conducted in
collaboration with a group from Duke University. This involved
announcing a large (3000 bytes) optional transitive attribute, using a
modified version of Quagga. The attribute used type code 99. The data
consisted of zeros. We used the prefix 93.175.144.0/24 for this and
announced from AS 12654 on AMS-IX, NL-IX and GN-IX to all our peers.

Reports from affected ISPs showed that the length of the attribute in
the attribute header, as seen by their routers, was not correct. The
header stated 233 bytes and the actual data in their samples was 237
bytes. This caused some routers to drop the session with the peer that
announced the route.


La bonne pratique dans ce cas aurait été d'ignorer l'attribut en
question, ce qu'ont fait la plupart des implémentations, mais d'autres
ont préféré faire un shutdown de la session relayant cette annonce.



Du coup, ça crée quelques questions :

- Le RIPE peut foutre la merde, ça on savait. Mais visiblement, un peu
de poudre verte dans un paquet et tous les cisco du globe se mettent à
tousser. Vu l'impact d'une "petite expérimentation", est ce qu'on peut
faire confiance à des implémentations aussi fragiles ?

- Quelles implémentations ont été touchées, et s'agit il bien du même
bug partout ? Lesquelles se braquent (en shutdown direct), et lesquelles
ont des comportements plus "subtils" ?

- Question subsidiaire, pourquoi donc n'y a t il pas encore eu de thread
ici même ? Les retours de vacances ?

-- 
Jérôme Nicolle

Attachment: signature.asc
Description: OpenPGP digital signature

Répondre à