Desole pour le retard de la reponse dans ce thread.

On Thu, Jun 27, 2019 at 5:50 AM Michel Py <
mic...@arneill-py.sacramento.ca.us> wrote:

>
> Désolé de le dire, et sans excuser Verizon qui n'avaient pas les
> précautions de base en place, c'est de la récupération politique. C'est pas
> Verizon qui a merdé. Même si c'est vrai qu'en tant que T1 ils devraient
> avoir filtré le bordel, le principe de la patate chaude et de la confiance
> qu'on a quand on accepte une session eBGP avec quelqu'un d'autre sont
> toujours la base du fonctionnement de la DFZ.


Une regle en accidentologie c'est que plus l'accident est important, plus
il y a de causes (root causes) qui s'additionnent pour l'expliquer. C'est
vrai en aviation, c'est vrai dans le nucleaire, etc. Ce leak n'echappe pas
a la regle. Il n'y a pas 1 root cause, ou 1 responsable, mais de multiples:

- un BGP optimiseur, sans no-export 👎
- un ISP qui redistribue les routes "optimisees" a ses clients 👎
- un client qui redistribue a son upstream 👎
- un upstream qui accepte et redistribue 👎
- des Tier1 "complices" puisque la plupart on aussi accepte les routes de
Verizon 👎 - felicitations a NTT et AT&T pour ne pas etre tombe dans le
panneau

Si on cumule tout ca, ca fait un incident global. Tu enleves une seule de
ces root causes et l'incident soit ne se produit pas du tout, soit il est
fortement reduit dans son impact.

Est-ce qu'on frappe plus fort sur Verizon sur notre blog ? Oui. 2 raisons a
cela:
- impossibilite totale de les joindre
- c'est un Tier1, donc leur responsabilite envers la qualite des routes
fournies sur Internet est bien plus importante que pour DQE
- DQE a repondu a notre appel telephonique, et a corrige en live.

En passant, pour ceux qui en doutent, il n'y a pas que Cloudflare qui a ete
impacte, loin de la. Voici des stats Cedexis pendant l'incident. Vous voyez
AWS ?



Jérome Fleury, j'ai lu ton blog. Le pire, c'est que tu as changé qui
> l'avait écrit pour Tom Strickx. Tu crois qu'on avait pas vu çà venir ?
>

> C'est carrément craintos. Le lien au-dessus, c'était signé par Jérome
> Fleury il y a 24 heures.
> Je ne suis pas le seul à voir remarqué. C'est vraiment nul à chier.
>

Je ne sais pas quoi repondre a ca. What the fuck ? Tom Strickx, de l'equipe
reseau de Cloudflare a Londres, qui a participe a la resolution de
l'incident, a ecrit ce blog entierement de sa plume. Je n'ai pas ecrit ce
post.

Je peux confirmer que j'ai valide l'integralite de ce qu'il a ecrit avant
sa publication.

---------------------------
Liste de diffusion du FRnOG
http://www.frnog.org/

Répondre à