23rd mars 2019

Perte sur les liens de niveau 2

Nous constatons de nombreuses pertes sur plusieurs liens clients. Le diagnostic est en cours

20190323 11h30 : Un LAG entre PE03-CIV et CORE03-CIV semble la source, nous avons réalisé un reload de l'interco, cela semble stable au moins pour une partie des clients. Nous continuons nos vérifications

20190323 11h48 : Nous avons identifié un autre souci sur PE02-CGT, le trafic est également contournée. Nous continuons nos investigations mais il ne semble plus y avoir d'impact client

20190323 12h07 : Après avoir dévié le trafic, nous avons rebooté la carte incriminée et nous allons remettre un peu de trafic dessus pour voir si cela a un impact

20190323 12h11 : Nous avons de nouveau de la perte, nous désactivons la carte et planifions son changement (sans impact).

20190323 14h30 : Nous avions encore quelques collectes impactées ce qui nous a permis de localiser une 3ème source d'erreur : SYSTEM:MAC FIFO full condition recovery sur CORE01-CIV, un reboot de la carte concerné a permis d'effacer tous les soucis restants. Nous prenons contact avec le constructeur (cet équipement est bien au dernier train de code stable de cette version). La carte incriminée à 12h11 ne semble plus en cause, c'était un effet de bord de ce problème. Nous l'avons remise en service