[WAR] Awaryjny restart jednego z przełączników – kontynuacja #2.

Znaleziono przyczynę problemu, błędne działanie translacji vlanów na jednym z przełączników.
Sytuacja jest opanowana, jednak zdecydowaliśmy o radykalnych krokach zmierzających do wyeliminowania w WAR nieodpornej na takie błędy przełączników topologi ringu.
W najbliższych dniach rozplanujemy migrację na sprawdzoną w EPIX KAT architekturę dual core + access wraz z hermetyzacją szkieletu.
Będziemy informowali o planowych pracach w tym zakresie.

Awaryjny restart jednego z przełączników – kontynuacja.

Niestety obserwujemy dalsze problemy z jednym z przełączników, trwają prace zmierzające do usunięcia problemu.

Awaryjny restart jednego z przełączników.

W wyniku dzisiejszych przedpołudniowych problemów jeden z przełączników wykazywał niestabilne działanie.
Dokonaliśmy jego restartu, wysłano raport błędu do producenta.

Problemy L2 – zakończenie.

Przyczyną problemu było uszkodzenie jednego z kolokowanych routerów posiadających połączenie z siecią WAR.eFn. Port historycznie nie posiadał skonfigurowanych reguł ochronnych, co spowodowało propagację pętli na przełączniki szkieletowe.
Skorygowano konfigurację, router kliencki został zrestartowany, co przywróciło go do prawidłowego działania.

Przepraszamy za kłopot.

Problemy L2.

Obserwujemy problemy transmisyjne.
Pracujemy nad zlokalizowaniem usterki.

Problemy ze ścieżkami Global.

Otrzymujemy informacje o selektywnych problemach z niektórymi ścieżkami (straty i brak dostępności celów) w sieci globalnej.
Prowadzimy obserwacje u którego z operatorów występują i będziemy podejmowali kroki zaradcze.

Awaria TKT.

Napływają do nas informacje o poważnej awarii TKT w Małopolsce.
Nie owocuje ona problemami po stronie EPIX, natomiast może powodować niedostępność naszych usług na łączach realizowanych dla uczestników przez TKT.

Ważna informacja, możliwe zakłócenia usług – zakończenie.

Prace zostały zakończone bez widocznych zakłóceń, mechanizmy redundancji zadziałały poprawnie.

Ważna informacja, możliwe zakłócenia usług.

Otrzymaliśmy informację o uszkodzeniu jednego z kabli łączących kolokacje 4DC i Jordana.
Wszystkie obwody idące po tym kablu będą przerzucane w ciągu najbliższego czasu na kabel zapasowy.
Mogą występować przerwy przełączeniowe i krótkie zaniki transmisji wynikające z czasu konwergencji naszego szkieletu.

Zmasowane DDOSy – kontynuacja – wymagane działania!

Pomimo naszych informacji wśród naszych użytkowników nadal występują niezabezpieczone systemy.
Obserwujemy zmasowane ataki DDOS, które eliminuje nasz system ochrony, niestety przekłada się to na zmiany tras i czyszczenie tablic BGP.

Cały czas pracujemy nad znalezieniem złotego środka w ustawieniach systemu zapobiegania DDOS.
Przepraszamy.