V neděli 7. dubna večer na dobu pěti hodin zkolabovala celá internetová síť, kterou v Prostějově spravuje společnost SPRINTEL. Jak známo, kvůli tomuto výpadku nemohl v řádném termínu vyjít ani pondělní PROSTĚJOVSKÝ Večerník, jehož výroba byla kolapsem internetu rovněž postižena. Internet spravovaný firmou Sprintel nefungoval podle informací Večerníku po celém Prostějově, podle projektového manažera společnosti Sprintel Petra Kapounka postihl tento výpadek dokonce celou střední Moravu. Proč? Právě na důvody se Večerník zeptal Petra Kapounka.
* Pane Kapounku, k čemu vlastně v neděli vůbec došlo, že lidem v Prostějově nefungovaly internetové služby, které zajišťuje společnost Sprintel?
„Síť Sprintel je postavena velmi robustně a disponuje kruhovou topologií páteřní sítě s klíčovými uzly ve dvou hlavních pražských datacentrech. Síť je tedy odolná proti výpadku kterékoliv páteřní trasy nebo páteřního prvku. Díky tomu ve chvílích, kdy se na sociálních sítích diskutují masivní výpadky jiných sítí, Sprintel funguje. Bohužel ani sebelépe postavená síť není odolná proti technologickému selhání. V týdnu před výpadkem došlo k obměně části páteřní technologie v rámci příprav na zrychlení sítě na 2x100 Gbit/s. Díky architektuře sítě a promyšlené práci našich specialistů i toto proběhlo bez výpadku a technologie běžela, jak měla.“
* Takže v čem byl tedy problém?
„Bohužel v neděli 7. dubna se začal z některých klientských zařízení z akvizovaných sítí, to znamená převzatých sítí od jiných firem, šířit škodlivý provoz. Později se ukázalo, že příčinou byl patrně virus na určitých typech klientských routerů. Nově instalovaná americká a velmi drahá technologie však nezvládla kombinaci tohoto problému a některých pokročilejších funkcí. Přitom podle specifikací mělo zařízení mít obrovskou výkonovou rezervu. Jde podle nás jednoznačně o chybu výrobce a s tímto výrobcem věc intenzivně řešíme. Bohužel se tato chyba projevila na obou páteřních uzlech a poprvé po mnoha letech tak došlo ke kompletnímu výpadku.“
„Ani sebemodernější technologii nelze věřit,“
říká ke kolapsu internetové sítě v Prostějově Petr Kapounek
* Pane Kapounku, k čemu vlastně v neděli vůbec došlo, že lidem v Prostějově nefungovaly internetové služby, které zajišťuje společnost Sprintel?
„Síť Sprintel je postavena velmi robustně a disponuje kruhovou topologií páteřní sítě s klíčovými uzly ve dvou hlavních pražských datacentrech. Síť je tedy odolná proti výpadku kterékoliv páteřní trasy nebo páteřního prvku. Díky tomu ve chvílích, kdy se na sociálních sítích diskutují masivní výpadky jiných sítí, Sprintel funguje. Bohužel ani sebelépe postavená síť není odolná proti technologickému selhání. V týdnu před výpadkem došlo k obměně části páteřní technologie v rámci příprav na zrychlení sítě na 2x100 Gbit/s. Díky architektuře sítě a promyšlené práci našich specialistů i toto proběhlo bez výpadku a technologie běžela, jak měla.“
* Takže v čem byl tedy problém?
„Bohužel v neděli 7. dubna se začal z některých klientských zařízení z akvizovaných sítí, to znamená převzatých sítí od jiných firem, šířit škodlivý provoz. Později se ukázalo, že příčinou byl patrně virus na určitých typech klientských routerů. Nově instalovaná americká a velmi drahá technologie však nezvládla kombinaci tohoto problému a některých pokročilejších funkcí. Přitom podle specifikací mělo zařízení mít obrovskou výkonovou rezervu. Jde podle nás jednoznačně o chybu výrobce a s tímto výrobcem věc intenzivně řešíme. Bohužel se tato chyba projevila na obou páteřních uzlech a poprvé po mnoha letech tak došlo ke kompletnímu výpadku.“
* Po jakou dobu nefungoval internet a jsou už nyní všechny problémy odstraněny?
„Úplný výpadek trval v neděli zhruba 5 hodin. Během této doby na problému pracoval nejen náš tým, ale i lidé od výrobce a dodavatele. V pondělí pak ještě docházelo ke kratším výpadkům v dílčích částech sítě během ladění náhradní technologie. Provoz je nyní překlopen přes jiné prvky, aby se problém nemohl opakovat. Tyto prvky mají samozřejmě dostatečnou kapacitní rezervu a jsou odzkoušené.“
* Kolika lidí se výpadek internetu týkal? A šlo čistě jen o Prostějov?
„Výpadek se dotkl celé sítě, která pokrývá střední Moravu. Počet klientů nebudeme uvádět.“
* Dá se podobným problémům vůbec předcházet?
„Dá se pouze snižovat riziko. Avšak ani sebelepším testováním prvků takovému problému nelze zcela předejít, zejména proto, že tento typ problémů se projevuje až při reálné zátěži skutečným provozem, jenž nejde nasimulovat. Nyní pracujeme na opatřeních k dalšímu navýšení redundance sítě a pokračujeme v kapacitním upgrade, abychom mohli dalších mnoho let fungovat bez výpadku. Ze situace si přinášíme ponaučení, že ani sebemodernější technologii nelze věřit a je třeba mít předem připraveno více způsobů havarijního zálohování.“