6.6. - ludva po několikatýdenních přípravách zapojil do ostrého provozu nový server Charon. Jedná se o hlavní router, který se společně s Elevem (kde se řídí rychlost a FUPka) zajišťuje náš internet. Bylo to již plánováno dlouho, neboť Zeus toho má na práci víc (všechny ostatní spoje ze serverovny, vč. společně s Jesterem spoj do NFX) a nějak občas nestíhal. Nyní je tedy internet jako takový úplně oddělen. Navzájem si jsou též schopny dělat zálohu, byť ne automatickou.
Bohužel nic není jednoduché tak, jak to vypadá při plánování. Celý itinerář vzal za své již v prvních pár minutách, kdy se povedlo shodit místo jedné síťové karty všechny. A možná proto se pak jak lavina přiřítili další problémy ...
Jako první záhadná ztrátovost na hlavní páteři khnetu - lasery, ceragony, alcoma. Naprosto netušíme proč, a proč se to projevilo až teď - v tom momentě ale nebylo překonfigurováno nic jiného, než ty servery. Všechny spoje končily ve stejných switchích ap. Pokus se zapnutím STP na masarce tomu též nepomohl - místo ztrátovosti padnul switch úplně. Nakonec jsme to identifikovali ve spoji neptun-mars. Což dost rozčiluje, je to Ceragon pomalu za milión, profesionální pojítko. Ani nevíme, jestli za to může přímo on, nebo něco před nebo za ním. Ale odpojení pomohlo.
Druhý problém již byl mezi židlí a klávesnicí. Projevoval se tak, že DNS server na zeusovi většinou nechtěl překládat žádné adresy mimo khnet. Tedy internet fungoval skvěle a správně rychle. Ale "první klik" byl jak ze zpomaleného filmu ... Hledání tohoto problému mi (ludva) sežralo asi pět let mého života a psychicky vyčerpalo na několik dnů dopředu. Nakonec to byl "vedlejší efekt" mé snahy o zkvalitnění provozu. Jelikož spousta členů si neumí, nebo nechce, nastavit torrent klienty (případně jsou zavirovaní a nic s tím nehodlají dělat), je na novém serveru Charon spuštěno hlídání maximálního počtu konexí (spojení) z jedné IP adresy. Nastaveno bylo dost vysoko - 300 pro TCP a 150 pro UDP protokol. No a právě ten UDP to způsobil - tento protokol totiž nefunguje na principu spojení, ale způsobem "vystřel a zapomeň". Tedy jako konexe je myšlena dvojička údajů - zdrojová IP (+port) a cílová IP (+port). A tato konexe nevyprší žádným příkazem "konec" jako u TCP, ale prostě vypršením času kdy se v rámci konexe nepřenesl ani bajt. Tento časový limit je myslím 10 vteřin. Zdá se to málo - ale překlad adres (DNS) funguje právě především po UDP a zeus funguje jako jeden z hlavních serverů - tedy se ptá jiných serverů na internetu pořád. Takže limit 150 konexí vyčerpal prakticky ihned a následně fungovat tedy přestal. Horší je, že hledání tohoto problémů jsem dlouho dobu vůbec tímto směrem necílil - třeba na serveru Kix to funguje už docela dlouho a ke vší spokojenosti. Až na konci mi došlo, že je to ale naprosto logické ... DNS dotazy přes Kixe totiž v podstatě vůbec nejdou, jsou generovány přímo z něj, tedy ten limit se nemohl projevit. Kdežto zeus se ptal přes charona a tam se projevil.
Třetí problém již moc problémem nebyl, jím způsobené výpadky byly očekávané. Řešilo se napájení zařízení v serverovně - a rychlé řešení vyvolal výpadek elektřiny v minulém týdnu. Tedy - zapojili se do provozu dva (staro)nové záložní zdroje, mezi které se rozdělila spotřeba zařízení ve druhém racku - server jester, ceragony pro internet a spoj na mars, access pointy a ostatní spoje, switche. Ono jenom jeden Ceragon si lízne cca 150W a jsou tam dva. V každém případě původní 800VA obyčejná UPSka byla zjevně na hraně, vydržela asi tak minutu ... a jelikož je obyčejná, tak to neumí dát najevo. Nyní tam jsou tedy dvě UPSky, každá o 700VA.
Čtvrtá věc co se v rámci tohoto harakiri dělala bylo přehození třech spojů (oba lasery a ceragon na mars) do nového switche. Jako hlavní důvod je příprava pro přechod hlavní páteře khnetu na čistě switchovaný provoz (řízení pomocí 802.1s - MSTP), tedy se to muselo zapojit do switche který to umí. A jako vedlejší důvod bylo vynechání optických převodníků (optika-ethernet) z trasy laserů - dělalo problémy zjištění že to nefunguje (např. kvůli počasí), neboť nepředávali příznak LINK na switch, což mě děsně rozčilovalo, jelikož to vůbec nebyl laciný šunt. No a jako drobná útěcha se zjistilo, že vypnutí dvou převodníků v napájecí vaně ušetřilo snad 70W spotřeby el. energie. To samé nás čeká ještě v serverovně Kix, ale tam to bude větší sranda - druhý switch už není pomalu kam nacpat.
Jako pátý problém vyskočil šotek z IPv6 protokolu. Vůbec mu nevadilo, že snad půl roku spokojeně a spolehlivě fungoval, včetně toho týdne kdy byl charon na místě a routoval též správně (byť přes něj provoz nešel). Po reorganizaci síťových karet na Zeusovi prostě přestal. To mě stálo dalších pět let života (mimochodem den smrti mám již někde v roce 2020 a každý den práce pro khnet mi ho přibližuje minimálně o dva dny). Problém byl v autokonfiguraci protokolu IPv6. Nastartování podpory protokolu udělá v systému několik věcí. Jedna z nich je vygenerování tzv. linkové adresy na každé síťové kartě. Tato adresa je ze speciálního rozsahu a generovaná na základě MAC adresy síťové karty. Nemá za účel nic jiného, než komunikaci v rámci jednoho ethernetového segmentu, proto linková. A je vymyšlena proto, aby pouhé zapojení počítače do sítě umožnilo komunikaci bez dalšího nastavování. Samozřejmě před "povolením" této adresy je provedena kontrola, zda již na segmentu neexistuje, aby nevznikl konflikt. V takovém případě se dostane do stavu "tentative" a ipv6 po té kartě prostě nefunguje. A tohle byl ten případ - systém si usmyslel, že jak linková, tak globální (ta je již vymyšlena "ručně") prostě existuje. Přitom sprostě kecal ... je to nějaká chybka ve starších (<2.6.28) jádrech linuxu a projevuje se jenom někdy. Tedy by to nebyl khnet, kdyby se neprojevila zrovna v nejméně vhodnou dobu.
Tedy z 1/4 hodiny přehazování serverů a 1/4 hodiny přehazování spojů a elektřiny vznikla práce na 14 hodin a zaměstnala (byť zdaleka ne na celou dobu) tři lidi - ludva, monty a dalicros.
7.6. - v noci přibližně okolo deváté večerní se muselo něco stát na věži žandov, neboť byly shozené jističe na hlavním přívodu. Záložní zdroj došel za hodinu, v deset (i když není řízený, takže přesná doba výpadku se neví). Takže monty s ludvou si udělali noční výlet po kutnohorském okrese, kde dělalo společnost stádo srnek, spousta zajíců a jiné zvířeny (po městské děti vcelku zážitek). Pojistky nalezeny něco málo po jedenácté hodině, nahozeny, všechny spoje tedy funkční. Ještě byla vyměněna UPSka za chytřejší, aby šla nějak řídit a hlídat. Cestou zpět, díky tomu že monty zapomněl zamknout vrátka a museli jsme se vrátit, se k potkané zvířeně připojila ještě rodinka prasátek, maminka s dětičkama. Z toho monty dostal záchvat strachu, měl bobky o své autíčko ...
8.6. - monty s neolkerem pomohli učilišti s montáží spoje mezi dvěma budovami (karlov - rodinka) a odpoledne započali renovaci přístupového bodu stadion. Při té příležitosti se zjistilo, že funguje jenom zázrakem - dva smrky a jeden ořech v cestě. Takže je již domluvená montáž trojnožky o pár metrů vedle.
14.6. - neolker na druhý pokus opravil bod Grusa, který odešel při poslední bouřce. Nejenom, že byla porouchaná i anténa (sektorová v pásmu 5GHz), ale též se někomu povedlo smontovat zařízení blbě ... kablíky do jiných konektorů.
15.6. - monty s neolkerem namontovali a zprovoznili Alcomu na kaňkovský kostel. Bohužel monty týden (nebo dva) předtím nezapojil na straně Baterky alcomu do switche. Takže nám to ještě nejede.
16.6. - neolker dozapojil a dozaměřil Alcomu na baterce směr kostel. Nyní je tedy kaňkovský kostel připojený do sítě kapacitou 88Mbit/s (byť z baterky na zeuse je momentálně pouze 44Mbit, ale to se časem vyřeší).
17.6. - Neolker dnes dodělal upgrade Kostela (Kaňk). A tedy díky 88Mbps páteři je už možno přejít či se nově připojit v pásmu 5GHz, což přináší řadu výhod (rychlost, kvalita, ...) oproti "staré" technologii pracující v (dnes už dost zarušeném) pásmu 2,4GHz. Fotky z montáží naleznete zde a dokonce jsme i natočili video, jak to tam momentálně vypadá, na které se můžete mrknout tady. Také Neolker pokukoval na 4km vzdálené Červené Pečky, které jdou krásně vidět, a když ověří viditelnost i z druhé strany, tak se naše síť brzy nejspíš opět rozroste o další vesničky.
ludva edit: on spíš pokukuje po své přítulkyni
ale je faktem, že v pečkách to jonovi moc nefunguje. Neolker dodatek: Nejen Jonovi, ale i síť "vášbezdrát" má problémy. Navíc narazíš v Č.P. na každý typ antény (od Jirous PAN 10 až po obrovská síta) a taky už máme s Kačenkou cca 4 potencionální zájemce (2 závazně).
Navíc sháníme zájemce, kdo by roznesl letáky po Kaňku, abychom využili upgrade.
20.6. - Pořádali jsme 11. valnou hromadu NFX. Pár fotografií je v galerii. Poděkování patří všem pomocníkům (zvlášť czernobylovi za přednášku o khnetu) i občanskému sdružení Kaňk, které nezištně poskytlo tělocvičnu. A též hospůdce Kréta, která nás živila švédskými stoly a štěnětem Plzně.
23.6. - monty s neolkerem opravili anténu ve zdeslavicích a celý spoj nepoměřice-zdeslavice dozaměřili. Zároveň se pokusili opravit i miletín, ale vzhledem k nedostupnosti klíčů od stodoly se to nepovedlo.
24.6. - neolker s montym zrenovovali rozvody v čp. 107 ulice 17. Listopadu. Již dříve neolker s czernobylem připravili nový rack a přívod el. energie a dnes se to dodělalo. Namontoval se nový switch a hlavně opravili prasečiny v natahaných kabelech (tedy se po různu popotahovali a nastavovali).
25.6. - krátce po poledni vypadnul internet. Naštěstí plánovaně, Sloane přesouvalo náš hlavní spoj na nádraží na jiný stožár. Krátce poté se monty s neolkerem vydali vyměnit wifi kartu do miletína, což se povedlo asi 5 vteřin před začátek bouřky (tento týden asi dvacáté). Mezi tím ludva nahodil doly, které se sekly po výpadku proudu. Po návratu domů se monty s neolkerem vrátili do nepoměřic, aby vyměnili právě odešlý napájecí zdroj a namontovali UPSku, kterou čmoud slíbil, ale nenamontoval. Cestou zpět opravili jeden ze spojů do křečovic.
28.6. - dopoledne si Monty udělal výlet na Obilu, kde opět vypadl elektrický proud.
29.6. - monty s neolkerem dopoledne zrenovovali kabeláž v čp. 105 panelnetu KIX a nainstalovali nový switch.