Cred c-am scris de vreo 3 ori articolul ăsta în diverse forme. Asta-i a 4-a și (sper eu) definitivă. Dacă nu, vom incrementa numerele întâlnite anterior :D. Și tot așa.
Bine, să-i dăm drumul.
Cateodata meseria asta iti ofera cate-o caruta de frustrari dintr-un foc. Si pentru ca ma tot cearta Bogdan ca nu-i frumos sa dam nume in public o sa incerc sa-i “ascund” cumva.
Sa prezentam protagonistii acestei povestiri adevarate:
Subiectul principal al poveștii (eu fiind doar un umil IT-ist chinuit) este un device. Să-i zicem “appliance” cum îi zice la carte. Este un “appliance” care se ocupă de e-mail-uri. Filtrare, anti-spam, anti-virus, e-mail gateway și alte chestii de genul ăsta. Hai să zicem că-l cheamă Steelslot și că până în 2007 a fost bine merci pe piața iar cam pe undeva pe la mijlocul anului respectiv compania care producea jucăriile astea a fost achiziționată de un gigant al lumii IT care-i cunoscut pentru plăcerea de-a cumpăra toate prostiile prezente pe piață (de fapt majoritatea fac la fel). Gigantului respectiv să-i zicem Cheese Co. În povestea noastră vom întâlni 2 astfel de appliance-uri. Să-i zicem A1 primului (un model nițel mai vechi) și A2 celui de-al doilea. De fapt appliance-uri e destul de mult zis. Sunt niște servere (să le zicem Hell) asupra cărora au fost operate câteva mici modificări cum ar fi astuparea intrării de monitor și înlocuirea bănuțului rotund cu marca de pe masca din față cu un altul pe care era trecut SteelSlot.
Ca subiecți secundari avem mai multe personaje/instituții/jucării. Mai întâi și întâi vă prezentăm “băieții de la IT”. Aici voi fi și eu cu un rol nițel mai important decât al celorlalții băieți de la IT. Nu că ei ar fi mai prejos ci doar din cauză că eu m-am enervat mai mult și am jucat un rol central și constant în toată istoria asta.
Mai avem clientul. Un client măricel. Oameni respectabili, fără prea mari legături cu IT-ul și care se bazează de obicei pe opinia noastră ca ofertanți de servicii. Unde “noastră” e firma la care trudim nu opinia personală. Doar cu toții știm că opinia personală nu prea are loc într-o colectivitate strânsă unde deciziile sunt luate unanim.
Urmează firma la care trudim. Nimic nou de adăugat aici.
În cele din urmă avem intermediarul. Firma/organizația de la care achiziționăm obiectul principal al povestirii noastre. Firmă a cărei principal scop este să-l vândă. Nu de alta da-i scump săracul.
Buun, acum să stabilim cadrul poveștii noastre. Înainte de asta aș aprecia dacă cititorii mei s-ar abține de la remarci de genul “ah, păi de ce n-ați făcut așa ?”. Toate alegerile luate au avut motivația lor foarte bine cântărită înainte.
În locația clientului aveam instalate 2 servere de mail pe care rula MS Exchange. Primul din ele stătea/stă în domeniu iar al doilea în DMZ pe post de gateway. Cel din domeniu are licență, are tot ce-i trebuie. Cel din DMZ avea (la momentul 0 al poveștii noastre) licența expirată de 2-3 zile. Evident, probleme destul de măricele cu spam-ul.
În momentul respectiv firma noastră a propus ca soluție posibilă jucăria de mai sus. Noi teoretic am instala orice. Nu de alta dar e fun să faci asta. Dar practic am fi preferat ceva cunoscut, ceva cu care să ne simțim confortabil atunci când îl instalăm. N-a fost bai mai ales că persoana cu decizia ne-a argumentat că “practic se instalează singur”. Nu c-aș fi pus botul având în vedere afinitatea persoanei respective pentru marketing dar m-a făcut cel puțin curios.
Așadar, în primă fază, urma să primim de la intermediar un device în teste pentru 2-3 săptămâni. Urmând ca ulterior să luăm decizia finală. Cu Exchange-ul din DMZ fără licență și cu un ochi rapid aruncat pe device și pe ce știe să facă am hotârât să-l băgam direct în producție. Prin urmare m-am apucat să-l configurez. Ocazie cu care am descoperit următoarele. În primul rând chiar se instala aproape singur. Îți trebuie doar câteva cunoștințe legate de terminologie și dacă nu ai un handicap mental sever te poți descurca relativ bine. Adică-l poți face funcțional. Ceea ce-am și făcut. A doua chestie descoperită a fost o gălăgie de loguri și rapoarte de sistem de pe device. Ale celor care avuseseră înainte device-ul respectiv. Că deh, era jucăria care se plimba în teste. Ocazie cu care-am remarcat și cam cât rahat mânca nenea care l-a adus și care zicea că s-a plimbat prin tot Bucureștiul. Draci, mai trecuse pe la 2 companii în ultimele 6-7 luni. Oricum, logurile și rapoartele de sistem m-au făcut să scap vreo 2 vorbe apropos de inteligența ascuțită a IT-istului care-a lăsat alea acolo să le vadă tot poporul și să scap și un hohot de râs. Hohot de râs care-mi va ieși pe nas undeva pe la finalul acestei istorisiri.
Odată instalat în producție echipamentul a început să-și facă treaba destul de binișor. Nu l-am frecat prea rău preferând să nu-i enervăm mai mult decât era necesar pe clienți. Și-a stat așa aproape 3 săptămâni. Până când a venit jucăria definitivă și un model mai nou. Ä‚sta avea pe el și Cheese Co ca să ne facă să ne udăm în chiloței de bucurie și fericire numai la gândul că vom sta în siguranță cu toate cele.
L-am configurat la fel de rapid ca și pe celălalt (se putea configura și c-o mână la spate și un deget în nas). Și într-o zi cu downtime anunțat și cu 2 dimineți am plecat spre client ca să-l scoatem pe cel vechi și să-l băgăm pe cel nou acolo unde-i era locul. Și-aici au început dezastrele naturale. Primul dintr-o serie lungă și neplăcută a fost faptul că nu puteam să-l băgam din rack din cauză că rack-ul nostru a pățit o buba și e nițel strâmb. Iar șina lui e cu câțiva milimetri prea scurtă și din cauza bubei nu o putem prinde de rack. Așa că l-am lăsat de-a-mpulea pe undeva cocoțat pe rack. Înjurând bineînțeles numai la gândul că va trebui să schimbam rack-ul și să extragem din el tot mormanul de servere și de UPS-uri.
După ce i-am dat drumul să meargă și l-am testat cu o serie de mail-uri ca să ne convingem că merge am zis să-l iau pe cel vechi și să-l șterg cum se cuvine că nu-i frumos să dăm din casă să vadă alțiii. Colegul meu tocmai mai descoperise o bubă cu un hdd pe unul din serverele din domeniu așa că m-am apucat singurel de operațiunea asta. Operațiune care, credeam eu, va fi extrem de rapidă și simplu de făcut.
Așadar m-am înfipt în jucărie cu un cablu de rețea și am dat un “restore to factory defaults” și reboot. Acum nu știu ce impresie aveți voi da’ eu când aud “factory defaults” mă gândesc la “curat cum a ieșit pe poarta uzinei de fabricat jucării scumpe pentru admini idioți” (eu fiind adminul în cazul acesta). După ce-a bootat (ca orice server care se respectă îi ia pe puțin 3-4 minute) am dat să arunc un ochi pe el. Ei na belea că ca să arunci un ochi trebuie neaparat să treci printr-un wizard de configurare din care NU ai cum să ieși. Asta via web că prin consolă m-a mâncat să dau un ? și nu prea am găsit nici o logică la modul în care sunt organizate setările disponibile/posibile. L-am configurat minim și așa am descoperit că Cheese Co are o cu totul altă impresie despre “factory defaults”. “Factory defaults” șterge doar fișierul de configurare și ATÂT. Nimic altceva. Rapoarte, loguri, toate erau acolo. Deja începeam să-l înțeleg pe amărâtul care lăsase astea pe device. Naibii, nu trebuia decât să te bazezi pe bun simț și să iei “factory defaults” ca atare.
Accesul la loguri se face doar via ftp. Așa că am intrat frumușel prin ftp și-am dat să radă tot ce era pe acolo. A ras toate logurile dar rapoartele (face o serie de rapoarte automate) nu le-a șters. Cică n-am drepturi. Pe contul de admin. Intru în interfața web (unde am acces și la rapoarte) și observ că mi le înșiră pe toate, le pot vedea și descărca (sunt în format pdf) dar nu am opțiunea de-a le șterge. Mă uit pe jucăria mai nouă din producție și observ că în versiunea respectivă de OS am posibilitatea de-a le bifa și de-a le șterge. Buuun. Purced spre un system upgrade din lipsă de alte opțiuni. Aveam pe device versiunea 6.3.0 și posibilitatea de-a face upgrade la două versiuni superioare, 6.3.1 și 6.3.2 (sau ceva de genul ăsta) în timp ce pe mașina nouă aveam 6.4.5. Am făcut la cea mai nouă posibilă. Upgrade-ul a durat cam 30-45 de minute timp în care deja ajunsesem la capătul răbdării. După upgrade, aceeași poveste. Într-o doară mă mai duc odată la system upgrade. Surpriză, alte 2 versiuni disponibile. Să zicem 6.3.3 și 6.3.4 (chiar nu contează prea mult). Iar, aleg versiunea cea mai nouă pentru upgrade. Alte 40 de minute. Făcut un ceai, halit ceva junk food. După upgrade, credeți sau nu, același lucru. Opțiunea de-a bifa și șterge rapoartele nu exista și pace. Plin de draci mă mai duc odată la system upgrade. De data asta văd un upgrade la o versiune mult mai apropiată decât cea de pe fratele cel mare, 6.4.2 (să zicem). Zic hai să mai stau odată să facă un upgrade că poate de data asta scap. Și stau. La final, în sfârșit aveam mult doritele “check” buttons care-mi permiteau selecția rapoartelor și ștergerea lor. Am ras iar tot de pe el, am mai dat odată factory defaults și l-am rebootat. După reboot, fript și cu iaurt zic “hai să mai intru să verific odată”. Știam lecția cu config-ul minimal așa că n-am mai înjurat atât de colorat de data asta. Dupa config, într-adevăr în rapoarte era curat. Dar îmi scapă ochii pe prima pagină unde este afișat un soi de status cu niște statistici ale device-ului din ultimele zile (până la 30 de zile). Printre informațiile prezente acolo și una care ne ustura destul de rău. O listă cu aproximativ toate adresele de mail ale clientului. Aproximativ 100. Nu-i chiar genul de informație care ți-ai dori să scape într-o perioadă în care lumea dă bani pe baze de date cu adrese de mail. Mai arunc un ochi și prin consolă și pe ftp. Absolut nimic altceva de șters. M-am uitat prin toate cotloanele lui virtuale. Nimic. Nu știu de unde-și ia datele respective dar știu sigur că nu pot scăpa atât de ușor de ele. Device-ul trebuie înapoiat intermediarului și n-am vrea să-l dăm în starea asta. Nici 30 de zile nu putem aștepta ca informațiile respective să fie perimate. Așa că momentan mi-am băgat picioarele și-am plecat acasă. Am lăsat vorbă unui alt coleg despre toată tărășenia și i-am zis să nu cumva să-l predăm așa înapoi. La cât am râs de săracul admin care-a lăsat înaintea mea log-uri și rapoarte acum mi-a ieșit pe nas cu totul.
Două zile fast-forward (timp în care am citit mai mult sau mai puțin atent toată documentația de pe manuale și cd-ul cu care-a venit jucăria). Dacă Cheese Co are un site în care poți găsi informații cuprinzătoare despre aproape toate metodele și posibilitățile de configurare ale echipamentelor lor, partea cu SteelSlot ăsta stă foarte prost. Nu găsești aproape nimic despre el. Toate-s ținute sub cheie/parolă/lacăte și păzite cu dragoni. După două zile eram la fel de prost da’ cu câteva idei noi. Idei mai mult venite prin forțe proprii decât cu ajutorul manualului.
Inclusiv o idee creață de tot. Cum rapoartele respective sunt doar pe termen de 30 de zile (ultimele 30 de zile) m-am gândit să dau ceasul înainte, să rebootez, să șterg din nou TOT de pe el, să rebootez iar, să dau ceasul înapoi, să rebootez înc-o dată și să văd ce și cum. Draci. Informațiile tot acolo. Selectabile, numai bine/bune de copiat și de pus într-un excel. Deja încep să mă gândesc la electromagneți și la proceduri care implică hdd-uri wiped. Sau înfipt bine-n părțile dorsale ale unui reprezentant de vânzări/specialist în marketing care tot lăuda jucăria. Într-un final n-am ce face și mă apuc să încerc cu mânuța toate comenzile din CLI. Alegerile logice făcute cu manualul și cu help-ul în față le-am făcut de mult. Undeva bine ascunsă era și-o comandă de deletedb. De fapt un soi de sub-comandă a unei alte comenzi. Atât de bine ascunsă încât nici nu apărea prin manuale. Cumva tind să cred că respectiva comandă a ajuns în sistemul de operare în urma unor probleme fix de genul ăsta. Și-a ajuns recent.
Morala ? Nu știu. Nu puneți botu’ la scule care amenință că fac ele toată treaba. Sau dacă puneți botu’ fiți siguri că aveți pe cine să dați vina. Sau dacă n-aveți pe cine să dați vina înarmați-vă cu răbdare, tutun, cafea și câteva ciocane mari cu mânerul lung. O să vă fie mai ușor.
“Cheese Co” e de retinut :)
Referitor la patanie in sine, te inteleg perfect, am patit o chestie similara cu un feature care a mers as advertised doar intre versiunile x.y.z si x.y.(z+t) al software-ului/firmware-ului. Chestii de genul asta m-au facut sa migrez spre medii cat mai OSS-based. Nu ca nu se intampla, dar stii ca la o adica se rezolva cu cafea + vi, fara ‘jde telefoane la suport.
Ah, nu-i bai. Și jucăria asta e (cică) bazată pe freebsd. Și am impresia că folosește qmail. Deci nu-i departe de oss. Da’ e atât de bine izolată partea aia frumoasă care te lasă să faci cam ce vrei tu încât devine frustrant de administrat.
Fix de aia ziceam și eu că-i pentru admini proști și leneși. Nu de alta’ da un alt motiv pentru care să izolezi în halul ăsta un sistem de operare nu văd.
Jucându-mă în ultima vreme și cu parte de servăraie pe Windows am descoperit că nu-s tocmai tâmpiți. Pe lângă partea de administrare simplă (cam ca în exemplul de mai sus) ai și destul background unde te poți întinde și te lasă să faci și prostii în voie dacă ții neapărat.
Și ca ultimă remarcă, documentația e sfântă. Documentația online este și mai sfântă. Cred că pot să număr pe degetele de la o mână momentele în care-am căutat ceva pe google și n-am găsit (în domeniul ăsta).
Cumva una din firmele pe unde mai trecuse era si Aviva ? ;))
Hai să-i zicem Abiba ca nu-i frumos….
Vo’ 2 zile (si nopti) m-am chinuit sa aflu cine-i SteelSlot. Nu mai puteam sa dorm noaptea ca nu stiam cine-s astia (Cheese Co. am descifrat usor).
Iar Win. server (cel putin ultimele) nu-s chiar proaste (ca tot ziceai in comentariu de win) . Ca nu degeaba cam 60% din servere sunt win.