Przejdź do treści

Od analityka danych do data scientist (moja historia)!

– Tato, czy Ty od zawsze robiłeś w pracy to, co teraz? – zapytała Jagódka.

– Nie Księżniczko. Dopiero od jakichś 3 lat.

– Tzy lata. Ja mam tzy latka – powiedziała Otylka.

– Czyli robiłeś coś całkiem innego wcześniej? – dopytywała Jagódka.

– Hmm… w sumie podobne rzeczy, tylko korzystałem z innych umiejętności – odpowiedziałem.

– A jak to się zaczęło?

– Siadajcie wygodnie, to Wam opowiem…

Wiele razy pytano mnie o to, jak zaczęła się moja przygoda ze sztuczną inteligencją i uczeniem maszynowym i jak zdobyłem zawód jako data scientist. Chętnie podzielę się swoją historią. Przyznam od razu, że pewnie będzie całkiem inna od tych, które znasz. Dlaczego? Sam się zaraz przekonasz.

Dawno, dawno temu…

Wszystko zaczęło się jakieś 16 lat temu… Mając 18 lat musiałem zdecydować, jaki przedmiot chcę zdawać na maturze i na jakie studia pójść. Nie będę niczego ukrywał – jestem duuużym leniem. Będąc w liceum zauważyłem, że najłatwiejszym przedmiotem dla mnie była matematyka –  musiałem w jej naukę wkładać tylko minimum pracy, aby mieć bardzo dobre wyniki. Jakoś wydawało mi się wtedy, że liczby mnie lubią. Niestety tylko mi się wydawało…

Mój wybór padł na studia matematyczne na Politechnice Wrocławskiej. Dlaczego Wrocław? Mieszkałem wtedy w Zielonej Górze, więc Wrocław był wystarczająco daleko, by rodzice mnie nie nachodzili i wystarczająco blisko, bym mógł co tydzień lub dwa wracać do domku po obiadki (i ewentualnie kasiorkę). Niestety idąc na studia nie miałem pomysłu, co będę po nich robił. Wtedy moim jedynym planem było odpoczywanie przez kolejnych 5 lat i zaznanie w pełni życia studenckiego. Przyjechałem do Wrocławia i …

… zaczęła się weryfikacja moich wyobrażeń o studiowaniu na PWr. Nie miałem pojęcia, że ta cała matematyka jest tak skomplikowana. Na prawie każdych zajęciach mój mózg wybuchał i nie rozumiałem prawie 75% z tego, o czym mówili wykładowcy. Żona mnie ostrzega, abym nigdy nie pokazywał swojego indeksu dzieciom. Miałem 13 dwójek, czyli niezaliczonych przedmiotów!

Na szczęście byłem cwaniakiem, więc nie zaliczałem tylko tego, co nie blokowało przejścia na kolejny rok.  Na najtrudniejszych zajęciach starałem się zgłaszać do zadań przy tablicy zdobywając dodatkowe punkty i prześlizgując się na trójach. Rozwiązania miałem od innych osób lub z wyższych roczników😄 – przecież sam bym nie wymyślił tak mądrych rzeczy. Po dwóch latach było nas już niecałe 40 osób ze 120. Czułem się najgłupszy na roku. Pewnie dlatego, że naprawdę były tam „mózgi”. Na szczęście te przysłowiowe „mózgi” okazały się naprawdę wspaniałymi ludzi. Do dzisiaj uważam, że tylko dzięki nim skończyłem studia. Dlaczego? Ponieważ potrafili znaleźć czas, aby tłumaczyć mi wiele skomplikowanych zagadnień.

Pierwsza praca

Sporo znajomych na czwartym roku studiów pracowało w różnych miejscach. Pomyślałem, że będąc już na trzecim chciałbym zacząć zarabiać. Jednym z ciekawych miejsc we Wrocławiu, gdzie chętnie witali studentów matematyki w tamtych czasach, był ówczesny Bank Zachodni WBK. Z przyjemnością umówiłem się na rozmowę kwalifikacyjną. Byłem tak zestresowany, że niewiele z niej pamiętam.

Pamiętam jedynie, że gdy mnie zapytano o największą wadę, to bez wahania odpowiedziałem, że jestem największym leniem! Możesz sobie wyobrazić, jakie było zdziwienie osób mnie rekrutujących. Za tą odpowiedź otrzymałem gratulacje za szczerość. Zazwyczaj otrzymywali odpowiedzi w stylu „za dużo od siebie wymagam„, albo „myślę, że moją słabą stroną jest dokładność”. Niestety nie dostałem się na praktyki, bo usłyszałem, że to za wcześnie i odezwą się za rok. Więc wyszedłem z banku i będąc wówczas na wrocławskim rynku znalazłem pracę w pobliskiej … Pizza Hut🙂(nigdy bym nie powiedział, że będą później nazywać mnie data scientist).

Minął rok i … niespodziewanie zadzwonił telefon. Pamiętali o mnie w BZ WBK! Skontaktowano się ze mną z pytaniem, czy dalej chcę odbyć praktyki w banku. Oczywiście, że chciałem :). Szczególnie że w tym okresie pracę w Banku Zachodnim rozpoczęło kilka osób z mojego roku.

Dzięki tym zdarzeniom jestem związany z bankowością od kilkunastu lat😄 (kilka lat temu BZ WBK został kupiony przez Santander i nastąpił rebranding).

Analizy, analizy, analizy

Przez pierwszych 10 lat pracy byłem analitykiem. Najczęściej co 2 – 3 lata zmieniałem całkowicie działkę, aby za bardzo się nie znudzić.

Swoją karierę rozpocząłem od typowego zarządzania ryzykiem. Miałem zbudować model szacujący ryzyko kredytowe klienta, czyli określić prawdopodobieństwo czy ktoś spłaci kredyt, czy nie w ciągu najbliższego roku. Polegało to na tym, że dostałem Excela, w którym miałem klikać według procedur i szukać najfajniejszych charakterystyk (cech) różnicujących klientów. Och, z perspektywy czasu aż wstyd mi za to, że tak do tego podszedłem. Później nabierałem krzepy zdobywając czarny pas w SQL, Excelu i programowaniu VBA w celu automatyzacji swojej pracy (lubiłem automatyzować, bo jestem leniem!).

I tak mijały kolejne lata. Można powiedzieć, że potrafiłem wyciągnąć z danych to, o co byłem proszony. Poznałem pełną ścieżkę klienta – od analiz CRMowych do kogo kierować ofertę kredytową, jakie konkretne produkty dawać, jakim kanałem kierować ofertę i o której godzinie, po kwoty kredytu (zdolność kredytowa) i reguły odrzutu (komu nie). Nawet zajmowałem się procesem windykacyjnym, czyli do kogo warto dzwonić i z nim rozmawiać, a od kogo nie odzyskamy pieniędzy i lepiej sprzedać wierzytelności firmie windykacyjnej. Czarny pras w zakresie znajomości danych dla bankowości detalicznej osiągnięty!

Level up, czyli twórca procesu

W związku z tym, że  miałem pełną wiedzę z zakresu całego procesu kredytowego przedzielono mi zadanie stworzenia nowego procesu w banku. Zaprojektowałem go od początku do końca wywracając wszystko, co było do tamtej pory do góry nogami. Jak? Zacząłem od wysłania zapytania o tak zwany raport kredytowy do Biura Informacji Kredytowej (BIK), by móc na wstępie oszacować zdolność kredytową klienta.

Projekt trwał rok. Największą nagrodą było dla mnie to, że doradcy w oddziałach pokochali mój tzw. symulator kredytowy. Po tym sukcesie wziąłem udział w stworzeniu podobnego procesu, ale dla klientów MŚP w bankowości internetowej. Nie kryję, że kolejny podobny projekt (tylko inny segment klientów i kanał) nie był już dla mnie wyzwaniem i zacząłem się nudzić.  I wtedy…

Ekspert Data Scientist

… w banku powstał nowy obszar – Business Intelligence.  Miałem wówczas 33 lata. Dostałem propozycję przejścia do nowego obszaru. Przyznam, że na początku miałem wątpliwości. Ale wtedy przypomniałem sobie, co często powtarzała moja babcia Ola:

LEKCJA 1: nigdy nie jest za późno na zmiany.

Więc zdecydowałem się podjąć to wyzwanie. Niestety nic to dla mnie nie zmieniło, ponieważ nadal brałem udział w projekcie budowania kolejnego procesu kredytowego. Dodatkowo pracowałem w innej lokalizacji we Wrocławiu siedząc z testerami i deweloperami z dala od mojego nowego obszaru.

Na szczęście los chciał, że pewnego dnia odwiedziłem nowy dział, aby poznać ludzi w nim pracujących.

I jakie było moje zdziwienie, gdy spotkałem ludzi w wieku 24-25 lat, którzy mówili w niezrozumiałym dla mnie języku. Mówili o sieciach neuronowych, wzmocnieniu gradientowym, optymalizacji baysowskiej… O co chodzi? Ja byłem ekspertem… Ekspert Data Scientist niby od uczenia maszynowego, który kojarzy jedynie regresję liniową i logistyczną wykorzystywaną kilka lat temu do prostych modeli.

Chwilkę walczyłem  z myślami, czy podejmować to wyzwanie, czy nie. Postanowiłem powalczyć. Przy okazji mój przypadek pokazuje, że zajmowane stanowisko nie jest jednoznaczne z posiadanymi umiejętnościami z pewnego zakresu. Ostatnio często widzę trend nazywania „data scientist” osób, które nie do końca znają nawet podstawy uczenia maszynowego. Każda firma inaczej rozumie to pojęcie i warto mieć tego świadomość.

Python vs R

Wracając do historii… Rzuciłem się do czytania o tym, od czego zacząć i co robić. Najważniejszym elementem był wybór programowania. W literaturze pojawiały się głównie dwa języki: Python oraz R. No cóż – każdy data scientist powinien znać któryś z tych dwóch języków. Widziałem mnóstwo dyskusji, gdzie ludzie rzucali się sobie do gardeł prezentując wyższość jednego języka nad drugim. Nie umiałem wybrać „lepszego”, więc zdecydować miał los. Python – reszka, R – orzeł. Rzut monetą.

Wypadła reszka. Z perspektywy czasu zauważyłem, że jeśli chcesz się rozwijać w dziedzinie data science, to język programowania nie ma znaczenia. Liczy się umiejętność łączenia faktów, dociekliwość i chęć szukania odpowiedzi. Jestem pewien, że gdyby wypadł orzeł i zacząłbym uczyć się języka R to miałbym tę samą wiedzę. Natomiast coraz częściej zauważam, że język Python znacznie ułatwia mi implementację rozwiązań na serwerach banku.

Kursy internetowe

Moją przygodę z uczeniem maszynowym zacząłem staroświecko, czyli od czytania książek. I tak poznawałem powolutku tajniki data science. Niestety teoria od praktyki różni się sporo. Dlatego zacząłem robić najróżniejsze darmowe kursy internetowe. Poznałem platformę Kaggle, kursy na Udemy, Datacamp oraz Courserze. Zauważyłem, że jest to ciekawy sposób nauki, który mi odpowiada. Jednak mimo zapału, nauka nie szła tak szybko jakbym się spodziewał.

Pierwszy płatny kurs

W tym samym czasie zacząłem słuchać podcastów i trafiłem na „Biznes myśli” prowadzony przez Vladimira. Okazało się, że Vladimir rusza ze swoim pierwszym kursem o uczeniu maszynowym. Troszkę się obawiałem wydawania pieniędzy na coś, czego nie znałem. Nigdy wcześniej nie wykupiłem żadnego kursu online (dla przypomnienia to była to końcówka 2017 pre-covid🙂). W końcu pomyślałem, że co mi szkodzi. Zawsze mogłem poprosić o zwrot pieniędzy. A wówczas byłem ekspertem data scientist, który znał… jedynie regresję logistyczną. Bardziej ośmieszyć się nie mogłem. Naprawdę byłem pewien, że nic nie ryzykuję.

Przyznam, że świetnie trafiłem. Spodziewałem się jakichś notatek, suchych materiałów. Zamiast tego dostałem super nagrane filmy, które prowadziły mnie krok po kroku, notebooki, cotygodniowe webinary, kanał slack z możliwością zadawania pytań itp. itd.

Od tego czasu przekonałem się do kursów internetowych tworzonych przez osoby mające bardzo dobre opinie i które mogę wcześniej poznać poprzez materiały, którymi się dzielą. Dodatkowo dużym motywatorem było dla mnie to, że na kurs wydałem własne pieniądze, dzięki czemu zaangażowałem się na 101%.

LEKCJA 2 – Dawaj z siebie 1 % więcej!

Kurs wymagał ode mnie systematyczności. Trwał on 8 tygodni i zawierał jeden materiał do przerobienia na każdy dzień tygodnia. Z perspektywy czasu przyznam, że była to jedna z ważniejszych lekcji w moim zawodowym życiu. Dlaczego? Bo po 8 tygodniach kursu nawyk codziennej wieczornej pracy został już ze mną na stałe.

Od tego czasu, jak moje dzieci pójdą spać, siadam przy komputerze i czytam nowe artykuły, opisy metod, o problemach lub dzielę się z Tobą tym, czego się nauczyłem. Przynajmniej w ten sposób mogę w jakiś sposób zrewanżować się światu za ogrom szczęścia, jaki spotkał mnie w życiu.

Pierwsze projekty

Z olbrzymim zapałem wystartowałem do pierwszych projektów data science i uczenia maszynowego. Jednym z nich była próba oszacowania dochodu klienta na podstawie lokalizacji.

Prostą sprawą jest oszacowanie dochodu na podstawie wpływów na konto, ale co z nowymi klientami, którzy nie mają historii w banku? Jeżdżąc po Wrocławiu byłem przekonanym, że są osiedla w stylu „na pewno każdy, kto tu mieszka zarabia nie mniej niż 5k„. I z taką myślą podjąłem się wcześniej wspomnianego zadania jako coraz pewniejszy swoich umiejętności data scientist.

Popełniłem niestety kilka błędów przy łączeniu danych. Niby model na próbie testowej miał 90% mocy accurancy, ale na zbiorze walidacyjnym… 54%. Niewiele więcej niż rzut monetą. Z perspektywy czasu to zadanie wydaje się prawie niewykonalne. Wystarczy pomyśleć o kamienicach, gdzie mieszkają ludzie zarabiający 10k+ oraz np. emeryci, którzy ledwo wiążą koniec z końcem.

Niestety miałem kilka projektów z rzędu, gdzie nic nie wchodziło.

LEKCJA 3 – nie poddawaj się i rób swoje! Nie bój się popełniać błędów…jeśli się czegoś na nich uczysz!

Na szczęście miałem i mam w pracy bardzo dobrych szefów. Wszyscy wyznają zasadę „każdy może raz się pomylić” i mają świadomość, że połowa projektów kończy się niepowodzeniem. Co nie zmienia faktu, że wewnętrzne ego mocno bolało.

Dzielenie się wiedzą

Potem przyszły pierwsze sukcesy. Robienie prostszych rzeczy (na przykład lepsze wersje wcześniejszych modeli przy wykorzystaniu nowszych algotymów) okazało się bardzo przyjemnym doświadczeniem. Dzięki temu mogłem zgłębić działanie poszczególnych metod i je przetestować. A mając sukcesy jako zespół warto było się nimi dzielić z innymi, aby mogli podążyć naszą ścieżką.

W ten sposób odkryłem, że najwięcej się uczyłem ucząc innych. I dokładnie dlatego narodziła się idea bloga miroslawmamczur.pl. Ponadto chciałem jak najszybciej dogonić innych w pracy. Dlatego, aby usystematyzować wiedzę zacząłem opisywać rzeczy, które poznaję jako data scientist.

LEKCJA 4: Dziel się wiedzą!

Muszę przyznać, że na samym początku strasznie się bałem ocen innych – jak odbiorą moje artykuły, czy będą je krytykować. Teraz już wiem, że obawy były bezpodstawne. Nauczyłem się, że nawet jeśli ktoś mnie krytykuje to poświęcił swój cenny czas na przeczytanie moich myśli, a następnie przemyślał, co mógłbym poprawić. Teraz staram się krytykę odbierać w pozytywny sposób, choć początki były trudne. No cóż… to tak jak z jazdą na rowerze. Po prostu trzeba się przyzwyczaić🙂

Otaczaj się fajnymi ludźmi

Na samym końcu chciałem dać Ci jeszcze jedną radę. Otaczaj się ludźmi, którzy dzielą się swoją pasją, mają mnóstwo energii do działania i tę energię roztaczają wokół siebie. Pamiętam, że jak wokół mnie były osoby wiecznie na wszystko narzekające, to rzeczywiście odechciewało mi się dawać z siebie więcej.

LEKCJA 5: Jeśli chcesz dojść gdzieś szybko idź sam, a jak daleko to z innymi.

Życzę Ci z całego serducha, abyś miał w swoim otoczeniu samych pozytywnych ludzi i abyś dbał o te relacje. Na pewno to zaprocentuje w Twoim życiu.

Mam nadzieję, że z tej historii wyciągniesz coś dla siebie.

Pozdrawiam serdecznie,

podpis Mirek

Image by Jim Semonik from Pixabay

11 komentarzy do “Od analityka danych do data scientist (moja historia)!”

  1. Pingback: Czym jest przetwarzanie języka naturalnego (NLP)? I jak zacząć? - Mirosław Mamczur

  2. Hej Mirku,

    Bardzo fajny wpis. Miło było przeczytać twoją historię od analityka danych do data scientist.
    Na pewno chętnie przeczytam twój następny wpis o tym czym się zajmuje data scientist.

    Czy data scientist znajduje zatrudnienie tylko w bankowości czy też są inne branże gdzie takich ludzi potrzebują?

    Pozdrawiam 👋.

  3. Bardzo fajny wpis! Może napisałbyś w którymś kolejnym wpisie jak krok po kroku wygląda opisywane powyżej tworzenie procesu w banku (nie podając nazwy banku, rzecz jasna), dlaczego musiałeś wszystko wywrócić do góry nogami itd.

    1. Hej Dawid!

      Już tłumaczę co wywróciliśmy do góry nogami, bo to nie tajemnica.
      W 2015 składanie wniosku w oddziale polegało to na tym, że najpierw doradca zbierał wszystkie dane od klienta (dochód, informacje o majątku, informacje o kredytach itp. itd.) Potem doradca wszystko wklepywał do komputera, a następnie wysyłał pytanie o raport BIK (Biuro Informacji Kredytowej). W oparciu o to po kilkunastu minutach wyliczała się zdolność kredytowa + scoring czy dostanie klient kredyt, czy nie.
      To, co zrobiliśmy, to wzięliśmy raporty BIK na początek + proste algorytmy szacujące parametry potrzebne do zdolności jak dochód czy liczbę osób na utrzymaniu. Więc po kilku kliknięciach doradca widział rzeczywistą zdolność + scoring. Doradca mógł prosto suwaczkami zmieniać parametry i od razu rozmawiał o konkretach, a klient znał decyzję w ciągu minutki 🙂 Potem wszystkie te dane zautomatyzowaliśmy by wpisały się w szablon wniosku co był (takie dzisiejsze RPA ;P)

      Dzisiaj sporo banków ma takie rozwiązania w aplikacjach mobilnych, więc to żadna nowość czy tajemnica w dzisiejszych czasach :D.

      Pozdrawiam serdecznie,
      Mirek

  4. Bardzo inspirująca historia i niezwykle przydatne rady 🙂 To chyba taka złota piątka, którą w pełni się zgadzam.

  5. Uwielbiam matematykę. Lubię jako naukę – za uporządkowanie, za logiczność, za kreatywność (szczególnie po porządnej szkole jaką są matematyczne metody fizyki i akcjach typu „prostowanie nieskończonych walców” jakie tam odchodziły).
    „Żona mnie ostrzega, abym nigdy nie pokazywał swojego indeksu dzieciom.” – z tej miłości mojej mam po 3 semestrach matematyki na WFiTJ („WF i takie jakieś” == Wydział Fizyki i Technik Jądrowych na AGH) 9 ocen z egzaminów. W tym trzy trójki 😉

Możliwość komentowania została wyłączona.

Spodobało Ci się? Udostępnij ten post w social mediach! ❤️❤️❤️