Kim jest data scientist i legendarny jednorożec?

kim jest data scientist

Nie tak dawno temu na placu zabaw…

– Tato co robisz w pracy? Czy też się tak dobrze bawisz jak ja w przedszkolu i moja siostra Otylka w żłobku? – zapytała mnie starsza córka Jagoda.

– Bawię się równie dobrze jak Ty. Zajmuję się data science, czyli jestem tak zwanym naukowcem danych. Obecnie sprawdzamy z zespołem czy możemy wyczarować z magicznej kuli czy klient będzie spłacał kredyt czy nie. Robimy to jedynie na podstawie danych pozyskanych z innych banków, które udostępnili nam klienci  –  odpowiedziałem. Podrapałem się po głowie, gdy zobaczyłem zakłopotanie Jagody. Nie wiedziała o co mi chodzi, więc spróbowałem jeszcze raz.

– Możesz wyobrazić sobie Kochanie, że jestem kucharzem prowadzącym bardzo specyficzną restaurację. Dlaczego specyficzną? Bo nie mam żadnego menu i zawsze wszystko dostosowuję pod gusta moich gości. A muszę przyznać, że przychodzą do mnie najróżniejsi klienci – uśmiechnąłem się przypominając sobie jak różnorodne czasami są moje zadania.

Jedni mówią bardzo konkretnie czego oczekują, np. średnio wysmażoną tylną nóżkę z króliczka z sosem grzybowym i ostrą papryczką Habanero. Takim mogę tylko doradzić, aby niektórych rzeczy nie łączyli i nie próbowali – czasami posłuchają a czasami nie. Człowiek niestety częściej uczy się na swoich błędach niż cudzych. Najczęściej bywają tacy, którzy mówią np. „chciałbym mięsko z kurczaczka”. Wtedy największą sztuką jest odpowiednio przygotować dodatki, by całość sprawiła im niezwykłe doznania, których nie zapomną na długo i z przyjemnością wrócą po więcej. Niestety najrzadziej przychodzą klienci, którzy mówią do mnie „Nie wiem co chcę. Zaskocz mnie”. I to jest najprzyjemniejsze uczucie, kiedy mogę podać im rzeczy, które bardzo dobrze znają, ale w odsłonie jakiej jeszcze nie widzieli.

– Aha. Rozumiem – uśmiechnęła się Jagoda – więc sprawiasz innym przyjemność podając im to, na co mają ochotę. Brzmi bardzo prosto.

– Większość osób myśli, że to jest takie proste. Niestety nikt nie widzi całej pracy włożonej w to przedsięwzięcie Księżniczko. Aby wszystko przygotować i aby było smaczne trzeba wielu setek godzin nauki. Nawet nie wiesz ile razy próbowałem zrobić idealne jajko w koszulce lub pierś z kaczuszki zanim zaczęły mi wychodzić. Jest mnóstwo metod obróbki warzyw czy mięska i warto poznać większość z nich, aby móc je wykorzystać. Warto też czasami odejść od dobrze znanych schematów by spróbować czegoś całkiem nowego – przetarłem rękawem spływający po czole pot.

Dodatkowo pamiętajmy, że cały proces zaczyna się od poznania wszystkich dostawców jedzenia (pozyskanie danych). Czasami niektóre półprodukty na pierwszy rzut oka mogą wydać się niezbyt ciekawe (surowe dane), ale po włożeniu pracy w wymycie, oczyszczenie i wstępną obróbkę (oczyszczanie danych) okazuje się, że trafiliśmy na prawdziwe trufle. Warto poznać większość okolicznych dostawców, bo każdy ma coś unikatowego, nawet jeśli nie jest tego świadom. Potem trzeba z tych elementów wyłuskać najlepsze części (inżynieria cech). Te rzeczy, które są przygotowane na samym początku to najczęściej 60%-80% mojej pracy. Następnie dobieram odpowiednią metodę obróbki mięsa czy warzyw (modelowanie). Zanim podam sam próbuję czy jest takie jakiego oczekiwał mój klient i czy sam zjadłbym to co przygotowałem (walidacja). Cały czas robiąc to wszystko warto mieć kontakt z klientem, rozmawiać i próbować zainteresować swoją pracą opowiadając historie o produktach i metodach. Jeśli to co robimy sprawia nam radość to wystarczy być po prostu naturalnym (storytelling). A na koniec pamiętam też o tym, że najpierw je się oczami, więc staram się przed podaniem dania zadbać o każdy element (wizualizacja). A potem czerpię satysfakcję widząc jak ludziom smakuje, jak zamykają oczy i przenoszą się do innego świata.

– Super tato! Dziękuję za wyjaśnienie. W końcu wiem czym się zajmujesz – uśmiechnęła się Jagódka i pobiegła dalej bawić się z siostrą i innymi dziećmi.

Kim jest data scientist? 

W polskiej wersji słyszałem już wiele określeń: danolog, naukowiec danych, mistrz danych, badacz danych. Jakkolwiek by nie próbować tego określić wszystko wiąże się z jednym – z danymi. Jego głównym celem jest wydobycie jak najwięcej wartości z danych. Jest to osoba, która powinna łączyć w sobie wiedzę z zakresu:

  • Programowania
  • Matematyki i statystyki
  • Znajomości biznesu
Data Scientist kto to

Programowanie rozumiem jako posiadanie umiejętności pozwalających na oprogramowanie mechanizmów rozwiązujących problem, który został przedstawiony. Nie jest ważne w jakim języku dana osoba programuje. Moim zdaniem nie ma lepszego ani gorszego języka. Jeśli jesteś na początku drogi i masz dylemat czy wybrać do nauki R czy Python to równie dobrze możesz rzucić monetą. Przede wszystkim w programowaniu liczy się sposób myślenia i rozwiązywania problemów. Wielu developerów z dużym doświadczeniem, gdyby miało napisać kod w nowym języku, zrobili by to bardzo szybko – wystarczy poznać podstawową składnię.

Z zakresu matematyki przydatne są podstawy statystyki, prawdopodobieństwa, algebry oraz eksploracji danych. Warto wiedzieć na czym polegają metody w uczeniu maszynowym, aby przypadkiem nie zastosować zbyt skomplikowanych algorytmów do prostych problemów i w drugą stronę. Według mnie nie trzeba kończyć studiów matematycznych, aby zdobyć wiedzę z tego zakresu. Jednak z własnego doświadczenia wiem, że bardzo to ułatwia. Studia matematyczne nauczyły mnie rozwiązywania problemów oraz pisania własnych algorytmów. Ale przede wszystkim nauczyły mnie komunikować się z innymi osobami. Z perspektywy czasu przyznaję, że nie byłem orłem. Dałem radę skończyć studia dzięki pomocy innych osób, które miały dla mnie wiele cierpliwości by wytłumaczyć mi różne skomplikowane zagadnienia.

Wiedza biznesowa przez wiele osób jest niedoceniana. Odgrywa ona tak samo ważną rolę jak dwie wcześniejsze. Bez wiedzy na czym firma, w której pracujesz, zarabia pieniądze, jakie ma problemy do rozwiązania, gdzie są dane oraz jak je interpretować, można polec lub niestety przygotować złe rozwiązanie. Dla mnie jest to najważniejszy element. Poprawne zrozumienie biznesu, którym się zajmujemy, pozwala osiągać ponadprzeciętne wyniki. Dzięki zapałowi i większemu zrozumieniu jesteśmy w stanie dobrać lepsze rozwiązania dla wymogów biznesowych a czasami nawet wyprzedzić naszych partnerów biznesowych proponując rozwiązania, o których inni jeszcze nie pomyśleli.

Wszystkie te elementy można porównać do całościowego przygotowywania posiłku.

Kim jest jednorożec?

Do powyższego dodałbym jeszcze jeden zakres kompetencji:

  • Opowiadanie historii

Opowiadanie historii rozumiem dość szeroko: jako umiejętność przedstawienia w ciekawy sposób wyników swojej pracy, zaciekawienia odbiorcy oraz umiejętne zwizualizowanie i proste wytłumaczenie tego, co zrobiliśmy. Pamiętajmy o tym, że wizualizacja to nasz największy przyjaciel. Czasami prosty wykres potrafi odpowiedzieć na wiele pytań i wyjaśnić słuchaczom co warto a czego nie. Możemy wykorzystywać najróżniejsze algorytmy, ale musimy umieć następnie to co przygotowaliśmy sprzedać innym.

Dla mnie najlepszymi data scientistami (legendarnymi jednorożcami 🙂 ) są osoby, które w każdej z wymienionych wyżej dziedzin mają odpowiednie umiejętności oraz wiedzę. Wszystkie elementy są jednakowo ważne w drodze do zostania jednorożcem. 

Mam nadzieję, że wspólnie uda nam się zgłębić tajniki by w głębi serca móc siebie nazwać takimi jednorożcami.

Życzę przyjemnej dalszej drogi,

.

One Comment on “Kim jest data scientist i legendarny jednorożec?”

  1. If you dеsire to іncrease your familiarity only keep visiting
    this site and be updated with the hottest news
    uρdate posteԀ here.

Comments are closed.