Go to content

Co robi junior data scientist? Wywiad z Magdaleną Cebulą

Gamitlab|30 sierpnia 2021
  • Co robi i powinien umieć junior data scientist?
  • Jak to jest być kobietą w „męskiej branży”?
  • Czy data scientist jest jak jednorożec?

Na te i inne pytania odpowiada Magdalena Cebula, junior data scientist w firmie Aviva i autorka kanału „Niesztuczna inteligencja” na YouTube.

*********************************************************************************************************************

Dlaczego zdecydowałaś się na wybór kariery w data science i jak wyglądała twoja droga do niej?

Byłam w technikum informatycznym, chciałam być wtedy programistką. Jakoś tak wyszło, że po technikum poszłam na studia (też informatyczne) i nie wiedziałam, czym dokładnie chcę się zająć. Miałam natomiast plan, czego na pewno nie chcę robić…

Co to było?

Front-end. W ogóle nie chciałam się zajmować front-endem i do dzisiaj podziwiam osoby, które robią strony internetowe. Totalnie nie mam do tego wyczucia ani cierpliwości (śmiech). Co ciekawe, na studiach nie do końca polubiłam się z bazami danych i statystyką, które są de facto podstawą data science. Ale później, kiedy stwierdziłam, że chcę wejść na ścieżkę data scientista, zobaczyłam, że wykorzystuje się to w praktyce i moje podejście się zmieniło. Natomiast generalnie chciałam być programistką. Nie wiedziałam dokładnie czego, więc pierwszej pracy szukałam na zasadzie „chciałabym coś programować”. Wtedy dostałam pracę z SAP-em, czyli wielkimi systemami dla wielkich korporacji. Niezbyt się polubiłam z tym systemem, ale w międzyczasie miałam możliwość udziału w pierwszym projekcie data science, który wprawdzie nie został wdrożony produkcyjnie, natomiast rozpalił moją ciekawość. W tym momencie stwierdziłam „kurczę, tak, to jest to, czym chciałabym się zajmować”. Zaczęłam przerabiać różne kursy dotyczące data science. W międzyczasie pojawiło się Data Workshop – wyzwanie uczenia maszynowego, no i warszawska grupa, którą zgodziłam się prowadzić. Później nastąpiło dalsze szukanie pracy: najpierw jako specjalista ds. walidacji modeli, no i już w zeszłym roku jako junior data scientist w firmie Aviva.

„Co ciekawe, na studiach nie do końca polubiłam się z bazami danych i statystyką, które są de facto podstawą data science. Ale później, kiedy stwierdziłam, że chcę wejść na ścieżkę data scientista, zobaczyłam, że wykorzystuje się to w praktyce i moje podejście się zmieniło.”

Magdalena Cebula

Opowiesz nam o swoich pierwszych dniach w pracy? Czy wejście na zupełnie nowe stanowisko to był dla ciebie szok?

Najtrudniejsze było to, że zaczynałam w lipcu ubiegłego roku, czyli w środku pandemii. Dziwnie było zdzwaniać się zdalnie, ale mój zespół był bardzo fajny. Na początku się spotkaliśmy, a moje pierwsze zadania były ukierunkowane na to żebym poznała ludzi, z którymi będę pracować, nasze systemy, to, jakie mamy dane i jak je przetwarzamy. Najdziwniej było przyjść pierwszego dnia, poznać parę osób, później dwa dni pracować zdalnie, a następnie znowu przyjść i poznać kolejne parę osób.

Z jakich programów i języków programowania korzystasz w pracy?

Oczywiście Python i R. Wykorzystujemy oba te języki w różnym stopniu. Do tych języków frameworki webowe takie jak Shiny i Dash, żeby zrobić wizualizację. Tworzymy aplikacje dla biznesu, więc żeby ładnie je wystawić biznesowi, tworzymy proste stronki właśnie w takim szajniaku czy w Dash-u. Z takich ciekawych technologii jest też Neo4j i bazy grafowe. To było coś, co rzeczywiście mnie zdziwiło. Kiedy na studiach miałam przedmiot z teorii grafów i sieci, to nie sądziłam, że ktoś to wykorzystuje w praktyce (śmiech). A tu się okazuje, że kurczę, bazy grafowe to całkiem potężne narzędzie. No i oczywiście SQL.

Całkiem sporo programów!

Tak, ale nie wszystko jest na raz wykorzystywane. Kiedy gdzieś czegoś potrzeba albo coś łatwiej jest zrobić w innej technologii, to wtedy wybiera się te najlepsze rzeczy.”Kiedy na studiach miałam przedmiot z teorii grafów i sieci, to nie sądziłam, że ktoś to wykorzystuje w praktyce.”

data science junior magdalena cebula
Magdalena prowadzi na YouTube kanał „nieSZTUCZNA INTELIGENCJA” poświęcony data science

Z tego co mówisz wynika, że zajmujesz się wieloma sprawami. Jak wygląda Twój typowy dzień pracy jako data scientist?

To zależy od zadania. Jakoś z rana zdzwaniamy się, żeby omówić bieżące sprawy. Najczęściej jest to jakaś analiza danych, kodowanie, spotkania… W sumie tutaj nie ma reguły, ale przeskakuję między tymi trzema zadaniami.

Które aspekty tej pracy są twoimi ulubionymi, a które nie do końca ci się podobają?

Lubię analizy biznesowe. Lubię poznawać, czego ten biznes od nas chce, zrozumieć go. To takie bardzo namacalne, kiedy damy biznesowi konkretną odpowiedź i wiemy, że zrobią z tym coś fajnego i wiem, że moja praca zostanie wykorzystana. Lubię też tworzyć modele. To są dwie takie najważniejsze rzeczy. Jeśli chodzi o rzeczy, które nie do końca lubię, to chyba tworzenie tych stron internetowych (śmiech). Ale na szczęście nie mam tego dużo. Natomiast to, co mnie zdziwiło, to to, że data science to nie zawsze jest machine learning. Ponieważ zawsze, jak zaczynamy przerabiać kursy, to tam bardzo często po Pythonie, R czy statystyce wchodzi od razu ML. I można odnieść wrażenie, że jeżeli mamy stanowisko związane z data science, to musi być machine learning. A tu okazuje się, że niekoniecznie. Jest też masa innych modeli, innych rozwiązań, niekoniecznie machine learningowych, które są wykorzystywane. Więc to mnie bardzo zdziwiło, bo w sumie byłam nastawiona na to, że będę mieć głównie ML, natomiast w praktyce zajmuję się też innymi rzeczami. Machine learning jest ciekawy i nie mam z nim problemu. Natomiast jeśli ktoś chciałby zajmować się stricte machine learningiem czy deep learningiem, to musi zwrócić uwagę na stanowiska, na które aplikuje. Może się okazać, że będzie data scientistem, a w ogóle nie będzie miał machine learningu.

Czyli jak widać są różne opcje i nie jesteśmy skazani na machine learning, wybierając karierę w data science?

Dokładnie. Każdy może znaleźć coś dla siebie. Tylko na początku trzeba dopytać się, co dokładnie będzie się na danym stanowisku robić.

„Lubię analizy biznesowe. Lubię poznawać, czego ten biznes od nas chce, zrozumieć go. To takie bardzo namacalne, kiedy damy biznesowi konkretną odpowiedź i wiemy, że zrobią z tym coś fajnego i wiem, że moja praca zostanie wykorzystana.”

Magdalena Cebula

Interesuje cię praca jako junior data scientist? Sprawdź nasz bootcamp data science:

https://gamitlab.com/szkolenie/program-rozwojowy-data-scientist-data-science-od-podstaw/

To teraz pytanie z trochę innej beczki. Z badań rynku pracy wynika, że około 33% osób pracujących w Polsce jako junior data scientist to kobiety. Jak odnajdujesz się w branży zdominowanej przez mężczyzn i czy poleciłabyś naszym czytelniczkom karierę w data science?

Jeżeli kogoś interesuje data science, to generalnie polecam. W sumie to nie czuję, żeby to „męskie środowisko” różniło się bardzo od typowo „damskiego”. Co ciekawe, u mnie w zespole, jest teraz na przykład większość kobiet. Być może to wynika z tego, że pracuję w ubezpieczeniach. W sumie od szkoły średniej miałam zawsze przewagę mężczyzn, czy to w klasie, czy w grupie na studiach. Natomiast generalnie podchodzę do tego na zasadzie „człowiek do człowieka”. Jeśli chcemy się dogadać, to praktycznie ze wszystkimi się dogadamy. Przynajmniej z moich doświadczeń wynika, że jesteśmy dorosłymi ludźmi i raczej nikt nam nie będzie robił jakichś problemów ze względu na płeć. Wiadomo, że mogą się pojawić pojedyncze przypadki, natomiast to będzie działało w obie strony. Mi się generalnie bardzo fajnie pracuje i nie czuję żadnych negatywnych konsekwencji tego, że jako kobieta jestem w mniejszości. Jeżeli ktoś chce się tym zająć, to nie ma żadnych przeciwwskazań. Trzeba się tylko nastawić na naukę, wytrwałość i ciągły rozwój.

Bardzo optymistyczne wnioski!

Tak wynika z moich doświadczeń. Studia pierwszego stopnia robiłam na WAT i tam też nie spotkałam się z żadną dyskryminacją, czego można by się było spodziewać po uczelni wojskowej. Nie przypominam sobie żadnej tego typu sytuacji zarówno ze strony wykładowców, jak i kolegów. Miałam jednego kolegę, który potrafił być niemiły, ale on był niemiły dla 90% osób (śmiech), więc nie brałam tego do siebie. Więc tak jak mówiłam, przypadki się zdarzają, ale generalnie na płeć nikt nie patrzy.

Niedawno zdecydowałaś się otworzyć swój kanał na YouTube poświęcony data science. Skąd pomysł na taki projekt?

Sam pomysł kanału chodził mi po głowie 2-3 lata. Na początku nie miałam pomysłu, o czym mogę mówić. W zeszłym roku wykrystalizowało mi się, że skoro analiza danych mnie kręci, to może coś w ten deseń. Miałam też rozkminy, czy dam radę, czy się nie zniechęcę, czy będę to robić… Osobą, dzięki której ten kanał powstał jest mój brat, który uczy się montażu. Powiedział, że może mi montować filmy. I pomyślałam „kurczę, skoro będę miała kogoś, kto mi w tym pomoże, to dobra, nie mam więcej wymówek” (śmiech), bo montaż to było coś, czym niekoniecznie chciałam się zajmować. No i w ten sposób stwierdziłam „dobra, zacznijmy w takim razie od jakichś lżejszych tematów, żeby tak sobie trochę pogadać i zobaczyć, jak to będzie”. Jak na razie na kanale są cztery filmy, będą kolejne. Więc generalnie się kręci i zobaczymy, co dalej.

W jednym z Twoich filmów wspomniałaś, że data scientist jest jak jednorożec. Możesz wytłumaczyć, co to dokładnie oznacza?

Geneza jest taka, że udostępniałam na LinkedInie ofertę pracy do nas do zespołu. Pojawił się tam komentarz, że w sumie to szukamy jednorożca; że chcemy osobę, która ma jakieś ogromne umiejętności – tu biznes, tu jakaś analiza, tu programowanie… W każdym razie było to tak opisane, że rzeczywiście miało się wrażenie, że szukamy człowieka jednego na milion (śmiech). Stąd właśnie wzięła się moja rozkmina, czy rzeczywiście tak jest i ten data scientist to jest taka bardzo wyjątkowa osoba, która ma jakieś niezwykłe umiejętności, najlepiej ze trzy doktoraty i tak dalej. W końcu mówi się na niego „naukowiec danych”, więc pewnie siedzi sobie w białym fartuchu w laboratorium (śmiech). Natomiast chciałam odczarować ten temat i data scientiści to są normalni ludzie. Jest trochę programowania, trochę analizy danych, jest zrozumienie biznesu. Nie sztuką jest sobie wsadzić dane do modelu i popatrzeć „o fajnie, coś nam wychodzi”, tylko też trzeba wiedzieć, co te dane oznaczają i czy to, co nam wychodzi ma sens. Więc być może tutaj jest element bycia jednorożcem. Natomiast wydaje mi się, że jest tak samo jak w IT: żeby tworzyć dobre systemy, trzeba rozumieć co biznes robi. Bo możemy sobie robić jakieś przekazywanie wiadomości, a gdzieś tam nie uchwycimy dokładnie tego, czego ludzie od nas potrzebowali. Więc generalnie uważam, że data scientist nie jest jednorożcem. Jasne, trafią się ludzie, którzy mają trzy doktoraty, wielkie umiejętności i 20 lat doświadczenia. Natomiast moim zdaniem każdy, kto chce zostać data scientistem jest w stanie to zrobić przy odpowiedniej ilości pracy.

„Jest trochę programowania, trochę analizy danych, jest zrozumienie biznesu. Nie sztuką jest sobie wsadzić dane do modelu i popatrzeć „o fajnie, coś nam wychodzi”, tylko też trzeba wiedzieć, co te dane oznaczają i czy to, co nam wychodzi ma sens.”

Magdalena Cebula

Jakie są twoje dalsze plany?

Planuję dalej wrzucać filmiki na YouTube. Będę chciała też przeprowadzać wywiady i zobaczymy, jak to się przyjmie. YouTube bardzo mnie wkręcił, bardzo mnie cieszy nagrywanie filmów, więc jest to coś, czym będę się dzielić. Będę też chciała, żeby te filmy były coraz bardziej merytoryczne, tak żeby oprócz moich przemyśleń przekazywać konkretną wiedzę. Jeżeli chodzi o moje dalsze plany to na pewno rozwój. Obecnie kończę studia magisterskie, więc wkrótce będę bronić pracy magisterskiej. Później jakiś doktorat, a co do całej reszty to zobaczymy, co los przyniesie. No i udział w konferencjach i hackatonach. To świetna kopalnia wiedzy i doświadczenia i możliwość poznania ciekawych ludzi. Więc mam nadzieję, że będziemy się mogli spotkać na takich wydarzeniach.

Życzymy powodzenia! Ostatnie pytanie: czy masz jakieś rady dla osób, które chcą rozpocząć karierę w dziedzinie data science?

Po pierwsze, nastawić się na praktykę. Generalnie nie da się nauczyć programowania, analizy danych czy ogólnie data science, nie robiąc tego w praktyce. Po drugie: w szkole miałam takie przekonanie, że najpierw się uczę, a jak się nauczę, to potem będę robić. Otóż tak nie jest (śmiech). Cały czas uczymy się na praktycznych rzeczach, bo wiadomo, że teoria jest konieczna, natomiast nauka jest ciągła. Nie będzie raczej takiego magicznego momentu, że będzie można powiedzieć „ok, to ja już wszystko umiem, od dzisiaj mogę startować na stanowiska związane z data science”. Zawsze będzie coś jeszcze do nauczenia i to jest normalne. Jeżeli na przykład widzimy ofertę, gdzie jest wymienionych dużo różnych rzeczy, to możemy się uczyć po kolei. Nie musimy też spełniać wszystkich wymagań w ofercie. Jeśli spełniamy te 70-80%, to można złożyć. A nuż się uda. Trzeba się nastawić na ciągły rozwój, dużo nauki i na to, żeby nie spocząć na laurach. Nawet jak już znajdziemy tę pierwszą pracę, to później i tak będą kolejne rzeczy do nauczenia.

Bardzo dziękujemy za wywiad i życzymy dalszych sukcesów.

Również dziękuję.

*********************************************************************************************************************

Nasza rozmówczyni

junior-data-scientist-magdalena-cebula

Magdalena Cebula

Magdalena od roku pracuje jako junior data scientist w firmie Aviva. Prowadzi warszawską grupę DataWorkshop, która realizuje projekty data science. Niedawno zaczęła prowadzić na YouTube kanał „Niesztuczna inteligencja” poświęcony tematyce data science:

https://www.youtube.com/channel/UCAHGHpxlzFgarv1iOQe3Zgw

Interesuje cię praca jako junior data scientist? Sprawdź nasz bootcamp data science:

https://gamitlab.com/szkolenie/program-rozwojowy-data-scientist-data-science-od-podstaw/

Autor