Go to content

Jak zostać Data Scientist? Przewodnik po Data Science dla początkujących

Gamitlab|16 marca 2021

Firmy z całego świata od zawsze zbierały i analizowały dane dotyczące swoich konsumentów, aby poprawić jakość usług i zwiększyć zwrot z inwestycji. Obszar data science skupia się na pozyskiwaniu użytecznych informacji z pochodzących z różnych źródeł danych. W dzisiejszym, cyfrowym świecie, nieustannie pozyskiwane są ogromne ilości danych. Aby uzyskać z nich korzyści, niezbędne są innowacyjne metody przetwarzania oraz odpowiednie oprogramowanie. W tej ciągle rozwijającej się dziedzinie istnieje znaczne zapotrzebowanie na specjalistów z odpowiednimi umiejętnościami, którzy potrafią dostarczać rozwiązania dla firm opartych na wykorzystaniu danych i pomagać im zdobywać przewagę konkurencyjną. Osoby zainteresowane rozpoczęciem przygody z data science często nie wiedzą do końca, jak dokładnie wygląda kariera w dziedzinie analizy danych i jakie warunki zastaną na rynku pracy. Jeśli jesteś jedną z nich, poniżej znajdziesz odpowiedzi na pytania często zadawane przez osoby zainteresowane rozwojem kariery jako data scientist.

Jakiego rodzaju specjaliści są poszukiwani przez wiodące firmy?

Istnieje ogromne zapotrzebowanie na specjalistów, którzy są w stanie zrozumieć biznesowe potrzeby firmy, a następnie stworzyć i wdrożyć stosowne rozwiązanie oparte na danych. Większość dzisiejszych firm woli zatrudniać kandydatów o wyspecjalizowanym zestawie umiejętności niż osoby znające się na wszystkim po trochu. Osoby pracujące jako data scientist powinny skupić się na wybranym obszarze, takim jak etykietowanie danych, uczenie maszynowe, modelowanie statystyczne czy obliczenia równoległe, i stać się w nim ekspertami. W przypadku osób specjalizujących się w sztucznej inteligencji najbardziej poszukiwanymi umiejętnościami są AI w aplikacjach, cloud computing, Internet rzeczy oraz robotyka przemysłowa. Data scientist to zawód będący połączeniem matematyka, informatyka, znawcy trendów, innowatora oraz specjalisty z zakresu komunikacji i rozwiązywania problemów. Wymogiem jest także umiejętność pracy w dynamicznym i innowacyjnym środowisku.

Jak wygląda rynek pracy w obszarze data science?

Data scientist to kluczowa rola w procesie przetwarzania dużych zbiorów danych w informacje przydatne dla firm. Zapotrzebowanie na osoby pracujące w tym charakterze istniało już wcześniej, jednak było ograniczone do bardzo dużych przedsiębiorstw. Dzisiaj niemal wszystkie światowe firmy inwestują w obszar data science, a zapotrzebowanie na specjalistów z tej dziedziny rośnie w ogromnym tempie. Dla przykładu: portal z ogłoszeniami o pracę Indeed.com odnotował aż 344% wzrost w ilości ogłoszeń o pracę dla specjalistów data science.

Jakie jest typowe wykształcenie osób pracujących jako data scientist?

Typowy profil osób zatrudnionych jako data scientist
Źródło: towardsdatascience.com

Przyjrzyjmy się typowemu profilowi osób obecnie zatrudnionych na stanowisku data scientist. 70% spośród nich stanowią mężczyźni. Większość z nich zna przynajmniej jeden język obcy. Średnio posiadają oni 4,5 roku doświadczenia zawodowego, z czego 2 lata jako data scientist. Ponad połowa z nich pracuje z użyciem R i/lub Pythona. 48% z nich posiada tytuł magistra, a 27% – doktora. Należy zaznaczyć, że podczas rekrutacji na stanowiska juniorskie pracodawcy coraz częściej wymagają licencjatu w dziedzinie pokrewnej z data science, np. informatyki. Zdobycie wykształcenia jest więc zdecydowanie dobrym pomysłem dla osób, które wiążą swoją przyszłą karierę z data science. Należy jednak pamiętać, że dla pracodawców liczą się przede wszystkim posiadane umiejętności, w tym znajomość języków programowania, które można nabyć także na własną rękę.

Jakie ścieżki rozwoju kariery oferuje data science?

Do najbardziej poszukiwanych ról związanych z data science należą:

  • BI developer
  • Architekt aplikacji
  • Administrator baz danych
  • Architekt danych
  • Architekt korporacyjny
  • Architekt infrastruktury IT
  • Data scientist
  • Inżynier danych
  • Analityk danych
  • Machine learning scientist
  • Inżynier uczenia maszynowego
  • Statystyk
Zatrudnienie w obszarze data science: analityk danych, inżynier danych, analityk biznesowy, data scientist
Źródło: towardsdatascience.com

Spośród osób zatrudnionych w obszarze data science, większość z nich (27,2%) pracuje jako analitycy danych, a nieco mniej (22,6%) jako inżynierowie danych. 17,2% stanowią analitycy biznesowi, a 10,2% – osoby pracujące jako data scientist. Osoby zatrudnione w pozostałych, nieco bardziej niszowych rolach, stanowią łącznie 22,7% wszystkich zatrudnionych w obszarze data science.

Rozwój kariery w data science jest ciągłym procesem, na który wpływ mają twoje zainteresowania oraz dotychczasowe doświadczenie i umiejętności. Wraz z praktyką i mierzeniem się z wyzwaniami biznesowymi będą wzrastać także twoje umiejętności analityczne. Sposobem na dodatkowe przyspieszenie kariery może być upskilling, na przykład poprzez udział w szkoleniach.

Jakie umiejętności związane z data science są szczególnie poszukiwane przez pracodawców?

Umiejętności specjalistyczne:

  • umiejętności analityczne
  • logiczne myślenie
  • myślenie krytyczne
  • umiejętności matematyczne
  • zarządzanie projektami
  • sieci neuronowe
  • uczenie głębokie
  • sztuczna inteligencja
  • przetwarzanie języka naturalnego
  • uczenie maszynowe
  • inżynieria danych
  • kreatywność w rozwiązywaniu problemów
  • programowanie
  • inżynieria oprogramowania

Znajomość oprogramowania i języków:

  • Python
  • R
  • SQL
  • Spark
  • SAS
  • Java
  • Tableau
  • Hive
  • Tensorflow
  • C
  • C++
  • Excel
  • NoSQL
  • Azure
  • Linux

3 umiejętności najczęściej wymieniane w ogłoszeniach o pracę związaną z data science na LikedIn to Python, R oraz SQL, a zaraz po nich Jupyter Notebook, Unix Shell/Awk, AWS, i Tensorflow.

Języki programowania używane w Data Science - Python, SQL, R
Źródło: businessoverbroadway.com

Przyjrzyjmy się językom programowania wykorzystywanym w data science. Zdecydowanie najpopularniejszym z nich jest Python, z którego regularnie korzysta aż 87% zatrudnionych w obszarze data science. Znaczną popularnością cieszą się również SQL (44,3%) i R (31%). Java, C++, JacaScript, Bash, C i MATLAB są wykorzystywane regularnie przez 10 – 15,4% zatrudnionych, a TypeScript – zaledwie przez 3%.

Inne kluczowe umiejętności:

  • Umiejętność komunikacji i współpracy w zespole
  • Storytelling (Data scientist musi umieć przekazać wnioski płynące z danych w sposób zrozumiały dla innych członków zespołu, także tych, którzy nie posługują się technicznym żargonem)
  • Umiejętność rozwiązywania problemów
  • Zrozumienie produktu
  • Ciekawość i innowacyjność
  • Przedsiębiorczość

Jak mogę stać się bardziej rozchwytywany na rynku pracy?

Aby zainteresować sobą większość pracodawców, pomocne będzie przede wszystkim skupienie się na kluczowych umiejętnościach z zakresu analizy danych i uczenia maszynowego. Bardzo pożądana jest również znajomość frameworków uczenia głębokiego, a także popularnych języków programowania, przede wszystkim Pythona i R (najlepiej obydwu z nich). Warto też rozważyć naukę Tableau, które przeżywa ostatnio rozkwit popularności. Nie można również zapominać o rozwoju umiejętności miękkich z zakresu komunikacji, które przydadzą się nie tylko w roli data scientista, ale również podczas procesu szukania pracy i rozmów kwalifikacyjnych.

Jakiego rodzaju certyfikaty i szkolenia zwiększą moją konkurencyjność na rynku pracy?

Big Data

Firmy poszukują ekspertów w zakresie big data, w tym znających programy Apache Hadoop i Apache Spark, a także ekspertów w zakresie eksploracji danych, którzy potrafią wykorzystać dane do przewidywania rynkowych trendów.

Business Intelligence i Data Science

Certyfikaty w zakresie Business Intelligence i Data Science poświadczają umiejętności niezbędne, aby pomóc firmom w zakresie analizy aplikacji czy modelowania danych.

Sztuczna Inteligencja i Uczenie Maszynowe

Certyfikaty w tym obszarze są obecnie najpopularniejszymi w dziedzinie data science. Certyfikacja w obszarze analizy predykcyjnej, uczenia głębokiego czy przetwarzania języka naturalnego niewątpliwie zrobi dobre wrażenie na potencjalnych pracodawcach.

Platformy chmurowe

Znajomość technologii chmurowych, takich jak AWS, Microsoft Azure czy Google Cloud Platform, jest niezbędna w niektórych rolach związanych z data science, a same platformy chmurowe mają wiele do zaoferowania z punktu widzenia analityków danych czy architektów infrastruktury IT.

Jak szukać pracy jako początkujący data scientist?

Kluczowe jest nieustanne poszerzanie swoich kompetencji i konsekwentne aplikowanie na stanowiska juniorskie, nawet jeśli nie czujesz, że w 100% spełniasz wymagania. Przykładowe stanowiska dla początkujących w tej branży, które mogą Cię zainteresować, to między innymi junior data analyst oraz junior data scientist. Niewątpliwym plusem będzie wykształcenie w obszarze zbieżnym z data science, ale możesz wyróżnić się spośród konkurencji także stażem lub doświadczeniem przy pracy nad projektem. Innym sposobem na podkreślenie swoich kompetencji jest umieszczenie w swoim CV informacji o odbytych szkoleniach oraz posiadanych certyfikatów. Pomocne może się okazać także poszerzenie sieci networkingowej, a także bezpośrednie kontaktowanie się z rekruterami, np. poprzez LinkedIn.

Jak początkujący data scientist może zdobyć doświadczenie i rozbudować swoje portfolio?

Zacznij od przestudiowania ogłoszeń o pracę i zwracaj uwagę na wymagane umiejętności oraz obowiązki na danym stanowisku. Dzięki temu będziesz lepiej wiedzieć, jak zaprezentować swoje umiejętności w CV. Niewątpliwie dobre wrażenie zrobi przygotowanie profesjonalnego portfolio, które poświadczy twoje doświadczenie. Angażuj się w projekty, w których będziesz mieć szansę w praktyczny sposób wykorzystać i poszerzyć posiadaną wiedzę. Aby zwiększyć swoją motywację, wybieraj projekty, które uważasz za szczególnie interesujące i zbieżne z twoimi zainteresowaniami.

Jak nauczyć się data science?

Istnieje kilka sposobów na naukę data science. Pierwszym z nich są studia na kierunkach Data Science lub Big Data, choć wielu analityków danych posiada również dyplomy w innych, pokrewnych dziedzinach, takich jak informatyka. Jest to jednak najbardziej czasochłonne rozwiązanie, zwłaszcza dla osób, które ukończyły już studia na innym kierunku i planują przebranżowienie w kierunku data science. Należy też pamiętać, że ukończenie studiów nie równa się automatycznie posiadaniu umiejętności poszukiwanych na szybko zmieniającym się rynku pracy. Drugim sposobem jest nauka na własną rękę z książek i materiałów dostępnych w Internecie. Zaletą tej metody jest możliwość indywidualnego dostosowywania tempa nauki, wadą – brak możliwości otrzymywania cennych informacji zwrotnych oraz zadawania pytań. Pomiędzy tymi dwoma podejściami do nauki znajdują się internetowe kursy, które opierają się na pracy własnej uczestników, ale oferują kontakt z trenerem, który jest w stanie odpowiedzieć na nurtujące kursantów pytania i konstruktywnie ocenić progres w ich nauce.

Jeśli interesuje Cię nauka data science, sprawdź nasze kompleksowe szkolenia realizowane od podstaw, w formie bootcampu:

Tekst na podstawie artykułu „Webinar Wrap Up: Breaking Into Data Science” autorstwa Eshny Vermy.

Autor