Kim jest prawdziwy data-scientists vel mistrz danych?

Piotr Golczyk

Łączę marketing z technologią, naukę z intuicją, a pracę z zabawą. Konsultuję rozwiązania. piotr @ golczyk com.

Jeżeli planujesz zatrudnienie kogoś kto pozwoli ci zrozumieć więcej, dobrze żebyś wiedział jak odróżnić kogoś od kogo się czegoś nauczysz od kogoś kogo będziesz uczył.

Mam tę przyjemność, że pracuję z osobą o kompetencjach prawdziwego mistrza danych. Żeby było jasne: nie oceniam jego kompetencji, bo brakuje mi na ten temat wiedzy. Oceniam sposób w jaki osiąga cele.

W zasadzie ludzi zajmujących się danymi można podzielić na trzy grupy: data scientists (mistrz danych), data analyst (analityk danych), data engineer.

Mistrz danych musi zadawać pytania równie sprawnie jak odpowiadać na nie. To typ poszukiwacza, rozwiązującego napotkane problemy za pomocą wszystkich dostępnych środków oraz swojej wiedzy. Nie upiera się przy żadnym rozwiązaniu do momentu aż nie przynosi ono pożądanych rozwiązań. Jego wiedza o danych jest większa niż wiedza programistyczna ale w sposób bardzo merytoryczny rozmawia z inżynierem danych (data engineer) o ile sam nim w dużej mierze nie jest.

Data engineer czyli inaczej Data Infrastructure Specialists bądź Data Architecture Specialists to osoby potrafiące dane zbierać, przygotować do obróbki i zastosować takie rozwiązania technologiczne, które pozwolą data-scientists odpowiadać na dowolnie skomplikowane pytania możliwie najłatwiej. Może to robić za pomocą wielu różnych rozwiązań na przykład dostarczając stosowne API pozwalające szybko zadawać złożone pytania do bazy danych, zarządzanie infrastrukturą, skalowanie, integracje, etc.

Mamy także data analists czyli osobę, która analizuje dane, potrafi je zwizualizować, opowiedzieć historię zbudowaną na danych i musi wykazać się odpowiednim zaangażowaniem i umiejętnością rozwiązywania problemów.

OK. To jaka jest różnica między nimi?

W zasadzie gdyby porównać Data scientis z Data-analists i z Data Engineer dochodzisz do wniosku, że oni są do siebie bardzo podobni. Różnice nie są wyraźne.

Można zaryzykować stwierdzenie, że Data scientis = Data Analists z Data Engineer. Czyli możesz mieć super Data Scientis zatrudniając dwóch stosunkowo bardziej dostępnych specjalistów czyli Data Analists i Data Engineer.

Istnieje całkiem sporo poradników jak odróżnić podczas rekrutacji osoby, które są i nie są Data scientis. Znajdziecie je bez trudu. Niektóre z nich koncentrują się na wiedzy specjalistycznej, inne na wiedzy ogólnej – w końcu taka osoba powinna rozumieć biznes i rzeczywistość na tyle, by zadawać sensowne pytania.

Na koniec zapraszam do oberzenia wystąpienia, które przybliży Wam różnice i samą definicję mistrza danych.