14. srpanj 2021.

Podatkovni znanstvenici pod mikroskopom: Kako izgleda radni dan Ana Marije Petric iz Poslovne inteligencije

Ana Marija Petric

   

Podatkovni znanstvenik najtraženije je zanimanje budućnosti u mnogim industrijama. Svi žele na svojoj strani nekoga tko razumije podatke koji se u suvremenim okolnostima prikupljaju u enormnim količinama. Pouke iz podataka mogu se upotrijebiti za donošenje strateških odluka o poslovnom razvoju, ali i svakodnevnim potezima koji profit znače. Budući da su podatkovni znanstvenici u Hrvatskoj malobrojni i da u Liderovoj redakciji najviše od svega volimo kada imamo konkretan primjer, kako bi dobili kvalitetan uvid u to čime se zapravo podatkovni znanstvenici bave, krenuli smo u potragu za primjerima od krvi i mesa. Kako je počela njezina priča, kako izgleda njezin radni dan i čime se sve bavi u razgovoru za Lider otkrila je podatkovna znanstvenica Ana Marija Petric iz tvrtke Poslovna inteligencija.

Kako ste postali data scientist? Gdje ste se školovali i zašto ste odabrali baš to?

- Originalno nisam planirala podatkovnu znanost kao primarni posao. Studirala sam engleski i češki na Filozofskom fakultetu u Zagrebu, ali sam se oduvijek vidjela više u istraživanju jezika nego u književnosti. Tako da sam, nakon završenog diplomskog studija u Zagrebu, otišla na Sveučilište Oxford gdje sam završila još jedan diplomski studij iz polja opće lingvistike i komparativne filologije. U sklopu studija po prvi put sam se susrela s programskim jezicima (prvo R, zatim Python) koje sam koristila u analizi jezika (Obrada prirodnog jezika, NLP). S obzirom na moj lingvistički background, htjela sam se više baviti upravo područjem jezika, ali, naravno, takvi poslovi nisu uvijek bili dostupni. Do pozicije podatkovnog znanstvenika došla sam učenjem programskih jezika i poslovne logike. Prvi poslovi su mi bili u polju automatizacije poslovnih procesa (vrlo jednostavni modeli), a kroz mentorstvo kolega u Nizozemskoj gdje sam niz godina radila, polako sam stjecala ostala znanja i vještine modeliranja drugačijih poslovnih procesa. Naravno, moja prva ljubav i dalje je lingvistika i trenutno se najviše bavim područjem obrade prirodnog jezika, prvenstveno iz perspektive zaštite privatnosti i osobnih podataka.

Što točno radite u Poslovnoj inteligenciji, koja je Vaša uloga? 

- Moja uloga trenutno je ML Team Lead unutar našeg softvera za zaštitu privatnosti (Data Privacy Manager) gdje s kolegama dizajniramo napredne algoritme za obradu jezika koji nam omogućavaju zaštitu osobnih podataka u enterprise sustavima, bilo da se radi o klasičnim tabličnim podacima, bilo da se radi o nestrukturiranim tekstovima, kao što je e-pošta. S obzirom na moje lingvističko obrazovanje, moja uloga je ne samo vođenje tima i razvoj koncepata i logike rada modela, već i evaluacija gramatičkih odnosa između određenih rečenica ili fraza. Moj posao varira. Radim s jedne strane dugoročno planiranje i viziju algoritma kakav bi on trebao biti na kraju našeg perioda istraživanja i razvoja, a s druge strane jednako kao i ostali članovi tima radim i na pripremi podataka, dizajnu modela i evaluaciji. Također, jedan dio mog posla odnosi se na podatkovnu znanost koja nije nužno vezana za NLP. S kolegama sam tako imala priliku raditi na predviđanju putnika u Međunarodnoj zračnoj luci Zagreb, pripremama ponuda iz domene klasičnih data science projekata (i.e. prediktivna analitika) te na internim edukacijama za kolege koji se žele baviti podatkovnom znanošću ili samo primjeniti neke od načina gledanja problema na svoje svakodnevne poslove.

Kako Vam izgleda radni dan?

- Moj radni dan započinje kratkim update pozivom ili, kada okolnosti to dopuštaju, sastankom uživo s kolegama iz tvrtke i kolegama na FER-u. Evaluiramo dnevni progres, informiramo jedni druge o eventualnim problemima, izazovima i slično. Budući da radimo u dvotjednim sprintovima, pratim da je odrađeno sve što treba biti odrađeno. Dio mog posla zajedno s data engineering team leadom je osigurati da su aktivnosti tima planirane. Nakon jutarnjeg sastanka, nastavljam s dizajnom svog dijela posla, bilo da se radi o pripremi podataka, modeliranju jednog dijela našeg algoritma ili evaluaciji i analizi rezultata. Ovisno o analizama, predlažem timu eventualne nove načine modeliranja ili promjene datasetova kako bismo osigurali da algoritam radi najbolje moguće. Naravno ako sam na poslu, obavezno se timski dogovorimo za ručak, popričamo malo o idejama i o stvarima koje bismo htjeli isprobati u narednim iteracijama modeliranja i slično.

Koja je najčešća zabluda oko Vašeg zanimanja?

- Mislim da je najveća zabluda oko mog posla da je sam algoritam suština posla. Najviše vremena svi trošimo na podatke, njihovu prilagodbu i nadogradnju, a vrlo malo na dizajn algoritma. Vrlo je važno imati jasnu viziju toga što se želi postići i načina na koji se to može postići. S druge strane, ljudi često misle da se naš posao može raditi solo. Može, ali puno je teže nego kada se radi s kvalitetnim timom jer sama razmjena ideja i drugačijih pogleda dovodi do puno boljeg dizajna.

Znaju li Vaši prijatelji i obitelj objasniti čime se zapravo bavite?

- Moja obitelj i prijatelji znaju čime se bavim i mislim da to mogu objasniti i drugima. Mislim da sam imala sreće da moju obitelj i prijatelje zaista zanima što radim pa su me voljni saslušati. A i inače, trudim se kada nekom novom pričam o svom poslu naći što plastičniji primjer.

Koji su izazovi tog zanimanja?

- Jedan od glavnih izazova mog zanimanje je komunicirati klijentima da je dizajniranje dobrog modela iterativan proces i da jedan dio vremenskih i financijskih sredstava mora biti utrošen na testiranje različitih pristupa problemu. Također, podaci mogu biti dobri, ali to ne znači nužno da su takvi kakvi jesu iskoristivi u pojedinom modelu. Zaista treba vremena da se podaci prilagode i transformiraju.  

Mijenja li se stalno sve s obzirom na brze promjene u tehnologijama?

- Brze promjene u tehnologijama imaju utjecaj na moj posao te se on kontinuirano mijenja. Kako biste ostali on top of things, morate pratiti trendove i nove stvari koje se događaju. Primjerice, prije par tjedana moji kolege Lucija i Josip testirali su pristup opisan o jednom znanstvenom članku koji je bio objavljen tek dva tjedna prije. Trudimo se pratiti trendove, ali i cijelo vrijeme imati u vidu da se u našem slušaju jedno ne mijenja, a to je važnost dobrih podataka. Bez obzira na stalne promjene i nove pristupe, to je konstanta.  

Kako se usavršavate? 

- Budući da sam iz nekonvencionalne struke, ako to tako možemo reći, usavršavam se raznim tečajevima i čitanjem znastvenih radova, prvenstveno iz polja obrade prirodnog jezika. Također, iako to ljudima često zna zvučati kao floskula, bez obzira na iskustvo, jako puno naučim i od kolega koji se bave drugim poslovima, neovisno o tome radi li se o pripremi podataka ili o developmentu. Jako sam zadovoljna okruženjem u kojem radim i ljudima s kojim radim jer svaki dan naučim nešto novo.