Data inženjer
Njegov je zadatak obrada, odnosno dohvat, čišćenje i transformacija podataka. Koristeći različite programske jezike i alate, radi sa strukturiranim, polustrukturiranim i nestrukturiranim izvorima podataka te je zadužen za automatizaciju procesa obrade podataka koji se zatim upotrebljavaju za naprednu analitiku.
Brzi i dostupni online programi svjetskih sveučilišta za stjecanje uvida u područje
Upravljanje velikim bazama podataka (Big data) u klasterima i pohrana u oblaku
Program tvrtke Cloudera nudi mogućnost stjecanja vještina upravljanja velikim bazama podataka (Big Data), njihovo učitavanje u klastere i pohrana u oblaku. Polaznici će završetkom edukacije znati kreirati upite pomoću distribuiranih SQL sustava kao što su Apache Hive i Apache Impala. Traje 20 sati, a cijena je 49 USD mjesečno.
Prijavi seBig Data analitika s Hadoopom i Apache Sparkom
Program na platformi LinkedIn nudi mogućnost uvida u sustav Apache Hadoop. Edukacija objedinjuje Hadoop distribuirani datotečni sustav (HDFS) i Spark tehnologiju za izgradnju skalabilnih i optimiziranih načina analize podataka. Traje 1 sat, a cijena je 25.81 EUR.
Prijavi seSpecijalizacija za velike baze podataka (Big Data)
Program kalifornijskoga Sveučilišta San Diego (21. mjesto prema Šangajskoj listi sveučilišta 2022.) nudi mogućnost uvida u utjecaj velikih baza podataka na poslovanje. Program vodi polaznika osnovama korištenja sustava Hadoop, Spark, Pig i Hive. Specijalizacija će polaznika pripremiti za učinkovitu komunikaciju sa znanstvenicima podataka i osnovno istraživanje velikih, složenih skupova podataka. Traje 13 sati, a cijena je 49 USD.
Prijavi seLorem ipsum dolor sit amet, consectetur adipiscing elit. Sed euismod feugiat diam, volutpat porta mauris fringilla nec. Maecenas cursus a eros ut egestas. Sed finibus ante quis libero lobortis tempus.
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed euismod feugiat diam, volutpat porta mauris fringilla nec. Maecenas cursus a eros ut egestas. Sed finibus ante quis libero lobortis tempus.
Ekspertni tim u kojem je 27 znanstvenika, profesora, menadžera, stručnjaka iz različitih industrija i osnivača top tehnoloških tvrtki prvi put u Hrvatskoj analizira najvažnije vještine za 100 zanimanja budućnosti u 10 industrija. Na svakoj industriji radio je poseban tim. Ovo su stručnjaci koji vam donose listu najvažnijih vještina za zanimanja budućnosti u informacijskim i komunikacijskim tehnologijama i savjete kako se odmah za njih obrazovati.
A1 Hrvatska
Glavni direktor za transformaciju poslovanja, ljudske potencijale i korporativne komunikacije
A1 Hrvatska
Direktor razvoja IT i telekomunikacijskih usluga
Algebra
Osnivač i član Uprave
Hrvatska udruga za umjetnu inteligenciju CroAi
Potpredsjednica
Fakultet elektrotehnike i računarstva
Docent, Zavod za telekomunikacije
Visoko učilište Algebra
Član Uprave
Što preporučujete onima koji se tek počinju obrazovati za ovo radno mjesto? Gdje se obrazovati i što je važno za uspjeh?
Podatkovni ili data inženjeri upravljaju temeljnim procedurama za strukturiranje važnih podataka tvrtke u tzv. skladištima podataka. Pokrivaju sve, od dizajniranja struktura tablica u bazama podataka do izgradnje procesa kojima se izvlače, prilagođavaju i učitavaju podaci iz raznih izvora, uz istovremenu brigu o skalabilnosti i performansama infrastrukture. Budući da je za ovakvo radno mjesto prijeko potrebna širina znanja i vještina, važni su i iskustvo te široka paleta vještina, a to uključuje poznavanje programskih jezika, dizajniranje i administriranje baza podataka, SQL, ETL / ELT tehnologije i odlično poznavanje mrežne infrastrukture i raznih servisa u oblaku.
Što preporučujete onima koji već rade, a ovo im je zanimanje zanimljivo? Kako steći potrebne vještine?
Za dolazak do ove pozicije svakako si dajte vremena, a ako ste tek na početku, krenite preko preddiplomskog studija računarstva ili informatike pa nastavite na diplomskom studiju podatkovne znanosti.
poznavanje platformi za pružanje cloud usluga (AWS, Azure)
korištenje alata za ekstrakciju, transformaciju i učitavanje velikih skupova podataka (ETL)
korištenje programskih okolina za rad s velikim skupovima podataka
upotreba tehnologije za obradu strukturiranih i nestrukturiranih podataka
analiza velikih podataka
primjena matematičkog procesuiranja podataka
kategoriziranje i konsolidacija velikih podataka
programiranje (npr. Python, Ruby, C++, Java)
upotreba alata za naprednu statističku analizu
prikupljanje (mining) podataka iz primarnih i sekundarnih izvora
upotreba računalnih alata za prikaz informacija
uklanjanje pogrešaka vezanih uz podatke
utvrđivanje kvalitete velikih podataka
kalibriranje sustava za prikupljanje podataka
normalizacija baze podataka
pisanje analitičkih upita (npr. u SQL jeziku)
identifikacija novih izvora podataka
izrada skladišta podataka
dizajniranje, kreiranje i održavanje baza podataka
točnost i detaljan pristup u radu
optimiziranje i unapređivanje procesa
primjena razina povjerljivosti i zaštite u radu s podacima
rješavanje kompleksnih problema
upravljanje promjenama
inovativnost (u postojećim i novim rješenjima)
upravljanje vremenom i prioritetima
poznavanje analitika tražilica
poznavanje cloud-native tehnologija
komunikacijske vještine (jasna formulacija komentara i informacija, vođenje razgovora, slušanje)
kritičko razmišljanje i analitičnost
donošenje odluka
sposobnost za rad pod pritiskom
emocionalna inteligencija / empatija
kreativnost
timska suradnja / virtualna suradnja
upornost i konzistentnost
otvorenost za stalno učenje