Som et av de kraftigste programmeringsrammene for åpen kildekode, er Hadoop et viktig verktøy for alle som håper å finne en big data-jobb. Hvis du vil pusse opp Hadoop -ferdighetene dine eller lære å mestre det, er det beste alternativet å ta et online kurs. Hvis det ikke er tilgjengelig for deg, kan du se gratis online opplæringsprogrammer og bruke referansemateriell for å feilsøke spesifikke problemer. Når du har fått det grunnleggende nede, kan du øve på små sett med virkelige data for å forbedre ferdighetene dine.
Trinn
Metode 1 av 2: Ta kurs og bruk opplæringsprogrammer
Trinn 1. Registrer deg for Cloudera for et 6-delt kurs og interaktive opplæringsprogrammer
Cloudera gir deg eksempler fra den virkelige verden du kan trene på i et skrivebeskyttet miljø, slik at du ikke trenger å bekymre deg for å gjøre store feil. De tilbyr også analyseverktøy som hjelper deg med å eksperimentere spørringsdata, samt en gratis live -demo kalt Cloudera Live for å lære deg Hadoop -miljøet.
Selv om det komplette, grundige kurset med sertifisering vil koste deg $ 295, vil det definitivt være verdt det hvis du bruker disse ferdighetene til jobben din. Å bruke Cloudera -kurset vil hjelpe deg med å fange feil og spare tid, noe som gjør at det raskt kan betale seg selv
Trinn 2. Prøv gratis online kurs gjennom Cloudera hvis du allerede kjenner det grunnleggende
Hvis du har erfaring med Hadoop og bare vil ha en oppfriskning, trenger du kanskje ikke å betale ut pengene til det seksdelte kurset. I stedet kan du sjekke ut de gratis online kursene på Cloudera University -nettstedet.
Det er ressurser for administratorer, utviklere og dataanalytikere, så uansett hvilken rolle du har, bør du kunne finne et passende kurs
Trinn 3. Ta et kurs på universitetsnivå om Coursera hvis du vil ha mer teori
Coursera er en velkjent, respektert kilde til programmeringskurs. Selv om instruksjonene generelt sett er mer teoretiske og ikke inneholder så mange kjøreeksempler, kan du øve sammen med opplæringen og bruke kursprosjektene for å få praktisk erfaring.
- Du finner dette kurset online på
- Kostnaden varierer mellom kursene, men Coursera tilbyr også et alternativ for økonomisk støtte til de som kvalifiserer.
Trinn 4. Følg et gratis kurs på Big Data University for et rimelig alternativ
Hvis du ikke vil betale for et online kurs, er Big Data University et godt alternativ. De har et 2-delt kurs, som først fokuserer på grunnleggende Hadoop, deretter på programmering med Hadoop, og det elektroniske formatet gjør det enkelt å gå i ditt eget tempo.
- Du finner disse kursene på
- De tilbyr mange opplæringsprogrammer på engelsk, så vel som japansk, spansk, portugisisk og russisk.
Trinn 5. Søk etter gjennomganger på YouTube hvis du trenger gratis, spesifikk opplæring
Det er tusenvis av videoer laget for å forklare Hadoop og hvordan du bruker den. Det brede utvalget av videoer gir deg fleksibilitet, pluss at det er gratis. Hvis du støter på et bestemt problem, kan du søke etter en video på YouTube som leder deg gjennom prosessen.
Hadoop -opplæringsprogrammer bør også være ganske enkle å finne, siden "hadoop" er et unikt søkeord
Trinn 6. Bruk Yahoos gratis opplæringsprogrammer hvis du vil øve med et virtuelt eksempel
Disse opplæringsprogrammene er delt opp i 7 moduler, og de instruerer deg i å installere og bruke Hadoop helt fra begynnelsen. Dette er et flott alternativ for å pusse opp spesifikke ferdigheter hvis de er litt rustne.
Trinn 7. Se gratis, grundige instruksjoner i IBM Open Source-dokumentet
Dette er et utrolig grundig PDF-dokument med åpen kildekode laget av et IBM-opplæringsinitiativ. Den leder deg nøye gjennom Hadoop, trinn for trinn, og gir klare skriftlige instruksjoner.
Disse instruksjonene fungerer også godt når de er sammenkoblet med en live demo som Cloudera
Metode 2 av 2: Overgang til virkelige applikasjoner
Trinn 1. Spør om du kan implementere Hadoop på jobben for å øve med ekte data
Legg inn en forespørsel med sjefen din eller veileder, eller snakk med dem en-mot-en om å bringe disse nye ferdighetene inn på arbeidsplassen. Dette er spesielt viktig hvis din bedrift har betalt for opplæring eller online kurs.
Jo før du begynner å implementere ferdighetene du har lært, jo før vil du kunne mestre dem
Trinn 2. Se etter enkle prosjekter å trene dine ferdigheter på
Velg prosjekter som er relativt enkle og med lav risiko, for eksempel å telle og rangere antall interaksjoner per kundeagent, som e-post og chat-økter.
- Noen andre virkelige dataprogrammer inkluderer skanning gjennom weblogger for feil eller overvåking av sosiale mediekanaler for merkesentiment.
- Du kan også øve med eksempeldata fra nettsteder som https://www.kaggle.com/datasets eller
Trinn 3. Kontroller koden din regelmessig med små undersett for å finne ut eventuelle feil
Før du kjører hele datasettet, ta et mindre testdatasett til din lokale maskin og kjør det gjennom flere forskjellige moduser. For eksempel kan du kjøre den iterativt gjennom Local Jobrunner-modus, deretter Pseudo-distribuert modus og deretter Full-distribuert modus.
- Dette lar deg gjenkjenne eventuelle feil eller feil før de blir forsterket i hele datasettet.
- Lokal Jobrunner-modus lar deg lokalt teste og feilsøke kartet og redusere koden, Pseudo-distribuert modus etterligner produksjonsmiljøet, og Full-distribuert modus ser på din virkelige produksjonsklynge.
Trinn 4. Bruk en 1-års gratis prøveperiode for å øve på et virtuelt maskinmiljø
Selskaper som Amazon og Microsoft tilbyr betalte abonnementer på sine Hadoop -øvelsestjenester. Amazons virtuelle maskin kalles Amazon Web Service (AWS) og Microsofts tjeneste kalles Microsoft Azure. For begge tjenestene er ditt første år gratis når du skriver inn kredittkortinformasjonen din.
Ikke glem å si opp abonnementet etter 1 år for å unngå å bli belastet
Tips
- Husk at Hadoop er et mer spesialisert programmeringsspråk som er smalt. Det vil sikkert gi deg et forsprang i big data -verdenen, men det er ikke alltid nødvendig å bli programmerer.
- Du kan også lese bøker og artikler om Hadoop, for eksempel Hadoop: The Definitive Guide, 3. utgave av Tom White.