Anonim

GaudiLab / Shutterstock

Hadoop, en Apache open source-software-ramme til lagring og knasning af store datasæt på tværs af klynger af maskiner, har ramt big time. Markeder og markeder forudsagde i januar 2017, at Hadoop-markedet kunne vokse til mere end 40 milliarder dollars i 2021. Disse prognoser begynder faktisk at se pessimistiske ud, da de globale markeder forventes at forbedre sig stabilt i 2018. En Forbes-rapport fra 2018 forventede, at Hadoop og markedet for big data vil vokse til mere end 99 milliarder dollars i 2022 (hvilket svarer til en forventet vækstrate på hele 28, 5%).

Én ting forbliver sikker: Vækst i så enorm skala skaber et presserende behov for meget mere dygtige it-proffere til at udvikle, styre og administrere Hadoop-implementeringer.

Givet rigelig tid og en forkærlighed for emnet, føler mange mennesker på området, at du kan lære, hvad du har brug for at vide om Hadoop via selvstudium. For disse mennesker er browsing i overflod af dokumentation på Apache Hadoop-webstedet et godt udgangspunkt. Du kan også downloade open source-udgivelsen Hadoop og benytte lejligheden til at dreje nogle drejeknapper og udforske Hadoop i dit eget tempo.

Administratorer og udviklere, der foretrækker en mere struktureret læringsoplevelse, kan drage fordel af gratis online-træningskurser, der er designet til at få dig hurtigt op.

Hadoop online træning

I ingen særlig rækkefølge er her mere end et dusin fantastisk gratis kilder til Hadoop-træning.

Tidligere Big Data University, CognitiveClass.ai tilbyder mere end 50 kurser på Hadoop, HBase, Pig, big data analytics, SQL, IBM BLU, DB2 og mere, alt tilgængeligt i dit eget tempo.

Du finder også to læringsstier dedikeret til at lære Hadoop Fundamentals for begyndere og Hadoop-programmering til mere avancerede Hadoop-udøvere.

De tilbyder også en bred række virtuelle laboratorier, der hjælper studerende med at praktisere, hvad de lærer. De fleste kurser er på engelsk, men nogle er på japansk, spansk og russisk. BigDataUniversity driver stadig portugisiske (.br) og mandarin (.cn) websteder.

2. Cloudera Essentials For Apache Hadoop

Cloudera har et Cloudera Essentials til Apache Hadoop online videokursus, der distribueres kapitel for kapitel. På Cloudera University finder du Hadoop-uddannelse rettet mod administratorer, dataanalytikere, udviklere af dataforskere og sikkerhedsfolk.

Dit næste trin kunne være at tage det tre-lektions introduktion til Hadoop og MapReduce-kursus, der tilbydes via Udacity. Cloudera har også en SQL-analytisk arbejdsbænk ved navn HUE, som er designet til at hjælpe virksomheder med at skabe deres egne selvbetjeningsforespørgsler - det er også et godt læringsværktøj for dem, der bliver bekendt med Hadoop-miljøet.

3. Coreservlets.com

Udlevering af glitz og glam, coreservlets.com leverer en række tutorials til udvikling af big data applikationer med Hadoop leveret fra en lige tekstbaseret interface.

Hver tutorial-sektion giver dig mulighed for at følge med ved hjælp af PDF-filer og / eller slideshares, men du får også downloadede virtuelle maskiner i nogle tilfælde såvel som øvelser (med løsninger).

Coursera har et stort bibliotek af kurser, der tilbydes i partnerskab med flere førende universiteter, såsom UC San Diego, Stanford, Duke og mange flere.

I selskabets politik hedder det, at du kan få adgang til videoforelæsninger og visse opgaver, der ikke er indbundet, gratis på alle kurser. Disse forhåndsvisninger giver dig muligheden for at beslutte, om du vil købe et kursus (pris mellem $ 29 og $ 99) og måske fortsætte med at gennemføre et certifikat.

Ved den seneste søgning trækker Coursera-motoren op 46 hits for kurser, der nævner Hadoop, inklusive alle slags big data og datavidenskabelige emner, sammen med en klasse fra UCSD med titlen Hadoop Platform and Application Framework.

5. edX

Ligesom Coursera tilbyder edX kurser fra kendte universiteter såvel som højteknologiske firmaer og andre bidragydere. På hovedwebsiden skal du indtaste "hadoop" i søgefeltet for at se, hvad der i øjeblikket er tilgængeligt.

Du kan revidere et edX-kursus gratis og arbejde igennem alle opgaver og eksamener, men kun betalte deltagere får et certifikat for afslutning. På nuværende tidspunkt tilbyder edX syv kurser på Hadoop, som alle inkluderer dækning af rammer og platform, og tre af dem nævner faktisk Hadoop i kursustittlen.

6. DeZyre

Med DeZyre kan du lære om big data og Hadoop fra brancheeksperter, få en mentor og gennemføre projekter … mod et gebyr. Men virksomhedens gratis tutorials er tilgængelige for enhver når som helst.

Gennemse den lange liste over tutorials på DeZyre Tutorials-siden, og klik på noget, der gnister din interesse - ingen tilmelding er nødvendig. Der er mere end 18 kurser på stedet, hvoraf to er gratis.

7. Hortonworks

Hortonworks har en masse gode kurser mod betaling, samt gratis Hadoop-træning og -tutorials. For de fleste tutorials skal du downloade og installere Hortonworks Sandbox, og virksomheden anbefaler andre tutorials som forudsætninger for at sikre, at du er klar til at lære mest effektivt.

Som en ophavsmand til Hadoop-teknologi tilbyder Hortonworks en af ​​de mest omfattende og respekterede porteføljer af Hadoop-uddannelse.

8. IBM-udviklerWorks

IBM DeveloperWorks serverer gratis tutorials og værktøjer til big data-analyse, cloud computing og andre højteknologiske kategorier, der er baseret på IBM-teknologier. Vælg f.eks. IBM Open Platform til dine Hadoop- og Spark-projekter, undersøger dets Apache Hadoop- og Apache Spark-distribution. Undervejs beskriver den formålet eller funktionen for hver komponent, såsom Spark, MapReduce, Sqoop og mere.

Selvom det er lidt længe i tanden, er Open Source Big Data for de utålmodige en solid tutorial, der leder dig gennem de grundlæggende elementer i big data og Hadoop. Det har dig til at downloade et Hadoop-billede (Cloudera anbefales) for at arbejde gennem eksempler på Hadoop, Hive, Pig, Oozie og Sqoop.

9. Hadoop-Online-Tutorials.com

Hadoop-trænings- og tutorialswebstedet, der administreres af Anil Jain, indeholder links til træning af brandede (mod betaling) samt gratis online-tutorials og tip til anbefalede bøger om Hadoop.

Flere af de gratis ressourcer, som Jain nævner, findes i dette blogindlæg, men du kan finde andre her, der bestemt er værd at se på.

10. MapR Technologies

MapR er leverandøren af ​​en førende Apache Hadoop distribution. Virksomhedens on-demand Hadoop-uddannelseskurser inkluderer videolektioner, laboratorier, praktiske øvelser med mere og kan føre til certificering som MapR Certified Cluster Administrator (MCCA), Data Analyst (MCDA) eller Certified Hadoop Developer (MCHD).

MapR tilbyder i øjeblikket Apache Hadoop Essentials, seks forskellige Cluster Administration-kurser, tre Hadoop Developer-kurser og mange flere on-demand-kurser, der dækker HBase, MapR Streams, Apache Spark, Apache Drill og Apache Hive.

Gennemse on-demand-træningssiden for at få en komplet liste over kursustilbud.

11. Udacity

Udacity er velkendt for sit katalog over uddannelseskurser om datavidenskab, webudvikling, software engineering og mobile operativsystemer bygget af Silicon Valley tunge møbler som Facebook og Twitter, Cadence og mange flere. Det tilbyder gratis kurser og kursusmateriale, men du skal tilmelde dig et betalt program for at få en Nanodegree-legitimation.

For at se alle gratis kurser med et øjeblik, skal du gå til siden Kurser og Nanodegree-programmer og markere afkrydsningsfeltet Gratis kurser i afsnittet Filtre. For øjeblikket viser en søgning på Hadoop der tre klasser: to på Hadoop selv og en anden om realtidsanalyse med Apache Storm.

12. Udemy

Udemy tilbyder mere end 40.000 gratis og gratis kurser på næsten alt under solen. Når du kommer til startsiden, skal du indtaste "Hadoop gratis" i søgefeltet for at se, hvad der i øjeblikket tilbydes.

I øjeblikket finder du mere end 35 kurser, der spænder fra fem til mere end 60 forelæsninger hver, hovedsageligt rettet mod begyndere til mellemniveauer. Alle nævner Hadoop specifikt og detaljeret.

13. Microsoft Virtual Academy

Microsoft Professional Program (MPP) tilbyder en række forskellige certifikater inden for big data og data science, blandt en række andre emner også.

Tilbudte kurser inkluderer Behandling af Big Data med Azure HDInsight (som er Microsofts administrerede Hadoop-distribution, der kører på Azure-skyen), Behandling af realtidsdata med Azure HDInsight og Implementering af forudsigelig analyse med Spark i Azure HDInsight. For klassificerede quizzer og et certifikat kræves et gebyr på $ 99.

14. YouTube

Som du kunne forvente har YouTube en lang liste med Hadoop træningsvideoer. Søg efter Hadoop på hovedsiden, nudle gennem 100-plus-resultaterne, og vælg nogle videoer, der ser ud til dig.

15. Hadoop-brugere LinkedIn-gruppe

Der er også stor information om Hadoop-træningsressourcer, der udveksles af medlemmer af Hadoop-brugernes LinkedIn-gruppe. Også, hvis du besøger LinkedIn Learning og foretager en søgning på Hadoop, dukker i øjeblikket ikke mindre end 297 hits op, lige fra dette tidspunkt. Gode ​​sager!