Jokainen koneoppimiskurssi Internetissä, luokiteltu arvosteluidesi mukaan

Puolitoista vuotta sitten keskeytin yhden parhaista tietojenkäsittelytieteen ohjelmista Kanadassa. Aloin luoda oman tietojenkäsittelytieteen maisteriohjelmani käyttämällä online-resursseja. Tajusin, että voisin oppia kaiken tarvittavan edX: n, Courseran ja Udacityn kautta. Ja voisin oppia sen nopeammin, tehokkaammin ja murto-osalla kustannuksista.

Olen melkein valmis nyt. Olen käynyt monia datatieteeseen liittyviä kursseja ja tarkastanut osia monista muista. Tiedän vaihtoehdot ja mitä taitoja tarvitaan oppijoille, jotka valmistautuvat data-analyytikkoon tai datatieteilijän rooliin.Joten aloin luoda arvostelupohjaisen oppaan, joka suosittelee parhaita kursseja kullekin aineelle datatieteessä.

Sarjan ensimmäiseen oppaaseen suosittelin muutamia koodausluokkia aloittelijoille. Sitten se oli tilastoja ja todennäköisyysluokkia. Sitten datatieteen esittelyt. Myös tietojen visualisointi.

Nyt koneoppimiseen.

Tätä opasta varten vietin kymmenkunta tuntia yrittäessäni tunnistaa kaikki tarjotut online-koneoppimiskurssit toukokuusta 2017 lähtien, purkamalla tärkeitä tietoja heidän opetussuunnitelmistaan ​​ja arvioinneista sekä kokoamalla heidän luokituksensa. Tavoitteenani oli tunnistaa kolme parasta käytettävissä olevaa kurssia ja esitellä ne sinulle alla.

Tätä tehtävää varten käännyin muuhun kuin avoimen lähdekoodin Class Central -yhteisöön ja sen tietokantaan, joka sisältää tuhansia kurssiarvioita ja arvosteluja.

Vuodesta 2011 lähtien Class Centralin perustaja Dhawal Shah on seurannut verkkokursseja tarkemmin kuin kukaan muu maailmassa. Dhawal auttoi minua henkilökohtaisesti kokoamaan tämän luettelon resursseista.

Kuinka valitsimme harkittavia kursseja

Jokaisen kurssin on täytettävä kolme kriteeriä:

  1. Siinä on oltava merkittävä määrä koneoppimisen sisältöä. Ihannetapauksessa koneoppiminen on ensisijainen aihe.Huomaa, että vain syväoppimiskurssit eivät ole mukana. Lisää siitä myöhemmin.
  2. Sen on oltava tilauksesta tai tarjottava muutaman kuukauden välein.
  3. Sen on oltava interaktiivinen verkkokurssi, joten ei kirjoja tai vain luku -oppaita . Vaikka nämä ovat kannattavia tapoja oppia, tässä oppaassa keskitytään kursseihin. Kurssit, jotka ovat pelkästään videoita (ts. Ilman tietokilpailuja, tehtäviä jne.), Suljetaan myös pois.

Uskomme, että käsitelimme kaikki merkittävät kurssit, jotka sopivat yllä oleviin kriteereihin. Koska Udemystä on näennäisesti satoja kursseja, päätimme ottaa huomioon vain kaikkein arvostetuimmat ja parhaiten arvioidut kurssit.

Aina on kuitenkin mahdollisuus, että menetimme jotain. Joten ilmoita meille kommenttiosassa, jos jätimme hyvän kurssin.

Kuinka arvioimme kursseja

Laadimme keskimääräiset arviot ja arvostelujen lukumäärän Class Centralilta ja muilta arvostelusivustoilta laskeakseen painotetun keskiarvon jokaiselle kurssille. Luimme tekstiarvostelut ja käytimme tätä palautetta täydentämään numeerisia arvosanoja.

Teimme subjektiivisia opetussuunnitelmia kolmen tekijän perusteella:

  1. Koneoppimisen työnkulun selitys. Esitetäänkö kurssilla onnistuneen ML-projektin suorittamiseen tarvittavat vaiheet? Katso seuraavasta osiosta, mitä tyypillinen työnkulku sisältää.
  2. Koneoppimisen tekniikoiden ja algoritmien kattavuus. Sisällytetäänkö erilaisia ​​tekniikoita (esim. Regressio, luokittelu, klusterointi jne.) Ja algoritmeja (esim. Luokituksen sisällä: naiivit Bayes, päätöksentekopuut, tukivektorikoneet jne.) Vai vain harvat valitut? Etusija annetaan kursseille, jotka kattavat enemmän yksityiskohtia säästämättä.
  3. Yhteisten tietojenkäsittelytietojen ja koneoppimisen työkalujen käyttö. Opetetaanko kurssilla suosittuja ohjelmointikieliä, kuten Python, R ja / tai Scala? Entä suosittuja kirjastoja kyseisillä kielillä? Nämä eivät ole välttämättömiä, mutta hyödyllisiä, joten nämä kurssit annetaan etusijalle.

Mitä koneoppiminen on? Mikä on työnkulku?

Suosittu määritelmä on peräisin Arthur Samuelilta vuonna 1959: koneoppiminen on tietojenkäsittelytieteen osa-alue, joka antaa "tietokoneille mahdollisuuden oppia ilman nimenomaista ohjelmointia". Käytännössä tämä tarkoittaa sellaisten tietokoneohjelmien kehittämistä, jotka voivat tehdä ennusteita tietojen perusteella. Aivan kuten ihmiset voivat oppia kokemuksesta, samoin tietokoneet, missä data = kokemus.

Koneoppimisen työnkulku on prosessi, jota tarvitaan koneoppimisprojektin suorittamiseen. Vaikka yksittäiset projektit voivatkin olla erilaisia, useimmilla työnkulkuilla on useita yleisiä tehtäviä: ongelmien arviointi, tietojen etsintä, tietojen esikäsittely, mallikoulutus / testaus / käyttöönotto jne. Alla on hyödyllinen visualisointi näistä ydinvaiheista:

Ihanteellinen kurssi esittelee koko prosessin ja tarjoaa interaktiivisia esimerkkejä, tehtäviä ja / tai tietokilpailuja, joissa opiskelijat voivat suorittaa kunkin tehtävän itse.

Kattaako nämä kurssit syvällisen oppimisen?

Ensinnäkin, määritellään syvä oppiminen. Tässä on ytimekäs kuvaus:

"Syväoppiminen on koneoppimisen osa-alue, joka liittyy algoritmeihin, jotka ovat aivojen rakenteen ja toiminnan innoittamia ja joita kutsutaan keinotekoisiksi hermoverkoiksi." - Jason Brownlee koneoppimisen masterystä

Kuten voidaan odottaa, osa koneoppimiskursseista sisältää syvällistä oppimissisältöä. Päätin kuitenkin olla sisällyttämättä vain syvällisiä oppimiskursseja. Jos olet kiinnostunut syvällisestä oppimisesta, olemme tutustuneet seuraavaan artikkeliin:

Sukella syvään oppimiseen 12 ilmaisella verkkokurssilla

Joka päivä tuo uusia otsikoita siitä, kuinka syvä oppiminen muuttaa ympäröivää maailmaa. Muutama esimerkki: medium.freecodecamp.com

Kolme tärkeintä suositustani tästä luettelosta ovat:

  • Syvän oppimisen luovia sovelluksia TensorFlow-sovelluksellakirjoittanut Kadenze
  • Toronton yliopiston hermoverkot koneoppimiseen (opettaja Geoffrey Hinton) Courseran kautta
  • Deep Learning AZ ™: Hands-On-keinotekoiset hermoverkot

    Kirill Eremenko, Hadelin de Ponteves ja SuperDataScience-tiimi Udemyn kautta

Suositeltavat edellytykset

Useat alla luetellut kurssit pyytävät opiskelijoita aikaisemmalla ohjelmoinnilla, laskennalla, lineaarisella algebralla ja tilastokokemuksella. Nämä edellytykset ovat ymmärrettäviä, kun otetaan huomioon, että koneoppiminen on edistyksellistä tieteenalaa.

Puuttuu muutama aihe? Hyviä uutisia! Osa tästä kokemuksesta voidaan hankkia tämän Data Science Career Guide -oppaan kahden ensimmäisen artikkelin (ohjelmointi, tilastot) suositusten avulla. Useat alla olevista huippuluokan kursseista tarjoavat myös lempeä laskenta- ja lineaarialgebra-virkistimet ja korostavat koneoppimisen kannalta tärkeimpiä näkökohtia vähemmän tutuille.

Paras koneoppimiskurssimme on…

  • Koneoppiminen (Stanfordin yliopisto Courseran kautta)

Stanfordin yliopiston koneoppiminen Courseralla on selkeä nykyinen voittaja luokitusten, arvosteluiden ja opetussuunnitelman suhteen. Tämän kurssin on opettanut kuuluisa Andrew Ng, Google Brainin perustaja ja entinen Baidun johtava tutkija, ja se on luonut Courseran perustamisen. Sillä on 4,7 tähden painotettu keskiarvo yli 422 arvosteluun.

Vuonna 2011 julkaistu se kattaa kaikki koneoppimisen työnkulun näkökohdat. Vaikka sillä on pienempi soveltamisala kuin alkuperäisellä Stanford-luokassa, johon se perustuu, se onnistuu kuitenkin kattamaan suuren määrän tekniikoita ja algoritmeja. Arvioitu aikajana on yksitoista viikkoa, ja kaksi viikkoa on omistettu hermoverkoille ja syvälle oppimiselle. Saatavilla on ilmaisia ​​ja maksettuja vaihtoehtoja.

Ng on dynaaminen, mutta lempeä ohjaaja, jolla on tuntuva kokemus. Hän herättää luottamusta etenkin, kun jaetaan käytännön toteutusvihjeitä ja varoituksia yleisistä sudenkuopista. Lineaarinen algebran päivitys tarjotaan ja Ng tuo esiin koneoppimisen kannalta olennaisimmat laskennan näkökohdat.

Arviointi on automaattista ja se tehdään monivalintakyselyjen avulla, jotka seuraavat kutakin oppituntia ja ohjelmointitehtäviä. Tehtävät (niitä on kahdeksan) voidaan suorittaa MATLABissa tai Octavessa, joka on MATLAB: n avoimen lähdekoodin versio. Ng selittää kielivalintansa:

Aiemmin olen yrittänyt opettaa koneoppimista useilla erilaisilla ohjelmointikielillä, kuten C ++, Java, Python, NumPy ja myös Octave ... Ja mitä olen nähnyt opettaneeni koneoppimisen melkein vuosikymmenen ajan, se on opit paljon nopeammin, jos käytät Octavea ohjelmointiympäristönä.

Vaikka Python ja R ovat todennäköisesti houkuttelevampia valintoja vuonna 2017 näiden kielten lisääntyneen suosion myötä, arvostelijat huomauttavat, että sen ei pitäisi estää sinua osallistumasta kurssille.

Muutama merkittävä arvostelija pani merkille seuraavat:

Stanfordin koneoppimiskurssi on MOOC-maailmassa pitkään tunnettu ja todellinen johdatus tähän aiheeseen. Kurssi kattaa laajalti kaikki koneoppimisen pääalueet ... Prof. Ng edeltää kutakin segmenttiä motivoivalla keskustelulla ja esimerkeillä.

Andrew Ng on lahjakas opettaja ja kykenee selittämään monimutkaisia ​​aiheita hyvin intuitiivisesti ja selkeästi, mukaan lukien kaikkien käsitteiden takana oleva matematiikka. Erittäin suositeltavaa.

Ainoa ongelma, jonka näen tällä kurssilla, jos se asettaa odotuspalkin erittäin korkealle muille kursseille.

Uusi Ivy League -esittely loistavan professorin kanssa

  • Koneoppiminen (Columbian yliopisto edX: n kautta)

Columbian yliopiston koneoppiminen on suhteellisen uusi tarjonta, joka on osa heidän tekoälyn MicroMastereita edX: ssä. Vaikka se on uudempi ja sillä ei ole paljon arvosteluja, ne, jotka sillä on, ovat poikkeuksellisen vahvoja. Professori John Paisley on loistava, selkeä ja älykäs. Sillä on 4,8 tähden painotettu keskiarvo yli 10 arvosteluun.

Kurssi kattaa myös kaikki koneoppimisen työnkulun näkökohdat ja enemmän algoritmeja kuin yllä oleva Stanfordin tarjonta. Columbia's on edistyneempi esittely, jossa arvostelijat huomauttavat, että opiskelijoiden tulisi olla tyytyväisiä suositeltuihin edellytyksiin (laskenta, lineaarinen algebra, tilastot, todennäköisyys ja koodaus).

Tietokilpailut (11), ohjelmointitehtävät (4) ja loppukoe ovat arviointitapoja. Oppilaat voivat käyttää tehtäviä joko Pythonilla, Octavella tai MATLAB: lla. Kurssin arvioitu kokonaisaika on kahdeksan - kymmenen tuntia viikossa yli 12 viikon ajan. Se on ilmainen, ja vahvistettu varmenne on ostettavissa.

Alla on muutama edellä mainituista kuohuviinien arvosteluista:

Kaikkien opiskeluaikani aikana olen törmännyt professoreihin, jotka eivät ole loistavia, professoreihin, jotka ovat loistavia, mutta eivät osaa selittää asioita selvästi, ja professoreihin, jotka ovat loistavia ja osaavat selittää jutut selvästi. Tohtori Paisley kuuluu kolmanteen ryhmään.

Tämä on hieno kurssi ... Ohjaajan kieli on tarkka ja mielestäni yksi kurssin vahvimmista puolista. Luennot ovat korkealaatuisia ja myös diat ovat hienoja.

Tohtori Paisley ja hänen ohjaajansa ovat… koneoppimisen isän Michael Jordanin opiskelijoita. [DR. Paisley] on Columbian paras ML-professori, koska kykenee selittämään asioita selvästi. Jopa 240 opiskelijaa on valinnut hänen kurssinsa tämän lukukauden aikana, mikä on suurin määrä kaikista koneoppimisen professoreista Columbiassa.

Käytännöllinen intro Python & R: ssä alan asiantuntijoilta

  • Machine Learning AZ ™: Hands-On Python & R datatieteessä (Kirill Eremenko, Hadelin de Ponteves ja SuperDataScience-tiimi Udemyn kautta)

Machine Learning AZ ™ on Udemy on vaikuttavan yksityiskohtainen tarjous, joka tarjoaa ohjeita sekä Pythonissa että R: ssä, mikä on harvinaista, eikä sitä voida sanoa mistään muusta huippukurssista. Sillä on 4,5 tähden painotettu keskimääräinen luokitus yli 8119 arvostelua, mikä tekee siitä kaikkein tarkastellun kurssin.

Se kattaa koko koneoppimisen työnkulun ja melkein naurettavan (hyvällä tavalla) algoritmien määrän 40,5 tunnin on-demand-videolla. Kurssi käyttää soveltuvampaa lähestymistapaa ja on matemaattisesti kevyempi kuin kaksi yllä olevaa kurssia. Jokainen osa alkaa Eremenkon "intuitio" -videolla, joka tiivistää opetettavan käsitteen taustalla olevan teorian. de Ponteves käy sitten läpi toteutuksen erillisillä videoilla sekä Pythonille että R: lle.

"Bonuksena" kurssi sisältää Python- ja R-koodimallit, joita opiskelijat voivat ladata ja käyttää omissa projekteissaan. On tietokilpailuja ja kotitehtäviin liittyviä haasteita, vaikka nämä eivät ole kurssin vahvoja puolia.

Eremenkoa ja SuperDataScience-tiimiä kunnioitetaan kyvystään "tehdä monimutkaisesta yksinkertaisesta". Lisäksi luetellut edellytykset ovat "vain vähän lukion matematiikkaa", joten tämä kurssi voi olla parempi vaihtoehto niille, jotka pelkäävät Stanfordin ja Columbian tarjouksia.

Muutama merkittävä arvostelija pani merkille seuraavat:

Kurssi on ammattimaisesti tuotettu, äänenlaatu on erinomainen ja selitykset ovat selkeät ja ytimekkäät ... Se on uskomaton arvo taloudelliseen ja aika-investointiin.

Oli mahtavaa, että pystyimme seuraamaan kurssia kahdella eri ohjelmointikielellä samanaikaisesti.

Kirill on yksi ehdottomasti parhaista ohjaajista Udemyssa (ellei Internetissä), ja suosittelen ottamaan minkä tahansa hänen opettamansa luokan. … Tällä kurssilla on paljon sisältöä, kuten tonni!

Kilpailu

Valinnallamme # 1 oli painotettu keskiarvo 4,7 viidestä tähdestä yli 422 arvostelussa. Katsotaanpa muita vaihtoehtoja, lajiteltu laskevan luokituksen mukaan. Muistutus siitä, että vain syväoppimiskurssit eivät sisälly tähän oppaaseen - löydät ne täältä.

Analytics Edge (Massachusetts Institute of Technology / edX): keskittyy enemmän analyysiin yleensä, vaikka se kattaa useita koneoppimisen aiheita. Käyttää R.Vahvaa kertomusta, joka hyödyntää tuttuja tosielämän esimerkkejä. Haastava. Kymmenestä viidentoista tuntiin viikossa yli 12 viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa. Sillä on 4,9 tähden painotettu keskiarvo yli 214 arvosteluun.

Python for Data Science and Machine Learning Bootcamp (Jose Portilla / Udemy): Hänellä on paljon koneoppimisen sisältöjä, mutta se kattaa koko tietojenkäsittelyprosessin. Enemmän hyvin yksityiskohtainen johdanto Pythoniin. Upea kurssi, vaikkakaan ei ihanteellinen tämän oppaan soveltamisalaan. 21,5 tuntia tilausvideota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,6 tähden painotettu keskiarvo yli 3316 arvostelusta.

Data Science and Machine Learning Bootcamp with R (Jose Portilla / Udemy): Portillan yllä olevan kurssin kommentit pätevät myös tähän, lukuun ottamatta R. 17,5 tunnin tilauksen videota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,6 tähden painotettu keskiarvo yli 1317 arvosteluun.

Koneoppimissarja (Lazy Programmer Inc./Udemy): Lazy Programmerilla on tällä hetkellä 16 koneoppimiseen keskittyvää kurssia Udemystä. Kursseilla on yhteensä yli 5000 luokitusta ja melkein kaikilla on 4,6 tähteä. Hyödyllinen kurssin järjestys annetaan kunkin kurssin kuvauksessa. Käyttää Pythonia. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan.

Koneoppiminen (Georgia Tech / Udacity): Kokoelma kolmesta erillisestä kurssista: valvottu, valvomaton ja vahvistava oppiminen. Osa Udacityn koneoppimisinsinööri Nanodegree- ja Georgia Techin online-maisterin tutkinnoista (OMS). Bite-kokoiset videot, kuten Udacityn tyyli. Ystävälliset professorit. Arvioitu aikataulu neljä kuukautta. Vapaa. Sillä on 4,56 tähden painotettu keskiarvo yli 9 arvosteluun.

Ennakoivan analyysin toteuttaminen Sparkin avulla Azure HDInsightissa (Microsoft / edX): Esittelyssä koneoppimisen peruskäsitteet ja erilaiset algoritmit. Hyödyntää useita suuria dataystävällisiä työkaluja, kuten Apache Spark, Scala ja Hadoop. Käyttää sekä Pythonia että R: ää. Neljä tuntia viikossa kuuden viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa. Sillä on 4,5 tähden painotettu keskiarvo yli 6 arvosteluun.

Tietojenkäsittely ja koneoppiminen Pythonin kanssa - Hands On! (Frank Kane / Udemy): Käyttää Pythonia. Kanella on yhdeksän vuoden kokemus Amazonista ja IMDb: stä. Yhdeksän tuntia tilattavaa videota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,5 tähden painotettu keskiarvo yli 4139 arvosteluun.

Scala ja Spark suurelle datalle ja koneoppimiselle (Jose Portilla / Udemy): ”Big data” keskittyy erityisesti Scalan ja Sparkin käyttöönottoon. Kymmenen tuntia on-demand-videota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,5 tähden painotettu keskiarvo yli 607 arvosteluun.

Koneoppimisinsinööri Nanodegree (Udacity): Udacityn lippulaiva Machine Learning -ohjelma, jossa on luokassaan paras projektien tarkastelujärjestelmä ja uratuki. Ohjelma on kokoelma useista yksittäisistä Udacity-kursseista, jotka ovat ilmaisia. Luonut Kaggle. Arvioitu kuuden kuukauden aikataulu. Tällä hetkellä kustannukset ovat 199 dollaria USD kuukaudessa, ja opintojen palautus on 50% 12 kuukauden sisällä valmistuneille. Sillä on 4,5 tähden painotettu keskiarvo yli 2 arvosteluun.

Oppiminen datasta (johdantokykyinen koneoppiminen) (Kalifornian teknillinen instituutti / edX): Ilmoittautuminen on tällä hetkellä suljettu edX: ssä, mutta se on saatavana myös CalTechin itsenäisen alustan kautta (katso alla). Sillä on 4,49 tähden painotettu keskiarvo yli 42 arvosteluun.

Oppiminen datasta (johdantokoneoppiminen) (Yaser Abu-Mostafa / Kalifornian teknillinen instituutti): "Todellinen Caltech-kurssi, ei vesitetty versio." Arvostelujen mukaan se on erinomainen koneoppimisen teorian ymmärtämiseen. Professori Yaser Abu-Mostafa on suosittu opiskelijoiden keskuudessa ja kirjoitti myös oppikirjan, johon tämä kurssi perustuu. Videot ovat nauhoitettuja luentoja (joissa luentojen diat kuva kuvassa) ladataan YouTubeen. Kotitehtävät ovat .pdf-tiedostoja. Verkko-opiskelijoiden kurssikokemus ei ole yhtä hiottu kuin kolme parasta suositusta. Sillä on 4,43 tähden painotettu keskiarvo yli 7 arvosteluun.

Mining Massive Datasets (Stanfordin yliopisto): Koneoppiminen painopisteenä "big data". Esittelyssä modernit hajautetut tiedostojärjestelmät ja MapReduce. Kymmenen tuntia viikossa yli seitsemän viikon. Vapaa. Sillä on 4,4 tähden painotettu keskiarvo yli 30 arvosteluun.

AWS-koneoppiminen: täydellinen opas Pythonilla (Chandra Lingam / Udemy): Ainutlaatuinen painopiste pilvipohjaiseen koneoppimiseen ja erityisesti Amazon Web Services -palveluihin. Käyttää Pythonia. Yhdeksän tuntia tilattavaa videota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,4 tähden painotettu keskiarvo yli 62 arvosteluun.

Johdatus koneoppimiseen ja kasvojentunnistukseen Pythonissa (Holczer Balazs / Udemy): Käyttää Pythonia. Kahdeksan tuntia on-demand-videota. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,4 tähden painotettu keskiarvo yli 162 arvosteluun.

StatLearning: Tilastollinen oppiminen (Stanfordin yliopisto): Perustuu erinomaiseen oppikirjaan "Johdatus tilastolliseen oppimiseen, R-sovelluksilla" ja jonka ovat kirjoittaneet sen professorit. Tarkastajat huomauttavat, että MOOC ei ole yhtä hyvä kuin kirja, vedoten ohuisiin harjoituksiin ja keskinkertaisiin videoihin. Viisi tuntia viikossa yhdeksän viikon aikana. Vapaa. Sillä on 4,35 tähden painotettu keskiarvo yli 84 arvosteluun.

Koneoppimisen erikoistuminen (Washingtonin yliopisto / Coursera): Hyvät kurssit, mutta kaksi viimeistä luokkaa (mukaan lukien huippukivi-projekti) peruutettiin. Arvioijat huomauttavat, että tämä sarja on sulavampi (lue: helpompaa niille, joilla ei ole vahvaa teknistä taustaa) kuin muut huippukoneoppimiskurssit (esim. Stanfordin tai Caltechin kurssit). Huomaa, että sarja on epätäydellinen, suosittelujärjestelmät, syvällinen oppiminen ja yhteenveto puuttuvat. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 4,31 tähden painotettu keskiarvo yli 80 arvosteluun.

Alkaen 0: stä 1: koneoppiminen, NLP ja Python-Cut to the Chase (Loony Corn / Udemy): "Maanläheinen, ujo, mutta luottavainen koneoppimistekniikoiden käyttöönotto." Opettanut nelihenkinen tiimi, jolla on vuosikymmenien kokemus teollisuudesta yhdessä. Käyttää Pythonia. Kustannukset vaihtelevat usein käyvien Udemy-alennusten mukaan. Sillä on 4,2 tähden painotettu keskiarvo yli 494 arvosteluun.

Koneoppimisen periaatteet (Microsoft / edX): Käyttää R-, Python- ja Microsoft Azure -oppimista. Osa Microsoft Professional Data Certificate -sertifikaattia. Kolme tai neljä tuntia viikossa kuuden viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa. Sillä on 4,09 tähden painotettu keskiarvo yli 11 arvosteluun.

Big Data: Tilastollinen päätelmä ja koneoppiminen (Queenslandin teknillinen yliopisto / FutureLearn): Mukava, lyhyt etsivä koneoppimiskurssi, jossa keskitytään suuriin tietoihin. Kattaa muutaman työkalun, kuten R, H2O Flow ja WEKA. Vain kolmen viikon kesto suositellulla kahdella tunnilla viikossa, mutta yksi arvostelija totesi, että kuusi tuntia viikossa olisi sopivampi. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 4 tähden painotettu keskiarvo yli 4 arvosteluun.

Genominen datatiede ja klusterointi (Bioinformatiikka V) (Kalifornian yliopisto, San Diego / Coursera): Niille, jotka ovat kiinnostuneita tietojenkäsittelytieteen ja biologian risteyksestä ja siitä, miten se edustaa merkittävää rajan nykyaikaisessa tieteessä. Keskittyy klustereihin ja ulottuvuuden vähentämiseen. Osa UCSD: n bioinformatiikan erikoistumista. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 4 tähden painotettu keskiarvo yli 3 arvosteluun.

Johdatus koneoppimiseen (Udacity): priorisoi aiheen leveyden ja käytännön työkalut (Pythonissa) syvyyden ja teorian sijaan. Ohjaajat, Sebastian Thrun ja Katie Malone, tekevät tästä luokasta niin hauskan. Koostuu puremankokoisista videoista ja tietokilpailuista, joita seuraa jokaisen oppitunnin miniprojekti. Tällä hetkellä osa Udacityn data-analyytikkoa Nanodegree. Arvioitu kymmenen viikon aikataulu. Vapaa. Sillä on 3,95 tähden painotettu keskiarvo yli 19 arvosteluun.

Koneoppiminen tietojen analysointia varten (Wesleyan University / Coursera): Lyhyt koneen oppiminen ja muutama valittu algoritmi. Kattaa päätöspuita, satunnaisia ​​metsiä, lasso-regressiota ja k-tarkoittaa klustereita. Osa Wesleyanin data-analyysi- ja tulkinta-erikoistumista. Arvioitu aikataulu neljä viikkoa. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 3,6 tähden painotettu keskiarvo yli 5 arvosteluun.

Ohjelmointi Python for Data Science -ohjelmalla (Microsoft / edX): Microsoftin tuottama yhteistyössä Coding Dojo: n kanssa. Käyttää Pythonia. Kahdeksan tuntia viikossa kuuden viikon aikana. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 3,46 tähden painotettu keskiarvo yli 37 arvosteluun.

Koneoppiminen kaupankäyntiin (Georgia Tech / Udacity): keskittyy todennäköisyysperusteisten koneoppimisen lähestymistapojen soveltamiseen kaupankäynnin päätöksiin. Käyttää Pythonia. Osa Udacityn koneoppimisinsinööri Nanodegree- ja Georgia Techin online-maisterin tutkinnoista (OMS). Arvioitu aikataulu neljä kuukautta. Vapaa. Sillä on 3,29 tähden painotettu keskiarvo yli 14 arvosteluun.

Käytännön koneoppiminen (Johns Hopkins University / Coursera): Lyhyt, käytännöllinen esittely useisiin koneoppimisalgoritmeihin. Useat yhden tai kahden tähden arvostelut ilmaisevat erilaisia ​​huolenaiheita. Osa JHU: n datatieteen erikoistumista. Neljästä yhdeksään tuntiin viikossa neljän viikon aikana. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 3,11 tähden painotettu keskiarvo yli 37 arvosteluun.

Machine Learning for Data Science and Analytics (Columbia University / edX): Esittelee laajan valikoiman koneoppimisen aiheita. Joitakin intohimoisia negatiivisia arvosteluja, joihin liittyy sisältövalintoja, ohjelmointitehtävien puutetta ja innoittamatonta esitystä. Seitsemästä kymmeneen tuntiin viikossa viiden viikon aikana. Ilmainen ja vahvistettu varmenne ostettavissa. Sillä on 2,74 tähden painotettu keskiarvo yli 36 arvosteluun.

Suosittelijajärjestelmien erikoistuminen (Minnesotan yliopisto / Coursera): Vahva keskittyminen tietyn tyyppiseen koneoppimiseen - suosittelujärjestelmät. Neljän kurssin erikoistuminen sekä huippukivi-projekti, joka on tapaustutkimus. Opettanut LensKit-ohjelmiston avulla (avoimen lähdekoodin työkalupakki suositusjärjestelmille). Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on kahden tähden painotettu keskiarvo yli 2 arvosteluun.

Koneoppiminen suurilla tiedoilla (Kalifornian yliopisto, San Diego / Coursera): Kauheat arvostelut, jotka korostavat heikkoa opetusta ja arviointia. Jotkut totesivat, että koko kurssin suorittaminen kesti vain tunteja. Osa UCSD: n Big Data -erikoistumista. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 1,86 tähden painotettu keskiarvo yli 14 arvosteluun.

Käytännön ennakoiva analyysi: Mallit ja menetelmät (Washingtonin yliopisto / Coursera): Lyhyt esittely koneoppimisen ydinkäsitteisiin. Yksi arvostelija totesi, että tietokilpailuista puuttui ja että tehtävät eivät olleet haastavia. Osa UW: n datatiedettä mittakaavassa Kuusi - kahdeksan tuntia viikossa neljän viikon aikana. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja. Sillä on 1,75 tähden painotettu keskiarvo yli 4 arvosteluun.

Seuraavilla kursseilla oli yksi arvostelu tai ei arvioita toukokuussa 2017.

Koneoppiminen muusikoille ja taiteilijoille (Goldsmiths, Lontoon yliopisto / Kadenze): Ainutlaatuinen. Opiskelijat oppivat algoritmeja, ohjelmistotyökaluja ja koneoppimisen parhaita käytäntöjä ymmärtääkseen ihmisen eleen, musiikillisen äänen ja muun reaaliaikaisen datan. Seitsemän istuntoa. Tarkastus (ilmainen) ja premium (10 dollaria USD kuukaudessa) käytettävissä. Sillä on yksi 5 tähden arvostelu.

Sovellettu koneoppiminen Pythonissa (University of Michigan / Coursera): Opettanut Pythonilla ja scikit-oppimisen työkalupaketilla. Osa Applied Data Science -python-erikoistumista. Suunniteltu alkamaan 29. toukokuuta. Saatavilla ilmaisia ​​ja maksettuja vaihtoehtoja.

Sovellettu koneoppiminen (Microsoft / edX): Opetetaan useilla työkaluilla, mukaan lukien Python, R ja Microsoft Azure Machine Learning (huomautus: Microsoft tuottaa kurssin). Sisältää käytännön laboratorioita luennon sisällön vahvistamiseksi. Kolme tai neljä tuntia viikossa kuuden viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa.

Koneoppiminen Pythonilla (Big Data University): Opettanut Pythonilla. Kohdennettu aloittelijoille. Arvioitu valmistumisaika neljä tuntia. Big Data University on sidoksissa IBM: hen. Vapaa.

Koneoppiminen Apache SystemML: n (Big Data University) avulla: Opetettu Apache SystemML: llä, joka on deklaratiivinen tyylikieli, joka on suunniteltu laajamittaiseen koneoppimiseen. Arvioitu valmistumisaika kahdeksan tuntia. Big Data University on sidoksissa IBM: hen. Vapaa.

Machine Learning for Data Science (Kalifornian yliopisto, San Diego / edX): Aloitetaan vasta tammikuussa 2018. Ohjelmointiesimerkit ja tehtävät ovat Pythonissa Jupyter-muistikirjoja käyttäen. Kahdeksan tuntia viikossa yli kymmenen viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa.

Johdatus Analytics-mallintamiseen (Georgia Tech / edX): Kurssi mainostaa R: ää ensisijaisena ohjelmointityökaluna. Viisi - kymmenen tuntia viikossa yli kymmenen viikon ajan. Ilmainen ja vahvistettu varmenne ostettavissa.

Ennakoiva analyysi: oivallusten saaminen Big Data -tietokannasta (Queenslandin teknillinen yliopisto / FutureLearn): Lyhyt katsaus muutamaan algoritmiin. Käyttää Hewlett Packard Enterprisen Vertica Analytics -alustaa sovellettuna työkaluna. Aloituspäivä ilmoitetaan. Kaksi tuntia viikossa neljän viikon aikana. Ilmainen ja saatavissa oleva todistus saavutuksesta.

Johdanto koneoppimiseen (Universitas Telefónica / Miríada X): Opetettu espanjaksi. Johdatus koneoppimiseen, joka kattaa valvotun ja valvomattoman oppimisen. Yhteensä 20 arvioitua tuntia neljän viikon aikana.

Koneoppimispolun vaihe (Dataquest): Opetetaan Pythonissa Dataquestin interaktiivisella selaimen sisäisellä alustalla. Useita ohjattuja projekteja ja "plus" -projekti, jossa rakennat oman koneoppimisjärjestelmän omia tietojasi käyttämällä. Tilaus vaaditaan.

DataCamp tarjoaa seuraavat kuusi kurssia. DataCampin hybridiopetustyyli hyödyntää video- ja tekstipohjaista ohjetta, jossa on paljon esimerkkejä selaimen sisäisen koodieditorin kautta. Jokaisen kurssin täysi pääsy edellyttää tilausta.

Johdatus koneoppimiseen (DataCamp): Kattaa luokittelu-, regressio- ja klusterointialgoritmit. Käyttää R. 15 videota ja 81 harjoitusta, joiden arvioitu aikajana on kuusi tuntia.

Ohjattu oppiminen scikit-learn-toiminnolla (DataCamp): Käyttää Pythonia ja scikit-learn-ohjelmaa. Kattaa luokittelu- ja regressioalgoritmit. Seitsemäntoista videota ja 54 harjoitusta, joiden arvioitu aikajana on neljä tuntia.

Valvomaton oppiminen R: ssä (DataCamp): Tarjoaa perustiedot R: n klusteroitumisesta ja ulottuvuuden vähentämisestä. Kuusitoista videota ja 49 harjoitusta, joiden arvioitu aikajana on neljä tuntia.

Koneoppimisen työkalut (DataCamp): Opettaa koneoppimisen "suuria ideoita". Käyttää R. 24 videota ja 88 harjoitusta, joiden arvioitu aikajana on neljä tuntia.

Koneoppiminen asiantuntijoiden kanssa: koulun budjetit (DataCamp): tapaustutkimus koneoppimiskilpailusta DrivenDatalla. Sisältää mallin, joka luokittelee kohteet automaattisesti koulun budjettiin. DataCampin ”Supervised Learning with scikit-learn” on edellytys. Viisitoista videota ja 51 harjoitusta, joiden arvioitu aikajana on neljä tuntia.

Valvomaton oppiminen Pythonissa (DataCamp): Kattaa useita valvomattomia oppimisalgoritmeja, jotka käyttävät Pythonia, scikit-learnia ja scipyä. Kurssi päättyy siihen, että opiskelijat rakentavat suositusjärjestelmän suosittelemaan suosittuja musiikkitaiteilijoita. Kolmetoista videota ja 52 harjoitusta, joiden arvioitu aikajana on neljä tuntia.

Koneoppiminen (Tom Mitchell / Carnegie Mellon University): Carnegie Mellonin jatko-osainen koneoppimiskurssi. Edellytys heidän toiselle jatkokoulutukselleen "Tilastollinen koneoppiminen". Teipatut yliopistoluennot, joissa on käytännön ongelmia, kotitehtäviä ja välituote (kaikki ratkaisuineen), jotka on julkaistu verkossa. Kurssista on olemassa myös vuoden 2011 versio. CMU on yksi parhaista koneoppimisen tutkijakouluista, ja sillä on koko ML: lle omistettu osasto. Vapaa.

Tilastollinen koneoppiminen (Larry Wasserman / Carnegie Mellon University): Todennäköisesti tämän oppaan edistynein kurssi. Jatko Carnegie Mellonin koneoppimiskurssille. Teipatut yliopistoluennot, joissa on käytännön ongelmia, kotitehtäviä ja välituote (kaikki ratkaisuineen), jotka on julkaistu verkossa. Vapaa.

Koneoppiminen perustutkinto (Nando de Freitas / University of British Columbia): Koneen perustutkinto-opiskelija. Luennot kuvataan ja laitetaan YouTubeen dian kanssa, jotka on lähetetty kurssin verkkosivustolle. Kurssitehtävät lähetetään myös (ei ratkaisuja). de Freitas on nyt kokopäiväinen professori Oxfordin yliopistossa ja saa kiitosta opetuskyvyistään useilla foorumeilla. Jatko-versio saatavana (katso alla).

Koneoppiminen (Nando de Freitas / University of British Columbia): Valmistunut koneoppimiskurssi. De Freitaksen perustutkinnon (yllä) kommentit pätevät myös tähän.

Kääri se ylös

Tämä on viidesosa kuusiosaisesta sarjasta, joka kattaa parhaat verkkokurssit, joiden avulla voit aloittaa itsesi datatieteen kentälle. Esitimme ohjelmoinnin ensimmäisessä artikkelissa, toisen artikkelin tilastot ja todennäköisyydet, kolmannen artikkelin tietojenkäsittelyt ja neljännessä tietojen visualisoinnin.

Sijoitin jokaisen Intro to Data Science -kurssin Internetiin tuhansien datapisteiden perusteella

Vuosi sitten pudotin yhdestä Kanadan parhaista tietojenkäsittelytieteen ohjelmista. Aloin luoda omia tietojani…

Viimeinen pala on yhteenveto näistä artikkeleista, sekä parhaat online-kurssit muille avainaiheille, kuten datan muokkaus, tietokannat ja jopa ohjelmistotuotanto.

Jos etsit täydellistä luetteloa Data Science -verkkokursseista, löydät ne Class Centralin Data Science and Big Data subject -sivulta.

Jos pidit tämän lukemisesta, tutustu joihinkin Class Centralin muihin kappaleisiin:

Tässä on 250 Ivy League -kurssia, joihin voit osallistua verkossa nyt ilmaiseksi

250 MOOC: ta Brownista, Columbiasta, Cornellista, Dartmouthista, Harvardista, Pennistä, Princetonista ja Yalesta.

50 parasta ilmaista yliopistokurssia tietojen mukaan

Kun aloitin Class Centralin marraskuussa 2011, oli noin 18 ilmaista verkkokurssia, ja melkein kaikki…

Jos sinulla on ehdotuksia ohitetuista kursseista, ilmoita siitä minulle vastauksissa!

Jos pidit tästä hyödyllisenä, napsauta? joten useammat ihmiset näkevät sen täällä Mediumissa.

Tämä on tiivistetty versio alkuperäisestä artikkelistani, joka julkaistiin Class Centralissa, johon olen sisällyttänyt yksityiskohtaiset kurssisuunnitelmat.