Haluatko tietää, miten syvä oppiminen toimii? Tässä on pikaopas kaikille.

Tekoäly (AI) ja koneoppiminen (ML) ovat tällä hetkellä kuumimpia aiheita.

Termi "AI" heitetään rennosti joka päivä. Kuulet pyrkivien kehittäjien sanovan haluavansa oppia tekoälyn. Kuulet myös johtajien sanovan haluavansa toteuttaa tekoälyn palveluissaan. Mutta melko usein monet näistä ihmisistä eivät ymmärrä, mikä tekoäly on.

Kun olet lukenut tämän artikkelin, ymmärrät tekoälyn ja ML: n perusteet. Vielä tärkeämpää on, että ymmärrät, miten Deep Learning, suosituin ML-tyyppi, toimii.

Tämä opas on tarkoitettu kaikille, joten matematiikkaa ei ole mukana.

Tausta

Ensimmäinen askel kohti syvällisen oppimisen ymmärtämistä on tarttua tärkeiden termien eroihin.

Tekoäly vs koneoppiminen

Tekoäly on ihmisen älykkyyden kopiointi tietokoneissa.

Kun tekoälyn tutkimus aloitettiin, tutkijat yrittivät kopioida ihmisen älykkyyttä tiettyihin tehtäviin - kuten pelaamiseen.

He ottivat käyttöön suuren määrän sääntöjä, joita tietokoneen oli noudatettava. Tietokoneella oli erityinen luettelo mahdollisista toimista, ja se teki päätökset näiden sääntöjen perusteella.

Koneoppiminen tarkoittaa koneen kykyä oppia käyttämällä suuria tietojoukkoja kovakoodattujen sääntöjen sijaan.

ML antaa tietokoneiden oppia itse. Tämän tyyppinen oppiminen hyödyntää nykyaikaisten tietokoneiden prosessointitehoa, joka voi helposti käsitellä suuria tietojoukkoja.

Ohjattu oppiminen vs. valvomaton oppiminen

Ohjattu oppiminen sisältää merkittyjen tietojoukkojen käytön, joilla on panoksia ja odotettuja tuloksia.

Kun koulutat tekoälyä valvotulla oppimisella, annat sille panoksen ja kerrot odotetun tuotoksen.

Jos tekoälyn tuottama lähtö on väärä, se säätää laskelmansa uudelleen. Tämä prosessi tehdään iteratiivisesti tietojoukon yli, kunnes tekoäly ei enää tee virheitä.

Esimerkki valvotusta oppimisesta on sääennusteinen tekoäly. Se oppii ennustamaan säätä historiallisten tietojen avulla. Harjoitustiedoissa on syötteitä (paine, kosteus, tuulen nopeus) ja lähtöjä (lämpötila).

Valvomaton oppiminen on koneoppimisen tehtävä tietojoukoilla, joilla ei ole määriteltyä rakennetta.

Kun harjoitat tekoälyä valvomattoman oppimisen avulla, annat tekoälyn luokitella tiedot loogisesti.

Esimerkki valvomattomasta oppimisesta on käyttäytymistä ennustava tekoäly verkkokauppasivustolle. Se ei opi käyttämällä merkittyä tulo- ja lähtötietojoukkoa.

Sen sijaan se luo oman luokituksen syötetiedoista. Se kertoo, mitkä käyttäjät todennäköisimmin ostavat erilaisia ​​tuotteita.

Kuinka syvä oppiminen toimii?

Olet nyt valmis ymmärtämään, mikä on syväoppiminen ja miten se toimii.

Deep Learning on koneoppimismenetelmä . Sen avulla voimme kouluttaa tekoälyä ennustamaan tuotoksia, kun otetaan huomioon joukko panoksia. Sekä valvottua että valvomatonta oppimista voidaan käyttää tekoälyn kouluttamiseen.

Opimme syvällisen oppimisen rakentamalla hypoteettisen lentolipun hinnanarviointipalvelun . Koulutamme sitä valvotulla oppimismenetelmällä.

Haluamme, että lentolippujen hinta-arvioijamme ennustaa hinnan seuraavien tietojen avulla (jätämme paluuliput yksinkertaisuuden vuoksi pois):

  • Alkuperäinen lentokenttä
  • Kohde lentokenttä
  • Lähtöpäivä
  • Lentoyhtiö

Neuroverkot

Katsotaanpa tekoälyn aivoissa.

Eläinten tavoin estimaattorimme AI: n aivoissa on neuroneja. Niitä edustavat ympyrät. Nämä neuronit ovat yhteydessä toisiinsa.

Neuronit on ryhmitelty kolmeen erityyppiseen kerrokseen:

  1. Syöttökerros
  2. Piilotettu kerros (t)
  3. Tulostustaso

Tulo kerros vastaanottaa lähtötietoja. Meidän tapauksessamme syöttökerroksessa on neljä hermosolua: lähtöpaikka, määränpää lentokenttä, lähtöpäivä ja lentoyhtiö. Tulokerros välittää syötteet ensimmäiseen piilotettuun kerrokseen.

Piilotettu kerrokset suorittaa matemaattisia laskutoimituksia meidän tuloa. Yksi haavoista hermoverkkojen luomisessa on piilotettujen kerrosten määrän sekä kunkin kerroksen neuronien määrän päättäminen.

Syvän oppimisen ” syvä ” viittaa useampaan kuin yhteen piilotettuun kerrokseen.

Lähtö kerros palauttaa lähtödata. Meidän tapauksessamme se antaa meille hintaennusteen.

Joten miten se laskee hintaennusteen?

Täältä alkaa syvällisen oppimisen taika .

Jokainen yhteys neuronien välillä liittyy painoon . Tämä paino määrää syötetyn arvon merkityksen. Alkuperäiset painot asetetaan satunnaisesti.

Lentolipun hintaa ennustettaessa lähtöpäivä on yksi raskaimmista tekijöistä. Siksi lähtöpäivämäärän hermosoluyhteyksillä on suuri painoarvo.

Jokaisella neuronilla on aktivointitoiminto. Näitä toimintoja on vaikea ymmärtää ilman matemaattista päättelyä.

Yksinkertaisesti sanottuna, yksi sen tarkoituksista on "standardoida" hermosäteen lähtö.

Kun joukko syötetietoja on kulkenut hermoverkon kaikkien kerrosten läpi, se palauttaa lähtötiedot ulostulokerroksen läpi.

Ei mitään monimutkaista, eikö?

Neuroverkon kouluttaminen

Tekoälyn kouluttaminen on vaikein osa syvällistä oppimista. Miksi?

  1. Tarvitset suuren tietojoukon .
  2. Tarvitset suuren määrän laskentatehoa .

Lentolippujen hinta-arvioimme varten meidän on löydettävä historialliset tiedot lippujen hinnoista. Suurien mahdollisten lentokenttien ja lähtöpäivämääräyhdistelmien vuoksi tarvitsemme erittäin suuren määrän lippuhintoja.

Tekoälyn kouluttamiseksi meidän on annettava sille tulot tietojoukostamme ja verrattava sen lähtöjä tietojoukon lähtöihin. Koska tekoäly on edelleen kouluttamaton, sen lähdöt ovat väärät.

Kun olemme käyneet läpi koko tietojoukon, voimme luoda toiminnon, joka näyttää meille, kuinka väärät tekoälyn lähdöt olivat todellisista lähdöistä. Tätä toimintoa kutsutaan kustannustoiminnoksi.

Ihannetapauksessa haluamme, että kustannustoimintomme on nolla. Silloin tekoälyn lähdöt ovat samat kuin datajoukon lähdöt.

Kuinka voimme vähentää kustannustoimintoa?

Muutamme hermosolujen painoja. Voisimme muuttaa niitä satunnaisesti, kunnes kustannustoimintomme on alhainen, mutta se ei ole kovin tehokasta.

Sen sijaan käytämme tekniikkaa nimeltä Gradient Descent.

Gradient Descent on tekniikka, jonka avulla voimme löytää funktion vähimmäisarvon. Meidän tapauksessamme etsimme vähimmäiskustannustoimintoa.

Se toimii muuttamalla painoja pieninä lisäyksinä jokaisen tietojoukon iteraation jälkeen . Laskemalla kustannusfunktion derivaatti (tai gradientti) tietyllä painojoukolla voimme nähdä, mihin suuntaan minimi on.

Kustannustoiminnon minimoimiseksi sinun täytyy toistaa tietojoukko läpi useita kertoja. Siksi tarvitset suuren määrän laskentatehoa.

Painojen päivitys gradientin laskeutumisen avulla tapahtuu automaattisesti . Se on syvällisen oppimisen taika!

Kun olemme kouluttaneet lentolippuhintojen estimaattori AI: n, voimme käyttää sitä ennustamaan tulevia hintoja.

Mistä voin oppia lisää?

On olemassa monia muita hermoverkkotyyppejä: konvoluutiohermoverkot tietokonenäköön ja toistuvat hermoverkot luonnollisen kielen käsittelyyn.

Jos haluat oppia syvällisen oppimisen teknisen puolen, suosittelen verkkokurssin suorittamista.

Tällä hetkellä yksi syvimmän oppimisen parhaista kursseista on Andrew Ng: n syvällisen oppimisen erikoistuminen. Jos et ole kiinnostunut sertifikaatin saamisesta, sinun ei tarvitse maksaa kurssista. Voit sen sijaan tarkastaa sen ilmaiseksi.

Jos sinulla on kysyttävää tai haluat lisää teknisiä selityksiä käsitteille, kysy alla!

Yhteenvetona…

  • Deep Learning käyttää hermoverkkoa matkimaan eläinten älykkyyttä.
  • Neuroverkossa on kolmen tyyppisiä hermosolujen kerroksia: tuloTaso, piilotettu (t) kerros (t) ja ulostulotaso.
  • Neuronien väliset yhteydet liittyvät painoon, joka määrää tuloarvon tärkeyden.
  • Neuronit käyttävät dataan aktivointitoimintoa "standardoidakseen" hermosoluista tulevan lähdön.
  • Neuroverkon kouluttamiseksi tarvitset suuren tietojoukon.
  • Toisto tietojoukon läpi ja lähtöjen vertailu tuottaa kustannustoiminnon, joka osoittaa, kuinka paljon tekoäly on poissa todellisista tuloksista.
  • Jokaisen tietojoukon läpi tapahtuneen iteraation jälkeen hermosolujen välisiä painoja säädetään Gradient Descent -toiminnolla kustannustoiminnon vähentämiseksi.

Jos pidit tästä artikkelista, anna minulle taputuksia, jotta useammat ihmiset näkevät sen. Kiitos!

Voit myös tarkistaa kokemukseni siitä, miten sain harjoitteluni Shopifyssä!

Lisää päivityksiä seuraa minua Twitterissä.