Kuinka luoda mahtava datatieteen salkku

Jos ansioluettelosi taitot-osiossa luetellaan Python, R, SQL, koneoppiminen, syvällinen oppiminen ja ihmettelet, miksi sinut hylätään joka kerta, jatka lukemista.

Miljoonat ihmiset etsivät työtä datatieteessä, ja mahdollisuudet ovat rajalliset. Joten tärkeä kysymys on, kuinka voit erottua pakkauksesta?

Opas yrittää kaapata kaiken mitä tarvitset kickass-salkun rakentamiseen - niin hyvä, että he eivät voi sivuuttaa sinua!

Miksi sinun pitäisi rakentaa salkku?

Henkilölle, joka on saanut maisterin tutkinnon tai tohtorin tutkinnon. ylimmän tason yliopistosta työn saaminen ei ehkä ole niin vaikeaa. Instituutti lisää profiilisi uskottavuutta, jota työnantajat etsivät.

Henkilölle, jolla ei ole asianmukaista tutkintoa tai tarpeeksi kokemusta, uskottavuus on vahvistettava tähtitiede-salkun kautta, joka esittelee potentiaaliasi. Salkku toimii sitten todisteena osaamisestasi.

On monia tekijöitä, jotka voivat parantaa mahdollisuuksiasi saada huomata työnantaja. Älykkään strategian ja johdonmukaisten ponnistelujen avulla voit murtaa sen.

Rakennetaan täällä typeryssuunnitelma, jotta voimme työskennellä kohti työpaikan purkamista!

Vaihe 1 - Tunnista itsesi

Hyppääminen uraportaalista toiseen ja hakeminen mihin tahansa työpaikkaan, jossa mainitaan ”Data”, ei ole älykäs liike. Se lisäisi stressiäsi ja työmäärääsi vain tietäessäsi, että he ovat hylänneet sinut.

Tarkenna hakua

Kuva viestiä varten

Data Science -spektri itsessään on valtava. Useimmat ihmiset makaavat yhdessä kaaviossa esitetyn pyramidin kerroksista. Vain harvat pystyvät hallitsemaan kaksi tai kolme kerrosta.

Tietopohjainen organisaatio työllistää nykyään eri tehtäviä, ja tässä on luettelo ongelmien vaikeustasosta, jonka nämä ammattilaiset ratkaisevat:

  • Data-analyytikot - helppo keskitasolle
  • Datainsinöörit - keskitasosta kovaan
  • ML-insinöörit - keskitaso
  • Tutkimus- / datatieteilijät - vaikea
  • Tekoälyinsinöörit / syvällisesti oppivat harjoittajat - erittäin kova

Kukaan henkilö ei tietenkään voi vetää kaikkia tehtäviä pois. Ensimmäinen asia, jonka sinun on tehtävä, on tunnistaa taitosi, jotka olet oppinut (tai haluat hallita). Kyseisen taitokokonaisuuden perusteella sinun tulee valita luettelo tavoiteltavasta työnkuvasta.

Vaihe 2 - Työselostuksen tutkiminen

Jos vietät tarpeeksi aikaa käymällä läpi joukko erilaisten tietoprofiilien työnkuvia, huomaat, että he kysyvät kokemusta, vaikka kyseessä olisi joku, joka on vasta yliopistosta.

Toinen asia, jonka sinun pitäisi ymmärtää, on se, että on työpaikkoja, joilla on yleisempiä vaatimuksia, kuten tietojen analysointi. Ja sitten on kohdennetumpia ja omistautuneempia tutkimusalueita, kuten hedge-rahaston tutkija, joka on erittäin matemaattista.

Tässä on muutama kuvakaappaus, jonka olen kaapannut muutamalta suurelta (Facebook, NetFlix) ja keskisuuren (h20.ai) organisaatiolta, joita etsit ehdokkaasta:

Kuva viestiä varten

Niiden tutkiminen vie meidät takaisin hyvin tärkeään ja usein kysyttyyn kysymykseen:

Kuinka kompensoin kokemustekijän, jos olen vasta koulun ulkopuolella ?

Vastaus on projektit!

Odota! Tiesin jo sen ...

Tässä on mitä et todennäköisesti tiennyt - nämä projektit eivät voi olla sinun analyysisi MNIST-tietojoukosta tai Titanic-tietojoukon luokitteluongelman ratkaisemisesta.

Joten, millaisia ​​projekteja? Mistä saan nämä projektit? Mitä minun on tehtävä?

Vastataksemme siihen, sukelkaamme salkun rakentamiseen.

Vaihe 3 - Asiantuntemuksen näyttäminen projektien kautta

Projektit ovat ainoa korvaava kokemus.

Chris Albon kysyi Datacampin haastattelussa siitä, mitä ihmisten pitäisi olla salkussa, kun he etsivät ensimmäistä työpaikkaansa:

... kun joku hakee, joitain parhaita asioita, joihin he voivat hakea, ovat tekemät projektit tai jotain esimerkiksi sanottua boot campia tai ehkä heidän väitöskirjatutkimuksiaan tai jotain sellaista, missä voimme katsoa ja sano: oi, siistiä, kuin olisit tehnyt mielenkiintoisia juttuja, olet työskennellyt joidenkin tietojen, mielenkiintoisten tapojen kanssa.

Mitä näiden hankkeiden tulisi heijastaa:

Projektisi on vahvistettava neljä päätekijää riippumatta siitä, mihin profiiliin haet:

  1. Vahva otteesi vaadittuun osaamiseen
  2. Ratkaisemasi tai tutkimasi ongelman monimutkaisuus - se voi olla joko uusi ongelma tai usein kysytty yritysluokan ongelma.
  3. Verkkotunnusosaaminen - tekemäsi tutkimuksen määrä vastausten löytämiseksi kysymyksiin tai tietoinfrastruktuurin rakentamiseen.
  4. Haluasi mennä ylimääräiselle mailille ja tehdä projektista erottuva - käyttää projektiasi julkiseen käyttöön tai kirjoittaa blogia tai julkaista video selittääksesi havainnot.

Salkkuun lisättävät projektityypit

Pidä mielessä yllä mainitut tekijät, tässä on luettelo projektiideoista, jotka edellyttävät vilpittömiä ponnisteluja, mutta lisäävät painoa salkkuusi.

  • Työskentely todellisten tietojen kanssa: Jos pystyt osoittamaan jollekin, että voit työskennellä eri lähteistä peräisin olevan raakatiedon kanssa ja vastata mielenkiintoisiin kysymyksiin sosiaalilakeista, rahoituksesta, terveydenhuollosta tai mistä tahansa tieteellisestä kokeesta, joka olisi erittäin arvostettua.
  • Exploring p ublicly saatavilla aineistoja:
Kuva viestiä varten

Hyödyntämällä julkisesti saatavilla olevia aineistoja tutkia tietoja useista oivalluksista, määritellä kysymyksiä, joita ei ole koskaan ennen kysytty, kaivaa lehtiin ja tutkimuspapereihin etsimään liittyvää materiaalia ja paljasta sitten piilotetut mallit tilastollisten mallien avulla.

Julkisesti saatavilla olevan tietojoukon perusteellinen analyysi on jälleen hyvä paikka aloittaa.

  • Hyödynnä uteliaisuuttasi: Koska utelias data-ammattilainen, sinun on oltava kiinnostavia tuotteita / palveluja / kysymyksiä. Käytä tätä uteliaisuutta uusien ongelmien selvittämiseen. Esimerkiksi urheilufanaatikko voi rakentaa kojelaudan tai tietoinfrastruktuurin, joka hallitsee kaikkien pelaajien tilastoja ja suorituskykymalleja.
  • Osallistuminen avoimen lähdekoodin paketteihin : Jokaisella organisaatiolla on suurta kunnioitusta avoimen lähdekoodin panoksella koneoppimiseen tai tieteellisiin tietokonepaketteihin. Ilmaisen ja avoimen lähdekoodin ohjelmistojen kehittäminen parantaa merkittävästi mahdollisuuttasi rekrytoida. Voit yrittää osallistua paketteihin, kuten sklearn, numpy ja pandat. Se osoittaa, että voit työskennellä valtavien ja monimutkaisten koodikantojen kanssa ja että tiedät tavarasi hyvin.
  • Rakenna end-to-end-projekteja: Erinomainen tapa todistaa, että olet todella yleinen, on rakentaa end-to-end-projekteja (enemmän kuin tuotteita). Älä lopeta ratkaisun löytämistä tai prototyypin luomista suositusjärjestelmälle tai fintech-chatbotille. Mene ylimääräiselle mailille, ota se käyttöön, jaa se ikäisillesi, jotta voit käyttää sitä, kerää analytiikkaa. Tämä osoittaa kuinka intohimoisesti olet tekemässäsi ja missä määrin voit mennä oppimaan uusia tekniikoita ja menetelmiä.
  • Taitokohtaiset projektit: On ihmisiä, jotka todella osaavat puhdistaa tietoja tai luoda oivaltavia juonia tai automatisoida dataputkistoja. Sinun tulisi harkita omien Python-pakettien kehittämistä, jotka voisivat automatisoida nämä puhdistustehtävät, tai antaa tietokehyksen, jonka paketin pitäisi luoda parikaaviot ja kaikki muut mahdollisuudet nopeuttaa EDA-prosessia.

Luettelo inspiroivista todella hienoista salkkuista:

  • //nycdatascience.com/blog/student-works/improving-a-music-websites-user-experience/
  • //varianceexplained.org/r/trump-tweets/
  • //nycdatascience.com/blog/student-works/forecasting-cryptocurrencies-price-trends/
  • //nycdatascience.com/blog/student-works/web-scraping/covid19s-impact-on-preventable-cancer-risk-in-women-a-call-for-action/

Aikataulu projektille

Aika, jonka viet projektiin, antaa vihjeitä sen vaatimasta monimutkaisuudesta, kapealta ja työmäärältä. Sen pitäisi auttaa sinua perustelemaan, onko projekti salkun arvoinen vai ei.

Kuinka paljon vaivaa projektissasi viedä seuraavalle tasolle riippuu monista eri tekijöistä.

Jos haluat antaa sinulle jotain määrällistä, jos olet valinnut syntymässä olevan tekniikan, sinun tulisi käyttää vähintään kuukausi rakentamaan jotain konkreettista.

Kuinka lisätä nämä projektit portfolioosi

Kun sinulla on muutama hyvä projekti, jotka voit sisällyttää salkkuusi, seuraava askel on pakata työsi parhaalla mahdollisella tavalla.

Apple tunnetaan pakkauksestaan ​​ja suunnittelustaan. Ole rehellinen siitä, miten pakkaat työsi, ennen kuin näytät sen.

Näin voit lisätä painoa projekteihisi:

  • GitHub URL: Jos päätät lisätä linkin repoosi, varmista, että repo ei vain sisällä Jupyter-muistikirjaa, sillä tulisi olla kaikki muut tiedostot, kutenrequirements.txt,.gitignorelisenssi tarvittaessa ja niin edelleen. Näin sinut palkataan kokonaisena pakettina eikä vain Jupyter-muistikirjan asiantuntijana.
  • Blogit: Saavutetusta kirjoittaminen on aina hyvä käytäntö, ja työnantajille se lisää luottamusta työhösi ja kykyäsi välittää tehokkaasti tekemäsi.
  • Käyttöönotetut sovellukset: Jos olet ottanut käyttöön ML-pohjaisen sovelluksesi, anna linkki työnantajalle pelaamaan sitä.
  • Kojelaudat: Jos olet ylpeä analyysistasi, voit luoda siitä kojelaudan. Voit käyttää Voilaa tai Dashia, jos työskentelet Pythonissa. Jos olet yritysanalytiikan asiantuntija, voit lisätä Power BI: n tai Tableaunkojelautaesitellä analyysitaitojasi.

Vaihe 4 - Sosiaalisen median profiilit

Hyvä sosiaalisen median profiili voi auttaa sinua saamaan seuraavan unelmatyösi. GitHub, LinkedIn, Twitter, Kaggle, StackOverflow ja Medium ovat tärkeimmät käyttöympäristöt, joilla ihmiset jakavat työnsä / mielialansa, verkostoituvat, kuluttavat tietoja ja mainostavat.

Organisaatiot ja rekrytoijat käyttävät näitä alustoja tavoitellakseen seuraavaa potentiaalista palkkaamistaan.

  • GitHub: Jos sinulla on hyvä GitHub-profiili, jossa on paljon julkaisuja tai tähtiä arkistoissasi, sinusta tulee kilpailukykyinen ohjelmoija.
Kuva viestiä varten
  • Kaggle: Kaggle-kilpailuihin osallistuminen, hyödyllisten muistikirjojen ja tietojoukkojen luominen voi myös auttaa sinua rakentamaan hyvän data-analyytikkoprofiilin.
Kuva viestiä varten

Ote Reshama Shaikhin To Kaggle or Not -viestistä sanoo:

On totta, että yhden Kaggle-kilpailun tekeminen ei oikeuta ketään tietojenkäsittelytieteen tutkijaksi. Ei myöskään pidä yhtä luokkaa tai käydä yhdessä konferenssioppaassa, analysoida yhtä tietoaineistoa tai lukea yhtä kirjaa tietojenkäsittelyssä. Kilpailun (kilpailujen) parissa työskenteleminen lisää kokemustasi ja lisää salkkuasi. Se on täydennys muihin projektiisi, ei ainoa tietojenkäsittelytaitojen lakmuskoe.
  • LinkedIn: Olen henkilökohtaisesti käyttänyt LinkedIniä ensimmäisen työpaikkani, ensimmäisen asiakkaani ja monien yhteistyökumppaneiden saamiseksi. Se on yhden luukun foorumi yhteydenpitoon ihmisiin, jotka työskentelevät unelmayrityksissäsi, ovat vuorovaikutuksessa heidän kanssaan, löytävät työpaikkoja ja seuraavat mielenkiintoisia edistysaskeleita. Optimoi profiilisi lukemalla tämä täydellinen datatiede LinkedIn Profile -opas.

    Vinkki: Sinun on oltava valmis tarjoamaan jotain ensin, ennen kuin pyydät palvelusta.

  • Twitter: Kaikki datatieteen avaruuden suuret nimet käyttävät Twitteriä melko usein, ja voit olla vuorovaikutuksessa alasi ihmisten kanssa. Opit, mitä nämä ihmiset työskentelevät, ja heidän mielipiteitään sosiaalisista kysymyksistä.

    Voit mainostaa blogiasi, videoitasi ja muita löytösi Twitterillä. Ihmiset ovat saaneet työtarjouksia, kutsuja konferensseihin, freelancereita ja vaikuttajamarkkinointisopimuksia työstään ja hyvästä seurannastaan ​​Twitterissä.

Suosituimmat datatieteilijät Twitterissä:

  • Andreas Mueller - Sci-kit Learn -kehittäjä
  • Yann LeCunn - johtava tekoälyn tutkija Facebookissa
  • Dean Abbott - johtava tietotieteilijä älykkäämpiHQ
  • Andrew Ng - Courseran perustaja

On monia muita, voit katsoa profiilini ja seuraamani ihmiset Twitter-profiilissani.

Vaihe 5 - Salkun tiivistäminen yhdelle sivulle Jatka

Työhakemuksesi tärkein osa on ansioluettelosi, koska se päättää, tuletko sinut listalle tähän työhön vai ei.

Ottaen huomioon, että kaikki muut elementit ovat hyvässä kunnossa, on aika tiivistää nämä tiedot tyylikkäässä ja ytimekkäässä ansioluettelossa.

Kuten sinun on tiedettävä, rekrytoijat käyttävät vain pari minuuttia aikaa selata ansioluettelosi, joten sinun on kerrottava kaikki tekemäsi yhdellä sivulla.

Tärkeimmät kohdat nimesi ja yhteystietojesi jälkeen:

  1. Yhteenveto : Kerro 1–2 lauseella, mitä olet tehnyt ja mitä aiot tehdä.
  2. Taidot : Älä täytä näitä kaikkia satunnaisia ​​taitoja, jotka tulevat mieleen. Älä merkitse itseäsi asteikolla. Yhden rivin, jolla on kaikki päätaidot, pitäisi olla riittävä.
  3. Projektit : Tämän pitäisi olla uusien luokkien pääosa, koska kokemusosastossasi ei ole paljon. Ole suppea siitä, mitä olet saavuttanut, lisää hyperlinkkejä työhösi. Ota mukaan huippukiviprojekteja, Kaggle-kilpailuja, riippumatonta tutkimusta ja projekteja. Tätä osiota kutsutaan salkuksi.
  4. Kursseista : Lisää asiaa kursseista vain. Voit mainita GPA: n tarvittaessa.
  5. Kokemus (jos sinulla on): Lisää asiaankuuluva työhistoria sekä luettelomerkit, jotka puhuvat organisaatiossasi tekemistäsi tärkeimmistä tehtävistä.
  6. Sosiaalisen median linkit: Älä unohda lisätä linkkejä aktiivisiin sosiaalisen median profiileihisi.

Tässä on esimerkki hyvästä ansioluettelosta, joka tarkistettiin Kaggle CareerCon2018 -tapahtuman aikana:

Kuva viestiä varten

Kehotus toimintaan

Sinulla on todennäköisesti vielä paljon kysymyksiä. Mistä sinun pitäisi etsiä projektiideoita? Kuinka pääset alkuun? Kuinka valmistaudut haastatteluihin? Ja paljon muuta.

Olen työskennellyt projektien luomisessa jokaiselle profiilille kokemukseni perusteella kokemuksestani työskennellessäni verkko- ja datatieteen kappaleiden opetussuunnittelijana.

Luon tähän viestiin antamasi vastauksen perusteella jokaiseen profiiliin Discord-kanavan, jossa jaan projektit ja ohjeet niiden täydentämiseksi kuhunkin liittyvään aikajanaan.

Uskon vahvasti projektipohjaiseen pedagogiikkaan ja luon siis paljon sisältöä, johon projektikehitys kattaisi. Jaan resurssit, joita voit käyttää oppimiseen (joista osa luon itse) ja saada projektit päätökseen onnistuneesti.

Voit tarkastella yhtä esimerkistäni täällä: COVID-19 Interactive Analysis Dashboard from Jupyter Notebooks.

Tässä on videoversio tästä blogitekstistä kanavallani Data Science with Harshit:

Datatiede Harshitin kanssa

Tällä kanavalla aion ottaa käyttöön pari sarjaa, joka kattaa koko datatieteen tilan. Tästä syystä sinun pitäisi tilata kanava:

  • Nämä sarjat kattavat kaikki vaaditut / vaaditut laatuoppaat kustakin aiheesta ja osa-alueista, kuten datatieteen Python-perusteet.
  • Selitetty matematiikka ja johdannaiset siitä, miksi teemme mitä teemme ML: ssä ja syväoppimisessa.
  • Podcastit datatieteilijöiden ja insinöörien kanssa Googlessa, Microsoftissa, Amazonissa jne. Sekä suurten datapohjaisten yritysten toimitusjohtajilla.
  • Projektit ja ohjeet tähänastisten aiheiden toteuttamiseksi.

Ota keskustelu eteenpäin ottamalla yhteyttä minuun LinkedInissä tai Twitterissä.