Miksi Jupyter Notebook on niin suosittu datatieteilijöiden keskuudessa
IPythonista vuonna 2014 syntyneen Jupyter Notebookin tietotiedeyhteisö on innostunut, ja siitä on tullut tutkimuksen oletusympäristö. Määritelmän mukaan Jupyter on ilmainen, avoimen lähdekoodin interaktiivinen verkkopohjainen laskennallinen muistikirja. Laskennalliset muistikirjat ovat olleet olemassa useita vuosia; Kuitenkin erityisesti Jupyterin suosio on kasvanut räjähdysmäisesti viimeisten parin vuoden aikana. Tämä näppärä työkalu tukee monikielistä ohjelmointia, ja siksi siitä tuli tosiasiallinen valinta datatieteilijöille erilaisten koodien harjoitteluun ja jakamiseen, nopeaan prototyyppien luomiseen ja tutkivaan analyysiin.
Vaikka kielikohtaisista IDE:istä (Integrated Development Environments), kuten PyCharm, Spyder tai Atom, ei ole pulaa joustavuuden ja vuorovaikutteisuuden vuoksi, Jupyterin suosio on kasvanut räjähdysmäisesti datatieteilijöiden keskuudessa. Jupyter Notebook on myös saanut valtavan suosion digitaalisissa humanistisissa tieteissä pedagogisena työkaluna. GitHubin analyysin mukaan on laskettu, että syyskuussa 2018 jaettiin yli 2,5 miljoonaa julkista Jupyter-kannettavaa, mikä on 200 000 enemmän kuin vuonna 2015. Ennen kuin tutkimme Jupyterin ominaisuuksia ja etuja ja miksi se on pidetään parhaana alustana datatieteilijöille, keskustelemme siitä, mikä Jupyter Notebook on.
REKISTERÖIDY>>
Mikä on Jupyter-muistikirja?
Epäsuora lyhenne kolmesta kielestä – Julia, Python ja R – Jupyter Notebook on asiakaspohjainen interaktiivinen verkkosovellus, jonka avulla käyttäjät voivat luoda ja jakaa koodeja, yhtälöitä, visualisointeja ja tekstiä. Muistikirjaa pidetään monikielisenä interaktiivisena laskentaympäristönä, joka tukee käyttäjilleen yli 40 ohjelmointikieltä. Jupyter Notebookin avulla käyttäjät voivat tuoda tietoja, koodia ja proosaa yhdessä luodakseen interaktiivisen laskennallisen tarinan.
Jos haluat analysoida kokoelmaa kirjoitettua tekstiä, luoda musiikkia tai taidetta tai kehittää suunnittelukonsepteja, Jupyter Notebook voi yhdistää koodeja ja selityksiä sovelluksen interaktiivisuuteen. Tämä tekee siitä kätevän työkalun datatieteilijöille, jotta he voivat virtaviivaistaa datatieteen työnkulkuja päästä päähän.
Jupyter-muistikirjan voi asentaa Python pip -komennolla. Ja jos käytät Anacondaa, se asennetaan automaattisesti osana Anaconda-asennusta. Se on yhdistetty kolmesta osasta – muistikirjasovelluksesta, ytimistä ja muistikirjan asiakirjoista. Notebook-verkkosovellusta käytetään koodien kirjoittamiseen ja suorittamiseen interaktiivisella tavalla, mutta ytimet ohjaavat järjestelmää suorittamalla ja tutkimalla käyttäjien koodeja. Ja kolmanneksi, muistikirjan asiakirjat ovat itsenäisiä asiakirjoja kaikesta muistikirjassa näkyvästä sisällöstä. Jokaisella muistikirjan asiakirjalla on ydin, joka hallitsee sitä.
Washington DC:n George Washingtonin yliopiston kone- ja ilmailuinsinöörin Lorena Barban mukaan datatieteilijöille Jupyter on noussut de facto -standardiksi.
Jupyter-muistikirjan tarkoitus
Tietojen puhdistus
Tilastollinen mallinnus
ML-mallien koulutus
Tietojen visualisointi
Mikä tekee Jupyter-muistikirjasta de facto -valinnan
Avoimen lähdekoodin ohjelmistojen kasvavan suosion alan sekä datatieteen ja koneoppimisen nopean kasvun vuoksi Jupyter-muistikirjasta on tullut kaikkialla tietotieteilijöiden keskuudessa. Monikielisen ohjelmoinnin tukemisen lisäksi tämä interaktiivinen verkkopohjainen laskenta-alusta tukee myös Markdown-soluja, mikä mahdollistaa yksityiskohtaisempien kirjoitusten tekemisen helpolla muotoilulla. Jupyterin avulla lopputuote voidaan viedä PDF- tai HTML-tiedostona, joka voidaan esittää selaimessa tai jakaa sivustoilla, kuten GitHub. Jupyter-muistikirjat tallennetaan strukturoituihin tekstitiedostoihin — JSON (JavaScript Object Notation) — mikä tekee niiden jakamisesta erittäin helppoa.
Fernando Pérez, Jupyterin perustaja, sanoi kerran, että Jupyterin kasvu johtuu parannuksista, jotka tehtiin Gmailin ja Google Docsin kaltaisia sovelluksia ohjaavaan verkkoohjelmistoon ja helppoudesta, jolla se helpottaa etätietojen käyttöä. joiden lataaminen voisi muuten olla epäkäytännöllistä. Tieteellisen Pythonin ja datatieteen kypsyminen on toinen syy tälle alustalle saada vetovoimaa.
Lisäksi Jupyter-muistikirjoilla on ollut keskeinen rooli datatieteen demokratisoinnissa, mikä on tehnyt siitä helpomman saatavuuden poistamalla tietotieteilijöiden pääsyn esteitä.
Edut
Vaikka Jupyter on kehitetty datatieteen sovelluksiin, jotka on kirjoitettu kielillä, kuten Python, R ja Julia, alustaa käytetään nyt kaikenlaisilla tavoilla projekteihin. Tämän lisäksi poistamalla tietotieteilijöiden esteet Jupyter teki dokumentoinnista, datan visualisoinneista ja välimuistista paljon helpompaa, etenkin koville ei-teknisille ihmisille.
Tietotieteen harrastaja sanoi: "Jupyter-muistikirjan pitäisi olla olennainen osa minkä tahansa Python-tietotieteilijän työkalupakkia. Se sopii erinomaisesti prototyyppien tekemiseen ja muistikirjojen jakamiseen visualisoinneilla."
Tutkitaanpa joitain etuja.
Tutkiva tietojen analyysi:
Jupyterin avulla käyttäjät voivat tarkastella koodin tuloksia suoraan ilman riippuvuutta koodin muista osista. Muistikirjassa koodin jokainen solu voidaan mahdollisesti tarkistaa milloin tahansa tulosteen piirtämiseksi. Tästä syystä, toisin kuin muut standardi-IDE:t, kuten PyCHarm, VSCode, Jupyter auttaa tulosteen in-line-tulostuksessa, josta tulee erittäin hyödyllistä tutkivassa data-analyysissa (EDA).
Katso myös
Kehittäjien kulma
Käsikäyttöinen painojen ja painotusten opas (Wandb) | Python-toteutuksen kanssa
Helppo välimuisti sisäänrakennetussa yksikössä:
Jokaisen solun suoritustilan ylläpitäminen on vaikeaa, mutta Jupyterilla tämä työ tehdään automaattisesti. Jupyter tallentaa välimuistiin jokaisen käynnissä olevan solun tulokset – olipa kyseessä sitten koodi, joka harjoittelee ML-mallia tai koodi, joka lataa gigatavuja tietoa etäpalvelimelta.
Kielestä riippumaton:
JSON-muotoisen edustuksensa ansiosta Jupyter Notebook on sekä alustasta että kielestä riippumaton. Toinen syy on se, että Jupyteria voidaan käsitellä millä tahansa useilla kielillä ja se voidaan muuntaa mihin tahansa tiedostomuotoon, kuten Markdown, HTML, PDF ja muihin.
Tiedon visualisointi:
Osaana jaettu muistikirja Jupyter tukee visualisointeja ja sisältää joidenkin tietojoukkojen, kuten grafiikan ja kaavioiden, renderöinnin, jotka luodaan koodeista moduulien, kuten Matplotlib, Plotly tai Bokeh, avulla. Jupyter antaa käyttäjien kertoa visualisointeja sekä jakaa koodia ja tietojoukkoja, mikä mahdollistaa muiden interaktiivisten muutosten tekemisen.
Reaaliaikainen vuorovaikutus koodin kanssa:
Jupyter Notebook käyttää "ipywidgets"-paketteja, jotka tarjoavat vakiokäyttöliittymät koodin ja tiedon interaktiivisuuden tutkimiseen. Ja siksi käyttäjät voivat muokata koodia, ja se voidaan myös lähettää uudelleen suoritettavaksi, jolloin Jupyterin koodi ei ole staattinen. Sen avulla käyttäjät voivat hallita koodin syöttölähteitä ja antaa palautetta suoraan selaimesta.
Dokumentointikoodiesimerkit:
Jupyterin avulla käyttäjät voivat helposti selittää koodinsa rivi riviltä ja palautetta on liitetty koko matkan ajan. Vielä parempi, Jupyterin avulla käyttäjät voivat lisätä interaktiivisuutta selitysten ohella koodin ollessa täysin toimiva.
Outlook
Yhdistämällä kaikki Jupyter Notebookin yllä mainitut edut, pääasia, joka tuli esiin, on, että Jupyterin käyttäminen on helppo tapa luoda tarina datan avulla. Nykyään Jupyter on muuttunut täysin ja kasvanut ekosysteemiksi, jossa se ymmärtää – useita vaihtoehtoisia kannettavan tietokoneen käyttöliittymiä, kuten JupyterLab ja Hydrogen, interaktiivisia visualisointikirjastoja ja kannettavien kanssa yhteensopivia työkaluja.
Mitä mieltä olet?
Liity Telegram-ryhmäämme. Ole osa kiinnostavaa verkkoyhteisöä.
Liity tästä
.
Tilaa uutiskirjeemme
Saat uusimmat päivitykset ja asiaankuuluvat tarjoukset jakamalla sähköpostisi.
Latest: Miksi sinun pitäisi käyttää Jupyter-kannettavia
Next: Miksi en käytä Jupyter-muistikirjaa, etkä myöskään sinun pitäisi