Seznam 10 nejlepších knih a popisů datové vědy pro všeobecnou veřejnost

Seznam 10 Nejlepsich Knih A Popisu Datove Vedy Pro Vseobecnou Verejnost



Data Science je obor, který zpracovává obrovské množství dat pomocí vědeckých metod, procesů, algoritmů a systémů k nalezení neviditelných vzorců, odvození smysluplných informací, přijímání obchodních rozhodnutí ve společnostech a také použití v nepodnikatelských institucích. Mezi nepodnikatelské instituce patří odvětví pro zdravotnictví, hry, rozpoznávání obrázků, doporučovací systémy, logistiku, odhalování podvodů (bankovní a finanční instituce), vyhledávání na internetu, rozpoznávání řeči, cílenou reklamu, plánování tras leteckých společností a rozšířenou realitu. Data Science je podmnožinou umělé inteligence. Data, která se používají pro analýzu, mohou pocházet z mnoha různých zdrojů a jsou prezentována v různých formátech. Některá zdrojová data mohou být standardizována; ostatní nemusí být standardizovány.

Jinými slovy, ke sběru dat se používají různé metodiky (množné číslo datum). Poté jsou ze sestavených dat extrahovány znalosti (cenné závěry). V procesu, poté, co jsou data shromážděna, se na nich (data) provádí výzkum, aby se získala nová data (výsledky), ze kterých se řeší problémy.







Data Science jako (hlavní) disciplína existuje na bakalářské a magisterské úrovni na univerzitě. Jen málo univerzit na světě však nabízí Data Science na bakalářském nebo magisterském stupni. Na úrovni bakalářského studia student absolvuje titul v oboru Data Science. Je to jako všeobecný titul. Na magisterské úrovni student odchází s postgraduálním titulem v oboru datové vědy se specializací na analýzu dat, datové inženýrství nebo jako datový vědec.



Čtenáře by mohlo překvapit a možná i bohužel, že strojové učení, modelování, statistika, programování a databáze jsou nezbytnou podmínkou pro studium datové vědy na bakalářském stupni, přestože jde o uznávané vysokoškolské obory, studované v další obory na úrovni bakalářského nebo magisterského stupně. Bez ohledu na to, když student jde na univerzitu studovat Data Science na úrovni studia, všechny tyto kurzy budou stále studovány vedle nebo před řádnými kurzy pro Data Science.



Data Science pro bakalářské studium nebo jeho specializace jako Data Analytics, Data Engineering nebo jako Data Scientist se stále vyvíjejí; i když po studiu (na univerzitě) dosáhly stadia, že se uplatňují v průmyslu. Data Science je celkově relativně velmi nová disciplína.





Pamatujte, že než se stanete specialistou, měli byste být nejprve všeobecným lékařem. Rozdíly mezi programy specialistů zatím nejsou jasné. Rozdíly mezi všeobecnými a specializovanými programy zatím nejsou jasné.

Vzhledem k tomu, že datová věda je relativně nová disciplína, jsou knihy předepsané v tomto dokumentu založeny na pokrytí obsahu a nikoli na pedagogice (jak dobře kniha učí). A jsou pro bakalářský (všeobecný) program. Existují různé všeobecné kurzy.



Seznam

Pro více podrobností a možnost nákupu kreditní kartou je u každé knihy uveden hypertextový odkaz. Žádná z knih nepokrývá všechny všeobecné kurzy.

Základní matematika pro datovou vědu: počet, statistika, teorie pravděpodobnosti a lineární algebra

Napsal: Hadrien Jean

  • Vydavatel: Hadrien Jean
  • Datum zveřejnění: po 30. září 2020
  • Jazyk: angličtina
  • Počet stran: více než 400

Obsah této knihy lze považovat za matematický kurz pro Data Science. Ačkoli se nedoporučuje učit se Data Science sám, absolvent střední školy, který se chce učit Data Science sám, by měl začít s touto knihou.

Obsah: Calculus; Statistika a pravděpodobnost; Lineární algebra; Skaláry a vektory; Matice a tenzory; Rozpětí, lineární závislost a transformace prostoru; Systémy lineárních rovnic; Vlastní vektory a vlastní čísla; Dekompozice singulární hodnoty.

https://www.essentialmathfordatascience.com/

Průvodce zdravým rozumem k datovým strukturám a algoritmům: Zvyšte úroveň svých základních programovacích dovedností / 2. vydání

Napsal: Jay Wengrow

  • Nakladatelství: Pragmatic Bookshelf
  • Datum zveřejnění: 15. září 2020
  • Jazyk: angličtina
  • Rozměry: 7,5 x 1,25 x 9,25 palce
  • Počet stran: ‎508

Tato kniha se zabývá algoritmy a datovými strukturami, které se používají v Data Science. Za předpokladu, že se někdo učí Data Science sám po absolvování střední školy, je to další kniha, kterou si přečtete po přečtení předchozí knihy o matematice. Příklady programů jsou uvedeny v JavaScriptu, Pythonu a Ruby.

Obsah: Proč na datových strukturách záleží; Proč na algoritmech záleží; O Ano! Velký O zápis; Zrychlení kódu pomocí Big O; Optimalizace kódu s a bez velkého O; Optimalizace pro optimistické scénáře; Velké O v každodenním kódu; Rychlé rychlé vyhledávání s hashovacími tabulkami; Vytváření elegantního kódu se zásobníky a frontami; Rekurzivně rekurze s rekurzí; Naučit se psát rekurzivně; Dynamické programování; Rekurzivní algoritmy pro rychlost; Datové struktury založené na uzlech; Urychlení všech věcí pomocí binárních vyhledávacích stromů; Udržujte své priority přímočaré s hromadami; Nebolí to zkusit; Propojení všeho s grafy; Vypořádání se s prostorovými omezeními; Techniky pro optimalizaci kódu

Smarter Data Science: Uspět s daty podnikové úrovně a projekty AI / 1 Svatý Editace

Napsal: Neal Fishman, Cole Stryker a Grady Booch

  • Vydavatel: Wiley
  • Datum zveřejnění: 14. dubna 2020
  • Jazyk: angličtina
  • Počet stran: ‎286

Obsah: Lezení po žebříku umělé inteligence; Rámcová část I: Úvahy pro organizace využívající AI; Rámcová část II: Úvahy pro práci s daty a AI; Pohled zpět na Analytics: Více než jedno kladivo; Pohled do budoucna na analýzu: Ne všechno může být hřebík; Řešení operačních disciplín na žebříčku AI; Maximalizace využití vašich dat: Řízení hodnoty; Oceňování dat pomocí statistické analýzy a umožnění smysluplného přístupu; Dlouhodobé budování; A Journey’s End: IA pro AI.

Machine Learning: A Probabilistic Perspective (adaptivní výpočty a řada Machine Learning) Illustrated Edition

Napsal: Kevin P. Murphy

  • Vydavatel: The MIT Press
  • Datum zveřejnění: 24. srpna 2012
  • Jazyk: angličtina
  • Rozměry: 8,25 x 1,79 x 9,27 palce
  • Počet stran: ‎1104

Tato kniha je vhodná pro začátečníky. Opět, stejně jako všechny ostatní knihy předepsané v tomto dokumentu, ani tato kniha nepokrývá vše potřebné pro všeobecný program, který bohužel stále není dokončen (specializované programy také stále nejsou dokončeny). Typickým začátečníkem je zde maturant s maturitou z matematiky a informatiky.

Obsah: Úvod (Strojové učení: co a proč?, Učení bez dozoru, Některé základní pojmy strojového učení); Pravděpodobnost; Generativní modely pro diskrétní data; Gaussovy modely; Bayesovská statistika; Frekvenční statistiky; Lineární regrese; Logistická regrese; Zobecněné lineární modely a exponenciální rodina; Řízené grafické modely (Bayesovy sítě); Směsné modely a EM algoritmus; Latentní lineární modely; Řídké lineární modely; jádra; Gaussovy procesy; Adaptivní základní funkční modely; Markovovy a skryté Markovovy modely; Modely stavového prostoru; Neorientované grafické modely (Markovova náhodná pole); Přesná inference pro grafické modely; Variační inference; Více variační závěr; Monte Carlo závěr; Markovův řetězec Monte Carlo (MCMC) závěr; Shlukování; Učení struktury grafického modelu; Modely latentních proměnných pro diskrétní data; Hluboké učení.

Data Science for Business: Co potřebujete vědět o dolování dat a analytickém myšlení / 1. vydání

Napsal: Tom Fawcett a Foster Provost

  • Vydavatel: O'Reilly Media
  • Datum zveřejnění: 17. září 2013
  • Jazyk: angličtina
  • Rozměry: 7 x 0,9 x 9,19 palce
  • Počet stran: ‎413

Obsah: Data-Analytic Thinking; Obchodní problémy a řešení datové vědy; Úvod do prediktivního modelování: Od korelace k řízené segmentaci; Přizpůsobení modelu datům; Overfitting a jeho zamezení; Podobnost, sousedé a shluky; Rozhodovací analytické myšlení I: Co je dobrý model?; vizualizace výkonu modelu; Důkazy a pravděpodobnosti; Zastupování a těžba textu; Rozhodovací analytické myšlení II: Směrem k analytickému inženýrství; Další úkoly a techniky datové vědy; datová věda a obchodní strategie; Závěr.

https://www.amazon.com/Data-Science-Business-Data-Analytic-Thinking/dp/B08VL5K5ZX

Praktické statistiky pro datové vědce: 50+ základních konceptů využívajících R a Python / 2. vydání

Napsal: Peter Bruce, Andrew Bruce a Peter Gedeck

  • Vydavatel: O'Reilly Media
  • Datum zveřejnění: 2. června 2020
  • Jazyk: angličtina
  • Rozměry: 7 x 0,9 x 9,1 palce
  • Počet stran: ‎368

Obsah: Průzkumná analýza dat, distribuce dat a vzorků, statistické experimenty a testování významnosti, regrese a predikce, klasifikace, statistické strojové učení, učení bez dozoru.

Kniha Proč: Nová věda o příčině a následku

Scénář: Judea Pearl, Dana Mackenzie

  • Vydavatel: Basic Book
  • Datum zveřejnění: 15. května 2018
  • Jazyk: angličtina
  • Rozměry: 6,3 x 1,4 x 9,4 palce
  • Počet stran: ‎432

Zatímco mnoho knih Data Science používá pro ilustraci čistě obchodní průmysl, tato kniha používá pro ilustraci lékařský průmysl a další obory.

Obsah: Úvod: Mysl nad daty; Žebřík příčinnosti; Od pirátů k morčatům: Genesis kauzální inference; Od důkazů k příčinám: Reverend Bayes se setkává s panem Holmesem; Confounding and Deconfounding: Or, Slaying the Lurking Variable; Debata plná kouře: Vyčištění vzduchu; Paradoxů habaděj!; Beyond Adjustment: The Conquest of Mount Intervention; Counterfactuals: Těžební světy, které mohly být; Mediace: Hledání mechanismu; Velká data, umělá inteligence a velké otázky.

Vybudujte si kariéru v datové vědě

Scénář: Emily Robinson a Jacqueline Nolis

  • Vydavatel: Manning
  • Datum zveřejnění: 24. března 2020
  • Jazyk: angličtina
  • Rozměry: 7,38 x 0,8 x 9,25 palce
  • Počet stran: ‎354

Obsah: Začínáme s datovou vědou; Vyhledání zaměstnání v oblasti datové vědy; Usazení se v Data Science; Růst ve vaší roli Data Science.

https://www.manning.com/books/build-a-career-in-data-science

Data Science for Dummies / 2. vydání

Napsal: Lillian Pierson

  • Vydavatel: For Dummies
  • Datum zveřejnění: 6. března 2017
  • Jazyk angličtina
  • Rozměry: 7,3 x 1 x 9 cm
  • Počet stran: ‎384

Tato kniha předpokládá, že čtenář již má předem požadované znalosti matematiky a programování.

Obsah:  Omotání hlavy kolem Data Science; Průzkum datového inženýrství a infrastruktury; Aplikace statistik založených na datech na obchod a průmysl; Strojové učení: Učení se z dat s vaším strojem; Matematické, pravděpodobnostní a statistické modelování; Použití Clustering k dělení dat; Modelování s instancemi; Budování modelů, které provozují zařízení internetu věcí; dodržování zásad návrhu vizualizace dat; Použití D3.js pro vizualizaci dat; Webové aplikace pro návrh vizualizace; Zkoumání osvědčených postupů v návrhu řídicích panelů; Vytváření map z prostorových dat; Použití Pythonu pro datovou vědu; Použití Open Source R pro datovou vědu; Použití SQL v Data Science; Dělat datovou vědu s Excelem a Knime; Data Science in Journalism: Nailing Down the Five Ws (a H); Ponoření do vědy o environmentálních datech; Data Science pro podporu růstu v elektronickém obchodování; Použití datové vědy k popisu a předvídání trestné činnosti; Deset fenomenálních zdrojů pro otevřená data; Deset bezplatných nástrojů a aplikací datové vědy.

Těžba masivních datových sad / 3 rd Editace

Scénář: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman

  • Vydavatel: Cambridge University Press
  • Datum zveřejnění: 13. února 2020
  • Jazyk angličtina
  • Rozměry: 7 x 1 x 9,75 palce
  • Počet stran: ‎565

Tato kniha také předpokládá, že čtenář již má předem požadované znalosti matematiky a programování.

Obsah: Data Mining; MapReduce a nový softwarový balík; Algoritmy využívající MapReduce; Hledání podobných položek; Těžba datových toků; Analýza odkazů; Časté sady položek; Shlukování; Reklama na webu; Systémy doporučení; těžba grafů sociálních sítí; Redukce rozměrů; Strojové učení ve velkém měřítku.

Závěr

Rozdíly mezi programy specialistů zatím nejsou jasné. Rozdíly mezi všeobecnými a specializovanými programy také nejsou dosud jasné. Po přečtení uvedeného seznamu knih však bude čtenář schopen lépe ocenit speciální role datového analytika, datového inženýrství a datového vědce a poté se pohnout vpřed.