Aspirants scientifiques des données! Apprenez les bases avec ces 7 livres!

Au cours des dernières années, j'ai passé beaucoup de temps à lire des livres sur la science des données. J'ai trouvé que ces 7 livres étaient les meilleurs. Ces éléments constituent ensemble une source très précieuse d'apprentissage des bases. Il vous guide à travers tout ce que vous devez savoir.

Bien qu'ils soient très agréables, aucun d'entre eux n'est une lecture légère. Donc, si vous décidez de les accompagner, allouez du temps et de l'énergie. Ça vaut le coup! Si vous combinez ces connaissances avec les bons cours de science des données en ligne, c'est déjà un niveau suffisant pour un poste de Data Scientist d'entrée de gamme. (À mon avis, au moins.)

Remarque: vous pouvez voir que j'ai répertorié quatre livres O'Reilly ici. Si cela vous semble suspect: je ne suis d'aucune façon affilié à eux. ;-) Je trouve leurs livres vraiment utiles.

Je suggère cette commande spécifique:

1. Lean Analytics - par Croll & Yoskovitz

Le premier livre à lire concerne l'état d'esprit de base des entreprises pour l'utilisation des données. Il dit que c'est pour les startups, mais j'ai l'impression que c'est beaucoup plus que ça. Vous apprendrez pourquoi il est si important de sélectionner la seule métrique qui compte ainsi que les 6 types de commerce en ligne de base - et la stratégie de données qui les sous-tend.

Vous pouvez acheter le livre: ici (lien affilié).

2. La valeur commerciale dans l'océan des données - par Fajszi, Cser & Fehér

Si Lean Analytics concerne les affaires + les données pour les startups, ce livre est les affaires + les données pour les grandes entreprises. Cela semble moins sophistiqué que le premier, mais il y a toujours une chance d'acquérir des connaissances utiles des grands, y compris la façon dont les compagnies d'assurance utilisent l'analyse prédictive et les problèmes de données auxquels les banques sont confrontées.

3. Statistiques nues - Charles Wheelan

Je fais constamment la promotion de ce livre sur mes chaînes. Ce n'est pas seulement pour les Data Scientists. C'est la base même de la pensée statistique, que je pense que chaque être humain devrait connaître. Ce livre est livré avec de nombreuses histoires et vous apprendrez comment ne pas être victime d'une arnaque par des titres comme «Comment nous avons poussé 1300% sur notre taux de conversion en changeant un seul mot» et d'autres BS.

Vous pouvez acheter le livre: ici (lien affilié).

4. Faire de la science des données - Schutt et O'Neil

Le dernier livre avant de devenir vraiment axé sur la technologie. Celui-ci prend les choses que vous avez apprises des 3 premiers livres au niveau suivant. Il approfondit des sujets tels que les modèles de régression, le filtrage du spam, les moteurs de recommandation et même le Big Data.

Vous pouvez acheter le livre: ici (lien affilié).

5. La science des données sur la ligne de commande - Janssens

L'autre chose que je encourage constamment est d'apprendre (au moins) le codage de base. Avec cela, vous pouvez être beaucoup plus flexible lors de la récupération, de l'effacement, de la transformation et de l'analyse de vos données. Il étend simplement vos opportunités en Data Science.

Et lorsque vous commencez, je suggère de commencer par la ligne de commande. C'est le seul livre que j'ai vu sur Data Science + Command Line, mais un seul suffit car il couvre à peu près tout.

Vous pouvez acheter le livre: ici (lien affilié).

6. Python pour l'analyse des données - McKinney

Le deuxième langage de données à apprendre est Python. Ce n'est pas trop difficile et c'est très largement utilisé. Vous pouvez presque tout faire en Python, en matière d'analyse, de prévision et même d'apprentissage automatique. C'est un livre lourd (littéralement: c'est plus de 400 pages), mais couvre tout sur Python.

Vous pouvez acheter le livre: ici (lien affilié).

7. I heart logs - Jay Kreps

Le dernier livre de la liste ne fait que 60 pages et est très technique. Il vous donne une bonne vue sur le contexte technique de la collecte et du traitement des données. En tant qu'analyste ou scientifique des données, vous n'utiliserez probablement pas directement ce type de connaissances, mais au moins vous serez au courant de ce que font les spécialistes de l'infrastructure de données de l'entreprise.

Vous pouvez acheter le livre: ici (lien affilié).

Et c'est tout!

Comme je l'ai mentionné précédemment, si vous passez par tous ces éléments - combinés avec les bons cours en ligne de science des données - vous aurez une solide connaissance de la science des données!

MISE À JOUR: J'ai créé un cours vidéo en ligne (gratuit) pour vous aider à démarrer avec Data Science. Cliquez ici pour plus d'informations: Comment devenir Data Scientist.

INSCRIVEZ-VOUS ICI (GRATUITEMENT): https://data36.com/how-to-become-a-data-scientist/

Si vous voulez essayer, ce que c'est que d'être un data scientist junior dans une startup fidèle à la réalité, découvrez mon nouveau cours de science des données en ligne de 6 semaines: le premier mois du junior data scientist!

En savoir plus sur les bases de l'analyse de données - et ne manquez pas ma nouvelle série de didacticiels sur le codage des données: SQL pour l'analyse des données et Python pour la science des données!

J'ai écrit un nouvel article sur mes livres de statistiques préférés: Aspiring Data Scientists! Commencez à apprendre les statistiques avec ces 6 livres!

Merci d'avoir lu! Vous avez aimé l'article? Veuillez me le faire savoir en cliquant sur le ci-dessous. Cela aide également d'autres personnes à voir l'histoire!

Tomi Mester mon blog: data36.com mon Twitter: @ data36_com