Jupyter Notebooks en tant que solution d'analyse de bout en bout

Et c'est tout. En résumé, voici ce que nous avons pu faire dans un seul environnement (le Notebook) :

Un workflow d'analyse complet de bout en bout, le tout dans un seul environnement. La prochaine étape consisterait à créer un cadre, une technologie et/ou un pipeline qui nous permettraient de partager facilement nos rapports avec les parties prenantes. Si cet article reçoit suffisamment d’attention, j’écrirai là-dessus ensuite. ?

Page de garde > La programmation > Jupyter Notebooks en tant que solution d'analyse de bout en bout

Jupyter Notebooks en tant que solution d'analyse de bout en bout

Publié le 2024-08-26

Parcourir:865

Introduction

Vous vous réveillez. Vous regardez votre liste de tâches et il y a une tâche confiée à un membre de l'équipe. Ils veulent que vous fassiez une sorte d’analyse et que vous produisiez un rapport. La demande elle-même est relativement complexe, ce qui signifie que vous devrez peut-être la décomposer à l'aide d'un énoncé de problème, extraire des données d'une source de données, l'explorer, recueillir vos informations, puis raconter l'histoire de vos découvertes au membre de l'équipe.

Voici comment résoudre ce problème :

Créer un énoncé du problème dans une plateforme de suivi des tâches (par exemple Trello, Jira)
Extraire des données d'une source de données (par exemple, base de données SQL, en utilisant une interface telle que SSMS, Power Query)
Effectuer des analyses exploratoires de données et des transformations complexes dans un outil analytique (Python, R, Excel)
Identifiez les informations, puis présentez-les de manière compréhensible aux moldus (un PowerPoint, ou si vous êtes épicé, un outil de visualisation comme Tableau ou Power BI)

Cela ressemble à une journée standard dans la vie d'un professionnel des données, n'est-ce pas ? Cependant, je ne sais pas pour vous, mais déplacer des données entre autant d’outils peut être assez désorientant. Cela crée un flux de travail très inefficace. Mais et si je vous disais qu’il existe une meilleure solution ? Que vous puissiez préparer votre énoncé de problème, rédiger votre requête SQL, effectuer votre analyse ET présenter vos résultats en un seul endroit ? Si vous travaillez avec des données et Python, vous connaissez probablement déjà Jupyter Notebook en tant qu'excellent outil d'analyse ad hoc. L'environnement interactif du Notebook permet une analyse et une narration séquentielles. Mais la beauté du Notebook ne se limite pas à son mariage avec IPython. Le Jupyter Notebook est essentiellement construit en utilisant HTML, CSS et JS ; ce qui signifie que nous pouvons utiliser ces technologies pour étendre les capacités du portable. Dans cet article, je vais vous montrer comment tirer parti de l'interface Web de Jupyter Notebook et des riches bibliothèques de données de Python pour créer une solution de reporting de bout en bout.

Pour suivre, vous aurez besoin des logiciels et/ou packages suivants pour être installés sur votre système :

SQL Server : il s'agit du dialecte SQL avec lequel nous allons interagir pour notre extraction de données
Base de données Aventure Works : Il s'agit de l'ensemble de bases de données à partir desquelles nous allons interroger nos données. La base de données AW est généralement fournie par défaut avec l'installation de SQL Server. Mais si ce n'est pas le cas, cliquez sur le lien et suivez les instructions pour le charger dans votre installation SQL Server.
Python et Jupyter : le moyen le plus simple d'installer Python et Jupyter en même temps consiste à utiliser la distribution anaconda. Si vous possédez déjà Python mais souhaitez installer uniquement Jupyter, utilisez ce lien.
Bibliothèques Python :

pyodbc
pandas
sqlalchimie
intrigue
mlxtend
réseaux

Maintenant que nous avons réglé cela, passons directement à notre bloc-notes Jupyter. Vous pouvez le trouver intégré ci-dessous :

NB : L'intégration ci-dessus provient d'un dépôt github, que vous pouvez cloner ici. Cependant, comme il est hébergé sur github, toute l'interactivité JS est désactivée, donc le « bouton bascule » ne sera pas rendu. Si vous clonez le dépôt sur votre ordinateur et exécutez le notebook localement, vous verrez que le bouton ressemblera à ceci :

Jupyter Notebooks as an End-to-End Analytics Solution

Et en cliquant sur le "Bouton bascule", les cellules de saisie sont masquées et vous vous retrouvez avec quelque chose comme ceci :

Jupyter Notebooks as an End-to-End Analytics Solution

Et c'est tout. En résumé, voici ce que nous avons pu faire dans un seul environnement (le Notebook) :

définir un énoncé du problème et développer les objectifs
se connecter et interroger des données directement à partir d'une base de données SQL
effectuer notre analyse
visualisations de tracé
formater nos sections, mises en page et résultats en utilisant le markdown pour raconter une histoire et rendre notre rapport lisible par un public non technique
fournir des fonctionnalités qui masquent nos entrées techniques, ne laissant que notre histoire et nos informations

Déclaration de sortie Cet article est reproduit à l'adresse : https://dev.to/simsights/jupyter-notebooks-as-an-end-to-end-analytics-solution-2d1o?1 En cas de violation, veuillez contacter [email protected] pour le supprimer

Dernier tutoriel Plus>

L'impact des valeurs nulles sur les performances et le stockage MySQL: analyse de différents moteurs
MySql Null Values: Performance and Storage Considérations L'effet des valeurs null sur les performances et le stockage de MySQL varie cons...

La programmation Publié le 2025-04-12
Pourquoi DateTime :: Modify de PHP («+ 1 mois») produit-il des résultats inattendus?
Modification des mois avec PHP DateTime: Découvrir le comportement prévu Lorsque vous travaillez avec la classe DateTime de Php, l'ajout o...

La programmation Publié le 2025-04-12
Comment puis-je lire efficacement un grand fichier dans l'ordre inverse à l'aide de Python?
en lisant un fichier dans l'ordre inverse dans python Si vous travaillez avec un grand fichier et que vous devez lire son contenu de la de...

La programmation Publié le 2025-04-12
Fonctionnement du curseur jQuery 6 fonctions majeures
Voici quelques puissants extraits de code jQuery pour manipuler le curseur de la souris! Ils peuvent être utilisés pour définir et obtenir une pos...

La programmation Publié le 2025-04-12
Espaces de noms sans nom et mots clés statiques en C ++: qui est mieux encapsulé?
dévoiler la supériorité des espaces de noms sans nom sur le mot-clé statique introduction: L'utilisation de la clé statique a été cohér...

La programmation Publié le 2025-04-12
Raisons de l'échec de l'alias de type GO
Comment lancer à un type d'alias dans go? Considérez le code GO suivant: package main import "fmt" type somethingFuncy func(int) ...

La programmation Publié le 2025-04-12
Python Lire le fichier CSV UnicodedeCodeerror Ultimate Solution
Unicode Decode Erreur dans la lecture du fichier CSV Lorsque vous essayez de lire un fichier CSV dans Python à l'aide du module CSV intégr...

La programmation Publié le 2025-04-12
Ne pas existe par rapport à Not in vs gauche jointer null: quelle clause SQL dois-je choisir?
Comprendre SQL n'existe pas , pas dans , et gauche jointer où est null : une analyse comparative SQL fournit diverses méthodes pour compa...

La programmation Publié le 2025-04-12
Comment puis-je exécuter plusieurs instructions SQL dans une seule requête en utilisant Node-Mysql?
Prise en charge de la requête multi-statement dans Node-Mysql Dans Node.js, la question se pose lors de l'exécution de plusieurs instructi...

La programmation Publié le 2025-04-12
Comment puis-je récupérer efficacement les valeurs d'attribut à partir de fichiers XML à l'aide de PHP?
Récupération des valeurs d'attribut à partir de fichiers xml dans php Chaque développeur rencontre la nécessité de analyser les fichiers X...

La programmation Publié le 2025-04-12
Pourquoi jQuery.Height () renvoie-t-il la valeur d'un élément caché?
jQuery: height () / width () et "affiche: aucun" Dans ce scénario, l'élément avec l'ID "Target" a sa propriété d&#...

La programmation Publié le 2025-04-12
Guide de l'utilisateur de l'API en plein écran HTML5 - SitePoint
If you don’t like change, perhaps web development isn’t for you. I previously described the Full-Screen API in late 2012 and, while I claimed the im...

La programmation Publié le 2025-04-12
Comment puis-je sélectionner par programmation tout le texte dans un clic div sur la souris?
Sélection du texte div sur la souris Cliquez sur Question Étant donné un élément div avec du contenu de texte, comment l'utilisateur peut-...

La programmation Publié le 2025-04-12
$ArrayList to String \ [\] Méthode Array en Java$
ArrayList to String \ [\] Méthode Array en Java
Converting arrayList en string [] dans java lorsque vous travaillez avec des collections dans java, il peut être nécessaire de convertir ...

La programmation Publié le 2025-04-12
Comment supprimer proprement les gestionnaires d'événements JavaScript anonymes?
supprimer les auditeurs d'événements anonymes Ajouter des auditeurs d'événements anonymes aux éléments offre une flexibilité et une simp...

La programmation Publié le 2025-04-12

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article