NB: La inserción anterior proviene de un repositorio de github, que puedes clonar aquí. Sin embargo, debido a que está alojado en github, toda la interactividad JS está deshabilitada, por lo que el \\\"Botón de alternancia\\\" no se representará. Sin embargo, si clona el repositorio en su máquina y ejecuta la computadora portátil localmente, verá que el botón se verá así:
Y al hacer clic en el \\\"Botón de alternancia\\\", las celdas de entrada se ocultan y queda algo como esto:
Y eso es todo. En resumen, esto es lo que pudimos hacer en un solo entorno (el Notebook):
Un flujo de trabajo de análisis completo de un extremo a otro, todo dentro de un solo entorno. El siguiente paso sería construir un marco, una tecnología y/o un canal que nos permita compartir nuestros informes con las partes interesadas de manera transparente. Si este artículo recibe suficiente atención, lo escribiré a continuación. ?
","image":"http://www.luping.net/uploads/20240826/172465956766cc376f39a45.jpg","datePublished":"2024-08-26T16:06:07+08:00","dateModified":"2024-08-26T16:06:07+08:00","author":{"@type":"Person","name":"luping.net","url":"https://www.luping.net/articlelist/0_1.html"}}Te despiertas. Miras tu lista de tareas pendientes y hay una tarea de un miembro del equipo. Quieren que usted haga algún tipo de análisis y produzca un informe. La solicitud en sí es relativamente compleja, lo que significa que es posible que tengas que desglosarla utilizando un enunciado del problema, extraer datos de una fuente de datos, explorarlos, recopilar tus conocimientos y luego contar una historia de tus hallazgos al miembro del equipo.
Así es como se podría resolver este problema:
Suena como un día normal en la vida de un profesional de datos, ¿verdad? Sin embargo, no sé ustedes, pero mover datos a través de tantas herramientas puede resultar bastante desorientador. Esto genera un flujo de trabajo muy ineficiente. Pero ¿y si te dijera que hay una manera mejor? ¿Que podría preparar el planteamiento de su problema, escribir su consulta SQL, realizar su análisis Y presentar sus hallazgos, todo en un solo lugar? Si trabaja con datos y Python, probablemente ya esté familiarizado con Jupyter Notebook como una excelente herramienta para análisis ad hoc. El entorno interactivo del Notebook permite el análisis secuencial y la narración de historias. Pero la belleza del Notebook no termina sólo en su unión con IPython. Jupyter Notebook se construye esencialmente usando HTML, CSS y JS; lo que significa que podemos usar esas tecnologías para ampliar las capacidades del Notebook. En este artículo, le mostraré cómo podemos aprovechar la interfaz web de Jupyter Notebook y las ricas bibliotecas de datos de Python para crear una solución de informes de un extremo a otro.
Para seguir adelante, necesitará instalar el siguiente software y/o paquetes en su sistema:
SQL Server: Este es el dialecto SQL con el que vamos a interactuar para nuestra extracción de datos
Base de datos de Aventure Works: Esta es la colección de bases de datos desde la que consultaremos nuestros datos. La base de datos AW generalmente viene con la instalación de SQL Server de forma predeterminada. Pero si no es así, haga clic en el enlace y siga las instrucciones sobre cómo cargarlo en su instalación de SQL Server.
Python y Jupyter: La forma más sencilla de instalar Python y Jupyter al mismo tiempo es mediante la distribución anaconda. Si ya tienes Python pero solo quieres instalar Jupyter, usa este enlace.
Bibliotecas de Python:
Ahora que hemos eliminado eso, profundicemos en nuestro Jupyter Notebook. Puede encontrarlo incrustado a continuación:
NB: La inserción anterior proviene de un repositorio de github, que puedes clonar aquí. Sin embargo, debido a que está alojado en github, toda la interactividad JS está deshabilitada, por lo que el "Botón de alternancia" no se representará. Sin embargo, si clona el repositorio en su máquina y ejecuta la computadora portátil localmente, verá que el botón se verá así:
Y al hacer clic en el "Botón de alternancia", las celdas de entrada se ocultan y queda algo como esto:
Y eso es todo. En resumen, esto es lo que pudimos hacer en un solo entorno (el Notebook):
Un flujo de trabajo de análisis completo de un extremo a otro, todo dentro de un solo entorno. El siguiente paso sería construir un marco, una tecnología y/o un canal que nos permita compartir nuestros informes con las partes interesadas de manera transparente. Si este artículo recibe suficiente atención, lo escribiré a continuación. ?
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3