"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > Conjunto de datos de tiempo del sitio web

Conjunto de datos de tiempo del sitio web

Publicado el 2024-11-07
Navegar:671

Hola, encontré un conjunto de datos en Kaggle sobre el tiempo de uso de un sitio web, por lo que quiero encontrar una relación entre el número de páginas visitadas y el tiempo total en el sitio web.

Puedes encontrar el conjunto de datos y el código en mi github: https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


Yo - Instalación

Para hacer esto, uso sqlalchemy en Python para convertir mi csv en una base de datos y trazar para mostrar mis resultados.

pip install plotly
pip install sqlalchemy

II - Código

Creo una clase principal, en la que recupero mi csv y lo coloco en una base de datos, usando el método get_data.
El resultado es una lista de tuplas, así que creo el método transform_data para obtener una lista doble.
Finalmente, puedo mostrar un gráfico simple entre el número de páginas vistas y el tiempo total.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Resultado

El eje x indica el número de páginas visitadas por el usuario, mientras que el eje y muestra el tiempo pasado en el sitio web en minutos.

Podemos ver que los usuarios que permanecen más tiempo visitan entre 4 y 6 páginas, y que entre 11 y 15 páginas todos los usuarios permanecen al menos unos minutos.

Website Time dataset

Declaración de liberación Este artículo se reproduce en: https://dev.to/victordalet/website-time-dataset-3k47?1 Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3