"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Ensemble de données sur l'heure du site Web

Ensemble de données sur l'heure du site Web

Publié le 2024-11-07
Parcourir:302

Bonjour, j'ai trouvé un ensemble de données sur Kaggle dans le temps d'utilisation d'un site Web, je souhaite donc trouver un rapport entre le nombre de pages visitées et le temps total passé sur le site Web.

Vous pouvez trouver l'ensemble de données et le code dans mon github : https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I-Installation

Pour ce faire, j'utilise sqlalchemy en python pour convertir mon csv en base de données et tracer pour afficher mes résultats.

pip install plotly
pip install sqlalchemy

II-Code

Je crée une classe Main, dans laquelle je récupère mon csv et le mets dans une base de données, en utilisant la méthode get_data.
Le résultat est une liste de tuples, je crée donc la méthode transform_data pour obtenir une liste double.
Enfin, je peux afficher un graphique simple entre le nombre de pages consultées et la durée totale.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Résultat

L'axe des X indique le nombre de pages visitées par l'utilisateur, tandis que l'axe des Y indique le temps passé sur le site Web en minutes.

On constate que les utilisateurs qui restent le plus longtemps visitent entre 4 et 6 pages, et qu'entre 11 et 15 pages tous les utilisateurs restent au moins quelques minutes.

Website Time dataset

Déclaration de sortie Cet article est reproduit sur : https://dev.to/victordalet/website-time-dataset-3k47?1 En cas de violation, veuillez contacter [email protected] pour le supprimer.
Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3