Bonjour, j'ai trouvé un ensemble de données sur Kaggle dans le temps d'utilisation d'un site Web, je souhaite donc trouver un rapport entre le nombre de pages visitées et le temps total passé sur le site Web.
Vous pouvez trouver l'ensemble de données et le code dans mon github : https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic
Pour ce faire, j'utilise sqlalchemy en python pour convertir mon csv en base de données et tracer pour afficher mes résultats.
pip install plotly pip install sqlalchemy
Je crée une classe Main, dans laquelle je récupère mon csv et le mets dans une base de données, en utilisant la méthode get_data.
Le résultat est une liste de tuples, je crée donc la méthode transform_data pour obtenir une liste double.
Enfin, je peux afficher un graphique simple entre le nombre de pages consultées et la durée totale.
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("website_wata.csv") self.df.to_sql("website_data", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text("SELECT Page_Views, Time_on_Page FROM website_data") self.result = self.connection.execute(query).fetchall() def transform_data(self): for i in range(len(self.result)): self.result[i] = list(self.result[i]) def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="" ) fig.show() Main()
L'axe des X indique le nombre de pages visitées par l'utilisateur, tandis que l'axe des Y indique le temps passé sur le site Web en minutes.
On constate que les utilisateurs qui restent le plus longtemps visitent entre 4 et 6 pages, et qu'entre 11 et 15 pages tous les utilisateurs restent au moins quelques minutes.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3