„Wenn ein Arbeiter seine Arbeit gut machen will, muss er zuerst seine Werkzeuge schärfen.“ – Konfuzius, „Die Gespräche des Konfuzius. Lu Linggong“
Titelseite > Programmierung > Website-Zeitdatensatz

Website-Zeitdatensatz

Veröffentlicht am 07.11.2024
Durchsuche:974

Hallo, ich habe auf Kaggle einen Datensatz zur Nutzungsdauer einer Website gefunden, daher möchte ich ein Verhältnis zwischen der Anzahl der besuchten Seiten und der Gesamtzeit auf der Website ermitteln.

Sie finden den Datensatz und den Code in meinem Github: https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


I - Installation

Dazu verwende ich sqlalchemy in Python, um meine CSV-Datei in eine Datenbank umzuwandeln und meine Ergebnisse anzuzeigen.

pip install plotly
pip install sqlalchemy

II - Kodex

Ich erstelle eine Hauptklasse, in der ich meine CSV-Datei abrufe und sie mithilfe der Methode get_data in eine Datenbank lege.
Das Ergebnis ist eine Liste von Tupeln, also erstelle ich die Methode transform_data, um eine doppelte Liste zu erhalten.
Schließlich kann ich eine einfache Grafik zwischen der Anzahl der aufgerufenen Seiten und der Gesamtzeit anzeigen.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - Ergebnis

Die x-Achse gibt die Anzahl der vom Benutzer besuchten Seiten an, während die y-Achse die auf der Website verbrachte Zeit in Minuten anzeigt.

Wir können sehen, dass die Benutzer, die am längsten bleiben, zwischen 4 und 6 Seiten besuchen, und dass zwischen 11 und 15 Seiten alle Benutzer mindestens ein paar Minuten bleiben.

Website Time dataset

Freigabeerklärung Dieser Artikel ist reproduziert unter: https://dev.to/victordalet/website-Time-dataset-3k47?1 Wenn es zu Verletzungen besteht, wenden Sie sich bitte an [email protected], um ihn zu löschen.
Neuestes Tutorial Mehr>

Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.

Copyright© 2022 湘ICP备2022001581号-3