」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 網站時間資料集

網站時間資料集

發佈於2024-11-07
瀏覽:811

您好,我在kaggle上發現了一個網站使用時間的資料集,所以我想找到訪問頁面數與網站總時間之間的比率。

您可以在我的github中找到資料集和程式碼:https://github.com/victordalet/Kaggle_analysis/tree/feat/website_traffic


一、安裝

為此,我在 python 中使用 sqlalchemy 將 csv 轉換為資料庫,並以繪圖方式顯示我的結果。

pip install plotly
pip install sqlalchemy

II - 代碼

我會建立一個 Main 類,在其中使用 get_data 方法檢索 csv 並將其放入資料庫中。
結果是一個元組列表,因此我創建了transform_data方法來獲取雙列表。
最後,我可以顯示查看的頁面數量和總時間之間的簡單圖表。

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - 結果

x 軸表示使用者造訪的頁數,y 軸表示使用者在網站上花費的時間(以分鐘為單位)。

我們可以看到,在 4 到 6 個頁面之間停留時間最長的用戶,在 11 到 15 個頁面之間,所有用戶都停留了至少幾分鐘。

Website Time dataset

版本聲明 本文轉載於:https://dev.to/victordalet/website-time-dataset-3k47?1如有侵犯,請聯絡[email protected]刪除
最新教學 更多>

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3