"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > مجموعة بيانات وقت الموقع

مجموعة بيانات وقت الموقع

تم النشر بتاريخ 2024-11-07
تصفح:701

مرحبًا، لقد وجدت مجموعة بيانات على kaggle في وقت استخدام موقع الويب، لذلك أريد العثور على نسبة بين عدد الصفحات التي تمت زيارتها وإجمالي الوقت في موقع الويب.

يمكنك العثور على مجموعة البيانات والكود في جيثب الخاص بي: https://github.com/victordalet/Kaggle_analogy/tree/feat/website_traffic


أنا - التثبيت

للقيام بذلك، أستخدم sqlalchemy في python لتحويل ملف CSV الخاص بي إلى قاعدة بيانات وعرض نتائجي بشكل مخطط.

pip install plotly
pip install sqlalchemy

ثانيا - الكود

أقوم بإنشاء فئة رئيسية، حيث أقوم باسترداد ملف CSV الخاص بي ووضعه في قاعدة بيانات، باستخدام طريقة get_data.
والنتيجة هي قائمة من الصفوف، لذلك قمت بإنشاء طريقة Transform_data للحصول على قائمة مزدوجة.
وأخيرا، يمكنني عرض رسم بياني بسيط بين عدد الصفحات التي تم عرضها والوقت الإجمالي.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

ثالثا - النتيجة

يشير المحور السيني إلى عدد الصفحات التي زارها المستخدم، بينما يوضح المحور الصادي الوقت الذي يقضيه المستخدم في الموقع بالدقائق.

يمكننا أن نرى أن المستخدمين الذين يبقون أطول زيارة تتراوح بين 4 و6 صفحات، وأن جميع المستخدمين الذين يبقون بين 11 و15 صفحة يبقون بضع دقائق على الأقل.

Website Time dataset

بيان الافراج يتم استنساخ هذه المقالة على: https://dev.to/victordalet/website-tim-dataset-3k47؟1 إذا كان هناك أي انتهاك ، فيرجى الاتصال بـ [email protected] لحذفه.
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3