مرحبًا، لقد وجدت مجموعة بيانات على kaggle في وقت استخدام موقع الويب، لذلك أريد العثور على نسبة بين عدد الصفحات التي تمت زيارتها وإجمالي الوقت في موقع الويب.
يمكنك العثور على مجموعة البيانات والكود في جيثب الخاص بي: https://github.com/victordalet/Kaggle_analogy/tree/feat/website_traffic
للقيام بذلك، أستخدم sqlalchemy في python لتحويل ملف CSV الخاص بي إلى قاعدة بيانات وعرض نتائجي بشكل مخطط.
pip install plotly pip install sqlalchemy
أقوم بإنشاء فئة رئيسية، حيث أقوم باسترداد ملف CSV الخاص بي ووضعه في قاعدة بيانات، باستخدام طريقة get_data.
والنتيجة هي قائمة من الصفوف، لذلك قمت بإنشاء طريقة Transform_data للحصول على قائمة مزدوجة.
وأخيرا، يمكنني عرض رسم بياني بسيط بين عدد الصفحات التي تم عرضها والوقت الإجمالي.
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("website_wata.csv") self.df.to_sql("website_data", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text("SELECT Page_Views, Time_on_Page FROM website_data") self.result = self.connection.execute(query).fetchall() def transform_data(self): for i in range(len(self.result)): self.result[i] = list(self.result[i]) def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="" ) fig.show() Main()
يشير المحور السيني إلى عدد الصفحات التي زارها المستخدم، بينما يوضح المحور الصادي الوقت الذي يقضيه المستخدم في الموقع بالدقائق.
يمكننا أن نرى أن المستخدمين الذين يبقون أطول زيارة تتراوح بين 4 و6 صفحات، وأن جميع المستخدمين الذين يبقون بين 11 و15 صفحة يبقون بضع دقائق على الأقل.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3