"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 웹사이트 시간 데이터세트

웹사이트 시간 데이터세트

2024-11-07에 게시됨
검색:714

안녕하세요, 웹사이트 이용시간에 캐글에서 데이터셋을 찾았는데, 방문한 페이지 수와 웹사이트에 머문 총 시간의 비율을 알고 싶습니다.

내 github에서 데이터 세트와 코드를 찾을 수 있습니다: https://github.com/victordalet/Kaggle_analytic/tree/feat/website_traffic


나 - 설치

이를 위해 Python에서 sqlalchemy를 사용하여 내 csv를 데이터베이스로 변환하고 결과를 표시합니다.

pip install plotly
pip install sqlalchemy

II - 코드

저는 get_data 메서드를 사용하여 내 csv를 검색하고 데이터베이스에 저장하는 Main 클래스를 만듭니다.
결과는 튜플 목록이므로 이중 목록을 얻기 위해 변환_데이터 메서드를 만듭니다.
마지막으로 조회한 페이지 수와 총 시간을 간단한 그래프로 표시할 수 있습니다.

import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("website_wata.csv")
        self.df.to_sql("website_data", self.engine, index=False, if_exists="append")
        self.get_data()
        self.transform_data()
        self.display_graph()


    def get_data(self):
        self.connection = self.engine.connect()
        query = text("SELECT Page_Views, Time_on_Page FROM website_data")
        self.result = self.connection.execute(query).fetchall()

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = list(self.result[i])


    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title=""
        )
        fig.show()


Main()

III - 결과

x축은 사용자가 방문한 페이지 수를 나타내고, y축은 웹사이트에서 보낸 시간을 분 단위로 나타냅니다.

가장 오래 머무르는 사용자는 4~6페이지에서, 11~15페이지에서는 모든 사용자가 최소 몇 분 이상 머무르는 것을 확인할 수 있습니다.

Website Time dataset

릴리스 선언문 이 글은 https://dev.to/victordalet/website-time-dataset-3k47?1 에서 복제되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3