"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > अमेज़ॅन उत्पाद डेटासेट

अमेज़ॅन उत्पाद डेटासेट

2024-08-29 को प्रकाशित
ब्राउज़ करें:165

नमस्कार, मुझे कागल में अमेज़ॅन उत्पादों का एक डेटासेट मिला और मैंने कीमत और स्टार रेटिंग के बीच संबंध खोजने का फैसला किया।

पूर्ण कोड:
https://github.com/victordalet/Kaggle_analyse/tree/feat/amazon_products


मैं - डेटा तैयार कर रहा हूँ

ऐसा करने के लिए, मैं सीएसवी फ़ाइल को एक छोटे डेटाबेस में परिवर्तित करने के लिए, और जानकारी को प्लॉटली प्रदर्शित करने के लिए SQLAlchemy का उपयोग करता हूं।

pip install SQLAlchemy
pip install plotly

निम्नलिखित स्क्रिप्ट में, मैं डेटा निकालता हूं और प्राप्त करता हूं:

  • कीमत और सितारों की संख्या के बीच का अनुपात
  • अंतिम रेटिंग और सितारों की संख्या
  • कीमत और सितारों की संख्या
import pandas as pd
from sqlalchemy import create_engine, text
import plotly.express as px


class Main:
    def __init__(self):
        self.result = None
        self.connection = None

        self.engine = create_engine("sqlite:///my_database.db", echo=False)
        self.df = pd.read_csv("amazon_product.csv")
        self.df.to_sql("products", self.engine, index=False, if_exists="append")

        self.get_data()
        self.transform_data()
        self.display_graph()
        self.get_data_number_start_and_price()
        self.transform_data()
        self.display_graph()
        self.get_data_number_start_and_start()
        self.display_graph()

    def get_data(self):
        self.connection = self.engine.connect()
        query = text(
            "SELECT product_price, product_star_rating FROM products where product_price != '$0.00'"
        )
        self.result = self.connection.execute(query).fetchall()

    def get_data_number_start_and_price(self):
        query = text(
            "SELECT product_price, product_num_ratings FROM products where product_price != '$0.00'"
        )
        self.result = self.connection.execute(query).fetchall()

    def get_data_number_start_and_start(self):
        query = text(
            "SELECT product_star_rating, product_num_ratings FROM products where product_price != '$0.00'"
        )
        self.result = self.connection.execute(query).fetchall()
        for i in range(len(self.result)):
            self.result[i] = [self.result[i][0], self.result[i][1]]

    def transform_data(self):
        for i in range(len(self.result)):
            self.result[i] = [float(self.result[i][0].split("$")[1]), self.result[i][1]]

    def display_graph(self):
        fig = px.scatter(
            self.result, x=0, y=1, title="Amazon Product Price vs Star Rating"
        )
        fig.show()


Main()

द्वितीय - परिणाम

मूल्य और अंकन

Amazon product dataset

मूल्य और अंकन की संख्या

Amazon product dataset

नोटेशन और राय की संख्या

Amazon product dataset

तृतीय - निष्कर्ष

हम देख सकते हैं, जरूरी नहीं कि कीमत और रेटिंग के बीच कोई संबंध हो, लेकिन कीमत जितनी अधिक होगी, रेटिंग उतनी ही कम होगी, और जितनी अधिक समीक्षाएं, रेटिंग उतनी ही अधिक होगी।
जो तर्कसंगत लगता है, क्योंकि यदि कोई उत्पाद बहुत अधिक खरीदा जाता है, तो इसका मतलब है कि वह लोकप्रिय है।

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://dev.to/victordalet/amazon-product-dataset-h00?1 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3