नमस्कार, मुझे कागल में अमेज़ॅन उत्पादों का एक डेटासेट मिला और मैंने कीमत और स्टार रेटिंग के बीच संबंध खोजने का फैसला किया।
पूर्ण कोड:
https://github.com/victordalet/Kaggle_analyse/tree/feat/amazon_products
ऐसा करने के लिए, मैं सीएसवी फ़ाइल को एक छोटे डेटाबेस में परिवर्तित करने के लिए, और जानकारी को प्लॉटली प्रदर्शित करने के लिए SQLAlchemy का उपयोग करता हूं।
pip install SQLAlchemy pip install plotly
निम्नलिखित स्क्रिप्ट में, मैं डेटा निकालता हूं और प्राप्त करता हूं:
import pandas as pd from sqlalchemy import create_engine, text import plotly.express as px class Main: def __init__(self): self.result = None self.connection = None self.engine = create_engine("sqlite:///my_database.db", echo=False) self.df = pd.read_csv("amazon_product.csv") self.df.to_sql("products", self.engine, index=False, if_exists="append") self.get_data() self.transform_data() self.display_graph() self.get_data_number_start_and_price() self.transform_data() self.display_graph() self.get_data_number_start_and_start() self.display_graph() def get_data(self): self.connection = self.engine.connect() query = text( "SELECT product_price, product_star_rating FROM products where product_price != '$0.00'" ) self.result = self.connection.execute(query).fetchall() def get_data_number_start_and_price(self): query = text( "SELECT product_price, product_num_ratings FROM products where product_price != '$0.00'" ) self.result = self.connection.execute(query).fetchall() def get_data_number_start_and_start(self): query = text( "SELECT product_star_rating, product_num_ratings FROM products where product_price != '$0.00'" ) self.result = self.connection.execute(query).fetchall() for i in range(len(self.result)): self.result[i] = [self.result[i][0], self.result[i][1]] def transform_data(self): for i in range(len(self.result)): self.result[i] = [float(self.result[i][0].split("$")[1]), self.result[i][1]] def display_graph(self): fig = px.scatter( self.result, x=0, y=1, title="Amazon Product Price vs Star Rating" ) fig.show() Main()
हम देख सकते हैं, जरूरी नहीं कि कीमत और रेटिंग के बीच कोई संबंध हो, लेकिन कीमत जितनी अधिक होगी, रेटिंग उतनी ही कम होगी, और जितनी अधिक समीक्षाएं, रेटिंग उतनी ही अधिक होगी।
जो तर्कसंगत लगता है, क्योंकि यदि कोई उत्पाद बहुत अधिक खरीदा जाता है, तो इसका मतलब है कि वह लोकप्रिय है।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3