इष्टतम हिस्टोग्राम बिन आकार का निर्धारण
डेटा विश्लेषण में, डेटा के वितरण को दृश्य रूप से दर्शाने के लिए हिस्टोग्राम मूल्यवान उपकरण हैं। हालाँकि स्क्रिप्टिंग भाषाओं का उपयोग करके हिस्टोग्राम उत्पन्न करना संभव है, क्या यह प्रक्रिया सीधे SQL के भीतर पूरी की जा सकती है? इसका उत्तर हाँ है, और निम्नलिखित प्रश्न इस विषय पर प्रकाश डालता है।
मुख्य चुनौती हिस्टोग्राम डिब्बे के आकार को परिभाषित करने में है। ज्यादातर मामलों में, लक्ष्य अधिक जानकारीपूर्ण और व्यापक प्रतिनिधित्व प्राप्त करने के लिए डेटा को पूर्वनिर्धारित श्रेणियों में समूहित करना है। प्रस्तुत प्रश्न एक SQL क्वेरी प्रदान करता है जो डेटा को "कुल" नामक पूर्णांक कॉलम द्वारा समूहित करता है, लेकिन यह भी नोट करता है कि परिणामी पंक्तियाँ बहुत अधिक हैं, जिससे वितरण की कल्पना करना मुश्किल हो जाता है।
इसका समाधान डेटा को बकेट करने में निहित है। बड़े डिब्बे में. इसे प्राप्त करने के लिए मूल SQL क्वेरी को संशोधित किया जा सकता है:
SELECT ROUND(total, -2) AS bucket,
COUNT(*) AS count
FROM faults
GROUP BY bucket;
राउंड फ़ंक्शन, एक नकारात्मक तर्क के साथ, "कुल" मानों को निकटतम पूर्वनिर्धारित अंतराल में पूर्णांकित करता है। इस मामले में, अंतराल -2 पर सेट है, जिसका अर्थ है निकटतम 100 (-2) तक पूर्णांक बनाना। यह [0-99], [100-199], और इसी तरह की श्रेणियों के साथ डिब्बे बनाता है। एक अधिक संक्षिप्त और सार्थक हिस्टोग्राम। आउटपुट प्रश्न में दिए गए उदाहरण जैसा होगा:
-------------------------------- | कुल | गिनती(कुल) | ---------------------- | 30 - 40 | 23 | | 40 - 50 | 15 | | 50 - 60 | 51 | | 60 - 70 | 45 | ------------------------------
------------ --------------- | total | count(total) | ------------ --------------- | 30 - 40 | 23 | | 40 - 50 | 15 | | 50 - 60 | 51 | | 60 - 70 | 45 | ------------------------------
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3