डेटासेट शोर के साथ कर्व्स को स्मूथ करना: एक व्यावहारिक गाइड
शोर वाले डेटासेट्स के लिए कर्व्स को स्मूथ करना डेटा विश्लेषण में एक आम चुनौती है। इसे संबोधित करने के लिए, शोर के कारण 20% भिन्नता वाले डेटासेट पर विचार करें:
import numpy as np x = np.linspace(0, 2*np.pi, 100) y = np.sin(x) np.random.random(100) * 0.2
इस स्थिति के लिए, सविट्ज़की-गोले फ़िल्टर एक प्रभावी विकल्प है। यह फ़िल्टर डेटा बिंदुओं की विंडो में एक बहुपद को फिट करके और विंडो के केंद्र में मान का अनुमान लगाने के लिए बहुपद का उपयोग करके काम करता है। फिर विंडो को डेटा के साथ स्थानांतरित कर दिया जाता है, और प्रक्रिया दोहराई जाती है, जिसके परिणामस्वरूप एक चिकना वक्र बनता है।
पाइथॉन में सविट्ज़की-गोले फ़िल्टर को लागू करने का तरीका यहां बताया गया है:
import numpy as np
import matplotlib.pyplot as plt
yhat = savgol_filter(y, 51, 3) # window size 51, polynomial order 3
plt.plot(x, y)
plt.plot(x, yhat, color='red')
plt.show()
अंतर्निहित सिग्नल को संरक्षित करते हुए परिणामी वक्र मूल की तुलना में अधिक चिकना होगा।
नोट: यदि आपके पास savgol_filter फ़ंक्शन नहीं है उपलब्ध है, आप इसे निम्न कमांड का उपयोग करके इंस्टॉल कर सकते हैं:
pip install scipy
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3