पांडा में समूहीकृत डेटाफ़्रेम में एक कॉलम कैसे जोड़ें
डेटा विश्लेषण में, डेटा को समूहीकृत करना और उस पर गणना करना अक्सर आवश्यक होता है प्रत्येक समूह. पांडा अपने ग्रुपबाय फ़ंक्शन के माध्यम से ऐसा करने का एक सुविधाजनक तरीका प्रदान करता है। एक सामान्य कार्य प्रत्येक समूह के भीतर एक कॉलम के मानों की गणना करना और डेटाफ़्रेम में इन गणनाओं वाला एक कॉलम जोड़ना है।
डेटाफ़्रेम df पर विचार करें:
df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})
प्रत्येक c के प्रकार के मानों की गणना करने के लिए, हम समूहीकृत डेटाफ़्रेम पर value_counts फ़ंक्शन का उपयोग कर सकते हैं:
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
यह ग्रुप काउंट के साथ एक नया डेटाफ्रेम g बनाता है। प्रत्येक समूह के आकार के साथ जी में एक कॉलम जोड़ने के लिए, हम ट्रांसफॉर्म फ़ंक्शन का उपयोग कर सकते हैं:
g['size'] = df.groupby('c')['type'].transform('size')
ट्रांसफ़ॉर्म मूल डेटाफ़्रेम में प्रत्येक समूह पर एक फ़ंक्शन लागू करता है और मूल डेटाफ़्रेम के साथ संरेखित इंडेक्स के साथ एक श्रृंखला लौटाता है। इस मामले में, हम प्रत्येक समूह में तत्वों की संख्या की गणना करने और इसे नए कॉलम आकार में निर्दिष्ट करने के लिए आकार फ़ंक्शन का उपयोग करते हैं। परिणामी डेटाफ़्रेम जी अब इस तरह दिखेगा:
c type t size
0 1 m 1 3
1 1 n 1 3
2 1 o 1 3
3 2 m 2 4
4 2 n 2 4
यह समूह द्वारा एकत्रीकरण के परिणामों के आधार पर समूहीकृत डेटाफ्रेम में एक नया कॉलम जोड़ने का एक सीधा तरीका प्रदर्शित करता है।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3