ग्रुपबाय ऑपरेशंस के दौरान अन्य कॉलम बनाए रखना
पांडा डेटाफ्रेम पर ग्रुपबाय ऑपरेशन करते समय, अक्सर उन कॉलमों को बनाए रखना आवश्यक होता है जो नहीं हैं समूहीकरण या एकत्रीकरण प्रक्रिया में शामिल। डिफ़ॉल्ट रूप से, ऑपरेशन पूरा होने पर ये अन्य कॉलम हटा दिए जाते हैं। यदि रखे गए कॉलम में बहुमूल्य जानकारी है तो यह समस्याग्रस्त हो सकता है।
निम्न डेटा फ़्रेम पर विचार करें:
item diff otherstuff 0 1 2 1 1 1 1 2 2 1 3 7 3 2 -1 0 4 2 1 3 5 2 4 9 6 2 -6 2 7 3 0 0 8 3 2 9
यदि हम डेटा फ़्रेम को "आइटम" कॉलम के आधार पर समूहित करें और "अंतर" कॉलम का न्यूनतम मान ज्ञात करें, तो परिणामी डेटा फ़्रेम इस तरह दिखेगा:
item diff 0 1 1 1 2 -6 2 3 0
ध्यान दें कि "अन्य सामान" कॉलम हटा दिया गया है। इस कॉलम को बनाए रखने के लिए, हम न्यूनतम अंतर के तत्वों के सूचकांक प्राप्त करने के लिए idxmin() विधि का उपयोग कर सकते हैं, और फिर उनका चयन कर सकते हैं:
>>> df.loc[df.groupby("item")["diff"].idxmin()] item diff otherstuff 1 1 1 2 6 2 -6 2 7 3 0 0 [3 rows x 3 columns]
दूसरी विधि डेटा फ़्रेम को "अंतर" कॉलम के आधार पर क्रमबद्ध करना है, और फिर प्रत्येक आइटम समूह में पहला तत्व लेना है:
>>> df.sort_values("diff").groupby("item", as_index=False).first() item diff otherstuff 0 1 1 2 1 2 -6 2 2 3 0 0 [3 rows x 3 columns]
ये दोनों विधियाँ "अन्य सामान" कॉलम को बनाए रखते हुए वांछित परिणाम देंगी। ध्यान रखें कि परिणामी सूचकांक भिन्न हो सकते हैं, भले ही पंक्ति की सामग्री समान हो।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3