कॉलम ए में डुप्लिकेट हटाते समय पंक्ति को उच्चतम बी मान के साथ रखना
वर्तमान कार्य में कॉलम ए में डुप्लिकेट मान हटाना शामिल है कॉलम बी में उच्चतम मान वाली पंक्ति को संरक्षित करते हुए एक डेटाफ्रेम। इसे प्राप्त करने के लिए, हम पायथन की पांडा लाइब्रेरी के भीतर अंतर्निहित कार्यों का उपयोग कर सकते हैं।
एक दृष्टिकोण में कॉलम ए द्वारा डेटाफ्रेम को सॉर्ट करना और फिर डुप्लिकेट को हटाना शामिल है अंतिम घटना को बनाए रखते हुए। इसे नीचे व्यक्त किया गया है:
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
वैकल्पिक रूप से, एक अधिक लचीला समाधान जो कर सकता है विभिन्न मानदंडों के लिए डेटाफ़्रेम को कॉलम ए द्वारा समूहित करना है। प्रत्येक समूह के भीतर, कॉलम बी में अधिकतम मान वाली पंक्ति निकाली जा सकती है। इसे निम्नलिखित कोड का उपयोग करके प्राप्त किया जा सकता है:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
By इनमें से किसी भी तरीके को लागू करके, आप कॉलम ए में डुप्लिकेट मानों को प्रभावी ढंग से समाप्त कर सकते हैं, जबकि यह सुनिश्चित कर सकते हैं कि उच्चतम बी मान वाली पंक्तियाँ संरक्षित हैं।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3