पांडा: स्ट्रिंग्स से नंबर निकालना
पांडा में डेटा फ़्रेम के साथ काम करते समय, अक्सर उन कोशिकाओं से संख्यात्मक जानकारी निकालना आवश्यक होता है जिनमें गैर शामिल होते हैं -संख्यात्मक वर्ण. यह चुनौतीपूर्ण हो सकता है, लेकिन पांडा आपको इसे हासिल करने में मदद करने के लिए कई तरीके प्रदान करता है।
संख्या निकालने के लिए str.extract() का उपयोग करना
संख्या निकालने के लिए एक प्रभावी तरीका स्ट्रिंग्स str.extract() है। यह विधि आपको एक नियमित अभिव्यक्ति पैटर्न निर्दिष्ट करने की अनुमति देती है जो उस संख्यात्मक डेटा को परिभाषित करती है जिसे आप कैप्चर करना चाहते हैं। एनपी के रूप में सुन्न आयात करें df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], }) प्रिंट(डीएफ)
आउटपुट:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
})
print(df)
प्रत्येक सेल से संख्याएं निकालने के लिए, आप निम्नलिखित रेगुलर एक्सप्रेशन का उपयोग कर सकते हैं:A 0 1a 1 NaN 2 10a 3 100b 4 0b
रेगेक्स पैटर्न (\d ) एक या अधिक अंकों के किसी भी अनुक्रम को कैप्चर करता है। पैटर्न के चारों ओर कोष्ठक एक कैप्चरिंग समूह बनाते हैं, जिसका उपयोग स्ट्रिंग के मिलान वाले हिस्से को वापस करने के लिए किया जाता है।
df.A.str.extract('(\d )')
0 1
1 NaN
2 10
3 100
4 0
नाम: ए, डीटाइप: ऑब्जेक्टजैसा कि आप देख सकते हैं, वांछित संख्याएं प्रत्येक सेल से सफलतापूर्वक निकाली गई हैं, यहां तक कि वे जिनमें गैर-संख्यात्मक वर्ण शामिल थे। ध्यान दें कि यह विधि केवल पूर्ण संख्याओं के लिए काम करेगी, फ्लोटिंग-पॉइंट संख्याओं के लिए नहीं। अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3