पांडा का उपयोग करके सेमी कोलन से अलग की गई .CSV फ़ाइलों को पार्स करना
अल्पविराम से अलग किए गए मान (CSV) फ़ाइलों से निपटते समय, इसे ठीक से संभालना आवश्यक है सटीक डेटा पार्सिंग सुनिश्चित करने के लिए विभाजक। पांडा अर्ध कोलन जैसे गैर-मानक विभाजकों के साथ सीएसवी फ़ाइलों को पढ़ने के लिए एक सीधा समाधान प्रदान करता है।
इस परिदृश्य पर विचार करें: आपके पास निम्न के समान प्रारूप वाली एक .csv फ़ाइल है:
a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
इस फ़ाइल को पांडा डेटाफ़्रेम में आयात करने के लिए, आप read_csv() फ़ंक्शन का उपयोग कर सकते हैं। हालाँकि, डिफ़ॉल्ट रूप से, पांडा मानते हैं कि विभाजक एक अल्पविराम है। सेमी कोलन सेपरेटर निर्दिष्ट करने के लिए, sep पैरामीटर का उपयोग इस प्रकार करें:
import pandas as pd
csv_path = "C:...."
data = pd.read_csv(csv_path, sep=';')
यदि आप sep पैरामीटर निर्दिष्ट करना भूल जाते हैं, तो पांडा का डिफ़ॉल्ट व्यवहार सभी डेटा को एक कॉलम के रूप में मानना है, जिसके परिणामस्वरूप मुद्रण करते समय गलत परिणाम आते हैं डेटाफ़्रेम।
इस डिफ़ॉल्ट व्यवहार का कारण यह है कि पांडा मानते हैं कि अल्पविराम सबसे आम विभाजक हैं। एसईपी पैरामीटर प्रदान करके, आप स्पष्ट रूप से पांडा को अर्ध कोलन को विभाजक के रूप में उपयोग करने का निर्देश देते हैं, जिससे आपके डेटा की सही पार्सिंग सुनिश्चित होती है। सितम्बर=';' सटीक डेटा पार्सिंग प्राप्त करने के लिए read_csv() फ़ंक्शन में।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3