تخطي الصفوف أثناء استيراد ملف CSV باستخدام Pandas
عند استيراد بيانات CSV باستخدام Pandas، غالبًا ما يكون من الضروري تخطي الصفوف التي لا تريدها لتضمينها في التحليل الخاص بك. ومع ذلك، فإن الغموض الذي يحيط بوسيطة التخطي يمكن أن يكون مربكًا.
بناء جملة التخطي هو كما يلي:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
السؤال الذي يطرح نفسه: كيف يعرف الباندا ما إذا كان يجب تخطي الصف الأول أو الصف الذي يحتوي على فهرس 1 عندما يتم تحديد Skirows=1؟
لكشف هذا، فلنجري تجربة باستخدام نموذج ملف CSV مكون من ثلاثة صفوف:
1, 2 3, 4 5, 6
تخطي الصف الذي يحتوي على الفهرس 1
إذا كنت تريد تخطي الصف الذي يحتوي على الفهرس 1، فقم بتمرير صفوف التخطي كقائمة:
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
الإخراج:
0 1 0 1 2 1 5 6
تخطي عدد من الصفوف
لتخطي عدد محدد من الصفوف (في هذه الحالة، 1)، قم بتمرير Skiprows كعدد صحيح:
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
الإخراج:
0 1 0 3 4 1 5 6
وبالتالي، فمن الواضح أن الوسيطة Skiprows تتصرف بشكل مختلف اعتمادًا على ما إذا كنت تقدم قائمة أو عددًا صحيحًا. إذا كنت تريد تخطي صف حسب فهرسه، فاستخدم القائمة. بخلاف ذلك، استخدم عددًا صحيحًا لتخطي عدد محدد من الصفوف من بداية الملف.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3