"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > كيف يمكن استخدام BeautifulSoup لاستخراج البيانات من جدول HTML في بايثون؟

كيف يمكن استخدام BeautifulSoup لاستخراج البيانات من جدول HTML في بايثون؟

تم النشر بتاريخ 2024-11-07
تصفح:487

How can BeautifulSoup be used to extract data from a HTML table in Python?

جدول تحليل BeautifulSoup

في Python، يوفر BeautifulSoup طرقًا قوية لتحليل مستندات HTML. عندما تواجه مثل هذا السيناريو حيث تحتاج إلى استرداد بيانات محددة من جدول، فإن BeautifulSoup يكون مفيدًا.

لاستخراج جدول العناصر المستهدفة، استخدم Soup.find()، مع تحديد السمات المناسبة داخل بين قوسين. في هذه الحالة، ستحتاج إلى:

table = soup.find("table", {"class": "lineItemsTable"})

بعد ذلك، يمكنك التكرار مرة أخرى كل صف في الجدول باستخدام table.findAll("tr"). داخل كل صف، يمكنك الوصول إلى خلايا الجدول (td) باستخدامrow.findAll("td").

إليك مقتطف التعليمات البرمجية المحسن:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

سينتج هذا الرمز قائمة من القوائم، حيث تمثل كل قائمة فرعية صفًا في الجدول. فإنه سيتم التقاط البيانات اللازمة بكفاءة من الموقع.

أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3