في Python، يوفر BeautifulSoup طرقًا قوية لتحليل مستندات HTML. عندما تواجه مثل هذا السيناريو حيث تحتاج إلى استرداد بيانات محددة من جدول، فإن BeautifulSoup يكون مفيدًا.
لاستخراج جدول العناصر المستهدفة، استخدم Soup.find()، مع تحديد السمات المناسبة داخل بين قوسين. في هذه الحالة، ستحتاج إلى:
table = soup.find("table", {"class": "lineItemsTable"})
بعد ذلك، يمكنك التكرار مرة أخرى كل صف في الجدول باستخدام table.findAll("tr"). داخل كل صف، يمكنك الوصول إلى خلايا الجدول (td) باستخدامrow.findAll("td").
إليك مقتطف التعليمات البرمجية المحسن:
data = []
table_body = table.find('tbody')
rows = table_body.find_all('tr')
for row in rows:
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols]
data.append([ele for ele in cols if ele]) # Remove empty values
سينتج هذا الرمز قائمة من القوائم، حيث تمثل كل قائمة فرعية صفًا في الجدول. فإنه سيتم التقاط البيانات اللازمة بكفاءة من الموقع.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3