كيف يمكن استخدام BeautifulSoup لاستخراج البيانات من جدول HTML في بايثون؟

الصفحة الأمامية > برمجة > كيف يمكن استخدام BeautifulSoup لاستخراج البيانات من جدول HTML في بايثون؟

كيف يمكن استخدام BeautifulSoup لاستخراج البيانات من جدول HTML في بايثون؟

تم النشر بتاريخ 2024-11-07

تصفح:487

How can BeautifulSoup be used to extract data from a HTML table in Python?

جدول تحليل BeautifulSoup

في Python، يوفر BeautifulSoup طرقًا قوية لتحليل مستندات HTML. عندما تواجه مثل هذا السيناريو حيث تحتاج إلى استرداد بيانات محددة من جدول، فإن BeautifulSoup يكون مفيدًا.

لاستخراج جدول العناصر المستهدفة، استخدم Soup.find()، مع تحديد السمات المناسبة داخل بين قوسين. في هذه الحالة، ستحتاج إلى:

table = soup.find("table", {"class": "lineItemsTable"})

بعد ذلك، يمكنك التكرار مرة أخرى كل صف في الجدول باستخدام table.findAll("tr"). داخل كل صف، يمكنك الوصول إلى خلايا الجدول (td) باستخدامrow.findAll("td").

إليك مقتطف التعليمات البرمجية المحسن:

data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values

سينتج هذا الرمز قائمة من القوائم، حيث تمثل كل قائمة فرعية صفًا في الجدول. فإنه سيتم التقاط البيانات اللازمة بكفاءة من الموقع.

أحدث البرنامج التعليمي أكثر>

$ما هي الطريقة الأكثر كفاءة للكشف عن نقطة في polygon: تتبع الأشعة أو matplotlib \'s path.contains_points؟$
ما هي الطريقة الأكثر كفاءة للكشف عن نقطة في polygon: تتبع الأشعة أو matplotlib \'s path.contains_points؟
الكشف الفعال في polegon في python تحديد ما إذا كانت النقطة تكمن في مضلع هي مهمة متكررة في الهندسة الحسابية. يعد إيجاد طريقة فعالة لهذه المهمة مف...

برمجة نشر في 2025-04-18
$كيفية إصلاح \ "mysql_config لم يتم العثور عليها \" عند تثبيت mysql-python على ubuntu/linux؟$
كيفية إصلاح \ "mysql_config لم يتم العثور عليها \" عند تثبيت mysql-python على ubuntu/linux؟
خطأ في تثبيت mysql-python: ينشأ هذا الخطأ بسبب مكتبة تطوير MySQL المفقودة. لحل هذه المشكلة ، يوصى باستخدام مستودع التوزيع على Ubuntu. قم بتثبيت...

برمجة نشر في 2025-04-18
كيفية تحليل صفائف JSON في GO باستخدام حزمة `json`؟
مثال: صفيف [] سلسلة } Func Main () { DataJson: = `[" 1 "،" 2 "،" 3 "]` ` ARR: = jsontype {} unmarsh...

برمجة نشر في 2025-04-18
كيف تمنع التقديمات المكررة بعد تحديث النموذج؟
منع عمليات التقديم المكررة مع التحديث معالجة في تطوير الويب ، من الشائع مواجهة مسألة الإبلاغ المكررة عند تحديث الصفحة بعد تقديم النموذج. لمعال...

برمجة نشر في 2025-04-18
لماذا ينتج عن DateTime's PHP :: تعديل ('+1 شهر') نتائج غير متوقعة؟
تعديل شهور مع DateTime PHP: الكشف عن السلوك المقصود عند العمل مع فئة قاعدة بيانات PHP ، قد لا تسفر عن الشهور أو طرحها دائمًا عن النتائج المتوق...

برمجة نشر في 2025-04-18
يحصل jQuery على قيمة مجموعة زر الراديو
توفر هذه المقالة مقتطفات وإجابات مختصرة في كود jQuery بشكل متكرر (الأسئلة الشائعة) فيما يتعلق بمعالجة مجموعات زر الراديو. استرداد قيمة زر الراد...

برمجة نشر في 2025-04-18
كيف يمكنني استبدال سلاسل متعددة بكفاءة في سلسلة Java؟
ومع ذلك ، يمكن أن يكون هذا غير فعال بالنسبة للسلاسل الكبيرة أو عند العمل مع العديد من الأوتار. تتيح لك التعبيرات العادية تحديد أنماط البحث المعقدة ...

برمجة نشر في 2025-04-18
كيفية التحقق مما إذا كان كائن لديه سمة محددة في بيثون؟
فكر في المثال التالي حيث تثير محاولة الوصول إلى خاصية غير محددة خطأً: >>> a = someclass () >>> A.Property Traceback (أحدث مكالمة أخيرة): ملف &...

برمجة نشر في 2025-04-18
كيفية عرض التاريخ والوقت الحاليين بشكل صحيح في "DD/MM/Yyyy HH: MM: SS.SS" في جافا؟
يكمن في استخدام مثيلات التبسيط المختلفة مع أنماط تنسيق مختلفة. الحل: java.text.simpledateformat ؛ استيراد java.util.calendar ؛ استيراد java.ut...

برمجة نشر في 2025-04-18
كيف يمكنني تخصيص تحسينات التجميع في برنامج التحويل البرمجي GO؟
ومع ذلك ، قد يحتاج المستخدمون إلى ضبط هذه التحسينات لمتطلبات معينة. هذا يعني أن المترجم يطبق تلقائيًا التحسينات القائمة على الاستدلال المحدد مسبقً...

برمجة نشر في 2025-04-18
لماذا تفشل Microsoft Visual C ++ في تنفيذ إنشاء مثيل للقالب ثنائي المراحل بشكل صحيح؟
] ما هي الجوانب المحددة للآلية تفشل في العمل كما هو متوقع؟ ومع ذلك ، تنشأ الشكوك فيما يتعلق بما إذا كان هذا الشيك يتحقق مما إذا كان يتم الإعلان عن الأ...

برمجة نشر في 2025-04-18
دليل إنشاء صفحة Fastapi مخصص 404
تعتمد الطريقة المناسبة على متطلباتك المحددة. call_next (طلب) إذا كان الاستجابة. status_code == 404: إرجاع RedirectResponse ("https://fasta...

برمجة نشر في 2025-04-18
$كيفية حل خطأ \ "الاستخدام غير صالح لوظيفة المجموعة \" في MySQL عند العثور على عدد أقصى؟$
كيفية حل خطأ \ "الاستخدام غير صالح لوظيفة المجموعة \" في MySQL عند العثور على عدد أقصى؟
كيفية استرداد الحد الأقصى لعد باستخدام mysql حدد ماكس (العد (*)) من مجموعة EMP1 بالاسم ؛ خطأ 1111 (hy000): الاستخدام غير الصحيح لوظيفة المجموعة...

برمجة نشر في 2025-04-18
استخدم mysqli للحصول على طريقة صفيف أحادية البعد عمود واحد
كيف أحصل على قيم عمود واحد كصفيف أحادي البعد باستخدام mysqli؟ بدلاً من الصفيف أحادي البعد المطلوب ، تتلقى صفيف متعدد الأبعاد. الحل: لاسترداد...

برمجة نشر في 2025-04-18
كيفية استخراج النص داخل الأقواس بكفاءة في PHP باستخدام regex
أحد الأساليب هو استخدام وظائف معالجة سلسلة PHP ، كما هو موضح أدناه: $ fullString = "تجاهل كل شيء باستثناء هذا (النص)" ؛ ، $ fullstrin...

برمجة نشر في 2025-04-18