"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > Python कुशल तरीका HTML टैग को पाठ से हटाने का

Python कुशल तरीका HTML टैग को पाठ से हटाने का

2025-04-13 को पोस्ट किया गया
ब्राउज़ करें:946

] यह HTML टैग को प्रभावी ढंग से स्ट्रिपिंग करके प्राप्त किया जा सकता है, जो आपको वांछित सादे पाठ के साथ छोड़ देता है। MlStripper HTML इनपुट लेता है और इसे पार्स करता है, केवल गैर-मार्कअप सामग्री को संरक्षित करता है। 3:

How Can I Efficiently Strip HTML Tags from Text in Python?

io आयात स्ट्रिंग से Html.parser आयात HTMLParser से क्लास MlStripper (HTMLParser): def __init __ (स्व): सुपर () .__ init __ () self.reset () self.strict = false self.convert_charrefs = true self.text = stringio () def हैंडल_डाटा (स्व, डी): self.text.write (d) def get_data (स्व): लौटा। text.getValue () DEF STRIP_TAGS (HTML): s = mlStripper () एसफेड (एचटीएमएल) S.GET_DATA ()

python 2:

से htmlparser आयात htmlparser आयात स्ट्रिंगियो इम्पोर्ट स्ट्रिंग से क्लास MlStripper (HTMLParser): def __init __ (स्व): self.reset () self.text = stringio () def हैंडल_डाटा (स्व, डी): self.text.write (d) def get_data (स्व): लौटा। text.getValue () DEF STRIP_TAGS (HTML): s = mlStripper () एसफेड (एचटीएमएल) S.GET_DATA ()

उपयोग:

बस स्ट्रिप_टैग्स फ़ंक्शन को कॉल करें जो कि HTML इनपुट को एक स्ट्रिंग तर्क के रूप में पास कर रहा है। लौटा हुआ मान सभी HTML टैग के साथ एक स्ट्रिप्ड स्ट्रिंग होगा।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3