मैं पायथन में मल्टीपल वर्ड बाउंड्री डिलीमीटर का उपयोग करके स्ट्रिंग्स को शब्दों में कैसे विभाजित कर सकता हूं?

मुखपृष्ठ > प्रोग्रामिंग > मैं पायथन में मल्टीपल वर्ड बाउंड्री डिलीमीटर का उपयोग करके स्ट्रिंग्स को शब्दों में कैसे विभाजित कर सकता हूं?

मैं पायथन में मल्टीपल वर्ड बाउंड्री डिलीमीटर का उपयोग करके स्ट्रिंग्स को शब्दों में कैसे विभाजित कर सकता हूं?

2024-12-23 को प्रकाशित

ब्राउज़ करें:791

How Can I Split Strings into Words Using Multiple Word Boundary Delimiters in Python?

मल्टीपल वर्ड बाउंड्री डिलीमीटर के साथ स्ट्रिंग्स को शब्दों में विभाजित करना

टेक्स्टुअल डेटा के साथ काम करते समय, एक सामान्य कार्य में स्ट्रिंग्स को अलग-अलग शब्दों में विभाजित करना शामिल होता है। पायथन की str.split() विधि एक सीधा समाधान प्रदान करती है, लेकिन यह अपने तर्क के रूप में केवल एक सीमांकक का समर्थन करती है। यह सीमा उस पाठ से निपटने में बाधा बन सकती है जिसमें कई प्रकार की शब्द सीमाएं होती हैं, जैसे विराम चिह्न।

पायथन री मॉड्यूल एक शक्तिशाली विकल्प प्रदान करता है: re.split()। यह फ़ंक्शन आपको शब्द सीमा सीमांकक के रूप में उपयोग करने के लिए एक पैटर्न निर्दिष्ट करने की अनुमति देता है। पैटर्न में एक साथ कई प्रकार की सीमाओं से मेल खाने के लिए नियमित अभिव्यक्तियां शामिल हो सकती हैं। आप - आप यहाँ क्या कर रहे हैं!?"

आप निम्नलिखित नियमित अभिव्यक्ति पैटर्न का उपयोग कर सकते हैं:

"Hey, you - what are you doing here!?"

यह पैटर्न गैर-शब्द वर्णों (वर्णमाला, संख्यात्मक, या अंडरस्कोर) के किसी भी अनुक्रम से मेल खाता है। जब re.split() के साथ उपयोग किया जाता है, तो यह इन वर्णों की सभी घटनाओं पर स्ट्रिंग को विभाजित कर देगा, प्रभावी ढंग से शब्दों की एक सूची तैयार करेगा।

'\W '

import दोबारा टेक्स्ट = "अरे, आप - आप यहाँ क्या कर रहे हैं!?" शब्द = re.split('\W', पाठ) प्रिंट(शब्द)

आउटपुट:

import re

text = "Hey, you - what are you doing here!?"
words = re.split('\W ', text)

print(words)

जैसा कि आप देख सकते हैं, re.split() प्रभावी ढंग से स्ट्रिंग को अलग-अलग शब्दों में विभाजित करता है, कई सीमांककों की उपस्थिति के बावजूद सही शब्द सीमाओं को संरक्षित करता है। यह लचीलापन इसे जटिल पाठ पार्सिंग परिदृश्यों को संभालने के लिए एक मूल्यवान उपकरण बनाता है, जहां एकाधिक शब्द सीमा सीमांकक का सामना करना पड़ता है।

नवीनतम ट्यूटोरियल अधिक>

मैं जावा में निर्देशिका परिवर्तन सहित कमांड प्रॉम्प्ट कमांड को कैसे निष्पादित कर सकता हूं?
] यद्यपि आपको कोड स्निपेट मिल सकते हैं जो कमांड प्रॉम्प्ट खोलते हैं, वे अक्सर निर्देशिकाओं को बदलने और अतिरिक्त कमांड को निष्पादित करने की क्षमता में ...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
क्या आप Chrome और फ़ायरफ़ॉक्स में CSS को कंसोल आउटपुट का उपयोग कर सकते हैं?
] संदेश? इसे प्राप्त करने के लिए, निम्नलिखित पैटर्न का उपयोग करें: कंसोल.लॉग (' %C ओह माय हैवेन्स!', 'बैकग्राउंड: #222; रंग: #bada55'...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
मैं नोड-MYSQL का उपयोग करके एक ही क्वेरी में कई SQL स्टेटमेंट को कैसे निष्पादित कर सकता हूं?
बयानों को अलग करने के लिए अर्ध-उपनिवेश (;)। हालाँकि, यह एक त्रुटि है कि SQL सिंटैक्स में कोई त्रुटि है। इस सुविधा को सक्षम करने के लिए, आपको एक कनेक्...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
Microsoft Visual C ++ दो-चरण टेम्पलेट तात्कालिकता को सही ढंग से लागू करने में विफल क्यों होता है?
तंत्र के कौन से विशिष्ट पहलू अपेक्षित रूप से संचालित करने में विफल होते हैं? हालाँकि, इस बारे में संदेह उत्पन्न होता है कि क्या यह चेक सत्यापित करता ...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
Chatbot कमांड निष्पादन के लिए वास्तविक समय में कैसे कैप्चर और स्ट्रीम करें?
] हालाँकि, वास्तविक समय में स्टडआउट को पुनः प्राप्त करने का प्रयास करते समय चुनौतियां उत्पन्न होती हैं। इसे दूर करने के लिए, हमें स्क्रिप्ट के निष्पाद...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
$मुझे अपने लिनक्स सर्वर पर आर्काइव_जिप स्थापित करने के बाद एक \ "क्लास \ 'ziparchive \' नहीं मिला \" त्रुटि क्यों मिल रही है?$
मुझे अपने लिनक्स सर्वर पर आर्काइव_जिप स्थापित करने के बाद एक \ "क्लास \ 'ziparchive \' नहीं मिला \" त्रुटि क्यों मिल रही है?
घातक त्रुटि: घातक त्रुटि: वर्ग Ziparchive में नहीं मिला ... कारण: इस समस्या को हल करें, इन चरणों का पालन करें: Fatal error: Class ZipArchiv...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
संस्करण 5.6.5 से पहले MySQL में टाइमस्टैम्प कॉलम के साथ current_timestamp का उपयोग करने पर क्या प्रतिबंध थे?
] Current_timestamp क्लॉज। यह सीमा INT, BigInt, और SmallInt पूर्णांक को वापस बढ़ाती है जब उन्हें शुरू में 2008 में पेश किया गया था। यह सीमा विरासत क...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
रिप्लेस डायरेक्टिव का उपयोग करके GO MOD में मॉड्यूल पथ विसंगतियों को कैसे हल करें?
यह गूँज के संदेशों द्वारा प्रदर्शित होने के कारण, ` github.com/coreos/etcd/client द्वारा github.com/coreos/tcd/client.test आयात आयात github.co...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
मैं PHP के फाइलसिस्टम फ़ंक्शंस में UTF-8 फ़ाइल नाम कैसे संभाल सकता हूं?
incompatibilities। mkdir ($ dir_name); मूल UTF-8 फ़ाइल नाम को पुनः प्राप्त करने के लिए, urldecode का उपयोग करें। केवल) विंडोज पर, आप UTF-8 फ़ा...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
Eval () बनाम ast.literal_eval (): उपयोगकर्ता इनपुट के लिए कौन सा पायथन फ़ंक्शन सुरक्षित है?
] eval (), एक शक्तिशाली पायथन फ़ंक्शन, अक्सर एक संभावित समाधान के रूप में उत्पन्न होता है, लेकिन चिंताएं इसके संभावित जोखिमों को घेरती हैं। यह लेख eva...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
HTML स्वरूपण टैग
HTML स्वरूपण तत्व ] HTML हमें CSS का उपयोग किए बिना पाठ को प्रारूपित करने की क्षमता प्रदान करता है। HTML में कई स्वरूपण टैग हैं। इन टैगों ...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
जावास्क्रिप्ट में कई चर घोषित करने के लिए कौन सी विधि अधिक बनाए रखने योग्य है?
] इसके लिए दो सामान्य दृष्टिकोण हैं: प्रत्येक चर को एक अलग लाइन पर घोषित करना: var चर १ = "हैलो, दुनिया!" var चर 2 = "परीक्षण ...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
फ़ायरफ़ॉक्स बैक बटन का उपयोग करते समय जावास्क्रिप्ट निष्पादन क्यों बंद हो जाता है?
] यह समस्या क्रोम और इंटरनेट एक्सप्लोरर जैसे अन्य ब्राउज़रों में नहीं होती है। इस समस्या को हल करने के लिए और बाद के पृष्ठ के दौरे पर स्क्रिप्ट निष्पा...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
क्या जावा कई प्रकार के रिटर्न प्रकार की अनुमति देता है: जेनेरिक तरीकों पर एक करीब से नज़र डालें?
java में कई प्रकार के रिटर्न प्रकार: एक गलत धारणा का अनावरण किया गया जहां फू एक कस्टम वर्ग है। विधि घोषणा दो रिटर्न प्रकार का दावा करती ह...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया
पायथन पढ़ें CSV फ़ाइल Unicodedecodeerror अल्टीमेट सॉल्यूशन
डिकोड बाइट्स स्थिति 2-3 में: truncated \ uxxxxxxxxx escape यह त्रुटि तब होती है जब CSV फ़ाइल के पथ में विशेष वर्ण होते हैं या यूनिकोड होता है कि पा...

प्रोग्रामिंग 2025-04-07 पर पोस्ट किया गया