] ऐसा इसलिए है क्योंकि वेबसाइटें एंटी-बॉट उपायों को लागू कर सकती हैं जो वास्तविक ब्राउज़रों और स्वचालित स्क्रिप्ट के बीच अंतर करते हैं। इन ब्लॉकों को बायपास करने के लिए, डेवलपर्स ब्राउज़र व्यवहार की नकल करने के लिए तकनीकों को नियोजित कर सकते हैं और कस्टम उपयोगकर्ता एजेंट हेडर उत्पन्न कर सकते हैं। क्रोम या फ़ायरफ़ॉक्स जैसे एक लोकप्रिय ब्राउज़र की नकल करके, अनुरोध लक्ष्य वेबसाइट से वांछित प्रतिक्रिया प्राप्त करने की संभावना में सुधार कर सकते हैं।
आयात अनुरोध
url = 'http://www.ichangtou.com/#company:data_000008.html'
हेडर = {'उपयोगकर्ता-एजेंट': 'मोज़िला/5.0 (मैकिंटोश; इंटेल मैक ओएस एक्स 10_10_1) Applewebkit/537.36 (KHTML, जैसे कि Gecko) Chrome/39.0.2171.95 सफारी/537.36'}}
प्रतिक्रिया = requests.get (URL, हेडर = हेडर)
प्रिंट (response.content)
नकली-useragent लाइब्रेरी
का उपयोग करना अधिक सुविधाजनक दृष्टिकोण के लिए, नकली-useragent लाइब्रेरी उपयोगकर्ता एजेंट स्ट्रिंग्स का एक मजबूत डेटाबेस प्रदान करता है। इस लाइब्रेरी का उपयोग करके, डेवलपर्स आसानी से यथार्थवादी उपयोगकर्ता एजेंट उत्पन्न कर सकते हैं। fake_useragent आयात उपयोगकर्ता से ua = useragent () हेडर = {'उपयोगकर्ता-एजेंट': ua.chrome} प्रतिक्रिया = requests.get (URL, हेडर = हेडर)
ब्राउज़र विज़िट और उपयुक्त उपयोगकर्ता एजेंट हेडर उत्पन्न करके, पायथन के अनुरोध वेबसाइट ब्लॉक को बायपास कर सकते हैं और जानकारी प्राप्त कर सकते हैं जैसे कि यह एक वास्तविक ब्राउज़र से आ रहा था। यह तकनीक वेब कार्यों को स्वचालित करने, प्रतिबंधित सामग्री तक पहुंचने और वेब स्क्रैपिंग संचालन की सटीकता को बढ़ाने के लिए नई संभावनाओं को खोलती है।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3