Java での URLConnection のユーザー エージェントのカスタマイズ
Java で URLConnection を使用して Web コンテンツを取得する場合、多くの場合、カスタム ユーザー エージェントの設定が必要になります。正確な Web サイトのクローリングとユーザー シミュレーション。ただし、デフォルトの Java ランタイムは独自の識別子をユーザー エージェント文字列に追加します。これは特定のシナリオでは望ましくない場合があります。
クエリ
Java 開発者が支援を求めましたランタイムによって「Java/1.5.0_19」サフィックスが追加されないユーザー エージェントを設定する場合。ユーザーは、setRequestProperty() を使用してユーザー エージェントを設定する方法を示すコード スニペットを提供しました。
解決策
幸いなことに、Java 1.6.30 以降では、 setRequestProperty("User-Agent", "") によるユーザー エージェントの設定は、追加の Java ランタイム情報を追加しなくても、問題なく機能します。これを実証するために、開発者は netcat を使用して受信 HTTP リクエストをリッスンし、カスタム ユーザー エージェントが Java サフィックスなしで正常に送信されたことを観察しました。
完全な実装
import java.io.IOException; import java.net.URL; import java.net.URLConnection; public class CustomUserAgent { public static void main(String[] args) throws IOException { URL url = new URL("http://localhost:8080/foobar"); URLConnection hc = url.openConnection(); hc.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2"); System.out.println(hc.getContentType()); } }
このアプローチを利用することで、開発者は Java 固有の不要な追加を行うことなく、Java で URLConnection のユーザー エージェントを効果的に設定でき、Web スクレイピングやその他の通信タスクに望ましい動作を保証できます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3