Configurando o agente do usuário de uma URLConnection Java
Ao tentar analisar uma página da web usando Java com URLConnection e definir o agente do usuário para um determinado valor, um "Java/1.5.0_19" adicional pode ser anexado ao final. Isso ocorre devido a uma limitação nas versões mais antigas do Java.
Solução (Java 1.6.30 e mais recente)
No Java 1.6.30 e mais recente, esse problema ocorreu foi resolvido. Definir o agente do usuário usando setRequestProperty("User-Agent", "Mozilla ...") agora funciona corretamente sem anexar a versão Java.
Verificação
Para verificar Para fazer isso, você pode escutar em uma porta usando o netcat, que exibe os cabeçalhos HTTP brutos das solicitações recebidas. Sem definir o agente do usuário, os cabeçalhos mostrarão:
GET /foobar HTTP/1.1 User-Agent: Java/1.6.0_30 Host: localhost:8080 Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2 Connection: keep-alive
Ao definir o agente do usuário, os cabeçalhos mostrarão:
GET /foobar HTTP/1.1 User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2 Host: localhost:8080 Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2 Connection: keep-alive
Código de exemplo (Java 1.6.30 )
O exemplo de código a seguir demonstra como definir corretamente o agente do usuário:
import java.io.IOException; import java.net.URL; import java.net.URLConnection; public class TestUrlOpener { public static void main(String[] args) throws IOException { URL url = new URL("http://localhost:8080/foobar"); URLConnection hc = url.openConnection(); hc.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2"); System.out.println(hc.getContentType()); } }
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3