当前所在位置:珠峰网资料 >> 计算机 >> 计算机等级考试 >> 正文
解决Java抓取页面遇到客户端身份认证的办法
发布时间:2010/6/12 11:47:29 来源:城市学习网 编辑:ziteng
  通过JAVA抓取页面时,有些页面会返回401(Unauthorized)响应状态码和www-authenticate响应头来要求客户端进行身份认证。这种认证有两种方式:BASIC和DIGEST,BASIC验证要求客户端对用户名和密码进行BASE64编码后传送给服务器。DIGEST的认证方式的细节比较复杂,会经过一系列的加密,所以很难被破译。
  JAVA提供一个用于启用身份认证的类,可以支持HTTP协议中的多个认证方式,这个类是java.net.Authenticator,使用方法如下:
  package com.xixuyishi;
  import java.io.BufferedReader;
  import java.io.InputStream;
  import java.io.InputStreamReader;
  import java.net.Authenticator;
  import java.net.PasswordAuthentication;
  import java.net.URL;
  public class RunHttpSpnego {
  static final String kuser = "username"; // 用户名
  static final String kpass = "password"; // 密码
  static class MyAuthenticator extends Authenticator {
  @Override
  public PasswordAuthentication
  getPasswordAuthentication() {
  return (new PasswordAuthentication(kuser,
  kpass.toCharArray()));
  }
  }
  public static void main(String[] args) throws Exception {
  Authenticator.setDefault(new MyAuthenticator());
  URL url = new URL(args[0]);
  InputStream ins = url.openConnection().getInputStream();
  BufferedReader reader = new BufferedReader(new
  InputStreamReader(ins));
  String str;
  while ((str = reader.readLine()) != null)
  System.out.println(str);
  }
  只需要创建一个继续自Authenticator的类,并且重写其中的getPasswordAuthentication()方法,将用户名和密码放入方法中,这样在需要使用身份认证的地方实现这个类就可以了。
广告合作:400-664-0084 全国热线:400-664-0084
Copyright 2010 - 2017 www.my8848.com 珠峰网 粤ICP备15066211号
珠峰网 版权所有 All Rights Reserved