Android端解析html文件
使用的是 net.htmlparesr.jericho.Source;包中的Source,需要導(dǎo)入jaricho-html-3.1.jar的外部jar包
一下為用這個包解析豆瓣網(wǎng)站的驗(yàn)證碼的代碼
1 URL url = new URL("http://www.douban.com/accounts/login"); 2 URLConnection conn = url.openConnection(); 3 //得到服務(wù)器返回的html連接 轉(zhuǎn)化成的html的對象 4 Source source = new Source(conn); 5 6 List<Element> inputElements = source.getAllElements("input"); 7 for(Element input: inputElements){ 8 if("captcha-id".equals(input.getAttributeValue("name"))){ 9 String id = input.getAttributeValue("value"); 10 String path = "http://www.douban.com/misc/captcha?id="+id+"&size=s"; 11 System.out.println("驗(yàn)證碼圖片的地址為:"+path); 12 } 13 }

浙公網(wǎng)安備 33010602011771號