首页>>程序代码>>Java HTMLParser框架遍历标签内容
Java HTMLParser框架遍历标签内容
来源: 时间: 2015-02-11 20:56:53

Parser parser = Parser.createParser(content,"utf-8") ;

HtmlPage nowpage = new HtmlPage(parser);

try

parser.visitAllNodesWith(nowpage);

}

catch (ParserException e1){

e1 = null;

}

NodeList nodelist = nowpage.getBody();

System.out.println(nodelist) ;

NodeFilter filter = new TagNameFilter("Meta");

nodelist = nodelist.extractAllNodesThatMatch(filter, true);

System.out.println(nodelist.size() + "***");

for (int i = 0; i < nodelist.size(); i++)

{

LinkTag link=(LinkTag) nodelist.elementAt(i);

System.out.println(link.getAttribute("keywords") + "***");

}

本页地址:http://www.easytd.com/chengxudaima/d_15021120741.html

网友评论留言

验证码 换一张
上一篇:Java递归算法示例及算法分析研究 下一篇:PHP字符串压缩的有关方法