互联网观察 网站建设 网站运营 网络创业 电子商务 建站软件 建站软件教程 网站开发 网页制作 收藏本站
建站常识 | 域名 | 主机 | 网上开店 | 搜索引擎优化 | 网站推广 | 网络赚钱 | 站长经验 | 个人建站 | 网站设计 | 网页特效 | wap网站

如何利用HTML页面中meta元素?

1:假如说你的站点页面中有这么一句:

<META NAME="robots" CONTENT="index,follow">

你利用Nutch抓取并分析时,如何得到这个meta数值并处理呢?

2:你可以从HtmlParseFilter扩展出一个RobotsParserFilter,用下面的代码得到meta值:

Properties generalMetaTags = metaTags.getGeneralTags();
String robots = generalMetaTags.getProperty("robots");

3:增加这个值到metadata中:

parse.getData().getMetadata().put("robots", robots);

4: robots属性还可以再次从 metadata获取:

String robots2 = parse.getData().get("robots");





上一篇:XHTML:非IE浏览器里对style.height赋值无效的问题
下一篇:网站亲和力评估
相关分类
网页制作 (4121)
  html教程 (591)
  css教程 (546)
  Dreamweaver教程 (1006)
  JavaScript教程 (834)
  网页制作技巧 (378)
  网页特效 (766)
 




   版权所有 Copyright© 2006 黑马建站宝典 联系方式:heima123#gmail.com