需要一个Java通用爬虫框架,可以下载网站镜像、增量更新,大家有好的推荐吗
crawler4jhttp://code.google.com/p/crawler4j/j-spiderhttp://j-spider.sourceforge.net/WebLechhttp://sourceforge.net/projects/weblech/
■网友
webmagic
■网友
可以用webcollector,扩展性比crawler4j灵活一些。 http://www.oschina.net/p/webcollector
■网友
webmagic
推荐阅读
- 居家养花不需要太多,养这3款多肉,不仅颜值高,而且可镇宅招财
- 同比■同比增长7.1%!2021年的第一个节你花了多少钱?
- “他是我第一个会说普通话的老师”:一对师生折射青海山村蝶变
- 有必要重新开个C店吗
- 大学再有三个月就结束了,没学到知识,参加一个软件测试培训机构好吗
- 汽车|长安UNI-K又将开创一个新的"引力"纪元?
- 旅行|需要准备哪些物品?全面冬季出游清单,建议收藏带宝宝出门旅行
- 神话|武汉传奇父亲:一个平行班孩子创造的高考神话(感动上万家长)
- 王者荣耀李白能不能出肉
- 直播会成为品牌传播的另一个途径么有哪些可行的方法感觉有戏又没头绪好捉急。