需要一个Java通用爬虫框架,可以下载网站镜像、增量更新,大家有好的推荐吗

crawler4jhttp://code.google.com/p/crawler4j/j-spiderhttp://j-spider.sourceforge.net/WebLechhttp://sourceforge.net/projects/weblech/
■网友
webmagic
■网友
可以用webcollector,扩展性比crawler4j灵活一些。 http://www.oschina.net/p/webcollector
■网友
webmagic


    推荐阅读