用 Java 拿下 HTML,分分钟写个小爬虫( 三 )


@ExcelProperty("单价")
private String price;
}
生成 Excel 文件
  public class EasyExcelUtils {
public static void simpleWrite(List<BookEntity> bookEntityList) {
String fileName = "D:\devEnv\JsoupTest\bookList" + System.currentTimeMillis + ".xlsx";
EasyExcel.write(fileName, ColumnData.class).sheet("书本详情").doWrite(data(bookEntityList));
System.out.println("excel文件生成完毕...");
}
private static List<ColumnData> data(List<BookEntity> bookEntityList) {
List<ColumnData> list = new ArrayList<>;
bookEntityList.forEach(b -> {
ColumnData data = https://www.isolves.com/it/cxkf/bk/2020-09-08/ColumnData.builder
.bookName(b.getBookName)
.starsCount(b.getStarsCount)
.author(b.getBookDetailInfo.getAuthor)
.bookImgUrl(b.getBookImgUrl)
.description(b.getDescription)
.price(b.getBookDetailInfo.getPrice)
.build;
list.add(data);
});
return list;
}
}
 
4.4 最终展示效果最终的效果如下图:

用 Java 拿下 HTML,分分钟写个小爬虫

文章插图
以上就是从想法到实践,我们就在实战中使用了 jsoup 的基本操作 。
完整代码地址:https://github.com/hellowHuaairen/JsoupTest
用 Java 拿下 HTML,分分钟写个小爬虫

文章插图
 
最后Java HTML Parser 库:jsoup,把它当成简单的爬虫用起来还是很方便的吧?
为什么会讲爬虫?大数据,人工智能时代玩的就是数据,数据很重要 。作为懂点技术的我们,也需要掌握一种获取网络数据的技能 。当然也有一些工具 Fiddler、webscraper 等也可以抓取你想要的数据 。
教程至此,你应该也能对 jsoup 有一些感觉了吧 。编程是不是也特别有意思呢?参考我上面的实战案例,有好多网站可以实践一下啦~

【用 Java 拿下 HTML,分分钟写个小爬虫】


推荐阅读