文章插图
国内一位开发者在 GitHub 上开源了个集众多数据源于一身的爬虫工具箱——InfoSpider , 一不小心就火了!!!
文章插图
有多火呢?开源没几天就登上GitHub周榜第四 , 标星1.3K , 累计分支172个(GitHub地址:https://github.com/kangvcar/InfoSpider)
在这样一个信息爆炸的时代 , 每个人都有很多个账号 , 账号一多就会出现这么一个情况:个人数据分散在各种各样的公司之间 , 就会形成数据孤岛 , 多维数据无法融合 , 这个项目可以帮你将多维数据进行融合并对个人数据进行分析 , 这样你就可以更直观、深入了解自己的信息 。
InfoSpider 是一个集众多数据源于一身的爬虫工具箱 , 旨在安全快捷的帮助用户拿回自己的数据 , 工具代码开源 , 流程透明 。并提供数据分析功能 , 基于用户数据生成图表文件 , 使得用户更直观、深入了解自己的信息 。
文章插图
目前支持数据源包括GitHub、QQ邮箱、网易邮箱、阿里邮箱、新浪邮箱、Hotmail邮箱、Outlook邮箱、京东、淘宝、支付宝、中国移动、中国联通、中国电信、知乎、哔哩哔哩、网易云音乐、QQ好友、QQ群、生成朋友圈相册、浏览器浏览历史、12306、博客园、CSDN博客、开源中国博客、简书 。
根据创建者介绍 , InfoSpider 具有以下特性:
- 安全可靠:本项目为开源项目 , 代码简洁 , 所有源码可见 , 本地运行 , 安全可靠 。
- 使用简单:提供 GUI 界面 , 只需点击所需获取的数据源并根据提示操作即可 。
- 结构清晰:本项目的所有数据源相互独立 , 可移植性高 , 所有爬虫脚本在项目的 Spiders 文件下 。
- 数据源丰富:本项目目前支持多达24+个数据源 , 持续更新 。
- 数据格式统一:爬取的所有数据都将存储为json格式 , 方便后期数据分析 。
- 个人数据丰富:本项目将尽可能多地为你爬取个人数据 , 后期数据处理可根据需要删减 。
- 数据分析:本项目提供个人数据的可视化分析 , 目前仅部分支持 。
是不是很简单呢 , 如果你对InfoSpider也感兴趣 , 赶紧试一下 。
来自:开源最前线(ID:OpenSourceTop)
【一款爆红的开源爬虫工具箱】
推荐阅读
- |晚春夜钓正当时,掌握5个“钻石技巧”,下杆就中鱼,可轻松爆护
- 新配色|iPhone 14新配色曝光:橙红的“苹果”喜欢吗?
- 安卓|Android被爆重要安全漏洞:根源竟来自苹果
- ReconSpider:一款功能强大的高级OSINT框架
- 一款强大的机器学习可视化IDE
- 华为手机哪一款比较好用性价比比较高 目前华为手机口碑最好的是哪一款
- 洗衣机|光刻机巨头ASML爆猛料:芯片太缺 都开始拆洗衣机了!
- 杭州龙牌茗茶销售火爆,火爆销售茶为谁清
- 油罐车发生爆炸 油罐车为什么会爆炸的原因
- 手机2020下半年性价比最高推荐 2020下半年最值得入手的手机是哪一款