新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
扒网站工具,看好哪个网站,指定好URL,自动扒下来做成模版。所见网站,皆可为我所用!
一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性;
风铃虫是一款轻量级的高效爬虫工具,配置简单,方便二次开发,能抓取js渲染的网页,可以抓取任何数据,支持保存网页快照,智能防封杀,天然适合分布式。
二代蜘蛛侠,此版本完全重新开发,比上一代更加强大(性能,易用,架构,分布式,简洁,成熟)
基于java的爬虫系统,可爬取国内主流视频网站的视频数据,目前支持爬取豆瓣、猫眼、IMDB、百度百科、优酷、电视猫数据。