Crawlab是一个基于Golang的分布式爬虫管理平台,用户可以在该平台上创建多个爬虫项目,支持多种编程语言以及多种爬虫框架,包括Scrapy和Selenium等。
Crawlab目前可以实现的功能包括定时任务、数据分析、可配置爬虫、SDK、消息通知、Scrapy支持、Git同步等。它主要解决的是大量爬虫管理困难的问题,例如需要监控上百个网站的参杂Scrapy和Selenium的项目不容易做到同时管理,而且命令行管理的成本非常高,还容易出错。Crawlab支持任何语言和任何框架,配合任务调度、任务监控,很容易做到对成规模的爬虫项目进行有效监控管理。