任务详情
一、需求描述: 类别:爬虫 进度:基础的需求脑图,需要技术开发。 功能: 1、做个小红书数据抓取工具,根据指定账号/昵称/ID采集,爬取账号粉丝数、笔记数、笔记列表及链接、每个笔记的点赞、收藏、评论数。 2、抓取的数据服务器本地存储,定时同步到主系统中。支持手动触发接口实时更新; 3、减少服务器维护成本:如自动登录,程序防卡重启。 4、数据跟踪:数据本地存储;实时能查到抓取的进度,方便定位数据不全不准的问题; 5、同步方式:主动推送到主系统。 兴趣类社交产品,实现用户以兴趣标签进行聚合和交流的功能。涉及用户登录注册、兴趣标签、IM消息推送、帖子模块、个人中心以及管理员后台