任务详情
需求分析 1、爬取百度贴吧吉林省高校(长春理工、长春工业、东北电力、吉林大学、东北师大、延边大学)2022年到2024年百度贴吧内容、包括(标题、发布时间、浏览量、点赞人数、评论等)通过分词(可以使用jieba库进行分词),进行数据预处理(清洗掉无用数据),收集到一份包含大学生网络行为数据的CSV文件,数据包括用户ID、行为时间、行为类型、行为内容等信息。 2、使用matplotlib或seaborn库绘制行为类型的分布图,了解大学生在网络空间中的主要行为。分析行为时间,了解大学生在网络空间中的活跃时间段。 3、对行为内容进行文本分析,可以使用jieba库进行分词,wordcloud库生