初学Python爬虫

大数据时代,数据无价

我最近研究了了qq空间的模拟登陆,程序拿到权限之后可以“为所欲为”。

想了想可以实现的玩法,欢迎补充。

理论可以实现的功能如下:

获取自己的说说列表
获取好友的说说列表
说说的点赞和评论情况
以及一些自然人刷空间可以获取到的所有信息

普通点的玩法:

  • 批量自动点赞评论
  • 尝试访问所有好友空间,可以知道有哪些好友对自己锁了空间

高级点的大数据玩法:

  • 分析近段时间好友关注热点(对说说内容进行分词、统计关键词热度)
  • 获取所有说说的评论列表和点赞列表,构建关系网络图像。可以有限的还原社交圈。
  • 订阅某人的说说(进行语义分析,分析文字情感值,绘制情绪曲线)
  • 识别说说中图片,有人脸则下载(自动下载空间里好友的自拍照片)
  • 统计分析好友作息规律,绘制曲线图
  • 统计分析好友使用的手机,综合年龄等数据,有限还原生活水平

理论上以上内容都可以完成,开发难度大小而已。

发表新评论