Skip to content

QingxinL/soulapp_analysis

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 

Repository files navigation

Soul APP Analysis

背景

社交网络的信息传播是一个非常有趣的问题。首先,社交网络有传统经济学理论没有深入关注的网络效应,会让社交网络的信息传播有非常明显的马太效应。平台机制对社交网络的信息传播也会有很大的影响,甚至会深刻地影响社交平台的发展。然而实证研究还没有很关注到社交网络的信息传播机制对社交网络的信息质量等的影响。本项目希望可以以一个机制相对简单的社交平台为例,探索社交网络的研究有什么特点。

思路

总体思路

  1. 抓数据,用APP抓包软件把数据找到并且写一个爬虫模拟APP把数据采集下来。
  2. 打标签,也就是提取特征。比如说做短文本分类或者聚类,微博等社交平台训练的数据应该都可以用。再比如说对图像做分类和聚类,有没有妹子啊是不是风景啊等等。还可以打情感便签,正面还是负面,开心还是悲伤还是恐惧,等等。
  3. 描述统计。主要是看非置顶数据的各项统计指标和置顶数据的统计指标,初步提取一下特征,看看哪些可能成为影响置顶的因素。
  4. 建立预测模型,比如把是否置顶作为因变量,去看什么可以预测是否置顶,这里因为变量很多,所以需要做变量选择和模型选择。
  5. 建立标准的社交网络模型,根据研究目标分析置顶本身有什么后果或者置顶信息包含了什么信息,由于知识所限,不知道要怎么下手,需要深入研究文献。

数据采集

  1. 安装和配置抓包软件,比如anyproxy
  2. 找到Soul的数据
  3. 写脚本自动储存Soul数据

问题

  • headers里面的api-sign是一个请求生成一个值,所以不能直接用requests等模拟,需要挂抓包软件做请求,或者直接调用APP做请求。

工具

  • anyproxy等抓包软件

About

Soul APP Analysis

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published