黄金舆情数据分析 项目流程 (1)舆情数据获取 爬取尽量多的新闻、点评以及行情播报等内容。 (2)舆情数据分类 以按照数据来源、数据内容分类。 (3)情绪分类 对每一条舆情进行舆情分类,可分为乐观、悲观、中性三类,可使用人工字典分类法或者机器学习自动分类法。 (4)构建变量 两种变量构建思路: a. 对舆情分类进行加工,构建情绪指标。 b. 对每一条新闻进行加工,构建词频变量。 (5)数据训练及结果分析 使用机器学习等方法对训练集进行训练,并进行结果分析。 (6)因子测试 使用情绪指标进行因子测试 (7)策略构建 根据训练结果构建黄金交易策略。