|||
前一篇博文 到底社媒曲线与股市曲线有没有、有多少相关度? 相当随机地选了一个品牌(HTC)来对照舆情曲线和股市曲线,没想到结果是如此吻合,令人惊叹。
舆情与股市有相关性几乎是常识了,关键是以前缺乏大数据及其靠谱的挖掘工具来做定量分析。现在不同了,社会媒体大数据火了,社会媒体作为普罗百姓的即时舆情平台已经是移动互联网时代的事实和特征了。有了这些大数据,我们就可以利用语言的深度分析和抽取技术进行舆情挖掘。这种挖掘技术已经相对成熟,其精准可靠性不仅仅由定期的来自第三方的严格质量检测所肯定,也从舆情挖掘结果与股市历史数据的吻合性上得到独立的证实。如果我们的中文舆情挖掘不靠谱,上篇博文所展示的HTC过去12月的中文社媒舆情曲线与其股市曲线的吻合性(见下图)就无法解释:
HTC最近一年的中文社媒舆情(褒贬度)与股市表现曲线图的对比
反过来也可以说,舆情与股市的相关性因此得到了切实的数据证据。
舆情与股市的相关性比较容易证明证实,困难的是因果分析以及如何利用这种分析加强我们的决策过程。
朋友指出:这种数据最大问题在于因果搞不清。而且时间量度很难掌握。说“马上要涨”,是10分钟之后呢,还是一个月之后?然后又跌下来了,能赶上趟卖掉么?
我觉得,多做一些实验,观察曲线之间的滞后性规律,这样的相关性分析应该可以逐渐帮助厘清因果。深入细致的相关性分析是一个非常有价值的研究方向。
总结一下:
经过这些观察研究,舆情与股市有某种相关性的结论基本可以肯定了,关键是这种相关性应该怎样合适地表述,并在何种程度上可以作为决策或预测的指证。
热议度与股市的吻合度不如褒贬度是显然的:如果热议的是抱怨,热议度越高,则股市可能越低。
所谓吻合度,不是简单的正相关。
即便如此,舆情(褒贬度)与股市吻合的趋向还是相当明显,不吻合的是局部,吻合是大部。
不吻合的情形值得认真分析,看有没有其他因素促成,还是纯粹是随机游离。
我有一个假想
我们应该可以很快通过实验和数据验证或否证(或修正)这个假想。
尽管相信熊市舆情滞后,舆情分析应该还是有指征作用,因为舆情趋向可以帮助做何时再进场探底的决策。譬如,尽管降价幅度已经很大,如果负面舆情还是持续走高,那么进场就是傻蛋。
【立委名言】色即是空 非空者 好奇心而已矣。
【相关】
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 22:04
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社