题材炒作,从庙堂到乡野,一直是国内股票交易的主流思维;虽然近年时常耳闻价值投资,但又有几人能守住寂寞,置潮流于不顾?但是面对海量信息,交易者往往难以全面的了解、准确定位,本文先谈谈主题投资的第一步,即主题发现。主题发现是指从复杂大规模信息源中挖掘潜在因素作为主题并进行表现。
一.主题发现的过程
主题发现的过程可以概括为:在已经确定了文档集中的若干术语或概念的基础上,进行主题聚类,发现文档中的核心主题。例:
1.PPP主题
随着项目融资的发展,政府和社会资本在基础设施及公共服务领域合作越来越流行。这些合作项目都有一个潜在的共同点并聚类成主题PPP(Public—Private—Partnership),即公私合作模式。
2.高送转主题
近期,上市公司股东频频通过送红股与资本公积金转增股本方式进行内部结构调整,以增强公司股票的流动性。这些公司的相同行为则形成了一个特定的主题“高送转”。
二.布尔财经主题发现的优势
1. NLP语义模型让文本聚类快速准确
基于十数年的非结构化大数据&NLP数据、算法积累,布尔财经在Storm流式架构之上二次开发,保证每步分析在50ms内完成,单篇文章抓取结束后在秒级以内即可完成全部分析,主题发现则更快更准确。
2.机器抓取能够根据数据反馈进行改进
不同于固定、通用的抓取模型,布尔财经数据分析系统具有独特的自我学习训练式模型,能够根据数据反馈进行自我改进,提升后期文本聚类准确性。
三.主题与股价的关系
布尔财经根据非结构化数据计算出的市场情绪指标与市场指数的转折点高度相关。
1.市场上每天会产生数以万计的财经事件
虽然无法准确到判断每一个事件都能对市场产生影响,但通过大数据方式统计全市场数据,则可以发现隐藏的趋势。从几个显著的转折点我们可以看到,布尔研究院的情绪指标和指数的转折基本保持一致,通常提前2-4周给出信号,尤其在2015年的大牛市,文章数量对指数的预测作用是非常显著的。
2.具体再以特斯拉主题为例
主题的热度变动结合相关股票(比亚迪)的行情走势可以看到,特斯拉主题的情绪指标对亚迪股价的几波行情均提前给出了信号。目前布尔财经监测了超过1000个此类的主题,每日均产生大量信号,为投资者决策提供参考。
四:主题投资模型的进一步优化
布尔财经主题投资模型通过分析市场中结构性、周期性及制度性变动趋势,挖掘出对股市可能具有大范围影响的潜在因素并作为“主题”,投资者可以以此为参考提前对受益的行业和公司进行投资。其主要包括:
1.热门事件。布尔财经为投资者挖掘潜在新闻,实时跟踪,并随着新闻热度的变化不断更新。 投资者可以根据新闻的热度提前布局相关个股。
2.热门主题,投资者可实时监控主题热度排名。如图中排名第一的为“新能源”主题,那么投资者亦可以提前布局相关个股。
3.主题传播的周期性。根据布尔研究院的研究,主题的平均炒作周期为101-103天,即每个主题每年平均会有2-3个周期。需要特别说明的是,经过对多年统计数据的优化,布尔已经可以过滤掉大部分伪信号。
由此可见,布尔财经从主题发现延伸出的一系列研究精细、缜密,对主题价格指数的预测客观、理性,对投资者制定投资策着实具有很好的指导意义。
笑脸金融荣膺第八届中国财经峰会“2019金融科技影响力品牌”奖项
✽本文资讯仅供参考,并不构成投资或采购等决策建议(承兑)。