论文导读::在股市中,均线形态反映了股票的走势情况,能够为投资者提供决策支持。将历史数据中的均线形态转换成计算机可以识别的数据,利用计算机对各种均线形态组合反映的股市走势进行统计,再筛选出盈利概率高且亏损概率低的组合。这种技术的优点在于为投资者提供了量化的决策支持,并且具有可扩展性。
论文关键词:均线形态组合,走势,盈利概率,亏损概率,统计
1.引言
随着计算机技术的发展,各领域对计算机的应用也更加广泛。股票交易中,有很多历史数据,这些历史数据蕴涵着价值很高的信息。其中,移动平均线能够很好的反映股市的走势。移动平均线反映了市场投资者的平均持股成本,对判断股价的趋势有重要作用。同时,短期均线对股价有重要的支撑或阻力作用,投资者常利用均线捕捉处于启动初期的个股,寻觅个股的最佳买点。
证券业采用的这种判断方法缺乏准确的数据依据,于是,将均线形态转换成计算机可以识别的数据,然后统计出各种均线形态向盈利和亏损转移的概率进行统计,这些统计数据对投资者来讲具有非常重要的参考价值。
统计表明,单一的均线形态向盈利和亏损转移的概率都比较小,提供的信息量比较小,为了提高转移概率,本文考虑统计各种均线形态组合。
2.均线形态
2.1 相关术语
1.移动平均线:先选定时间数列的平均数,在该期间内求取移动总值,然后除以期数,就可求得移动平均值的长期趋势值。其计算为: MA= 其中:T为平均期数,Pj为第j天的股价(指数)。以时间为横坐标走势,以移动平均数为纵坐标,将各点以移动平均数连成一线即为移动平均线,简称均线。
2.概化:概化是一个过程,它将大量的与任务相关的数据集从较低概念层抽象到较高的概念层。
3.均线形态:假设研究对象是n条移动平均线,均线形态是指n条移动平均线之间的位置关系的某种持续状态。
4.均线形态组合:一种均线形态与其前后的均线形态之间的组合就叫做均线形态组合,均线形态组合反映了均线形态的一种变化。
5.涨幅:股票的买入上涨幅度,计算式为:(抛出价格-买入价格)/买入价格。
6.盈利目标:投资者认为是投资成功的股票涨幅。
7.亏损目标:投资者认为是投资失败的股票涨幅。
8.转移概率:由某种均线形态组合向一种均线形态转移的概率论文开题报告。
2.2 均线形态在当前股票分析中的应用
股票分析中,利用移动平均线来确定买入点的方法由来已久,并且形成了许多分析理论,其中著名的有美国投资专家葛南维提出的“移动平均线的八条法则”。还有一些根据多条移动平均线之间的关系来确定买入点的理论,天数少的平均线要比天数多的平均线较为波动。两条移动平均线组合分析时,天数少的移动平均线升破天数多的移动平均线即为买入信号,反之,跌破天数多的移动平均线即为出售信号。
2.3 均线形态组合的应用
根据均线形态,人们可以凭经验,总结出某些盈利概率大的买入点。这种判断往往不准确,有时一个金叉信号只是股市调整时表现出来的临时状态,实际上可能随之而来的是该股票的下跌。同理,那些总结出来的一些盈利概率大的均线形态组合,也可能出现下跌甚至狂跌的情况。对投资者来说,如果能准确知道具体的盈利概率,就能做到心里有底。
对某种均线形态组合,通过对该均线形态组合的在交易记录中出现的次数进行统计,然后统计出其中向盈利和亏损两个状态转移的条数。向盈利转移的条数除以该组合的总条数,就是该均线形态组合的参考盈利概率;相应,向亏损转移的条数除以该组合的总条数,就是该均线形态组合的参考亏损概率。
可以统计出各种均线形态组合的转移概率,筛选出其中盈利概率或者亏损概率较大的组合作为理想的买入点或售出点,称作理想组合。为了实现这个目标,需要将股票交易原始数据转换成形态数据,再采用现有的数据挖掘工具进行挖掘。
3.算法设计
3.1 均线形态的计算机识别
本文仅研究1日,5日,10日均线,称10日均线为长期均线,5日均线为中期均线,1日均线为短期均线。以8%为盈利目标,-3%为亏损目标。
3.1.1 均线位置关系的编码
编码的目的是用数字来区分各种均线位置关系。令短期均线的码值为3;中期均线的码值为2;长期均线的码值为1。编码规则:从上到下对应编码的高位到低位。例如图1所示一组均线,在10-6-11这一天,3条均线之间的位置关系处编码为312。

图1 某时段均线图
3.1.2 均线位置关系的概化
股票均线的某种位置关系的持续反映了其走势,如短线持续上扬,反映出该股的上涨,中线处于最高或最低位走势,说明该股处于调整期;
在时间维度上概化位置关系表,增加一个持续天数维度D。某股s从第 i日起,状态231维持了3天,概化后如下表1所示。
表1 均线位置关系概化表
3.2 均线形态的划分
对于某种均线位置关系,例如123,在所有的交易记录中,123的持续时间的变化范围是1天到94天,即对应位置关系123就有94种不同的均线形态。为简化均线形态,将均线形态按持续时间进行划分,划分标准是,在某个持续时间区间内,相应的均线形态要反映出股票的涨幅特征。
例如,均线形态为321持续3天以上且涨幅≥8%的记录数为17060条,而均线形态为321持续3天以下且涨幅≤8%的只有561条;在涨幅≥8%的所有记录中,有17621条的状态是321,而只有2839条不是321。根据这个统计结果,我们将均线位置关系为321的所有均线形态划分为两类:持续时间≥3天和持续时间≤3天,第一类称为调整态321,第二类称为盈利态。
按照同样的方法,根据统计结果,对均线形态的划分结果如表2所示。
表2 划分标准
状态序列
|
调整态
213
|
调整态
231
|
调整态
132
|
调整态
312
|
调整态
123
|
调整态
321
|
亏损态
|
盈利态
|
均线形态
|
213
|
231
|
132
|
312
|
123
|
123
|
无
|
无
|
涨幅
|
<8%且>-3%
|
<8%且>-3%
|
<8%且>-3%
|
<8%且>-3%
|
<8%且>-3%
|
<8%且>-3%
|
≥8%
|
≤-3%
|
3.3 形态转移概率
将交易记录中各均线形态按照表2的划分标准进行划分。
一般来讲,投资者最关心它转向盈利态和亏损态的概率。统计出历史交易记录k阶均线形态组合转向盈利和转向亏损的条数,转向盈利的条数所占的比例称作该均线形态组合的盈利概率;相应,转向亏损的条数所占的比例称作该均线形态组合的亏损概率。
4.历史数据运算实例及结果分析
本文选择了我国沪深两地证券市场的1120只股票从2006年1月至2010年8月的日交易数据,共935113条记录为原始数据。按照前一节设计的算法,将原始数据转化为形态数据。
4.1 股票数据的统计
将形态数据表的前6阶均线形态组合作为输入,当前均线形态作为输出,用微软的分析管理器的决策树进行统计。发现如表3所示的一些比较令人满意的组合。
表3 一组均线形态组合
k阶均线形态组合
|
总条数
|
亏损概率
|
盈利概率
|
前1阶形态 = 中间态231 与
前2阶形态 ≠ 中间态213 与
前2阶状态 ≠ 盈利态 与
前3阶状态 = 亏损态
|
94
|
3.84%
|
24.04%
|
前1阶状态 = 中间态231 与
前2阶状态 ≠ 中间态213 与
前2阶状态 ≠ 盈利态 与
前3阶状态 = 盈利态
|
1275
|
9.03%
|
17.9%
|
前1阶状态 = 中间态231 与
前2阶状态 ≠ 中间态213 与
前2阶状态 ≠ 盈利态
|
36340
|
2.84
|
9.87%
|
前1阶状态 = 中间态312
|
54079
|
3.13%
|
10.43%
|
前1阶状态 = 中间态312 与
前3阶状态 = 中间态321
|
626
|
2.82%
|
13.01%
|
从挖掘结果可以看出,高于3阶的均线形态影响就比较弱。这些结果可以为决策人提供参考:例如最后一条,满足前1阶状态 = 中间态312 且 前3阶状态 = 中间态321,向盈利状态转移的概率是13.01%,而向亏损状态转移的概率为2.49%。
4.2 股票数据分组统计
从炒作的角度来说,流通盘较大的股票比流通盘较小的股票所需的资金要大,所以流通盘小的容易吸引资金进驻,容易被控制论文开题报告。从股本扩张的角度看,流通盘较小的个股能够出题材。所以流通盘较小的股票往往得到更多的青睐和追捧。
据此,我们将股票按流通盘大小进行分组,观察分组后的各组股票对应交易记录的均线形态组合的形态转移概率。分组的标准是各组的股票数大致相等,还要兼顾划分的简洁性,也即各组之间的界限最好是10000,5000这样的整数。分组后的统计结果说明,流通盘的大小对各种均线形态组合的形态转移概率的影响不明显。其中,流通盘≥10000(万股)的股票对应交易记录的挖掘结果走势,如表4所示。
表4 交易记录挖掘结果
K阶均线形态组合
|
总条数
|
亏损概率
|
盈利概率
|
前1阶状态 = 中间态312 与
前2阶状态 = 中间态132
|
9223
|
2.53%
|
10.82%
|
前1阶状态 = 中间态312 与
前2阶状态≠中间态132 与
前2阶状态≠中间态213 与
前3阶状态≠中间态213 与
前3阶状态≠亏损态
|
6370
|
2.6%
|
9.33%
|
4.3 大盘的均线形态对个股均线形态的影响
股市中,大盘的走势影响着个股的走势。在这里,要统计出个股的均线形态对应的大盘均线形态的情况,也就是统计大盘的均线形态对个股均线形态的影响。具体做法是把大盘也看成一支股票,对某一个股,把它进入某一种均线形态时对应的大盘均线形态作为对应大盘均线形态。统计出个股均线形态和大盘均线形态的组合情况。
5.数据处理
所用到的数据是2006年1月到2010年8月上证,深证的股票交易数据,所涉及到的数据表有日交易数据表day,流通盘情况表fin,还有上海大盘的交易数据。以下是对这些数据的处理过程:
1)在Access下生成1、5、10日成均线表;
2)将均线表导入到SQL Server 2005,选出2006年以后的所有交易数据;
3)在SQL Server 2005中,将属于不同状态组合的记录进行编号;
4)生成均线形态表;
5)将当前形态的前k阶均线形态组合添入均线形态表;
6)在SQL Server 2005中,建立挖掘模型,进行挖掘(统计):设置当前形态为预测目标,前k阶均线形态组合为输入;
7)股票数据分组统计;
8)沪市大盘的均线形态对个股均线形态的影响情况。
6.结论
本文从分析均线形态组合入手,提供了一种用统计来挖掘股票交易中用户感兴趣模式的方法。其中,挖掘出了一些用户感兴趣的均线形态组合。对于不同的评价标准,会有不同的结果。
这种方法具有较强的应用性,例如可以对K线形态的组合进行挖掘。利用数据挖掘的方法和工具,从海量的历史数据中提取用户感兴趣的模式,这是一个新兴的领域,值得我们去开拓创新。
参考文献
1.[加]Jiawei Han, MichelineKamber著;范明等译. 数据挖掘:概念与技术,北京:机械工业出版社,2001.8.
2.唐应辉,李攀峰,杨晋浩.均线形态组合在证券分析中的应用,电子科技大学学报,2002,31(1).
3.陈玉山,席斌.独立成份分析方法在股票分析中的应用,计算机工程与设计,2007,6.
4.杜芸,于立红.数据库技术在股票分析中的应用,西安航空技术高等专科学校学报,2009,3.
5.魏雄,决策树算法在股票分析与预测中的应用,电脑知识与技术(学术交流),2007,9.
|