欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

决策树算法

程序员文章站 2022-06-13 15:18:04
...

决策树的伪代码如下(分而治之算法):

输入:
训练集D={(x1,y1),(x2,y2),.....,(xm,ym)};
属性集A={a1,a2,.....ad}.
过程:函数treeGenerate(D,A)
1.生成节点Node;
2.if D中样本全属于同一类别C then
3.		将node标记为C类叶结点;return
4.	end if
5.	if A≠∅ OR D中样本在A上取值相同 then
6.		将node标记为叶结点,其类别标记为D中样本最多的类;return 
7.	end if
8.	从A中选择最优划分属性a*9.	for a*的每一个值a*V do
10.	为node生成一个分支,另Dv表示D在a*上取值为a*V的样本子集;
11.	 if Dv为空then
12.		将分支结点标记为叶结点,其类别标记为D中样本最多的类,return
13.	 else
14.		以TreeGenerate(Dv,A\{ak})为分支结点
15.	endif
16.	end for