通过实例学习Either 树和模式匹配
前言
在这一期的文章中,我将继续介绍 either,使用它构建树形结构,该结构允许我模拟 scala 的模式匹配来构建遍历方法。
在 java 中使用泛型数据,either 会成为接收两种类型之一的单一数据结构,这两种类型保存在 left 和 right 部分中。
在上一期文章的罗马数字解析器示例中,either 保存了 exception(左侧)或 integer(右侧),如图 1 所示:
图 1. either 抽象保存了两种类型的其中之一
在本示例中,either以如下的方式被填充:
either<exception, integer> result = romannumeralparser.parsenumber("xlii");
scala 模式匹配
scala 的众多出色功能之一就是能够使用 模式匹配 进行调度(参阅 参考资料)。与描述相比,演示更简单一些,因此我们会考虑清单 1 中的函数,将数字分数转换为字母分数:
清单 1. 使用 scala 模式匹配根据分数调度字母分数
val valid_grades = set("a", "b", "c", "d", "f") def lettergrade(value: any) : string = value match { case x:int if (90 to 100).contains(x) => "a" case x:int if (80 to 90).contains(x) => "b" case x:int if (70 to 80).contains(x) => "c" case x:int if (60 to 70).contains(x) => "d" case x:int if (0 to 60).contains(x) => "f" case x:string if valid_grades(x.touppercase) => x.touppercase } printf("amy scores %d and receives %s\n", 91, lettergrade(91)) printf("bob scores %d and receives %s\n", 72, lettergrade(72)) printf("sam never showed for class, scored %d, and received %s\n", 44, lettergrade(44)) printf("roy transfered and already had %s, which translated as %s\n", "b", lettergrade("b"))
在 清单 1 中,函数的整个正文由应用于 value 的 match 构成。对于每个选项,模式防护 允许我根据除参数类型以外的条件筛选匹配内容。这种语法的优势是一个干净的选项分区,而不是一系列复杂的 if 语句。
模式匹配与 scala 的 case 类一同工作,该类是具有特殊属性的类 (包括执行模式匹配的能力),以消除决策序列。考虑匹配颜色组合,如清单 2 所示:
清单 2. 在 scala 中匹配 case 类
class color(val red:int, val green:int, val blue:int) case class red(r:int) extends color(r, 0, 0) case class green(g:int) extends color(0, g, 0) case class blue(b:int) extends color(0, 0, b) def printcolor(c:color) = c match { case red(v) => println("red: " + v) case green(v) => println("green: " + v) case blue(v) => println("blue: " + v) case col:color => { print("r: " + col.red + ", ") print("g: " + col.green + ", ") println("b: " + col.blue) } case null => println("invalid color") }
在 清单 2 中,我创建了一个基本 color 类,然后与 case 类一样,创建了一个特殊的单一颜色版本。当确定将哪种颜色传递给函数时,我使用了 match,根据所有可用选项进行模式匹配,这些可用选项中包括最后一个 case,它将处理 null。
java 没有提供模式匹配,因此它无法复制 scala 的创建清晰可读的调度代码的能力。但是,通过结合使用泛型数据结构和众所周知的数据结构,可以实现更加接近的能力,这又将我带回了 either。
either 树
可以建模一个具有三个抽象的树形数据结构,如表 1 所示:
empty | 单元中不包含任何值 |
---|---|
leaf | 单元中拥有一个特殊数据类型值 |
node | 指向其他 叶 或 节点 |
但是为了方便起见,我将在本例中使用来自 functional java 框架的一个类。从概念上讲,either 抽象扩展到了所需的方面。例如,您可以考虑声明 either<empty, either<leaf, node>>,这将创建一个三部分的数据结构,如图 2 所示:
图 2. either<empty, either<leaf, node>> 的数据结构
执行了三个树抽象的 either 实现之后,我定义了树,如清单 3 所示:
清单 3. 基于 either 的树
import fj.data.either; import static fj.data.either.left; import static fj.data.either.right; public abstract class tree { private tree() {} public abstract either<empty, either<leaf, node>> toeither(); public static final class empty extends tree { public either<empty, either<leaf, node>> toeither() { return left(this); } public empty() {} } public static final class leaf extends tree { public final int n; public either<empty, either<leaf, node>> toeither() { return right(either.<leaf, node>left(this)); } public leaf(int n) { this.n = n; } } public static final class node extends tree { public final tree left; public final tree right; public either<empty, either<leaf, node>> toeither() { return right(either.<leaf, node>right(this)); } public node(tree left, tree right) { this.left = left; this.right = right; } } }
清单 3 中的抽象 tree 类定义了三个 final 具体类:empty、leaf 和 node。从内部讲,tree 类使用 3 个插槽的 either,如 图 2 所示,实现这样一种规则,即最左侧的插槽总是保存 empty,中间插槽保存 leaf,而最右侧的插槽保存 node。方法是:请求每个类都实现 toeither() 方法,返回该类型相应的 “插槽”。从传统计算机科学方面讲,数据结构中的每个 “单元” 都是一个 union,旨在保存任意给定时间三种可能类型的其中一种类型。
考虑到此树形结构和其内部结构基于 <either, <left, node>> 的事实,我可以通过模拟模式匹配来访问树中的每个元素。
树遍历的模式匹配
scala 的模式匹配鼓励您思考离散情况。functional java 的 either 实现中的 left() 和 right() 方法都实现了 iterable 接口;这允许我编写支持模式匹配的代码来确定树的深度,如清单 4 所示:
清单 4. 使用类似模式匹配的语法检查树的深度
static public int depth(tree t) { for (empty e : t.toeither().left()) return 0; for (either<leaf, node> ln: t.toeither().right()) { for (leaf leaf : ln.left()) return 1; for (node node : ln.right()) return 1 + max(depth(node.left), depth(node.right)); } throw new runtimeexception("inexhaustible pattern match on tree"); }
清单 4 中的 depth() 方法是一个递归深度查找函数。因为我的树基于一个具体的数据结构(<either, <left, node>>),所以我可以将每个 “插槽” 视为一个具体情况。如果单元为空,则树枝没有深度。如果单元为叶,则将它视为树级别。如果单元为节点,那么我会知道应该以递归方式搜索左侧和右侧,然后添加 1 进行另一次递归。
我还可以使用相同的模式匹配语法来执行树的递归搜索,如清单 5 所示:
清单 5. 在树中确定是否存在元素
static public boolean intree(tree t, int value) { for (empty e : t.toeither().left()) return false; for (either<leaf, node> ln: t.toeither().right()) { for (leaf leaf : ln.left()) return value == leaf.n; for (node node : ln.right()) return intree(node.left, value) | intree(node.right, value); } return false; }
与之前一样,我在数据结构中为每个可能的 “插槽” 指定一个 return 值。如果遇到一个空单元,则会返回 false;我的搜索会失败。对于叶,我会检查传递的值,如果它们匹配则返回 true。否则,在遇到节点时,我会遍历树,使用 |(非短路的 or 运算符)来组合返回的布尔值。
要查看实际的树创建和搜索,请考虑清单 6 中的单元测试:
清单 6. 测试树可搜索性
@test public void more_elaborate_searchp_test() { tree t = new node(new node(new node(new node( new node(new leaf(4),new empty()), new leaf(12)), new leaf(55)), new empty()), new leaf(4)); asserttrue(intree(t, 55)); asserttrue(intree(t, 4)); asserttrue(intree(t, 12)); assertfalse(intree(t, 42)); }
在 清单 6 中,我构建了树,然后调查了是否存在元素。intree() 方法返回 true,如果其中一个叶等于搜索值,并且 true 传播了递归调用堆栈,这是因为 | ("or") 运算符,如 清单 5 所示。
清单 5 中的示例确定了元素是否出现于树中。更复杂的版本还会检查出现的次数,如清单 7 所示:
清单 7. 查找在树中出现的次数
static public int occurrencesin(tree t, int value) { for (empty e: t.toeither().left()) return 0; for (either<leaf, node> ln: t.toeither().right()) { for (leaf leaf : ln.left()) if (value == leaf.n) return 1; for (node node : ln.right()) return occurrencesin(node.left, value) + occurrencesin(node.right, value); } return 0; }
在 清单 7 中,我为每个匹配的叶返回了 1,这使我可以计算树中每个数字出现的次数。
清单 8 展示了复杂树中 depth()、intree() 和 occurrencesin() 的测试:
清单 8. 在复杂树中测试深度、存在状况和出现次数
@test public void multi_branch_tree_test() { tree t = new node(new node(new node(new leaf(4), new node(new leaf(1), new node( new node(new node(new node( new node(new node(new leaf(10), new leaf(0)), new leaf(22)), new node(new node( new node(new leaf(4), new empty()), new leaf(101)), new leaf(555))), new leaf(201)), new leaf(1000)), new leaf(4)))), new leaf(12)), new leaf(27)); assertequals(12, depth(t)); asserttrue(intree(t, 555)); assertequals(3, occurrencesin(t, 4)); }
由于我对树的内部结构应用了正则性,因此我可以在遍历期间分析树,方法是思考每种情况,如元素类型所示。该语法尽管不像完全成熟的 scala 模式匹配一样强大,但是与 scala 出乎意料的接近。
结束语
在这一期的文章中,我介绍了如何在树遍历期间,对启用了 scala 风格的模式匹配应用正则性,以及如何利用泛型 iterable 的一些固有属性、functional java 的 either 类和其他一些元素来模拟强大的 scala 功能。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。