用实际代码演示Ruby的容易被误解的6个特性
简介: 假设您是一名 c++ 开发人员,您需要使用 ruby 快速执行一些原型设计。当您拿起一本 ruby 参考书籍(比如 pickaxe)或浏览 ruby 网站时,会看到一些熟悉的构造,比如类声明、线程支持和异常处理。正当您认为自己了解 ruby 的工作原理之时,您意识到了,您 ruby 代码中的并发机制与 boost 线程工作原理不一样,catch 和 throw 也与它们看上去的大不相同,而且其他人在其 ruby 脚本中各处使用了名为 self 的关键词。欢迎来到 ruby 的世界中!
如果您是一名 c++ 程序员且需要在 ruby 环境中工作,那么您有一些功课要做。本文讨论了 ruby 新手可能会误解的六个 ruby 特性,特别是当他或她来自一个类似但又不太相同的环境,比如 c++:
● ruby 类层次结构
● ruby 中的单例方法
● self 关键词
● method_missing 方法
● 异常处理
● 线程
注意:本文中所有的代码均进行测试,且基于 ruby 版本 1.8.7。
ruby 中的类层次结构
ruby 中的类层次结构会很棘手。创建一个 cat 类型的类并开始探讨其层次结构(参见 清单 1)。
清单 1. ruby 中的隐式类层次结构
irb(main):092:0> class cat irb(main):093:1> end => nil irb(main):087:0> c = cat.new => #<cat:0x2bacb68> irb(main):088:0> c.class => cat irb(main):089:0> c.class.superclass => object irb(main):090:0> c.class.superclass.superclass => nil irb(main):091:0> c.class.superclass.superclass.superclass nomethoderror: undefined method `superclass' for nil:nilclass from (irb):91 from :0
ruby 中的所有对象(甚至用户定义的对象)都是 object 类的后代,这在清单 1 中清晰可见。这与 c++ 是鲜明的对比。这一点也不像普通数据类型,例如 c/c++ int 或 double。清单 2 显示了整数 1 的类层次结构。
清单 2. 整数 1 的类层次结构
irb(main):100:0> 1.class => fixnum irb(main):101:0> 1.class.superclass => integer irb(main):102:0> 1.class.superclass.superclass => numeric irb(main):103:0> 1.class.superclass.superclass.superclass => object
到目前为止一切顺利。现在您知道了类本身是 class 类型的对象。而 class 最终派生自 object,如 清单 3 中所示使用 ruby 内置的 string 类。
清单 3. 类的类层次结构
irb(main):100:0> string.class => class irb(main):101:0> string.class.superclass => module irb(main):102:0> string.class.superclass.superclass => object
module 是 class 的基类,但是使用它时有一点要注意,即您不能直接实例化用户定义的 module 对象。如果您不想深入 ruby 内部,最好考虑与 c++ 命名空间有类似特征的 module:您可以定义您自己的方法、常量、等等。您在 class 中包含了一个 module,以及 voilà,module 的所有元素现在会魔法般地成为 class 的元素。清单 4 提供了一个示例。
清单 4. module 不能进行直接实例化,并且只能与类一同使用
irb(main):020:0> module mymodule irb(main):021:1> def hello irb(main):022:2> puts "hello world" irb(main):023:2> end irb(main):024:1> end irb(main):025:0> test = mymodule.new nomethoderror: undefined method `new' for mymodule:module from (irb):25 irb(main):026:0> class myclass irb(main):027:1> include mymodule irb(main):028:1> end => myclass irb(main):029:0> test = myclass.new => #<myclass:0x2c18bc8> irb(main):030:0> test.hello hello world => nil
下面再重申一下重点:当您使用 ruby 编写 c = cat.new 时,c 是派生自 object 的 cat 类型的一个对象。cat 类是 class 类型的一个对象,class 派生自 module,而 module 又派生自 object。因此该对象及其类型都是有效的 ruby 对象。
单例方法和可编辑类
现在,看一下单例方法。假设您想使用 c++ 建模类似于人类社会的东西。那么您会如何做呢?定义一个名为 human 的类,然后定义数百万的 human 对象?这更像是在建模一个呆板的社会;每个人必须具惟一的特征。ruby 的单例方法在这里就派上了用场,如 清单 5 所示。
清单 5. ruby 中的单例方法
irb(main):113:0> y = human.new => #<human:0x319b6f0> irb(main):114:0> def y.paint irb(main):115:1> puts "can paint" irb(main):116:1> end => nil irb(main):117:0> y.paint can paint => nil irb(main):118:0> z = human.new => #<human:0x3153fc0> irb(main):119:0> z.paint nomethoderror: undefined method `paint' for #<human:0x3153fc0> from (irb):119
ruby 中的单例方法 是仅与特定对象关联的方法,不能用于一般的类。它们的前缀是对象名称。在 清单 5 中,paint 方法特定于 y对象,而且仅限于 y 对象;z.paint 导致一个 “方法未定义” 错误。您可以调用 singleton_methods 来查明一个对象中的单例方法列表:
irb(main):120:0> y.singleton_methods => ["paint"]
不过在 ruby 中有另一种定义单例方法的方式。看看 清单 6 中的代码。
清单 6. 创建单例方法的另一种方式
irb(main):113:0> y = human.new => #<human:0x319b6f0> irb(main):114:0> class << y irb(main):115:1> def sing irb(main):116:1> puts "can sing" irb(main):117:1> end irb(main):118:1>end => nil irb(main):117:0> y.sing can sing => nil
清单 5 还开创了新的可能性,可以添加新方法到用户定义的类和内置的 ruby 现有类,比如 string。这在 c++ 中是不可能实现的,除非您能够访问您使用的类的源代码。再次观察 string 类(清单 7)。
清单 7. ruby 允许您修改一个现有的类
irb(main):035:0> y = string.new("racecar") => "racecar" irb(main):036:0> y.methods.grep(/palindrome/) => [ ] irb(main):037:0> class string irb(main):038:1> def palindrome? irb(main):039:2> self == self.reverse irb(main):040:2> end irb(main):041:1> end irb(main):050:0> y.palindrome? => true
清单 7 清楚地展示了如何编辑一个现有的 ruby 类来添加您自行选择的方法。这里,我添加了 palindrome? 方法到 string 类。因此 ruby 类在运行时是可编辑的(一个强大的属性)。
现在您对 ruby 的类层次结构和单例有了一定的认识,接下来我们来看 self。注意,在定义 palindrome? 方法时我使用了 self。
发现 self
self 关键词的最常见用法可能就是在 ruby 类中声明一个静态方法,如 清单 8 所示。
清单 8. 使用 self 声明类的静态方法
class selftest def self.test puts "hello world with self!" end end class selftest2 def test puts "this is not a class static method" end end selftest.test selftest2.test
从 清单 8 的输出中可以看到(如 清单 9 所示),没有对象您无法调用非静态方法。该行为类似于 c++。
清单 9. 在没有对象的情况下调用非静态方法时会出错
irb(main):087:0> selftest.test hello world with self! => nil irb(main):088:0> selftest2.test nomethoderror: undefined method 'test' for selftest2:class from (irb):88
在探讨 self 更深奥的用途和含义之前,注意您也可以通过在方法名称前面加上类名来在 ruby 中定义一个静态方法:
class testme def testme.test puts "yet another static member function" end end testme.test # works fine
清单 10 提供了 self 的一个更有趣但不太容易找到的用法。
清单 10. 使用元类来声明静态方法
class mytest class << self def test puts "this is a class static method" end end end mytest.test # works fine
该段代码以一种稍微不同的方式将 test 定义为一个类静态方法。要了解究竟发生了什么,您需要看一下 class << self 语法的一些细节。class << self … end 创建一个元类。在方法查找链中,在访问对象的基类之前先搜索该对象的元类。如果您在元类中定义一个方法,可以在类上调用该方法。这类似于 c++ 中静态方法的概念。
可以访问一个元类吗?是的:只需从 class << self … end 内返回 self。注意,在一个 ruby 类声明中,您没有义务仅给出方法定义。清单 11 显示了元类。
清单 11. 理解元类
irb(main):198:0> class mytest irb(main):199:1> end => nil irb(main):200:0> y = mytest.new => #< mytest:0x2d43fe0> irb(main):201:0> z = class mytest irb(main):202:1> class << self irb(main):203:2> self irb(main):204:2> end irb(main):205:1> end => #<class: mytest > irb(main):206:0> z.class => class irb(main):207:0> y.class => mytest
回到 清单 7 的代码,您会看到 palindrome 被定义为 self == self.reverse。在该上下文中,self 与 c++ 没有什么区别。c++和 ruby 中的方法都需要一个操作对象,以修改或提取状态信息。self 是指这里的这个对象。注意,可以通过附加 self 前缀来选择性地调用公共方法,指明方法付诸作用的对象,如 清单 12 所示。
清单 12. 使用 self 调用方法
irb(main):094:0> class selftest3 irb(main):095:1> def foo irb(main):096:2> self.bar() irb(main):097:2> end irb(main):098:1> def bar irb(main):099:2> puts "testing self" irb(main):100:2> end irb(main):101:1> end => nil irb(main):102:0> test = selftest3.new => #<selftest3:0x2d15750> irb(main):103:0> test.foo testing self => nil
在 ruby 中您无法通过附加 self 关键词前缀来调用私有方法。对于一名 c++ 开发人员,这可能会有点混淆。清单 13 中的代码明确表示,self 不能用于私有方法:对私有方法的调用只能针对隐式对象。
清单 13. self 不能用于私有方法调用
irb(main):110:0> class selftest4 irb(main):111:1> def method1 irb(main):112:2> self.method2 irb(main):113:2> end irb(main):114:1> def method3 irb(main):115:2> method2 irb(main):116:2> end irb(main):117:1> private irb(main):118:1> def method2 irb(main):119:2> puts "inside private method" irb(main):120:2> end irb(main):121:1> end => nil irb(main):122:0> y = selftest4.new => #<selftest4:0x2c13d80> irb(main):123:0> y.method1 nomethoderror: private method `method2' called for #<selftest4:0x2c13d80> from (irb):112:in `method1' irb(main):124:0> y.method3 inside private method => nil
由于 ruby 中的一切都是对象,当在 irb 提示符上调用 self 时您会得到以下结果:
irb(main):104:0> self => main irb(main):105:0> self.class => object
一启动 irb,ruby 解释器就为您创建主对象。这一主对象在 ruby 相关的文章中也被称为顶层上下文。
关于 self 就介绍这么多了。下面我们接着来看动态方法和 method_missing 方法。
method_missing 揭秘
看一下 清单 14 中的 ruby 代码。
清单 14. 运行中的 method_missing
irb(main):135:0> class test irb(main):136:1> def method_missing(method, *args) irb(main):137:2> puts "method: #{method} args: (#{args.join(', ')})" irb(main):138:2> end irb(main):139:1> end => nil irb(main):140:0> t = test.new => #<test:0x2c7b850> irb(main):141:0> t.f(23) method: f args: (23) => nil
在 清单 15 中查看更多 voodoo。
清单 15. 使用 send 方法将参数传递给一个例程
irb(main):142:0> class test irb(main):143:1> def method1(s, y) irb(main):144:2> puts "s: #{s} y: #{y}" irb(main):145:2> end irb(main):146:1> end => nil irb(main):147:0>t = test.new irb(main):148:0> t.send(:method1, 23, 12) s: 23 y: 12 => nil
清单 16. 访问类私有方法
irb(main):258:0> class sendtest irb(main):259:1> private irb(main):260:1> def hello irb(main):261:2> puts "saying hello privately" irb(main):262:2> end irb(main):263:1> end => nil irb(main):264:0> y = sendtest.new => #< sendtest:0x2cc52c0> irb(main):265:0> y.hello nomethoderror: private method `hello' called for #< sendtest:0x2cc52c0> from (irb):265 irb(main):266:0> y.send(:hello) saying hello privately => nil
如果您像我一样具有 c++ 工作背景,且试图编写异常安全代码,那么在看到 ruby 有 throw 和 catch 关键词时会开始感到异常亲切。遗憾的是,throw 和 catch 在 ruby 中的含义完全不同。
ruby 通常使用 begin…rescue 块处理异常。清单 17 提供了一个示例。
清单 17. ruby 中的异常处理
begin f = file.open("ruby.txt") # .. continue file processing rescue ex => exception # .. handle errors, if any ensure f.close unless f.nil? # always execute the code in ensure block end
ruby 中的 catch 和 throw 代码块实际上不是异常处理:您可以使用 throw 修改程序流程。清单 18 显示了一个使用 throw 和 catch的示例。
清单 18. ruby 中的 throw 和 catch
irb(main):185:0> catch :label do irb(main):186:1* puts "this will print" irb(main):187:1> throw :label irb(main):188:1> puts "this will not print" irb(main):189:1> end this will print => nil
有些人甚至说,ruby 中对 catch 和 throw 的支持将 c goto 行为带到一个全新的高度。鉴于函数可以有多个嵌套层,而 catch 块可能在每一级,goto 行为类比似乎有据可循。
清单 19. ruby 中的异常处理:嵌套的 catch 块
irb(main):190:0> catch :label do irb(main):191:1* catch :label1 do irb(main):192:2* puts "this will print" irb(main):193:2> throw :label irb(main):194:2> puts "this won't print" irb(main):195:2> end irb(main):196:1> puts "neither will this print" irb(main):197:1> end this will print => nil
ruby 版本 1.8.7 不支持真正的并发性。确实不支持。但是您会说,在 ruby 中有 thread 构造函数。您说的没错。不过这个thread.new 不会在您每次调用同一方法时生成一个真实的操作系统线程。ruby 支持的是绿色线程:ruby 解释器使用单一操作系统线程来处理来自多个应用程序级线程的工作负载。
当某个线程等待一些输入/输出发生时,这一 “绿色线程” 概念很有用,而且您可以轻松调度一个不同的 ruby 线程来充分利用 cpu。但是这一构造函数无法使用现代的多核 cpu(*提供了一段内容,很好地解释了什么是绿色线程。参见 参考资料 获取链接)。
最后这一个示例(参见 清单 20)证明了这一点。
清单 20. ruby 中的多个线程
#!/usr/bin/env ruby def func(id, count) i = 0; while (i < count) puts "thread #{i} time: #{time.now}" sleep(1) i = i + 1 end end puts "started at #{time.now}" thread1 = thread.new{func(1, 100)} thread2 = thread.new{func(2, 100)} thread3 = thread.new{func(3, 100)} thread4 = thread.new{func(4, 100)} thread1.join thread2.join thread3.join thread4.join puts "ending at #{time.now}"
假设您的 linux? 或 unix? 机器上拥有 top 实用程序,在终端运行代码,获取进程 id,然后再运行 top –p <process id>。top启动后,按住 shift-h 来列出运行中线程的数量。您应当只能看到一个线程,确认了这一点:ruby 1.8.7 中的并发性不过是个神话。
总的看来,绿色线程没有什么坏处。它们在重负荷输入/输出密集型程序中仍然有用,更不用说该方法可能是操作系统间最可移植的一个了。
结束语
本文涵盖了以下多个方面:
● ruby 中类层次结构的概念
● 单例方法
● 解释 self 关键词和 method_missing 方法
● 异常
● 线程
尽管 ruby 不乏特立独行之处,但是使用它进行编程还是挺有趣的,而且其以最少的代码完成大量工作的能力还是很强大的。难怪 twitter 这样的大型应用程序会使用 ruby 来驾驭其真正的潜力。祝您有个快乐的 ruby 编程体验!
上一篇: 简单的Ruby中的Socket编程教程
下一篇: 实例讲解Ruby中的五种变量