Ruby 多线程的潜力和弱点分析

程序员文章站 2022-11-15 19:50:15

web 应用大多是 io 密集型的，利用 ruby 多进程+多线程模型将能大幅提升系统吞吐量。其原因在于：当ruby 某个线程处于 io block 状态时，其它的线程还可...

web 应用大多是 io 密集型的，利用 ruby 多进程+多线程模型将能大幅提升系统吞吐量。其原因在于：当ruby 某个线程处于 io block 状态时，其它的线程还可以继续执行。但由于存在 ruby gil (global interpreter lock)，mri ruby 并不能真正利用多线程进行并行计算。jruby 去除了 gil，是真正意义的多线程，既能应付 io block，也能充分利用多核 cpu 加快整体运算速度。

上面说得比较抽象，下面就用例子一一加以说明。

ruby 多线程和 io block

先看下面一段代码（演示目的，没有实际用途）：

复制代码代码如下:

# file: block_io1.rb

def func1
puts "sleep 3 seconds in func1\n"
sleep(3)
end

def func2
puts "sleep 2 seconds in func2\n"
sleep(2)
end

def func3
puts "sleep 5 seconds in func3\n"
sleep(5)
end

func1
func2
func3

代码很简单，3 个方法，用 sleep 模拟耗时的 io 操作。运行代码（环境 mri ruby 1.9.3）结果是：

复制代码代码如下:

$ time ruby block_io1.rb
sleep 3 seconds in func1
sleep 2 seconds in func2
sleep 5 seconds in func3

real 0m11.681s
user 0m3.086s
sys 0m0.152s

比较慢，时间都耗在 sleep 上了，总共花了 10 多秒。

采用多线程的方式，改写如下：

复制代码代码如下:

# file: block_io2.rb

def func1
puts "sleep 3 seconds in func1\n"
sleep(3)
end

def func2
puts "sleep 2 seconds in func2\n"
sleep(2)
end

def func3
puts "sleep 5 seconds in func3\n"
sleep(5)
end

threads = []
threads << thread.new { func1 }
threads << thread.new { func2 }
threads << thread.new { func3 }

threads.each { |t| t.join }

运行的结果是：

复制代码代码如下:

$ time ruby block_io2.rb
sleep 3 seconds in func1
sleep 2 seconds in func2
sleep 5 seconds in func3

real 0m6.543s
user 0m3.169s
sys 0m0.147s

总共花了 6 秒多，明显快了许多，只比最长的 sleep 5 秒多了一点。

上面的例子说明，ruby 的多线程能够应付 io block，当某个线程处于 io block 状态时，其它的线程还可以继续执行，从而使整体处理时间大幅缩短。

ruby gil 的影响

还是先看一段代码（演示目的）：

复制代码代码如下:

# file: gil1.rb

require 'securerandom'
require 'zlib'

data = securerandom.hex(4096000)

16.times { zlib::deflate.deflate(data) }

代码先随机生成一些数据，然后对其进行压缩，压缩是非常耗 cpu 的，在我机器(双核 cpu, mri ruby 1.9.3)运行结果如下：

复制代码代码如下:

$ time ruby gil1.rb

real 0m8.572s
user 0m8.359s
sys 0m0.102s

更改为多线程版本，代码如下：

复制代码代码如下:

# file: gil2.rb

require 'securerandom'
require 'zlib'

data = securerandom.hex(4096000)

threads = []
16.times do
threads << thread.new { zlib::deflate.deflate(data) }
end

threads.each {|t| t.join}

多线程的版本运行结果如下：

复制代码代码如下:

$ time ruby gil2.rb

real 0m8.616s
user 0m8.377s
sys 0m0.211s

从结果可以看出，由于 mri ruby gil 的存在，ruby 多线程并不能重复利用多核 cpu，使用多线程后整体所花时间并不缩短，反而由于线程切换的影响，所花时间还略有增加。

jruby 去除了 gil

使用 jruby (我的机器上是 jruby 1.7.0)运行 gil1.rb 和 gil2.rb，得到很不一样的结果。

复制代码代码如下:

$ time jruby gil1.rb

real 0m12.225s
user 0m14.060s
sys 0m0.615s

复制代码代码如下:

$ time jruby gil2.rb

real 0m7.584s
user 0m22.822s
sys 0m0.819s

可以看到，jruby 使用多线程时，整体运行时间有明显缩短（7.58 比 12.22），这是由于 jruby 去除了 gil，可以真正并行的执行多线程，充分利用了多核 cpu。

总结：ruby 多线程可以在某个线程 io block 时，依然能够执行其它线程，从而降低 io block 对整体的影响，但由于 mri ruby gil 的存在，mri ruby 并不是真正的并行执行，jruby 去除了 gil，可以做到真正的多线程并行执行。

上一篇：或WWDC 2019上亮相：苹果新显示器曝光

下一篇：用Ruby实现一个单元测试框架的教程

Ruby 多线程的潜力和弱点分析

Ruby 多线程的潜力和弱点分析

深入分析C#中的异步和多线程

java多线程中的volatile和synchronized用法分析

java多线程中的volatile和synchronized用法分析

深入分析C#中的异步和多线程