golang 限制同一时间的并发量操作
go的并发量是很厉害的,goroutine创建的代价极小,其中一个重要的原因是因为go采用了分段栈技术,每一个goroutine只占极小的空间。与此同时,goroutine是语言层面的,减少了内核态到用户态的切换开销,并且goroutine摒弃了一些golang用不到的一些os thread的系统调用,创建代价小。
我们可以一瞬间创建很多个goroutine,这是相当容易的。
乍一看,这与题目完全不符,前面说了那么多,难道不是鼓励我们多创建goroutine吗?不不不,goroutine确实很好用,但是如果不加以限制,很有可能出现其他的不可预料的错误。
比如在web领域中, 一个连接,在linux/unix下就相当于是打开了一个文件,占用一个文件描述符。但是系统会规定文件描述符的上限,我们可以使用ulimit -n来进行查看,如果我们遵循量大就好的话,那么一拥而上的请求连接会瞬间报错。
2018/06/30 10:09:54 dial tcp :8080: socket: too many open files
上面这条报错信息源于我写的一个循环请求的工具
package main import ( "sync" "net" "strconv" "fmt" "log" ) const ( max_concurrency = 10000 ) var waitgroup sync.waitgroup func main(){ concurrency() waitgroup.wait() } //进行网络io func request(currentcount int){ fmt.println("request" + strconv.itoa(currentcount) + "\r") conn, err := net.dial("tcp",":8080") if err != nil { log.fatal(err) } defer conn.close() defer waitgroup.done() } //并发请求 func concurrency(){ for i := 0;i < max_concurrency;i++ { waitgroup.add(1) go request(i) } }
用go建立一个服务端很简单,我这里简单的贴下server的代码
package main import ( "io" "os" "fmt" "net" ) func checkerr(err error){ if err != nil { fmt.fprintln(os.stderr, err) } } func main() { listener, err := net.listen("tcp",":8080") checkerr(err) for { conn, err := listener.accept() checkerr(err) go func(conn net.conn){ _, err := io.writestring(conn, "welcome!") checkerr(err) defer conn.close() }(conn) } }
现在回到主题,我们可以看到一拥而上其实也有坏处,想要解决这一问题,我们可以限制同一时间的并发数量,可以利用channel来达到这一点,这有点类似于信号量(semaphore)
创建一个带缓存的channel,其中channel_cache为同一时间的最大并发量
想简单的说一下为什么这里chan的类型要用一个空的struct,这是因为在这个场景下(限制同一时间的并发量),通过channel传输的数据的类型并不重要,我们只需要通过做一个通知效果就行了(就像你通知你朋友起床,你只用闪个电话,而不用实际的接通,省去了电话费的开销),这里的空的struct实际上是不占任何空间的,因此这里选用空的struct
const ( channel_cache = 200 ) var tmpchannel = make(chan struct{}, channel_cache)
在与服务器建立连接的地方这样写(是不是很类似于信号量)
tmpchan <- struct{}{} conn, err := net.dial("tcp",":8080") <- tmpchan
这样同一时间的并发量就由channel_cache限制下来
经过循环开启的goroutine在请求服务器之前会向channel发送消息,如果缓存满了,那么说明已经有channel_cache个goroutine在进行与服务器的连接,接着就会阻塞在这里,等待其中一个goroutine处理完之后,从channel中读出一个空的struct,这时阻塞的地方向channel发送一个空struct,就可以与服务器建立连接了
下面贴一下全部的代码
package main import ( "sync" "net" "strconv" "fmt" "log" ) const ( max_concurrency = 10000 channel_cache = 200 ) var tmpchan = make(chan struct{}, max_concurrency) var waitgroup sync.waitgroup func main(){ concurrency() waitgroup.wait() } //进行网络io func request(currentcount int){ fmt.println("request" + strconv.itoa(currentcount) + "\r") tmpchan <- struct{}{} conn, err := net.dial("tcp",":8080") <- tmpchan if err != nil { log.fatal(err) } defer conn.close() defer waitgroup.done() } //并发 func concurrency(){ for i := 0;i < max_concurrency;i++ { waitgroup.add(1) go request(i) } }
这样就可以愉快的进行并发了!!!
补充:golang限制n个并发同时运行
我就废话不多说了,大家还是直接看代码吧~
package main import ( "fmt" "sync" "time" ) var wg sync.waitgroup func main() { var wg sync.waitgroup sem := make(chan struct{}, 2) // 最多允许2个并发同时执行 tasknum := 10 for i := 0; i < tasknum; i++ { wg.add(1) go func(id int) { defer wg.done() sem <- struct{}{} // 获取信号 defer func() { <-sem }() // 释放信号 // do something for task time.sleep(time.second * 2) fmt.println(id, time.now()) }(i) } wg.wait() }
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。