golang 限制同一时间的并发量操作

程序员文章站 2022-04-11 09:50:29

go的并发量是很厉害的，goroutine创建的代价极小，其中一个重要的原因是因为go采用了分段栈技术，每一个goroutine只占极小的空间。与此同时，goroutine是语言层面的，减少了内核态到...

go的并发量是很厉害的，goroutine创建的代价极小，其中一个重要的原因是因为go采用了分段栈技术，每一个goroutine只占极小的空间。与此同时，goroutine是语言层面的，减少了内核态到用户态的切换开销，并且goroutine摒弃了一些golang用不到的一些os thread的系统调用，创建代价小。

我们可以一瞬间创建很多个goroutine，这是相当容易的。

乍一看，这与题目完全不符，前面说了那么多，难道不是鼓励我们多创建goroutine吗？不不不，goroutine确实很好用，但是如果不加以限制，很有可能出现其他的不可预料的错误。

比如在web领域中，一个连接，在linux/unix下就相当于是打开了一个文件，占用一个文件描述符。但是系统会规定文件描述符的上限，我们可以使用ulimit -n来进行查看，如果我们遵循量大就好的话，那么一拥而上的请求连接会瞬间报错。

2018/06/30 10:09:54 dial tcp :8080: socket: too many open files

上面这条报错信息源于我写的一个循环请求的工具

package main
import (
  "sync"
  "net"
  "strconv"
  "fmt"
  "log"
)
const (
  max_concurrency = 10000 
)
var waitgroup sync.waitgroup
func main(){
  concurrency()
  waitgroup.wait()
}
//进行网络io
func request(currentcount int){
  fmt.println("request" + strconv.itoa(currentcount) + "\r")
  conn, err := net.dial("tcp",":8080")
  if err != nil { log.fatal(err) }
  defer conn.close()
  defer waitgroup.done()
}
//并发请求
func concurrency(){
  for i := 0;i < max_concurrency;i++ {
    waitgroup.add(1)
    go request(i)
  }
}

用go建立一个服务端很简单，我这里简单的贴下server的代码

package main
import (
  "io"
  "os"
  "fmt"
  "net"
)
func checkerr(err error){
  if err != nil { fmt.fprintln(os.stderr, err) }
}
func main() {
  listener, err := net.listen("tcp",":8080")
  checkerr(err)
  for {
    conn, err := listener.accept()
    checkerr(err)
    go func(conn net.conn){ 
      _, err := io.writestring(conn, "welcome!") 
      checkerr(err)
      defer conn.close()
    }(conn)
  }
}

现在回到主题，我们可以看到一拥而上其实也有坏处，想要解决这一问题，我们可以限制同一时间的并发数量，可以利用channel来达到这一点，这有点类似于信号量（semaphore）

创建一个带缓存的channel，其中channel_cache为同一时间的最大并发量

想简单的说一下为什么这里chan的类型要用一个空的struct，这是因为在这个场景下（限制同一时间的并发量），通过channel传输的数据的类型并不重要，我们只需要通过做一个通知效果就行了（就像你通知你朋友起床，你只用闪个电话，而不用实际的接通，省去了电话费的开销），这里的空的struct实际上是不占任何空间的，因此这里选用空的struct

const (
  channel_cache = 200
)
var tmpchannel = make(chan struct{}, channel_cache)

在与服务器建立连接的地方这样写（是不是很类似于信号量）

tmpchan <- struct{}{}
conn, err := net.dial("tcp",":8080")
<- tmpchan

这样同一时间的并发量就由channel_cache限制下来

经过循环开启的goroutine在请求服务器之前会向channel发送消息，如果缓存满了，那么说明已经有channel_cache个goroutine在进行与服务器的连接，接着就会阻塞在这里，等待其中一个goroutine处理完之后，从channel中读出一个空的struct，这时阻塞的地方向channel发送一个空struct，就可以与服务器建立连接了

下面贴一下全部的代码

package main
import (
  "sync"
  "net"
  "strconv"
  "fmt"
  "log"
)
const (
  max_concurrency = 10000 
  channel_cache = 200
)
var tmpchan = make(chan struct{}, max_concurrency)
var waitgroup sync.waitgroup
func main(){
  concurrency()
  waitgroup.wait()
}
//进行网络io
func request(currentcount int){
  fmt.println("request" + strconv.itoa(currentcount) + "\r")
  tmpchan <- struct{}{}
  conn, err := net.dial("tcp",":8080")
  <- tmpchan
  if err != nil { log.fatal(err) }
  defer conn.close()
  defer waitgroup.done()
}
//并发
func concurrency(){
  for i := 0;i < max_concurrency;i++ {
    waitgroup.add(1)
    go request(i)
	}
}

这样就可以愉快的进行并发了！！！

补充：golang限制n个并发同时运行

我就废话不多说了，大家还是直接看代码吧~

package main 
import (
  "fmt"
  "sync"
  "time"
) 
var wg sync.waitgroup 
func main() {
  var wg sync.waitgroup
 
  sem := make(chan struct{}, 2) // 最多允许2个并发同时执行
  tasknum := 10
 
  for i := 0; i < tasknum; i++ {
    wg.add(1)
 
    go func(id int) {
      defer wg.done()
 
      sem <- struct{}{}    // 获取信号
      defer func() { <-sem }() // 释放信号
 
      // do something for task
      time.sleep(time.second * 2)
      fmt.println(id, time.now())
    }(i)
  }
  wg.wait()
}

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。如有错误或未考虑完全的地方，望不吝赐教。

golang 限制同一时间的并发量操作

详解Golang 中的并发限制与超时控制