golang并发下载多个文件的方法
程序员文章站
2024-01-23 21:25:04
背景说明
假设有一个分布式文件系统,现需要从该系统中并发下载一部分文件到本地机器。
已知该文件系统的部分节点ip, 以及需要下载的文件fileid列表,并能通过这些信息...
背景说明
假设有一个分布式文件系统,现需要从该系统中并发下载一部分文件到本地机器。
已知该文件系统的部分节点ip, 以及需要下载的文件fileid列表,并能通过这些信息来拼接下载地址。
其中节点ip列表保存在xx_node.txt, 要下载的fileid保存在xx_fileid.txt中。
代码示例
package main import ( "bufio" "flag" "fmt" "io" "math/rand" "net/http" "os" "time" ) var ( clustername = flag.string("clustername", "c1", "download clustername") ) // 逐行读取文件内容 func readlines(fpath string) []string { fd, err := os.open(fpath) if err != nil { panic(err) } defer fd.close() var lines []string scanner := bufio.newscanner(fd) for scanner.scan() { lines = append(lines, scanner.text()) } if err := scanner.err(); err != nil { fmt.fprintln(os.stderr, err) } return lines } // 实现单个文件的下载 func download(clustername string, node string, fileid string) string { nt := time.now().format("2006-01-02 15:04:05") fmt.printf("[%s]to download %s\n", nt, fileid) url := fmt.sprintf("http://%s/file/%s", node, fileid) fpath := fmt.sprintf("/yourpath/download/%s_%s", clustername, fileid) newfile, err := os.create(fpath) if err != nil { fmt.println(err.error()) return "process failed for " + fileid } defer newfile.close() client := http.client{timeout: 900 * time.second} resp, err := client.get(url) defer resp.body.close() _, err = io.copy(newfile, resp.body) if err != nil { fmt.println(err.error()) } return fileid } func main() { flag.parse() // 从文件中读取节点ip列表 nodelist := readlines(fmt.sprintf("%s_node.txt", *clustername)) if len(nodelist) == 0 { return } // 从文件中读取待下载的文件id列表 fileidlist := readlines(fmt.sprintf("%s_fileid.txt", *clustername)) if len(fileidlist) == 0 { return } ch := make(chan string) // 每个goroutine处理一个文件的下载 r := rand.new(rand.newsource(time.now().unixnano())) for _, fileid := range fileidlist { node := nodelist[r.intn(len(nodelist))] go func(node, fileid string) { ch <- download(*clustername, node, fileid) }(node, fileid) } // 等待每个文件下载的完成,并检查超时 timeout := time.after(900 * time.second) for idx := 0; idx < len(fileidlist); idx++ { select { case res := <-ch: nt := time.now().format("2006-01-02 15:04:05") fmt.printf("[%s]finish download %s\n", nt, res) case <-timeout: fmt.println("timeout...") break } } }
小结
下载时没有用到默认的http client, 并指定了超时时间;
下载文件时调用了系统调用, goroutine会被挂起;
下载文件完成后会唤醒被挂起的goroutine, 该goroutine执行完后面的代码后便退出;
全局超时控制,超时后主线程退出。
以上这篇golang并发下载多个文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。