欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

golang并发下载多个文件的方法

程序员文章站 2024-01-23 21:25:04
背景说明 假设有一个分布式文件系统,现需要从该系统中并发下载一部分文件到本地机器。 已知该文件系统的部分节点ip, 以及需要下载的文件fileid列表,并能通过这些信息...

背景说明

假设有一个分布式文件系统,现需要从该系统中并发下载一部分文件到本地机器。

已知该文件系统的部分节点ip, 以及需要下载的文件fileid列表,并能通过这些信息来拼接下载地址。

其中节点ip列表保存在xx_node.txt, 要下载的fileid保存在xx_fileid.txt中。

代码示例

package main

import (
  "bufio"
  "flag"
  "fmt"
  "io"
  "math/rand"
  "net/http"
  "os"
  "time"
)

var (
  clustername = flag.string("clustername", "c1", "download clustername")
)

// 逐行读取文件内容
func readlines(fpath string) []string {
  fd, err := os.open(fpath)
  if err != nil {
    panic(err)
  }
  defer fd.close()

  var lines []string
  scanner := bufio.newscanner(fd)
  for scanner.scan() {
    lines = append(lines, scanner.text())
  }
  if err := scanner.err(); err != nil {
    fmt.fprintln(os.stderr, err)
  }

  return lines
}

// 实现单个文件的下载
func download(clustername string, node string, fileid string) string {
  nt := time.now().format("2006-01-02 15:04:05")
  fmt.printf("[%s]to download %s\n", nt, fileid)

  url := fmt.sprintf("http://%s/file/%s", node, fileid)
  fpath := fmt.sprintf("/yourpath/download/%s_%s", clustername, fileid)
  newfile, err := os.create(fpath)
  if err != nil {
    fmt.println(err.error())
    return "process failed for " + fileid
  }
  defer newfile.close()

  client := http.client{timeout: 900 * time.second}
  resp, err := client.get(url)
  defer resp.body.close()

  _, err = io.copy(newfile, resp.body)
  if err != nil {
    fmt.println(err.error())
  }
  return fileid
}

func main() {
  flag.parse()

  // 从文件中读取节点ip列表
  nodelist := readlines(fmt.sprintf("%s_node.txt", *clustername))
  if len(nodelist) == 0 {
    return
  }

  // 从文件中读取待下载的文件id列表
  fileidlist := readlines(fmt.sprintf("%s_fileid.txt", *clustername))
  if len(fileidlist) == 0 {
    return
  }

  ch := make(chan string)

  // 每个goroutine处理一个文件的下载
  r := rand.new(rand.newsource(time.now().unixnano()))
  for _, fileid := range fileidlist {
    node := nodelist[r.intn(len(nodelist))]
    go func(node, fileid string) {
      ch <- download(*clustername, node, fileid)
    }(node, fileid)
  }

  // 等待每个文件下载的完成,并检查超时
  timeout := time.after(900 * time.second)
  for idx := 0; idx < len(fileidlist); idx++ {
    select {
    case res := <-ch:
      nt := time.now().format("2006-01-02 15:04:05")
      fmt.printf("[%s]finish download %s\n", nt, res)
    case <-timeout:
      fmt.println("timeout...")
      break
    }
  }
}

小结

下载时没有用到默认的http client, 并指定了超时时间;

下载文件时调用了系统调用, goroutine会被挂起;

下载文件完成后会唤醒被挂起的goroutine, 该goroutine执行完后面的代码后便退出;

全局超时控制,超时后主线程退出。

以上这篇golang并发下载多个文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。