欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

golang实战之truncate日志文件详解

程序员文章站 2022-11-05 22:50:54
前言 有时候我们生成的日志文件很大,如果文件过大,或者磁盘空间有限,那么我们就需要把日志文件改小一点。 (当然实际应用场景中,一般采用log rotate的方式实现...

前言

有时候我们生成的日志文件很大,如果文件过大,或者磁盘空间有限,那么我们就需要把日志文件改小一点。

(当然实际应用场景中,一般采用log rotate的方式实现多个日志文件,定期把旧的日志文件挪走或者删除)

现在我们考虑如何把日志文件变小的场景。

首先想到的是文件truncate,遗憾的是truncate是把新的内容删掉,而不是把旧的内容删掉;因为通常我们的做法是要把旧的日志内容删除,而保留最新的日志内容。

方法1:拷贝文件,然后把前半部分删除,保留新的后半部分

$ wc -l logfile
$ tail -n {linenum}/2 logfile > logfile2
$ mv logfile2 logfile

缺点是需要额外的临时磁盘空间(logfile2),保留新拷贝的文件

方法2:把日志文件读入内存,截去前半部分,把后半部分重新写会文件。

缺点也是要创建一个临时文件,或者把整个文件内容一次性读入内存。

下面是一个实现创建临时文件的例子:

(如果采用整个文件读入内存,那么可以重复覆盖使用原来的读入文件,不用创建临时文件):

package main

import (
 "bufio"
 "log"
 "io"
 "os"
)

func readline(r *bufio.reader, w *bufio.writer) error {
 for i := 0; ; i++ {
  line, err := r.readstring('\n')
  if i >= 12554364/2 { // this number is hard-codes just for example use
   if _,err := w.writestring(line); err != nil {
    log.fatal(err)
   }
  }

  if err != nil {
   if err == io.eof {
    return nil
   }
   return err
  }
 }
 return nil
}

func main() {
 fin, err := os.open("data.in")
 if err != nil {
  log.fatal(err)
 }
 defer fin.close()

 fout, err := os.create("data.dat")
 if err != nil {
  log.fatal(err)
 }
 defer fout.close()

 reader := bufio.newreader(fin)
 writer := bufio.newwriter(fout)
 if err := readline(reader, writer); err != nil {
  log.fatal(err)
 }
 writer.flush()
}

运行:

对于1g大小的日志文件,在我的linux上执行时间大约是:

$ go build && time ./main
real 0m6.972s
user 0m4.668s
sys  0m2.055s

方法3:也是利用文件,把文件mmap映射到内存,然后使用copy函数覆盖内存。

缺点是,mmap操作日志文件不能过大。

下面是一个实现的代码例子:

package main

import (
 "fmt"
 "log"
 "os"
 "syscall"
)

// truncate file to half size, with line aligned.
func truncatetext(f *os.file) error {
 fi, err := f.stat()
 if err != nil {
  return err
 }

 mem, err := syscall.mmap(int(f.fd()), 0, int(fi.size()), syscall.prot_read|syscall.prot_write, syscall.map_shared)
 if err != nil {
  return err
 }

 size := fi.size()
 if size <= 1 {
  // don't need to truncate file if it's too small
  return nil
 }

 trun := size/2 - 1
 for ; trun < fi.size(); trun ++ {
  if mem[trun] == '\n' {
   break
  }
 }

 //fmt.printf("size=%d, trun=%d\n", size, trun)
 if trun >= size - 1 {
  trun = size/2
 } else {
  trun = trun + 1
 }

 // overwrite file content
 copy(mem[0:], mem[trun:])
 
 err = syscall.munmap(mem)
 if err != nil {
  return err
 }

 // truncate file
 f.truncate(fi.size() - trun)

 // reset file offset
 f.seek(trun,0)

 return nil
}


func main() {
 path := "data.dat"

 f, err := os.openfile(path, os.o_rdwr|os.o_create, 0644)
 if err != nil {
  fmt.println("cannot create file")
  log.fatal(err)
 }

 err = truncatetext(f)
 if err != nil {
  fmt.println("cannot truncatelog file")
  log.fatal(err)
 }

 f.write([]byte("abcd"))
 f.close()
}

函数truncatetext的功能就是把文件截取到原来的一半大小,并保持按行对齐;分如下几步:

  • 先把文件映射syscall.mmap 到内存。
  • 查找到中间行的位置。
  • 然后用内置函数copy,把中间行以后的挪动到文件开始位置。
  • 修改文件的大小file.truncate
  • 重置文件的偏移指针offset
  • 取消文件映射syscall.munmap

运行:

对于1g大小的日志文件,在我的linux上执行时间大约是:

$ go build && time ./main
real 0m1.861s
user 0m0.335s
sys  0m0.650s

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对的支持。