Python实现FLV视频拼接功能

程序员文章站 2022-10-11 22:27:19

文章摘要本文简单说明了flv文件的格式，以此为出发点，使用 python 实现flv视频的拼接。一.flv文件格式关于flv文件格式的解析网上有诸多文章，在这里就简单介绍一...

文章摘要

本文简单说明了flv文件的格式，以此为出发点，使用 python 实现flv视频的拼接。

一.flv文件格式

关于flv文件格式的解析网上有诸多文章，在这里就简单介绍一下需要了解的部分，以便读者更好地明白各段代码的功能。

flv文件是由文件头(header)和文件体(body)按顺序拼接而成。审查flv内容时，以二进制方式读取内容。

header：文件头表明了文件的封装格式为flv，存储对象为音频、视频或两者。
以下为flv文件的header，共 9 个字节：

b'flv\x01\x05\x00\x00\x00\t'
前 3 个字节(flv)说明这是一个flv文件
第 4 个字节(\x01)为版本号，固定为 1
第 5 个字节(\x05)表明存储对象，需将其转化成二进制(00000101)查看，左、右边的 1 分别表示文件含有音频和视频
后 4 个字节(\x00\x00\x00\t)表示文件头的长度，其值固定为 9

body：文件体由若干个 tag 组成，除了第一个，每个 tag 是由头部( 11 字节)、主体(不定长)和尾部( 4 字节)组成。第一个 tag 只有尾部。

tag 又分为 3 类，脚本(scripts)、音频(audio)和视频(video)。通常第 2 个 tag 为脚本类型，且只有一个，后续的都是音视频类型。

以下为脚本 tag 的部分，作为示例介绍一下：

头部：b'\x12\x00\tb\x00\x00\x00\x00\x00\x00\x00'
第 1 个字节(\x12)表示 tag 类型，脚本类型的对应值为 18 ，音频为 8 ，视频为 9
第 2-4 个字节(\x00\tb)表示 tag 主体的长度，此处为 2402
第 5-7 个字节(\x00\x00\x00)为时间戳，脚本类型的时间戳通常为 0
第 8 个字节(\x00)是时间戳的扩展，当前 3 个字节不够用时会用这个字节当作大端
后 3 个字节(\x00\x00\x00)是 stream id，固定为 0

主体：脚本 tag 的主体包含flv视频的基本信息，如时长、大小、分辨率等，比较复杂，在此不作介绍

尾部：b'\x00\x00\tm'

固定 4 字节，表示 tag 头部加主体的长度，即 11 + 2402 = 2413

二.flv视频拼接

将多个flv视频合成一个可以正常播放的视频，便足够满足大部分的需求。因此，在接下来的拼接过程中，不会对flv进行细致入微的调整，达到基本要求即可。

设置阅读器

阅读器可以使我们很方便地读取文件内容。

class reader():
  def __init__(self, content): # content (bytes):flv文件的二进制内容
    self.content = content
    self.start = 0
    self.eof = false # 判断是否已读完全部内容
    self.length = len(self.content)
    
  def read(self, n=1):
    # 设置 if 语句防止过度读取内容
    if self.length > (self.start + n):
      out = self.content[self.start:self.start + n]
      self.start += n
    else:
      out = self.content[self.start:]
      self.eof = true
    return out

向新建flv文件写入 header 和 tag

在这里假设要拼接的视频基本信息相似，即都含有音视频，分辨率、码率等相同或相近。

为了生成一个可以正常播放的flv视频，header 和 tag 是必不可少的。我们可以选取第一个flv的文件头写入新建flv中，然后依次将修改过时间戳的 tag 写入其中，便可达到拼接目的。

def add_flv(flv, target, videotimestamp, audiotimestamp): # 修改并添加 tag 的函数
  with open(flv, 'rb') as f:
    content = f.read()
  reader = reader(content)
  header = reader.read(13)
  with open(target, 'ab') as f:
    while not reader.eof: # 一直读取直到读完，此时 reader.eof = true
      datatype = reader.read(1)
      datasize = reader.read(3)
      timestamp = int.from_bytes(reader.read(3), 'big') # 将 3 字节转换成整数
      headerremained = reader.read(4)
      if datatype == b'\t': # 视频
        timestamp += videotimestamp
        videots = timestamp
      if datatype == b'\x08': # 音频
        timestamp += audiotimestamp
        audiots = timestamp
      timestamp = timestamp.to_bytes(3, 'big') # 将整数转换成 3 字节
      tagheader = datatype + datasize + timestamp + headerremained
      tagdata_andsize = reader.read(int.from_bytes(datasize, 'big') + 4)
      f.write(tagheader)
      f.write(tagdata_andsize)
  return videots, audiots
def merge_flv(flvs, target): # 主函数
  videots = 0
  audiots = 0
  for i, flv in enumerate(flvs):
    with open(flv, 'rb') as f:
      content = f.read()
    reader = reader(content)
    
    header = reader.read(13) # flvheader + tagsize0
    if i == 0: # 写入第 1 个flv视频的文件头
      with open(target, 'wb') as f:
        f.write(header)
        
    videots, audiots = add_flv(flv, target, videots, audiots)

拼接

import time
since = time.time()
flvs = ['m1.flv', 'm2.flv', 'm3.flv', 'm4.flv'] # 视频大小：45mb，20mb，59mb，54mb
target = 't.flv'
merge_flv(flvs, target)
end = time.time()
print('merging flvs takes {:.2f} s'.format(end - since))
# merging flvs takes 0.88 s

可以看到，拼接 4 个共 178mb视频用时 0.88 秒。

总结

flv文件格式还是比较简明的，对数据的要求也是比较宽松的，即便没有对 scripts 里的参数作调整，拼接后的视频依然能够正常播放。

不过，拼接的视频是有不少隐形问题，如到视频末尾可能会出现音画不同步( 0.5 秒左右)的现象，以及不能够方便地分离出完整的视频和音频。

以上所述是小编给大家介绍的python实现flv视频拼接功能，希望对大家有所帮助

上一篇： Python实现的二维码生成小软件

下一篇： python代码绘制动态烟花(代码简单只需二十几行)

Python实现FLV视频拼接功能

python+selenium实现京东自动登录及秒杀功能

Python实现mysql数据库更新表数据接口的功能

Python实现的在特定目录下导入模块功能分析

python实现简单的计时器功能函数

使用python 3实现发送邮件功能

python3实现域名查询和whois查询功能

Python实现可获取网易页面所有文本信息的网易网络爬虫功能示例

Python 使用PIL numpy 实现拼接图片的示例

Python Django实现layui风格+django分页功能的例子

在Python的Django框架中实现Hacker News的一些功能