RTSP协议的一些分析(六)——使用RTP传输AAC文件
目录
RTP的封装等信息,我已经在前面的文章中讲过,这里不做赘述。
一、AAC的RTP打包
1.1 AAC格式
详见音频编码基础。
1.2 AAC的RTP打包方式
AAC的RTP打包方式并没有向H.264那样丰富,我知道的只有一种方式,原因主要是AAC一帧数据大小都是几百个字节,不会向H.264那么少则几个字节,多则几千。
AAC的RTP打包方式就是将ADTS帧取出ADTS头部,取出AAC数据,每帧数据封装成一个RTP包
需要注意的是,并不是将AAC数据直接拷贝到RTP的载荷中。AAC封装成RTP包,在RTP载荷中的前四个字节是有特殊含义的,然后再是AAC数据,如下图所示。
其中RTP载荷的一个字节为0x00,第二个字节为0x10。第三个字节和第四个字节保存AAC Data的大小,最多只能保存13bit,第三个字节保存数据大小的高八位,第四个字节的高5位保存数据大小的低5位。
rtpPacket->payload[0] = 0x00;
rtpPacket->payload[1] = 0x10;
rtpPacket->payload[2] = (frameSize & 0x1FE0) >> 5; //高8位
rtpPacket->payload[3] = (frameSize & 0x1F) << 3; //低5位
1.3 AAC RTP包的时间戳计算
假设音频的采样率位44100,即每秒钟采样44100次。
AAC一般将1024次采样编码成一帧,所以一秒就有44100/1024=43帧。
RTP包发送的每一帧数据的时间增量为44100/43=1025。
每一帧数据的时间间隔为1000/43=23ms。
1.4 源码
#include <stdio.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
#include "rtp.h"
#define AAC_FILE "test.aac"
#define CLIENT_PORT 9832
#define CLIENT_IP "10.14.33.103"
struct AdtsHeader
{
unsigned int syncword; //12 bit 同步字 '1111 1111 1111',说明一个ADTS帧的开始
unsigned int id; //1 bit MPEG 标示符, 0 for MPEG-4,1 for MPEG-2
unsigned int layer; //2 bit 总是'00'
unsigned int protectionAbsent; //1 bit 1表示没有crc,0表示有crc
unsigned int profile; //1 bit 表示使用哪个级别的AAC
unsigned int samplingFreqIndex; //4 bit 表示使用的采样频率
unsigned int privateBit; //1 bit
unsigned int channelCfg; //3 bit 表示声道数
unsigned int originalCopy; //1 bit
unsigned int home; //1 bit
/*下面的为改变的参数即每一帧都不同*/
unsigned int copyrightIdentificationBit; //1 bit
unsigned int copyrightIdentificationStart; //1 bit
unsigned int aacFrameLength; //13 bit 一个ADTS帧的长度包括ADTS头和AAC原始流
unsigned int adtsBufferFullness; //11 bit 0x7FF 说明是码率可变的码流
/* number_of_raw_data_blocks_in_frame
* 表示ADTS帧中有number_of_raw_data_blocks_in_frame + 1个AAC原始帧
* 所以说number_of_raw_data_blocks_in_frame == 0
* 表示说ADTS帧中有一个AAC数据块并不是说没有。(一个AAC原始帧包含一段时间内1024个采样及相关数据)
*/
unsigned int numberOfRawDataBlockInFrame; //2 bit
};
static int parseAdtsHeader(uint8_t* in, struct AdtsHeader* res)
{
static int frame_number = 0;
memset(res,0,sizeof(*res));
if ((in[0] == 0xFF)&&((in[1] & 0xF0) == 0xF0))
{
res->id = ((unsigned int) in[1] & 0x08) >> 3;
res->layer = ((unsigned int) in[1] & 0x06) >> 1;
res->protectionAbsent = (unsigned int) in[1] & 0x01;
res->profile = ((unsigned int) in[2] & 0xc0) >> 6;
res->samplingFreqIndex = ((unsigned int) in[2] & 0x3c) >> 2;
res->privateBit = ((unsigned int) in[2] & 0x02) >> 1;
res->channelCfg = ((((unsigned int) in[2] & 0x01) << 2) | (((unsigned int) in[3] & 0xc0) >> 6));
res->originalCopy = ((unsigned int) in[3] & 0x20) >> 5;
res->home = ((unsigned int) in[3] & 0x10) >> 4;
res->copyrightIdentificationBit = ((unsigned int) in[3] & 0x08) >> 3;
res->copyrightIdentificationStart = (unsigned int) in[3] & 0x04 >> 2;
res->aacFrameLength = (((((unsigned int) in[3]) & 0x03) << 11) |
(((unsigned int)in[4] & 0xFF) << 3) |
((unsigned int)in[5] & 0xE0) >> 5) ;
res->adtsBufferFullness = (((unsigned int) in[5] & 0x1f) << 6 |
((unsigned int) in[6] & 0xfc) >> 2);
res->numberOfRawDataBlockInFrame = ((unsigned int) in[6] & 0x03);
return 0;
}
else
{
return -1;
}
}
static int createUdpSocket()
{
int fd;
int on = 1;
fd = socket(AF_INET, SOCK_DGRAM, 0);
if(fd < 0)
return -1;
setsockopt(fd, SOL_SOCKET, SO_REUSEADDR, (const char*)&on, sizeof(on));
return fd;
}
static int rtpSendAACFrame(int socket, char* ip, int16_t port,
struct RtpPacket* rtpPacket, uint8_t* frame, uint32_t frameSize)
{
int ret;
rtpPacket->payload[0] = 0x00;
rtpPacket->payload[1] = 0x10;
rtpPacket->payload[2] = (frameSize & 0x1FE0) >> 5; //高8位
rtpPacket->payload[3] = (frameSize & 0x1F) << 3; //低5位
memcpy(rtpPacket->payload+4, frame, frameSize);
ret = rtpSendPacket(socket, ip, port, rtpPacket, frameSize+4);
if(ret < 0)
{
printf("failed to send rtp packet\n");
return -1;
}
rtpPacket->rtpHeader.seq++;
/*
* 如果采样频率是44100
* 一般AAC每个1024个采样为一帧
* 所以一秒就有 44100 / 1024 = 43帧
* 时间增量就是 44100 / 43 = 1025
* 一帧的时间为 1 / 43 = 23ms
*/
rtpPacket->rtpHeader.timestamp += 1025;
return 0;
}
int main(int argc, char* argv[])
{
int fd;
int ret;
int socket;
uint8_t* frame;
struct AdtsHeader adtsHeader;
struct RtpPacket* rtpPacket;
fd = open(AAC_FILE, O_RDONLY);
if(fd < 0)
{
printf("failed to open %s\n", AAC_FILE);
return -1;
}
socket = createUdpSocket();
if(socket < 0)
{
printf("failed to create udp socket\n");
return -1;
}
frame = (uint8_t*)malloc(5000);
rtpPacket = malloc(5000);
rtpHeaderInit(rtpPacket, 0, 0, 0, RTP_VESION, RTP_PAYLOAD_TYPE_AAC, 1, 0, 0, 0x32411);
while(1)
{
ret = read(fd, frame, 7);
if(ret <= 0)
{
lseek(fd, 0, SEEK_SET);
continue;
}
if(parseAdtsHeader(frame, &adtsHeader) < 0)
{
printf("parse err\n");
break;
}
ret = read(fd, frame, adtsHeader.aacFrameLength-7);
if(ret < 0)
{
printf("read err\n");
break;
}
rtpSendAACFrame(socket,CLIENT_IP, CLIENT_PORT,
rtpPacket, frame, adtsHeader.aacFrameLength-7);
usleep(23000);
}
close(fd);
close(socket);
free(frame);
free(rtpPacket);
return 0;
}
二、AAC的sdp媒体描述
下面给出AAC的媒体描述信息:
m=audio 9832 RTP/AVP 97
a=rtpmap:97 mpeg4-generic/44100/2
a=fmtp:97 SizeLength=13;
c=IN IP4 10.1.74.190
@ m=audio 9832 RTP/AVP 97
格式为 m=<媒体类型> <端口号> <传输协议> <媒体格式 >
媒体类型:audio,表示这是一个音频流
端口号:9832,表示UDP发送的目的端口为9832
传输协议:RTP/AVP,表示RTP OVER UDP,通过UDP发送RTP包
媒体格式:表示负载类型(payload type),一般使用97表示AAC
@ a=rtpmap:97 mpeg4-generic/44100/2
格式为a=rtpmap:<媒体格式><编码格式>/<时钟频率> /[channel]
mpeg4-generic表示编码,44100表示时钟频率,2表示双通道
c=IN IP4 10.1.74.190
IN:表示internet
IP4:表示IPV4
10.1.74.190:表示UDP发送的目的地址为10.1.74.190
特别注意:这段sdp文件描述的udp发送的目的IP为10.1.74.190,目的端口为9832。
三、测试
将上面给出的源码rtp.c、rtp.h、rtp_h264.c保存下来,sdp文件保存为rtp_aac.sdp。
下一篇: 不可变数组的一些方法与理解