床与榻区别:FLV文件结构分析

来源:百度文库 编辑:中财网 时间:2024/04/29 14:19:27

FLV文件结构分析 

2011-01-12 

 

FLV是一个二进制文件,由文件头(FLV header)和很多tag组成。tag又可以分成三类:audio,video,script,分别代表音频流,视频流,脚本流(关键字或者文件信息之类)。

 

FLV Header

一般比较简单,包括文件类型之类的全局信息

文件类型3bytes总是FLV(0x46 0x4C 0x56),否则...版本
1byte一般是0x01,表示FLV version 1
流信息1byte 
倒数第一bit是1表示有视频,倒数第三bit是1表示有音频,其他都应该是0(有些软件如flvtool2可能造成倒数第四bit是1,不过也没发现有什么不对)header长度
4bytes整个文件头的长度,一般是9(3+1+1+4),有时候后面还有些别的信息,就不是9了   

 

FLV Body

FLV body就是由很多tag组成的,一个tag包括下列信息:

previoustagsize4bytes前一个tag的长度,第一个tag就是0tag类型1byte

三类:

  • 8 -- 音频tag
  • 9 -- 视频tag
  • 18 -- 脚本tag
数据区长度3bytes 时间戳3bytes单位毫秒,如果是脚本tag就是0扩展时间戳 
1byte作为时间戳的高位streamsID3bytes总是0(不知道干啥用)数据区 

If TagType == 8

AUDIODATA

If TagType == 9

VIDEODATA

If TagType == 18

SCRIPTDATAOBJECT 

 

根据不同的tag类型就有不同的数据区

 

Audio tag 数据区

audio信息1byte

前四位bits表示音频格式:

  • 0 -- 未压缩
  • 1 = ADPCM
  • 2 = MP3
  • 3 = Linear PCM, little endian
  • 4 = Nellymoser 16-kHz mono
  • 5 = Nellymoser 8-kHz mono
  • 6 = Nellymoser
  • 7 = G.711 A-law logarithmic PCM
  • 8 = G.711 mu-law logarithmic PCM
  • 9 = reserved
  • 10 = AAC
  • 11 = Speex
  • 14 = MP3 8-Khz
  • 15 = Device-specific sound

下面两位bits表示samplerate:

  • 0 -- 5.5kHz
  • 1 -- 11kHz
  • 2 -- 22kHz
  • 3 -- 44kHz

下面一位bit表示每个采样的长度:

  • 0 -- snd8Bit
  • 1 -- snd16Bit

下面一位bit表示类型:

  • 0 -- sndMomo
  • 1 -- sndStereo
audio数据区
不定

 

 

if SoundFormat == 10

    AACAUDIODATA

else

    Sound data—varies by format

 

 

 

AACAUDIODATA

AACPacketType1byte

 

0: AAC sequence header

1: AAC raw

 

AACAUDIODATA数据区
不定

 

 

iif AACPacketType == 0

     AudioSpecificConfig

else if AACPacketType == 1

    Raw AAC frame data

 

 

 

 

 

 

video tag 数据区

video信息1byte

前四位bits表示类型:

  • 1 -- keyframe
  • 2 -- inner frame
  • 3 -- disposable inner frame (H.263 only)
  • 4: generated keyframe (reserved for server use only)
  • 5: video info/command frame 

后四位bits表示编码器id:

  • 1: JPEG (currently unused)
  • 2 -- Seronson H.263
  • 3 -- Screen video
  • 4 -- On2 VP6
  • 5 -- On2 VP6 without channel
  • 6 -- Screen video version 2
  • 7: AVC 
video数据区
不定

 

 

If CodecID == 2 

H263VIDEOPACKET

If CodecID == 3 

SCREENVIDEOPACKET

If CodecID == 4 

VP6FLVVIDEOPACKET

If CodecID == 5 

VP6FLVALPHAVIDEOPACKET

If CodecID == 6 

SCREENV2VIDEOPACKET

if CodecID == 7

AVCVIDEOPACKET

 


 

H263VIDEOPACKET

H263VIDEOPACKET数据结构:

PictureStartCode UB[17]  和H.263 5.1.1相似
    0000 0000 0000 0000 1

Version  UB[5]  视频格式版本
    Flash Player 6 supports 0 and 1
TemporalReference UB[8]  察看 H.263 5.1.2

PictureSize UB[3]  图像尺寸:
    000: custom, 1 byte
    001: custom, 2 bytes
    010: CIF (352x288)
    011: QCIF (176x144)
    100: SQCIF (128x96)
    101: 320x240
    110: 160x120
    111: 保留

CustomWidth   If PictureSize = 000 UB[8]
    If PictureSize = 001 UB[16]
    否则不存在
    注意:UB[16]不一样UI16,这里不是字节交换的
    单位是像素

CustomHeight   If PictureSize = 000 UB[8]

 

AVCVIDEOPACKET

 

AVCPacketType1byte

 

 

0: AVC sequence header

1: AVC NALU

2: AVC end of sequence (lower level NALU 

sequence ender is not required or supported)

 

CompositionTime
3byte

 

 

if AVCPacketType == 1

Composition time offset 

else

0

 

 

 

Data不定

 

 

if AVCPacketType == 0

AVCDecoderConfigurationRecord

else if AVCPacketType == 1

One or more NALUs (can be individual

slices per FLV packets; that is, full frames

are not strictly required)

else if AVCPacketType == 2

Empty

 

 

 

script tag 数据区

来两张图片