在典型的应用程序中,编译器或汇编器将程序的源代码(例如C或汇编语言)转换为机器代码,并将其输出到一个文件中。然后,这个文件由程序员导入,以将机器代码“烧录”到ROM(或Flash Memory)中,或传输到目标系统以进行加载和执行。
这个存放机器码的文件就是烧录文件,它是用来烧录到微控制器(如MCU、EEPROM、NOR/NAND Flash等)里面的flash memory里面的一个程序文件。烧录文件可以有很多种格式,如bin、Hex,S19等。以下对这几种文件格式做完全解析。
这种文件格式最简单最直接,直接存储flash memory的raw data。Bin文件有其优点和缺点——简单直接,是优点也是缺点。
因为其里面存储的是raw data,所以,我们可以直接通过文件地址就找到对应memory地址的内容。其缺点呢?正因为其文件地址跟memory地址对应,文件地址是连续的,所以,如果memory地址如果是一个很大的数值(例如0xFFB0000),memory在IC上的地址空间不连续的话,那就非常麻烦。
也许你会说,将空白的地方填0x00或者0xFF啊,那你得想想这个bin文件得多大了。
面对这个问题,那么SREC、HEX等文件格式就登场了。
本文讨论的HEX,指的是Intel-HEX,它是由Intel制定的格式。
Intel Hex的描述
Intel HEX由ASCII文本行组成,这些行由换行符或回车符或两者分隔。每个文本行均包含编码多个二进制数字的十六进制字符。二进制数可以表示数据,内存地址或其他值,这取决于它们在行中的位置以及行的类型和长度。每个文本行都称为一条记录(record)。
Intel Hex的格式这个record包含6部分内容,其格式是这样的:
record示例::020000021200EA
| 格式 |Start code | Byte count | Address | Record type | Data02 |Checksum | | ----- | ----- | ----- | ----- | ----- | ----- | | 示例 | : | 02 | 0000 | 02 | 1200 | EA |
255 (0xFF)
. 16 (0x10)
和32 (0x20)
是最常用的。00 ~ 05
, 表示不同数据段的含义。2n
个hex数字,具体内容取决于实际应用数据。Intel Hex的Checksum直接用例子解释吧:
record示例: :0300300002337A1E数据和为:03 + 00 + 30 + 00 + 02 + 33 + 7A = E2,这个E2的补码是1E,即这个数据record的补码。
文本行的结束符
Hex文件中,一行记录一个record,所以一个record后面跟这个结束符,即行结束符(可简单理解为换行符),这取决于系统环境,例如Linux用一个LF(即0A),而Windows的是CR LF(0D 0A)。
Record类型
有6种(00~05)标准类型:
Hex编码 | 类型 | 描述 | 示例 |
---|---|---|---|
00 | Data | 数据段, 为数据和16 bit起始地址 | :0B0010006164647265737320676170A7 |
01 | End Of File | 结束行,一般为文件的最后一行,数据区一般为空 | :00000001FF |
02 | Extended Segment Address | 数据字段包含与80x86实模式寻址兼容的16位段基址(因此字节数为02)。地址字段(通常为0000)将被忽略。 | :020000021200EA |
03 | Start Segment Address | 对于80x86处理器,请指定CS:IP寄存器的初始内容。地址字段是0000,字节数是04,前两个字节是CS值,后两个字节是IP值。 | :0400000300003800C1 |
04 | Extended Linear Address | 允许32位寻址(最大4GiB)。地址字段将被忽略(通常为0000),字节数始终为02。 | :02000004FFFFFC |
05 | Start Linear Address | 地址字段是0000(未使用),字节数是04。这四个数据字节代表加载到80386及更高版本CPU的EIP寄存器中的32位值。 | :04000005000000CD2A |
看看一个hex文件长什么样:
这个hex的实际内容是:
从中可以看到,地址并非一定要从0x0000开始的。
名称格式
有时会使用特殊名称来表示使用记录类型的特定子集的HEX文件的格式。例如:
SREC的描述这个SREC跟Hex格式类似,它是由Motorola制定的,一般也叫Motorola S-Record。这种格式通常就是我们平时见的SRECORD, SREC, S19, S28, S37。SREC的文件后缀有好多种,例如:.s19, .s28, .s37, .s, .s1, .s2, .s3, .sx, .srec, .mot
SREC的格式
示例:S1137AF00A0A0D0000000000000000000000000061
S | Type | Byte Count | Address | Data | Checksum |
---|---|---|---|---|---|
S | 1 | 13 | 7AF0 | 0A0A0D00000000000000000000000000 | 61 |
一个SREC格式文件由一系列ASCII文本记录组成。记录从左到右具有以下结构:
文本行的结束符
跟Hex文件的类似。此处不累述。
Record类型
下表描述了10种可能的S记录。S4是保留的,当前未定义。S6最初是保留的,但后来在某个时候重新定义。
Record Field | Record Purpose | Address Field | Data Field | Record Description |
---|---|---|---|---|
s0 | Header | 16-bit "0000" | √ | 该记录包含特定于供应商的ASCII文本,表示为一系列十六进制数字对。通常以空终止字符串的格式查看此记录的数据。 |
s1 | Data | 16-bit Address | √ | 该记录包含以16位地址字段开头的数据。该记录通常是 用于8位微控制器,例如AVR,PIC,8051、68xx,6502、80xx,Z80。 |
s2 | Data | 24-bit Address | √ | 该记录包含以24位地址开头的数据。 |
s3 | Data | 32-bit Address | √ | 该记录包含以32位地址开头的数据。此记录通常用于 适用于32位微控制器,例如ARM和680x0。 |
s4 | Reserved | N/A | N/A | 保留字段 |
s5 | Count | 16-bit Count | × | 此可选记录包含 S1 / S2 / S3记录的16位计数。 |
s6 | Count | 24-bit Count | × | 此可选记录包含S1 / S2 / S3记录的24位计数。该记录包含一个32位地址的起始执行位置。 |
s7 | Start Address (Termination) | 32-bit Address | × | 该记录包含一个32位地址的起始执行位置。 |
s8 | Start Address (Termination) | 24-bit Address | × | 该记录包含24位地址处的起始执行位置。 |
s9 | Start Address (Termination) | 16-bit Address | × | 该记录在16位地址处包含开始执行位置。 |
Record顺序尽管某些Unix文档指出“文件中S记录的顺序无关紧要,并且可以假定没有特定顺序”,实际上,大多数软件都对SREC记录进行了排序。典型的记录顺序以(有时是可选的)S0头记录开始,以一个或多个S1 / S2 / S3数据记录的序列继续,可能具有一个可选的S5 / S6计数记录,并以一个合适的S7 / S8 / S9终止记录。
SREC的Checksum
示例:S1137AF00A0A0D0000000000000000000000000061
相加:13 + 7A+F0 + 0A+0A+0D+00+00+00+00+00+00+00+00+00+00+00+00+00
= 19E
(hex) 掩码:保留总数的最低有效字节= 9E
(hex)。
补码:计算最低有效字节的补码= 61
(hex)。
我们来看看一个完整的SREC文件是怎样的:
这个SREC的实际内存内容是:
值得一提的是,SREC文件里面有个S0段,这个段的内容不是存放Memory有效数据的,而是一个文件头信息,可以存一些如这个文件的长度、校验码等。在做软件发布和升级文件的时候,这个内容非常有用。
通过IDE编译生成文件直接烧录就可以了,学习这些文件格式有什么用?
通过上面章节,文件格式我们是了解了,怎么才能做一个文件处理程序呢,或者有没有现成的工具可以使用?
根据实际需要的功能要求,自行实现一个软件或者脚本程序。实际上,写一个这样的程序并不难,因为其格式也不复杂。对于MCU里面的升级程序,往往需要解析这样的hex文件或者srec文件格式,也是需要实现这个文件解析的。网上也有很多这样的例子。对于网上的例子,建议多验证多测试。
2.使用SRecord
这个软件功能非常强大,它是用C/C++写的,很多其他软件都引用它,例如keil也有使用这个工具BIN2MOT。
The SRecord package is a collection of powerful tools for manipulating EPROM load files. I wrote SRecord because when I was looking for programs to manipulate EPROM load files, I could not find very many. The ones that I could find only did a few of the things I needed. SRecord is written in C++ and polymorphism is used to provide the file format flexibility and arbitrary filter chaining. Adding more file formats and filters is relatively simple.
SRecord支持非常多的文件格式,你想的到的你想不到的都支持(多达40种格式):Ascii-Hex、ASM、Atmel Generic、BASIC、Binary、B-Record、C、Intel-Hex、Motorola-Record……
实际上,它只有三板斧:srec_cat 、srec_cmp、srec_info
The primary tools of the package are srec_cat and srec_cmp. All of the tools understand all of the file formats, and all of the filters.
Name | Description |
---|---|
srec_cat | The srec_cat program may be used to catenate (join) EPROM load files, or portions of EPROM load files, together. Because it understands all of the input and output formats, it can also be used to convert files from one format to another. |
srec_cmp | The srec_cmp program may be use to compare EPROM load files, or portions of EPROM load files, for equality. |
srec_info | The srec_info program may be used to print summary information about EPROM load files. |
这个不但有Windows的程序点击链接下载(https://sourceforge.net/projects/srecord/files/srecord-win32/1.64/),还开放了源码点击链接下载(https://sourceforge.net/projects/srecord/files/srecord/1.64/),里面的实现是非常值得我们学习的。
更多内容详见:http://srecord.sourceforge.net
3.使用IntelHex
IntelHex是用Python写的,如其名字,专门用来处理Intel-Hex文件,当然也可以处理bin文件。其用法非常简单。
安装:
pip install intelhex
读数据:
>>> from intelhex import IntelHex>>> ih = IntelHex() # create empty object
>>> ih.loadbin('foo.bin') # load from bin
>>> ih.fromfile('bar.bin',format='bin') # also load from bin
>>> ih.loadbin('baz.bin',offset=0x1000) # load binary data and place them
>>> # starting with specified offset
写数据:
>>> from cStringIO import StringIO
>>> from intelhex import IntelHex
>>> ih = IntelHex()
>>> ih[0] = 0x55
>>> sio = StringIO()
>>> ih.write_hex_file(sio)
>>> hexstr = sio.getvalue()
>>> sio.close()
合并文件:
>>> original = IntelHex("foo.hex")
>>> new = IntelHex("bar.hex")>>> original.merge(new[0x0F:0x3F])
还有几个现成的script给你使用:
hex2bin.py
bin2hex.py
hex2dump.py
hexmerge.py
hexdiff.py
hexinfo.py
更多内容详见:https://python-intelhex.readthedocs.io/en/latest
4.使用bincopy
也是Python实现的,但功能比Intelhex更强大点
Mangling of various file formats that conveys binary information (Motorola S-Record, Intel HEX, TI-TXT and binary files).Project homepage: https://github.com/eerimoq/bincopyDocumentation: https://bincopy.readthedocs.io
安装:
pip install bincopy
使用:
直接看个例子比较好理解
>>> import bincopy>>> f = bincopy.BinFile("tests/files/in.hex")
>>> print(f.as_ihex())
:20010000214601360121470136007EFE09D219012146017E17C20001FF5F16002148011979:20012000194E79234623965778239EDA3F01B2CA3F0156702B5E712B722B7321460134219F:00000001FF
>>> print(f.as_srec())
S32500000100214601360121470136007EFE09D219012146017E17C20001FF5F16002148011973
S32500000120194E79234623965778239EDA3F01B2CA3F0156702B5E712B722B73214601342199
S5030002FA
>>> print(f.as_ti_txt())
@0100
21 46 01 36 01 21 47 01 36 00 7E FE 09 D2 19 01
21 46 01 7E 17 C2 00 01 FF 5F 16 00 21 48 01 19
19 4E 79 23 46 23 96 57 78 23 9E DA 3F 01 B2 CA
3F 01 56 70 2B 5E 71 2B 72 2B 73 21 46 01 34 21
q
>>> f.as_binary()
bytearray(b'!F\x016\x01!G\x016\x00~\xfe\t\xd2\x19\x01!F\x01~\x17\xc2\x00\x01\xff_\x16\x00!H\x01\x19\x19Ny#F#\x96Wx#\x9e\xda?\x01\xb2\xca?\x01Vp+^q+r+s!F\x014!')
>>> list(f.segments)
[Segment(address=256, data=bytearray(b'!F\x016\x01!G\x016\x00~\xfe\t\xd2\x19\x01!F\x01~\x17\xc2\x00\x01\xff_\x16\x00!H\x01\x19\x19Ny#F#\x96Wx#\x9e\xda?\x01\xb2\xca?\x01Vp+^q+r+s!F\x014!'))]
>>> f.minimum_address
256
>>> f.maximum_address
320
>>> len(f)
64
>>> f[f.minimum_address]
33
>>> f[f.minimum_address:f.minimum_address + 1]
bytearray(b'!')
更多内容详见:https://bincopy.readthedocs.io/en/latest/
5.其他的
本文参考:
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8