组织:中国互动出版网(http://www.china-pub.com/) RFC文档中文翻译计划(http://www.china-pub.com/compters/emook/aboutemook.htm) E-mail:ouyang@china-pub.com 译者:kevin73(kevin73,panzhenyu_2@263.net) 译文发布时间:2001-4-26 版权:本中文翻译文档版权归中国互动出版网所有。可以用于非商业用途自由转载,但必须 保留本文档的翻译及版权信息。
Network Working Group Y. Rekhter Request for Comments: 1771 T.J. Watson Research Center, IBM Corp. Obsoletes: 1654 T. Li Category: Standards Track cisco Systems Editors March 1995
边界网关协议版本4(BGP-4) (RFC1771 A Border Gateway Protocol 4 (BGP-4))
本备忘录的状态 本文档讲述了一种Internet社区的Internet标准跟踪协议,它需要进一步进行讨论和 建议以得到改进。请参考最新版的“Internet正式协议标准” (STD1)来获得本协议的标准 化程度和状态。本备忘录的发布不受任何限制。
摘要 本文档,以及随同文档,“边检网关协议在互联网中的应用”,定义了互联网的自治系 统间路由协议。 目录
致谢 3
介绍 3
操作总结 4 3.1 路由:通告和存储 5 3.2 路由信息库 5
消息格式 5 4.1 消息头格式 6 4.2 OPEN消息格式 6 4.3 UPDATE消息格式 8 4.4 KEEPALIVE消息格式 13 4.5 NOTIFICATION消息格式 13
路径属性 15 5.1 路径属性使用 16 5.1.1 ORIGIN 16 5.1.2 AS-PATH 16 5.1.3 NEXT-HOP 16 5.1.4 MULTI-EXIT-DISC 17 5.1.5 LOCAL_PREF 17 5.1.6 ATOMIC_AGGREGATE 17 5.1.7 AGGREGATOR 18
BGP错误处理 18 6.1 消息头错误处理. 18 6.2 OPEN 消息错误处理 19 6.3 UPDATE 消息错误处理 19 6.4 NOTIFICATION 消息错误处理 20 6.5 HOLD TIMER 溢出错误处理 20 6.6 有限状态及错误处理. 20 6.7 终止 21 6.8 连接冲突检测 21
BGP版本商议 21
BGP 有限状态机 22
UPDATE 消息处理 25 9.1 决策过程 26 9.1.1 Phase 1: 优先级的计算 26 9.1.2 Phase 2: 路由选择 27 9.1.3 Phase 3: 路由分发 28 9.1.4 路由覆盖 29 9.2 UPDATE发送过程 29 9.2.1 内部更新 30 9.2.2 外部更新 31 9.2.3 控制路由流量开销 31 9.2.4 路由信息的有效组织 32 9.3 路由选择标准 34 9.4 产生BGP路由 34 附录 1. BGP FSM 状态转换和行为 34 附录 2. 对比RFC1267 37 附录 3. 对比RFC1663 38 附录4. 对比 RFC 1105 38 附录5. BGP可能使用的TCP选项 39 附录6. 应用建议 39 6.1 每个消息的多网络前缀 39 6.2 使用流协议 40 6.3 减少路由抖动 40 6.4 BGP 计时器 40 6.5 路径属性顺序 40 6.6 AS_SET 排序 41 6.7 版本商议控制 41 6.8 复杂 AS_PATH 聚合 41 参考 41 安全考虑 42 作者地址 42
致谢 本文档初版是1991年10月的RFC1267,由Kirk Lougheed (cisco 系统) 和 Yakov Rekhter (IBM)合作。 我们意欲感谢Guy Almes (ANS), Len Bosack(cisco 系统), 和Jeffrey C. Honig (Cornell 大学) 对本文档早期版本的贡献。 我们特别感谢Bob Braden (ISI) 回顾本文档的早期版本并作出了建设性有价值的评论。 我们同时感谢Bob Hinden, Internet Engineering Steering Group路由主管, 以及他 组织回顾早期版本(BGP-2)的小组。本小组,包括Deborah Estrin, Milo Medin, John Moy, Radia Perlman, Martha Steenstrup, Mike St. Johns, 和 Paul Tsuchiya, 工作顽强专 业谦逊。 本文档作为更新版本是编者Yakov Rekhter and Tony Li 的IETF IDR 工作组的产品。 本文档某些部分广泛参考了IDRP[7],BGP的OSI对等协议。为此感谢ANSI X3S3.3 组,主席 是Lyman Chapin (BBN), 编辑是Charles Kunzinger(IBM Corp.)。 同时感谢Mike Craren (Proteon, Inc.), Dimitry Haskin (Bay Networks, Inc.), John Krawczyk (Bay Networks, Inc.), 和 Paul Traina (cisco Systems) 的深刻评论。 我们特别感谢 Dennis Ferguson (MCI)的巨大贡献。 Yakov Rekhter 的工作资金部分来自National Science Foundation ,批号NCR-9219216.
介绍 边界网关协议(BGP)是自治系统间路由协议。它的建立来源于RFC904[1]中定义的EGP 以及RFC1092[2]和RFC1093[3]中描述的EGP在NSFNET骨干网中的使用。 BGP交互系统的主要功能是和其他的BGP系统交换网络可达信息。网络可达信息包括可达 信息经过的自治系统(AS)清单上的信息。这些信息有效地构造了AS互联的图像并由此清除 了路由环路同时在AS级别上实施了策略决策。 BGP-4提供了一套新的机制支持无类域间路由。这些机制包括支持网络前缀的广播取消 BGP网络中“类”的概念。BGP-4也引入机制支持路由聚合,包括AS路径的聚合。这些改变为 [8, 9]建议的超网方案提供了支持。 为了刻画BGP执行的路由决策,集中讲述BGP发言者通告他自己使用的路由到相邻AS中对 端(与之通信的别的BGP发言者)的规则。这些规则反映了当今互联网广泛使用的“一跳一 跳”路由范例。注意一些策略不被“一跳一跳路由范例支持所以需要比如源路由之类的技术 来增强。例如,BGP不支持AS发送流量到相邻的AS但是路由和源自相邻AS流量有不同的路由。 另一方面,BGP支持任何与“一跳一跳”一致的策略。由于当前互联网只使用“一跳一跳” 路由范例同时BGP支持与范例一致的策略,BGP作为AS间路由协议非常适用于当今互联网。 BGP能否执行哪些策略超出了本文档的讨论范围(请参考讨论BGP使用的随同文档[5])。 BGP运行在稳定的传输协议上。这样就不用再更新分段,重传,应答和排序。传输协议 使用的认证机制可以作为BGP自己的认证机制的附加。BGP的错误通知机制假定传输协议支持 “体面”关闭,也就是说,说有没有传到的数据在联接关闭之前要被送到。 BGP使用TCP[4]作为传输协议。TCP满足BGP的传输需求并在所有的商业路由器和主机上 使用。在后面的叙述中,术语“传输协议连接”可以理解为TCP连接。BGP使用TCP端口179 建立连接。 本文档使用术语自治系统(AS)。自治系统的经典定义是在统一技术管理下的一系列路 由器,在AS内部使用内部网关协议和通用的度量路由数据包,在AS外部使用外部网关协议路 由数据包。由于本定义的发展,通常一个AS可以使用几个内部网关协议同时在AS内部使用多 种度量。使用自治系统这个术语强调了以下事实,即使使用了多个IGP和度量,对别的AS而 言,AS的管理表现出一致的路由计划和一致的目的地可达。 在互联网中使用BGP的计划,包括拓扑问题,BGP和IGP的交互,路由策略规则的实施, 在随同文档[5]中表述。本文当是一系列探究BGP应用各方面问题计划的开始。请发表评论到 BGP邮件列表(bgp@ans.net).
操作总结 两个系统通过传输协议互联。他们交换消息来打开和确认连接参数。初始的数据流是整 个BGP路由表。增加的更新作为路由表改变发送。因此,BGP发言者必须保存在连接期间所有 对等体的整个BGP路由表的当前版本。KeepAlive心跳消息周期性发送来保证连接的存在。发 送通知消息报错或者特别情况。如果一个连接遇到一个错误情况,要发送通知消息并且关闭 连接。 执行边界网关协议的主机不一定是路由器。一个非路由主机可以通过EGP甚至内部网关 协议和路由器交换路由信息。然后非路由主机可以通过BGP和别的AS中的边界路由器交换路 由信息。这种应用构架可以用于更进一步的研究。 如果一个特定AS有多个BGP发言者同时为别的AS提供中转业务,应该注意保证本AS中对 路由有一致的观点。AS内部路由的一致看法由内部路由协议提供。AS外部对路由的一致看法 由所有AS内部的BGP发言者保持BGP一一互联。使用通常的策略,BGP发言者对哪一个边界路 由器服务为和别的AS的外出/进入点达成一致。这些信息可能通过内部网关协议通信到AS的 内部路由器。注意在BGP发言者把中转业务通告到别的AS之前所有的内部路由器需要更新中 转信息。 不同AS之间的BGP发言者的连接被称为“外部”链路。同一个AS内部的BGP连接被称为“内 部”链路。同样不同AS之间的对端被称为外部对端,相同AS之间的对端被称为内部对端。 3.1 路由:通告和存储 从协议的用途出发路由被定义为组合了一个目的地和到这个目的地的路径属性的信息 单位。 -路由在一对BGP发言者之间通过UPDATE消息广播。目的地也就是在网络层可达信息 (NLRI)内报告的IP地址,路径是在UPDATE消息路径属性域内报告的信息。 -路由存储在路由信息库(RIB)内:也就是the Adj-RIBs-In, the Loc-RIB, and the Adj-RIBs-Out. 将被广播到别的BGP发言者的路由放在Adj-RIB-Out内部;在本地BGP发言者 使用的路由放在Loc-RIB, 这些路由的下一跳信息保存在BGP发言者的转发信息库内;别的 BGP发言者收到的路由信息保存在Adj-RIBs-In内部。 如果一个BGP发言者选择路由通告,他可以在通告路由到对端之前加入和修改路由的路 径属性。 BGP提供机制告诉对端先前的路由通告不再能使用。有三种方式供BGP发言者指示撤销某 条路由的服务。 a)在UPDATE消息的WITHDRAWN ROUTES域内通告先前广播的路由目的地IP前缀,这样相应 的路有被标志为不再使用, b)使用了相同网络层可达信息的替代路由被通告, c)BGP发言者-发言者的连接被关闭,强制撤销这一对发言者通高的所有的路由服务。 3.2 路由信息库 BGP发言者的路由信息库(RIB)包括三个不同部分: a)Adj-RIBs-In: Adj-RIBs-In 保存了从输入UPDATE消息学习到的路由信息,这是决策 过程的输入。 b)Loc-RIB: Loc-RIB保存了BGP发言者根据本地策略在Adj-RIBs-In内选择的本地路由 息。 c)Adj_RIBs_Out: Adj_RIBs_Out保存了本地BGP发言者通告到对端的路由。 Adj_RIBs_Out内部的消息被放在UPDATE消息内部发送的对端。 总之,Adj_RIB_In包括了被对端广播到BGP发言者的路由信息;Loc_RIB包括了被本地决 策过程选择的路由信息;Adj_RIBs_Out组织路由使用UPDATE消息通告到特定对端。 尽管本概念模型区分Adj-RIBs-In,Loc-RIB,和 Adj-RIBs-Out,这并不意味着也没有 必要具体应用中维护路由信息的独立拷贝。应用的选择(例如,信息库的三份拷贝或者一个 拷贝的指针)不受协议限制。
消息格式 本章描述BGP的消息格式。 消息通过一个稳定的传输协议互联发送。消息只有在被完整收到之后才会处理。最大的 消息是4096字节。最小的消息就是一个不包括消息体的BGP消息头,19字节。 4.1 消息头格式 每一个消息包括一个定长的消息头。消息头后面可以/可以不包含数据部分,这取决于 消息类型。这些域设计如下: 0 1 2 3 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | |
+
| |
Marker(标记): 本16字节的域包含消息接收者可以预测的值。如果消息类型是OPEN,或者OPEN消息 承载了认证信息(作为可选参数),标记必须是全1。否者,标记的值要使用认证机制来计 算(认证机制是通过认证信息的一部分来指定的)。标记可以用来探测BGP对端的同步丢失, 认证进入的BGP消息。 长度(Length): 两字节无符号整数指定了消息的字节全长,包括头部的字节。这也就是说,允许在 传输层数据流定位下一个消息(的标记域)。长度的值必须最少19字节最大4096字节,同时 由于不同的消息有更多的约束。不允许“填充”多余的数据在消息后,所以长度域是需要的 最小值。 类型(Type): 一字节的无符号整数制定了消息类型编码。如下定义: 1 - OPEN 2 - UPDATE 3 - NOTIFICATION 4 - KEEPALIVE
4.2 OPEN消息格式 在传输协议连接建立之后,两边发送的第一个消息是OPEN消息。如果OPEN消息可以接受, 需要发回一个KEEPALIVE消息来确认OPEN消息。一旦确认了OPEN消息,UPDATE,KEEKPALIVE 和NOTIFICATION消息可以交换。 在定长的BGP消息头后面,OPEN消息包含下列域:
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+
| Version |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| My Autonomous System |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| Hold Time |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| BGP Identifier |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| Opt Parm Len |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| |
| Optional Parameters |
| |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Version(版本): 1字节无符号整数指示消息的协议版本号。当前的BGP版本号是4。
My Autonomous System(我的自治系统): 2字节无符号整数指示发送者自治系统号。
Hold Time(保持时间): 2字节的无符号整数指示了发送者期望的Hold计时器的秒数。在接收OPEN消息后, BGP发言者必须使用配置的Hold计时器和收到的Hold计时器来计算Hold计时器的值。 Hold计时器必须要末是0要末最少3秒。应用可以根据Hold计时器来拒绝连接。计算好的 值指示了在连续的KEEPALIVE和/或UPDATE消息之间可以流逝的最大秒数。
BGP Identifier (BGP标示符): 4字节无符号整数指示了BGP发言者的标示符。给定的BGP发言者设置BGP标示符为IP 地址。在启动的时候决定BGP表示符,对每一个本地端口和每一个对端是一样的。
Optional Parameters Length(可选参数长度): 1字节无符号整数指示可选参数域的字节总长度。如果这个域是0,说明没有可选参 数。
Optional Parameters(可选参数):
这个域包含了可选参数清单,每一个参数编码为<参数类型,参数长度,参数值> 三元组。
0 1
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-...
| Parm. Type | Parm. Length | Parameter Value (variable)
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-...
参数类型是1个字节明确指示了参数的类型。参数长度1子节包含参数值的字节长 度。参数值是变长域根据参数类型有不同的解释。 本文档定义了下列可选参数: a)认证消息(参数类型1): 选参数用来认证BGP对端。参数值包含1字节认证编码后面是变长的认证数据。 0 1 2 3 4 5 6 7 8 +-+-+-+-+-+-+-+-+ | Auth. Code | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | | Authentication Data | | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Authentication Code(认证编码):
1字节无符号整数指示了使用的认证机制。当指定认证机制的时候,需要说明三件 事情: -认证编码的值用来指示认证机制, -认证数据的格式和含义, -Marker标示域计算值的算法。 注意可以使用另外的认证机制在建立传输层连接时。
Authentication Data(认证数据):
这个域的格式和含义取决于认证编码。
OPEN消息的最小长度是29字节(包括消息头)。 4.3 UPDATE消息格式 UPDATE消息用来发送路由信息到BGP对端。UPDATE消息报内的信息可以被用来构造AS之 间的关系描述。通过应用以下讨论的规则,路由环路和别的异常可以测出并清除出AS间路由。 UPDATE消息用来广播一条可用路由到对端,或者撤销多条不可用路由(见3。1)。UPDATE 消息可以同时广播可用路由并撤销多个不可用路由。UPDATE消息总是包括定长消息头,同时 可选的包括下面的域:
+-----------------------------------------------------+
| Unfeasible Routes Length (2 octets) |
+-----------------------------------------------------+
| Withdrawn Routes (variable) |
+-----------------------------------------------------+
| Total Path Attribute Length (2 octets) |
+-----------------------------------------------------+
| Path Attributes (variable) |
+-----------------------------------------------------+
| Network Layer Reachability Information (variable) |
+-----------------------------------------------------+
Unfeasible Routes Length(不可用路由长度):
2字节无符号整数指示了撤销路由的字节总长度。这个值必须保证网络层可达信息 域的长度被确定。 0说明没有撤销路由, UPDATE消息内部没有撤销路由。
Withdrawn Routes(撤销路由):
可变长路由域包括一系列的IP前缀说明撤销服务的路由。每一个IP前缀编码为〈长 度,前缀〉二元组,如下描述: +---------------------------+ | Length (1 octet) | +---------------------------+ | Prefix (variable) | +---------------------------+
使用和含义如下:
a) Length(长度):
长度指示了IP前缀的比特数。0长度指示了匹配所有IP地址的前缀(前缀本身 为0字节)
b) Prefix(前缀):
前缀包含了IP地址前缀后面是填充比特保证域结尾符合字节边界。注意填充比 特的值无意义。
Total Path Attribute Length(总的路径属性长度):
2字节无符号整数值时路径属性域字节总长度。值必须使下文中网络层可达域的长 度能够被探测到。
值0指示在UPDATE消息中没有网络层可达信息域。
Path Attributes(路径属性):
在每一个UPDATE消息中有变长的路径属性序列。每一个路径属性是<属性类型, 属性长度,属性值>变长三元组 属性类型是2字节域包括了属性标志字节和属性类型码字节。
0 1
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| Attr. Flags |Attr. Type Code|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
属性标志字节第一高位比特(比特0)是可选比特。定义了属性是否是可选的 (设为1)或者是公认的(设为0)。 属性标志字节第二高位比特(比特1)是转发比特。定义一个可选的属性是否 是转发的(如果设置为1)或者不是转发的(设为0)。公认属性的转发位必须设为 1。(参看部分5讨论转发属性)。 属性标志字节的第三比特(比特2)是部分比特。定义是否包括在可选转发属 性内的信息是部分的(设置为1)或者是完整的(设置为0)。公认属性和可选非转 发的部分位必须是0。 属性标志字节的第四比特(比特3)是扩展长度比特。定义了是否属性长度是1 字节(如果设置为0)或者是2字节(如果设置为1)。仅仅当属性值超过255字节的 时候,扩展长度可以使用。 属性标志字节低字节顺序4比特没有被使用。必须填0(接收不处理)。
属性类型编码字节包含了属性类型码。当前定义的属性类型码在部分5讨论。
如果属性标志字节的扩展长度比特被设置为0,路径属性的第三个字节包含了 属性数据的字节长度。
如果属性标志字节的扩展长度比特设置为1,那末路径属性的第三和第四个字 节包含了属性数据的字节长度。
路径属性剩下的字节代表属性值应该通过属性标识和属性类型码翻译。支持的 属性类型码,它们的属性值和使用如下定义:
a) ORIGIN (类型码 1):
ORIGIN是公认强制属性定义了路径信息的来源。本数据字节假定如下值:
值 含义
0 IGP – 网络层可达信息和来源AS同内部
1 EGP – 网络层可达信息通过EGP学习
2 INCOMPLETE – 通过别的方式学习网络层可达信息
它的使用在5.1.1定义。
b) AS_PATH (类型编码2):
AS-PATH是公认强制属性由一系列AS路径段组成。每一个AS路径段表示为三元 组<路径段类型,路径段长度,路径段值>。 路径段类型是1字节长度域有下列定义值。
值 段类型
1 AS_SET: 在UPDATE消息中的路由经过的AS的无序集
2 AS_SEQUENCE: 在UPDATE消息中的路由经过的AS的有序集
路径段长度是1字节长度的域包含了在路径段值域的AS的数量。
路径段值域包含了一个或者多个AS号,每一个编码为2字节长度的域。
属性的使用定义在5.1.2。
c) NEXT_HOP (类型码3):
公认强制属性定义了作为到达UPDATE消息网络层可达域地址所用的下一跳的 边界路由器的IP地址
属性的使用定义在5.1.3。
d) MULTI_EXIT_DISC (类型码4):
可选非转发属性4自解非负整数。属性值可以被BGP发言者决策过程在相邻自治 系统中区分多个出口。 它的使用在5.1.4.定义。
e) LOCAL_PREF (类型编码 5):
LOCAL-PREF是公认自决属性4自解非负整数。BGP发言者使用它通知别的BGP在 自己的自治系统中源发言者广播路由的优先程度。使用属性在5。1。5中描述。
f) ATOMIC_AGGREGATE (类型编码6)
ATOMIC-AGGREGATE是公认自决属性长度为0。BGP发言者使用它通知别的BGP法 颜真本的选择了一条更不特殊的路由而不是选择了一条更特殊的包括在内的路由。 使用这个属性描述在5。1。6。
g) AGGREGATOR (类型编码7)
AGGREGATOR是可选转发属性长度为6。属性包含了形成聚合路由最后的AS号码(编 码为2字节),后面是形成聚合路由的BGP发言者的IP地址(编码为4字节)。使用 这个属性描述在5。1。7。
Network Layer Reachability Information(网络层可达信息):
这个变长域包含了IP地址前缀的清单。网络层可达信息的字节长度不是明确编 码的,但是可以计算如下: UPDATE消息长度-23-总的路径属性长度-不可用路由长度。
其中UPDATE消息长度是定长BGP消息头的编码值,总的路径属性长度和不可用 路由长度是作为部分UPDATE消息的编码值。23是定长的BGP消息头,总的路径属性 长度域和不可用路由长度域的组合长度。
可达信息编码时作为一个或者多个二元组格式为〈长度,前缀〉,它们的域描 述如下:
+---------------------------+
| Length (长度,1字节 ) |
+---------------------------+
| Prefix (变量 ) |
+---------------------------+
域使用和含义如下: a) 长度:
长度域指示了IP地址前缀的比特长度。0地址指示了匹配所有IP地址的前缀(前 缀本身0字节)
b) 前缀: 前缀域包含了IP地址前缀跟随足够的填充比特使=域的结尾能够落在字节边 界。注意填充比特的值不关紧要。
UPDTAE消息的最小长度是23字节—19字节定长消息头+2字节不可用路由长度 +2字节总的路径属性长度(不可用路由长度是0同时总的路径属性长度是0)。
UPDATE消息能够广播至少一条路由,路由可用几个路径属性描述。所有的路径 树形包括在一个给定的UPDATE消息适用于在UPDATE消息的网络层可达信息域内包 含的目的地。
一个UPDATE消息能够列出多个路由撤销服务。每一个路由通过目的地制定(表 示为IP前缀),明白的根据上下文指定了BGP发言者-BGP发言者连接先前广播过的 路由 一个UPDATE消息可以仅仅撤销路由,这样就不需要包括路径属性或者网络层可 达信息。相反,也可以仅仅广播可达路由,这样WITHDRAWN ROUTES不需要了。
4.4 KEEPALIVE消息格式 BGP不使用任何基于传输协议的心跳机制来确定对端是否可达。相反, KEEPALIVE消息在对端之间交换频率要满足HOLD计时器不溢出的标准。合理的最 大KEEPALIVE消息时间是HOLD计时器间隔的1/3。KEEPALIVE消息必须不能比每秒 一个更频繁。应用可以调整发送KEEPALIVE消息的速率使用HOLD计时间隔的函数。 如果商议哦HOLD计时间隔是0,周期性的KEKPALIVE消息必须不发送。 KEEPALIVE消息只包含消息头长度是19字节。 4.5 NOTIFICATION消息格式 NOTIFACATION消息在探测到错误情况时发送。BGP连接发送他之后要立即关闭。
除了顶长BGP消息头,NOTIFICATION消息包括下面的域。
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| Error code | Error subcode | Data |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ +
| |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
错误码:
1字节的无符号整数指示了NOTIFICATION的类型。下列的错误类型编码定义:
错误码 符号名称 参考
1 消息头错误 部分 6.1
2 OPEN消息错误 部分6.2
3 UPDATE消息错误 部分6.3
4 Hold 计时器溢出 部分6.5
5 FSM错误 部分6.6
6 终止 部分6.7
错误子码:
一个字节的无符号整数提供了更多的信息关于报告的错误的种类。每一个错误可以由一个或 者多个错误子码,如果没有特别的错误子码定义,在错误子码域填充0(不具体)。
Message Header Error subcodes(消息头错误子码):
1 - 连接未同步.
2 - 错误消息长度.
3 - 错误消息类型.
OPEN Message Error subcodes(OPEN 显系错误子码):
1 - 不支持版本号.
2 - 错误对端AS.
3 - 坏的BGP标示符. '
4 - 不支持的选项参数.
5 - 认证失败.
6 - 不支持的HOLD时间.
UPDATE Message Error subcodes(UPDATE消息错误子码):
1 – 畸形属性链表.
2 – 不认识工人属性
3 – 缺少工人属性
4 – 属性标志错误
5 – 属性长度错误
6 – 无效ORIGION属性
7 – AS路由环路
8 – 无效的NEXT-HOP属性
9 – 可选参数错误
10 – 无效网络域
11 – 畸形AS_PATH.
数据:
变长的域白用来诊断NOTIFICATION的原因。数据与的内容依赖于错误码和错误子码。部分6 有详细说明。 注意数据与的长度可以使用公式来计算按消息长度来确定。
Message Length = 21 + Data Length
NOTIFICATION消息最小的长度是21字节,(包括消息头)
路径属性分为下面四类。
1. Well-known mandatory.(公认强制)
2. Well-known discretionary.(公认自决)
3. Optional transitive.(可选转发)
4. Optional non-transitive.(可选非转发)
公认属性是所有BGP应用都要认识的。有一些属性是情之的必须被包括在每一个ATE消息内 部。别的是自觉的可以也可以不在特定的UPDATE消息内部发送。
所有的公认属性必须发送到BGP对端(在必要的更新之后)。
作为公认属性的附加,每一个路径可以包括一个或者多个可选属性。不是所有的BGP应用都 要支持所有的可选属性。如里一个不认识的可选属性是通过设置属性标志字节的转发比特来 确定的。又不认识转发属性的路径应该被接受。如果一个有不认识的转发属性的路经被接受 并且被转发别的BGP,不认识的路径转发可选属性必须和路径一起传递到别的BGP对端,同时 属性标志字节的部分位设置为1。如果一个路径有不认识的转发可选属性被接受并且转发到 别的BGP对端,他的属性标志字节的部分比特被先前的AS设置为1,当前的AS不能把他设置为 0。不认识的非转发可选属性必须默默丢弃不要发送到别的BGP对端。
新的转发可选属性可以被起源者和别的AS附加到路径上。如果不是被其源者附加的,属性标 志的部分位被设置为1。附加新的非转发可选属性依赖于特定属性的特性。每一非转发可选 属性的文档要包括这些法则。(MULTI-EXIT-DISC属性的描述给出了一个例子)所有可选的 属性 (转发和非专发的)可以被路径上的AS更新(如果合适)。UPDATE西噢啊系的发送者要排序 路径树形在UPDATE消息内同时准备处理没有顺序的UPDATE消息的路径属性。 同样的属性不能在UPDATE消息的路径属性消息与内出现两次。
5.1 路径属性使用
每一个BGP路径属性的使用描述如下:
clauses.
5.1.1 ORIGIN
ORIGIN式是一个公认强制属性。ORIGIN 属性是产生路由的自治系统产生的。所有选择通
告路由到别的BGP发言者的BGP发言者可以把这个包括在UPDATE消息内。
5.1.2 AS-PATH
AS-PATH是公认强制属性。本属性定义了UPDATE消息那的路由信息经过的AS。列表的元素可
以是AS_SET或者AS_SEQUENCE。
当BGP发言者通告从别的BGP发言者 UPDATE的消息学习到的路由,应该根据路由发送到的BGP 发言者的位置,修改路由 AS-PATH的属性。
a)当给定的BGP发言者通告路由到本AS的别的BGP发言者,通告发言者应该修改路由的 AS-PATH属性。
b)当给定的BGP发言者通告路由到邻居AS的BGP发言者,通告发言者因该修改路由的AS-PATH 属性。
1)如果AS-PATH的第一个路径属性是AS-SEQUENCE类型,本地系统应该把字节的AS号码 作为序列的最后一个AS号码加在后面(放在最左面)。 2)如果AS-PATH的第一个属性类型是AS-SET类型,本地系统应该添加一个新的路径段 AS-SEQUENCE类型,在段的内部放AS号码。
当BGP发言者产生路由:
a)起源发言者应该包括自己的AS号码在发送到邻居AS自治系统的BGP发言者的所有UPDATE消 息的AS-PATH属性中。(在这种情况下,起源发言者的自治系统号因该是AS-PATH属性的入口)。
b)起源发言者因该包括一个空的AS-PATH属性在发送到本地自治系统的BGP发言者的所有 UPDATE消息的AS-PATH属性中。(空的AS-PATH属性是长度域是0的属性) 5.1.3 NEXT-HOP NEXT-HOP路径属性定义了边界路由器的IP地址,作为到达UPDATE消息的目的地列表的下 一跳。如果边界路由器和对端属于同一个AS,对端是内部边界路由器。否则,是外部边界路 由器。BGP发言者可以通告任何内部边界路由器作为下一跳,如果本边界路由器和IP地址对 应的接口(说明在NEXT-HOP路径属性中)和本地以及远端边界路由器共享公共的子网。BGP 发言者可以通告任何外部边界路由器作为下一跳,如果本边界路由器的IP地址是通过对端 BGP发言者学习到的,同时边界路由器的IP地址相应的接口(在NEXT-HOP路径属性中说明) 和本地以及远端的BGP发言者共享了公共的子网。BGP发言者需要能够支持外部边界路由器的 通告能力不足。 BGP发言者必须不通告对端的一个地址作为NEXT-HOP到这个对端,作为这个发言者产生的路 由。BGP发言者必须不能安装路由把自己作为下一跳。
当BGP发言者通告路由到本地AS的BGP发言者,通告发言者不应该修改路由的NEXT-HOP属性。 当BGP发言者通过内部链路受到路由,可以转发包到NEXT-HOP地址,如果属性中包含的地址 是和本地以及远端BGP发言者在公共的子网上。
5.1.4 MULTI-EXIT-DISC MULTI-EXIT-DISC属性可以被用来在外部(AS间)链路上区分同一个邻居AS的多个出口或者 说入口。MULTI-EXIT-DISC属性的值时四个字节的无符号数称为一个度量。所有别的因子相 等,具有较低的度量的出口或者入口有较高的优先级。如果在外部链路上收到, MULTI-EXIT-DISC属性可以通告到内部链路的同一个AS的别的BGP发言者。MULTI-EXIT-DISC 属性不能再通告到邻居AS的别的BGP发言者。 5.1.5 LOCAL_PREF LOCAL-PREF是公认自决属性,可以包括在发送到本地AS的BGP发言者的UPDATE消息内。BGP 发言者应该为每一条外部路由计算优先级程度同时在通告路由到内部对端的时候包括这个 优先级。优先级高的路由应该使用。BGP发言者因该使用通过LOCAL-PREF学习到的优先级用 于决策过程(见部分9。1。1)。
BGP发言者应该不包括这个属性在发送到邻居AS的发言者的UPDATE消息中。如果BGP发言者受 到一条不在同一个AS内的BGP发言者的UPDATE消息包括了这个属性,这个属性应该被忽略掉。 5.1.6 ATOMIC_AGGREGATE ATOMIC-AGGREGATE是公认自决属性。如果BGP发言者,当得到一个对端的一些重叠的路由(见 9。1。4),选择了一条更不特殊的路由而不是选择一条更特殊的路由,那末本地系统应该 附加ATOMIC-AGGREGATE属性到路由,当通告道别的BGP发言者的时候(如果属性没有表示在 接收的更不特殊的路由中)。BGP发言者接收具有ATOMIC-AGGREGATE属性的路由不应该从路 由中去掉这个属性,当通告路由到别的BGP发言者的时候。收到具有ATOMIC-AGGREGATE属性 的路由的BGP发言者需要知道如下事实:实际的到达目的地的路由,在NLRI内说明,有自由 环回特性,可以通过AS-PATH属性内没有列出的AS。
5.1.7 AGGREGATOR AGGREGATOR是可选转发属性,可以包括在聚合形成的更新中,(见9。2。4。2)。执行聚合 的BGP发言者可以加入AGGREGATOR属性,里面包括自己的AS号和IP地址。
当下面描述的任何情况被探测到,NOTIFICATION消息包括制定的错误码,错误子码,数据域, 被发送出去,BGP连接断开。如果错误子码没有指定,必须要使用0。
术语“BGP连接关闭”意思是传输协议连接被关闭同时BGP连接的所有资源被释放。远端对应 的路由表入口被标记无效。在路由被系统探测出来之前,路由无效的事实被发送到BGP对端。
除非特别说明,发送指示错误的NOTIFICATION消息的数据域是空的。
6.1 消息头错误处理. 当处理消息头时所有探测的错误在发送NOTIFICATION消息时用错误码Message Header Error指示.错误子码依赖于具体的错误。
消息头的Marker域的期望值是全1,如果消息类型是OPEN。别的BGP消息的消息头的 Marker于的期望值决定于BGP OPEN消息的认证信息可选参数的表达和实际的认证机制(如果 BGP OPEN消息表达了认证信息)。如果消息头的Marker域不是期望的,就发生了同步错误, 错误子码设置为Connection Not Synchronized。
如果消息头的长度域小于19字节或者大于4096字节,或者OPEN消息的长度域小于最小的 OPEN消息长度,或者UPDATE消息的长度域小于UPDATE消息的最小长度,或者KEEPALIVE消息 的长度域小于KEEPALIVE消息的最小长度,或者NOTIFICATION消息的长度小于最小的 NOTIFICATION消息的长度。错误子码设置为Bad Message Length。数据域包含了错误的长度。
消息头的pe 域不认识,错误子码设置为Bad Message Type。数据域包含了错误的Type域。
6.2 OPEN 消息错误处理 处理OPEN消息探测到的错误通过发送NOTIFACAITION指示,错误子码是OPEN Message Error。错误子码取决于特定的错误。
如果OPEN消息Version域内的版本号不支持,错误子码设置为Unsupported Version Number。数据域是2字节的无符号整数,说明最大的本地支持的小于对端BGP提出的版本。(在 OPEN消息中收到) 如果OPEN消息的Autonomous System域不支持,错误子码设置为Bad Peer AS。可接受的 AS号码的确定超出了文档的范围。
如果OPEN消息的Hold Time域不可接受,错误子码必须设置为Unacceptable Hold Time。 应用必须拒绝一到两秒的Hold Time值。应用可以拒绝任何建议的Hold Time。接受Hold Time 的应用必须使用Hold Time的商议值。
如果OPEN消息的BGP Identifier域语法错误。错误子码设置为Bad BGP Identifier。语 法错误意味着BGP Identifier 是错误的标示符。
如果OPEN消息的一个Optional Parameter不认识,错误子码设置为Unsupported Optional Parameters。
如果OPEN消息承载了Authentication Information (作为可选参数), 激活相应的认证 过程。如果认证过程(基于认证码和认证数据)失败,错误子码设置为 Authentication Failure。
6.3 UPDATE 消息错误处理 处理UPDATE消息探测的错误通过发送NOTIFACATION说明,错误码是UPDATE Message Error。错误子码决定于具体的错误。
UPDATE消息的错误检查开始是路径属性检查。如果不可用路由长度或者整个属性长度太大 (也就是说,如果Unfeasible Routes Length + Total Attribute Length + 23 ) message Length), 错误子码是Malformed Attribute List。
如果认识的属性的属性标志和属性类型码矛盾,错误子码设置为Attribute Flags Error。 数据域包含了错误的属性 (类型,长度和值)。
如果认识的属性的属性长度和期望的长度矛盾(根据属性类型码),错误子码是Attribute Length Error。数据域包含了错误的属性 (类型,长度和值)。
如果强制公认属性没有表示,错误子码设置为Missing Well-known Attribute。数据域包括 了漏掉的公认属性的类型码。
如果强制公认属性不认识,错误子码设置为Unrecognized Well-known Attribute。数据域 包含了不认识的属性(类型,长度,值)。
如果ORIGIN属性值不认识,错误子码是Invalid Origin Attribute. 数据域包含了不认识 的属性(类型,长度,值)。
如果NEXT-HOP属性是语法错误,错误子码是Invalid NEXT_HOP Attribute。数据域包含了不 正确的属性(类型,长度,值)。语法错误意思是NEXT-HOP属性表示无效IP地址。语义检验 只用在外部BGP链节上。意味着IP地址的接口,在NEXT-HOP中说明,和接受BGP发言者共享了 公共的子网但是不是接受BGP发言者的IP地址。如果NEXT-HOP属性是语义不正确,错误要记 录,路由被忽略。在这种情况下,不发送NOTIFACAITON消息。
AS-PATH属性要检查语法错误。如果路径语法错误,错误子码是Malformed AS_PATH。
如果可选参数认识,参数值要检查。如果发现错误,属性被丢弃,错误子码是Optional Attribute Error.数据域是这个属性(类型,长度和值)。
如果任何属性在UPDATE消息中出现多次,错误子码是Malformed Attribute List。
UPDATE消息的NLRI域作语法检查。如果语法错误,错误子码是Invalid Network Field。
6.4 NOTIFICATION 消息错误处理 如果对端发送NOTIFICATION消息,在消息中有错误,很不幸没有办法报告这个错误,通过又 一个NOTIFICAITON消息。任何这种错误,,比如不认识的错误吗或者错误子码,应该注意, 在本地记录,同时引起对端管理的注意。实现手段就不是本文档讨论的问题了。
6.5 Hold Timer 溢出错误处理 如果系统在OPEN消息的Hold Time域说明的周期内没有收到连续的KEEPALIVE和/或UPDATE和 /或NOTIFACATION消息,错误子码是Hold Timer Expired Error Code 的NOTIFICATION消息 发送出去同时BGP连接断开。
6.6 有限状态及错误处理. BGP 有限状态机探测的任何错误(比如,接受到不认识事件)通过发送NOTIFICATION消息指 示,错误子码是Finite State Machine Error。
6.7 终止 如果出现任何致命错误(在这个部分说明),BGP对端可以选择在给定的任何时间关闭BGP 连接,通过发送错误码是Error Code Cease的NOTIFACATION消息。然而,Cease NOTIFACATION 消息必须不使用,当这个部分说明的致命错误不存在。
6.8 连接冲突检测 如果一对BGP发言者尝试互相同时建立TCP连接,在一对发言者之间的两个并行的连接形成, 我们称为连接冲突。很明显,一个连接应该关闭。
基于BGP标示符的值,建立了约定来探测当冲突发生的时候哪一个BGP连接是先来的。约定时 比较冲突的BGP对端的标示符同时保留使用较高的BGP标示符的BGP发言者初始化的连接。
在收到OPEN消息,本地系统应该检测所有的在OnenConfirm状态的连接。BGP发言者也可以检 测在OpenSent状态的连接,如果他通过本协议以外的手段知道对端的BGP标示符。如果在这 些连接中,有一个连接到远端的BGP发言者,他的BGP标示符等于在OPEN消息中的标示符,本 地系统执行下面的冲突解决过程:
1.本的系统的BGP发言者比较远端系统的BGP标示符。(在OPEN消息中说明)
2.如果本的BGP标示符的值小于远端,本的系统关闭已经存在的BGP连接(已经在OpenConfirm 状态的那个),同时接受远端系初始哈的BGP连接。
3.否则,本地系统关闭新建立的BGP连接(和新收到的OPEN消息关联的),继续使用存在的 那个(已经在OpenConfirm 状态的那个)。
比较BGP标示符是把他们看作(4字节长)无符号整数。
和已经在建立状态的BGP连接冲突的连接导致无条件关闭新建立的连接。注意连接冲突不能 被探测,如果有连接在Idle,或者Connect,或者Active状态。
关闭这个BGP连接(这是冲突解决过程的结果)是通过发送NOTIFICATION消息,错误子码是 Cease.
BGP版本商议 BGP发言者可以商议协议版本,通过多次尝试打开一个BGP连接,使用两边都支持的最高版本。 如果建立尝试失败,错误吗是OPEN Message Error, 错误子码是Unsupported Version Number,BGP发言者得到他尝试的版本号,对端尝试的版本号,在NOTIFICATION消息中对 端发送的版本号。如果两个对端支持一个或多个公共版本,可以很快决定最高的支持版本。 为了支持BGP版本商议,未来的BGP版本保留OPEN和NOTIFACATION 消息的格式。
BGP 有限状态机 本部分使用状态机(FSM)明BGP的操作。下面是BGP操作的FSM简要的说明和回顾。BGP FSM 精华版本在附录1中说明。
开始BGP在Idle状态。
Idle状态:
在这个状态,BGP拒绝任何进入的BGP连接。不为对端分配任何资源。响应Start事件(系 统或者操作者初始化),本地系统初始化所有的BGP资源,开始ConnectRetry计时器,初始 化传输连接到别的BGP对端,当检听到远端BGP对端初始化BGP连接,改变状态到连接。 ConnectRetry计时器的确切值是本地设置,但是要有效大于允许TCP初始化。
如果BGP发言者探测到错误,关闭连接转换状态到Idle。脱离Idle状态需要Start事件的产生。 如果这个事件自动产生,连续的BGP错误会导致发言者的抖动。为了避免这个情况,建议先 前由于错误而转换到Idle状态的对端的Start事件不应该立即产生。在连续产生的Start事件 之间的时间,如果事件时自动产生的,应该指数增长。初始计时器的值应该是60秒。计时应 该每连续产生一次就加倍。
在Idle状态下任何别的事件被忽略。
连接状态:
在这个状态BGP等待传输协议连接的完成。
如果传输协议连接成功,本地系统清除ConnectRetry计时器,完成初始化,发送OPEN 消息到对端,改变状态到OpenSent.
如果传输协议连接失败(比如,重穿超时),本的系统重启ConnnectRetry计时器,继 续侦听远端BGP对端初始化的连接,改变它的状态到Active状态。
响应ConnectRetry计时器溢出事件,本地系统重启ConnectRetry计时器,初始化传输连 接到BGP对端,继续侦听远端BGP对端初始化的连接,停留在Connect状态。
Start事件在Active状态被忽略。
响应其他的事件(被别的系统或者操作者初始化),本地系统释放连接占有的所有的BGP 资源,转换状态到Idle。
Active状态:
在这个状态,BGP尝试通过初始化传输协议连接来得到对端。
如果传输协议连接成功,本地系统清除ConnectRetry计时器,完成初始化,发送OPEN 消息到对端,设置Hold计时器为一个很大值,改变状态到OpenSent。计时器值建议是4分钟。
响应ConnectRetry计时器溢出事件,本的系统重启ConnectRetry计时器,初始化传输连 接到别的BGP对端,继续侦听远端BGP对端初始化的连接,改变状态到Connect.
如果本的系统探测到远端尝试建立BGP连接到自己,远端的IP地址不是期望的,本的系 统重启ConnectRetry计时器,拒绝尝试连接,继续侦听远端BGP对端初始化的连接,停留在 Active状态。
Start事件在Active状态被忽略。
响应任何别的事件(别的系统或者操作者初始化),本的系统释放连接占有的所有的资 源,改变状态到Idle.
OpenSent状态:
在这个状态BGP等待来自对端的OPEN消息。当OPEN消息受到,所有的域要检查正确性, 如果BGP消息头检查或者OPEN消息检查探测到错误(见部分6。2),或者由连接冲突(见部 分6。8),本的系统发送NOTIFACATION消息,改变状态到Idle。
如果在OPEN消息内没有错误,BGP发送KEEPALIVE消息设置KeepAlive计时器。Hold计时 器,先前被设置为一个大值(见上面),被商议的Hold Time值替代(见部分4。2)。如果 商议的Hold Time值是0,Hold Time计时器和KeepAlive计时器要重启。如果Autonomous System 域的值是和本地AS号码一样的,连接是“内部”连接,否则是“外部”连接。(这 会影响下面所描述的UPDATE消息的处理。)最后,转态转换到OpenConfirm。
如果从承载传输协议收到断开通告,本的系统关闭BGP连接,重启ConnectRetry计时器, 同时继续侦听远端BGP初始化的连接,进入Active状态。
如果Hold计时器溢出,本的系统发送NOTIFICATION消息,错误码是Hold Timer Expired , 同时改变状态到Idle。
响应Stop事件(系统或者操作者初始化),本地系统发送NOTIFICATION消息,错误码是 Cease同时改变状态到Idle。
Start事件在OpenSent状态被忽略。
对别的事件的响应,本的系统发送NOTIFICATION消息,错误码是Finite State Machine Error同时改变状态到Idle。
无论何时BGP改变状态从OpenSet道Idle,关闭BGP(以及传输层)连接释放连接占用的所 有的资源。
OpenConfire状态:
在这个状态,BGP等待KEEPALIVE或者NOTIFICATION消息。
如果本的系统受到KEEPALIVE消息,改变状态到Established。
如果在收到KEEPALIVE消息之前,Hold 计时器溢出,本的系统发送NOTIFICATION消息, 错误码是Hold Timer Expired,改变状态到Idle.
如果本的系统受到NOTIFICATION消息,改变状态到Idle。
如果KeepAlive计时器溢出,本的系统发送KEEPALIVE消息,重启他的KeepAlive计时器。
如果从底层的传输协议受到断开通告,本的系统状态转换到Idle。
响应Stop事件(系统或者操作者初始化)本地系统发送NOTIFICATION消息,错误码是 Cease ,改变状态到Idle。
Start事件在OpenConfirm状态被忽略。
响应别的事件,本的系统发送NOTIFICATION消息,错误码是Finite State Machine Error,改变状态到Idle。
无论何时BGP改变状态从OpenConfirm到Idle,关闭BGP(传输层)连接同时释放所有连 接占用的资源。
建立状态:
在建立状态,BGP交换UPDATE, NOTIFICATION,和KEEPALIVE消息到对端。
如果本的系统受到UPDATE或者KEEPALIVE消息,开启Hold计时器,如果商议的Hold Time 值不是零。
如果本的系统受到NOTIFICATION消息,状态转换到Idle.
如果本的系统受到UPDATE消息,UPDATE消息的错误处理过程(见部分6。3)探测到错误, 本的系统发送NOTIFICATION消息,改变状态到Idle。
如果断开通告通过承载传输协议受到,本的系统改变状态到Idle。
如果Hold计时器溢出,本的系统发送NOTIFICATION消息,错误码是Hold Timer Expired , 改变状态到Idle。
如果KeepAlive计时器溢出,本的系统发送KEEPALIVE消息,重启KeepAlive计时器。
每次本的系统发送KEEPALIVE或者UPDATE消息,重启KeepAlive计时器,除非商议的计时 器值是零。
响应Stop事件(通过系统或者操作者初始化),本地系统发送NOTIFICATIOIN消息,错 误码是Cease,改变状态到Idle。
Start事件在Established状态被忽略。
响应别的事件,本的系统发送NOTIFACATION消息,错误码是Finite State Machine Error,改变状态到Idle。
无论何时P改变状态从Established到Idle,关闭BGP(以及传输层)连接,释放连接占 用的所有资源,删除所有的连接产生的路由。
如果可选的非转发的属性不认识,默默丢弃。如果可选转发属性不认识,属性标志字节 设置部分位(第三个高位顺序位),保留属性公告到别的BGP发言者。
如果可选的属性被认识,而且值有效,要根据可选参数的类型在本地处理,保留,,如果必 要的话,更新广播到别的BGP发言者。
如果UPDATE消息包括非空的WITHDRAWN ROUTES域,先前广播的路由如果目的地包括在这里面 需要从Adj-RIB_In中移出来。BGP发言者应该运行决策过程,原因是先前的公告路由不再可 用。
如果UPDATE消息包括了一个可用的路由,应该放在相应的Adj-RIB_In内部,同时做下面的步 骤:
i)如果网络层可达信息(NLRI)和Adj-RIB_In的路由一样,新路由应该替换老路由,这样明 确撤销了老路由的服务。BGP发言者运行决策过程,原因是老路由不再存在。
ii)如果新的路由重叠包含在Adj-RIB-In老路由内部(见9。1。4),BGP发言者应该运行决策 过程,因为更特殊路由使得原来的更不特殊路由的一部分不可用了。
iii)如果新路由有和Adj_RIB_In内包含的路由同样的路径属性,并且更特殊(见9。1。4)。 不需要做任何事情。
iv)如果新路由的NLRI不同于Adj-RIB-In存储的任何路由,新路由应该放入。BGP发言者应该 运行决策进程。
v)如果新路由是更不特别的重叠路由,BGP发言者应该运行对更不特殊的路由运行决策进程。
9.1 决策过程 决策过程选择路由用于下一步的通告,方法是应用本地策略信息库(PIB)的策略处理 Adj-RIB-In中的路由。决策过程的输出是广播到对端的路由集合;被选的路由存储在 Adj-RIB-Out中。
选择过程可以定义为一个函数,给定路由的属性作为参数,返回非负的整数指示路由的优先 级别。计算路由优先级别的函数不能把以下的情况作为输入:别的路由的存在,别的路由的 不存在,或者别的路由的路径属性。路由选择对每一个可用路由运用优先程度算法,选择最 高优先程度的路由。
决策过程操作Adj-RIB-In包括的路由中,同时负责:
-选择路由通告到本地的AS中别的BGP发言者
-选择路由通告到邻居AS中的BGP发言者
-路由聚合和路由信息简化
决策过程分三期,通过不同的事件触发。
a)一期负责计算来自邻居AS 的BGP发言者的每条路有的优先级,通告到在本地AS的 别的BGP发言者到每个确定的目的地的具有最高优先级的路由。
b)二期在一期完成的时候激活。负责从到达目的地的所有路由中选择最好的路由,同时安装 每个选择的路由到相应的Loc-RIB。
c)在Loc-RIB修改后激活三期。负责发布Loc_RIB中的路由到邻居AS的每个对端。路由聚合和 信息简约在这期可选的执行。
9.1.1 Phase 1: 优先级的计算
无论何时本地的BGP发言者接受到邻居AS的对端的通告新的路由,替代路由,测销路由的 UPDATE消息,都要激活一期决策过程,
一期决策过程是独立的过程,当没有别的工作要做的时候就停止。
一期决策功能在操作任何包含路由之前锁定Adj-RIB-In,在操作完成所有新的或者不可用的 路由之后,解开Adj-RIB-In。
每一个新收到或者替代的可用路由,本的BGP发言者应该确定一个优先级。如果路由是通过 本地AS的BGP发言者学习到的,或者LOCAL-PREF值被当作优先级,或者本地系统应该根据预 先配置的策略信息计算路由优先级。如果路由通过邻居AS中的BGP发言者学习,优先级的计 算是根据预先配置的策略。策略信息的确切特性和相关计算是本地的问题。本的发言者应该 云内部更新过程9。2。1选择并且通告最佳路由。
9.1.2 Phase 2: 路由选择
第二期决策函数在第一期完成后激活。第二期函数是独立的过程当没有更进一步的工作要做 的时候就停止。第二期进程要考虑Adj_RIB_In中的所有路由,包括从自己的AS中和邻居的AS 中的BGP发言者接收的路由。当运行第三期决策函数,第二期决策函数可以阻塞。第二期距 测函数应该在开始函数前锁定所有的Adj-RIB-In,在完成后解开所有。
如果BGP路由的NEXT-HOP属性描述了一个地址,在本地Loc-RIB中BGP发言者没有路由,BGP 发言者应该排除在第二期决策函数外面。
为了Adj_RIB_In中的路由的每一个目的地集合,本地BGP发言者以确定路由: a)对同一个目的地集和,最高优先级的路由,或者
b)是唯一的到目的的地路由,或者
c)是9.1.2.1.第二期解扣规则的选择结果。
本地发言者应该安装路由到Loc-RIB中,替代Loc-RIB中保存的任何道相同目的地的路由。本 地发言者必须根据选择路由的NEXT-HOP属性确定立即下一跳,通过查找IGP悬着IGP中的可能 的路径。当安装选择路由在Loc_RIB中,立即下一跳必须被使用。如果NEXT-HOP属性描述的 地址改变,路由选择应该按照上面的说明重新计算。
不可用的路由应该从Loc-RIB中拿出,相应的不可用路由应该从Adj-RIBs-In拿出。
9.1.2.1 解扣(第二期)
在Adj-RIBs-In中一个BGP发言者可以有多个有相同的优先级的路由到同一个目的地。本 的发言者可以选择包含在相应Loc-RIB中的一条路由。本地发言者认为所有的路由,不论是 邻居AS的BGP发言者的路由,还是本地AS的BGP发言者的路由是一样的。
下面的解扣过程假设一个自治系统的所有AS的每一个候选路由能够确定到NEXT-HOP属性描 述的地址的路径代价(内部距离)。根据下面的算法解扣。
a)如果本地系统配置考虑MULTI_EXIT_DISC,候选路由的MULTI_EXIT_DISC 属性不同,选择
MULTI_EXIT_DISC属性值最小的。
b)否则,选择到路与欧的NEXT-HOP属性描述的入口的代价(内部距离)最小的。如果有几个 路由有相同的代价,按照下面的过程解扣
-如果最少有一个路由是通过邻居AS的BGP发言者通告的,选择邻居AS的BGP发言者通告的鲈 鱼哦,如果BGP的标示符的值是所有邻居AS的BGP发言者中最小的。
-否则,选者BGP标示符最小的BGP发言者通告的路由。
9.1.3 Phase 3: 路由分发
第三期路由决策过程可以被第二期的完成激活,或者下面的事件发生:
a)Loc-RIB中的到本地目的地的路由改变。
b)当本地产生的通过BGP以外的方式学习的路由改变。
C)当新的BGP发言者-BGP发言者连接建立。
第三期函数是独立的过程当没有进一步的工作去做的时候停止。第三期路由决策过程应该被 阻塞,如果第二期决策过程在运行。
所有的Loc-RIB中的路由应该被处理到相应的到Adj-RIBs-Out的入口。路由聚合和信息简约 技术(见9.2.4.1) 可选执行。
为了更好支持未来的AS间多播能力,参加AS间多播路由的BGP发言者应该通告他 从外部对端收到的路由同时如果安装在Loc-RIB内,因该通告到接收路由的对端。对 没有参加AS间多播路由的BGP发言者这个通告是可选的。如果做这样一个通告,NEX T-HOP属性应该被设置为对端地址。应用可以优化这个通告,组合AS-PATH属性 的信息不但包括自己的AS号码而且通告路由的对端的AS号码(这个组合要求ORIGI N属性被设置为INCOMPLETE)。另外,应用不需要传递可选的或者自决的路径属 性在这种通告中 。
当Adj-RIBs-Out更新而且转发信息库(FIB)完成,本地BGP发言者应该运行外部更新 进程9。2。2。
9.1.4 路由覆盖 BGP发言者可以传送具有重叠的网络层可达信息(NLRI)的路由到别的BGP发言者。 NLRI重叠产生于一些列目的地对非匹配的多个路由是唯一的。由于BGP使用IP前缀 对NLRI编码,重叠一般要展示子网关系。路由描述了更小范围的目的地(更长的前缀) 称为更特别路由,路由描述了更大范围的目的地(更短的前缀)成为更一般路由。反之同样。
这种优先关系有效分解了更一般路由为两部分:
-一系列目的地,仅仅使用更一般路由描述。
-一系列路由,使用更一般和更特殊路由的重叠描述。
当重叠路由发生在同样的Adj-RIB-In,更特殊的路由应该有优先权,顺序是更特殊到更一般。
重叠描述的目的地的集合表明一部分更一般路由是可用的,但是当前不可用。如果一个更特 殊的路由后来撤销了,重叠描述的目的地的集合将可以使用更一般的路由到达。
如果BGP发言者接收了重叠路由,决策过程应该考虑重叠路由的语义。特别是,如果BG P发言者接收了同一个对端的更一般的路由同时拒绝了更特殊的路由,那末重叠表示的目的 地可能不转发到路由的AS-PATH属性列出的AS那里。因此,BGP发言者可以由下 面选择: a)同时安装更一般和更特殊的路由
b)只安装更特殊的路由 c)只安装更一般路由的非重叠部分(这意味着解聚和)
d)聚合着两条路由同时安装聚合路由
e)安装更一般的路由
f)都不安装
如果一个BGP发言者选择e),应该加入ATOMIC-AGGREGATE属性到路由中。承载 ATOMIC-AGGREGATE属性的路由不能被解聚和。也就是说,路由的NLRI不能被是更特殊。向这 个路由转发不保证IP包实际沿着路由的AS-PATH属性列出的AS中转。如果BGP发言者选择a), 必须不在通告更特殊的路由的时候通告更一般的路由。 9.2 Update发送过程 Update-Send 进程负责通告UPDATE消息到所有的对端。例如,他发布决策进程选择的路由到 位于同样的自治系统或者邻居自治系统的BGP发言者。不同自治系统的BGP发言者之间信息交 换的法则参看9。2。2;相同自治系统的BGP发言者之间信息交换的法则参看9。2。1。
在BGP发言者集合之间的路由信息的发布,所有BGP发言者如果在同一个自治系统,称为内部 发布。 9.2.1 内部更新 内部更新进程是发布路由信息到本地自治系统的BGP发言者。
当BGP发言者从在本地自治系统的别的BGP收到了UPDATE消息,接收BGP发言者不应该再分配 UPDATE消息中的路由信息道别的本地自治系统的BGP发言者。
当BGP发言者接收了邻居自治系统的BGP发言者的一条新的路由,如果下面的情况之一发生, 应该使用UPDATE消息通告路由到本的自治系统的所有的BGP发言者:
1) 本地BGP发言者安排给新接收的路由的优先程度高于本地发言者已经安排的接受自邻居 自治系统的别的路由的优先级,或者 2) 没有接收到别的邻居自治系统的BGP发言者发送的路由,或者 3) 新接收路由是几个最高优先级,同样目的的的路由解扣的结果,(解扣过程在9。2。1。 1中说明。
当BGP发言者受到了UPDATE消息,有非空的WITHDRAWN RJOUTES域,应该从Adj-RIB-In里去掉 所有的在这个域中(IP前缀表示)的目的地。
发言者应该做下面的附加步骤:
1) 如果相应的可用路由先前没有被通告,不需要做更多的行动。 2) 如果相应的可用路由先前被通告,那末:
i) 如果被选择通告的新的路由和不可用路由有相同的网络层可达信息,本的系统 因该通告替代路由。 ii) 如果替代路由不能用于通告,BGP发言者应该包括不可用路由的目的的(IP前缀 形式)在UPDATE消息的WITHDRAWN ROUTES域,因该发送这个消息到先前通告了 相应的可用路由的对端。
所有的通告过的可用路由因该放入相应的Adj-RIBs-Out,所有不可用的但是通告过的路由应 该被从Adj-RIBs-Out清除。
9.2.1.1解扣 (内部更新)
如果一个本地的BGP发言者连接到邻居AS的几个BGP发言者,有多个Adj-RIBs-In和这些对段 相关联。这些Adj-RIB-In可以包括到同一个目的的的多个等价优先级的路由,所有的路由要 通告到邻居自治系统。本的BGP发言者应该根据下面法则选择其中一条路由:
a)如果候选路由的NEXT-HOP和MULTI-EXIT-DISC属性不同,本地系统配置中考虑了 MULTI-EXIT-DISC属性,选择有最低的MULTI-EXIT-DISC属性的路由。
b)如果本的系统能够确定候选路由中T-HOP属性描述的实体的路径的成本,选择成本较 低的路由。
c)在所有别的情况中,选择通告路由的BGP发言者具有较低的BGP标示符的路由。
9.2.2 外部更新
外部更新过程和邻居AS的BGP发言者路由信息的发布有关。作为阶段3选择过程的一部分,BGP 发言者更新他的Adj-RIBs-Out 和转发表.所有新的安装的路由和所有新的没有替代路由的 不可用的路由要通过UPDATE消息通告到邻居AS内部的BGP发言者。
任何位于LOC-RIB的路由,如果是不可用的应该被撤销。在自己的AS内部如果可达地址改变 应该发送UPDATE消息。
9.2.3 控制路由流量开销 BGP协议限制路由流量(也就是UPDATE消息),目的是减少通告UPDATE消息的带宽和消化 UPDATE消息信息的决策过程的处理能力。
9.2.3.1 路由通告的频率
参数MinRouteAdvertisementInterval确定了BGP发言者到特定目的地的两个路由通告之间 的最小时间。这个速率限制过程是基于单个目的地的,但是这个 MinRouteAdvertisementInterval值是对每一个对端设置的。
从单个BGP发言者通告可用路由到目的地集合的来自BGP发言者的两个UPDATE消息必须至少 分离MinRouteAdvertisementInterval. 无疑, 只有精确保持目的地集合的计时器才能做到 这一点。这是不现实的开销。任何保证BGP发言者接受自邻居AS通告的两个UPDATE消息之间 时间间隔的技术通告可用路由到目的的地最小间隔是MinRouteAdvertisementInterval,也 要保证大于间隔的一个常量是可以接受的。
由于需要在AS内部快速收敛,本过程不能用于从本AS中别的BGP发言者发来的路由。为了避 免永久黑洞,本过程不能用于明确的撤销或者不可用路由(也就是,目的地(通过IP前缀表 示)在UPDATE消息中WITHDRAWN ROUTEST域的路由)。
这个过程不限制路由选择的速率,但是仅仅限制路由通告的速率。当等待 MinRouteAdvertisementInterval溢出时,如果新的路由被选择多次, 在 MinRouteAdvertisementInterval的最后最后选择的路由被通告.
9.2.3.2 路由产生的速率
参数MinASOriginationInterval确定了在BGP发言者本身的AS,中报告变化的UPDATE消息的 连续通告的最小间隔
9.2.3.3 Jitter
为了减少给定的BGP发言者的BGP消息产生尖峰,jitter应该被使用于 MinASOriginationInterval, Keepalive, MinRouteAdvertisementInterval计时器.给定的BGP发言者应该应用同样的jitter数量, 无论UPDATE被送到那个目的地;也就是说,jitter不能被基于“每个对端” 使用。 引入的Jitter的数量使用相应的计数器的基本值乘以一个范围是0。75到1的随机因子。
9.2.4 路由信息的有效组织
选择将要广播的路由信息,一个BGP发言者可以采用几个方法,组织信息为一个有效形式。
9.2.4.1 信息简约
信息简约可以在策略控制的程度上使用简约-在信息崩溃之后,相同的策略在等价类上使用 在所有的目的地和路径。
决策进程使用下面方法可选的减少放在Adj-RIB_Out中的信息数量:
a)网络层可达信息(NLRI)
目的IP地址可以被看作IP地址前缀。若地址结构和在AS管理者控制下的系统能够达成一致, 有可能减少UPDATE消息中NLRI的尺寸。
b) AS_PATHs(AS 路径):
AS 路径信息可以表达为顺序AS-SEQUENCE和无序AS-SET。S-SET可以用在路由聚合算法,描 述在9。2。4。2中。他们减少了AS-PATH的尺寸,通过只列出每个AS号码一次,无论在聚合 的AS-PATH上出现了几次。
一个AS-SET意味着NLRI列出的目的地能够通过由AS-SET中的部分AS组成的路径到达。AS-SET 提供有效的信息来避免回环;然而使用他们可能会剪除一些潜在的有用路径,原因是一些路 径不再被单独通过AS-SEQUENCE的方式列出。实际使用中这不是个问题,应为一旦IP报到达 AS组的边界,这个点上的BGP发言者更可能有更多的详细路径信息并能够区分到目的地的路 径。
9.2.4.2 聚合路由信息
聚合是一个过程用来组合几个不同的路由来广播一个单独的路由。聚合作为决策的一个部分 发生,这样可以减少放在Ajd_RIBs_Out中路由信息的数量
聚合减少了BGP发言者存储并且和别的BGP发言者交换的路由。路由聚合使用下面的独立于期 望类型的路径属性和网络层可达信息的过程。
有下面属性的路由不能被聚合。除非相应的属性是唯一的MULTI_EXIT_DISC, NEXT_HOP.
具有不同类型码的路径属性不能被聚合在一起.一些类型码的路径能够被聚合,使用下面的 规则:
ORIGIN属性:如果最少一个被聚合路由它的ORIGIN指示INCOMPLETE,聚合路由ORIGIN的属性 值是IMCOMPLETE.否则,如果最少一个路由的属性是EGP,聚合路由的属性是EGP.在所有别的 情况下ORIGIN属性是INTERNAL.
AS-PATH属性:如果路由聚合有单一的AS-PATH属性,聚合的路由有同样的AS-PATH属性.
为了聚合路由属性,我们建模AS-PATH属性作为二元组<类型,值>,"类型"定义了路径段的 属性(比如AS-SEQUENCE,AS_SET),"值"定义了AS号码.如果路由被聚合有不同的AS-PATH属 性,聚合的AS-PATH属性应该满足: -所有在聚合AS-PATH的AS-SEQUENCE二元组应该在最早的路由集的AS-PATH中都出现.
-在聚合的AS-PATH中AS-SET类型的所有的二元组应该出现在最少一个AS-PATH类型中(可以 出现为AS-SET或者AS-SEQUENCE)。
-在聚合AS-PATH中任何类型AS-SEQUENCE的二元组X领先于Y,在初始的AS-PATH中,X在每一 个AS-PATH中领先于Y,不论Y的类型。
-在AS-PATH中不能由同一个二元组具有相同值却出现了两次,不论二元组的类型。
应用可以选择任何算法只要符合这些规则。最少的一个构造应用应该能够执行下埋嗯的算法 来满足所有的条件。
-确定最长的对所有的聚合AS-PATH属性来说的二元组序列(如上定义)。把这个序列作为聚 合后的派头AS-PATH属性序列。
-设置剩下的AS-PATH属性二元组为AS-SET,把他们加入到AS-PATH后面。
-如果聚合AS-PATH属性有多个相同的二元组(不论二元组的类型),清除所有的,只留下一 个通过去掉AS-PATH属性中的AS-SET类型。
附录6,部分6。8提出另外一个算法来满足这个条件同时允许复杂的策略配置。
ATOMIC_AGGREGATE: 如果最少一个路由有这个路径属性,那末聚合后的路由应该有这个属 性。
AGGREGATOR: 聚合者属性应该被忽略。
9.3 路由选择标准
总的来说,在几个可替代路由中比较路由的额外法则是在本文讨论问题之外的。有两个例外。
-如果新路由中AS路径出现了本地AS,新路由不能被看作比别的路由更好的路由。如果使用 这样的一个路由,路由环路会发生。
-为了成功实现发布操作,只有具有稳定可能性的路由被选择。这样,一个AS必须避免使用 不稳定的路由,必须不使路由自发选择快速改变。前面句子中“不稳定”和“快速”的名词 量化需要经验,但是原理是清楚的。
9.4 产生BGP路由
一个BGP发言者可以通过某些方式(比如通过IGP)获得的注入BGP的路由信息产生BGP路由。 BGP发言者产生BGP路由应该通过决策进程(见部分9。1)来安排路由的优先级别。这些路由 可以被发布到别的在本地AS的BGP发言者作为内部更新进程的一部分(见9。2。1)。在一个 AS内部决定是否发送非BGP获得的路由,取决于AS内部的环境(也就是IGP类型)而且可以通 过配置来控制。
附录 1. BGP FSM 状态转换和行为
这个附录讨论BGP FSM 响应BGP事件的状态转换。下面是当商议的Hold Time值不是0的时候 状态和事件的列表
BGP 状态:
1 - Idle
2 - Connect
3 - Active
4 - OpenSent
5 - OpenConfirm
6 - Established
BGP 事件:
1 - BGP Start
2 - BGP Stop
3 - BGP Transport connection open
4 - BGP Transport connection closed
5 - BGP Transport connection open failed
6 - BGP Transport fatal error
7 - ConnectRetry timer expired
8 - Hold Timer expired
9 - KeepAlive timer expired
10 - Receive OPEN message
11 - Receive KEEPALIVE message
12 - Receive UPDATE messages
13 - Receive NOTIFICATION message
下面的表描述BGP FSM的状态转换,以及转换触发的行为。
事件 行为 发送的消息 下一个状态
--------------------------------------------------------------------
Idle (1)
1 资源初始化 none 2
Start ConnectRetry timer
舒适化传输连接
others none none 1
Connect(2)
1 none none 2
3 完成初始化 OPEN 4
Clear ConnectRetry timer
5 Restart ConnectRetry timer none 3
7 Restart ConnectRetry timer none 2
初始传输连接
others 释放资源 none 1
Active (3)
1 none none 3
3 完成初始化 OPEN 4
Clear ConnectRetry timer
5 关闭连接 3
Restart ConnectRetry timer
7 Restart ConnectRetry timer none 2
初始传输连接
others 释放资源 none 1
OpenSent(4)
1 none none 4
4 Close transport connection none 3
Restart ConnectRetry timer
6 Release resources none 1
10 Process OPEN is OK KEEPALIVE 5
Process OPEN failed NOTIFICATION 1
others Close transport connection NOTIFICATION 1
Release resources
OpenConfirm (5)
1 none none 5
4 Release resources none 1
6 Release resources none 1
9 Restart KeepAlive timer KEEPALIVE 5
11 Complete initialization none 6
Restart Hold Timer
13 Close transport connection 1
Release resources
others Close transport connection NOTIFICATION 1
Release resources
Established (6)
1 none none 6
4 Release resources none 1
6 Release resources none 1
9 Restart KeepAlive timer KEEPALIVE 6
11 Restart Hold Timer KEEPALIVE 6
12 Process UPDATE is OK UPDATE 6
Process UPDATE failed NOTIFICATION 1
13 Close transport connection 1
Release resources
others Close transport connection NOTIFICATION 1
Release resources
下面是以上状态转换表的精华版本
Events| Idle | Connect | Active | OpenSent | OpenConfirm | Estab | (1) | (2) | (3) | (4) | (5) | (6) |-------------------------------------------------------------- 1 | 2 | 2 | 3 | 4 | 5 | 6 | | | | | | 2 | 1 | 1 | 1 | 1 | 1 | 1 | | | | | | 3 | 1 | 4 | 4 | 1 | 1 | 1 | | | | | | 4 | 1 | 1 | 1 | 3 | 1 | 1 | | | | | | 5 | 1 | 3 | 3 | 1 | 1 | 1 | | | | | | 6 | 1 | 1 | 1 | 1 | 1 | 1 | | | | | | 7 | 1 | 2 | 2 | 1 | 1 | 1 | | | | | | 8 | 1 | 1 | 1 | 1 | 1 | 1 | | | | | | 9 | 1 | 1 | 1 | 1 | 5 | 6 | | | | | | 10 | 1 | 1 | 1 | 1 or 5 | 1 | 1 | | | | | | 11 | 1 | 1 | 1 | 1 | 6 | 6 | | | | | | 12 | 1 | 1 | 1 | 1 | 1 | 1 or 6 | | | | | | 13 | 1 | 1 | 1 | 1 | 1 | 1 | | | | | |
附录 2. 对比RFC1267
BGP-4使用在可达目的地的集合可以表示为一个单独的IP前缀的环境中。网络类,或者说子网 的概念,对BGP-4来说是没用的.为了提供这种能力,BGP-4改变了AS-PATH属性的语义和编码. 新的文本被加入来定义IP前缀的语义.这些能力使得BGP-4支持提议中的超网计划[9].
为了简化配置,本版本引入了新的属性,LOCAL-PREF,简化了路由选择过程.
INTER_AS_METRIC属性被重新命名为MULTI_EXIT_DISC.一个新的属性,ATOMIC_AGGREGATE,被 引入来保证某些聚合不能再被反聚和.另外一个新的属性,AGGREGATOR,被加入聚合路由用来 通告是哪一个AS和AS内部的哪一个BGP发言者引起了聚合.
为了保证HOLD计时器的对称, Hold Time现在在单链接的基础上协商. Hold Time为0现在可 以支持.
附录 3. 对比RFC1663
所有的改变在附录2中列出,还有下面的:
为了探测和恢复BGP连接冲突,新的域(BGP 标示符)被引入OPEN消息.新的文本(部分6.8)被 加入,说明探测和恢复冲突的过程.
新的文档不再限制在NEXT-HOP路径属性中传递的边界路由器,需要和BGP发言者是同一个AS.
新的文档优化和简化了关于以前的可达路由信息的交换.
附录4. 对比 RFC 1105
所有附录2和3所列,加上下面的:
需要对RFC1105有限状态机作很小改变适应BSD4.3提供的TCP用户接口.
RFC1105中表达的Up/Down/Horizontal关系的概念被驱除出协议。
RFC1105消息格式的改变如下:
1.Hold Time域被从BGP消息头移到OPEN消息。
2.版本域被从BGP消息头移动到OPEN消息。
3.Link Type域被从OPEN消息中去掉。
4.OPEN CONFIRM消息被取消,替代为KEEPALIVE消息的隐含确认。
5.UPDATE消息的格式改变显著。新的域被加入到UPDATE消息中支持多个路由属性。
6.Marker域被扩展,现在他可以支持认证。
注意通常的BGP,在RFC1105中说明的,被称为BGP-1,BGP,在RFC1163中说明的,被称为BGP-2, BGP,在RFC1267中说明的,被称为BGP-3,在本文当说明的BGP被称为BGP-4。
附录5. BGP可能使用的TCP选项
如果本地系统的TCP用户接口支持TCP PUSH函数,每一个BGP消息应该在传输的时候设置PUSH 标志位。设置PUSH标志强制BGP消息迅速发送到接收者。
如果本地系统的TCP用户接口支持TCP连接的设置过程,BGP传送连接应该使用Internetwork Control (110)[参见6] 值设置下进行TCP连接过程。
附录6. 应用建议
本部分提出一些应用建议。
6.1 每个消息的多网络前缀
BGP协议使得具有相同的AS路径和下一跳网关的多个地址前缀能够在同一个消息里说明。非 常推荐使用这个能力。每一个消息传递一个地址前缀会显著的增加接收者的开销。不但由于 接收多个消息导致系统开销,而且扫描路由表更新BGP对端和别的路由协议(发送和协商消 息)也会导致多倍的时间开销。一个从不是按照单个AS路径组织的路由表中建立单个AS路径 和网关中包含多个地址前缀的消息的方法是当路由表扫描的时候建立多个消息。当每一个地 址前缀被处理时,相应AS路径和网关的消息被确定,如果不存在,新的地址前缀需要加入。 如果消息存在,新的地址前缀仅仅附加就可以。如果消息缺少空间包含新的地址前缀,发送, 新的消息被分配,新的地址前缀插入在新的消息内部。扫描整个路由表,所有的分配消息被 发送同时资源被释放。如果所有的地址前缀覆盖的目的的共享一个网关和通用的路径属性就 可以达到最大的压缩。这样就可以在一个4096字节的消息中发送多个地址前缀。
当对端的BGP应用没有压缩多个地址前缀在一个消息中,当对端需要的时候或者网络拓扑的 改变发生的时候有必要采取措施减少接收数据泛洪的开销。一个方法是减少更新的速率。这 样就去掉了多余的提供快速的BGP对端和别的路由协议的更新路由表扫描。这个实现的一个 缺点是增加了路由信息的广播延迟。选择一个最小的快速更新间隔,不能很大超过处理多个 消息的时间能够最小化这个延迟。一个更好的办法是在发送UPDATE之前读所有的接收消息。
6.2 使用流协议
BGP使用TCP作为传输机制。由于TCP的流特性,所有的接收消息的数据不需要同时到达。这 样可能难于处理数据,因为消息,特别是使用BSD Unix的系统不可能探测有多少数据已经被 接收但是还没有被处理。
在这种情况下的一个办法是首先尝试读消息头。对KEEPALIVE消息类型,这是个完整的消息; 对别的消息类型,需要首先确认消息头,特别是整个长度。如果所有的检查是成功的,这个 长度,减去消息头的长度是剩下的需要读出的数据。愿意“挂起”路由信息进程应用在尝试 读出对端的时候为每一个对端设置一个消息缓冲区(4096字节)填充数据直到一个完整的消 息被收到,
6.3 减少路由抖动
为了抑制过分的路由抖动,BGP发言者在如果需要撤销一个目的的同时更新一个更特殊或者 更不特殊的路由应该把他们组合在一个UPDATE消息中。
6.4 BGP 计时器
BGP使用5个计时器:ConnectRetry, Hold Time, KeepAlive, MinASOriginationInterval, 和 MinRouteAdvertisementInterval 。ConnectRetry 计时器的建议值是120秒。Hold Time 计时器的建议值是90秒。KeepAlive计时器的建议值是30秒。 MinASOriginationInterval 的计时器的建议值是15秒。MinRouteAdvertisementInterval 计时器的建议值是30秒。
一个BGP应用必须保证这些计时器是可配置的。
6.5 路径属性顺序
如6。1叙述组合更新消息的应用更喜欢把所有的路径消息看成一个有序的集合。这样允许他 们从不同的在语义上相同的更新消息中快速确定属性集。为了有利,对路径属性根据类型码 排序是有用的优化项。这个优化是完全可选的。
6.6 AS_SET 排序
另外一个有用的选项备用来简化情况是排序AS-SET中找到的AS号码。这个选项时完全可选 的。 6.7 版本商议控制
由于BGP-4能够承载聚合路由,这是在BGP-3中不能正确表达的,一个支持BGP-4和别的BGP 版本的应用应该提供只在端到端基础上使用BGP-4的能力。
6.8 复杂 AS_PATH 聚合 选择提供路由聚合算法的应用来保留显著数量的路径信息可以使用下面的过程。
为了聚合两个路由的AS-PATH属性,我们为AS建模为二元组<类型,值>,“类型”定义了AS 属于的路径段的种类(比如AS-SEQUENCE,AS-SET),“值”是AS号码。如果相应的〈类型, 值〉二元组相同,两个AS被看成是一样的。
聚合两个AS-PATH属性的算法工作如下:
a) 识别每一个AS-PATH属性内部相通的具有相同相关顺序的AS。两个AS,X和Y,被认为顺 序相同: -X在每一个AS-PATH属性中领先于Y,或者Y在每一个AS-PATH属性中领先于X。
b) 聚合的AS-PATH属性包含a)中表示的AS,顺序完全和在被聚合的AS-PATH属性相同。 如果两个连续的a)中表示的AS不是在两个被聚合的AS-PATH属性中紧密跟随,那末中间AS(AS 在连续的相同AS之间)被组合成AS-SET路径段,它由两个AS-PATH属性中都有的AS组成。这 个段被放入在两个连续的a)中定义的聚合属性的AS之间。如果两个连续的a)中表示的AS在一 个属性中紧密跟随,但是在另外一个中不是,那末后者的中间AS被组合成AS-SET路径段;这 个段被放在这两个a)中表示的AS 之间。
如果作为前面过程的结果,一个给定的AS号码在聚合AS-PATH属性中出现不止一次,所有的, 除了最后一个(最右边)的AS号码,应该被从聚合AS-PATH属性中除掉。
参考
[1] Mills, D., "Exterior Gateway Protocol Formal Specification", RFC 904, BBN, April 1984.
[2] Rekhter, Y., "EGP and Policy Based Routing in the New NSFNET Backbone", RFC 1092, T.J. Watson Research Center, February 1989.
[3] Braun, H-W., "The NSFNET Routing Architecture", RFC 1093, MERIT/NSFNET Project, February 1989.
[4] Postel, J., "Transmission Control Protocol - DARPA Internet Program Protocol Specification", STD 7, RFC 793, DARPA, September 1981. [5] Rekhter, Y., and P. Gross, "Application of the Border Gateway Protocol in the Internet", RFC 1772, T.J. Watson Research Center, IBM Corp., MCI, March 1995.
[6] Postel, J., "Internet Protocol - DARPA Internet Program Protocol Specification", STD 5, RFC 791, DARPA, September 1981.
[7] "Information Processing Systems - Telecommunications and Information Exchange between Systems - Protocol for Exchange of Inter-domain Routeing Information among Intermediate Systems to Support Forwarding of ISO 8473 PDUs", ISO/IEC IS10747, 1993
[8] Fuller, V., Li, T., Yu, J., and K. Varadhan, "Classless Inter- Domain Routing (CIDR): an Address Assignment and Aggregation Strategy", RFC 1519, BARRNet, cisco, MERIT, OARnet, September 1993
[9] Rekhter, Y., Li, T., "An Architecture for IP Address Allocation with CIDR", RFC 1518, T.J. Watson Research Center, cisco, September 1993
安全考虑
本文档没有讨论安全问题
作者地址
Yakov Rekhter T.J. Watson Research Center IBM Corporation P.O. Box 704, Office H3-D40 Yorktown Heights, NY 10598
Phone: +1 914 784 7361 EMail: yakov@watson.ibm.com
Tony Li cisco Systems, Inc. 170 W. Tasman Dr. San Jose, CA 95134
EMail: tli@cisco.com
RFC1771 A Border Gateway Protocol 4 (BGP-4) 边界网关协议(版本4)
1 RFC文档中文翻译计划
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8