мета-данные страницы
Это старая версия документа!
BGP
BGP (Border Gateway Protocol) — это основной протокол динамической маршрутизации, который используется в Интернете.
Маршрутизаторы, использующие протокол BGP, обмениваются информацией о доступности сетей. Вместе с информацией о сетях передаются различные атрибуты этих сетей, с помощью которых BGP выбирает лучший маршрут и настраиваются политики маршрутизации.
Один из основных атрибутов, который передается с информацией о маршруте — это список автономных систем, через которые прошла эта информация. Эта информация позволяет BGP определять где находится сеть относительно автономных систем, исключать петли маршрутизации, а также может быть использована при настройке политик.
Маршрутизация осуществляется пошагово от одной автономной системы к другой. Все политики BGP настраиваются, в основном, по отношению к внешним/соседним автономным системам. То есть, описываются правила взаимодействия с ними.
Так как BGP оперирует большими объемами данных (текущий размер таблицы для IPv4 более 450 тысяч маршрутов), то принципы его настройки и работы отличаются от внутренних протоколов динамической маршрутизации (IGP).
Терминология протокола
'Внутренний протокол маршрутизации (interior gateway protocol)' – протокол, который используется для передачи информации о маршрутах внутри автономной системы.'Внешний протокол маршрутизации (exterior gateway protocol)' – протокол, который используется для передачи информации о маршрутах между автономными системами.'Автономная система (autonomous system, AS)' — набор маршрутизаторов, имеющих единые правила маршрутизации, управляемых одной технической администрацией и работающих на одном из протоколов IGP (для внутренней маршрутизации AS может использовать и несколько IGP).'Транзитная автономная система (transit AS)' — автономная система, через которую передается трафик других автономных систем.'Путь (path)' — последовательность состоящая из номеров автономных систем через которые нужно пройти для достижения сети назначения.'Атрибуты пути (path attributes, PA)' — характеристики пути, которые позволяют выбрать лучший путь.'BGP speaker' — маршрутизатор, на котором работает протокол BGP.'Соседи (neighbor, peer)' — любые два маршрутизатора, между которыми открыто TCP-соединение для обмена информацией о маршрутизации.'Информация сетевого уровня о доступности сети (Network Layer Reachability Information, NLRI)' — IP-префикс и длина префикса.
Описание протокола
BGP выбирает лучшие маршруты не на основании технических характеристик пути (пропускной способности, задержки и т.п.), а на основании политик.
В локальных сетях наибольшее значение имеет скорость сходимости сети, время реагирования на изменения.
И маршрутизаторы, которые используют внутренние протоколы динамической маршрутизации, при выборе маршрута, как правило, сравнивают какие-то технические характеристики пути, например, пропускную способность линков.
При выборе между каналами двух провайдеров, зачастую имеет значение не то, у какого канала лучше технические характеристики, а какие-то внутренние правила компании. Например, использование какого канала обходится компании дешевле.
Поэтому в BGP выбор лучшего маршрута осуществляется на основании политик, которые настраиваются с использованием фильтров, анонсирования маршрутов, и изменения атрибутов.
Если принимать решение о том как должен маршрутизироваться пакет, необходимо по каким-то дополнительным критериям, кроме адреса получателя, необходимо использовать механизм policy-based routing (PBR).
Основные характеристики протокола
BGP это path-vector протокол с такими общими характеристиками:
- Использует TCP для передачи данных, это обеспечивает надежную доставку обновлений протокола (порт 179)
- Отправляет обновления только после изменений в сети (нет периодических обновлений)
- Периодически отправляет keepalive-сообщения для проверки TCP-соединения
- Метрика протокола называется path vector или атрибуты (attributes)
Автономная система
Автономная система (autonomous system, AS) — это система IP-сетей и маршрутизаторов, управляемых одним или несколькими операторами, имеющими единую, четко определенную политику маршрутизации с Интернетом (RFC 1930).
Диапазоны номеров автономных систем (autonomous system number, ASN):
- 0-65535 (изначально определенный диапазон для ASN 16 бит)
- 65536-4294967295 (новый диапазон для ASN 32 бита (RFC 4893))
Использование:
- 0 и 65535 (зарезервированы)
- 1-64495 (публичные номера)
- 65552-4294967295 (публичные номера)
- 64512-65534 (приватные номера)
- 23456 (представляет 32-битный диапазон на устройствах, которые работают с 16-битным диапазоном)
Описание работы протокола
- Таблица соседей (neighbor table) — список всех соседей BGP
- Таблица BGP (BGP table, forwarding database, topology database):
- Список сетей, полученных от каждого соседа
- Может содержать несколько путей к destination сетям
- Атрибуты BGP для каждого пути
- Таблица маршрутизации — список лучших путей к сетям
По умолчанию BGP отправляет keepalive-сообщения каждые 60 секунд.
Если существует несколько путей к получателю, то маршрутизатор будет анонсировать соседям не все возможные варианты, а только лучший маршрут из таблицы BGP.
Внутренний BGP (Internal BGP) и Внешний BGP (External BGP)
'Внутренний BGP (Internal BGP, iBGP)' — BGP работающий внутри автономной системы. iBGP-соседи не обязательно должны быть непосредственно соединены.'Внешний BGP (External BGP, eBGP)' — BGP работающий между автономными системами. По умолчанию, eBGP-соседи должны быть непосредственно соединены.
Если iBGP-маршрутизаторы работают в нетранзитной AS, то соединение между ними должно быть full mesh.
Это следствие принципов работы протокола — если маршрутизатор, находящийся на границе AS, получил обновление, то он передает его всем соседям; соседи, которые находятся внутри автономной системы, больше это обновление не распространяют, так как считают, что все соседи внутри AS уже его получили.
Таймеры протокола
'Keepalive Interval' — Интервал времени в секундах, между отправкой сообщений keepalive. По умолчанию 60 секунд.'Hold Time' — Интервал времени в секундах, по истечении которого сосед будет считаться недоступным. По умолчанию 180 секунд.
Типы сообщений BGP
У всех сообщений BGP такой формат заголовка:
|<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | + + | | + + | Marker | + + | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Length | Type | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Поля заголовка BGP-сообщений:
- Marker — поле, которое включено в заголовок для совместимости. Размер поля — 16 байт, все байты должны быть 1.
- Length — длина всего сообщения в октетах, включая заголовок. Поле может принимать значения от 19 до 4096.
- Type — тип передаваемого сообщения:
- 1 — OPEN
- 2 — UPDATE
- 3 — NOTIFICATION
- 4 — KEEPALIVE
Open
Open — используется для установки отношений соседства и обмена базовыми параметрами. Отправляется сразу после установки TCP-соединения.
Формат сообщения Open:
|<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+ | Version | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | My Autonomous System | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Hold Time | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | BGP Identifier | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Opt Parm Len | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | | Optional Parameters | | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Кроме стандартного заголовка пакета BGP, в сообщении Open такие поля:
- Version — версия протокола BGP
- My Autonomous System — номер автономной системы отправителя
- Hold Time — максимальное время в секундах, которое может пройти между получением Keepalive и сообщением Update. Время выбирается минимальным
- BGP Identifier — играет роль в выборе пути пересылки BGP-сообщений при наличии более одного канала связи между BGP-соседями
- Optional Parameters Length — если равен 0, то в маркер записываются единицы, а Optional Parameters имеет нулевую длину; если не равен 0, то в Optional Parameters записываются данные для определения кода, который указывается в маркере.
- Optional Parameters — играет роль в формировании и последующем определении кода в поле маркер.
Update
Update — используется для обмена информацией маршрутизации.
Формат сообщения Update:
+-----------------------------------------------------+ | Unfeasible Routes Length (2 octets) | +-----------------------------------------------------+ | Withdrawn Routes (variable) | +-----------------------------------------------------+ | Total Path Attribute Length (2 octets) | +-----------------------------------------------------+ | Path Attributes (variable) | +-----------------------------------------------------+ | Network Layer Reachability Information (variable) | +-----------------------------------------------------+
Notification
Notification — используется когда возникают ошибки BGP. После отправки сообщения сессия с соседом разрывается.
Формат сообщения Notification:
|<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Error code | Error subcode | Data | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ + | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Кроме стандартного заголовка пакета BGP, в сообщении Notification такие поля:
- Error Code — тип оповещения:
- 1 — Message Header Error
- 2 — OPEN Message Error
- 3 — UPDATE Message Error
- 4 — Hold Timer Expired
- 5 — Finite State Machine Error
- 6 — Cease
Keepalive
Keepalive — используется для поддерживания отношений соседства, для обнаружения неактивных соседей.
Сообщения Keepalive состоят только из заголовка пакета (длина 19 октетов).
Если периодичность отправки keepalive-сообщений выставлена в 0, то сообщения не отправляются.
Отношения соседства
Для того чтобы установить отношения соседства, в BGP надо настроить вручную каждого соседа.
Когда указывается сосед локального маршрутизатора, обязательно указывается автономная система соседа. По этой информации BGP определяет тип соседа:
'Внутренний BGP сосед (iBGP-сосед)' — сосед, который находится в той же автономной системе, что и локальный маршрутизатор. iBGP-соседи не обязательно должны быть непосредственно соединены.'Внешний BGP сосед (eBGP-сосед)' — сосед, который находится в автономной системе отличной от локального маршрутизатора. По умолчанию, eBGP-соседи должны быть непосредственно соединены.
Тип соседа мало влияет на установку отношений соседства. Более существенные отличия между различными типами соседей проявляются в процессе отправки обновлений BGP и добавлении маршрутов в таблицу маршрутизации.
BGP выполняет такие проверки, когда формирует отношения соседства:
- Маршрутизатор должен получить запрос на TCP-соединение с адресом отправителя, который маршрутизатор найдет указанным в списке соседей (команда neighbor).
- Номер автономной системы локального маршрутизатора должен совпадать с номером автономной системы, который указан на соседнем маршрутизаторе командой
'neighbor remote-as' (это требование не соблюдается при настройках конфедераций). - Идентификаторы маршрутизаторов (Router ID) не должны совпадать.
- Если настроена аутентификация, то соседи должны пройти её.
BGP выполняет проверку таймеров keepalive и hold, однако несовпадение этих параметров не влияет на установку отношений соседства. Если таймеры не совпадают, то каждый маршрутизатор будет использовать меньшее значение таймера hold.
Состояния связи с соседями
- Idle
- Connect
- Open sent
- Open confirm
- active
- Established
| Состояние | Ожидание TCP | Инициация TCP | Установлено TCP | Отправлено Open | Получено Open | Сосед Up |
|---|---|---|---|---|---|---|
| Idle | Нет | Нет | Нет | Нет | Нет | Нет |
| Connect | Да | Нет | Нет | Нет | Нет | Нет |
| Active | Да | Да | Нет | Нет | Нет | Нет |
| Open sent | Да | Да | Да | Да | Нет | Нет |
| Open confirm | Да | Да | Да | Да | Да | Нет |
| Established | Да | Да | Да | Да | Да | Да |
Если не совпали IP-адреса с соседом, то этот сосед будет в состоянии active.
Атрибуты пути (path attributes)
Атрибуты пути разделены на 4 категории:
'Well-known mandatory' — все маршрутизаторы, работающие по протоколу BGP, должны распознавать эти атрибуты. Должны присутствовать во всех обновлениях (update).'Well-known discretionary' — все маршрутизаторы, работающие по протоколу BGP, должны распознавать эти атрибуты. Могут присутствовать в обновлениях (update), но их присутствие не обязательно.'Optional transitive' — могут не распознаваться всеми реализациями BGP. Если маршрутизатор не распознал атрибут, он помечает обновление как частичное (partial) и отправляет его дальше соседям, сохраняя не распознанный атрибут.'Optional non-transitive' — могут не распознаваться всеми реализациями BGP. Если маршрутизатор не распознал атрибут, то атрибут игнорируется и при передаче соседям отбрасывается.
Примеры атрибутов BGP:
- Well-known mandatory:
- Autonomous system path
- Next-hop
- Origin
- Well-known discretionary:
- Local preference
- Atomic aggregate
- Optional transitive:
- Aggregator
- Communities
- Optional non-transitive:
- Multi-exit discriminator (MED)
- Originator ID
- Cluster list
Autonomous system path
Атрибут Autonomous system path (AS Path):
- Описывает через какие автономные системы надо пройти, чтобы дойти до сети назначения.
- Номер AS добавляется при передаче обновления из одной AS eBGP-соседу в другой AS.
Используется для:
- обнаружения петель
- применения политик
Каждый сегмент атрибута AS path представлен в виде поля TLV (path segment type, path segment length, path segment value):
'path segment type' — поле размером 1 байт для которого определены такие значения:- 1 — AS_SET: неупорядоченное множество автономных систем, через которые прошел маршрут в сообщении Update,
- 2 — AS_SEQUENCE: упорядоченное множество автономных систем, через которые прошел маршрут в сообщении Update
'path segment length' — поле размером 1 байт. Указывает сколько автономных систем указано в поле path segment value'path segment value' — номера автономных систем, каждая представлена полем размером 2 байта.
Next-hop
Атрибут Next-hop
- IP-адрес следующей AS для достижения сети назначения.
- Это IP-адрес eBGP-маршрутизатора, через который идет путь к сети назначения.
- Атрибут меняется при передаче префикса в другую AS
Third party next hop:
Origin
Атрибут Origin — указывает на то, каким образом был получен маршрут в обновлении.
Возможные значения атрибута:
'0' — IGP: NLRI получена внутри исходной автономной системы;'1' — EGP: NLRI выучена по протоколу Exterior Gateway Protocol (EGP). Предшественник BGP, не используется'2' — Incomplete: NLRI была выучена каким-то другим образом
Local preference
Атрибут Local preference:
- Указывает маршрутизаторам внутри автономной системы как выйти за её пределы.
- Этот атрибут передается только в пределах одной автономной системы.
- На маршрутизаторах Cisco по умолчанию значение атрибута — 100.
- Выбирается та точка выхода у которой значение атрибута больше.
- Если eBGP-сосед получает обновление с выставленным значением local preference, он игнорирует этот атрибут.
Atomic aggregate
Метка, указывающая, что NLRI является summary.
Aggregator
Список RID и ASN маршрутизаторов, создавших summary NLRI.
Communities
Атрибут community:
- Тегирование маршрутов
- Существуют предопределенные значения
- По умолчанию не пересылаются соседям
- Один из вариантов применения: передается соседней AS для управления входящим трафиком
Значения от 0x00000000 до 0x0000FFFF и от 0xFFFF0000 до 0xFFFFFFFF зарезервированы.
Как правило community отображаются в формате ASN:VALUE.
В таком формате, доступны для использования community от 1:0 до 65534:65535.
В первой части указывается номер автономной системы, а во второй значение community, которое определяет политику маршрутизации трафика.
Некоторые значения communities предопределены. RFC1997 определяет три значения таких community. Эти значения должны одинаково распознаваться и обрабатываться всеми реализациями BGP, которые распознают атрибут community.
Если маршрутизатор получает маршрут в котором указано предопределенное значение communities, то он выполняет специфическое, предопределенное действие основанное на значении атрибута.
Предопределенные значения communities (Well-known Communities):
'no-export (0xFFFFFF01)' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться за пределы конфедерации (автономная система, которая не является частью конфедерации считается конфедерацией). То есть, маршруты не анонсируются EBGP-соседям, но анонсируются внешним соседям в конфедерации,'no-advertise (0xFFFFFF02)' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться другим BGP-соседям,'no-export-subconfed (0xFFFFFF03)' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться внешним BGP-соседям (ни внешним в конфедерации, ни настоящим внешним соседям). В Cisco это значение встречается и под названием local-as.
Multi exit discriminator (MED)
Атрибут MED:
- Используется для информирования eBGP-соседей о том, какой путь в автономную систему более предпочтительный.
- Атрибут передается между автономными системами.
- Маршрутизаторы внутри соседней автономной системы используют этот атрибут, но, как только обновление выходит за пределы AS, атрибут MED отбрасывается.
- Чем меньше значение атрибута, тем более предпочтительна точка входа в автономную систему.
Weight (проприетарный атрибут Cisco)
Атрибут Weight:
- Позволяет назначить «вес» различным путям локально на маршрутизаторе.
- Используется в тех случаях, когда у одного маршрутизатора есть несколько выходов из автономной системы (сам маршрутизатор является точкой выхода).
- Имеет значение только локально, в пределах маршрутизатора.
- Не передается в обновлениях.
- Чем больше значение атрибута, тем более предпочтителен путь выхода.
Выбор пути
Характеристики процедуры выбора пути протоколом BGP:
- В таблице BGP хранятся все известные пути, а в таблице маршрутизации — лучшие.
- Пути выбираются на основании политик.
- Пути не выбираются на основании пропускной способности.
Сначала проверяется:
- Доступен ли next-hop ([http://tools.ietf.org/html/rfc4271#section-9.1.2.1 Route Resolvability Condition])
- : Для того чтобы next-hop считался доступным (accessible), необходимо чтобы в таблице маршрутизации был IGP-маршрут, который ведет к нему.
Cisco
- Максимальное значение weight (локально для маршрутизатора).
- Максимальное значение local preference (для всей AS).
- Предпочесть локальный маршрут маршрутизатора (next hop = 0.0.0.0).
- Кратчайший путь через автономные системы. (самый короткий AS_PATH)
- Минимальное значение origin code (IGP < EGP < incomplete).
- Минимальное значение MED (распространяется между автономными системами).
- Путь eBGP лучше чем путь iBGP.
- Выбрать путь через ближайшего IGP-соседа.
- Выбрать самый старый маршрут для eBGP-пути.
- Выбрать путь через соседа с наименьшим BGP router ID.
- Выбрать путь через соседа с наименьшим IP-адресом.
Juniper
Если существует несколько маршрутов до одной сети назначения, будет выбран только один из них. Каждый шаг в алгоритме выбора лучшего маршрута пытается устранить все, кроме одного маршруты к пункту назначения. Если на шаге алгоритма маршрутов все еще больше одного, будет выполнен переход на следующий
шаг алгоритма. Таким образом, алгоритм работает до тех пор, пока это необходимо. В устройствах Juniper выбор наилучшего маршрута происходит по следующему алгоритму:
- проверка на доступность next-hop в локальной таблице маршрутизации. Если next-hop не доступен, маршрут отбрасывается.
- маршрутизатор выбирает маршрут с наибольшим Local Preference атрибутом.
- маршрутизатор выбирает маршрут с кратчайшим AS Path length.
- маршрутизатор выбирает маршрут с наименьшим значением атрибута Origin (то есть отдается предпочтение IGP).
- маршрутизатор выбирает маршрут с наименьшим значением MED. Этот шаг выполняется, по умолчанию, только для маршрутов из одной AS.
- маршрутизатор выбирает маршруты, полученные от соседей EBGP нежели полученные от IBGP соседей. Если остальные маршруты EBGP-маршруты, маршрутизатор переходит к шагу 9.
- маршрутизатор выбирает маршрут с наименьшей метрикой IGP к анонсируемому BGP Next Hop.
- если используется Route Reflection для IBGP пиринга, маршрутизатор выбирает путь с наименьшим Cluster-List length.
- маршрутизатор выбирает маршрут от партнера с наименьшим Router ID.
- маршрутизатор выбирает маршрут от партнера с наименьшим Peer Address.



