====== BGP ====== **BGP (Border Gateway Protocol)** — это основной протокол динамической маршрутизации, который используется в Интернете. Маршрутизаторы, использующие протокол BGP, обмениваются информацией о доступности сетей. Вместе с информацией о сетях передаются различные атрибуты этих сетей, с помощью которых BGP выбирает лучший маршрут и настраиваются политики маршрутизации. Один из основных атрибутов, который передается с информацией о маршруте — это список автономных систем, через которые прошла эта информация. Эта информация позволяет BGP определять где находится сеть относительно автономных систем, исключать петли маршрутизации, а также может быть использована при настройке политик. Маршрутизация осуществляется пошагово от одной автономной системы к другой. Все политики BGP настраиваются, в основном, по отношению к внешним/соседним автономным системам. То есть, описываются правила взаимодействия с ними. Так как BGP оперирует большими объемами данных (текущий размер таблицы для IPv4 более 450 тысяч маршрутов), то принципы его настройки и работы отличаются от внутренних протоколов динамической маршрутизации (IGP). ===== Терминология протокола ===== * '''Внутренний протокол маршрутизации (interior gateway protocol)''' – протокол, который используется для передачи информации о маршрутах внутри автономной системы. * '''Внешний протокол маршрутизации (exterior gateway protocol)''' – протокол, который используется для передачи информации о маршрутах между автономными системами. * '''Автономная система (autonomous system, AS)''' — набор маршрутизаторов, имеющих единые правила маршрутизации, управляемых одной технической администрацией и работающих на одном из протоколов IGP (для внутренней маршрутизации AS может использовать и несколько IGP). * '''Транзитная автономная система (transit AS)''' — автономная система, через которую передается трафик других автономных систем. * '''Путь (path)''' — последовательность состоящая из номеров автономных систем через которые нужно пройти для достижения сети назначения. * '''Атрибуты пути (path attributes, PA)''' — характеристики пути, которые позволяют выбрать лучший путь. * '''BGP speaker''' — маршрутизатор, на котором работает протокол BGP. * '''Соседи (neighbor, peer)''' — любые два маршрутизатора, между которыми открыто TCP-соединение для обмена информацией о маршрутизации. * '''Информация сетевого уровня о доступности сети (Network Layer Reachability Information, NLRI)''' — IP-префикс и длина префикса. ===== Описание протокола ===== BGP выбирает лучшие маршруты не на основании технических характеристик пути (пропускной способности, задержки и т.п.), а на основании политик. В локальных сетях наибольшее значение имеет скорость сходимости сети, время реагирования на изменения. И маршрутизаторы, которые используют внутренние протоколы динамической маршрутизации, при выборе маршрута, как правило, сравнивают какие-то технические характеристики пути, например, пропускную способность линков. При выборе между каналами двух провайдеров, зачастую имеет значение не то, у какого канала лучше технические характеристики, а какие-то внутренние правила компании. Например, использование какого канала обходится компании дешевле. Поэтому в BGP выбор лучшего маршрута осуществляется на основании политик, которые настраиваются с использованием фильтров, анонсирования маршрутов, и изменения атрибутов. Как и другие протоколы динамической маршрутизации, BGP может передавать трафик только на основании IP-адреса получателя. Это значит, что с помощью BGP нет возможности настроить правила маршрутизации, в которых будет учитываться, например, то, из какой сети был отправлен пакет или данные какого приложения передаются. Если принимать решение о том как должен маршрутизироваться пакет, необходимо по каким-то дополнительным критериям, кроме адреса получателя, необходимо использовать механизм policy-based routing (PBR). ==== Основные характеристики протокола ==== BGP это path-vector протокол с такими общими характеристиками: * Использует TCP для передачи данных, это обеспечивает надежную доставку обновлений протокола (порт 179) * Отправляет обновления только после изменений в сети (нет периодических обновлений) * Периодически отправляет keepalive-сообщения для проверки TCP-соединения * Метрика протокола называется path vector или атрибуты (attributes) ==== Автономная система ==== **Автономная система (autonomous system, AS)** — это система IP-сетей и маршрутизаторов, управляемых одним или несколькими операторами, имеющими единую, четко определенную политику маршрутизации с Интернетом (RFC 1930). Диапазоны номеров автономных систем (autonomous system number, ASN): * 0-65535 (изначально определенный диапазон для ASN 16 бит) * 65536-4294967295 (новый диапазон для ASN 32 бита (RFC 4893)) Использование: * 0 и 65535 (зарезервированы) * 1-64495 (публичные номера) * 65552-4294967295 (публичные номера) * 64512-65534 (приватные номера) * 23456 (представляет 32-битный диапазон на устройствах, которые работают с 16-битным диапазоном) ===== Описание работы протокола ===== * Таблица соседей (neighbor table) — список всех соседей BGP * Таблица BGP (BGP table, forwarding database, topology database): * Список сетей, полученных от каждого соседа * Может содержать несколько путей к destination сетям * Атрибуты BGP для каждого пути * Таблица маршрутизации — список лучших путей к сетям {{:glossary:net:protocols:inside_bgp.png?600}} По умолчанию BGP отправляет keepalive-сообщения каждые 60 секунд. Если существует несколько путей к получателю, то маршрутизатор будет анонсировать соседям не все возможные варианты, а только лучший маршрут из таблицы BGP. ==== Внутренний BGP (Internal BGP) и Внешний BGP (External BGP) ==== * '''Внутренний BGP (Internal BGP, iBGP)''' — BGP работающий внутри автономной системы. iBGP-соседи не обязательно должны быть непосредственно соединены. * '''Внешний BGP (External BGP, eBGP)''' — BGP работающий между автономными системами. По умолчанию, eBGP-соседи должны быть непосредственно соединены. Если iBGP-маршрутизаторы работают в нетранзитной AS, то соединение между ними должно быть full mesh. Это следствие принципов работы протокола — если маршрутизатор, находящийся на границе AS, получил обновление, то он передает его всем соседям; соседи, которые находятся внутри автономной системы, больше это обновление не распространяют, так как считают, что все соседи внутри AS уже его получили. ==== Таймеры протокола ==== * '''Keepalive Interval''' — Интервал времени в секундах, между отправкой сообщений keepalive. По умолчанию 60 секунд. * '''Hold Time''' — Интервал времени в секундах, по истечении которого сосед будет считаться недоступным. По умолчанию 180 секунд. ==== Типы сообщений BGP ==== У всех сообщений BGP такой формат заголовка: |<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | + + | | + + | Marker | + + | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Length | Type | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ Поля заголовка BGP-сообщений: * Marker — поле, которое включено в заголовок для совместимости. Размер поля — 16 байт, все байты должны быть 1. * Length — длина всего сообщения в октетах, включая заголовок. Поле может принимать значения от 19 до 4096. * Type — тип передаваемого сообщения: * 1 — OPEN * 2 — UPDATE * 3 — NOTIFICATION * 4 — KEEPALIVE === Open === **Open** — используется для установки отношений соседства и обмена базовыми параметрами. Отправляется сразу после установки TCP-соединения. Формат сообщения Open: |<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+ | Version | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | My Autonomous System | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Hold Time | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | BGP Identifier | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Opt Parm Len | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | | | Optional Parameters | | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ Кроме стандартного заголовка пакета BGP, в сообщении Open такие поля: * Version — версия протокола BGP * My Autonomous System — номер автономной системы отправителя * Hold Time — максимальное время в секундах, которое может пройти между получением Keepalive и сообщением Update. Время выбирается минимальным * BGP Identifier — играет роль в выборе пути пересылки BGP-сообщений при наличии более одного канала связи между BGP-соседями * Optional Parameters Length — если равен 0, то в маркер записываются единицы, а Optional Parameters имеет нулевую длину; если не равен 0, то в Optional Parameters записываются данные для определения кода, который указывается в маркере. * Optional Parameters — играет роль в формировании и последующем определении кода в поле маркер. === Update === **Update** — используется для обмена информацией маршрутизации. Формат сообщения Update: +-----------------------------------------------------+ | Unfeasible Routes Length (2 octets) | +-----------------------------------------------------+ | Withdrawn Routes (variable) | +-----------------------------------------------------+ | Total Path Attribute Length (2 octets) | +-----------------------------------------------------+ | Path Attributes (variable) | +-----------------------------------------------------+ | Network Layer Reachability Information (variable) | +-----------------------------------------------------+ === Notification === **Notification** — используется когда возникают ошибки BGP. После отправки сообщения сессия с соседом разрывается. Формат сообщения Notification: |<-------------------------- 32 бита --------------------------->| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ | Error code | Error subcode | Data | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ + | | +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ Кроме стандартного заголовка пакета BGP, в сообщении Notification такие поля: * Error Code — тип оповещения: * 1 — Message Header Error * 2 — OPEN Message Error * 3 — UPDATE Message Error * 4 — Hold Timer Expired * 5 — Finite State Machine Error * 6 — Cease === Keepalive === **Keepalive** — используется для поддерживания отношений соседства, для обнаружения неактивных соседей. Сообщения Keepalive состоят только из заголовка пакета (длина 19 октетов). Если периодичность отправки keepalive-сообщений выставлена в 0, то сообщения не отправляются. ==== Отношения соседства ==== Для того чтобы установить отношения соседства, в BGP надо настроить вручную каждого соседа. Когда указывается сосед локального маршрутизатора, обязательно указывается автономная система соседа. По этой информации BGP определяет тип соседа: * '''Внутренний BGP сосед (iBGP-сосед)''' — сосед, который находится в той же автономной системе, что и локальный маршрутизатор. iBGP-соседи не обязательно должны быть непосредственно соединены. * '''Внешний BGP сосед (eBGP-сосед)''' — сосед, который находится в автономной системе отличной от локального маршрутизатора. По умолчанию, eBGP-соседи должны быть непосредственно соединены. Тип соседа мало влияет на установку отношений соседства. Более существенные отличия между различными типами соседей проявляются в процессе отправки обновлений BGP и добавлении маршрутов в таблицу маршрутизации. BGP выполняет такие проверки, когда формирует отношения соседства: - Маршрутизатор должен получить запрос на TCP-соединение с адресом отправителя, который маршрутизатор найдет указанным в списке соседей (команда neighbor). - Номер автономной системы локального маршрутизатора должен совпадать с номером автономной системы, который указан на соседнем маршрутизаторе командой '''neighbor remote-as''' (это требование не соблюдается при настройках конфедераций). - Идентификаторы маршрутизаторов (Router ID) не должны совпадать. - Если настроена аутентификация, то соседи должны пройти её. У первого пункта проверки есть некоторая особенность: только у одного из двух маршрутизаторов IP-адрес, указанный как адрес отправки обновлений, должен быть указан в команде **neighbor** другого маршрутизатора. BGP выполняет проверку таймеров keepalive и hold, однако несовпадение этих параметров не влияет на установку отношений соседства. Если таймеры не совпадают, то каждый маршрутизатор будет использовать меньшее значение таймера hold. === Состояния связи с соседями === * Idle * Connect * Open sent * Open confirm * active * Established ^ Состояние ^ Ожидание TCP ^ Инициация TCP ^ Установлено TCP ^ Отправлено Open ^ Получено Open ^ Сосед Up ^ | Idle | Нет | Нет | Нет | Нет | Нет | Нет | | Connect | Да | Нет | Нет | Нет | Нет | Нет | | Active | Да | Да | Нет | Нет | Нет | Нет | | Open sent | Да | Да | Да | Да | Нет | Нет | | Open confirm | Да | Да | Да | Да | Да | Нет | | Established | Да | Да | Да | Да | Да | Да | Если не совпали IP-адреса с соседом, то этот сосед будет в состоянии active. ===== Атрибуты пути (path attributes) ===== Атрибуты пути разделены на 4 категории: - '''Well-known mandatory''' — все маршрутизаторы, работающие по протоколу BGP, должны распознавать эти атрибуты. Должны присутствовать во всех обновлениях (update). - '''Well-known discretionary''' — все маршрутизаторы, работающие по протоколу BGP, должны распознавать эти атрибуты. Могут присутствовать в обновлениях (update), но их присутствие не обязательно. - '''Optional transitive''' — могут не распознаваться всеми реализациями BGP. Если маршрутизатор не распознал атрибут, он помечает обновление как частичное (partial) и отправляет его дальше соседям, сохраняя не распознанный атрибут. - '''Optional non-transitive''' — могут не распознаваться всеми реализациями BGP. Если маршрутизатор не распознал атрибут, то атрибут игнорируется и при передаче соседям отбрасывается. Примеры атрибутов BGP: * Well-known mandatory: * Autonomous system path * Next-hop * Origin * Well-known discretionary: * Local preference * Atomic aggregate * Optional transitive: * Aggregator * Communities * Optional non-transitive: * Multi-exit discriminator (MED) * Originator ID * Cluster list ==== Autonomous system path ==== {{ :glossary:net:protocols:as_path.png?400}} Атрибут Autonomous system path (AS Path): * Описывает через какие автономные системы надо пройти, чтобы дойти до сети назначения. * Номер AS добавляется при передаче обновления из одной AS eBGP-соседу в другой AS. Используется для: * обнаружения петель * применения политик Каждый сегмент атрибута AS path представлен в виде поля TLV (path segment type, path segment length, path segment value): * '''path segment type''' — поле размером 1 байт для которого определены такие значения: * 1 — AS_SET: неупорядоченное множество автономных систем, через которые прошел маршрут в сообщении Update, * 2 — AS_SEQUENCE: упорядоченное множество автономных систем, через которые прошел маршрут в сообщении Update * '''path segment length''' — поле размером 1 байт. Указывает сколько автономных систем указано в поле path segment value * '''path segment value''' — номера автономных систем, каждая представлена полем размером 2 байта. ==== Next-hop ==== {{ :glossary:net:protocols:next-hop.png?400}} Атрибут **Next-hop** * IP-адрес следующей AS для достижения сети назначения. * Это IP-адрес eBGP-маршрутизатора, через который идет путь к сети назначения. * Атрибут меняется при передаче префикса в другую AS Third party next hop: {{:glossary:net:protocols:300px-next-hop3.png?300}} ==== Origin ==== Атрибут **Origin** — указывает на то, каким образом был получен маршрут в обновлении. Возможные значения атрибута: * '''0''' — IGP: NLRI получена внутри исходной автономной системы; * '''1''' — EGP: NLRI выучена по протоколу Exterior Gateway Protocol (EGP). Предшественник BGP, не используется * '''2''' — Incomplete: NLRI была выучена каким-то другим образом ==== Local preference ==== Атрибут **Local preference**: * Указывает маршрутизаторам внутри автономной системы как выйти за её пределы. * Этот атрибут передается только в пределах одной автономной системы. * На маршрутизаторах Cisco по умолчанию значение атрибута — 100. * Выбирается та точка выхода у которой значение атрибута больше. * Если eBGP-сосед получает обновление с выставленным значением local preference, он игнорирует этот атрибут. ==== Atomic aggregate ==== Метка, указывающая, что NLRI является summary. ==== Aggregator ==== Список RID и ASN маршрутизаторов, создавших summary NLRI. ==== Communities ==== Атрибут community: * Тегирование маршрутов * Существуют предопределенные значения * По умолчанию не пересылаются соседям * Один из вариантов применения: передается соседней AS для управления входящим трафиком Значения от 0x00000000 до 0x0000FFFF и от 0xFFFF0000 до 0xFFFFFFFF зарезервированы. Как правило community отображаются в формате ASN:VALUE. В таком формате, доступны для использования community от 1:0 до 65534:65535. В первой части указывается номер автономной системы, а во второй значение community, которое определяет политику маршрутизации трафика. Некоторые значения communities предопределены. RFC1997 определяет три значения таких community. Эти значения должны одинаково распознаваться и обрабатываться всеми реализациями BGP, которые распознают атрибут community. Если маршрутизатор получает маршрут в котором указано предопределенное значение communities, то он выполняет специфическое, предопределенное действие основанное на значении атрибута. Предопределенные значения communities (Well-known Communities): * '''no-export (0xFFFFFF01)''' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться за пределы конфедерации (автономная система, которая не является частью конфедерации считается конфедерацией). То есть, маршруты не анонсируются EBGP-соседям, но анонсируются внешним соседям в конфедерации, * '''no-advertise (0xFFFFFF02)''' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться другим BGP-соседям, * '''no-export-subconfed (0xFFFFFF03)''' — Все маршруты которые передаются с таким значением атрибута community не должны анонсироваться внешним BGP-соседям (ни внешним в конфедерации, ни настоящим внешним соседям). В Cisco это значение встречается и под названием local-as. Маршрутизаторы которые не поддерживают атрибут community, будут передавать его далее, так как это transitive атрибут. ==== Multi exit discriminator (MED) ==== Атрибут **MED**: * Используется для информирования eBGP-соседей о том, какой путь в автономную систему более предпочтительный. * Атрибут передается между автономными системами. * Маршрутизаторы внутри соседней автономной системы используют этот атрибут, но, как только обновление выходит за пределы AS, атрибут MED отбрасывается. * Чем меньше значение атрибута, тем более предпочтительна точка входа в автономную систему. ==== Weight (проприетарный атрибут Cisco) ==== Атрибут **Weight**: * Позволяет назначить "вес" различным путям локально на маршрутизаторе. * Используется в тех случаях, когда у одного маршрутизатора есть несколько выходов из автономной системы (сам маршрутизатор является точкой выхода). * Имеет значение только локально, в пределах маршрутизатора. * Не передается в обновлениях. * Чем больше значение атрибута, тем более предпочтителен путь выхода. ===== Выбор пути ===== Характеристики процедуры выбора пути протоколом BGP: * В таблице BGP хранятся все известные пути, а в таблице маршрутизации — лучшие. * Пути выбираются на основании политик. * Пути не выбираются на основании пропускной способности. Сначала проверяется: * Доступен ли next-hop ([http://tools.ietf.org/html/rfc4271#section-9.1.2.1 Route Resolvability Condition]) * : Для того чтобы next-hop считался доступным (accessible), необходимо чтобы в таблице маршрутизации был IGP-маршрут, который ведет к нему. ==== Cisco ==== - Максимальное значение weight (локально для маршрутизатора). - Максимальное значение local preference (для всей AS). - Предпочесть локальный маршрут маршрутизатора (next hop = 0.0.0.0). - Кратчайший путь через автономные системы. (самый короткий AS_PATH) - Минимальное значение origin code (IGP < EGP < incomplete). - Минимальное значение MED (распространяется между автономными системами). - Путь eBGP лучше чем путь iBGP. - Выбрать путь через ближайшего IGP-соседа. - Выбрать самый старый маршрут для eBGP-пути. - Выбрать путь через соседа с наименьшим BGP router ID. - Выбрать путь через соседа с наименьшим IP-адресом. ==== Juniper ==== Если существует несколько маршрутов до одной сети назначения, будет выбран только один из них. Каждый шаг в алгоритме выбора лучшего маршрута пытается устранить все, кроме одного маршруты к пункту назначения. Если на шаге алгоритма маршрутов все еще больше одного, будет выполнен переход на следующий шаг алгоритма. Таким образом, алгоритм работает до тех пор, пока это необходимо. В устройствах Juniper выбор наилучшего маршрута происходит по следующему алгоритму: - проверка на доступность next-hop в локальной таблице маршрутизации. Если next-hop не доступен, маршрут отбрасывается. - маршрутизатор выбирает маршрут с наибольшим Local Preference атрибутом. - маршрутизатор выбирает маршрут с кратчайшим AS Path length. - маршрутизатор выбирает маршрут с наименьшим значением атрибута Origin (то есть отдается предпочтение IGP). - маршрутизатор выбирает маршрут с наименьшим значением MED. Этот шаг выполняется, по умолчанию, только для маршрутов из одной AS. - маршрутизатор выбирает маршруты, полученные от соседей EBGP нежели полученные от IBGP соседей. Если остальные маршруты EBGP-маршруты, маршрутизатор переходит к шагу 9. - маршрутизатор выбирает маршрут с наименьшей метрикой IGP к анонсируемому BGP Next Hop. - если используется Route Reflection для IBGP пиринга, маршрутизатор выбирает путь с наименьшим Cluster-List length. - маршрутизатор выбирает маршрут от партнера с наименьшим Router ID. - маршрутизатор выбирает маршрут от партнера с наименьшим Peer Address. Только лучший путь помещается в таблицу маршрутизации и анонсируется BGP-соседям.