Методология
Обнаружение и атрибуция задержек на подводных кабелях через двухсигнальную кросс-валидацию
Евгений Королёв — GeoCables · Техническая заметка, июнь 2026 · v1.1
1. Основа данных
| Актив | Масштаб |
|---|---|
| Подводные кабели (с геометрией точек выхода) | 703 |
| Точки выхода (геокодированы) | 1,932 |
| Магистральные сегменты кабелей | 26,053 |
| Свои зонды (Минск, Алматы, Тбилиси, Иерусалим) + RIPE Atlas | 12 + RIPE |
| Завершённых проверок (с 01.03.2026) | 168,699 |
| Кабелей под активным измерением | 691 |
Метод работает на курируемом графе топологии и непрерывно накапливающемся архиве измерений. Сырой RTT каждого замера хранится только-добавлением, поэтому любой будущий детектор можно прогнать по всей истории — свойство, которое нельзя восстановить задним числом из одних публичных карт кабелей.
2. Детекция (baseline + привязка по haversine)
Каждая проверка пингует (и трейсит) цель рядом с точкой выхода кабеля. Замер — кандидат в аномалии, когда RTT существенно превышает адаптивный baseline маршрута. Кандидаты проходят ступенчатую воронку до любого оповещения — первый слой подавления ложных срабатываний:
| Стадия | Значение | Кол-во |
|---|---|---|
spike | сырой замер выше baseline | 624 |
anomaly_confirmed | спайк, который держится / подтверждён | 189 |
alert | повышен до отслеживаемого инцидента | 114 |
Лишь ~18% сырых спайков (114 / 624) становятся оповещениями. Привязка к кабелю геометрическая: скачок задержки связывается с ближайшим сегментом кабеля по haversine-расстоянию между подозреваемым хопом и точками выхода кабелей-кандидатов.
3. Двухсигнальная кросс-валидация
3.1 Сигнал A — смена AS-пути (reroute)
Когда подводный кабель деградирует, трафик часто перестраивается, меняя путь автономных систем. Для каждого оповещения мы сравниваем AS-путь до события (модальный путь на паре зонд→цель) с путём в момент события.
| Вердикт | Значение | Кол-во |
|---|---|---|
route_change_break | AS-путь сменился, с большим дальнейшим ростом задержки на новом пути | 4 |
route_change | AS-путь сменился | 5 |
same_path | RTT вырос, путь не менялся (класс конгестии) | 57 |
no routing history | недостаточно истории маршрутизации | 48 |
Из 66 оповещений с достаточной историей маршрутизации 9 (13,6%) были независимо подтверждены измеренной сменой AS-пути. Наивный отпечаток по сырому IP-пути слишком шумный (ECMP-балансировка и плавающие таймауты дают ~18 разных IP-путей на пару зонд→цель); сигнал стабилен только на отпечатке AS-множества (~1,5 на пару), который мы и используем.
3.2 Сигнал B — сегмент-осознанный консенсус зондов
Если деградацию видит только зонд-детектор, вопрос в том, являются ли остальные зонды молчащими свидетелями или просто не на затронутом кабеле. Зонд, идущий в обход кабеля, не свидетель — его молчание не алиби. Поэтому мы считаем зонд правомочным свидетелем, только если его реальный AS-путь гео-проходит тот же коридор кабеля, что и путь алертного зонда. Этот гео-коридорный тест отсеял 30% наивных «свидетелей» того же кабеля как внекоридорных.
| Вердикт | Значение | Кол-во |
|---|---|---|
widespread | большинство коридорных свидетелей тоже деградировали — реальное событие кабеля | 1 |
mixed | часть коридорных свидетелей деградировала | 4 |
routing_event_non_cable | алертный зонд перестроился, коридорные свидетели здоровы → BGP/пиринг, не обрыв | 7 |
probe_specific_likely_fp | коридорные свидетели здоровы, без reroute → локальный артефакт | 44 |
narrow_path_event_possible | single-probe кабель — узкое событие нельзя исключить | 1 |
insufficient_witness_context | нет одновременного коридорного свидетеля — неизвестно | 57 |
3.3 Лестница доверия
Два сигнала в значительной мере независимы: смена AS-пути отражает топологическое событие, а консенсус зондов — географическую широту деградации; это разные физические процессы, которые не обязаны совпадать. Очень мало оповещений удовлетворяют обоим. Их сочетание:
| Уровень | Определение | Кол-во (из 114) |
|---|---|---|
| Подтверждён дважды | смена AS-пути и консенсус зондов | 0 |
| Один сигнал | подтверждён ровно одним сигналом | 14 |
| Защищаемый ложный срабатыв. | коридорные свидетели здоровы и без reroute | 44 |
| Не классифицир. (покрытие) | нет свидетеля на коридоре — предел покрытия зондов, не неопределённость метода | 56 |
Счёт «подтверждён дважды» равен нулю — и это правильный результат: окно 2026-03–06 не содержало крупного обрыва подводного кабеля. Настоящий крупный обрыв зажёг бы оба сигнала разом; ценность метода в том, что он различает — уверенно помечает 44 оповещения (38%) как защищаемые ложные срабатывания и выделяет 7 событий как изменения маршрутизации, которые не являются авариями кабеля, — а не в драматичном «счёте тел» в тихий месяц.
4. Анализ ложных срабатываний (честно)
- Воронка уже отбрасывает 82% сырых спайков до оповещения (624 → 114).
- Из оповещений 44/114 (38%) — защищаемые ложные срабатывания: оба независимых сигнала отрицательны. Теперь они подавляются в уведомлениях пользователям, но остаются видны в дашборде.
- Наивное правило «один зонд ⇒ ложное срабатывание» завысило бы FP примерно на 45%: гео-коридорное уточнение переводит многие из них в неизвестно, а не в подтверждённый FP, потому что отсутствие свидетеля, который никогда не пользовался кабелем, не является доказательством.
- 56/114 оповещений остаются неклассифицированными из-за структурного отсутствия свидетеля на коридоре — это ограничение покрытия зондов, а не неопределённость метода. Классификатор для них определён; просто пока нет данных, чтобы их оценить.
5. Ограничения
- География зондов. Небольшой фиксированный парк плюс RIPE Atlas означает, что у многих кабелей нет второй точки наблюдения на нужном коридоре; для них сигнал консенсуса структурно недоступен. Расширение парка зондов напрямую устраняет структурную причину большинства неклассифицированных случаев.
- Гео-разрешение. Сопоставление коридора — на уровне стран по геолокации AS-пути; некоторые сети геолоцируются неверно, что мы трактуем как неизвестно, а не как несовпадение.
- Привязка геометрическая. Назначение кабеля — по haversine-близости; коридорная сверка подтверждает его там, где есть данные пути (64 из 66 с данными подтверждены), но это эвристика, а не утверждение об истине.
- Тихое окно. В отчётный период не было крупного обрыва; метод подтверждается своей различающей способностью, а не обнаружением катастрофы.
6. Воспроизводимость и данные
Детекция использует адаптивный порог, калиброванный по распределению baseline каждого маршрута, а не фиксированный множитель; уровни консенсуса отражают долю правомочных коридорных свидетелей, подтверждающих деградацию. Точная параметризация здесь намеренно опущена и доступна в будущей полной публикации или по запросу. Сырой RTT каждого замера и AS-пути сохраняются, поэтому классификатор можно прогнать по всему архиву при любой пересмотренной методике. Источники сигнала: RIPE Atlas (ping + traceroute), свои зонды и курируемый граф кабелей/точек выхода.