Détection et attribution des anomalies de latence des câbles sous-marins par validation croisée à deux signaux
Méthodologie
Détection et attribution des anomalies de latence dans les câbles sous-marins par validation croisée à deux signaux
Evgeny Korolev - GeoCables · Note technique, juin 2026 · v1.1
L'apport principal de ce travail n'est pas le détecteur lui-même, mais une couche de validation croisée à deux signaux qui évalue chaque alerte à l'aune de deux signaux physiques indépendants : un changement dans la route à travers les systèmes autonomes (AS-path) au moment de l'événement, et la question de savoir si d'autres sondes dont la route traverse physiquement le même corridor de câble observent la même dégradation.
Les deux signaux reflètent des processus physiques fondamentalement distincts et sont, dans une large mesure, indépendants l'un de l'autre. Leur analyse conjointe permet de séparer les incidents réels au niveau de la topologie du câble, les changements de routage et le bruit provenant d'une sonde unique.
Les chiffres présentés ci-dessous sont délibérément dépourvus de dramatisme : aucune rupture de câble à grande échelle ne s'est produite durant la période analysée - et la méthode s'abstient correctement d'en « inventer » une.
1. Données de base
| Élément | Quantité |
|---|---|
| Câbles sous-marins (avec géométrie des points d'atterrissage) | 703 |
| Points d'atterrissage (géocodés) | 1 932 |
| Segments de réseau dorsal / tronçons de câble | 26 053 |
| Sondes internes (Minsk, Almaty, Tbilissi, Jérusalem) + | 12 + RIPE |
| Vérifications d'état effectuées (depuis le 01/03/2026) | 168 699 |
| Câbles sous surveillance active | 691 |
La méthode s'appuie sur un graphe de topologie de réseau soigneusement vérifié et sur une archive de mesures en constante expansion.
Les valeurs RTT brutes de chaque mesure sont conservées en mode append-only (append-only - principe d'immuabilité : les nouveaux enregistrements sont ajoutés, les anciens ne sont jamais supprimés ni modifiés - comme le journal de bord d'un navire, qui garantit l'intégrité de l'historique), de sorte que tout détecteur futur pourra être réexécuté sur l'intégralité de l'historique.
Cette propriété ne peut être reconstituée rétrospectivement à partir des seules cartes de câbles publiques.
2. Détection (niveau de référence + attribution géométrique)
Chaque vérification envoie un ping et effectue une trace de route vers une cible proche d'un point d'atterrissage de câble.
Une mesure est considérée comme anomalie candidate lorsque son RTT dépasse sensiblement le niveau de référence adaptatif de cette route (le niveau de référence est la latence statistiquement « normale » calculée à partir de l'historique des mesures - comme la température corporelle normale : un écart n'est signalé que lorsqu'il est réellement significatif).
Ces candidats passent par un entonnoir de filtrage par étapes avant qu'une alerte ne soit émise - constituant le premier niveau de suppression des faux positifs :
| Étape | Signification | Quantité |
|---|---|---|
spike |
mesure ponctuelle au-dessus du niveau de référence | 624 |
anomaly_confirmed |
pic confirmé par récurrence ou données corroborantes | 189 |
alert |
promu au statut d'incident suivi activement | 114 |
Seulement ~18 % des pics bruts (114 sur 624) atteignent le statut d'alerte.
L'attribution du câble est géométrique : le saut de latence est associé au segment de câble le plus proche selon la distance haversine (la formule de haversine - méthode de navigation classique pour calculer la distance la plus courte entre deux points à la surface d'une sphère ; utilisée par les navigateurs du XIXe siècle et aujourd'hui incontournable dans le GPS et l'analyse géospatiale) entre le saut suspect et les points d'atterrissage des câbles candidats.
3. Validation croisée à deux signaux
3.1 Signal A - Changement de route AS
Lorsqu'un câble sous-marin se dégrade, le trafic est fréquemment redirigé, ce qui modifie la route à travers les systèmes autonomes (AS-path).
Un Système Autonome (AS) est un réseau géré de façon indépendante sous une autorité administrative unique - comme un grand fournisseur d'accès à internet ou un opérateur cloud. L'ensemble d'internet est constitué d'environ 80 000 de ces systèmes, qui coordonnent leurs routes via BGP - le « langage diplomatique » entre réseaux.
Pour chaque alerte, nous comparons l'AS-path avant l'événement (la route modale pour cette paire sonde→cible) avec la route au moment de l'événement.
| Verdict | Signification | Quantité |
|---|---|---|
route_change_break |
l'AS-path a changé, avec une forte augmentation de latence sur la nouvelle route | 4 |
route_change |
l'AS-path a changé | 5 |
same_path |
la latence a augmenté, la route est inchangée - compatible avec une congestion | 57 |
no routing history |
historique de routage insuffisant | 48 |
Lors de la calibration de l'algorithme, parmi les 66 alertes disposant d'un historique de routage suffisant, seulement 9 (13,6 %) ont été corroborées de manière indépendante par un changement d'AS-path mesuré.
Une « empreinte digitale » naïve sur la route IP brute génère beaucoup trop de bruit : le balancement de charge ECMP (ECMP - routage à coût égal par chemins multiples : lorsque plusieurs routes équivalentes mènent à une destination, le trafic se répartit aléatoirement entre elles - comme des voitures se distribuant entre les voies d'une autoroute) et les délais d'attente intermittents produisent ~18 routes IP distinctes par paire sonde→cible. Le signal ne devient stable qu'au niveau de l'ensemble d'AS (~1,5 distinct par paire), ce que nous utilisons.
3.2 Signal B - Consensus multi-sonde tenant compte des segments
Si seule la sonde détectrice observe une dégradation, la question clé est de savoir si les autres sondes sont des témoins silencieux ou si elles n'utilisent tout simplement pas le câble affecté.
Une sonde dont la route contourne le câble n'est pas un témoin valable - son silence ne prouve rien. Il s'agit du piège logique classique : absentia probationis non est probatio absentiae - l'absence de preuve n'est pas la preuve de l'absence.
C'est pourquoi nous ne considérons une sonde comme témoin qualifié que lorsque sa route AS réelle traverse géographiquement le même corridor de câble que la route de la sonde ayant émis l'alerte. Cette vérification par géo-corridor a exclu 30 % des « témoins » naïvement supposés valides selon le critère « même câble ».
| Verdict | Signification | Quantité |
|---|---|---|
widespread |
la majorité des témoins du corridor ont également détecté une dégradation - événement câble réel | 1 |
mixed |
certains témoins du corridor ont détecté une dégradation | 4 |
routing_event_non_cable |
la sonde a été redirigée, les témoins du corridor sont sains → événement BGP/peering, pas une coupure de câble | 7 |
probe_specific_likely_fp |
témoins du corridor sains, sans redirection → artefact local | 44 |
narrow_path_event_possible |
câble à sonde unique - un événement ponctuel ne peut être exclu | 1 |
insufficient_witness_context |
aucun témoin simultané sur le corridor - statut inconnu | 57 |
3.3 Échelle de confiance
Les deux signaux sont dans une large mesure indépendants : un changement d'AS-path reflète un événement topologique dans le réseau - une interruption physique dans la route -, tandis que le consensus multi-sonde reflète l'étendue géographique de la dégradation.
Il s'agit de processus physiques fondamentalement distincts qui n'ont pas à coexister.
Très peu d'alertes satisfont les deux critères simultanément. Le résultat de leur analyse combinée :
| Niveau | Définition | Quantité (sur 114) |
|---|---|---|
| Confirmation duale | changement d'AS-path et corroboration multi-sonde simultanément | 0 |
| Signal unique | corroboré par exactement l'un des deux signaux | 14 |
| Faux positif défendable | témoins du corridor sains et sans redirection | 44 |
| Non classifié (couverture) | aucun témoin présent sur le corridor - limite de couverture des sondes, pas d'incertitude de méthode | 56 |
Le nombre de confirmations duales est zéro, et c'est le résultat attendu : la période mars–juin 2026 n'a enregistré aucune rupture de câble sous-marin à grande échelle.
Une véritable rupture majeure activerait les deux signaux simultanément - tout comme un tremblement de terre est enregistré en même temps par plusieurs sismographes indépendants.
La valeur de la méthode réside dans sa capacité à discriminer : qualifier avec assurance 44 alertes (38 %) de faux positifs défendables et isoler 7 événements comme des changements de routage qui ne sont pas des défauts de câble - plutôt que de produire des statistiques alarmantes durant une période calme.
4. Analyse des faux positifs (sans détour)
- L'entonnoir de filtrage écarte déjà 82 % des pics bruts avant l'émission d'alertes (624 → 114).
- Parmi les alertes, 44/114 (38 %) sont des faux positifs défendables - les deux signaux indépendants sont négatifs. Ces alertes ne sont désormais plus affichées dans les notifications utilisateurs, mais restent visibles dans le tableau de bord.
- Une règle naïve « une seule sonde ⇒ faux positif » aurait surestimé les faux positifs d'environ 45 % : le raffinement par géo-corridor reclassifie beaucoup d'entre eux en inconnu plutôt qu'en faux positif confirmé, car le silence d'un témoin qui n'a jamais emprunté le câble ne constitue pas une preuve.
- 56/114 alertes restent non classifiées en raison de l'absence structurelle d'un témoin sur le corridor - une limitation de la couverture des sondes, non une incertitude de la méthode. Le classifieur est bien défini pour ces alertes ; les données permettant de les évaluer n'existent tout simplement pas encore.
5. Limites
- Géographie des sondes. Une flotte fixe réduite plus (- le plus grand réseau distribué de mesure d'internet au monde, avec plus de 12 000 sondes indépendantes dans plus de 180 pays, opéré par le RIPE NCC) signifie que de nombreux câbles ne disposent pas d'un second point d'observation sur le corridor concerné ; pour ceux-là, le signal de consensus est structurellement indisponible. L'élargissement de la flotte de sondes supprime directement la cause structurelle de la plupart des cas non classifiés.
- Résolution géospatiale. La correspondance des corridors s'effectue au niveau du pays à partir de la géolocalisation de l'AS-path ; certains réseaux présentent une géolocalisation incorrecte, ce que nous traitons comme inconnu plutôt que comme discordance.
- L'attribution est géométrique. L'assignation du câble s'effectue par proximité haversine ; la vérification croisée par corridor la confirme là où des données de route existent (64 des 66 cas confirmés), mais il s'agit d'une heuristique, non d'une affirmation de vérité absolue.
- Période d'observation calme. La période analysée n'a enregistré aucune rupture de câble majeure. La méthode se valide par sa capacité de discrimination, non par la détection d'une catastrophe - comme on vérifie la fiabilité d'un détecteur de fumée avec de la fumée de test, et non avec un véritable incendie.
6. Reproductibilité et données
La détection utilise un seuil adaptatif calibré selon la distribution du niveau de référence de chaque route, plutôt qu'un multiplicateur fixe ; les niveaux de consensus reflètent la proportion de témoins qualifiés du corridor ayant corroboré la dégradation.
La paramétrisation exacte est intentionnellement omise ici et sera disponible dans une publication complète à venir ou sur demande. Les valeurs RTT brutes et les AS-paths de chaque mesure sont conservés, ce qui permet de réexécuter le classifieur de bout en bout sur l'intégralité de l'archive sous n'importe quelle méthode révisée.
Sources des signaux : (ping + trace de route), sondes internes et graphe vérifié de câbles et points d'atterrissage.
La méthode et les données peuvent être citées avec attribution.
Surveillance en temps réel : Moniteur d'état des câbles. Données à jour au 17/06/2026 et susceptibles d'évoluer au fil de l'enrichissement de l'archive.