La panne 911 répandue en Pennsylvanie en juillet 2025 souligne à quel point les systèmes de sécurité publique critiques sont vulnérables. La confusion qui a laissé les résidents qui n’avaient pas un accès fiable aux services d’urgence ont révélé un éventail de vulnérabilités qui limitent la visibilité sur l’accès du système à partir d’infrastructures obsolètes et de dépendances centralisées, de faibles dépendances de gestion du changement.
Pour éviter les échecs futurs, vous avez besoin de plus d’une correction à court terme. La responsabilité des fournisseurs doit être renforcée, la modernisation architecturale, les systèmes de test de stress dans des conditions réelles et la résilience doit être construite sur la technologie et les processus. Ci-dessous, les membres du Forbes Technology Council mettent en évidence les faiblesses exposées par la panne du Pennsylvanie 911 et partagent des recommandations pour s’assurer que les systèmes critiques de sécurité publique peuvent être fiables lorsqu’ils sont les plus nécessaires.
1. Effectuez des revues et RFP de fournisseurs réguliers
Les gouvernements changent rarement de fournisseurs lorsqu’ils installent des produits de travail ou des solutions. Ils doivent s’assurer que les meilleures solutions sont en place pour fournir un intérêt public en conservant des avis réguliers et des offres publiques pour ces produits et services. Cela aide à renforcer le système. – Lane Campbell, Govsoft
2. Créez un registre fédéral de résilience pour les fournisseurs NG911
47 Les réglementations actuelles en vertu du CFR, partie 9, exigent la certification annuelle des fournisseurs de services 911 pour la diversité des circuits, la puissance de sauvegarde et la surveillance du réseau. Cependant, ces règles n’ont pas de référence de résilience pour l’infrastructure 911 basée sur IP. Le registre fédéral de résilience et les organismes de certification peuvent permettre une vérification de basculement en temps réel et s’assurer que les fournisseurs de NG911 démontrent une tolérance aux défauts. -Cristian Randieri, Intellisystem Technologies
Forbes Technology Council est une communauté uniquement sur l’invitation pour les DSI, les CTO et les cadres technologiques de classe mondiale. Êtes-vous qualifié?
3. Ajouter un basculement automatisé pour améliorer la continuité du service
La panne de Pennsylvanie 911 a révélé comment un seul échec peut perturber les services critiques. La création de redondance, de surveillance en temps réel et de bascules automatisés vous donne la résilience dont vous avez besoin pour maintenir vos systèmes essentiels en cours d’exécution même si une partie de votre réseau tombe en panne. – Richard Danforth, Jenacy
4. Adoptez une architecture cloud hybride pour éliminer les silos
Cette panne souligne à quel point les systèmes de communication critiques sont vulnérables lorsqu’ils sont construits sur une infrastructure obsolète ou cloisonnée. Pour améliorer la résilience, les organisations doivent adopter une architecture hybride compatible avec le cloud qui prend en charge la surveillance en temps réel, la redondance et le basculement transparent. Ces systèmes offrent une plus grande flexibilité et garantissent la continuité lorsque les enjeux sont élevés et que les temps d’arrêt ne sont pas une option. -Luiz Domingos, Mitel
5. Créez un plan de rétro-retour rapide pour les échecs liés au changement
L’une des principales mesures de performance pour une organisation est le temps moyen qu’il résout. Dans ce cas, le problème était lié au changement, mais le temps de recul et de restauration a pris plus de 12 heures. Le fait d’avoir une stratégie de retour en arrière robuste peut vous aider à créer une infrastructure et des systèmes résilients. -Abhinav Sharma, JPMorgan Chase
6. Vendeur d’audit avec SLA et protocole de test de régression
Le NG911 ajoute des fonctionnalités, mais augmente également le risque d’échec. Le déploiement de l’entreprise nécessite une redondance et un basculement entièrement testés, des tests de charge réels et des vérifications de régression automatique. Tenez les fournisseurs responsables des contrats et des audits au niveau des services pour assurer la fiabilité et éviter les perturbations des services critiques. -Debdeep Mazumder, Tradeweb Markets
7. Un processus opérationnel mature pour éviter les lacunes de déploiement
Les problèmes techniques tels que les défaillances de nœuds qui peuvent être catastrophiques et la panne à l’échelle du système sont les conséquences de l’immaturité dans le processus. Dans ce cas, les processus de stadification et de test du système n’ont pas été respectés. En conséquence, le système fragile a été déployé. Se concentrer sur un seul point d’échec technique obscurcit une cause profonde plus importante: l’étape a été ignorée. Cela peut être évité une fois que le processus mûrit. – James Stanger, Comptia
8. Migrer vers un modèle d’infrastructure de nuage natif distribué
La panne de la Pennsylvania 911 repose sur une seule infrastructure de défaillance et héritée qui manque de redondance. Pour y remédier, les systèmes publics doivent adopter une architecture natiable en nuage distribuée avec un basculement en temps réel, une surveillance continue et des exercices stricts de reprise après sinistre. -Katerina Axelsson, tastry
9. Chaîne de dépendance des tests de carte et de contrainte
La panne a révélé que la résilience ne concerne pas seulement les sauvegardes. Il s’agit de connaître l’extrémité de la chaîne de dépendances et le fonctionnement de chaque lien sous le stress. Peu de systèmes ont cartographié et testé cela. La création d’une carte de dépendance en direct exercée via un exercice de défaut contrôlé garantit que l’ensemble du système s’adaptera sans hésitation si un lien se brise. -Abhesh Kumar, Springline Advisory
10. Distribuer des décisions tout en maintenant la surveillance
L’événement en Pennsylvanie a montré exactement ce qui arriverait aux entreprises coincées dans une hiérarchie rigide. La prise de décision et la récupération peuvent conduire à une seule défaillance qui peut onduler sur l’ensemble du système. Les systèmes critiques sont décentralisés, mais doivent fonctionner sous un parapluie supérieur. L’autonomie locale favorise la vitesse et la résilience, et la surveillance centrale garantit que les normes, la coordination et la confiance ne sont pas compromises. – Doug Shannon
11. Intégrer l’automatisation axée sur l’IA pour une auto-guérison immédiate
Les systèmes d’urgence hérités n’ont pas d’adaptabilité en temps réel et de redondance intelligente. Un échec a été en cascade sur le réseau. En intégrant l’automatisation alimentée par l’IA avec des flux de données à tokenisés, les agents peuvent créer une infrastructure d’auto-guérison où les alertes peuvent être réaffectées instantanément, permettant aux services critiques de continuer à fonctionner sans retards humains ni goulots d’étranglement centralisés dans la région. -Charles Morey, Mobileyes Inc.
12. Simuler les échecs d’orchestration en direct pour vérifier la redondance
Les pannes révèlent comment les dépendances ponctuelles sont enterrées dans les systèmes modernes. La redondance est souvent conçue pour le matériel, mais pas pour la logique d’orchestration elle-même. Les reliefs sont ennuyeux, mais efficaces. Il simule les chemins de défaillance trimestriels réels ainsi que la théorie. Assurez-vous que le basculement fonctionne sous Liveload, pas sous un laboratoire propre. -Zameer Rizvi, Odesso Inc.
13. Renforcer la gestion du changement avec les déploiements étape par étape
Semblable à la panne, l’échec du 911 de la Pennsylvanie a souligné que les modifications incontrôlées, que ce soit dans le matériel, les logiciels ou la configuration, perturbent les systèmes critiques. Une gestion améliorée du changement avec des tests rigoureux, des déploiements progressifs et des plans de basculement est essentiel pour prévenir les incidents similaires. -Yogesh Malik, way2Direct
14. Antoriser les vulnérabilités des logiciels à l’aide de la redondance géographique
Les mises à jour de routine ont provoqué de graves défaillances des services d’urgence, révélant le risque de vulnérabilités logicielles. Pour éviter les échecs futurs, les organisations devraient mettre en œuvre des déploiements mis en scène, maintenir la redondance géographique et tester régulièrement les systèmes de basculement. Si l’infrastructure aide la sécurité publique, la conception résiliente n’est pas une option. -Dileeprai, groupe de livres Hachette
15. Appliquer des graphiques de connaissances pour améliorer le contrôle d’accès à l’identité
La panne de Pennsylvania 911 met en évidence une vulnérabilité importante. C’est le manque de visibilité sur l’accès à l’identité entre les systèmes interconnectés. Si le contrôle d’accès est obsolète ou non géré, un lien faible peut endommager la disponibilité. En utilisant des graphiques de connaissances et des jumeaux numériques, les organisations peuvent cartographier et surveiller les relations d’accès, réduire les risques et améliorer la résilience face à de telles pannes. – Craig Davis, Gattid
16. Améliorez votre système hérité vers une plate-forme cloud avec une surveillance en temps réel
Cet incident a révélé les vulnérabilités des systèmes publics importants qui manquent de mécanismes de redondance et de basculement appropriés. La mise à niveau vers un système basé sur le cloud avec résilience intégrée, redondance et surveillance en temps réel garantit la continuité pendant les pannes. Les tests et le maintien réguliers de ces systèmes peuvent aider à améliorer la fiabilité et à réduire le risque d’échecs similaires. -Tannu Jiwnani, Microsoft
17. Développez les échecs localisés pour équilibrer les dépendances du cloud
La panne de Pennsylvanie 911 m’a rappelé que « basé sur le cloud » ne signifie pas la « prévention des tempêtes ». Une vraie vulnérabilité? Dépendances technologiques localisées, sans échec et sans réserve, concentrées. C’est comme mettre tous les canots de sauvetage d’un côté du navire. Solution? Architecture résiliente hybride – Des sauvegardes locales qui permettent aux nuages de donner un coup de pied comme une mémoire musculaire lorsqu’ils s’étouffent. – Joel Frenett, Travelfun.biz
18. Audit de reprise après sinistre et mandats de basculement automatique
La panne a révélé un défaut significatif. Les plans de reprise après sinistre et de résilience sont médiocres et les tests sont médiocres. Les systèmes de communication gouvernementaux critiques devraient être mandatés par la loi pour inclure la résilience intégrée et le basculement automatique. Ces fonctionnalités doivent être testées régulièrement, réaliste ou plus fréquemment régulièrement, pour assurer la préparation aux urgences. – Florida Blue, Harikrishnan Mutukrishnan
19. Exécutez un exercice de basculement en direct pour convertir la théorie en pratique
Les pannes ont indiqué comment les systèmes critiques sont rarement testés dans des conditions de défaillance réelles. La redondance du papier n’a guère de sens si personne ne simule ce qui se passe lorsque le nœud central tombe réellement. Un exercice de basculement en direct normal, combiné à une voie de sauvegarde distribuée, peut transformer la résilience théorique en continuité réelle lorsque la prochaine crise frappe. -Umesh Kumar Sharma
20. Moderniser votre infrastructure d’urgence avec un basculement automatique
Les pannes ont été un rappel sévère à quel point notre système d’urgence est vulnérable et obsolète. Un échec ne devrait pas mettre votre vie en danger. Il est temps de progresser vers l’infrastructure native du cloud en utilisant la surveillance en temps réel et le basculement automatisé. Ces mises à niveau ne sont pas seulement techniques. Ils sont essentiels pour faire fonctionner les services critiques lorsqu’ils comptent chaque seconde. -Harvendra Singh, Publix Super Markets Inc.


