Des services secrets, nous ne savons que les échecs et rarement les succès. Si l'échec provoque l'anathème, l'ingratitude est fille de la victoire. Quand à la gloire, il faut l'oublier, elle est pour les autres...

vendredi 23 octobre 2020

L’IA au service du renseignement : le cas d’Earthcube

 

(© Earthcube)


Votre société travaille à l’apex entre l’intelligence artificielle et le géospatial, un domaine en pleine expansion qui impose le traitement d’énormes volumes de données. Vos solutions sont-­elles déjà fonctionnelles ? Concrètement, que parvenez-­vous à faire et avec quel degré de confiance ?

Arnaud Guérin et Renaud Allioux : Cent vingt milliards d’euros par an : c’est le montant des dépenses mondiales pour l’acquisition de systèmes C4ISR (Communication, command & control, computers, intelligence, surveillance, reconnaissance) visant à apporter aux armées la supériorité informationnelle. La très vaste majorité de ce budget est destinée aux moyens matériels d’acquisition de données brutes pour le renseignement dans les domaines spatial, aérien, terrestre ou naval. En France, plusieurs programmes sont venus révolutionner les capacités C4ISR des forces et de la communauté du renseignement ou sont sur le point d’être mis en service : composante spatiale optique pour le ROIM (Renseignement d’origine image) spatial, Rafale Reco NG et avion léger de surveillance et de reconnaissance pour le ROIM aérien, Reaper et Patroller pour les drones, ou encore CERES et EPICURE pour le ROEM (Renseignement d’origine électromagnétique). On dispose aujourd’hui de 100 fois plus de données qu’il y a encore quelques années.

Auditionné en 2018 à l’Assemblée nationale, le général Ferlet, directeur du renseignement militaire, parlait d’un «  tsunami de données ». Il ajoutait : «  Nous sommes submergés par des données dont la masse croît de manière exponentielle. Il ne saurait être question d’y faire face en se contentant de demander des moyens supplémentaires en exploitants ou en analystes. Nous devons au contraire trouver des solutions plus innovantes, à base d’outils d’intelligence artificielle.  »

C’est dans ce contexte qu’Earthcube a développé depuis 2016 une solution logicielle permettant aux exploitants de valoriser 100 % des données collectées. Cette solution est en effet capable d’orienter les analystes en identifiant automatiquement les quelques pour cent de données nécessitant leur attention, car un évènement d’intérêt a été détecté. Pour cela, Earthcube s’appuie sur des standards OTAN tels que le STANAG 3596 pour le ROIM satellitaire et combine les forces de l’analyste qui définit les « patterns of life » qui l’intéressent et de l’intelligence artificielle qui va traiter massivement la donnée brute à la recherche de ces patterns. L’exploitant peut ainsi focaliser son attention sur l’analyse fine au lieu de perdre son temps à chercher l’aiguille dans la botte de foin.

Notre intelligence artificielle traite en effet 100 % du flux de données pour détecter les principaux objets d’intérêt défense (véhicules, blindés, avions, hélicoptères, navires, systèmes SAM/SSM…), identifier finement le modèle détecté et générer une alerte lorsqu’un pattern est identifié. Chaque image est donc analysée en quelques minutes au lieu de quelques heures ou jours. Il devient possible d’accroître considérablement la fréquence de surveillance. De plus, l’information extraite est capitalisée et l’exploitant dispose ainsi d’un contexte historique et régional sans précédent pour comprendre la situation observée.

Lauréat du défi organisé par la Direction du renseignement militaire en 2017 sur l’analyse massive de données satellites, Earthcube a depuis acquis plusieurs références prestigieuses à l’international, notamment à l’OTAN et plus récemment dans le cadre du programme européen PEONEER (Persistent earth observation for actionable intelligence surveillance and reconnaissance). Si nos clients restent très discrets, le commandant d’un centre de renseignement de l’OTAN où notre solution est déployée témoignait en janvier 2020, lors de la conférence Defense and GeoIntelligence à Londres, que son organisation était désormais capable de traiter 11 fois plus de données et que ses analystes étaient «  plus heureux et performants, car concentrés sur les tâches à haute valeur ajoutée  ». Développer une solution capable de gagner la confiance des opérationnels a nécessité de longues années de travail. Elle s’appuie à la fois sur une équipe de chercheurs à la pointe en Europe dans le domaine de l’intelligence artificielle et sur une compréhension fine des enjeux de nos clients pour répondre aux cas les plus complexes : ombres, occultations partielles, voile nuageux, neige…

Vous évoquez notamment la surveillance de sites, mais une des difficultés, en particulier depuis les années 1990, est l’utilisation de leurres de plus en plus sophistiqués par les acteurs. En quoi l’intelligence artificielle peut-elle aider à faire le tri entre leurres et systèmes d’intérêt et jusqu’à quel point peut-elle le faire ?

Les solutions d’intelligence artificielle ne peuvent inventer de l’information. Si un leurre peut tromper l’analyste, alors il trompera les meilleurs algorithmes. En revanche, les nouvelles générations de capteurs permettent de combiner différents signaux en complément de l’optique visible que notre œil est habitué à analyser. On peut notamment penser à des signaux réagissant aux caractéristiques physiques des objets tels que l’infrarouge, le radar, voire l’hyperspectral. Cette fusion, impossible à réaliser à l’œil nu, devient accessible pour les algorithmes. La fusion de signaux « multicapteurs » est au cœur de travaux que nous réalisons depuis fin 2019 dans le cadre du plan d’étude amont Man-Machine Teaming en amont du programme SCAF (Système de combat aérien du futur).

Au-delà du problème des leurres, les cas d’usage d’intelligence artificielle pour la défense sont parmi les plus complexes que l’on puisse imaginer. Tout d’abord, la frugalité : les algorithmes doivent en effet atteindre des niveaux particulièrement élevés de performance alors même que très peu d’exemples sont généralement mis à disposition des industriels compte tenu des enjeux de confidentialité. Ensuite, l’autonomie : les algorithmes doivent fonctionner au sein des installations des clients. Il est impossible de déployer des ressources pour corriger les éventuelles erreurs. Enfin, l’explicabilité : les exploitants peuvent accepter des erreurs si l’on sait précisément expliquer les limites du domaine d’application pour circonscrire l’utilisation du logiciel à des cas d’usage où la performance est garantie.

Si l’on entend de plus en plus souvent que les algorithmes deviennent une commodité et que la différence se fait sur les données d’entraînement, ce principe ne s’applique pas sur nos cas d’usage. Le domaine d’application dont les contraintes se rapprochent le plus de celles de la défense est probablement celui de l’imagerie médicale. Aucune solution sur étagère des GAFAM ou autre ne répond à des exigences aussi poussées. Il nous a donc fallu développer des algorithmes propriétaires qui trouvent peu d’équivalents aujourd’hui dans le monde.

En matière de machine learning, la qualité des données permettant de « nourrir » et d’« éduquer » le système est fondamentale : « garbage in, garbage out ». Comment vous positionnez-vous sur le recueil et le traitement de ces données ?

Le développement d’un algorithme d’intelligence artificielle doit être vu comme une chaîne d’opérations, de la production de la base d’apprentissage à l’algorithme lui-­même (conception de l’architecture, entraînement, validation, déploiement en production). La fiabilité de la chaîne n’est assurée que si chaque étape est parfaitement maîtrisée. La production d’une base d’apprentissage est elle-­même constituée de trois étapes.

La première consiste à sélectionner les zones d’intérêt et les images à faire annoter. Cette étape est critique pour assurer la capacité du logiciel à être performant dans n’importe quel contexte alors même que nos clients ne vont pas nous communiquer les régions ou sites qui les intéressent. Il faut pouvoir fonctionner quel que soit le contexte. Pour ce faire, si l’on prend l’exemple de notre détecteur d’avions, nous avons construit une base de données propriétaire de dizaines de milliers d’aéroports civils et de milliers d’aéroports militaires. Pour chaque aéroport, nous documentons son ordre de bataille (c’est-à‑dire les types de modèles présents) ainsi que les caractéristiques physiques du terrain (bitume, terre, herbe, neige…). Cela nous permet de construire une base à la fois générique, pour reconnaître tous les modèles dans tous les contextes, et équilibrée, pour ne pas introduire de biais qui pourrait venir d’une surreprésentation de certains types de modèles. Pour la deuxième étape, l’annotation proprement dite, de nombreux prestataires existent. Earthcube a choisi de travailler avec l’un des leaders du secteur, qui collabore avec de nombreuses start-up françaises et est reconnu pour sa qualité. Toutefois, le mode de travail a été adapté à nos enjeux bien spécifiques. Une équipe spécifique est formée par nos soins et nous faisons passer un examen à chacun de ses membres avant de l’autoriser à travailler. De plus, les opérateurs travaillent intégralement avec des outils web propriétaires développés par Earthcube. À aucun moment ils ne peuvent accéder aux informations des sites annotés ou à la donnée brute, ni exporter la donnée d’apprentissage. Impossible donc de copier notre propriété intellectuelle pour la communiquer à d’autres.

Enfin, troisième et dernière étape, toutes ces données d’apprentissage sont méthodiquement vérifiées. Des tests automatiques vont rechercher d’éventuelles incohérences (par exemple un avion américain sur un site russe) et une équipe d’experts au sein d’Earthcube réalise des tests par sondage pour s’assurer de la qualité des données produites. Aujourd’hui, moins de 1 % des données produites sont ainsi renvoyées pour défaut de qualité.

L’imagerie spatiale commerciale est en pleine expansion et de plus en plus d’États se dotent ainsi de capacités de renseignement qu’ils n’avaient, jusque-là, pas. Y rencontrez-vous un succès commercial ? Plus largement, vu la sensibilité de vos technologies, quelle est votre politique d’exportation ?

L’essor de l’imagerie spatiale commerciale profite à tous les pays. Même ceux dotés de moyens souverains tirent parti de la complémentarité avec les moyens commerciaux pour disposer de moyens de surveillance performants de manière compétitive. Aux États-Unis, le National Reconnaissance Office est par exemple sur le point d’étendre le programme d’acquisition d’images EnhancedView avec l’arrivée de la constellation Legion de Maxar ou encore les offres de Planet et Blacksky. De nombreux pays, dont la France, pourraient être tentés de faire de même avec le lancement en 2021 de la constellation Pleiades NEO d’Airbus. Ces satellites commerciaux ont une résolution moindre que les satellites souverains, mais suffisante pour de nombreux cas d’usage. Ils offrent donc une solution très économique et permettent d’augmenter significativement la fréquence de surveillance en multipliant les sources de données.

Si Earthcube a pour ambition de continuer à croître sur les marchés export, cette croissance se fera avec un très grand souci de respecter des principes éthiques au cœur de la culture de la société. Nous avons ainsi mis en place un comité éthique définissant un cadre d’emploi strict pour nos solutions, que cela concerne l’ajout de nouvelles fonctionnalités ou les clients auprès de qui nous commercialisons nos produits. Ces règles se fondent sur des indicateurs internationalement reconnus mesurant notamment le respect des principes démocratiques.

L’innovation aussi bien que tout ce qui touche au renseignement sont des domaines prioritaires pour le ministère des Armées. Vous sentez-vous suffisamment soutenu par ce dernier ?

La société n’existait pas depuis trois mois quand elle a été identifiée par le ministère des Armées. Quatre ans plus tard, notre chiffre d’affaires connaît une très forte croissance, multiplié par quatre en 2019 et en passe de connaître la même accélération en 2020. Notre société compte une cinquantaine d’employés actuellement, et nous serons près de 200 d’ici à deux ans. La confiance des acteurs de la défense ne se gagne pas en un jour, mais les premiers contrats peuvent rapidement atteindre des montants dix fois supérieurs à ce qu’une start-up peut connaître sur des marchés civils.

Sous l’impulsion de la ministre des Armées, Florence Parly, un très fort accent a en effet été mis sur l’innovation. Cette innovation n’est pas l’apanage des start-up : elle mobilise tout un écosystème de laboratoires de recherche, de PME/ETI et de grands industriels. Des organisations comme l’Intelligence Campus et l’Agence de l’innovation de défense ont pour mission de favoriser l’émergence de solutions innovantes en mettant en lumière les besoins du ministère des Armées et en raccourcissant les délais d’acquisition.

Par ailleurs, le ministère des Armées a un rôle fortement moteur pour promouvoir ses champions industriels à l’international. Après avoir été parmi les cinq sélectionnés aux États-Unis dans le cadre du FCT (1) au sein d’un panel de plusieurs centaines de sociétés internationales, Earthcube a ainsi tiré parti d’un évènement organisé par la Direction internationale de la Direction générale de l’armement (DGA) à l’ambassade de France à Washington pour être mis en relation avec une quinzaine de prospects américains.

Enfin, dans le contexte de crise sanitaire et économique de ce début d’année, la DGA a porté une attention particulière à la santé des industriels à travers l’action de son Service des affaires industrielles et de l’intelligence économique. Elle a par exemple ainsi veillé à ce que les paiements des contrats engagés ne soient pas retardés.

Propos recueillis par Joseph Henrotin, le 3 juillet 2020.

Note

(1) Voir : DGA, « Le programme Foreign Comparative Testing du département de la défense américain : présentation et opportunités », 29 mai 2020 (https://​www​.defense​.gouv​.fr/​e​n​g​l​i​s​h​/​d​g​a​/​a​c​t​u​a​l​i​t​e​/​l​e​-​p​r​o​g​r​a​m​m​e​-​f​o​r​e​i​g​n​-​c​o​m​p​a​r​a​t​i​v​e​-​t​e​s​t​i​n​g​-​d​u​-​d​e​p​a​r​t​e​m​e​n​t​-​d​e​-​l​a​-​d​e​f​e​n​s​e​-​a​m​e​r​i​c​a​i​n​-​p​r​e​s​e​n​t​a​t​i​o​n​-​e​t​-​o​p​p​o​r​t​u​n​i​tes).

areion24.news