On fait des choses étonnantes en alliant machine learning et données massives. Ainsi, trois jeunes chercheurs de Stanford (article ici) ont eu l’idée de compter les caméras de surveillance qui pénètrent de plus en plus les espaces urbains. Ils ont donc enseigné à leur machine à reconnaître sur une image ce qu’est une caméra et ont passé à ce filtre de recherche les immenses bases de données de Google Maps, celles obtenues par les véhicules qui photographient les façades des rues en parcourant la plupart des grandes villes du monde.

Voici ce que repère typiquement la machine, ceci dans les rues de San Francisco :

 

 

Avec un soin particulier pour éviter les faux positifs, comme ci-après où la machine a initialement pris pour des caméras des ornements décoratifs (image de gauche) ou un parcmètre (de droite) :

 

Et en voici le résultat sur quelques grandes villes des États-Unis et du monde. Paris ressort à la deuxième place, ce qui remet en cause certaines idées (on aurait plutôt vu Londres loin devant Paris !). Cela soulève un point de méthode s’agissant de ces nouveaux instruments algorithmiques : il faut toujours une analyse humaine des résultats avant d’en tirer un enseignement. En effet, les auteurs ne considèrent que Paris intra-muros, probablement une des métropoles les plus denses au monde, même par leur métrique du nombre de caméras par kilomètre de rue. S’ils avaient pris le Grand Paris, pour être homogènes par exemple avec Séoul ou Londres, ils auraient inclus Garges-les-Gonesses, et la densité moyenne aurait fortement baissé.

 

 

Pourquoi ces jeunes chercheurs se sont-ils lancés dans un tel exercice ? Probablement avec un souci citoyen en tête. Ils écrivent en effet : « les caméras posent également des problèmes importants en matière de vie privée. Les juristes regardent depuis longtemps les interférences des caméras sur les libertés au titre du Premier amendement et du droit constitutionnel à la vie privée. Plus récemment, ils se sont inquiétés du rôle des caméras de surveillance pour assurer un « ordre prédictif », ou des effets négatifs de la reconnaissance faciale et de la vision par ordinateur, ou enfin des menaces de piratage de ces caméras de surveillance. Mais ces inquiétudes ont peu fait pour limiter le nombre et la répartition géospatiale des caméras. »