La pierre apprenante. Les intelligences artificielles à l’assaut de l’immobilier #1

Les dossiers de La FoncièreNumérique

La pierre apprenante.
Les intelligences artificielles
à l’assaut de l’immobilier
« Dès que cela fonctionne, plus personne ne l’appelle IA. »
John McCarthy, pionnier de la recherche en intelligence artificielle

Par Alexandra Ivanovitch

INTRODUCTION

L’IA, grand architecte de la valeur immobilière à venir ?
Entre promesses et réalités.

Tour à tour présentée comme le “grand mythe de notre temps” ou le miracle technologique ultime, l’intelligence artificielle (IA) fascine et pourtant demeure largement incomprise, tant elle est auréolée d’une nébuleuse de termes connexes et pourtant distincts : « machine learning », « deep learning », etc.

Quoique la plupart du temps “faible” car spécifique et non générale, l’intelligence artificielle, avec sa vague d’automatisation de processus, a déjà pris d’assaut des industries phares, bastions traditionnels de l’élite tels que la banque, la finance et la santé.

Solidement ancré dans la pierre, l’immobilier fait figure de secteur irréductible qui résiste encore et toujours. Et pourtant les signes précurseurs d’une disruption prochaine émergent depuis l’autre côté de l’Atlantique, avec plusieurs remarquables levées de fonds qui financent généreusement des proptech propulsées par l’IA.

Classification automatisée des documents, maintenance prédictive, détection des signaux faibles de valorisation du patrimoine, bots collaborateurs et assistants, assets managers artificiels : autant de promesses exponentielles par lesquelles l’intelligence artificielle pourrait augmenter les métiers de l’immobilier. Pourtant la réalité du développement est bien plus humble.

Pour cette nouvelle génération de développeurs immobiliers à l’assaut des terres numériques, la donnée est la nouvelle pierre et l’IA serait le nouvel architecte de la valeur immobilière – omniscient, infatigable et adaptatif.

Nous sommes allés à la rencontre de notre équipe de data scientists ici à la FoncièreNumérique aux prises avec la réalité quotidienne du développement pour mieux comprendre les enjeux concrets et répercussions pour les professionnels de l’immobilier. En route pour notre laboratoire R&D ! Ci-après le portrait-robot d’une intelligence accélérée : incomprise, protéiforme et prometteuse.

Plan du dossier :

A. Intelligences artificielles : histoire et définition entre mirages, échecs et apprentissage
B. L’intelligence artificielle, la nouvelle business intelligence de l’immobilier ?
C. (Ré)apprendre à lire et compter : l’immobilier à la petite école du machine learning

A. Intelligences artificielles : histoire et définition entre mirages, échecs et apprentissage

Définitions et histoire. « Intelligence artificielle » :
par-delà l’oxymore
« Une machine peut-elle penser ? »
Des interrogations philosophiques aux premières expérimentations

L’intelligence des machines est-elle une « idée hérétique » ? C’est en répondant à cette question qu’Alan Turing a livré la première version de son fameux test pour évaluer la capacité d’un programme à imiter la conversation humaine.

Baptisée par John McCarthy dès 1955, l’intelligence artificielle est définie comme « la construction de programmes informatiques qui s’adonnent à des tâches qui sont, pour l’instant, accomplies de façon plus satisfaisante par des êtres humains car elles demandent des processus mentaux de haut niveau tels que : l’apprentissage perceptuel, l’organisation de la mémoire et le raisonnement critique » (Marvin Lee Minsky).

John McCarthy, Stanford

Dans cette quête d’un graal scientifique et mathématique, la recherche en IA s’est d’abord attelée au modèle ultime de l’intelligence dans son expression la plus noble et mathématique, à savoir le jeu (d’imitation du jeu) d’échecs : depuis le programme d’échecs balbutiant développé par John McCarthy écrit en langage Fortran (tournant années 50 et 60) jusqu’à Deep Blue, superordinateur en mesure d’anticiper 100 millions de positions par seconde, et vainqueur de Garry Kasparov.

Le périmètre de l’intelligence machine. Faiblesses, forces et malentendus

De plus en plus omniprésente, l’IA est tantôt qualifiée de « faible » ou de « forte ». Faible, elle l’est déjà lorsque se consacre à une tache au périmètre clairement prédéfini. Forte, elle le deviendra selon certains futurologues lorsqu’elle sera douée de conscience et en mesure de s’atteler à n’importe quel problème, y compris ceux qu’elle aura définis de son propre chef.

Le degré ultime de la force pour une IA dite « générale » sera atteint des lors que l’IA sera en mesure de se reprogrammer en s’améliorant elle-même de façon exponentielle, ou qui sait, en inventant un langage propre à elle-même qui demeurera impénétrable à l’intelligence humaine – peut-être à la manière des IA négociatrices développées et désactivées par Facebook qui prirent l’initiative de créer un langage artificiel ad hoc pour optimiser la communication entre elles ?

En attendant cette apocalypse ou apothéose que l’on nomme la « Singularité », comment faire le départ entre les multiples terminologies qui coexistent pour désigner l’intelligence artificielle ?

Un chapeau englobant pour une nébuleuse de termes et de réalités

Dès sa création, l’intelligence artificielle tente de mimer l’intelligence humaine par deux approches distinctes.

Dans la première approche, il est primordial d’identifier les règles et l’intelligence s’exerce dans la recherche des meilleures solutions qui respectent lesdites règles.

Dans la seconde approche, on a besoin de nombreux exemples qui vont constituer notre base d’apprentissage et l’intelligence advient lors de l’apprentissage à partir de cette base. D’où l’appellation de « machine learning » pour désigner ce sous-domaine de l’IA où les algorithmes apprennent en se nourrissant de bases de données sans avoir été programmés explicitement.

Parmi toutes les approches de machine learning se distingue plus spécifiquement le sous-domaine du « deep learning », où les modèles imitent le fonctionnement des réseaux neuronaux d’un cerveau humain. Voir schéma ci-dessous.

Pour donner un aperçu rapide des capacités du machine learning, parcourons trois types de problèmes résolus par l’apprentissage machine :

A. Intelligences artificielles : histoire et définition entre mirages, échecs et apprentissage

Quelles erreurs fait-on fréquemment lorsqu’on parle d’IA ? Le Pôle IA de La FoncièreNumérique décrypte.

« L’intelligence artificielle n’existe pas. »
Luc Julia, co-créateur de Siri

Direction le Pôle IA de La FoncièreNumérique pour en rencontrer sa responsable, Mahat Khelfallah et démêler les mirages de la réalité du développement :

« La principale erreur c’est de croire que l’IA est magique. C’est loin d’être le cas. L’intelligence artificielle, tout comme l’intelligence humaine, s’appuie sur des connaissances acquises soit sous forme de règles (à la base du raisonnement) ou bien sous forme d’exemples (tirés de l’expérience). »

Mahat Khelfallah, Responsable du Pôle IA

« Il faut être très prudent lorsque l’on parle d’IA. Pour un humain, apprendre à différencier et reconnaitre deux types nouveaux d’animaux est une formalité. Pour une machine il est nécessaire de créer un jeu d’entrainement colossal de ces deux espèces pour espérer que l’algorithme de classification puisse les différencier (et pas à 100% !). Pour l’anecdote récente et amusante, un algorithme de pilotage de caméra avec suivi de ballon de foot a confondu le ballon avec le crâne chauve d’un arbitre de ligne… Erreur compréhensible d’un point de vue machine, mais qu’un humain ne ferait jamais.

La différence majeure entre un humain et une intelligence artificielle est le pouvoir de généralisation et d’abstraction qui est extrêmement difficile pour une machine. Nous insistons tous les jours sur le fait que « l’IA n’est pas de la magie ». Derrière chaque problème résolu par une méthode d’apprentissage machine, il y a des années de recherche, des mathématiques extrêmement complexes, des milliers d’essais, des résultats explicables, d’autres non… Et bien entendu, si une tâche est difficile pour un humain expert dans le domaine, elle l’est tout autant pour un algorithme !
D’aucuns pensent qu’un jour le monde sera dominé par une IA post-singularité, alors qu’en réalité les plus éminents chercheurs peinent à différencier à coup sûr une photo de bateau d’une photo de grenouille.

En bref, l’erreur communément admise est de parler d’IA en ne pensant qu’au machine learning, qui englobe lui aussi le deep learning (les grands réseaux de neurones profonds). La seconde erreur, et la plus importante, est de penser que si une tâche est simple pour un humain alors elle est magiquement triviale pour une machine. En effet une machine n’a aucun a priori sur ce qu’elle traite. Enfin, même si on a une très bonne base d’apprentissage pour un problème donné (ce qui est très rare, ou très coûteux puisqu’il faut que des humains experts fassent ce travail), il est possible qu’aucune technique d’IA (au sens large) ne résolve le problème de manière satisfaisante. Le meilleur exemple est celui de la finance de marché : l’historique des cours de bourse est parfaitement connu, tout l’environnement décisionnel également (connaissance des M&A, des caractéristiques des CEO, lancements de produits, et de millions d’autres critères accessibles en temps réel parfaitement vérifiés) pourtant personne ne peut prévoir les variations de la bourse (et pourtant des ressources sont massivement investies dans ce champ de recherche). »

A. Intelligences artificielles : histoire et définition entre mirages, échecs et apprentissage

L’IA, enfant terrible des data sciences. Potentialités et réalités d’une intelligence accélérée

Applications contemporaines : l’IA transdisciplinaire

Cette surpuissance computationnelle a naturellement fait de l’intelligence artificielle un outil de choix pour le secteur de la banque et de finance : par exemple, des systèmes experts d’évaluation de risque (en l’occurrence, lié à l’octroi d’un crédit) ou encore le hedge fund Bridgewater Associates (portfolio de $170 milliards) qui utilise une IA opérationnelle nommée « Le Livre de l’avenir » qui agit comme un « GPS personnel » pour manager les équipes et aider à la prise de décision .

Ces dernières années ont vu l’intelligence artificielle s’émanciper de ces modèles purement computationnels pour conquérir ce qui apparaissait jusqu’à peu comme les forteresses inexpugnables de l’intelligence humaine : la créativité, l’art oratoire, la méthode scientifique. L’IA a déjà écrit son premier spot de pub pour Lexus , produit un avis argumenté sur les subventions des classes maternelles , développé son premier programme de recherche .

En octobre 2018, une équipe américaine du Massachusetts Institute of Technology a tenté d’apprendre le langage naturel à un robot par le biais d’analyseurs syntaxiques et sémantiques traitant des vidéos sous-titrées, et a remarqué que l’android apprend à la manière d’un enfant .

Enfant, l’IA l’est assurément depuis plusieurs décennies pour les générations de chercheurs qui ont tenté de lui inculquer les rudiments d’une éducation généraliste. Née en sachant compter, l’IA a successivement appris à lire, écrire, écouter, classer et … voir.

Mais l’enfant terrible des data sciences sait-il pour autant faire du business ? Curriculum in-progress de l’apprenant avec les regards croisés de nos collaborateurs du Pôle IA à La FoncièreNumérique.

« Dans quels domaines avez-vous pu appliquer l’intelligence artificielle par le passé ? »

« J’ai appliqué les techniques de l’IA dans des domaines différents et variés tels que la logistique pour la recherche de placements optimaux pour des objets dans un container, dans l’énergie pour la modélisation et l’optimisation de la consommation électrique, les Ressources Humaines pour le développement d’un système de recommandation de profils de candidats correspondant le mieux aux annonces de missions. »

Mahat Khelfallah, Responsable du Pôle IA, La FoncièreNumérique

Vente en ligne, santé, efficience énergétique comptent parmi les secteurs sur lesquels j’ai déjà eu l’occasion de travailler en IA. Dans le domaine de la vente en ligne, le vendeur devait uploader une image, et l’algorithme devait pouvoir identifier exactement de quel vêtement il s’agissait. Il s’agit d’un problème de classification d’image qu’il est courant de résoudre avec une approche de type réseau de neurones convolutionnels profond. Dans le secteur de la santé, je me suis penché sur la reconnaissance de tumeurs malignes pour le cancer de la prostate. En partant de l’ensemble de caractéristiques sur une tumeur, il fallait évaluer si elle était maligne ou non. Dans le champ de la transition environnementale, enjeu sociétal, économique et technologique de taille, j’ai pu travailler sur la prédiction de la consommation énergétique sur les bâtiments de Seattle aux Etats-Unis.

Clément Allain, Ingénieur IA, La FoncièreNumérique

Mes projets en intelligence artificielle m’ont amené à travailler sur des problématiques variés à travers plusieurs secteurs : l’analyse d’imagerie médicale (2D) pour recommander ou non des opérations chirurgicales, la prédiction du nombre de pièces automobiles à produire pour un fabriquant, l’utilisation de données LIDAR et de caméras pour concevoir un régulateur de vitesse adaptatif, la détection automatique de langue et l’analyse de textes pour leur attribuer plusieurs labels qui les décrivent, la classification de documents à partir d’images, la séparation de différents flux audio mélangés (voix et musique).

Thomas Boulet, Ingénieur IA, La FoncièreNumérique

Data warehouse vs. data lake: entre structure et liberté. quel paradigme pour le stockage de mes données ?

Data warehouse vs. data lake: entre structure et liberté. quel paradigme pour le stockage de mes données ?

L’entrepôt ou le lac de données : vous avez déjà entendu ces métaphores juxtaposées, parfois employées de façon quasi interchangeable pour désigner deux modes de stockage et de traitement de données. Mais quelles différences fondatrices entre ces deux paradigmes quant aux utilisateurs, aux usages et types de données concernées ?

La structure vs. La liberté : deux paradigmes de stockage, deux avenirs possibles pour le traitement des données
Les data lakes sont utilisés pour le stockage rentable de grandes quantités de données provenant de nombreuses sources hétérogènes : IoT, flux de médias sociaux en temps réel, données utilisateur et transactions d’applications Web.

Data warehouse
Data lake
Type de données
Données historiques qui ont été structurées pour s’adapter à un schéma de base de données relationnelle
Données non structurées et structurées provenant de diverses sources de données d’entreprise
Utilisateurs
Consultants
Data scientists et ingénieurs
Utilisation
Requêtes généralement en lecture seule pour agréger et résumer les données
Stockage des données et des analyses de données volumineuses, pour le deep learning et l’analyse en temps réel
Taille
Stocke uniquement les données pertinentes pour l’analyse
Stocke toutes les données qui peuvent être utilisées – peuvent prendre des pétaoctets !
Accessibilité
Accès moins aisé du fait de la rigidité de la solution
Accès facile et souple avec possibilité d’effectuer des mises à jour rapides

Les réponses aux questions d’hier vs. Les questions ouvertes sur les modèles de demain
Les données structurées de la data warehouse sont plus faciles à analyser car elles sont plus propres et disposent d’un schéma uniforme à partir duquel effectuer des requêtes.

En revanche, la structure se gagne au prix de la liberté et de l’évolutivité.

Les datalakes absorbent des données de n’importe quelle structure, sans que celles-ci n’aient besoin de s’adapter à un schéma spécifique et pré-défini, ce qui est le plus adapté pour le machine learning et deep learning.

Les data warehouses sont très efficaces pour analyser les données historiques pour des décisions de données spécifiques, mais ne sont pas recommandées pour qui souhaite innover en profondeur en parsant les données avec des modèles novateurs.

Opter pour un modèle « future-proof » ?
Si vous souhaitez obtenir des réponses rapides à des questions relativement classiques sans faire appel à l’analyse en temps réel, la data warehouse vous donnera la solution la plus facile à implémenter.

Si vous souhaitez faire un investissement d’avenir dans un mode de stockage souple et évolutif qui saura s’adapter aux mutations rapides du machine learning pour découvrir des modes d’exploration et d’analyse de données inédits, le data lake est l’option pour vous.