Les notaires ont courageusement ouvert leur coffre aux trésors début 2019, emportés par la vague de l’open data, en rendant publiques 5 années de transactions immobilières détaillées mais anonymisées. C’est une très bonne nouvelle pour tous les particuliers à la recherche d’informations pour mieux évaluer les prix immobiliers. Mais ils auront très probablement encore besoin des professionnels malgré tout car les données sont loin d’être simples à exploiter.

Vous pensez que les notaires sont des gens sérieux et que les données qu’ils mettent à disposition sont fiables ? C’est globalement vrai, mais malheureusement faux dans le détail. Comment ça ? Et bien, dans ce trésor, on trouve par exemple des pépites de ce type : une maison de 89 m2 avec un terrain de 273 m2 vendue en 2018 dans la région Nord à un prix mirifique dépassant les 100 M€ ! Certainement une belle plus-value à la clé pour le vendeur. Mais plus probablement, à moins que le terrain ne recouvre des ressources naturelles convoitées, il s’agit tout simplement d’une erreur de saisie de la part du notaire ayant transmis l’information.

Bon, vous me direz qu’il ne s’agit là que d’un exemple isolé. Certes. Mais, en tant que professionnels cherchant à fournir des informations de prix les plus fiables possibles à nos utilisateurs, vous pensez bien que nous avons creusé de manière systématique le sujet. Résultat des courses : nous avons exclu plusieurs milliers de transactions fortement « douteuses » (nous faisons l’hypothèse que les mines d’or cachées dans les terrains sont rares en France). Ah oui, tout de même ! Ce travail de nettoyage, minutieux et relativement technique à conduire, est essentiel pour éviter de présenter des évaluations de prix biaisées par ces erreurs.

Ce billet ne vise certainement pas à se moquer des notaires, car des erreurs de saisie sont vite arrivées. Mais peut-être que quelques règles de vérification générant des alertes en cas de valeurs anormales permettraient de limiter ce genre de merveilles. La transaction électronique des données rend l’automatisation de ces règles tout à fait possible.

Ce que tout ceci met en exergue est que l’open data nécessite davantage de contrôles sur les données en entrée. L’open data est une avancée extrêmement utiles pour les particuliers, et les professionnels ont énormément à apporter pour rendre ces données fiables et exploitables. Nous nous y attachons.