Que serait devenue la Gameboy sans Tetris, la Wii sans la Wiifit, Windows sans la suite Office et Facebook sans la messagerie instantanée ? Chaque plate-forme a construit son succès sur une application qui justifiait à elle seule son achat ou son adoption, la killer app. Où sont les killer apps nées de l’open data ? Derrière cette question lancinante, répétée à l’envi depuis les premières heures du mouvement, se dissimule un profond malentendu concernant la valeur réelle de l’open data. Comme si le seul modèle économique de l’ouverture des données résidait dans la création d’applications mobiles révolutionnaires. Cet article a été publié dans le livre Open Models, les business models de l’économie ouverte.
Battons joyeusement notre coulpe : cette vision biaisée est en partie le fait des acteurs de l’open data eux-mêmes. Afin d’en faciliter la pédagogie, ils se sont empressés de décrire un modèle à sens unique, qui descendrait naturellement du producteur de données aux développeurs d’applications mobiles réutilisant ces données.
Mais avec le recul et quelques années de maturité, il est désormais aisé de constater que la viabilité économique des applications mobiles est plus souvent l’exception que la règle. Et que les modèles économiques de l’open data résident le plus souvent dans les plates-formes de services qui organisent la rencontre entre producteurs et réutilisateurs de données ouvertes.
Ce modèle est certainement moins attrayant que la promesse de la killer application. Mais il est aussi infiniment plus robuste et réaliste. Nous proposons d’en explorer ici les fondements.
Redéfinir la « valeur » des données : du stock vers le flux
En tant que bien immatériel non rival qu’on peut dupliquer à l’infini, la donnée n’a pas de véritable valeur en soi. Si un développeur ou un data center consomme une donnée supplémentaire, cet usage n’impliquera pas la suppression d’une unité supplémentaire. Bien au contraire : la réutilisation d’une donnée en crée de nouvelles – les fameuses « métadonnées » ou « données de la donnée ».
La valeur de la donnée se décuple donc dans le flux et dans l’échange plutôt que dans le stock et l’accumulation. Et c’est logiquement sur l’orchestration de ce flux que les nouveaux intermédiaires de l’open data positionnent leurs modèles économiques.
La montée en puissance des intermédiaires
Le fantasme de la killer app de l’open data repose sur une vision simpliste de la relation producteur/consommateur de données, et de la nature du flux qui les unit. Il laisse croire que ce flux est à sens unique et unilatéral entre deux parties, occultant complètement le socle technique qui conditionne les réutilisations. Or, ce maillon intermédiaire est de plus en plus essentiel dans la chaîne de valeur. Ces plates-formes de services qui se placent entre le producteur et le réutilisateur consolident et accélèrent le potentiel d’innovation des données ouvertes en simplifiant leur accès, leur transformation et leur consommation.
Voire plus encore puisquel’économie de ces plates-formes intermédiaires donne également l’occasion à un producteur de données d’intégrer à son tour de la donnée enrichie, croisée et transformée. On parle alors de « boucle de rétroaction » ou feedback loop. La frontière producteurs et utilisateurs de données devient alors poreuse, floue, en même temps que l’intermédiaire se pose comme un élément incontournable de l’écosystème.
La prévalence du modèle freemium : comment concilier gratuité de la donnée et économie des plates-formes ?
Les plates-formes de services intermédiaires construites à partir de l’open data sont orientées vers le producteur et/ou le réutilisateur. Auprès du producteur, elles simplifient la publication et incitent à l’usage, en travaillant notamment l’interopérabilité des formats. Et côté réutilisateur, elles offrent une panoplie de services qui optimisent la consommation de données (standardisation des données, API, hébergement sur le cloud, customisation, etc.).
Si plusieurs modèles d’affaires co-existent, le freemium tient le haut du pavé. Ce modèle repose sur la combinaison de deux offres : la première, gratuite, propose à l’utilisateur d’accéder aux données avec des services restreints. Mais dès lors qu’il souhaite élargir cette offre de services, il doit souscrire à l’offre payante. Le basculement d’un palier à l’autre se fait en fonction de plusieurs critères fonctionnels, tels que le volume de consommation des données, le stockage dans le cloud ou les services associés dont dépendent le support (API, customisation ou services de data science par exemple).
Dans le modèle freemium, la donnée est gratuite tandis que le service est payant. Pourquoi ? Parce que le véritable coût de l’open data réside dans les architectures techniques qui soutiennent le positionnement des intermédiaires et facilitent le flux de données, leur circulation, leur transformation et leur stockage pour des réutilisations constantes. Le modèle freemium s’accommode donc parfaitement de la culture de gratuité de l’open data, mais également aux architectures techniques qui rendent possibles les montées en charge (« scalabilité »).
Tentons à présent d’esquisser une typologie plus fine des différentes plates-formes intermédiaires appartenant à cette grande et belle famille freemium. On peut en effet distinguer trois grandes catégories :
- MapBox : le freemium à fonctionnalités variées
MapBox est un fournisseur de services cartographiques construit sur les données ouvertes de OpenStreetMap. L’intérêt de ce service réside dans l’ajout d’une couche de design cartographique et d’outils (software development kit, customisation des cartes, API, hébergement dans le cloud, etc.) au-dessus des données brutes d’OpenStreetMap, permettant de développer, d’héberger et d’assurer la “scalabilité” de cartes publiées en version web ou mobile.
Au-delà de l’offre gratuite, plusieurs plans tarifaires sont proposés selon le nombre de vues sur les cartes (déterminées par les requêtes dans l’API) et le volume de stockage dans les data centers de MapBox. Dans ce modèle, l’utilisateur paie pour la consommation des architectures techniques.
- OpenCorporates : le freemium fondé sur les finalités d’usage
OpenCorporates est une start-up britannique, incubée à l’Open Data Institute, centralisant les informations publiques de plus de 77 millions d’entreprises dans le monde. Ce service propose une API qui permet de naviguer dans ces données (adresse, données comptables, etc.) et d’en faire des analyses sectorielles.
Pour éviter la privatisation de données ouvertes après leur traitement, OpenCorporates a recours à un modèle fondé sur la finalité plutôt que sur la consommation : l’accès aux données est gratuit pour des projets respectant le partage à l’identité (share-alike) en maintenant donc ouvertes les données d’OpenCorporates qu’ils auraient enrichies. En revanche, si le projet s’inscrit dans une volonté de refermer les données sous une licence commerciale, une fois passée leur utilisation, leur croisement et leur enrichissement, le service devient payant.
OpenCorporate reprend ainsi le principe de la double licence cher à l’open source. Comme le souligne Jeni Tennison, Chief Technical Officer de l’Open Data Institute, ce modèle peut aussi se décliner selon le chiffre d’affaires ou la part de marché du réutilisateur.
- Enigma.io : le freemium comme cheval de troie
Enigma.io est une plate-forme de recherche et de consommation de données ouvertes. Enigma.io obtient des données auprès des agences fédérales américaines et des entreprises. La plate-forme distribue aujourd’hui plus de données publiques que le gouvernement américain lui-même, qu’il s’agisse des obtentions de visa, de l’historique des incendies ou encore des cargaisons présentes dans le port de New York. Enigma.io offre ainsi un accès à des jeux de données structurés avec un socle de services associés (recherche facilitée et ciblée, accès par API, etc.).
Enigma.io va plus loin en utilisant le freemium comme une vitrine de son savoir-faire en data science pour proposer des services ad hoc qui ne sont pas directement liés à la plate-forme. Dans ce cas, le freemium agit en réalité comme un cheval de Troie, à savoir une démonstration puissante des compétences de l’équipe qui vend son expertise en analyse de données, en s’adressant à des segments spécifique du marché. C’est le cas du secteur de l’assurance : Enigma.io propose ainsi de modéliser et d’anticiper des risques à partir des données historiques des incendies compilées dans la plate-forme
En 2009 déjà, Chris Anderson […] montrait que la présence de la gratuité ne signifiait pas l’absence de modèles économiques
Si d’autres modèles auraient pu être présentés, la prévalence du modèle freemium et sa capacité ingénieuse à concilier gratuité de la donnée et vente d’un service en font un excellent indicateur de la vraie « valeur » de l’open data, résidant dans le flux plutôt que dans le stock.
En 2009 déjà, Chris Anderson, auteur du livre Free: The Future of a Radical Price, montrait que la présence de la gratuité ne signifiait pas l’absence de modèles économiques, bien au contraire. D’autant que l’abondance des données et des biens immatériels en général crée dans son sillage une nouvelle rareté, qui réside non pas dans la possession du bien, mais dans le savoir-faire acquis dans son exploitation.
L’organisation du flux, l’harmonisation des jeux de données et la création de services associés comme les data sciences, se posent comme des modèles économiques viables. C’est peut-être aussi, pour les producteurs de données en quête de modèles d’affaires, l’occasion de penser de nouvelles offres, en s’inspirant des intermédiaires issus d’un « trou » dans la chaîne entre producteurs et réutilisateurs.