Où trouver les mégadonnées?

Jean-Francois Parent
2018-01-15 13:15:00

Le monde juridique n'y échappe pas : que ce soit pour l'analyse jurisprudentielle ou les transactions de fusions-acquisitions, les avancées sont notoires, relève le magazine Law.com.
Mais pour voir la forêt au-delà des arbres, encore faut-il alimenter la machine de suffisamment de données pour rendre l'exercice pertinent. Et lorsqu'il est question de mesurer des variables telles le rendement sur investissement d'un avocat affecté à un dossier, ou le coût d'acquisition de nouveaux clients, les cabinets se heurtent à un mur.
Les données permettant de se mesurer par rapport à la moyenne de l'industrie, par exemple, ne sont pas vraiment disponibles. Même s'ils peuvent tirer profit d'une analyse chiffrée de leur modèle d'affaires, et de se mesurer à la concurrence, les cabinets refusent de divulguer leurs chiffres relatifs aux coûts de leurs services.
Le hic, c'est qu'il n'y a aucune raison pour un cabinet ou un service juridique de dévoiler combien il achète ou vend des services. À moins qu'il n'y ait un profit à en tirer.
C'est pourquoi les grandes boîtes d'analytiques d'affaires dépensent des millions de dollars afin de constituer leurs propres bases de données, qui serviront à mesurer les tendances de l'industrie.
Et lorsqu'il est question de l'industrie juridique, il est préférable de compiler ses propres séries de données plutôt que d'acheter ce qu'il y a sur le marché, où l'on ne trouve que des produits plutôt décevants, peut-on lire dans Law.com.
À l'aide d'outils d'apprentissage-machine et d'algorithmes permettant le forage de données qui colligent toute l'information rendue publique, qu'elle se trouve dans les documents réglementaires soumis aux autorités boursières, dans les communiqués de presse oui dans les médias d'information, les données seront identifiées par la technologie.
Une fois qu'on a une base relativement complète d'information stratégique, on a une monnaie d'échange servant à obtenir l'accès au données des cabinets privés.
Et c'est ainsi que des sociétés d'analytiques comme Brightflag se constituent des bases de données qu'elles pourront revendre. Brightflag a ainsi compilé un outil permettant de mesurer l'efficacité et la conformité de la facturation, ayant colligé des factures d'honoraires pour un total de plus de 100 milliards de dollars.
D'autres obstacles inhibent la collection de données industrielles et commerciales. Les obtenir par le biais d'échange ou en les récoltant auprès de sources publiques n'est parfois pas si facile. Tant les médias que les réseaux sociaux cherchent eux aussi à monnayer les données qu'ils amassent. LinkedIn, par exemple, a récemment intenté une action contre une firme d'analytique afin de l'empêcher de forer les données—publiques—de ses usagers.
La demande logée contre la société techno hiQ, qui est toujours devant les tribunaux, pourraient baliser la façon dont la collecte de données se fait à l'avenir.
Dans le cas précis de LinkedIn, les tribunaux auront à trancher : si LinkedIn laisse Google forer ses données, parce que cela lui apporte du trafic web, pourquoi les entreprises ne pourraient-elles pas elles aussi forer LinkedIn?, demande Law.com.