Thibaut SOULARD; Fatiha SAÏS et al. – Étude de transférabilité de clés pour un liage explicable de données entre graphes de connaissances
Le liage de données dans les graphes de connaissances est un problème crucial et de longue date ; il consiste à déterminer des liens d’identité entre les descriptions des entités de deux graphes désignant une même entité du monde réel (e.g., même personne, même livre, même protéine). Les clés, qui sont des sous-ensembles de propriétés permettant d’identifier chaque instance dans un graphe, sont des éléments importants pour la découverte de ces liens d’identité. L’approche classique de liage de données fondée sur les clés consiste à découvrir un ensemble de clés dans chaque graphe, et d’appliquer ensuite une procédure de fusion des ensembles de clés obtenues. Cependant, cette approche peut conduire à la réduction du nombre de clés valides dans les deux graphes et peut parfois être très coûteuse en temps de calcul. Nous proposons dans ce travail une nouvelle approche de liage de données fondée sur le transfert de clés découvertes sur un graphe source vers un graphe cible impliqué dans la tâche de liage de données. Ce transfert s’appuie sur un alignement de propriétés connues a priori et sur le calcul de métriques permettant de valider la qualité des clés transférées vers le graphe cible. Nous avons conduit des expérimentations sur plusieurs jeux de données extraits du web de données (DBpedia, Wikidata et YAGO) afin d’évaluer la qualité du liage de données et le gain en temps de calcul obtenu grâce au transfert de clés.
mars 1, 2026
Aller à la source
Author: