14046 shaares
Lors de son adoption en janvier en première lecture à l’Assemblée Nationale, le projet de loi pour une République numérique a été amendé par l’article 18 bis prévoyant une exception au droit d’auteur pour les projets scientifiques d’extraction de texte et de données (Text and data mining ou TDM) financés par la recherche publique.
Le TDM constitue une pratique indispensable pour faire de l’information un bien commun circulant et s’assurer que les connaissances contenues dans les textes puissent circuler indépendamment de leur expression originale, soumise à protection. Le développement de Wikidata, le « Wikipédia des données », est appelé à reposer de plus en plus sur des procédures d’extraction automatisées garantissant la transformation des écrits scientifiques en séries de données structurées. Grâce à une exception adoptée au Royaume-Uni, le projet ContentMine ambitionne de réunir des centaines de millions de «faits » extraits de corpus scientifiques et de les déposer dans le domaine public (en licence Creative Commons « Zéro » CC0).
Le TDM constitue une pratique indispensable pour faire de l’information un bien commun circulant et s’assurer que les connaissances contenues dans les textes puissent circuler indépendamment de leur expression originale, soumise à protection. Le développement de Wikidata, le « Wikipédia des données », est appelé à reposer de plus en plus sur des procédures d’extraction automatisées garantissant la transformation des écrits scientifiques en séries de données structurées. Grâce à une exception adoptée au Royaume-Uni, le projet ContentMine ambitionne de réunir des centaines de millions de «faits » extraits de corpus scientifiques et de les déposer dans le domaine public (en licence Creative Commons « Zéro » CC0).