OpenRefine
OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.
Développé par | Google, Metaweb (en) et Antonin Delpeuch (d) |
---|---|
Première version | |
Dernière version | 3.6.1 ()[1] |
Dépôt | github.com/OpenRefine/OpenRefine |
Assurance qualité | Revue de code et intégration continue |
Écrit en | Java et JavaScript |
Système d'exploitation | Microsoft Windows, macOS et Linux |
Formats lus | TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation et Notation3 |
Langues | Anglais, italien, langues chinoises, japonais et français |
Type |
Outil de Wikidata (d) Open source (en) |
Licence | Licence BSD |
Site web | openrefine.org |
Historique
Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.
Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].
Le , Google a racheté la société Metaweb[3].
Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].
En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.
En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].
Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].
Fonctionnalités
- Nettoyage de données.
- Manipulation de données, d'un format à un autre.
- Moissonnage de données d'un site web.
- Ajout de données depuis un service web.
- Alignement avec une Wikibase (dont Wikidata).
Références
- (en) « OpenRefine v3.6.1 » (consulté le )
- (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur https://freebase-gridworks.blogspot.com, (consulté le ).
- (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur https://googleblog.blogspot.com, Google, (consulté le ).
- (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur https://opensource.googleblog.com, Google, (consulté le ).
- (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur https://openrefine.org/blog, (consulté le ).
- (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science » [html], sur https://openrefine.org/blog, (consulté le ).
Voir aussi
Bibliographie
- (en) Kelli Ham, « OpenRefine (version 2.5). http://openrefine.org. Free, open-source tool for cleaning and transforming data », Journal of the Medical Library Association, University Library System, University of Pittsburgh (d), vol. 101, no 3, , p. 233-234 (ISSN 1536-5050 et 1558-9439, OCLC 47728400, PMCID 3738091, DOI 10.3163/1536-5050.101.3.020)
Articles connexes
Liens externes
- (en) Site officiel
- (en) « Manuel sur la page de la School of data de l'Open Knowledge Foundation », sur schoolofdata.org (consulté le )
- « #36 - OpenRefine, "Excel aux hormones" pour nettoyage de données - Patrimoine et numérique » (consulté le )
- Dépôt du code source
- Portail du logiciel
- Portail des probabilités et de la statistique
- Portail des logiciels libres