OpenRefine

OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.

OpenRefine
Informations
Développé par Google, Metaweb (en) et Antonin Delpeuch (d)
Première version
Dernière version 3.6.1 ()[1]
Dépôt github.com/OpenRefine/OpenRefine
Assurance qualité Revue de code et intégration continue
Écrit en Java et JavaScript
Système d'exploitation Microsoft Windows, macOS et Linux
Formats lus TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation et Notation3
Langues Anglais, italien, langues chinoises, japonais et français
Type Outil de Wikidata (d)
Open source (en)
Licence Licence BSD
Site web openrefine.org

Historique

Ancien logo de Google Refine
Nouveau logo

Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.

Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].

Le , Google a racheté la société Metaweb[3].

Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].

En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.

En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].

Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].

Fonctionnalités

  • Nettoyage de données.
  • Manipulation de données, d'un format à un autre.
  • Moissonnage de données d'un site web.
  • Ajout de données depuis un service web.
  • Alignement avec une Wikibase (dont Wikidata).

Références

  1. (en) « OpenRefine v3.6.1 » (consulté le )
  2. (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur https://freebase-gridworks.blogspot.com, (consulté le ).
  3. (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur https://googleblog.blogspot.com, Google, (consulté le ).
  4. (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur https://opensource.googleblog.com, Google, (consulté le ).
  5. (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur https://openrefine.org/blog, (consulté le ).
  6. (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science » [html], sur https://openrefine.org/blog, (consulté le ).

Voir aussi

Bibliographie

Articles connexes

Liens externes

  • Portail du logiciel
  • Portail des probabilités et de la statistique
  • Portail des logiciels libres
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.