Base de données MNIST

La base de données MNIST pour Modified ou Mixed National Institute of Standards and Technology, est une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en apprentissage automatique[1].

Base de données MNIST
Typologie
Sujet principal
Scripte (en), chiffres arabes
Diffusion
Site web
Un exemple de chiffres de la base MNIST.

La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenue un test standard[1]. Elle regroupe 60000 images d'apprentissage et 10000 images de test, issues d'une base de données antérieure, appelée simplement NIST[1]. Ce sont des images en noir et blanc, normalisées centrées de 28 pixels de côté[1].

Historique

En 2018 un groupe de chercheurs annonce un taux d'erreur de 0,18%, améliorant le meilleur résultat précédent, en utilisant Random Multimodel Deep Learning (RMDL)[2].

Articles connexes

Notes et références

  1. L. Deng, « The MNIST Database of Handwritten Digit Images for Machine Learning Research (Best of the Web) », IEEE Signal Processing Magazine, vol. 29, no 6, , p. 141-142 (ISSN 1053-5888, DOI 10.1109/MSP.2012.2211477)
  2. Kamran Kowsari, Mojtaba Heidarysafa, Donald E. Brown, Kiana Jafari Meimandi et Laura E. Barnes, « RMDL: Random Multimodel Deep Learning for Classification », sur arXiv.org e-Print archive, (arXiv 1805.01890, consulté le )

Liens externes

  • Portail de l'informatique théorique
  • Portail des données
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.