Base de données MNIST
La base de données MNIST pour Modified ou Mixed National Institute of Standards and Technology, est une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en apprentissage automatique[1].
La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenue un test standard[1]. Elle regroupe 60000 images d'apprentissage et 10000 images de test, issues d'une base de données antérieure, appelée simplement NIST[1]. Ce sont des images en noir et blanc, normalisées centrées de 28 pixels de côté[1].
Historique
En 2018 un groupe de chercheurs annonce un taux d'erreur de 0,18%, améliorant le meilleur résultat précédent, en utilisant Random Multimodel Deep Learning (RMDL)[2].
Articles connexes
Notes et références
- L. Deng, « The MNIST Database of Handwritten Digit Images for Machine Learning Research (Best of the Web) », IEEE Signal Processing Magazine, vol. 29, no 6, , p. 141-142 (ISSN 1053-5888, DOI 10.1109/MSP.2012.2211477)
- Kamran Kowsari, Mojtaba Heidarysafa, Donald E. Brown, Kiana Jafari Meimandi et Laura E. Barnes, « RMDL: Random Multimodel Deep Learning for Classification », sur arXiv.org e-Print archive, (arXiv 1805.01890, consulté le )
Liens externes
- Yann LeCun, Corinna Cortes et Chris Burges, « MNIST handwritten digit database », page de la base de données
- Martial Bornet, « Visualisation des chiffres de la base MNIST », ensembles d'images des chiffres manuscrits de la base MNIST
- Portail de l'informatique théorique
- Portail des données