Karen Spärck Jones
Karen Spärck Jones née le à Huddersfield et décédée le 4 avril 2007 est une scientifique britannique, chercheuse en informatique. Ses travaux concernent le domaine de l'intelligence artificielle, et principalement le traitement automatique du langage naturel et la recherche d'information.
Naissance |
Huddersfield, Yorkshire de l'Ouest |
---|---|
Décès |
Willingham, Cambridgeshire |
Nationalité | Royaume-Uni |
Domaines | Informatique |
---|---|
Institutions | Université de Cambridge |
Renommé pour | schémas probabilistes de recherche textuelle et documentaire |
Distinctions | ACL Lifetime Achievement Award, BCS Lovelace Medal, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit |
Site | www.cl.cam.ac.uk/archive/ksj21 |
Compléments
Épouse de Roger Needham
Biographie
Karen Spärck Jones est la fille de Owen Jones, maître de conférence (lecturer) en chimie, et Ida Spärck, une Norvégienne ayant déménagé en Grande-Bretagne durant la Seconde Guerre mondiale. Spärck Jones a fait ses études dans un lycée (grammar school) puis au Girton College de Cambridge de 1953 à 1956 où elle étudie l’histoire puis la philosophie. Elle y rencontre la responsable de l’Unité de recherche linguistique de Cambridge, Margaret Masterman, avec qui elle travaille pour faire comprendre aux ordinateurs le langage humain. Son travail établit la base des moteurs de recherche comme Google.
Son article publié en 1964 Classification de la synonymie et sémantique est désormais considéré comme un document fondamental dans le domaine du traitement du langage naturel[1].
En 1972, elle publie dans Journal of Documentation un article qui donne les bases des moteurs de recherche en combinant les statistiques et la linguistique et qui indique de quelles manières les ordinateurs interprètent les relations entre les mots[1]. Il s'agit d'une pondération par « spécificité de terme » dans une recherche d'information, ultérieurement dénommée « fréquence de document inverse » (FDI). L'intuition de cette méthode est qu'un mot apparaissant dans de nombreux documents n'est pas un discriminateur valable. Ce concept est utilisé aujourd'hui dans la plupart des moteurs de recherche, le plus souvent dans le cadre de la méthode TF-IDF[2].
- « La spécificité d'un terme peut être quantifiée comme une fonction inverse du nombre de documents dans lesquels il apparaît. » — K. Spärck[3]
À partir de 1974, elle travaille au laboratoire d'informatique de l'université de Cambridge. Dans les années 1980, elle travaille sur les systèmes de reconnaissance vocale précoce. En 1982, le gouvernement britannique lui demande de travailler sur le programme Alvey, un programme visant à promouvoir les recherches en informatique. En 1993, elle co-écrit avec Julia Galliers un article sur les systèmes de traitement du langage naturel. Elle obtient le poste de professeure d'informatique et information à l'université de Cambridge en 1999. Elle prend sa retraite en 2002.
Elle indique que « L'informatique est trop importante pour être laissée aux hommes »[1].
Karen Spärck Jones est mariée au chercheur en informatique, pionnier de la sécurité logicielle, Roger Needham (1935-2003).
Prix et distinctions
Karen Spärck Jones a reçu plusieurs prix et distinctions[4] au cours de sa carrière, dont :
- 1988 : prix Gérard Salton de l'ACM SIGIR
- 2004 : prix de l'ACL
- 2006 : prix Allen Newell de l'ACM/AAAI
- 2007 : médaille Lovelace de la British Computer Society
Hommage
Microsoft et la British Computer Society (décernent conjointement le BCS IRSG Karen Spärck Jones Award[5] depuis 2009 pour récompenser les découvertes dans l'amélioration de la recherche d'information et le traitement du langage naturel.
Publications
- Karen Spärck Jones, « A statistical interpretation of term specificity and its application in retrieval », Journal of Documentation, vol. 28, no 1, , p. 11–21 (DOI 10.1108/eb026526, lire en ligne)
Références et notes
- (en-US) « Overlooked No More: Karen Sparck Jones, Who Established the Basis for Search Engines », The New York Times, (ISSN 0362-4331, lire en ligne, consulté le )
- (en) Stephen Robertson, « Understanding Inverse Document Frequency: On theoretical arguments for IDF », Journal of Documentation, vol. 60, no 5, , p. 503–520 (ISSN 0022-0418, DOI 10.1108/00220410410560582, lire en ligne).
- Traduction libre de « The specificity of a term can be quantified as an inverse function of the number of documents in which it occurs. » extrait de Spärck Jones, K. (1972). « A Statistical Interpretation of Term Specificity and Its Application in Retrieval », Journal of Documentation, 28: 11–21. CiteSeerX 10.1.1.115.8343. doi:10.1108/eb026526
- (en) Stephen Robertson et Peter Willett, « In memoriam: Karen Spärck Jones », sur Journal of Documentation (DOI 10.1108/jd.2007.27863eaa.001, consulté le )
- « KSJ Award », sur irsg.bcs.org (consulté le )
Liens externes
- Notices d'autorité :
- Fichier d’autorité international virtuel
- International Standard Name Identifier
- Bibliothèque nationale de France (données)
- Système universitaire de documentation
- Bibliothèque du Congrès
- Gemeinsame Normdatei
- Bibliothèque nationale d’Espagne
- Bibliothèque royale des Pays-Bas
- Bibliothèque nationale de Pologne
- Bibliothèque nationale de Pologne
- Bibliothèque nationale d’Israël
- Bibliothèque universitaire de Pologne
- Bibliothèque nationale de Suède
- Bibliothèque nationale d’Australie
- Bibliothèque nationale tchèque
- Bibliothèque nationale de Grèce
- WorldCat
- http://spectrum.ieee.org/geek-life/profiles/computer-science-a-womans-work
- Portail de l’informatique
- Portail du Royaume-Uni