![]() |
||||
Le corpus A l'instar du British National Corpus (BNC), un corpus a été établi pour les textes de vulgarisation scientifique tirés de diverses sources dont la BBC, CNN, et New Scientist. Le corpus contient 100 000 mots dans 150 textes. L'analyse statistique de ce corpus donne des résultats similaires à ceux du BNC, avec une liste de 150 mots courants qui constituent environ 50% des mots dans un texte. L'article défini, à lui seul, représente 6% des mots du corpus. Tableau des mots les plus utilisés dans les textes du corpus : |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
LEGENDE :
|