¡Esta es una revisión vieja del documento!
Natural Language Processing
Inicio
Vocabulario
Bigrams, pares de palabras que aparecen juntas en un texto. Por ejemplo para […] more is said than done […] serían [more is], [is said], [said than] y [than done].
Collocation, pareja de palabras que aparecen juntas a menudo pero no demasiado, “vino tinto” lo es, “el vino”.
Corpus
Hapaxe, palabra que únicamente aparece una vez en el texto.