¡Esta es una revisión vieja del documento!
Natural Language Processing
Inicio
Vocabulario
Bigrams, pares de palabras que aparecen juntas en un texto. Por ejemplo para “more is said than done” serían [more is], [is said], [said than] y [than done].
Collocation, pareja de palabras que aparecen juntas a menudo pero no demasiado, “vino tinto” lo es, “el vino”.
Corpus, conjunto de textos.
Hapaxe, palabra que únicamente aparece una vez en el texto.
Homónimos, lemas que se escriben igual pero con distinto significado.
Léxico, palabras (lexicones) con alguna relación. Por ejemplo el léxico de un texto es su vocabulario, siendo el lexema (o lema o headword) la raíz de dichas palabras y relación.
Semántica, significado de una palabra.
Stopword
Synset, viene de set de sinónimos, es decir, conjunto de sinónimos.
Notas
Recursos