====== Natural Language Processing ====== ===== Inicio ===== ==== Vocabulario ==== * **Bigrams**, pares de palabras que aparecen juntas en un texto. Por ejemplo para "//more is said than done//" serían [more is], [is said], [said than] y [than done]. * **Collocation**, pareja de palabras que aparecen juntas a menudo pero no demasiado, "vino tinto" lo es, "el vino" no (un nombre y un apellido también lo serían). * **Corpus**, conjunto de textos. * **Hapaxe**, palabra que únicamente aparece una vez en el texto. * **Homónimos**, lemas que se escriben igual pero con distinto significado. * **Léxico**, palabras (lexicones) con alguna relación. Por ejemplo el léxico de un texto es su vocabulario, siendo el **lexema** (o **lema** o **headword**) la raíz de dichas palabras y relación. * **Semántica**, significado de una palabra. * **Stopword** * **Synset**, viene de //set de sinónimos//, es decir, conjunto de sinónimos. ===== Notas ===== ==== Recursos ==== * {{ai:nlp:texts_test.zip|Textos de ejemplo}}.