Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
|
ai:nlp [2011/09/22 09:14] alfred |
ai:nlp [2020/05/09 09:25] (actual) |
||
|---|---|---|---|
| Línea 1: | Línea 1: | ||
| ====== Natural Language Processing ====== | ====== Natural Language Processing ====== | ||
| ===== Inicio ===== | ===== Inicio ===== | ||
| + | |||
| + | |||
| + | |||
| + | |||
| ==== Vocabulario ==== | ==== Vocabulario ==== | ||
| - | * **Bigrams**, pares de palabras que aparecen juntas en un texto. Por ejemplo para ''[...] more is said than done [...]'' serían [more is], [is said], [said than] y [than done]. | + | * **Bigrams**, pares de palabras que aparecen juntas en un texto. Por ejemplo para "//more is said than done//" serían [more is], [is said], [said than] y [than done]. |
| - | * **Collocation**, pareja de palabras que aparecen juntas a menudo pero no demasiado, "vino tinto" lo es, "el vino". | + | * **Collocation**, pareja de palabras que aparecen juntas a menudo pero no demasiado, "vino tinto" lo es, "el vino" no (un nombre y un apellido también lo serían). |
| - | * **Corpus** | + | * **Corpus**, conjunto de textos. |
| * **Hapaxe**, palabra que únicamente aparece una vez en el texto. | * **Hapaxe**, palabra que únicamente aparece una vez en el texto. | ||
| + | * **Homónimos**, lemas que se escriben igual pero con distinto significado. | ||
| + | * **Léxico**, palabras (lexicones) con alguna relación. Por ejemplo el léxico de un texto es su vocabulario, siendo el **lexema** (o **lema** o **headword**) la raíz de dichas palabras y relación. | ||
| + | * **Semántica**, significado de una palabra. | ||
| + | * **Stopword** | ||
| + | * **Synset**, viene de //set de sinónimos//, es decir, conjunto de sinónimos. | ||
| + | |||
| + | ===== Notas ===== | ||
| + | ==== Recursos ==== | ||
| + | * {{ai:nlp:texts_test.zip|Textos de ejemplo}}. | ||