La ontología Wordnet

La ontología Wordnet fue creada por el Cognitive Science Laboratory de la Universidad de Princeton, WordNet es una base de datos conceptual de lengua inglesa estructurada en forma de red semántica y se la clasifica dentro del grupo de las ontologías léxico-conceptuales7. Su diseño se fundamenta en teorías psicolingüísticas sobre la memoria léxica humana basada en redes semánticas (Miller 1986). WordNet constituye un intento de reflejar este modelo de memoria léxica en un modelo lexicográfico de organización léxica.

Disponible on-line gratuitamente, podríamos decir que es un diccionario conceptual en el que las palabras están organizadas en conjuntos de sinonimia correspondientes a un concepto subyacente. En su día se trató del lexicón relacional en formato computacional más completo y extenso existente de cualquier lengua, siendo toda su información introducida manualmente por el grupo de lexicógrafos del proyecto.

La versión europea multilingüe se denomina EuroWordNet, e incluye versiones en holandés, italiano, castellano, alemán, francés, checo y estonio. Además, están en desarrollo las versiones para las siguientes lenguas: sueco, noruego, danés, griego, portugués, vascuence, catalán, rumano, lituano, ruso, búlgaro, esloveno.

WordNet contiene 126.000 entradas dividas en cinco categorías: nombres8, verbos9, adjetivos10, adverbios y elementos funcionales. A pesar de no incluir definiciones semánticas formales, WordNet engloba 100.000 significados (conceptos) organizados en una taxonomía.

La unidad básica en que se estructura WorNet es el synset («synonym sets») o conjunto de sinónimos, representativo de un concepto lexicalizado (palabras o lexías). El término forma léxica («word form») es usado para referirse a la expresión física que se escribe o se pronuncia y significado léxico («word meaning») para referirse al concepto lexicalizado que se expresa por medio de una forma léxica. Al contrario de lo que ocurre con los diccionarios de sinónimos o thesauros tradicionales, un «synonym set» no tiene una palabra clave (headword), que usualmente es usada por el lexicógrafo como representativa del conjunto.

wordnet

 

 

 

 

 

 

 

 

 

 

Muchos de los tipos de relaciones de la Ontología de Applied Semantics son los mismos que los representados en WordNet, dado que su tipo de relaciones son la base de la estructura del lexicón humano. Sin embargo la ontología de WordNet no incluía ningún tipo de datos probabilísticos, que son críticos para la utilización de las ontologías en el análisis de un documento. Además, WordNet tampoco incluía relaciones laterales que ayudan a organizar conceptos en grupos coherentes. Este tipo de datos heterárquicos que por el hecho de ir “cogidas de la mano” no aparecen en relaciones jerárquicas, son centrales para establecer contextos que puedan ser usados para reconocer significados particulares de palabras.

 

Deja un comentario