La tesis es una contribución al campo del Procesamiento de las Lenguas
Naturales (PLN) desde un punto de vista de ingeniería. Se centra en la
definición de una arquitectura para la representación del conocimiento léxico
en sistemas PLN, representación que abarca los diferentes niveles del
conocimiento (morfológico, sintáctico, semántico, etc.) y las interrelaciones
entre ellos, al tiempo que permite la construcción incremental de recursos
léxicos y su organización modular. La arquitectura define un modelo
estructural, que a su vez puede verse en dos niveles -conceptual y físico-, y
un modelo funcional, a través de sus interfaces con otros componentes de un
sistema de PLN.
Para facilitar la construcción de recursos léxicos conformes con la
arquitectura propuesta, se define también un formalismo para la representación
del conocimiento léxico, denominado ARIES-II. Este formalismo emplea
estructuras de rasgos como mecanismo de representación básica e incorpora
características adicionales, como herencia de atributos, para lograr una
representación eficiente y compacta.