Los grafos conceptuales (conceptual
graphs), propuestos por Sowa (1984), se diferencian de las redes IS-A en
que los arcos no están etiquetados, y los nodos son de dos tipos:
- Nodos de concepto, que pueden representar tanto
una entidad como un estado o proceso.
- Nodos de relación, que indican cómo se relacionan
los nodos de concepto.
Por tanto, son los nodos de
relación los que hacen el papel de enlaces entre las entidades.
Existen dos notaciones para
los grafos conceptuales, la forma lineal (textual) y los diagramas o display
form, que presentan tres tipos de elementos notacionales:
- rectángulos, que marcan los nodos de concepto,
- círculos, que marcan los nodos de relación,
- flechas direccionadas, que marcan los arcos.
La
Figura 4.15 muestra
estos tipos de notaciones.
Como mostraremos en el siguiente
capítulo, este tipo de modelado conceptual debe mucho al modelo de
Entidad/Relación de Chen (Chen 1976).
La intención del uso de los
grafos conceptuales para la representación del lenguaje natural es mencionada
por el propio Sowa, quien dedica un capítulo completo de su obra a la
aplicación de su esquema al análisis del lenguaje. La representación semántica
de la frase "man biting dog" que nos muestra en el capítulo
introductorio es indicativo del uso que se le puede dar (Figura 4.16)
(Sowa 1984:8). Sowa apunta que sus grafos conceptuales ponen el énfasis en la
representación semántica (en el sentido lingüístico de la palabra).
Una gran ventaja del
esquema de Sowa es que permite restringir la generación de representaciones sin
sentido por medio de lo que él denomina grafos canónicos. Tomando como
base la conocida frase de Chomsky
"Colorless green ideas sleep furiously" (Chomsky 1957),
representada por el grafo
[SLEEP] (AGNT) [IDEA] (COLOR) [GREEN],
establece la idea de canon, que está basada en la noción de jerarquía
de tipos, según la cual existe una función tipo que proyecta
conceptos sobre un conjunto C cuyos elementos son etiquetas de tipo.
Esta función corresponde a los arcos IS-A que vimos anteriormente. El canon
contiene la información necesaria para derivar otros grafos canónicos y tiene
cuatro componentes:
- Una jerarquía de tipos T
- Un conjunto de indicadores de individuos I
- Una relación de conformidad: que
relaciona etiquetas en T con indicadores en I
- Un conjunto finito de grafos conceptuales B,
llamado base canónica, que contiene todos las etiquetas de tipos en
T y todos los referentes, ya sea en I o en el referente
genérico *
Las reglas de formación que
permiten que un grafo canónico se derive de otro son las de copia, unión,
restricción y simplificación. Además un grafo puede convertirse en
canónico mediante otros dos procesos:
- Perception: un grafo es canónico si es construido por el assembler
mediante un icono sensorial.
- Insight: se pueden concebir los grafos conceptuales arbitrarios
como canónicos.
La relación de
conformidad es también relevante, porque se refiere al concepto type/token,
que Sowa representa mediante la notación t::i, donde el indicador
individual i está relacionado con el tipo t.
La frase de Chomsky sería
bloqueada por los cánones:
De este modo se pueden
generar grafos bastante complejos para representar conceptos. Como ejemplo,
exponemos el grafo de transacción (Sowa 1984:110) (Figura 4.17).
El que inicia la
transacción es un customer, que es el receptor de un acto de give y el agente
de otro give. El objeto de la transacción es una entity, que es el objeto del
primer give. El instrumento de la transacción es money, que es también el
objeto del segundo give. La fuente de la transacción es un seller que es el
agente de un give y el receptor del otro.
Sowa advierte que las
reglas canónicas de formación no son reglas de inferencia. La formación de
reglas únicamente asegura las restricciones de selección semánticas, que Sowa
basa en las teorías de Katz y Fodor (1963), pero no garantiza la verdad o
falsedad de las aserciones. Para incorporar la lógica a la teoría de grafos
conceptuales, se usa un operador que proyecta los grafos conceptuales sobre
fórmulas de cálculo de predicados de primer orden (Hodgson 1991).
El canon es por tanto un
sistema extremadamente flexible para representar el conocimiento y,
específicamente, el conocimiento lingüístico. De hecho, el sistema de
representación léxica que más éxito ha tenido hasta el presente, las estructuras
de rasgos, comúnmente usadas en los formalismos gramaticales modernos,
pueden ser consideradas como una especialización de los grafos canónicos de
Sowa específicamente aplicadas a la representación del lenguaje. Su
implementación, normalmente en Lisp, también guarda muchas similitudes.
No deberíamos finalizar la
exposición de este apartado sin mencionar un esquema de representación
anterior, que si bien no ha tenido la misma repercusión que los grafos
conceptuales, contiene la base que, junto con las ideas de las redes
semánticas, usó Sowa para su esquema. Estamos hablando de las redes de dependencia
conceptual (CD: Conceptual Dependency).
Esta notación fue
desarrollada por Schank (Schank 1975) desde finales de los años 60. Al igual
que en los grafos conceptuales, la idea central detrás de la CD es crear una
representación canónica de una frase, en este caso basándose en ciertos
primitivos semánticos. En la teoría original tan sólo se contemplaban siete
primitivos, que incluían cinco acciones físicas: move, propel, ingest, expel y
grasp y dos cambios de estado: ptrans (transferencia física en el espacio) y
mtrans (transferencia mental de información). La frase "John threw a ball
to Mary" es representada del modo siguiente (Schank 1975:51):
Esta teoría está
enteramente basada en los primitivos semánticos, que son las entidades básicas
usadas para describir el mundo. Las dificultades, por tanto, son las mismas que
presentan todas las teorías lingüísticas basadas en primitivos: la naturaleza
totalmente arbitraria de los primitivos escogidos y la falta de sistematicidad
en su uso y adopción. Al igual que en otras teorías lingüísticas basadas en
primitivos semánticos, el número de éstos tendió a crecer, en el caso de Schank
hasta 40. Tampoco él se salva de la sospechosa similitud entre algunos
primitivos y lexemas concretos, como por ejemplo want.
La teoría original de
Schank evolucionó para incluir unidades de memoria más desarrolladas, llamadas scripts
(Schank & Abelson 1977). Un script es una secuencia de esquemas que
"cuenta una historia", el ejemplo tradicional es el del restaurante:
entrar, pedir la comida, pagar al camarero, etc., serían los esquemas que conforman
el script. Los scripts, sin embargo, tienen mucho en común con la
notación que estudiamos a continuación, los esquemas de marcos.