Un conjunto difuso es una clase de objetos con un continuo de grados de pertenencia.
Este
conjunto se caracteriza por una función de pertenencia (característica) que asigna a cada objeto
un grado de pertenencia que oscila entre cero y uno. Las nociones de inclusión, unión intersección,
complemento, relación, convexidad, etc., se extienden a dichos conjuntos, y se establecen varias
propiedades de estas nociones en el contexto de los conjuntos difusos. En particular, se establece
un teorema de separación para conjuntos difusos convexos sin requerir que los conjuntos difusos
sean disjuntos.
INTRODUCCIÓN
En la mayoría de los casos, las clases de objetos que se encuentran en el mundo físico real no
tienen criterios de pertenencia definidos con precisión. Por ejemplo, la clase de los animales
incluye claramente a los perros, los caballos, los pájaros etc., y excluye claramente objetos como
las rocas, los fluidos, plantas, etc. Sin embargo, objetos como las estrellas de mar, las bacterias,
etc. tienen un
estatus ambiguo con respecto a la clase de los animales. El mismo tipo de ambigüedad surge en el
caso de un número como el 10 en relación con la "clase" de todos los números reales que son
mucho mayores que 1. Es evidente que la "clase de todos los números reales que son mucho
mayores que
1", o "la clase de las mujeres bellas", o "la clase de los hombres altos", no constituyen clases o
conjuntos en el sentido matemático habitual de estos términos. Sin embargo, estas "clases",
definidas de forma imprecisa, desempeñan un papel importante en el importante en el
pensamiento humano, sobre todo en los ámbitos del reconocimiento de patrones, la
comunicación de información y la abstracción. reconocimiento de patrones, la comunicación de
información y la abstracción.
El propósito de esta nota es explorar de forma preliminar algunas de las propiedades e
implicaciones básicas de un concepto que puede ser útil en que trata de "clases" del tipo citado
anteriormente. El concepto en cuestión es el de conjunto difuso, es decir, una "clase" con un
continuo de grados de
de pertenencia. Como se verá a continuación, la noción de conjunto difuso un punto de partida
conveniente para la construcción de un marco conceptual que se asemeja en muchos aspectos al
marco utilizado en el caso de los conjuntos ordinarios. utilizado en el caso de los conjuntos
ordinarios, pero es más general que este último y, potencialmente, puede tener un ámbito de
aplicación mucho más amplio, especialmente en los campos de la clasificación de patrones y el
procesamiento de la información. Esencialmente, este marco proporciona una forma natural de
tratar problemas en los que la fuente de imprecisión es la ausencia de criterios claramente
definidos de pertenencia a una clase, en lugar de la presencia de variables aleatorias.
Comenzamos la discusión de los conjuntos difusos con varias definiciones básicas.
DEFINICIONES
Sea X un espacio de puntos (objetos), con un elemento genérico de X denotado
por x. Así, X = {z}.
Un conjunto difuso (clase) A en X se caracteriza por una función de pertenencia (característica)
fA(x) que asocia a cada punto 2 de X un número real en el intervalo [0, 1] 3, con el valor de fA(x) en
x que representa el "grado de pertenencia" de x a A. Así, cuanto más se acerque el valor de fA(x) a
la unidad, mayor será el grado de pertenencia de x a A. Cuando A es un conjunto en el sentido
ordinario del término, su función de pertenencia puede tomar sólo dos valores 0 y 1, con fA(x) = 1
o 0 según x pertenezca o no a A. Así, en este caso fA(x) se reduce a la función característica
familiar de un conjunto A.
Cuando es necesario diferenciar entre estos conjuntos y los conjuntos difusos, los conjuntos con
funciones características se denominarán conjuntos ordinarios o simplemente conjuntos.)
Ejemplo. Sea X la recta real R 1 y sea A un conjunto difuso de números que son mucho mayores que
1. Entonces, se puede dar una caracterización precisa, aunque subjetiva, de A especificando fA(x)
como una función en R 1. Los valores representativos de tal función podrían ser: fA (0) =0; fA (1)
=0; fA(5) = 0,01; fA(10) = 0,2; fx(100) = 0,95; fA(500) = 1.
Hay que tener en cuenta que, aunque la función de pertenencia de un conjunto difuso tiene cierto
parecido con una función de probabilidad cuando X es un conjunto contable (o una función de
densidad de probabilidad cuando X es un continuo), hay diferencias esenciales entre estos
conceptos que se harán más evidentes una vez que se hayan establecido las reglas de combinación
de las funciones de pertenencia y sus propiedades básicas. De hecho, la noción de conjunto difuso
es de naturaleza completamente no estadística.
Comenzamos con varias definiciones de conjuntos difusos que son extensiones obvias de las
definiciones correspondientes para los conjuntos ordinarios. Un conjunto difuso es vacío si y sólo
si su función de pertenencia es idénticamente cero en X.
Dos conjuntos difusos A y B son iguales, escritos como A = B, si y sólo si fA(x) = fB(x) para todas las
x de X. (En lo sucesivo, en lugar de escribir fA(x) = fB(x) para todo x en X, escribiremos más
sencillamente fa = fB). El complemento de un conjunto difuso A se denota por A' y se define por
Al igual que en la facilidad de los conjuntos ordinarios, la noción de contención juega un papel
central en la facilidad de los conjuntos difusos. Esta noción y las nociones relacionadas de unión e
intersección se definen como sigue.
Contención: A está contenido en B (o, lo que es lo mismo, A es un subconjunto de B o A es menor
o igual que B) si y sólo si fA ≤fB. En los símbolos
Unión. La unión de dos conjuntos difusos A y B con sus respectivas funciones de pertenencia fA(x)
y fB(x) es un conjunto difuso C, escrito como C = A U B, cuya función de pertenencia está
relacionada con las de A y B por
o, de forma abreviada
Nótese que U tiene la propiedad asociativa, es decir, A U (B U C) = (A UB) UC.
Comentario. Una forma más intuitiva de definir la unión es lo siguiente: La unión de A y B es el
conjunto difuso más pequeño que contiene A y B. Más precisamente, si D es cualquier conjunto
difuso que contiene tanto a A y B, entonces también contiene la unión de A y B.
Para demostrar que esta definición es equivalente a (3), observamos, en primer lugar, que C
definido por (3) contiene tanto a A como a B, ya que
Y,
Además, si D es un conjunto difuso cualquiera que contiene tanto a A como a B, entonces
y por lo tanto
lo que implica que C ⊂ D. Q.E.D.
La noción de intersección de conjuntos difusos puede definirse de forma análoga análoga. En
concreto:
Intersección. La intersección de dos conjuntos difusos A y B con sus respectivas funciones de
pertenencia fA(x) y fB(x) es un conjunto difuso C, escrito como C =A n B, cuya función de
pertenencia está relacionada con las de A y B por
o, de forma abreviada
Como en el caso de la unión, es fácil demostrar que la intersección de A y B es el mayor conjunto
difuso que está contenido en A y B. Como en el caso de los conjuntos ordinarios, A y B son
disjuntos si A∩ B está vacío. Nótese que ∩, al igual que U, tiene la propiedad asociativa.
La intersección y la unión de dos conjuntos difusos en R 1 se ilustran en Fig. 1. La función de
pertenencia de la unión está compuesta por los segmentos de la curva 1 y 2; la de la intersección
está formada por los segmentos 3 y 4 (líneas gruesas).
Comentario. Nótese que la noción de "pertenencia", que juega un papel fundamental en el caso
de los conjuntos ordinarios, no tiene el mismo papel en
el caso de los conjuntos difusos. Así, no tiene sentido hablar de un punto x "perteneciente" a un
conjunto difuso A salvo en el sentido trivial de que fA(x) sea positivo.
De forma menos trivial, se pueden introducir dos niveles α y β (0 < α < 1, 0 < β< 1, α > β) y convenir
en decir que (1) "x: pertenece a A" si fA(x) ≥α ; (2) "x no pertenece a A" si fA(x) ≤β y (3) "x tiene un
estado indeterminado en relación con A" si β< fA(x) < α. lógica de tres valores con tres valores de
verdad: T (fA(x) ≥α) , F (fA(x) ≤ β), y U(β <fA(x) < α).
ALGUNAS PROPIEDADES DE ∪ , ∩, Y COMPLEMENTACIÓN
Con las operaciones de unión, intersección y complementación definidas como en (3), (5) y (1), es
fácil extender muchas de las identidades básicas identidades básicas de los conjuntos ordinarios a
los conjuntos difusos. Como ejemplos, tenemos
Estas y otras igualdades similares pueden establecerse mostrando que las relaciones
correspondientes para las funciones de pertenencia de A, B y C son identidades. Por ejemplo, en el
caso de (7), tenemos
que puede verificarse fácilmente que es una identidad probándola para los dos posibles: fa(x) >
fB(x) y fa(x) < fB(x). Del mismo modo, en el caso de (10), la relación correspondiente en términos
de fA > fB y fc es:
que se puede comprobar que es una identidad considerando los seis casos:
Esencialmente, los conjuntos difusos en X constituyen una red distributiva con un 0 y 1.
UNA INTERPRETACIÓN PARA UNIONES E INTERSECCIONES
En el caso de los conjuntos ordinarios, un conjunto C que se expresa en términos de una familia de
conjuntos A1, …. , A i ,….. , An a través de los conectivos U y ∩, puede representarse como una red
de conmutadores α1, …. , αn, con Ai ∩ Aj y Ai U Aj correspondientes, respectivamente, a
combinaciones en serie y en paralelo de αi y αj.
En el caso de los conjuntos difusos, se puede dar una interpretación análoga interpretación en
términos de tamices. En concreto, sea fi(x), i = 1, ... , n, denota el valor de la función de
pertenencia de Ai en x. Asocie a fi (x) un tamiz Si(x) cuyas mallas son de tamaño fi(x). Entonces,
fi(x) v fj(x) y fi(x) ^ fj(x) corresponden, respectivamente, a combinaciones paralelas y en serie de
Si(x) y Sj(x), como se muestra en la Fig. 2.
En general, una expresión bien formada que incluya A1, …, A n , U, y ∩ corresponde a una red de
tamices S1(x), . . . , Sn( x) que puede que se pueden encontrar mediante las técnicas de síntesis
convencionales para los circuitos de conmutación. Como ejemplo muy sencillo,
corresponde a la red mostrada en la Fig. 3.
Obsérvese que el tamaño de las mallas de los tamices de la red depende de x y que el conjunto de
la red equivale a un único tamiz cuyas mallas son de tamaño fc(x).
OPERACIONES ALGEBRAICAS SOBRE CONJUNTOS DIFUSOS
Además de las operaciones de unión e intersección, se pueden definir otras formas de formar
combinaciones de conjuntos difusos y relacionarlos entre sí. Entre las más importantes se
encuentran las siguientes
Producto algebraico. El producto algebraico de A y B se denomina AB y se define en términos de
las funciones de pertenencia de A y B mediante la relación
Suma algebraica. La suma algebraica de A y B se denota por A + B
y se define por
siempre que la suma Fa + fB sea menor o igual a la unidad. Así, a diferencia del producto
algebraico, la suma algebraica sólo tiene sentido cuando la condición fA(x) + fB(x) ≤ 1 se cumple
para todo x.
Diferencia absoluta. La diferencia absoluta de A y B se denota por l A – B l y se define por
Nótese que en la facilidad de los conjuntos ordinarios I A - B I se reduce al complemento relativo
de complemento de A ∩ B en A U B.
Combinación convexa. Por combinación convexa de dos vectores f y g se suele entender una
combinación lineal de f y g de la forma λf + (1 - λ)g, en la que 0 ≤ λ ≤ 1. Este modo de combinar f y
g puede generalizarse a los conjuntos difusos de la siguiente manera.
Sean A, B y ꓥ conjuntos difusos arbitrarios. La combinación convexa de A, B y ꓥ se denomina (A, B;
ꓥ ) y se define por la relación
donde ꓥ' es el complemento de ꓥ. Escrito en términos de funciones de pertenencia, (17) se lee
Una propiedad básica de la combinación convexa de A, B y ꓥ se expresa por
Esta propiedad es una consecuencia inmediata de las desigualdades
que se mantienen para todo X en [0, 1]. Es interesante observar que, dado cualquier conjunto
difuso C que satisface A ∩ B ⊂ C ⊂ A U B, siempre se puede encontrar un conjunto difuso
conjunto ꓥ tal que C = (A, B; ꓥ). La función de pertenencia de este conjunto es dada por
Relación difusa. El concepto de relación (que es una generalización de función) tiene una
extensión natural a los conjuntos difusos y juega un papel importante papel importante en la
teoría de dichos conjuntos y sus aplicaciones como en el caso de los conjuntos ordinarios. En lo
sucesivo, nos limitaremos a definir la noción de relación difusa y tocaremos algunos conceptos
relacionados.
Normalmente, una relación se define como un conjunto de pares ordenados, por ejemplo, el
conjunto de todos los pares ordenados de números reales x e y tales que x ≥ y. En el contexto de
los conjuntos difusos, una relación difusa en X es un conjunto difuso en el producto espacio X x X.
Por ejemplo, la relación denotada por x >> y , x, y ∈ R2, puede considerarse como un conjunto
difuso A en R2, con la función de pertenencia función de pertenencia de A, Fa (x, y), con los
siguientes valores representativos (subjetivos) f △ (10, 5) = 0; fA (100, 10) = 0,7; fA(100, 1) = 1; etc.
De forma más general, se puede definir una relación difusa n-aria en X como un conjunto difuso A
en el espacio del producto X × X × ….. × X. Para tales relaciones, la función de función de
pertenencia es de la forma fA(x1, . . . , xn), donde xi ∈ X, i= 1 , . . . , n .
En el caso de las relaciones difusas binarias, la composición de dos relaciones difusas A y B se
denomina B o A y se define como una relación difusa en X cuya función de pertenencia está
relacionada con las de A y B por
Nótese que, la operación de composición tiene la propiedad asociativa
Conjuntos difusos inducidos por mapeos. Sea T un mapeo de X a un espacio Y. Sea B un conjunto
difuso en Y con función de pertenencia fB(y). El mapeo inverso T -1 induce un conjunto difuso A en
X cuya función de pertenencia función de pertenencia está definida por
para todas las x de X que son mapeadas por T en y.
Consideremos ahora un problema inverso en el que A es un conjunto difuso dado en X, y T, como
antes, es un mapeo de X a Y. La pregunta es: ¿Cuál es la función de pertenencia del conjunto
difuso B en Y que es inducida por este mapeo?
Si T no es unívoco, se produce una ambigüedad cuando dos o más puntos distintos de X puntos
distintos de X, por ejemplo x1 y x2, con diferentes grados de pertenencia en A, se asignan al
mismo punto y en Y. En este caso, la cuestión es: ¿Qué grado de pertenencia a B debe asignarse a
y?
Para resolver esta ambigüedad, acordamos asignar a y el mayor de los dos. En general, la función
de pertenencia de B se define por para B estará definida por
donde T-1(y) es el conjunto de puntos de X que son mapeados en y por T.
CONVEXIDAD
Como se verá en la siguiente sección, la noción de convexidad puede ser fácilmente a los
conjuntos difusos de manera que se conserven muchas de las propiedades que tiene en el
contexto de los conjuntos ordinarios. Esta noción parece Esta noción parece ser particularmente
útil en aplicaciones que implican la clasificación de patrones, optimización y problemas
relacionados.
En lo que sigue, asumimos para concretar que X es un espacio euclidiano real espacio E n.
DEFINICIONES
Convexidad. Un conjunto difuso A es convexo si y sólo si los conjuntos Γ α , definidos por
son convexos para todo a en el intervalo (0, 1].
Una definición alternativa y más directa de convexidad es la siguiente A es convexo si y sólo si
para todo x1 y x2 en X y todo λ en [0, 1]. Nótese que esta definición no implica que fA(x) deba ser
una función convexa de x. Esto se ilustra en Fig. 4 para n = 1.
Para mostrar la equivalencia entre las definiciones anteriores nótese que si A es convexo en el
sentido de la primera definición y α= fA(x1) ≤ fA(x2) entonces x2ϵ Γ α, y λx1 + (1 – λ )x2 ϵ Γ α por la
convexidad de Γ α . Por tanto,
A la inversa, si A es convexo en el sentido de la segunda definición y α = fA (x1 ), entonces Γ α
puede considerarse como el conjunto de todos los puntos x2 para los que fA(x2) ≥ fA(x2). En virtud
de (25), todo punto de la forma λx1+ (1 - λ)x2, 0 ≤ λ ≤ 1, está también en Γ α y por tanto Γ α es un
conjunto convexo. Q.E.D.
Una propiedad básica de los conjuntos difusos convexos se expresa mediante la Teorema. Si A y B
son convexos, también lo es su intersección.
Acotamiento. Un conjunto difuso A está acotado si y sólo si los conjuntos Γ α = {x l fA(x) ≥ α} están
acotados para todo α > 0; es decir, para todo α > 0 existe un R(α) finito tal que ll x ll ≤ R(α) para
todo x en Γ α .
Si A es un conjunto acotado, entonces para cada ϵ > 0 existe un hiperplano H tal que fA(x) ≤ ϵ para
todo x en el lado de H que no contiene el origen. Pues bien, consideremos el conjunto Γ ϵ = {x
IFa(x) ≥ϵ }. Por hipótesis este conjunto está contenido en una esfera S de radio R( ϵ ). Sea H un
hiperplano cualquiera que soporta S. Entonces, todos los puntos del lado de H que no contienen el
origen están fuera o en S, y por tanto para todos esos puntos fA(x) ≤ ϵ .
LEMA. Sea A un conjunto difuso acotado y sea M -= SupxfA(x). (M se denominará grado máximo M
en A.) Entonces existe al menos un punto X0 en el que M se alcanza esencialmente en el sentido
de que, para cada ϵ >0, toda vecindad esférica de x0 contiene puntos del conjunto Q( ϵ ) ={x [fa(x) ≥
M - ϵ }.
Prueba Consideremos una secuencia anidada de conjuntos acotados donde
Γ n = {x l fA(x) >= M - M/(n + 1)}, n = 1, 2, . . . Nota: Γ n es no vacía para todo n finito como
consecuencia de la definición de M como M = SupxfA(x). (Suponemos que M > 0.)
Sea x. un punto elegido arbitrariamente en , Γ n , n = 1, 2, - . . . Entonces x1, x2, …. , es una
secuencia de puntos en un conjunto cerrado y acotado Γ 1 . Por el teorema de Bolzano-
Weierstrass, esta secuencia debe tener al menos un punto límite, digamos x0, en Γ 1. En
consecuencia, toda vecindad esférica de x0 contendrá infinitos puntos de la secuencia x1, x2 , ….,
y, en particular, de las sucesiones Xn+1, Xn+2 , ….. , donde N > M/e. Como los puntos de esta
subsecuencia caen dentro del conjunto Q(ϵ ) = {x I fA(x) ≥ M - ϵ }, se demuestra el lema.
Convexidad estricta y fuerte. Un conjunto difuso A es estrictamente convexo si los conjuntos Γ α , 0
< α ≤ 1 son estrictamente convexos (es decir, si el punto medio de dos puntos distintos de Γ α se
encuentra en el interior de Γ α ). Nótese que esta definición se reduce a la de convexidad estricta
para conjuntos ordinarios cuando A es un conjunto de este tipo. Un conjunto difuso A es
fuertemente convexo si, para dos puntos distintos x1 y x2 y cualquier X en el intervalo abierto (0,
1).
Nótese que la convexidad fuerte no implica convexidad estricta ni viceversa. Obsérvese también
que, si A y B son acotados, también lo son su unión e intersección. Del mismo modo, si A y B son
estrictamente (fuertemente) convexos, su intersección es estrictamente (fuertemente) convexa.
Sea A un conjunto difuso convexo y sea M = SupxfA(x). Si A está acotado entonces, como se ha
mostrado anteriormente, o bien M se alcanza para alguna x, digamos x0, o bien hay al menos un
punto, x0 en el que M se alcanza esencialmente en el sentido que, para cada ϵ > 0, toda vecindad
esférica de x0 contiene puntos en el conjunto Q( ϵ ) = {x lM - fA(x) ≤ ϵ }. En particular, si A es
fuertemente convexo y se alcanza x0, entonces x0 es único. Pues, si M = fA(x0) y M = fa(x0), Y
M=fA(x1), con X1 diferente x0 entonces fA(x) > M para x = 0,5x0 + 0,5x, lo que contradice M =
MaxXfa(x).
De forma más general, sea C(A) el conjunto de todos los puntos de X en los que M es
esencialmente alcanzado. Este conjunto se denominará el núcleo de A. En el caso de los casos de
los conjuntos difusos convexos, podemos afirmar la siguiente propiedad de C(A). TEOREMA. Si A
es un conjunto difuso convexo, entonces su núcleo es un conjunto convexo.
La prueba: Bastará con demostrar que, si M se alcanza esencialmente en x0 y x1, x1 ≠ x0, entonces
también se alcanza esencialmente en todo x de la forma x =λx0+ (1-λ)x1, 0≤ λ≤ 1.
Para ello, sea P un cilindro de radio ϵ con la línea que pasa por x0 y x1 como su eje. Sea x0' un
punto de una esfera de radio ϵ centrado en x0 y x1 sea un punto en una esfera de radio ϵ centrada
en x1 tal que fa(x0') ≥M -ϵ y fA(x1')≥ M - ϵ . Entonces, por la convexidad de A para cualquier punto
u en el segmento x0’ x1’, tenemos que fA(u) ≥ M - ϵ . Además, por la convexidad de P, todos los
puntos de xo' x1’ estarán en P.
Sea ahora x un punto cualquiera del segmento x0x1. La distancia de este punto del segmento
x0'x1’ debe ser menor o igual que ϵ , ya que x0'x1' se encuentra en P. En consecuencia, una esfera
de radio ϵ centrada en x contendrá al menos un punto del segmento x0 un punto del segmento
x0’x1’' y, por tanto, contendrá al menos un punto punto, digamos w, en el que fA(w) ≥ M- ϵ . Esto
establece que M es esencialmente en x y, por tanto, demuestra el teorema.
COROLARIO. Si X = E1 y A es fuertemente convexo, entonces el punto en el que se alcanza
esencialmente M es único.
Sombra de un conjunto difuso. Sea A un conjunto difuso en E n con función de pertenencia fA(x) =
fA(x1 , . . . , xn). Para simplificar la nota, la noción de sombra (proyección) de A sobre un
hiperplano H se definirá a continuación para el caso especial en que H es un hiperplano de
coordenadas, por ejemplo, H = { x l x1 = 0}.
En concreto, la sombra de A en H = {x lx1 = 0} se define como un conjunto difuso S H(A) en En-1 con
fsh(A)(x) dada por
Cuando A es un conjunto difuso convexo, la siguiente propiedad de SH(A) es una consecuencia
inmediata de la definición anterior: Si A es un conjunto difuso convexo Si A es un conjunto difuso
convexo, su sombra en cualquier hiperplano es también un conjunto difuso convexo. Una
propiedad interesante de las sombras de dos conjuntos difusos convexos es expresada por la
siguiente implicación
Para demostrar esta afirmación, basta con mostrar que si existe un punto, digamos x0, tal que
fA(x0) ≠ fB(x0), entonces existe un hiperplano H tal que f SH(A)(x0*)≠ fSH(B)(xo*), donde x0* es la
proyección de x0 sobre H.
Supongamos que fA(x0) = α > fB(x0) = β Como B es un conjunto difuso convexo el conjunto Γ β = {x
l fB(x) > β} es convexo, y por tanto existe un hiperplano F que soporta a Γ β y pasa por x0. Sea H un
hiperplano ortogonal a F, y sea x0* la proyección de x0 sobre H. Entonces, como fB(x) ≤ β para
todo x en F, tenemos fSH(B)(Xo*) ≤β. Por otra parte fSH(A)(x0*)≥α. En consecuencia , fSH(B)(x0*)≠ fSH(A)
(xo*), y análogamente para el caso en que α < β.
Una forma algo más general de la afirmación anterior es la siguiente: Sea A, pero no
necesariamente B, un conjunto difuso convexo, y sea SH(A) = SH(B) para todo H. Entonces A = conv
B, donde conv B es el casco convexo de B, es decir, el conjunto convexo más pequeño que
contiene a B. Más generalmente, SH(A) = SH(B) para todo H implica que conv A = conv B.
Separación de conjuntos difusos convexos. El teorema clásico de separación para conjuntos
convexos ordinarios establece, en esencia, que si A y B son conjuntos convexos disjuntos
conjuntos convexos, entonces existe un hiperplano de separación H tal que A está en un lado de H
y B en el otro. Es natural preguntarse si este teorema puede extenderse a los conjuntos difusos
convexos conjuntos difusos convexos, sin exigir que A y B sean disjuntos, ya que la condición de
disjunción es demasiado restrictiva en el caso de los conjuntos difusos. Resulta, como se verá en la
siguiente sección, que la respuesta a esta pregunta es afirmativa.
Como paso previo, tendremos que hacer algunas definiciones. En concreto sean A y B dos
conjuntos difusos acotados y sea H una hipersuperficie en E n definida por una ecuación h(x) = O,
con todos los puntos para los que h(x) ≥0 en un lado de H y todos los puntos para los que h(x) ≤0
están en el otro lado. otro lado. a Sea K H un número dependiente de H tal que fA(x) ≤KH en un lado
de H y fB(x) ≤ KH en el otro lado. Sea Mg Inf K H .El número DH = 1 - MH se llamará grado de
separación de A y B por H.
En general, no se trata de una hipersuperficie dada H, sino con una familia de hipersuperficies
{Hλ}, con X que abarca, por ejemplo, Em. El problema entonces, es encontrar un miembro de esta
familia que realice el mayor grado de separación posible.
Un caso especial de este problema es aquel en el que los Hλ son hiperplanos en En, con λ , que
abarcan En . En este caso, definimos el grado de separabilidad de A y B por la relación
con el subíndice λ omitido para simplificar.
Entre las diversas afirmaciones que se pueden hacer sobre D, la siguiente afirmación es, en efecto,
una extensión del teorema de separación a los conjuntos difusos convexos.
Teroema. Sean A y B conjuntos difusos convexos acotados en E n, con máximos grados MA y MB,
respectivamente [MA = SupxfA(x), MB = SupxfB(x)]. Sea M el grado máximo de la intersección A ∩ B
(M = SupxMin[ fA(x), fB(x)]). Entonces D = 1 - M.
Comentario. En palabras sencillas, el teorema afirma que el mayor grado de separación de dos
conjuntos difusos convexos A y B que se puede alcanzar con un hiperplano en E n es uno menos el
grado máximo en la intersección A ∩ B. Esto se ilustra en la Fig. 5 para n = 1.
La prueba: Es conveniente considerar por separado los dos casos siguientes:(1) M = Min (MA, MB)
y (2) M < Min (MA, MB ). Obsérvese que el último caso descarta A ⊂ B o B ⊂ A.
Caso 1. Para concretar, supongamos que MA < MB, de modo que M = MA. Entonces, por la
propiedad de los conjuntos acotados ya expuesta existe un hiperplano H tal que fB(x) <= M para
todo x en un lado de H. En el otro lado de H, fA(x) < M porque f~(x) =< MA = M para todo x. Queda
por demostrar que no existe un M' < M y un hiperplano H' tal que fA(x) < M r en un lado de H' y
fB(x) =< M' en el otro lado.
Esto se deduce inmediatamente de la siguiente observación. Supongamos que tales H' y M'
existen, y supongamos para concretar que el núcleo de A (es decir, el conjunto de puntos en los
que se alcanza esencialmente MA = M) está en el lado positivo de H'. Esto descarta la posibilidad
de que fA(x) <=M’.
para todo x en el lado positivo de H', y por lo tanto necesita que fA(x) <= M’ para todo x en el lado
negativo de H’, y fB(x) <= M’ para todo x en el lado positivo de H Por lo tanto, sobre todas las x en
el lado positivo de H'
y lo mismo para todo x en el lado negativo de H'. Esto implica que, sobre todo x en X, SupαMin [fA
(x), fB(x)] =< M’, lo que contradice la suposición que Supx Min [fA(x), fB(x)] = M > M'.
Caso 2. Consideremos los conjuntos convexos Γ A = {X l fA(x) > M} Y Γ B ={x l fB(x) > M}. Estos
conjuntos son no vacíos y disjuntos, ya que si no lo fueran no lo fueran habría un punto, digamos
u, tal que fA(u) > M y fB(u) > M, y por tanto fA ∩ B(u) > M, lo que contradice la suposición de que
M =Supx fA∩ B(x)
Como Γ A y Γ Bson disjuntos, por el teorema de separación para conjuntos convexos ordinarios
conjuntos convexos ordinarios existe un hiperplano H tal que Γ A está en un lado de H (digamos, el
lado positivo) y Γ B está en el otro lado (el lado negativo). Además, por las definiciones de Γ A y Γ B
, para todos los puntos del lado de H, fA(x) =< M, y para todos los puntos del lado positivo de H, fB
(x) =< M. Así, hemos demostrado que existe un hiperplano H que realiza 1 - M como grado de
separación de A y B. La conclusión de que un mayor grado de separación de A y B no se puede
realizar a partir del argumento dado en el caso 1. Con esto concluye la demostración del teorema.
El teorema de la separación para los conjuntos difusos convexos parece ser de especial relevancia
para el problema de la discriminación de patrones. Su aplicación Su aplicación a esta clase de
problemas, así como a los problemas de optimización, será en notas posteriores sobre los
conjuntos difusos y sus propiedades.