Carlos Santamaría y su obra escrita

Nociones fundamentales de la TeorÃa de la InformaciÃ³n

Estudios Empresariales, 65/2 zk., 1965

Finalidad de esta nota

La finalidad de esta nota es dar a conocer a los lectores no iniciados en esta nueva rama de la matemÃ¡tica, las nociones fundamentales de cÃ¡lculo informativo, creaciÃ³n del matemÃ¡tico e ingeniero americano Claudio Shannon hace aÃºn menos de veinticinco aÃ±os.

Las aplicaciones de esta teorÃa se han revelado diversÃsimas y fecundas en diferentes ramas de la actividad humana y no cabe duda de que un conocimiento bÃ¡sico de la misma deberÃ¡ formar parte en adelante de la cultura general de los hombres de ciencia y, de modo muy particular, de los que trabajen en el campo de la organizaciÃ³n.

Sin embargo el cÃ¡lculo informativo no ha pasado todavÃa a integrarse en los planes de estudio de las carreras y, por otra parte, resulta enteramente desconocido para la inmensa mayorÃa de los cientÃficos que han adquirido su formaciÃ³n en los Ãºltimos aÃ±os.

Por ello, y sin otra pretensiÃ³n que la de realizar una modesta tarea de divulgaciÃ³n, me ha parecido conveniente informar a los lectores de esta Revista sobre algunos elementos fundamentales de la nueva teorÃa. Dada la extensiÃ³n y el carÃ¡cter elemental de la presente nota debo limitarme a hacer en ella una introducciÃ³n muy rudimentaria al tema, que algunos podrÃ¡ servirles, quizÃ¡s, como de cebo para interesarse mÃ¡s a fondo en tan curiosa y nueva rama del saber.

Generalidades sobre polÃtica informativa

Al plantearse una actividad se necesita disponer previamente de una Â«informaciÃ³nÂ» suficiente sobre la situaciÃ³n en que aquella haya de desenvolverse. El comerciante deberÃ¡ estar informado sobre la situaciÃ³n y estructura del mercado, el estratega sobre la disposiciÃ³n y la cuantÃa de las fuerzas adversas, el organizador del trabajo sobre la eficacia de los medios de que dispone, etc.

La clave del Ã©xito en muchas empresas consiste, precisamente, en disponer de una informaciÃ³n buena y abundante, o mÃ¡s exactamente, de la informaciÃ³n adecuada a la actividad que se trata de desarrollar.

Podemos, pues, suponer como modelo general, el caso de una persona A que se encuentra ante una situaciÃ³n de indeterminaciÃ³n o de incertidumbre dentro del cual, debe realizar determinados fines. Lo primero que harÃ¡ A, es tratar de obtener la informaciÃ³n precisa, es decir; el conocimiento de ciertos datos o elementos de la situaciÃ³n que necesita utilizar para actuar. A este fin se valdrÃ¡ en general de estudios estadÃsticos, encuestas o sondeos. En la mayor parte de los casos no llegarÃ¡ a obtener una informaciÃ³n completa, y siempre quedarÃ¡ sometido a un margen, mÃ¡s o menos importante, de incertidumbre o de indeterminaciÃ³n.

Ahora bien, la informaciÃ³n cuesta dinero. La realizaciÃ³n de un sondeo, el anÃ¡lisis de unos datos estadÃsticos, son en general, operaciones costosas y que exigen ademÃ¡s tiempo. De ahÃ la importancia que tiene el saber elegir entre el material informativo aquel que proporcione una mayor cantidad de informaciÃ³n con el menor gasto posible o, mÃ¡s bien, el saber determinar en cada caso la informaciÃ³n mÃ¡s adecuada, la que mejor se ajuste a las necesidades impuestas por la acciÃ³n proyectada.

En muchos casos serÃ¡ mejor dejar un margen de incertidumbre que tratar de obtener una informaciÃ³n completa, es decir, la primera soluciÃ³n resultarÃ¡ mÃ¡s econÃ³mica que la segunda. La pretensiÃ³n de agotar las informaciones llegando a resultados exhaustivos no es siempre la mÃ¡s razonable. En cada caso serÃ¡ menester definir una Â«polÃtica de informaciÃ³nÂ», la mÃ¡s conveniente en vista del conjunto de las circunstancias que concurren en el mismo.

AsÃ, por ejemplo, si una Empresa trata de establecer una polÃtica de producciÃ³n deberÃ¡, en general, dar la prioridad a los artÃculos mÃ¡s solicitados por el pÃºblico, y para ello deberÃ¡ informarse previamente sobre las preferencias manifestadas por la clientela. A este efecto, podrÃ¡ organizar por ejemplo, un sondeo. Pero difÃcilmente podrÃ¡ llegar a un conocimiento completo y exhaustivo del campo de preferencias. Los gustos de pÃºblico cambian constantemente y el servicio de informaciÃ³n destinado a aconsejar a la direcciÃ³n de la Empresa en este aspecto deberÃ¡ estar constantemente en funcionamiento. Para ello podrÃ¡ contar con las estadÃsticas de ventas, la distribuciÃ³n de pedidos, etc., datos que se pueden conseguir fÃ¡cilmente sin salir del Ã¡mbito de la empresa. Ahora bien, en medio de este mare magnum de cifras y de datos se precisa definir una Â«polÃticaÂ» recogiendo los datos mÃ¡s fÃ¡cilmente accesibles, los mÃ¡s econÃ³micos, los que en definitiva resulten mÃ¡s Ãºtiles para orientar la producciÃ³n.

AnÃ¡logamente las seÃ±ales que un automovilista encuentra a lo largo de una carretera le proporcionan informaciones mÃ¡s o menos importantes sobre la ruta que debe seguir. Es evidente que aumentando el nÃºmero de seÃ±ales se puede aumentar la informaciÃ³n, pero esta polÃtica no serÃ¡ siempre la mÃ¡s acertada. La proliferaciÃ³n de seÃ±ales puede servir mÃ¡s para confundir que para orientar al conductor. Por otra parte, la instalaciÃ³n de seÃ±ales origina gastos de instalaciÃ³n y de conservaciÃ³n mÃ¡s o menos cuantiosos y la direcciÃ³n de carreteras no puede permitirse el lujo de multiplicarlas hasta el infinito. Â¿CuÃ¡ntas seÃ±ales y quÃ© seÃ±ales nos darÃ¡n los resultados mejores y mÃ¡s econÃ³micos? Responder a esta pregunta es lo mismo que definir una polÃtica informativa de la ruta.

De los ejemplos que hemos citado, se deduce la conveniencia de disponer de un instrumento sistemÃ¡tico para la medida y el cÃ¡lculo de la informaciÃ³n. Este instrumento matemÃ¡tico existe y ha recibido el nombre de Â«teorÃa matemÃ¡tica de la informaciÃ³nÂ». Su primer campo de acciÃ³n son las tÃ©cnicas de la comunicaciÃ³n, o de la transmisiÃ³n por hilo o por ondas. La teorÃa matemÃ¡tica de la informaciÃ³n es inicialmente creada por SHANNON con vistas a este dominio hoy tan importante de la actividad humana. Pero luego aparece su enorme utilidad en otros campos tales como la fisiologÃa, la lingÃ¼Ãstica y la electrÃ³nica. En particular las mÃ¡quinas de traducir, trabajan fundamentalmente en la transformaciÃ³n de material informativo y en su concepciÃ³n tiene tanta importancia la medida de la informaciÃ³n como pueda tenerla en electrotecnia la definiciÃ³n y medida de las magnitudes elÃ©ctricas.

Por lo que hace a las tÃ©cnicas empresariales no hay que hacerse demasiadas ilusiones sobre la utilidad de la aplicaciÃ³n del cÃ¡lculo informativo a este dominio, pero en muchos casos puede ser Ãºtil para proporcionar al hombre de empresa, un esquema abstracto, y hasta cierto punto, seguro, de sus problemas informativos.

La nociÃ³n de entropÃa informativa

La primera magnitud que debe definirse es la de la incertidumbre o indeterminaciÃ³n de una situaciÃ³n. Es evidente que dentro de la incertidumbre caben grados diversos. La incertidumbre del automovilista que se encuentra ante dos rutas posibles es menor que la del que se halla en un nÃºcleo urbano del que parten cinco direcciones posibles. De la misma manera si entre un grupo de ocho candidatos a un concurso interesa saber cuÃ¡l es el candidato mÃ¡s apto, la incertidumbre serÃ¡ menor que si lo que se trata de averiguar es el orden de preferencia entre los ocho candidatos. Esta segunda cuestiÃ³n contiene una cantidad de indeterminaciÃ³n mucho mayor que la primera, y exigirÃ¡ probablemente pruebas mucho mÃ¡s minuciosas. Sobre ese mismo grupo de ocho candidatos pueden plantearse otras cuestiones. Por ejemplo, puede tratarse de clasificarlos en dos grupos de cuatro candidatos cada uno, cuatro aceptados y cuatro rechazados. En tal caso el grado de incertidumbre serÃ¡ distinto que en los casos anteriores. Pero Â¿serÃa mayor o menor que el de cada uno de los dos ejemplos anteriores? Para poder contestar a esta pregunta se precisa disponer de un sistema de medida y de cÃ¡lculo de la incertidumbre o, para emplear el tÃ©rmino actualmente consagrado, de la entropÃa de cada una de la situaciones planteadas.

El caso mÃ¡s sencillo que puede presentarse es el de una situaciÃ³n que tiene n Â«salidasÂ» posibles a las que no se atribuye ninguna preferencia relativa, es decir, que se las juzga todas igualmente probables. En tal caso, la entropÃa de la situaciÃ³n viene expresada por el logaritmo del nÃºmero de salidas, es decir, que podrÃ¡ escribirse:

E = log n (I)

Donde el logaritmo puede tomarse en un sistema cualquiera. si el sistema adoptado es el decimal diremos que la entropÃa viene expresa en unidades decimales. En el caso, muy corriente, de que la base adoptada sea el nÃºmero 2, la medida de la entropÃa vendrÃ¡ expresada en una unidad llamada hartley o bit.

Apliquemos esta definiciÃ³n a cada uno de los tres ejemplos reciÃ©n propuestos sobre ocho candidatos a un concurso.

Las preguntas formuladas son Ã©stas:

1. Â¿CuÃ¡l de los ocho candidatos es el mÃ¡s apto?

2. Â¿CuÃ¡l es el orden de aptitud entre los ocho candidatos?

3. Â¿CuÃ¡les son entre los ocho candidatos los cuatro mÃ¡s aptos, es decir, el grupo de cuatro de mayor capacidad que los otros cuatro?

Tendremos que determinar en cada una de las tres situaciones de incertidumbre el nÃºmero de salidas o de respuestas posibles. Dichos nÃºmero se determinan con facilidad con ayuda del cÃ¡lculo y son respectivamente 8, 8! y C4 8 Determinando los logaritmos respectivos de estos tres nÃºmeros obtenemos las entropÃas correspondiente a las situaciones en unidades decimales.

log10 8 = 0,903

log10 8! = 4,605

log10 C4 8 = 1,845

y en hartley

log2 8 = 3

log2 8! = 15,299

log2 C4 8 = 6,129

Naturalmente habrÃa que justificar el empleo de esta nociÃ³n tal como ha quedado definida. Baste decir aquÃ que la definiciÃ³n de entropÃa adoptada satisface a todas las condiciones intuitivas que pueden exigirse y que en utilizaciÃ³n prÃ¡ctica ha demostrado ser una nociÃ³n extremadamente prÃ¡ctica y que proporciona resultados lÃ³gicos y coherentes. El objetivo que nos proponemos que es el de suministrar a nuestros lectores unas nociones elementales y sumamente sencillas del cÃ¡lculo informativo no justificarÃa consideraciones mÃ¡s extensas sobre este punto.

Veamos ahora cÃ³mo se mide la entropÃa de una situaciÃ³n con diversas salidas desigualmente probables. En tal caso cada salida posible vendrÃ¡ caracterizada por una probabilidad. La fÃ³rmula adoptada para la entropÃa es:

E = _pi log 1___Pi

es decir la suma de las probabilidades correspondientes a las distintas salidas multiplicadas respectivamente por los logaritmos de sus inversas. Esta definiciÃ³n requerirÃa tambiÃ©n algunas consideraciones justificativas, pero en una nota elemental como Ã©sta no hay lugar para ellas. LimitÃ©monos a ponerla en claro con un ejemplo.

Fig. 1Fig. 2

Se trata de comparar las entropÃas de estas dos situaciones. (Fig. 1)

En una bifurcaciÃ³n A hay dos salidas. En otra bifurcaciÃ³n B hay tres salidas pero dos de ellas vuelven a encontrarse en el nudo C tal como se indica en la figura. Se desea saber si la incertidumbre es mayor en la bifurcaciÃ³n A o en la bifurcaciÃ³n B. A este efecto se calcularÃ¡n las entropÃas por la fÃ³rmula (2). Las probabilidades de las salidas son 1/2 y 1/2 en el primer caso y 1/3 y 2/3 en el segundo caso. Por tanto se tendrÃ¡:

SituaciÃ³n A: E = 1__2 log2 + 1__2 log2 = 0,301 u.d. de entropÃa.

SituaciÃ³n B: E' = 1__3 log3 + 2__3 log 3__2 = 0,277 u.d. de entropÃa.

Resulta pues que la entropÃa es mayor en el nudo A que en el B. En general el hecho de que las salidas sean desigualmente probables hacen disminuir la incertidumbre, es decir, la entropÃa de una situaciÃ³n con dos salidas igualmente probables es mayor que la otra situaciÃ³n con dos salidas desigualmente probables.

La entropÃa ligada

Consideramos un procedimiento de fabricaciÃ³n en dos fases. La primera fase estÃ¡ representada por el nudo A en el grÃ¡fico (Fig. 2).

Dicha fase puede conducir a uno de los resultados B o C siendo las probabilidades respectivas 1/3 y 2/3. En la segunda fase se puede partir de B o de C, segÃºn cual haya sido el resultado de la primera fase. Si se parte de B los resultados pueden ser I y II con probabilidades respectivas 1/2. Si se parte de C los resultados pueden ser III, IV y V con probabilidades respectivas 1/3. Aplicando la fÃ³rmula (2) podemos calcular la entropÃa en A y las entropÃas en B y C. Los resultados que se obtienen inmediatamente son los siguientes:

EA = 1__3 log3 + 2__3 log 3__2 = 0,277...

EB = log2 = 0,301...

EC = log3 = 0,477

Veamos cuÃ¡l es la entropÃa del proceso total P. Este proceso tiene cinco salidas posibles cuyas probabilidades respectivas son: 1/6; 1/6; 2/9; 2/9 y 2/9 como se ve por un sencillo cÃ¡lculo de probabilidades compuestas. Por tanto la entropÃa del proceso P serÃ¡ aplicando la fÃ³rmula (2).

Ep = 1__6 log6 + 1__6 log6 + 2__9 log 2__9 + 2__9 log 9__2 + 2__9 log 9__2 = 0,694...

Tratemos ahora de definir lo que se llama la entropÃa de P ligada a la prueba A. La definiciÃ³n exacta de esta nociÃ³n, que a continuaciÃ³n trataremos de aclarar prÃ¡cticamente, es Ã©sta: se llama entropÃa del proceso P ligada a la prueba A al valor medio de las entropÃas correspondientes a las distintas salidas de A, es decir, a la suma de las probabilidades de B y C multiplicadas respectivamente por las entropÃas de EB EC. Hemos visto que las probabilidades de las salidas B y C de la situaciÃ³n A eran 1/3 y 2/3. Las entropÃas de las situaciones B y C han sido calculadas y valen respectivamente log2 y log3. Por tanto la entropÃa de P ligada a la experiencia A serÃ¡:

EP/A = 1__3 log2 + 2__3 log3 = 0,418...

Se comprueba que:

EP = EA + EP/A (3)

es decir que la entropÃa total del proceso P es igual a la suma de la entropÃa de la situaciÃ³n A mÃ¡s la entropÃa del proceso P ligada a la prueba A.

Esta propiedad tiene carÃ¡cter general. Para demostrarla bastarÃa efectuar cÃ¡lculos anÃ¡logos a los que hemos realizado numÃ©ricamente sobre un caso particular, en un caso general con datos literales.

Sin embargo, la fÃ³rmula (3) no tiene toda la generalidad deseable puesto que ha sido obtenida a partir del grÃ¡fico de la Fig. 2 que tiene una particularidad y es que todas las salidas de situaciÃ³n A pertenecen al proceso total P. Puede ocurrir que no sea asÃ y en tal caso debemos introducir una pequeÃ±a modificaciÃ³n en la fÃ³rmula (3) que la hace mÃ¡s general.

Consideremos un proceso P de fabricaciÃ³n en el que partiendo de una situaciÃ³n A se trata de llegar a otra G. Esto puede lograrse por tres procedimientos, dos de los cuales pasan por una fase intermedia B y el tercero por la fase intermedia C. La sucesiÃ³n de fases estÃ¡ representada por las aristas dobles del grÃ¡fico de la Fig. 3.

Fig. 3

Pero en la situaciÃ³n A puede presentarse una tercera salida A igualmente probable que las AB y AC, la cual no pertenece al proceso P. Esta es la novedad del grÃ¡fico (3) en relaciÃ³n con el (2) y es que no todas las salidas de la situaciÃ³n A pertenecen al proceso P. Para que la fÃ³rmula (3) resulte aplicable a este nuevo caso tendrÃamos que considerar un proceso total PA integrado por todas las salidas del proceso P unidas a las de la situaciÃ³n A que sean extraÃ±as al proceso P (en el caso propuesto la salida AD). La fÃ³rmula se escribirÃa pues con referencia al proceso conjunto en la forma:

EPA = EA + EP/A (4)

El proceso P tiene tres salidas posibles ABEG, ABFG y ACFG cuyas probabilidades respectivas son 1/4, 1/4 y 1/2. Su entropÃa es por consiguiente:

EP = 1__4 log4 + 1__4 log4 + 1__2 log2

La situaciÃ³n A tiene tres salidas posibles AB, AC, AD igualmente probables. Su entropÃa es por tanto:

EA = log3

La situaciÃ³n B tiene 2 salidas igualmente probables. Su entropÃa es log 2. La situaciÃ³n C tiene una sola salida y por tanto su entropÃa es 0.

La entropÃa del proceso P ligada a la prueba A, que hemos definido como la media de las entropÃas correspondientes a las distintas salidas de A, deberÃ¡ ser evaluada dentro del contexto total PA. Por tanto serÃ¡:

EP/A = 1__3 EB + 1__3 EC + 1__3 log2 + 1__3 log1 = 1__3 log2

Finalmente la entropÃa del proceso conjunto PA se calcularÃ¡ teniendo en cuenta que ofrece cuatro salidas ABEG, ABFG, ACFG, AD la Ãºltima de ellas extraÃ±a al proceso P, cuyas probabilidades son 1/6; 1/6; 1/3 y 1/3. Por tanto su cÃ¡lculo serÃ¡:

EPA = 1__6 log6 + 1__6 log6 + 1__3 log3 + 1__3 log3

Se observa inmediatamente que se verifica la relaciÃ³n (4) pero no la (3). Las precauciones seÃ±aladas en el cÃ¡lculo son indispensables.

La nociÃ³n de informaciÃ³n

Supongamos que se trata de encontrar las fichas de las huellas dactilares de dos personas en una colecciÃ³n de mil fichas desordenadas. MÃ¡s en general, se trata de localizar dos elementos en un conjunto formado por 1.000 elementos. La entropÃa de esta situaciÃ³n de incertidumbre, o del proceso que debemos realizar, se calcularÃ¡ inmediatamente teniendo en cuenta que la situaciÃ³n correspondiente tiene C21000 salidas posibles, todas ellas igualmente probables. Dicha entropÃa serÃ¡ pues igual a log C21000 = log 499500 = 5,698 u.d. Esta es la cantidad total de incertidumbre contra la que tenemos que luchar en este caso. Ahora bien, se nos ofrecen dos procedimientos igualmente costosos. El primero de ellos nos ofrece la posibilidad de Â«detectarÂ» en un grupo de 100 fichas (o menos) la presencia de una de las fichas buscadas o de las dos fichas. Se trata de la simple presencia no de la localizaciÃ³n de las fichas citadas. Es decir, que una vez realizada la prueba sabremos que el grupo o colecciÃ³n utilizada contiene las dos fichas buscadas, o en el mismo estÃ¡ sÃ³lo una de ellas o no estÃ¡ ninguna de ellas, sin que el procedimiento nos proporcione mÃ¡s resultado. En cambio, el segundo procedimiento opera sobre colecciones de 50 fichas (o menores), pero no se limita a detectar la presencia de las fichas buscadas, sino que las localiza. Es decir, las salidas de este segundo procedimiento pueden ser Ã©stas: las dos fichas buscadas estÃ¡n aquÃ, son Ã©sta y Ã©sta (primera salida); sÃ³lo una de las fichas buscadas estÃ¡ aquÃ y es Ã©sta (segunda salida) y, finalmente (tercera salida) ninguna de las fichas buscadas estÃ¡ en esta colecciÃ³n. Como se ha dicho, se supone que ambos procedimientos son igualmente costosos desde el punto de vista econÃ³mico. Elegiremos sin duda, salvo otras razones ajenas a nuestra exposiciÃ³n, el procedimiento que nos suministre mayor cantidad de informaciÃ³n, es decir, aquel que, por tÃ©rmino medio, nos conduzca a situaciones de menor entropÃa. Recordando la relaciÃ³n (4) antes considerada:

EPA = EA + EP/A

consideraremos representada por la letra A la prueba correspondiente al procedimiento empleado (uno u otro de los que se han indicado y entre los que hay que elegir). Supongamos por ejemplo que hemos aplicado el primer procedimiento a una colecciÃ³n de 100 fichas. Ello habrÃ¡ eliminado parte de la incertidumbre total (que habÃamos antes evaluado en 5,698 unidades decimales). Â¿Pero quÃ© parte? Notemos que despuÃ©s de realizada la prueba A podrÃ¡n presentarse distintas situaciones. Nos interesa calcular la media de las entropÃas de Ã©stas: consideraremos esta media como la entropÃa restante despuÃ©s de la experiencia. En realidad la entropÃa restante podrÃ¡ ser mayor o menor que Ã©sta, pero su valor medio esperado serÃ¡ EP/A. Es decir: despuÃ©s de aplicado el procedimiento a una colecciÃ³n de 100 objetos, la cantidad de incertidumbre que nos queda serÃ¡ por tÃ©rmino medio EP/A. Tratemos de calcular esta entropÃa ligada. Para ello tenemos que evaluar las entropÃas de las situaciones a que puede llevarnos el procedimiento segÃºn las tres salidas que ofrece. El razonamiento se conduce en la forma que vamos a ver a continuaciÃ³n.

Las probabilidades de las tres salidas mencionadas del primer procedimiento son las siguientes:

a) Probabilidad de que las dos fichas buscadas estÃ©n en el grupo de 100. Es:

      C2100 11
      ______ = ______
            C21000 1110

b) Probabilidad de que sÃ³lo una de las fichas buscadas estÃ¡ en el grupo de 100. Es:

       2
      ______
            111.

       899
      _______
            1110

Veamos ahora cuÃ¡les son las entropÃas a las que cada una de esas salidas nos conducen.

a) La primera salida nos conduce a buscar dos fichas en una colecciÃ³n de 100. Por tanto su entropÃa es: log C2100 = log 4950 = 3,695.

b) La segunda salida del procedimiento nos conduce a buscar una ficha en una colecciÃ³n de 100 y una ficha en una colecciÃ³n de 900. Por tanto la entropÃa serÃ¡ la suma de las entropÃas de estos dos procesos, es decir: log100 + log900 = 4,954.

c) La tercera salida nos conduce a buscar dos fichas en una colecciÃ³n de 900. La entropÃa restante serÃa en este caso

log C2900 = log 404550 = 5,607

Conocidas ya las probabilidades de las tres salidas y las entropÃas de los procesos a los que nos conducen, obtendremos la entropÃa media restante, despuÃ©s de la aplicaciÃ³n del procedimiento, con arreglo a la fÃ³rmula del valor medio:

       11      20       899
      ______ . 3,695 + _____ . 4,954 + ______ . 5,607 = 4,667
            1110 111    1110

Por tanto, antes de realizarse la experiencia sobre la colecciÃ³n de 100 fichas, la entropÃa del proceso era:

EP = 5,698

DespuÃ©s de realizarse la experiencia, podremos vernos conducidos a distintas soluciones, y la entropÃa media de estas situaciones serÃ¡:

EP/A = 4,667

Podemos decir que la cantidad de informaciÃ³n aportada por la aplicaciÃ³n del procedimiento o de la prueba de los 100 ha sido de 5,698 - 4,667 = 1,031 unidades decimales de entropÃa.

MÃ¡s en general, que la cantidad de informaciÃ³n aportada por una prueba A en relaciÃ³n con un proceso P viene expresada por la diferencia entre la entropÃa del proceso total y la entropÃa ligada a A. Es decir, que se tiene en general:

Inf. p(A) = EP - EP/A (5)

La notaciÃ³n utilizada en el primer miembro expresa la cantidad de informaciÃ³n proporcionada, por tÃ©rmino medio, por la experiencia A en el proceso de incertidumbre P.

La cantidad de informaciÃ³n se mide pues por las mismas unidades que la entropÃa. EntropÃa e informaciÃ³n son magnitudes homogÃ©neas. La primera radica en el proceso mismo de incertidumbre. La segunda en los procedimientos empleados para deshacer esta incertidumbre.

Continuemos ahora con el examen del caso presentado anteriormente. Debemos ahora evaluar la cantidad de informaciÃ³n que aportarÃa la aplicaciÃ³n del segundo procedimiento —el de las cincuenta fichas.

CÃ¡lculos anÃ¡logos a los efectuados en relaciÃ³n con el primer procedimiento nos llevan los siguientes resultados.

El segundo procedimiento tiene tres salidas posibles. Las probabilidades de las mismas y las entropÃas de las situaciones a las que conducen vienen indicadas a continuaciÃ³n

       245
1Âª salida Probabilidad    EntropÃa de la situaciÃ³n a la que conduce: o
      999000

             95000
2Âª salida Probabilidad    EntropÃa correspondiente 4,676
      999000

            901550
3Âª salida Probabilidad    EntropÃa correspondiente 5,654
      999000

EntropÃa restante media EP/A = 5,106

Diferencia de entropÃas 0,592

La cantidad de informaciÃ³n aportada por el segundo procedimiento es pues de 0,592 unidades decimales. Es menor que la del primer procedimiento.

Por consiguiente, para iniciar el proceso de investigaciÃ³n nos convendrÃ¡ mÃ¡s elegir el primer procedimiento. Esto no significa que una vez realizadas alguna o algunas experiencias, no nos interese cambiar de mÃ©todo ya que las condiciones del problema se van alterando. Pero el decidirnos sobre este punto requerirÃa prolongar el estudio matemÃ¡tico que acabamos de dejar iniciado.

Resumen

En la brevÃsima exposiciÃ³n que acabamos de hacer hemos presentado las tres nociones mÃ¡s importantes y fundamentales del cÃ¡lculo informativo. La primera de ellas la entropÃa o cantidad de incertidumbre contenida en una situaciÃ³n o implicada en un proceso con diversas salidas posibles. En la segunda de estas nociones, la de entropÃa ligada a una prueba o experiencia, se considera la cantidad de incertidumbre restante despuÃ©s de la realizaciÃ³n de dicha prueba. Es decir, que la realizaciÃ³n de la prueba, proporcionÃ¡ndonos nuevos datos sobre la situaciÃ³n, reduce la entropÃa (aunque a veces Ã©sta puede no variar siendo en este caso inÃºtil la experiencia desde el punto de vista de la informaciÃ³n). La tercera nociÃ³n a la que nos conducen las dos anteriores es la de cantidad (media) de informaciÃ³n que puede suministrarnos una prueba o experiencia. En ningÃºn caso podrÃ¡ darse por conocida una situaciÃ³n si las informaciones no cubren la entropÃa total de la misma.

Con estos elementos, hÃ¡bilmente utilizados, se pueden obtener resultados sorprendentes en relaciÃ³n con procesos de comunicaciÃ³n, tales como los que se realizan en los organismos vivos o en las mÃ¡quinas electrÃ³nicas, y tambiÃ©n en otros de carÃ¡cter social, como son los idiomas y los cÃ³digos. Pero naturalmente no podemos en los estrechos lÃmites de esta nota iniciar al lector en estos dominios de aplicaciÃ³n.

anterior | siguiente

El sistema de búsqueda busca una sucesión de letras dada (no funciona con lematizador y no realiza análisis lingüístico).
Busca las formas que comienzan con la sucesión de letras dada, y no contempla dicha búsqueda en interior de palabra (el resultado de la búsqueda barc será barca, barcos, Barcala, Barcelona, barcelonesa..., pero no embarcación, embarcarse...).
Se pueden buscar sucesiones de palabras (pacifismo cristiano, por ejemplo, o partido comunista francés).
Es posible especificar el corpus: solo en textos en castellano / solo en textos en euskera / en todos los idiomas (euskera, castellano y francés).

Selección de idioma

Menú de campus

Campus Gipuzkoa

Menú principal (perfiles, estudios, estructura, investigación, acceso a la universidad, áreas temáticas, servicios y directorio)

Ruta de migas

Carlos Santamaría y su obra escrita