La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Elementos de Teoría de la Información 27-Marzo-2012.

Presentaciones similares


Presentación del tema: "Elementos de Teoría de la Información 27-Marzo-2012."— Transcripción de la presentación:

1 Elementos de Teoría de la Información 27-Marzo-2012

2 Antes continuemos con algunos puntos de “N1” ….. Los medios de transmisión…. …. Y las “perturbaciones” …..

3 Perturbaciones en la transmisión La señal recibida puede diferir de la señal transmitida Analógico - degradación de la calidad de la señal Digital – Errores de bits Causado por  Atenuación y distorsión de atenuación  Distorsión de retardo  Ruido

4 Atenuación La intensidad de la señal disminuye con la distancia Depende del medio La intensidad de la señal recibida:  Debe ser suficiente para que se detecte  Debe ser suficientemente mayor que el ruido para que se reciba sin error  Crece con la frecuencia Ecualización: amplificar más las frecuencias más altas Problema “menos grave” para las señales digitales

5 Distorsión de retardo Sólo en medios guiados La velocidad de propagación en el medio varía con la frecuencia Para una señal limitada en banda, la velocidad es mayor cerca de la frecuencia central Las componentes de frecuencia llegan al receptor en distintos instantes de tiempo, originando desplazamientos de fase entre las distintas frecuencias

6 Ruido (1) Señales adicionales insertadas entre el transmisor y el receptor Térmico  Debido a la agitación térmica de los electrones  Aumenta linealmente con la temperatura absoluta (N 0 = kT)  Uniformemente distribuido en la frecuencia  Ruido blanco (N BW = kTB) Intermodulación  Señales que son la suma y la diferencia de frecuencias originales y sus múltiplos (mf 1 ± nf 2 )  Se produce por falta de linealidad

7 Ruido (2) Diafonía  Una señal de una línea se mete en otra Impulsivo  Impulsos irregulares o picos  Ej: Interferencia electromagnética externa (tormenta)  Corta duración  Gran amplitud

8 Efecto del ruido en señal digital

9 Conceptos relacionados con la capacidad del canal Velocidad de datos  En bits por segundo  Velocidad a la cual se pueden transmitir los datos Ancho de Banda  En ciclos por segundo (hertz)  Limitado por el transmisor y el medio Ruido, nivel medio a través del camino de transmisión Tasa de errores, cambiar 0 por 1 y viceversa (BER, Bit Erro Rate)

10 Ancho de Banda de Nyquist (ancho de banda teórico máximo) Para 2 niveles SIN RUIDO  Velocidad binaria Para M niveles SIN RUIDO  Velocidad binaria  1 Baudio = 1 estado señalización/sg  1 Baudio = 1 bps si M=2  La relación entre la velocidad de transmisión C y la velocidad de modulación V es: Nyquist, H., “Certain Factors Affecting Telegraph Speed,” Bell System Technical Journal, April 1924, p. 324; “Certain Topics in Telegraph Transmission Theory,” A.I.E.E. Trans., v. 47, April 1928, p. 617.

11 Capacidad de Shannon (1) Para un cierto nivel de ruido, a mayor velocidad, menor período de un bit, mayor tasa de error (se pueden corromper 2 bits en el tiempo en que antes se corrompía 1 bit) Relación Señal / Ruido (Signal Noise Ratio, SNR) en dB Restricción: no se puede aumentar M cuanto se quiera porque debe cumplirse:

12 Capacidad de Shannon (2) En principio, si se aumenta el ancho de banda B y la potencia de señal S, aumenta la velocidad binaria C. Pero:  Un aumento del ancho de banda B aumenta el ruido  Un aumento de potencia de señal S aumenta las no linealidades y el ruido de intermodulación Por tanto, la velocidad binaria teórica máxima será: =>

13 Ejemplo Canal entre 3 MHz y 4 MHz Relación señal ruido = 24 dB, SNR=10 2,4 =251 Calcular ancho de banda  Respuesta: B = 1 MHz Calcular la velocidad binaria teórica máxima y el número de niveles  Respuesta: SNR = 251  Respuesta: C = 8 Mbps  Respuesta: M = 16 niveles

14 Teoría de la Información y Codificación

15 Teoría de la Información Claude Shannon estableció la Teoría de la Información Clásica Dos Teoremas Fundacionales: 1.Noiseless source coding 2.Noisy channel coding C. E. Shannon, Bell System Technical Journal, vol. 27, pp. 379-423 and 623-656, July and October, 1948. Reprinted with corrections from The Bell System Technical Journal,

16 Uno de ellos describe la máxima eficiencia posible de un método de corrección de errores ( codificación ) frente a los niveles de ruido y de corrupción de los datos. No dice nada sobre como implementar dicha codificación. En definitiva brinda el limite para la TX de bits (basándose en la Ley de los Grandes Números ) Teoría de Shannon

17 February 8, 2010Harvard QR4817 Shannon, paper Bell Labs (1948)

18 C. E. Shannon, Bell System Technical Journal, vol. 27, pp. 379-423 and 623-656, July and October, 1948 A method is developed for representing any communication system geometrically. Messages and the corresponding signals are points in two “function spaces,” and the modulation process is a mapping of one space into the other. Using this representation, a number of results in communication theory are deduced concerning expansion and compression of bandwidth and the threshold effect. Formulas are found for the maximum rate of transmission of binary digits over a system when the signal is perturbed by various types of noise. Some of the properties of “ideal” systems which transmit at this maximum rate are discussed. The equivalent number of binary digits per second for certain information sources is calculated.

19 C. E. Shannon (January 1949). "Communication in the presence of noise" Proc. Institute of Radio Engineers vol. 37 (1): 10–21. C. E. Shannon"Communication in the presence of noise"Proc. Institute of Radio Engineers THE recent development of various methods of modulation such as PCM and PPM which exchange bandwidth for signal-to-noise ratio has intensified the interest in a general theory of communication. A basis for such a theory is contained in the important papers of Nyquist and Hartley on this subject. In the present paper we will extend the theory to include a number of new factors, in particular the effect of noise in the channel, and the savings possible due to the statistical structure of the original message and due to the nature of the final destination of the information. The fundamental problem of communication is that of reproducing at one point either exactly or approximately a message selected at another point. Frequently the messages have meaning; that is they refer to or are correlated according to some system with certain physical or conceptual entities. These semantic aspects of communication are irrelevant to the engineering problem. The significant aspect is that the actual message is one selected from a set of possible messages. The system must be designed to operate for each possible selection, not just the one which will actually be chosen since this is unknown at the time of design. If the number of messages in the set is finite then this number or any monotonic function of this number can be regarded as a measure of the information produced when one message is chosen from the set, all choices being equally likely. As was pointed out by Hartley the most natural choice is the logarithmic function. Although this definition must be generalized considerably when we consider the influence of the statistics of the message and when we have a continuous range of messages, we will in all cases use an essentially logarithmic measure.

20 Modelo de un Sistema de Comunicaciones

21 “If the rate of Information is less than the Channel capacity then there exists a coding technique such that the information can be transmitted over it with very small probability of error despite the presence of noise.”

22 Información

23 Definición : unidades

24 1 Bit

25 Fuente de memoria nula

26 Memoria nula (cont)

27 Entropía

28 Entropía (cont) La entropía de un mensaje X, que se representa por H(X), es el valor medio ponderado de la cantidad de información de los diversos estados del mensaje. H(X) = -  p(x) log2 [1/p(x)] Es una medida de la incertidumbre media acerca de una variable aleatoria y el número de bits de información. El concepto de incertidumbre en H puede aceptarse. Es evidente que la función entropía representa una medida de la incertidumbre, no obstante se suele considerar la entropía como la información media suministrada por cada símbolo de la fuente

29 Entropía: Fuente Binaria

30 a) La entropía es no negativa y se anula si y sólo si un estado de la variable es igual a 1 y el resto 0. b) La entropía es máxima, mayor incertidumbre del mensaje, cuando todos los valores posibles de la variable X son equiprobables (empíricamente fácil). Si hay n estados equiprobables, entonces p i = 1/n. Luego: H(X) = -  p i log 2 p i = - n(1/n) log 2 (1/n) = - (log 2 1 - log 2 n) i H(X) máx = log 2 n Propiedades de la entropía

31 Si existe una segunda variable Y que influya sobre X, esto nos entregará importante información adicional. H(X/Y) = -  p (x,y) log 2 p (x,y) x,y Luego: H(X/Y) = -  p (y)  p (x/y) log 2 p (x/y) y x La entropía se reduce: hay más orden y menos incertidumbre. Entropía condicional Donde p(x,y) = p(y)p(x/y) y la relación p(x/y) es la probabilidad de que se obtenga un estado X conocido el valor de Y.

32 Sea X = {x 1, x 2, x 3, x 4 } con p(x i ) = 0.25 Sea ahora Y = {y 1, y 2, y 3 } con p(y 1 ) = 0.5; p(y 2 ) = 0.25; p(y 3 ) = 0.25 Luego H(X) = 4 log 2 4 = 2.0 y H(Y) = 2 log 2 4 + log 2 2 = 1.5 Además hay las siguientes dependencias entre X e Y: Si Y = y 1  X = x 1 o x 2 o x 3 o x 4 (cualquiera con igual probabilidad) Si Y = y 2  X = x 2 o x 3 (cualquiera con igual probabilidad) Si Y = y 3  X = x 3 o x 4 (cualquiera con igual probabilidad) y=3 x=4 Como H(X/Y) = -  p (y)  p (x/y) log 2 p (x/y) y=1 x=1 H(X/Y) = - p(y 1 )[p(x 1 /y 1 )log 2 p(x 1 /y 1 ) + p(x 2 /y 1 )log 2 p(x 2 /y 1 ) + p(x 3 /y 1 )log 2 p(x 3 /y 1 ) + p(x 4 /y 1 )log 2 p(x 4 /y 1 )] - p(y 2 )[p(x 1 /y 2 )log 2 p(x 1 /y 2 ) + p(x 2 /y 2 )log 2 p(x 2 /y 2 ) + p(x 3 /y 2 )log 2 p(x 3 /y 2 ) + p(x 4 /y 2 )log 2 p(x 4 /y 2 )] - p(y 3 )[p(x 1 /y 3 )log 2 p(x 1 /y 3 ) + p(x 2 /y 3 )log 2 p(x 2 /y 3 ) + p(x 3 /y 3 )log 2 p(x 3 /y 3 ) + p(x 4 /y 3 )log 2 p(x 4 /y 3 )] Calculando, se obtiene H(X/Y) = 1.0 + 0.25 + 0.25 = 1.5. La entropía de X ha bajado en medio bit con el conocimiento de su relación con Y. Ejemplo

33 Extensión de una Fuente de Memoria Nula

34 Fuente de Markov

35 Fuente de Markov (cont)

36

37 37 Establecer una correspondencia entre los símbolos de una fuente y los símbolos del alfabeto de un código. Codificación de Fuente Proceso encaminado a lograr una representación más eficiente de la información ( eliminar redundancia)*.

38 Condiciones del código 38 singular separable (Únicamente decodificable) instantáneo

39 Consideremos cuatro códigos 39 m1 --- 01 m1 --- 0 m1 --- 0 m1 --- 0 m2 --- 01 m2 --- 01 m2 --- 01 m2 --- 10 m3 --- 10 m3 --- 001 m3 --- 011 m3 --- 110 abcd No singular singulares no separable separables instantáneo*

40 Condición de los prefijos 40 La condición necesaria y suficiente para que un código sea instantáneo es que sus palabras cumplan la condición de los prefijos: No exista palabra que sea prefijo de otra palabra de longitud mayor No exista palabra que sea prefijo de otra palabra de longitud mayor.*

41 Condiciones del código 41 Códigos No Singulares Singulares No separables Separables No instantáneos Instantáneos

42 Códigos eficientes 42 l i longitud de la palabra codificada del mensaje m i r : # de símbolos del alfabeto del código L =  p i l i : Longitud promedio de la palabra* Estrategia Estrategia: Asignar palabras más cortas a símbolos más probables

43 Eficiencia de un código 43 log r : Cantidad promedio máxima de información de un símbolo del código. L log r  H(s)  Eficiencia del código :  S) / ( L log r) *

44

45 Nos falta encontrar el segundo término pendiente en la definición de cantidad de información: codificador óptimo. Introduciendo el signo negativo dentro del logaritmo en la expresión de la entropía, ésta nos quedará como: H(X) =  p(x) log 2 [1/p(x)] i La expresión log 2 [1/p(x)] representa el número necesario de bits para codificar el mensaje X en un codificador óptimo. Codificador óptimo es aquel que para codificar un mensaje X usa el menor número posible de bits. Codificador óptimo Veamos un ejemplo de codificación

46 M = 1 “ ” = 01 A = 000 I = 0010 E = 0011 Código óptimo: Mensaje: MI MAMA ME MIMA Mensaje: 1 0010 01 1 000 1 000 01 1 0011 01 1 0010 1 000 (33 bits) Pregunta: ¿Con cuántos bits se codificaría si se usara ASCII? Saque conclusiones. Creación del árbol de frecuencias observadas Codificación de Huffman

47 47 Del poema “El Golem “ de Borges ….. Cual es la Entropía Si bien el archivo de texto fue codificado en ASCII como harías una nueva codificación del mismo ….


Descargar ppt "Elementos de Teoría de la Información 27-Marzo-2012."

Presentaciones similares


Anuncios Google