La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

1 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido.

Presentaciones similares


Presentación del tema: "1 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido."— Transcripción de la presentación:

1

2 1 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

3 2 INTRODUCCIÓN Un gran porcentaje de la información nos llega a través de la vista. Un gran porcentaje de la información nos llega a través de la vista. -Problema: personas con deficiencias visuales. -Solución: métodos alternativos (tacto...) Avances en la sonificación de datos. Avances en la sonificación de datos. -No sucede lo mismo con las imágenes. Sonificación :Representación de imágenes por medio de sonidos. Sonificación :Representación de imágenes por medio de sonidos.

4 3 INTRODUCCIÓN Optófono como instrumento para sonificar una imagen o escena. Optófono como instrumento para sonificar una imagen o escena. Problema: limitada capacidad de asimilación de información auditiva en comparación con la visual. Problema: limitada capacidad de asimilación de información auditiva en comparación con la visual. - Solución: eliminar información para simplificar.

5 4 SONIFICACIÓN Sonificación: uso de sonido no hablado ( nonspeech audio ) para tratar o canalizar la información Sonificación: uso de sonido no hablado ( nonspeech audio ) para tratar o canalizar la información Áreas de interés: desde el estudio sobre la percepción humana hasta la elección de dispositivos acústicos. Áreas de interés: desde el estudio sobre la percepción humana hasta la elección de dispositivos acústicos. Foro internacional de investigación en el área de la sonificación (ICAD). Foro internacional de investigación en el área de la sonificación (ICAD).

6 5 ACCESO A LA INFORMACIÓN (La percepción) ACCESO A LA INFORMACIÓN (La percepción) Proceso mediante el cual se maneja la información. Proceso mediante el cual se maneja la información. Según Jacobson (1950,1951) el ojo tiene una capacidad de asimilación de información de 130 x 10 6 x 18 = 2340 x 10 6 bits/s. Según Jacobson (1950,1951) el ojo tiene una capacidad de asimilación de información de 130 x 10 6 x 18 = 2340 x 10 6 bits/s. Un humano puede distinguir un rango de frecuencia entre 30 y Hz. Un humano puede distinguir un rango de frecuencia entre 30 y Hz. La capacidad del oído con estos datos es de 1450 x 4 x 7.7 = bits/s. La capacidad del oído con estos datos es de 1450 x 4 x 7.7 = bits/s.

7 6 ACCESO A LA INFORMACIÓN (Distintas formas de percepción) ACCESO A LA INFORMACIÓN (Distintas formas de percepción) Percepción como una colección de datos y su procesamiento. Percepción como una colección de datos y su procesamiento. Diversos animales obtienen la información en una forma poco usual: Diversos animales obtienen la información en una forma poco usual: - Murciélagos: emiten ultrasonidos - Serpiente cascabel: detecta infrarrojos - Pez torpedo: produce corrientes eléctricas

8 7 ACCESO A LA INFORMACIÓN ¿y si falla la percepción visual? ACCESO A LA INFORMACIÓN ¿y si falla la percepción visual? Braille (XIX) inventó un sistema para representar las letras del alfabeto en relieve. Braille (XIX) inventó un sistema para representar las letras del alfabeto en relieve. -Inconvenientes: excesivo volumen de las copias y alto coste de producción. Métodos complementarios: grabaciones en cinta magnetofónica, escáner y ordenador.. Métodos complementarios: grabaciones en cinta magnetofónica, escáner y ordenador.. Proyecto Tiflonet, Web por y para ciegos. Proyecto Tiflonet, Web por y para ciegos.

9 8 ACCESO A LA INFORMACIÓN ¿y si falla la percepción visual? ACCESO A LA INFORMACIÓN ¿y si falla la percepción visual? Aparatos para convertir información visual: Aparatos para convertir información visual: * TVSS : Sistema de substitución sensorial * TVSS : Sistema de substitución sensorial * Contador Geiger : emite señales acústicas en respuesta a diferentes niveles de radiación según cambios en el medio. * Contador Geiger : emite señales acústicas en respuesta a diferentes niveles de radiación según cambios en el medio. * Pulsioxímetro: produce señales acústicas que varían en intensidad según el nivel de oxígeno en sangre del paciente. * Pulsioxímetro: produce señales acústicas que varían en intensidad según el nivel de oxígeno en sangre del paciente. ¿Y qué pasa con las imágenes? ¿Y qué pasa con las imágenes? Aplicación de la sonificación. Aplicación de la sonificación.

10 9 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

11 10 OBJETIVOS Transformar una señal visual simplificada (imagen bidimensional o sintética) en una señal de audio equivalente. Transformar una señal visual simplificada (imagen bidimensional o sintética) en una señal de audio equivalente. Optófono que distingue intensidades de gris. Optófono que distingue intensidades de gris. Es importante la simplificación de la escena a sonificar. Es importante la simplificación de la escena a sonificar. -Diferentes métodos de segmentación de imágenes : * Reducción de la resolución espacial * Detección de bordes

12 11 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

13 12 PROCESAMIENTO DE IMÁGENES PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

14 13 REPRESENTACIÓN DE IMÁGENES REPRESENTACIÓN DE IMÁGENES Imagen digital > f (x,y) Imagen digital > f (x,y) -(x,y) : coordenadas de la imagen -f : nivel de gris en la posición (x,y) Se caracteriza por MxNxL: Se caracteriza por MxNxL: -M : número de filas -N : número de columnas -L : número de bits para representar cada pixel

15 14 PROCESAMIENTO DE IMÁGENES PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

16 15 CONVERSIÓN A GRISES CONVERSIÓN A GRISES Optófono sólo trabaja con niveles de gris. Optófono sólo trabaja con niveles de gris. -Convertir la imagen a escala de grises. El ojo humano percibe desde 380 a 780 nm (desde el violeta hasta el rojo). El ojo humano percibe desde 380 a 780 nm (desde el violeta hasta el rojo). Obtención de gris a partir de colores: Obtención de gris a partir de colores: Y = R*0.3 + G* B*0.11

17 16 CONVERSIÓN A GRISES CONVERSIÓN A GRISES Imagen de Lenna como imagen clásica en el procesado de imágenes. Imagen de Lenna como imagen clásica en el procesado de imágenes. ). a)Imagen de Lenna a color; b) Imagen de Lenna en escala de grises (256 niveles)

18 17 PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

19 18 NEGATIVO DE UNA IMAGEN NEGATIVO DE UNA IMAGEN Transformar cada píxel en la escala de grises en una imagen con niveles de intensidad invertidos. Transformar cada píxel en la escala de grises en una imagen con niveles de intensidad invertidos. Operación: nuevo_píxel = MAX - viejo_píxel Operación: nuevo_píxel = MAX - viejo_píxel Fig. 6: a) Lenna a 256 niveles de gris; b) Lenna en negativo.

20 19 PROCESAMIENTO DE IMÁGENES PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

21 20 UMBRALIZACIÓN UMBRALIZACIÓN Método de segmentación: Método de segmentación: - Imagen en escala de grises > Imagen con sólo dos niveles de gris separando objetos del fondo. si (viejo_píxel>umbral) nuevo_píxel = MAX nuevo_píxel = MAXsino nuevo_píxel = MIN nuevo_píxel = MIN

22 21 Ejemplos: Ejemplos: UMBRALIZACIÓN UMBRALIZACIÓN Lenna con un umbral bajo ; Lenna a 256 niveles de gris ; Lenna con un umbral alto ; Lenna con un umbral intermedio ;

23 22 PROCESAMIENTO DE IMÁGENES PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

24 23 CUANTIZACIÓN Convertir una imagen con una escala de grises de x niveles a otra con una escala menor, reduciendo el volumen de datos. Convertir una imagen con una escala de grises de x niveles a otra con una escala menor, reduciendo el volumen de datos. Lenna a 256 niveles de gris; Lenna a 16 niveles de gris; Lenna a 8 niveles de gris; Lenna a 4 niveles de gris.

25 24 PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

26 25 REDUCCIÓN DE LA RESOLUCIÓN Una imagen de grandes dimensiones generará muchos sonidos. Una imagen de grandes dimensiones generará muchos sonidos. - Inconveniente: difícil de asemejar a una escena. Habrá que eliminar información para simplificar. Habrá que eliminar información para simplificar. Lenna con una resolución de 256 x 256 Lenna con una resolución de 64 x 64 píxeles

27 26 PROCESAMIENTO DE IMÁGENES Representación de imágenes Representación de imágenes Conversión a grises Conversión a grises Negativo de una imagen Negativo de una imagen Umbralización Umbralización Cuantización Cuantización Reducción de la resolución de la imagen Reducción de la resolución de la imagen Filtros Filtros

28 27 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Conclusiones Conclusiones

29 28 FORMATO WAV Introducción Introducción Características Características Conceptos Conceptos Formato Formato

30 29 FORMATO WAV Introducción Introducción – Formato de archivo originario de Microsoft. – Es un estándar en audio digital para PC. – Contienen información del audio del mundo real, esto es la representación digital de una señal analógica.

31 30 FORMATO WAV Características Características – Muy flexible Usado para tratamiento del sonido – Gran Calidad Ocupa gran tamaño – Compatibilidad para convertirse en otros formatos.

32 31 FORMATO WAV Conceptos Conceptos – Frecuencia del tono. – Sonido. – Timbre. – Intensidad.

33 32 FORMATO WAV Frecuencia: Frecuencia: – indicar el número de veces que se repite en un segundo cualquier fenómeno periódico – Su unidad es el herzio. – Frecuencia del tono: – característica del sonido que indica su altura. – A medida que aumenta la frecuencia también lo hace el tono

34 33 FORMATO WAV Sonido: Sonido: –fenómeno físico que estimula el sentido del oído debido a vibraciones del medio que llegan al oído interno Timbre: Timbre: –cualidad que permite distinguir los sonidos producidos por los diferentes instrumentos Intesidad Intesidad –cualidad que permite distinguir entre sonidos fuertes o débiles

35 34 FORMATO WAV Un fichero WAVE se compone de: –cabecera formada por el descriptor RIFF –dos sub-campos fmt, que especifica el formato de los datos fmt, que especifica el formato de los datos data, campo de datos data, campo de datos

36 35 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

37 36 De La Imagen al Sonido Vamos a generar sonido a partir de una imagen digital en escala de grises en base a las características visuales de la misma Vamos a generar sonido a partir de una imagen digital en escala de grises en base a las características visuales de la misma Es decir, Sonificamos una imagen por columnas, creando una onda sonora de cada uno de los píxeles que contiene. Es decir, Sonificamos una imagen por columnas, creando una onda sonora de cada uno de los píxeles que contiene.

38 37 De la Imagen al Sonido El nivel de gris de cada píxel está directamente relacionado con la amplitud de la onda que genera (el volumen del sonido). El nivel de gris de cada píxel está directamente relacionado con la amplitud de la onda que genera (el volumen del sonido). La altura de cada píxel determina la frecuencia de la onda (que está relacionada íntimamente con el tono del sonido) La altura de cada píxel determina la frecuencia de la onda (que está relacionada íntimamente con el tono del sonido) Para sonificar la imagen antendemos a la siguiente relación intuitiva:

39 38 De la Imagen al Sonido La suma que se forma de la contribución de cada uno de los píxeles es el sonido correspondiente a la primera columna. Para sonificar la imagen entera, barremos las sucesivas columnas, generando así el sonido total compuesto por los sonidos individuales de cada una de ellas La suma que se forma de la contribución de cada uno de los píxeles es el sonido correspondiente a la primera columna. Para sonificar la imagen entera, barremos las sucesivas columnas, generando así el sonido total compuesto por los sonidos individuales de cada una de ellas De esta manera, la duración del sonido debido a la sonificación de toda la imagen será suma de las duraciones parciales de las ondas de todas las columnas.

40 39 De la Imagen al Sonido Cuando la imagen k-1-ésima es transformada en sonido, la imagen k-ésima es muestreada, digitaliza y almacenada como M columnas x N filas. Cuando la imagen k-1-ésima es transformada en sonido, la imagen k-ésima es muestreada, digitaliza y almacenada como M columnas x N filas.

41 40 De la Imagen al Sonido La sonificación de forma algebraica se puede expresar como: La sonificación de forma algebraica se puede expresar como: –x=1..N, la posición de la columna en la imagen de dimensiones NxM, –y=1..M la posición del píxel en la columna, –I x,y el nivel de gris del píxel situado en la posición (x, y) de la imagen –w la frecuencia perteneciente a la altura y

42 41 De la Imagen al Sonido Problema Problema –El acoplamiento de las funciones correspondientes a las columnas para crear la sonificación de toda la imagen creará sonidos extremadamente complejos y sin aparente sentido –Más problemas en imágenes de gran detalle y multitud de grises.

43 42 De la Imagen al Sonido El conjunto de frecuencias usado en el proceso de sonificación puede ser en principio arbitrario El conjunto de frecuencias usado en el proceso de sonificación puede ser en principio arbitrario Hay dos buenos conjuntos de frecuencias Hay dos buenos conjuntos de frecuencias –la distribución lineal (equidistante) –la exponencial El uso de la Escala Natural y Cromática expresa de un modo más intuitivo el sonido producido. El uso de la Escala Natural y Cromática expresa de un modo más intuitivo el sonido producido.

44 43 De la Imagen al Sonido ¿Por qué la escala natural? ¿Por qué la escala natural? –Por la educación del oido humano –El salto de una frecuencia a otro no es lineal, aunque lo parezca –La escala natural se utiliza fundamentalmente para imágenes de dimensiones pequeñas ¿Por qué la escala cromática? ¿Por qué la escala cromática? – nuestro salto unitario se corresponde con un semitono – algo más grandes pues en una única octava tenemos hasta 12 sonidos diferentes

45 44 De la imagen al Sonido Conclusiones: Conclusiones: –El sonido creado tras el barrido de la imagen representará a la propia imagen –Hay que aprender a escuchar las imágenes –importancia en personas con discapacidades visuales

46 45 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

47 46 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

48 47 NOTICIAS Ciegos ven en el PC (Revista Siglo 21) Ciegos ven en el PC (Revista Siglo 21) Ciegos ven en el PC Ciegos ven en el PC Blind see with sound (BBC) Blind see with sound (BBC) Blind see with sound Blind see with sound

49 48 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido De imagen a sonido Experimentos Experimentos Noticias Noticias Conclusiones Conclusiones

50 49 CONCLUSIONES Campo de investigación actual: SONIFICACIÓN Campo de investigación actual: SONIFICACIÓN Exceso de información de las imágenes: necesidad de segmentación (técnicas). Exceso de información de las imágenes: necesidad de segmentación (técnicas). Pensado para personas con discapacidades visuales. Pensado para personas con discapacidades visuales.


Descargar ppt "1 ÍNDICE Introducción Introducción Objetivos Objetivos Procesamiento de imágenes Procesamiento de imágenes Formato WAVE Formato WAVE De imagen a sonido."

Presentaciones similares


Anuncios Google