La descarga está en progreso. Por favor, espere

La descarga está en progreso. Por favor, espere

Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por.

Presentaciones similares


Presentación del tema: "Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por."— Transcripción de la presentación:

1 Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por Virginia Yip (Universidad China de Hong Kong) y Stephen Matthews (Universidad de Hong Kong).

2 Vista general 1. ¿Qué es el sistema CHILDES? 2. ¿Cómo instalar el programa CLAN? 3. ¿Cómo acceder al Corpus de datos? 4. Qué es un sistema de transcripción? 5. Cómo usar los comando en CLAN? 6. Cómo construir un corpus? (una introducción breve)

3 1. ¿Qué es el sistema CHILDES?

4 1. Qué es el sistema CHILDES? El sistema CHILDES proporciona herramientas para estudiar las interacciones conversacionales. Estas herramientas incluyen: ~ una base de datos de transcripciones ~ programas para el análisis de las transcripciones con ordenadors. ~ métodos de codificación lingüística ~ sistemas para conectar las transcripciones a las grabaciones digitales de audio y video.

5 2. ¿Cómo instalar CLAN?

6 2. Cómo instalar el progama CLAN a.) El programa CLAN está disponible para descarga gratuita en: Puedes localizar el programa en las Seccioens PROGRAM & Data

7 Para sistemas Windows pulsa el botón derecho del ratón >> guardar archivo como >> elige el directorio para el archivo descargado. En Macintosh, haz click en el enlace y se salvará automáticamente (b) The download page Descarga la fuente Arial Unicode e instálala en tu PC. Luego podrás ver las fuentes Arial Unicode usadas en el corpus.

8 Para Windows: la instalación exige hacer click sobre el archivo de instalación y seguir las indicaciones dadas por InstallShield c) Instale el programa en su PC o MAC. Para Macintosh: la instalación exige descomprimir el archivo haciendo doble click sobre la aplicacón. Para hacer funcionar CLAN en UNIX en MacOS X, use la disstribución UNIX.

9 Reinicie Windows después de la instalación Un icono de CLAN se encuentra en el escritorio

10 3. ¿Cómo acceder al Corpus?

11 3. Cómo acceder al corpus de datos a.) El Corpus de datos está disponible para descarga gratuita en: Puedes localizar el Corpus de Datos en las Secciones PROGRAM & Data

12 b) La página de descarga Puedes localizar el Corpus de Datos Bilingües en la Sección Special Type. En esta sección, sólamente están disponibles archivos cha. Puedes descargar el Corpus de Datos Bilingües con archivos de audio en la Sección Downloadable (=descargable) Puedes ojear el Corpus de Datos online con Internet Explores/Netscape en la Sección Directly Browsable (visible directamente)

13 En Windows, haz click en el botón derecho del ratón >> salvar archvo como >> eige el directorio para la descarga del archivo. En Macintosh, haz click en el enlace y se guardará automáticamente.

14 c) Archivos CHA Si tienes el programa Winzip/Winrar, puedes descomprimir el corpus descargado haciendo click en el botón derecho del ratón >> Extraer aquí Después de la descompresión, puedes localizar múltiples carpetas dentro de la carpeta descomprimida. Cada carpeta contiene muchos archivos da. Son las transcripciones de niños bilingües.

15 4. ¿Qué es el sistema de transcripción?

16 Encabezados (indicados L í neas principales (comienzan con * ) L í neas dependientes (comienzan con % ) Estructura de la transcripción: Una transcripción está compuesta normalmente de tres subpartes: los encabezados las líneas principales las líneas dependientes. 4. ¿Qué es el sistema de transcripción?

17 Coloca los archivos correspondientes de audio y cha en la misma carpeta Abre el archivo CHA haciendo dos veces click en él. >>Mode >>Sonic El modo Audio Wave del archivo de sonido se abrirá dentro de la ventana de CLAN. Puedes o pulsar Esc+8 o Click Mode >> Reproducción continua b) Cómo reproducir los archivos de audio.

18 Coloca los los archivos de vídeos correspondiente s y los arvhicos cha juntos en la misma carpeta. Puedes usar o Esc+8 o Modo Click >> Reproducción continua en el enlace de transcripción de Vídeo c) Cómo reproducir archivos de vídeo.

19 5. ¿Cómo usar CLAN ?

20 5. Como usar Command dentro del CLAN a.) The Command window Ventana Window >> Commands o Ctrl+D La ventana Command aparece. Localice la carpeta destino de los archivos.cha haciendo click el primer botón working. Puede hacer funcionar los commands aquí.

21 b) La estructura de los Comandos freq +t*CHI 0042.cha mlu +t*MOT 0042.cha Un comand se compone básicamente de 3 partes El tipo de comando La(s) etiqueta(s) El archivo de destino Comando etiqueta(s) (comienza con +t ) El arhcivo(s) destino (terminan con.cha o.cex ) combo +t*MOT +s"kitty^kitty" 0042.cha kwal +sbunny -w2 +w cha Hay algunas opciones únicas para cada comando. Puede mirar en el manual CLAN para más detalles. Los siguientes son algunos ejemplos: +s xx^xx (busca los datos para combinaciones espec í ficas de palabras o cadenas de caracteres) Las opciones -w y +w indica cuántas líneas de texto deberían incluirse antes y después de las palabras buscadas.

22 c) Algunos comandos útiles 1. MLU ~ Se usa principalemente para determinar la longitud media de las produccioens de un hablante concreto. ~ Proporciona también el número total de produciones y de morfemas en un archivo. ~ La proporción de morfemas en relación con las producciones (MLU) surge de aquellos dos totales. ~ Ejemplo: mlu +t*CHI *.cha La ventana Command se abre.. Localice la carpeta destino de los archivos.cha haciendo click el primer botón working. Puedes ejecutar comandos mlu +t*CHI *.cha El resultado del comando se muestra así.

23 2. Frecuencia ~FREQ cuenta la frecuencia de palabras usadas en los archivos seleccionados. Calcula también la proporción de tipo-de-habla usada commo medida de la diversidad lexical. ~ Example: freq +t*CHI CE cha Una parte del resultado del comando usado anterioremente sería la siguiente:

24 3. Kwal ~ KWAL busca datos de palabras específicas de usuario y las muestra en el contexto. La opción +s se usa para especificar las palabras que van a ser buscadas. ~Ejemplo: kwal +t*CHI +t%mor +sbut CE cha Una muestra del resultado del comando usado antes sería el siguiente:

25 4. Combo ~COMBO es un programa potente que busca las coincidencias de combinaciones específicas de palabras o cadenas de caracteres. ~Ejemplo: combo +t*CHI +what^is CE cha Una muestra del resultado del comando usado antes sería lo siguiente:

26 Puede localizar el manual del programa CLAN aquí. 5. Manual El Manual de Clan está disponible para us descarga gratuita en:http://childes.psy.cmu.edu/http://childes.psy.cmu.edu/ Instale el lector Adobe Acrobat para poder ver el manual en formato pdf.

27 6. ¿Cómo construir un Corpus? (breve introducción)

28 Prepare un cable Mini- mini stereo Enchufe un extremo del cable de audio a la conexión de salida en tu walkman, grabadora o mini-disc. Asegurate de que tiene energía (baterías o conexión a la red). Enchufa el otro extremo del cable de audio a la conexión de entrada en la tarjeta de sonido de tu ordenador PC or MAC. 1. Procesado de sonido digital a) Conecte la fuente de audio (DAT, casette, minidisk, etc.) al ordenador.

29 b) Instala un programa de audio digital. ~ Para los Macs más antiguos: Sound Edit 16 (http://www.macromedia.com/software/sound/ )http://www.macromedia.com/software/sound/ ~ Para Windows: CoolEdit ( ).http://syntrillium.com/ También, Windows proporciona grabación de sonido en Accesorios del sistema, aunque esta característica tiene algunas limitaciones. ~ Para Mac OS X: Peak 3.0 ( ). Hay también programas de grabación gratuitos y copartidos (shareware), con sus limitaciones propias.http://bias-inc.com Ventana de Cool Edit 2000 Captura de pantalla de Peak 3.0

30 Una vez que termine la gración, convierte de estereo a mono. Salva el archivo como *.aif o mp3. Si un punto rojo o bloque rojo aparece en el área de niveles de grabación el sonido esta siendo recortado. Por ejemplo, si un niño está sentado muy cerca del micrófono y comienza a gritar los valores máximos y mínimos de la señal son suprimidos. Esto provoca una muesta digitalizada pobre.

31 2) Transcripción en el programa Clan Hay varias formas de realizar la transcripción en un ordenador. Se puede usar: Note Pad y salvar la tarnscripción com un archivo *.txt Abre el archivo *.txt en el editor CLAN. Salvar el archivo como *.cha MS Word and salvar la transcripción como *.doc,. Pega tu texto en el Editor CLAN Salvar el archivo como *.cha Editor CLAN Salvar el archivo como *.cha

32 3.) Transcribir ~ Si no tiene la grabación digitalizada, puede usar una grabadora/reproductora de cintas. Reproduzca la cinta y transcriba el texto. Sin embargo, deberá rebobinar muchas veces en los solapamientos y las grabaciones poco claras. ~ Si usa mini disk (MD) par ala grabación, podrá usar la búsqueda digital para llegar a la parte exacta que desea transcribir. ~ Si ha digitalizado la fuente de audio, puede usar un reproductor externo en PC o Mac (e.g. Quicktime, Window Media Player o Winamp) para reproducir el sonido. Para rebobinar e ir hacia adelante rápidamente, necesita mover la barra de desplazamiento de cada programa.

33 Haz click en MODE >> SONIC MODE >> Elige el archivo de sonido relacionado >> OK La onda sonora del archivo de sonido aparecerá dentro de la ventana de CLAN. Selecciona la onda de sonido que quieras reproducir del archivo de sonido. ~ O puedes usar el modo sonic en CLAN.

34 4. Comentarios: a)Participantes La etiqueta de un participante, use una única abreviatura de 3- letras para identificar a los participantes por su nombre (p.e. MAR por Maria, NIÑ por niño o niña, etc.) y especifique sus papeles adecuadamente. Los papeles son categorías de clase cerrada en CLAN, use, por tanto, alguna de los siguientes: Target_Child, Target_ Adult, Child, Mother, Father, Brother, Sister, Sibling, Grandmother, Grandfather, Aunt, Uncle, Cousin Family_Friend,Playmate, Visitor, Student, Teacher, Babysitter, Housekeeper Investigator, Examiner, Observer, Clinician, Therapist, Informant Camera_Operator, Doctor, Nurse, Patient, Client Subject Unidentified, Adult, Teenager, Boy, Girl, Non_Human, Toy, OffScript, Text Narrator, PlayRole, Activity

35 d) Letras mayúsculas No utilice letras mayúsculas en ninguna expresión excepto para NOMBRES PROPIOS y EL PRONOMBRE DE PRIMERA PERSONA DEL SINGULAR YO, de lo contrario cualquier expresión de palabra se etiquetarácomo nombres propios. *CHI:esto es un libro. *MOT:María, qué estas haciendo? *CHI:Yo estoy leyendo. P.S. etiquetar es un proceso en el que se asigna a cada palabra su componente de habla.

36 b) Delimitadores Cada fila en la línea principal debe terminar con un único delimitador de expresión. Para evitar problemas generados en el proceso de comprobación, sitúe un espacio antes de cada delimitador como se muestra a continuación: (el subrayado _ indica el espacio anterior al delimitador) ?. ! *CHI:qué es esto _ ? *MOT:un perro _. *CHI:un perro _ ! Asegúrate que añades un delimitador. después de los delimitadores comunes a excepción de +…. Pon un espacio entre el delimitador final y los delimitadores comunes. *MOT:en efecto -:_.

37 4) Otros delimitadores comunes son: *LIN:esto es +/. interrupción *CHIun libro. MOT:bueno hay +… frase incompleta *MOT:mira esto. frases con comillas/imitación directa *CHI:+ mira esto. [=! Action] *CHI:0 [=! riéndose]. información paralingüística *CHI:no [=! llora]. [/] *CHI:quiero [/] éste. Auto-repetición

38 [//] frase siguiente. *INV: [//] ngo5 aa1. auto-corrección [>] [ [>] Superposición *CHI: [<] gusta este. www o xxx *CHI:viene www. producciones ininteligibles. *CHI:&gook segmento fonético, pero ininteligible. [?] *CHI:no tenes [?]. código para producciones no claras

39 Preguntas & respuestas - fin - prepared by Uta Lam, CUHK Traducido por: Jesús Vera 24 November 2005


Descargar ppt "Introdución a CHILDES Esta introducción ha sido elaborada por Uta Lam usando materiales derivados del Corpus de Lenguaje Infantil aportados a CHILDES por."

Presentaciones similares


Anuncios Google