PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico Sánchez y Orlando Santillan Bioinformática Aplicada

La regulación génica es vital para todo ser vivo. El inicio de la transcripción es el principal evento regulado por la mayoría de organismos que contienen DNA. Las bacterias tienen terminación transcripcional: intrínseca y factor-dependiente. La atenuación actúa principalmente en operones de biosíntesis de aminoácidos. Estos operones cuentan con una región líder donde se encuentran pequeños péptidos relacionados con los genes estructurales de éstos. La conservación, adaptabilidad y el bajo coste económico hace de la atenuación un proceso de gran relevancia para el estudio de la regulación génica en procariontes. Datos importantes

Se reconocen 2 formas distintas para el control del inicio de la transcripción: a) Control Regulador (depende de proteínas) y b) Control Constitutivo (estructura del promotor). La terminación transcripcional puede ser: intrínseca o factor-dependiente. Nosotros nos enfocaremos en la terminación intrínseca, más específicamente en la atenuación para predecir péptidos líder pero...¿qué es la atenuación y los péptidos líder? En bacterias...

Antes de contestar.... La terminación intrínseca sucede en regiones donde el DNA cuenta con una secuencia palíndromo invertido seguida de una serie de adeninas, cuyo RNA es capaz de formar “tallos-asa” y, aunado al tracto de poliU, debilitar la interacción DNA-RNA e interferir al mismo tiempo con la polimerasa, facilitando de este modo la disociación. Es la suma de todas estas condiciones lo que favorece el término de la transcripción sobre la elongación

Nos acercamos a la respuesta Se conocen 2 mecanismos para el control elongación/terminación transcripcional: antiterminación y atenuación. Antiterminación Ocurre cuando la polimerasa ignora una señal de terminación y prosigue elongando el transcrito hasta que una segunda señal es detectada. Este proceso es controlado por una proteína. Permite a la célula: Activar o reprimir la expresión de genes al final de un operón

Se piensa que dicha proteína desestabiliza al terminador intrínseco o previene la unión de Rho, según sea el caso.

Por fin... ¡Atenuación! La atenuación actúa principalmente en operones de biosíntesis de aminoácidos. Las regiones líder -contenidas en el promotor- generalmente contienen péptidos relevantes (péptidos líder) para el operón transcrito. Operon de triptofano en E. coli. El péptido líder poseen 14 aminoácidos, de los cuales 2 son triptofanos

Operon de triptofano en E. coli Se pueden formar dos estructuras tallo-asa mutuamente excluyentes, una al inicio del transcrito (terminador) y otra (atenuador) al inicio del gen trpE. Si la cantidad de triptofano libre es limitada, el ribosoma se parará (intentando sintetizar el péptido líder) mientras la polimerasa sigue haciendo transcrito, lo que impide la formación del terminador. Pero si el ribosoma sigue a la polimerasa, el terminador si podrá formarse y la transcripción terminará.

Atenuación en el operón de triptofano de E. coli

Ventajas de la Atenuación Secuencias cortas y únicas de RNA -estructuras secundarias- pueden mediar decisiones cruciales para la expresión de los genes contenidos en operones Estrategia de regulación común y se encuentra conservada entre genes ortólogos de especies filogenéticamente distantes Los operones donde ocurre atenuación siempre cuentan con péptidos líder Fácilmente adaptable a las necesidades de regulación transcripcional

Objetivos Dada la importancia y conservación de la atenuación en el proceso de regulación génica en procariontes, se buscan características, que nos permitan la identificación y posible predicción de péptidos líder.,

Pitacora por Pitoches s.a. de c.c.g parque acuático Todos los programas utilizados en este trabajo fueron realizados por nuestra compañía con el fin de poder controlar todos los parámetros en cada uno de los filtros utilizados SET DE PROGRAMAS AIDA.pl FRECAA A rtilugios de I dentificación D e tr A nscripción por p éptido l íder CONTROLE R UTILIZAB LE NACO ORFE R NOCO PY MERINA ZO GC.CO NT D

Controler.pl El programa controler.pl es un programa con el que se saca de “E_coli_K12.list” los péptidos líder que ya estuvieran anotados y saca la región intergénica para el siguiente gen tomando en cuenta su dirección (F o R). Estos fueron usados como control checando que después de cada filtro fueran mantenidos en nuestro set de datos. El programa controler.pl es un programa con el que se saca de “E_coli_K12.list” los péptidos líder que ya estuvieran anotados y saca la región intergénica para el siguiente gen tomando en cuenta su dirección (F o R). Estos fueron usados como control checando que después de cada filtro fueran mantenidos en nuestro set de datos.

Utilizable.pl El programa utilizable.pl lee “E_coli_K12.list” y saca toda la secuencia codificante de “E_coli_K12.dna”. Genera una secuencia continua, esta, se va leyendo por codones, obteniendo la media y la desviación estándar del contendido de GC por posiciones de codón. Además manda esa secuencia codificante a un archivo. Que nos sera de utilidad más adelante El programa utilizable.pl lee “E_coli_K12.list” y saca toda la secuencia codificante de “E_coli_K12.dna”. Genera una secuencia continua, esta, se va leyendo por codones, obteniendo la media y la desviación estándar del contendido de GC por posiciones de codón. Además manda esa secuencia codificante a un archivo. Que nos sera de utilidad más adelante

Naco.pl El programa naco.pl saca los ID's de todos los genes (no se tomaron solo los operones porque algunos de nuestros controles no venían anotados como tal) que estaban en la lista de OPERONS. En esta lista nos dan el ID si esta en “F” o en “R” y si forma parte de un operón, en caso de que si formara parte, distingue si estaba en “R” o “F” y se tomaba solo la posición importante. El programa naco.pl saca los ID's de todos los genes (no se tomaron solo los operones porque algunos de nuestros controles no venían anotados como tal) que estaban en la lista de OPERONS. En esta lista nos dan el ID si esta en “F” o en “R” y si forma parte de un operón, en caso de que si formara parte, distingue si estaba en “R” o “F” y se tomaba solo la posición importante. Con esos Id, recupera las posiciones de dichos genes del archivo “E_coli_K12.list” verificando, así mismo, la dirección de cada ID obtenido y las posiciones dentro del genoma. Se guardo de tal manera que tomara la primera posición de los operones con dirección “forward” y el ultimo ID para los “reverse”. Con esos Id, recupera las posiciones de dichos genes del archivo “E_coli_K12.list” verificando, así mismo, la dirección de cada ID obtenido y las posiciones dentro del genoma. Se guardo de tal manera que tomara la primera posición de los operones con dirección “forward” y el ultimo ID para los “reverse”. Para cortar las regiones intergénicas, vimos que nuestros controles no eran muy distantes al próximo gen. Con las posiciones de cada gen, se corto del, regiones de 500bp río arriba, obviamente para los “reverse” se utilizaba la secuencia correspondiente. Para cortar las regiones intergénicas, vimos que nuestros controles no eran muy distantes al próximo gen. Con las posiciones de cada gen, se corto del, regiones de 500bp río arriba, obviamente para los “reverse” se utilizaba la secuencia correspondiente. Con este programa se obtuvo una lista de 2722 regiones intergénicas, sin limpiar algunas que sobrelapaban por distintos marcos de lectura. Con este programa se obtuvo una lista de 2722 regiones intergénicas, sin limpiar algunas que sobrelapaban por distintos marcos de lectura.

Orfer.pl El orfer.pl es un programa que saca todos los posibles marcos de lectura en las regiones intergénicas, lo que hace es ir avanzando hasta encontrar una metionina y después avanzar de 3 en 3 hasta encontrar un codón de paro, y al revés para los que estén en “R”. Este programa tiene restricciones de tamaño para las secuencias que vaya encontrando, esto para favorecer los tamaños que puedan ser un péptido líder según la literatura. El orfer.pl es un programa que saca todos los posibles marcos de lectura en las regiones intergénicas, lo que hace es ir avanzando hasta encontrar una metionina y después avanzar de 3 en 3 hasta encontrar un codón de paro, y al revés para los que estén en “R”. Este programa tiene restricciones de tamaño para las secuencias que vaya encontrando, esto para favorecer los tamaños que puedan ser un péptido líder según la literatura.

Nocopy.pl Se hizo el nocopy.pl para purgar los resultados de naco.pl, ya que debido a la anotación de OPERONS(archivos *.dllh) existen algunos genes que están contiguos pero están anotados como genes individuales no como operones. Esto provoca cierto sobrelape y por ende cierta redundancia al momento de tomar las regiones + - 500pb. La manera de resolverlo que usa este programa es purgar esos resultados; lee el archivo de salida de orfer.pl y se queda con solo la primera aparición de cada “orf” debido a que seria sobre el cual actuaria el péptido líder. Solo tomar el siguiente gen para cada “orf”, que es la primera aparición. Se hizo el nocopy.pl para purgar los resultados de naco.pl, ya que debido a la anotación de OPERONS(archivos *.dllh) existen algunos genes que están contiguos pero están anotados como genes individuales no como operones. Esto provoca cierto sobrelape y por ende cierta redundancia al momento de tomar las regiones + - 500pb. La manera de resolverlo que usa este programa es purgar esos resultados; lee el archivo de salida de orfer.pl y se queda con solo la primera aparición de cada “orf” debido a que seria sobre el cual actuaria el péptido líder. Solo tomar el siguiente gen para cada “orf”, que es la primera aparición.

Merinazo.pl Realizamos un programa llamado merinazo.pl que interesecta los resultados obtenidos por ENRIQUE MERINO con los nuestros. Y nos quedamos con los que tengamos en común. Por alguna extraña razón, algunos resultados salieron duplicados así que a este set de datos resultado también le corrimos el nocopy.pl Después se usan dos vías simultaneas Realizamos un programa llamado merinazo.pl que interesecta los resultados obtenidos por ENRIQUE MERINO con los nuestros. Y nos quedamos con los que tengamos en común. Por alguna extraña razón, algunos resultados salieron duplicados así que a este set de datos resultado también le corrimos el nocopy.pl Después se usan dos vías simultaneas

Frecaa.pl lo que hace este programa es para cada “orf” saca la frecuencia de cada aminoácido en este, después crea una distribución para determinados patrones de secuencia, la distribución es hecha con 10,000 “orfs” al azar de secuencia codificante que nos da el programa utilizable.pl, a cada una de estas distribuciones se le saca la media y la distribución estándar, teniendo esto se pondera cada uno de los patrones de secuencia, con la frecuencia que tendría en toda la secuencia codificante, si la ponderación cae dentro de 2 desviaciones estándar se rechaza el parámetro. Si alguno de los parámetros es aceptado el “orf” es aprobado. lo que hace este programa es para cada “orf” saca la frecuencia de cada aminoácido en este, después crea una distribución para determinados patrones de secuencia, la distribución es hecha con 10,000 “orfs” al azar de secuencia codificante que nos da el programa utilizable.pl, a cada una de estas distribuciones se le saca la media y la distribución estándar, teniendo esto se pondera cada uno de los patrones de secuencia, con la frecuencia que tendría en toda la secuencia codificante, si la ponderación cae dentro de 2 desviaciones estándar se rechaza el parámetro. Si alguno de los parámetros es aceptado el “orf” es aprobado.

Gc.cont.pl Ya con la desviación estándar del utilizable.pl se crea un rango de valores en los que puede caer cada “orf” para cada una de las 3 posiciones del codón, saca el contenido de GC para la primera, segunda y la tercera posición de cada “orf” putativo. Para que un “orf” sea aceptado los tres contenidos de GC tienen que estar dentro del rango del mínimo del valor de e.coli menos la desviación estándar, y el máximo la media de e.coli más una desviación estándar. Es dinámico puede tomar 1, 2 desviaciones estándar, para nuestro trabajo fue utilizado el parámetro de solo 1 desviación estándar. Imprime antes de las secuencia de cada “orf”, valor de GC para primera segunda y tercera posición y que gen regula Ya con la desviación estándar del utilizable.pl se crea un rango de valores en los que puede caer cada “orf” para cada una de las 3 posiciones del codón, saca el contenido de GC para la primera, segunda y la tercera posición de cada “orf” putativo. Para que un “orf” sea aceptado los tres contenidos de GC tienen que estar dentro del rango del mínimo del valor de e.coli menos la desviación estándar, y el máximo la media de e.coli más una desviación estándar. Es dinámico puede tomar 1, 2 desviaciones estándar, para nuestro trabajo fue utilizado el parámetro de solo 1 desviación estándar. Imprime antes de las secuencia de cada “orf”, valor de GC para primera segunda y tercera posición y que gen regula

Resultados dependiendo de la desviacion estandar y si paso por merinazo =1 y merinazo ---------> 258 genes dentro de 1 desv. est y predichos por MerinoE_coli_K12.m.1.orfsE_coli_K12.m.1.orfs =2 y merinazo ---------> 1787 genes dentro de 2 desv. est y predichos por MerinoE_coli_K12.m.1.orfsE_coli_K12.m.1.orfs =1 ---------> 351 genes dentro de 1 desv. estE_coli_K12.m.2.orfsE_coli_K12.m.2.orfs =2 ---------> 2508 genes dentro de 2 desv. estE_coli_K12.m.2.orfsE_coli_K12.m.2.orfs

PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Presentaciones similares

Presentación del tema: "PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback

Iniciar la sesión

Autorizarse a través de una red social:

PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico.

Presentaciones similares

Presentación del tema: "PREDICCION DE PEPTIDOS LIDER PUTATIVOS EN PROCESOS TRANSCRIPCIONALES EN ESCHERICHIA COLI José C. RAMON. Hernández, Pedro Olivares, Pablo Rodríguez, Federico."— Transcripción de la presentación:

Presentaciones similares

Sobre el proyecto

Feedback