análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me...

49
Pág.47 UNIVERSIDAD DE CÓRDOBA Facultad de Ciencias Grado de Bioquímica Trabajo Fin de Grado Análisis e integración de datos -ómicos y su aplicación a la investigación en encina Código del TFG: BQ17-16-BBM Tipología: Inicio a la investigación Autor: Jesús Miguel Pérez Gómez 07/09/2018 (Quercus ilex)

Upload: others

Post on 21-Jul-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

Pág.47

UNIVERSIDAD DE CÓRDOBA Facultad de Ciencias

Grado de Bioquímica

Trabajo Fin de Grado

Análisis e integración de datos -ómicos y su aplicación a la

investigación en encina Código del TFG: BQ17-16-BBM Tipología: Inicio a la investigación

Autor: Jesús Miguel Pérez Gómez

07/09/2018

(Quercus ilex)

Page 2: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 2

Agradecimientos

Este trabajo pone broche a una etapa de aprendizaje continuo, tanto a nivel formativo como

personal, la cual sería imposible sin aquellas personas que me han ayudado y apoyado día

tras día.

En primer lugar, agradecer a la Fundación Torres Gutiérrez por la financiación, que ha

contribuido al desarrollo del trabajo aquí expuesto.

Agradecer a mis tutores Jesús y Rosa, por guiarme a lo largo de este proyecto. Por su

motivación para superarme y por brindarme sus consejos y conocimientos, que trascienden

este trabajo y me serán de utilidad en mi futuro profesional.

Especial mención a Lola, que me ha demostrado su entregada dedicación, por su absoluta

disponibilidad y por ofrecerme su ayuda en todo momento.

Agradecer también a Víctor, ya que sin su ayuda este trabajo no hubiera salido adelante.

También agradecer a Mari Ángeles, Ana, Mari Carmen, Conchi, Cristina, Isabel, Macedonia,

Manolo, Silvia, Kamilla y muchos más, que han formado parte de este laboratorio en los

últimos tres años.

A Félix, por facilitarnos aquello de lo que carecíamos en nuestro laboratorio y por su ayuda

desinteresada.

Y, por último, agradecer a los tres apoyos fundamentales de mi vida, mis padres y mi

hermano, por alentarme a dar la mejor versión de mí, por aguantarme en mis peores

momentos y por ser un apoyo incondicional.

Page 3: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 3

Índice general

Índice de Ilustraciones ........................................................................................................................ 4

Índice de tablas ................................................................................................................................... 4

Resumen .............................................................................................................................................. 5

Abstract ............................................................................................................................................... 6

Introducción ........................................................................................................................................ 7

Materiales y métodos ....................................................................................................................... 12

1. Material vegetal ........................................................................................................................ 12

2. Tratamiento de sequía y muestreo ........................................................................................... 12

3. Extracción de RNA ..................................................................................................................... 13

4. Estimación de la cantidad y la calidad del RNA ......................................................................... 13

5. RNA-Seq ..................................................................................................................................... 14

6. Análisis de datos de RNA-Seq .................................................................................................... 14

Resultados y discusión ...................................................................................................................... 15

1. Inspección visual de daños, contenido hídrico y fluorescencia de hojas .................................. 15

2. Control de calidad de las secuencias ......................................................................................... 17

3. Análisis de expresión diferencial ............................................................................................... 18

4. Comparación entre tiempos. Análisis de términos de Ontología Génica ................................. 29

5. Integración de resultados: transcriptómica y proteómica ........................................................ 31

Conclusiones ..................................................................................................................................... 34

Conclusions ....................................................................................................................................... 35

Bibliografía ........................................................................................................................................ 36

Anexo ................................................................................................................................................ 41

Page 4: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 4

Índice de Ilustraciones

Ilustración 1. Número de publicaciones en PubMed desde 1990 relacionadas con RNA-Seq y Microarrays ………………………………………………………………………………………………………………………..10 Ilustración 2. Flujo de trabajo en un experimento de transcriptómica con una estrategia de RNA-Seq ……………………………………………………………………………………………………………………………..11 Ilustración 3. Inspección visual de daños y medida de fluorescencia ………………………………….16 Ilustración 4. Análisis de calidad de las secuencia ………………………………………………………………18 Ilustración 5. Número de genes con expresión diferencial en respuesta a sequía……………….19 Ilustración 6. Representación gráfica MA de los transcritos diferencialmente expresados a los 20 días……………………………………………………………………………………………………………………………20 Ilustración 7. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 20 días…………………………………………………………………………………………………………………….....20 Ilustración 8. Representación gráfica MDS de las muestras a los 20 días……………………………………………………………………………………………………………………….…………….21 Ilustración 9. Categorización funcional de los transcritos expresados diferencialmente a los 20 días…………………………………………………………………………………………………………….…………………..21 Ilustración 10. Representación gráfica MA de los transcritos diferencialmente expresados a los 25 días………………………………………………………………………………………….………………………………..24 Ilustración 11. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 25 días……………………………………………………………………………………………….……..24 Ilustración 12. Representación gráfica MDS de las muestras a los 25 días…………………………..25 Ilustración 13. Categorización funcional de los transcritos expresados diferencialmente a los 25 días…………………………………………………………………………………………………………………………………25 Ilustración 14. Grupos funcionales identificados en el estudio proteómico………………………..32 Ilustración 15. Ontología Génica de las funciones moleculares…………………………………………..47 Ilustración 16. Ontología Génica de los procesos biológicos……………………………………………….48 Ilustración 17. Ontología Génica de los componentes celulares………………………………………….49

Índice de Tablas Tabla 1. Parámetros de calidad de las lecturas originales y procesadas………………………………17 Tabla 2. Valores de RIN de las preparaciones de RNA………………………………………………………….41 Tabla 3. Genes con expresión diferencial a los 20 días del ensayo………………………………………42 Tabla 4. Genes con expresión diferencial a los 25 días del ensayo………………………………………43 Tabla 5. Comparación de los datos generados por las aproximaciones de transcriptómica y proteómica………………………………………………………………………………………………………………………….33

Page 5: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 5

Resumen

El presente trabajo tiene por objetivo el estudio a nivel fisiológico y molecular de la

respuesta a sequía en Q. ilex. Se llevó a cabo con plántulas de 6 meses de edad. El

tratamiento de sequía se impuso por la eliminación por completo del riego durante 25 días.

Las consecuencias y la respuesta a dicho estrés se evaluaron mediante la inspección de

visual daños, contenido hídrico en hojas y raíces, y la fluorescencia en hojas.

En el periodo de ensayo no se observaron síntomas de daños por sequía, ni diferencias

significativas entre control y tratamiento en el contenido hídrico, confirmando así el carácter

tolerante de esta especie. Los valores de fluorescencia se vieron reducidos un 30 % y 50 % a

los 20 y 25 días del ensayo, respectivamente. Mediante transcriptómica, utilizando la

plataforma HiSeq 4000 PE100 lane (Illumina) se llevó a cabo el análisis de expresión

diferencial de genes a los 20 y 25 días. El número de transcritos diferenciales identificados

fue de, respectivamente, 14 y 90 para cada uno de los tiempos. La respuesta a sequía se

caracterizó por un aumento en la abundancia de transcritos de genes de respuesta a estrés,

incluyendo sistemas enzimáticos de detoxificación de especies reactivas de oxígeno y

proteínas de respuesta a choque térmico, genes ribosomales y genes de enzimas de las rutas

metabólicas de carbohidratos y aminoácidos. Los datos así generados se integraron con los

obtenidos mediante técnicas proteómicas, proporcionando una visión holística de la

respuesta a sequía. Los datos de transcriptómica a nivel de grupos funcionales se

correlacionaron con los datos proteómicos publicados por Papa (2018).

Palabras clave: Quercus ilex; Sequía; Transcriptómica; Proteómica; Integración -ómica

Page 6: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 6

Abstract

The main objective of this TFG is to study the response to drought in Q. ilex from a

physiological and molecular point of view. The experiments were carried out using 6-month

plants. The plants were subjected to a severe water deficit for 25 days. The consequences

and responses to drought were evaluated by typical symptoms of stress (chlorosis and

water-soaked lesions), relative water content both in leaves and roots, and fluorescence

emitted by leaves.

Neither symptoms of stress nor differences in the relative water content were

observed, indicating that Q. ilex is highly tolerant against drought. The fluorescence values

were reduced by 30 % and 50 % at 20 and 25 days, respectively. A differential expression

analysis of genes involved in response to drought at 20 and 25 days was carried out using

the HiSeq 4000 PE100 lane (Illumina) platform by a RNA-Seq analysis. A total of 14 and 90

differential transcripts was identified at each of both times, respectively. The drought

response was characterized by an increase in the number of transcripts related to plant

stress, including enzymatic systems for the detoxification of reactive oxygen species and

heat-shock proteins, ribosomal genes, and genes involved in the carbohydrate and amino

acid metabolism. All these data were integrated with data previously obtained by a

proteomic approach, giving a holistic view of the response to experimental drought

conditions in Q. ilex. The transcriptome data at functional group level were correlated to

proteomic data previously published by Papa (2018).

Keywords: Quercus ilex; Drought; Transcriptomics; Proteomics; -Omics integration

Page 7: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 7

Introducción

En la introducción del presente Trabajo Fin de Grado (TFG) haremos referencia a los

tres elementos básicos en que definen un proyecto de investigación: el sistema

experimental, los objetivos e hipótesis de partida y la aproximación metodológica, quedando

todos ellos definidos en el propio título “Análisis e integración de datos -ómicos y su

aplicación a la investigación en encina (Quercus ilex)”.

La encina (Q. ilex L. subsp ballota [Desf.] Samp.) es la especie predominante del

ecosistema agrosilvopastoral andaluz, la dehesa, y del bosque mediterráneo (Cañellas et al.,

2007; Pasta et al., 2016). La encina es una parte importante del patrimonio medioambiental

de Andalucía, con una superficie de 981.431 ha y una gran importancia ecológica, social y

económica, siendo considerada como el Árbol Nacional de España (Moro, 2002). Desde el

Imperio Romano ha jugado un papel destacado en la vida y subsistencia del hombre

mediterráneo, utilizándose como fuente de madera para construcciones, combustible y

alimento. Su fruto, la bellota, es el producto de mayor valor, fuente de alimento del cerdo y

lo que da calidad a los productos obtenidos del mismo, jamón y embutidos (Cañellas et al.,

2007).

La encina presenta características de especie esclerófila, como hojas pequeñas y

coriáceas, adaptaciones que le permiten tolerar situaciones de sequía y altas temperaturas

(Pasta et al., 2016). Además, a diferencia de otras especies similares, como Q. humilis, la

encina también posee una elevada resistencia al frío (Braitenberg & Schüz, 1998), lo que le

ha permitido sobrevivir y ser dominante en climas continentales con inviernos fríos y largos y

calurosos veranos.

En la actualidad, la sostenibilidad y supervivencia de Q. ilex se ve amenazada por una

serie de factores entre los que se encuentran árboles envejecidos, sobreexplotación

(pastoreo) y, sobre todo estreses tanto abióticos como bióticos, en especial sequía y

Phytophthora cinnamomi; todos ellos, en conjunto, contribuyen, en mayor o menor medida,

al denominado síndrome de la seca, con focos de mortandad de árboles cada vez más

extendidos (Jorge et al., 2006; Echevarría-Zomeño et al., 2009; Valero-Galván et al., 2011,

Sghaier-Hammami et al., 2013;). La situación puede verse agravada en un escenario de un

inminente cambio climático, con unas previsiones que estiman un incremento de la

temperatura media en las regiones del mediterráneo de 4-5 °C para el año 2100 (Lindner et

al., 2010). Ante esta situación de alarma, que ha transcendido el sector productivo y

científico-técnico, urge la toma de ciertas medidas (González, 2008; http://www.ipcc.ch).

Page 8: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 8

Actualmente, debido a la preocupante situación en la que se encuentra la encina, numerosas

noticias han sido publicadas en varios periódicos nacionales para llamar la atención de la

sociedad, como por ejemplo el artículo publicado en el País el día 15/05/2018 titulado “Una

encina tarda 40 años en florecer; este hongo (P. cinnamomi) la puede secar en días”

(https://elpais.com/politica/2018/05/15/actualidad/1526406969_811389.html), o el

publicado en el Diario de Córdoba el día 04/06/2018 titulado “La Junta destina 30,5 millones

a renovar el arbolado de la dehesa”

(http://www.diariocordoba.com/noticias/cordobalocal/junta-destina-30-5-millones-renovar-

arbolado-dehesa_1230194.html). A este respecto, la Biotecnología Vegetal puede jugar un

papel importante.

En este contexto, la línea de trabajo llevada a cabo por el Grupo de Investigación

“Bioquímica, Proteómica y Biología de Sistemas Vegetal y Agroforestal” (AGR-164) está

enfocada al estudio de diferentes aspectos de la biología de Q. ilex que van desde los

puramente fisiológicos, a aproximaciones moleculares, combinando bioquímica clásica con

diferentes aproximaciones -ómicas (transcriptómica, proteómica y metabolómica)

(Echevarría-Zomeño et al., 2009, 2012; Jorrín-Novo et al., 2009; Valero-Galván et al., 2011,

2012; Sghaier-Hammami et al., 2013, 2016; Romero-Rodríguez et al., 2014; Guerrero-

Sanchez et al., 2017; López-Hidalgo et al., 2018). A partir de la propia experiencia del grupo

de investigación en trabajos llevados a cabo en Q. ilex, se conoce la extrema complejidad

presentada en esta especie forestal debido a sus características biológicas, con ciclo de vida

largo, carácter alógamo, y a su naturaleza recalcitrante. Es por ello, y como ocurre en la

mayoría de las especies forestales, los programas de mejora genética clásica no son viables y

la ingeniería genética no es factible ni aceptada dentro de la UE. La única alternativa posible

es la explotación de la biodiversidad, lo que implica, como paso previo, la caracterización de

la misma a nivel macroscópico, microscópico y molecular, y el análisis a nivel morfológico,

fenológico, fisiológico y molecular, incluyendo las modernas aproximaciones –ómicas. El

objetivo final sería la identificación de árboles “élites” o “plus” con características fenotípicas

determinadas basadas en marcadores moleculares.

El presente TFG tiene por objetivo la utilización de la transcriptómica en la

caracterización de la respuesta y tolerancia a sequía en Q. ilex, utilizando para ello la

tecnología NSG (del inglés Next Genome Sequencing), en concreto el RNA-Seq mediante la

plataforma HiSeq 4000 PE100 lane (Illumina). Se basa en la comparación del perfil de

transcritos en hojas de plantas con y sin estrés por sequía. Los datos resultantes se

Page 9: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 9

compararán con aquellos obtenidos mediante una aproximación de proteómica (Papa,

2018).

La palabra transcriptoma fue usada por primera vez en 1995 (Velculescu et al., 1997).

Desde ese momento se ha vivido una verdadera revolución que ha hecho de la

transcriptómica un campo muy amplio y complejo. Este rápido avance está ligado y dirigido

por el desarrollo de las denominadas nuevas tecnologías de secuenciación masiva, con la

mejora de su sensibilidad y la gran disminución de sus precios (Lowe et al., 2017). Las

tecnologías transcriptómicas son aquellas usadas para el estudio del transcriptoma, el

conjunto de todos los transcritos presentes en un sistema biológico (orgánulo, célula, tejido,

órgano, individuo, especie o ecosistema), en cualquier etapa de desarrollo y bajo

condiciones ambientales específicas (Lowe et al., 2017). La información de un organismo

está grabada en el DNA, y se expresa por medio de la transcripción. El RNA mensajero

(mRNA) sirve como molécula intermediaria de información en el dogma central de la

biología molecular, actuando como nexo entre el genoma y el proteoma de una especie. Los

objetivos de la transcriptómica son (1) identificar y catalogar todas las especies de

transcriptos, incluyendo mRNAs, RNAs no codificantes (tRNA, rRNA, lncRNA, etc.) y RNAs

pequeños (siRNAs, miRNAs y piRNAs); (2) determinar las estructuras transcripcionales de los

genes, en cuanto a sus sitios definidos 5' y 3' de inicio y fin; (3) identificar los patrones de

ayuste (o en inglés “splicing”) y otras modificaciones post-transcripcionales; y (5) cuantificar

los cambios en los niveles de expresión de cada transcripto durante las distintas fases del

desarrollo y bajo diferentes condiciones (Wang et al., 2001).

Las librerías de EST (acrónimo del inglés Expressed Sequence Tag o marcador de

secuencia expresada) basadas en retrotranscripción a DNA complementario (cDNA) y

secuenciación Sanger junto con el posterior desarrollo de la metodología “por etiquetas”

gracias a las técnicas SAGE/CAGE (acrónimo del inglés Serial and Cap analysis of gene

expression, repectivamente) y MPSS (acrónimo del inglés Massively Parallel Signature) en

combinación con los métodos de secuenciación por síntesis (Solexa/Illumina, San Diego, CA)

fueron los precursores de la transcriptómica actual (Lowe et al., 2017). Actualmente, junto

con un análisis de RNA-Seq, los microarrays son las técnicas predominantes en el campo de

la transcriptómica (Lowe et al., 2017). Brevemente, los microarrays miden la abundancia de

hasta miles de transcritos por su hibridación en una placa, previamente diseñada con sondas

específicas de DNA. Hay dos tipos principales de microarrays transcriptómicos, los

coloreados (o en inglés “spotted”) o los de síntesis in situ (Affymetrix GeneChip®

Page 10: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 10

Microarrays). Ambos cuantifican los transcriptos por detección de fluorescencia. Por su

parte, el RNA-Seq hace referencia a la secuenciación de los transcritos, en forma de cDNA de

una muestra biológica. De la secuenciación se generan lecturas (secuencia ordenada de

nucleótidos o de sus probabilidades inferidas de un fragmento de DNA), y a partir de éstas se

puede cuantificar la expresión del transcrito. Pese a que los microarrays fueran

predominantes entre los años 2008 – 2012, ha habido un cambio de tendencia que sitúan al

RNA-Seq por delante en el número de publicaciones en la actualidad (Ilustración 1). Factores

como la cantidad de RNA necesaria de partida (ng en RNA-Seq y mg en microarrays), la

sensibilidad y un rango dinámico hasta dos órdenes de magnitud superior, dan la ventaja al

RNA-Seq frente a los microarrays (Lowe et al., 2017). Además, otra de las ventajas que

ofrece el RNA-Seq es que no requiere del conocimiento previo del genoma del organismo,

mientras que un microarray exige el diseño de la placa con sondas específicas de DNA para

el desarrollo del set de transcritos que se quiera identificar. Por lo tanto, un análisis de RNA-

Seq es una herramienta muy útil a la hora de identificar transcritos relacionados con la

tolerancia a condiciones de estrés hídrico ya que el genoma de Q. ilex no está, actualmente,

secuenciado.

Ilustración 1. Número de publicaciones en PubMed desde 1990 relacionadas con RNA-Seq y Microarrays. En azul el número corresponde a la búsqueda del término “RNA-Seq” y en rojo “RNA microarrays”. (http://dan.corlan.net/medline-trend.html. Consultado el: 19/07/2018)

Los estudios del transcriptoma mediante RNA-Seq, en su sentido más amplio e

integrado, permiten dilucidar la tendencia coordinada del sistema, lo que se convierte en su

mayor ventaja frente a otros ensayos dirigidos a un número concreto de dianas génicas. Así,

esta tecnología resulta de especial interés en su aplicación a la caracterización de perfiles

patogénicos; en el estudio del transcriptoma en diferentes condiciones ambientales; en la

anotación e identificación de genes responsables de un fenotipo, especialmente en

0

1000

2000

3000

4000

de

pu

blic

acio

ne

s

Año

Page 11: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 11

organismos no modelo; estudio de isoformas de ayuste; identificación de polimorfismos de

un sólo nucleótido (o SNP por sus siglas en inglés; Single Nucleotide Polymorphism); e incluso

en el estudio de los RNAs no codificantes (por ejemplo, RNA pequeño de interferencia (o

siRNA por sus siglas en inglés: small interfering RNA; micro-RNA (o miRNAs), entre otros)

(Wang et al., 2001).

En cuanto al flujo de trabajo para un análisis de RNA-Seq, éste consta de varias

etapas fundamentales representadas en la Ilustración 2. A su vez, el proceso de análisis

bioinformático de los resultados suele también incluir una etapa de control de calidad de las

secuencias, alineamiento frente al genoma en el caso de las especies cuyo genoma esté

secuenciado o a un transcriptoma de novo en el caso de las especies sin genoma

secuenciado, cuantificación de los transcritos y estudios de expresión diferencial (Lowe et

al., 2017).

Ilustración 2. Flujo de trabajo en un experimento de transcriptómica con una estrategia de RNA-Seq. Aparecen representadas las siguientes etapas: (1) diseño experimental y muestreo, (2) extracción del RNA, (3) cuantificación y comprobación de parámetros de calidad, (4) conversión a cDNA y fragmentación, (5) secuenciación, (6) análisis bioinformático de las secuencias obtenidas, y (7) validación e interpretación biológica de los resultados.

Por tanto, este TFG ha tenido principalmente dos objetivos generales bien definidos:

el primero ha consistido en estudiar la respuesta molecular de plántulas de Q. ilex frente a

estrés hídrico severo mediante un análisis transcriptómico. Para ello, se ha llevado una

estrategia de transcriptómica basa en un análisis de RNA-Seq. Los datos se compararán con

los previamente obtenidos mediante proteómica (Papa, 2018). Una vez identificados los

transcritos diferenciales (tratamiento control y de sequía), éstos se agruparán

funcionalmente, proponiéndose qué genes y mecanismos están implicados en la respuesta y

tolerancia a sequía. Aparte del objetivo científico, el TFG ha supuesto, desde un punto de

vista académico y formativo, un excelente método de aprendizaje e inicio en la

investigación, el trabajo técnico en el laboratorio, la búsqueda de información y diseño de

Page 12: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 12

experimentos, la interpretación y discusión de los resultados, y la preparación de un

manuscrito científico.

Materiales y métodos

1. Material vegetal

Las bellotas fueron suministradas por la Red de Viveros de Andalucía y se recogieron

de 10 árboles de la población “Almadén de la Plata” (Sevilla; 37° 52´N 6° 28´W).

Las bellotas fueron seleccionadas y esterilizadas según Bonner & Vozzo, 1987. Para

su limpieza y eliminación de los frutos dañados, estos se sumergieron en agua, eliminado las

que flotaban (frutos avellanados o con picaduras de insectos). La esterilización se llevó a

cabo mediante un lavado con una solución de hipoclorito de sodio al 2,5 % (v/v),

conteniendo unas gotas de Tween-20, durante 20 minutos a temperatura ambiente.

Finalmente, se lavaron con abundante agua, se secaron a temperatura ambiente y se

almacenaron en bolsas de polietileno herméticamente cerradas a 4 °C hasta su utilización

(Caliskan, 2014)

Para que la germinación fuera homogénea y sincronizada, se eliminó el pericarpo y la

porción distal (respecto al embrión) de las semillas. Las semillas se dispusieron, con el

embrión hacia abajo, en macetas de 0,5 L con perlita, como sustrato. La germinación y

crecimiento de las plántulas se llevó a cabo en el invernadero, durante los meses de

diciembre-mayo. Las plantas se regaron a capacidad de campo con agua corriente cada dos

días y una vez a la semana con solución nutritiva (macronutrientes FOLEN 8-8-8 (Solem) y

micronutrientes Microplus Fertiberia Jardín (Hoagland & Arnon, 1950)).

2. Tratamiento de sequía y muestreo

El experimento de sequía fue llevado a cabo en el invernadero, bajo luz natural,

durante el mes de junio de 2017, cuando las plantas tenían 6 meses, presentando 10 hojas y

una altura media de tallo media de 9 cm (Ilustración 3). La temperatura máxima fue de

44/19 °C (día/noche) y la humedad relativa del 30-60 %. El estrés hídrico se impuso

eliminando totalmente el riego, mientras que los plantones control se regaron a capacidad

de campo dos veces por semana con agua y una con solución nutritiva. La duración del

experimento fue de 25 días.

Page 13: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 13

La aparición de síntomas de daño (clorosis, marchitez, muerte) se siguió visualmente,

determinándose en hojas el contenido hídrico relativo y la fluorescencia. El procedimiento

fue el descrito por Gómez-Gálvez (2017) y Papa (2018).

Se recolectaron hojas fotosintéticamente activas a los 20 y 25 días de tratamiento,

considerados como los tiempos 1 (T1) y 2 (T2) de aquí en adelante. La elección de estos días

fue en base a la caída de la actividad fotosintética, con 30 % para T1 y un 50 % para T2. Las

hojas recolectadas se lavaron con agua, se secaron en papel de filtro y se congelaron en

nitrógeno líquido. El tejido se pulverizó en un mortero en presencia de nitrógeno líquido,

almacenándose a -80 oC hasta su extracción.

3. Extracción de RNA

Para la extracción de RNA se utilizaron 50 mg de polvo congelado, utilizándose el kit

InviTrap® Spin Plant RNA Mini kit (Invitek, Berlín, Alemania) y siguiendo el protocolo descrito

previamente por Echevarría-Zomeño et al., (2012), con algunas modificaciones. El

procedimiento se puede resumir en una serie de etapas elementales: (1) homogeneización

del tejido vegetal en buffer de lisis. Para mejorar la calidad del RNA extraído, al buffer de lisis

se añadió 20 mg/ml de polivinilpolipirrolidona (PVPP, 110 µm Sigma), ya que es insoluble en

agua y capaz de unirse a taninos, fenoles y polisacáridos (muy abundantes en las hojas de Q.

ilex) estableciendo puentes de hidrógeno. (2) Eliminación de restos celulares por

centrifugación en columna, (3) dilución del eluido con etanol 96 %, (4) retención del RNA en

columna de afinidad por centrifugación, (5) lavados repetidos de la columna con distintos

buffers, (6) digestión con DNAsa (no incluida en el kit; se empleó una desoxirribonucleasa I

de 20.000 unidades de actividad enzimática a 177,7 U/µl - Invitrogen, Karlsruhe, Alemania).

(7) Elución del RNA retenido.

De los 30 µl finales de eluido de RNA, se tomaron 2 µl para la cuantificación, y 2 µl

para la estimación de la calidad. Los 26 µl restantes de todas las muestras se almacenaron a

-80 °C hasta su envío a la compañía para llevar a cabo el análisis del RNA-Seq.

4. Estimación de la cantidad y la calidad del RNA

La cuantificación del RNA se llevó a cabo por espectrometría (NanoDrop™

2000/2000c). La calidad e integridad del RNA extraído se comprobó electroforéticamente

(bioanalizador Agilent 2100), determinándose el valor de RIN. Dicho análisis se llevó a cabo

Page 14: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 14

en el Servicio Central de Apoyo a la Investigación-SCAI, de la Universidad de Córdoba. Se

seleccionaron aquellas muestras con un RIN ≥ a 7 para el análisis del RNA-Seq.

5. RNA-Seq

Las 12 alícuotas de RNA (2 tratamientos (control/sequía) x 2 tiempos (tiempo inicial y

tiempo final) x 3 réplicas) fueron enviadas a la compañía Allgenetics & Biology (A Coruña,

Galicia, España) para llevar a cabo el RNA-Seq. Una vez recibido, se volvió a cuantificar y a

estimar su calidad en el bioanalizador Agilent 2100 (Agilent RNA 6000 kit), para comprobar

que este no había sufrido degradación (Tabla 2).

Se empleó el kit TruSeq Stranded mRNA Library Prep de Illumina con el protocolo

“low sample” (LS) para preparar las librerías de cDNA. A su vez, el desarrollo de este kit

puede dividirse en una serie de etapas fundamentales: (1) purificación del mRNA mediante

oligonucleótidos poli-T unidos a bolas magnéticas, (2) fragmentación del mRNA por cationes

divalentes a elevada temperatura, (3) síntesis de la primera cadena de cDNA, (4) síntesis de

la segunda cadena de cDNA, (5) adenilación de los extremos 3’, (6) ligación de los

adaptadores, (7) enriquecimiento de los fragmentos de DNA mediante PCR, (8) validación de

la librerías, y (9) normalización y agrupación de librerías, cuantificando mediante Qubit

dsDNA HS Assay Kit (Thermo Fisher Scientific, Somerset, NJ, USA.) (Hou et al., 2015).

6. Análisis de datos de RNA-Seq

Se llevó a cabo un control de calidad de las lecturas sin procesar de todos los

tratamientos, utilizando la herramienta bioinformática FastQC

(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/).

Se observó que las lecturas poseían distintas secuencias sobrerrepresentadas en cada

uno de los archivos pareados, correspondientes a los adaptadores Truseq Adapter Index 7

(ATCGGAAGAGCACACGTCTGAACTCCAGTCACCGGCTATGATCTCGTATG) e Illumina Single End

PCR Primer 1 (ATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGGCTATAGTGTAGATCTC).

Dichos adaptadores, fueron eliminados de las lecturas mediante el programa de

procesamiento de lecturas FastX Toolkit

(http://hannonlab.cshl.edu/fastx_toolkit/index.html).

La causa de este error está originada en el paso del método de iniciación o cebado al

azar (en inglés random priming) en el proceso de construcción de la librería para la

secuenciación. El método de iniciación al azar debería ser dirigido por la selección de

Page 15: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 15

hexámeros aleatorios los cuales en teoría deberían estar presentes en la misma frecuencia

en el mix de cebadores y, también, deberían tener la misma eficiencia. No obstante, esto no

es así en la práctica pues ciertos hexámeros están más favorecidos durante el paso de

imprimación (o en inglés priming) (Hansen et al., 2010).

También se eliminaron las 12 primeras bases de cada lectura debido a la no

proporcionalidad del contenido de bases en esas posiciones de acuerdo con FastQC. Este es

un error común en la secuenciación Illumina y para corregirlo se empleó de nuevo FastX

Toolkit.

Las lecturas ya limpias, fueron alineadas frente al transcriptoma de referencia de

encina, publicado previamente por nuestro grupo de investigación (Guerrero-Sánchez et al.,

2017), utilizando el software Kallisto (https://pachterlab.github.io/kallisto/download). Como

resultado, se obtiene un fichero con la abundancia de expresión de cada transcrito,

expresada en TPM (del inglés Transcripts Per Million).

La relación entre las dos condiciones experimentales de los valores medios de TPM,

permitió obtener los valores de fold change para cada transcrito (expresado como log2). Los

resultados de expresión fueron analizados estadísticamente mediante el paquete Limma del

lenguaje de programación R (False Discovery Rate (FDR) < 0,05) (Ritchie et al., 2015). Se

seleccionaron como expresados diferencialmente aquellos que presentaban unos niveles de

fold change de ±2 respecto a los controles.

Resultados y discusión

1. Inspección visual de daños, contenido hídrico y fluorescencia de hojas

En el género Quercus hay muchas especies que han desarrollado mecanismos de

tolerancia al estrés hídrico (Aranda et al., 2014). Estos mecanismos han sido muy estudiados

a nivel morfológico y fisiológico, siendo muy escasos a nivel molecular. La respuesta a

condiciones de estrés hídrico (o tolerancia a sequía) se evaluó visualmente atendiendo a la

aparición de síntomas de daño, mediante el contenido hídrico en raíces y hojas, y por

cantidad de fluorescencia emitida por las hojas. Durante los 25 días que duró el

experimento, no se observaron síntomas claros de daños por sequía tales como la marchitez,

caída y clorosis de las hojas (Ilustración 3A). Esto corrobora la tolerancia a sequía

previamente descrita en Q. ilex por nuestro grupo de investigación, donde se comparó la

dicha tolerancia entre especies del género Quercus y dentro de la especie Q. ilex (Gómez-

Gálvez, 2017). El contenido hídrico relativo no mostró diferencias significativas entre control

Page 16: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 16

y tratamiento (p = 0.1396 en raíces y p = 0.2721 en hojas), siendo los valores medios

estimados de 48.83 % (hoja control), 67.08 % (raíz control), 54.44 % (hoja sequía) y 48.72 %

(raíz sequía). Las plantas permanecieron bien hidratas en condiciones de sequía, lo que

indica la existencia de un mecanismo de tolerancia a dicho estrés. Este hecho podría estar

asociado al cierre estomático, que disminuya o evite la evapotranspiración (Peguero-Pina et

al., 2018). Los valores de fluorescencia en las hojas es un parámetro de medida de la

actividad del fotosistema II (PSII), siendo muy utilizado en estudios de respuesta a estrés

(Rohácêk, 2002). Los valores de fluorescencia (Fv/Fm) de las plantas sometidas a sequía

fueron, a partir del día 11, inferiores a los de las plantas control, observándose, en las

primera una caída continua desde 0,7 a 0,4 (Ilustración 3B). La caída de la fotosíntesis fue

más acusadas en especies del género Quercus más susceptibles a sequía, casos de, Q. cerris,

Q. frainetto y Q. pyrenaica (Manes et al., 2006; Gómez-Gálvez, 2017).

Ilustración 3. Inspección visual de daños y medida de fluorescencia de A) Imagen de la izquierda corresponde a plantas controles e imagen de la derecha corresponde a plantas sometidas a estrés hídrico de Q. ilex tras 25 días de ensayo. B) Fluorescencia de las hojas. Los valores son media de 3 réplicas. Se indica con * las diferencias significativas (ANOVA, p<0,05).

Page 17: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 17

2. Control de calidad de las secuencias

Se llevó a cabo un análisis transcriptómico comparativo entre muestras de hojas

procedentes de plantas control y sometidas a sequía por ausencia de riego, a dos tiempos,

20 y 25 días, cuando la fluorescencia de las hojas cayó a un 30 y 50 %. Se utilizó tecnología

NGS, en concreto, HiSeq 4000 PE100 lane (Illumina). Esta es una técnica no exenta de

artefactos o errores en las lecturas que pueden originar pequeñas inserciones o deleciones,

baja calidad en algunas lecturas o contaminación por cebadores y adaptadores, lo cual

puede afectar al posterior procesamiento y análisis de los datos generados. Es, por ello,

imprescindible realizar sobre las lecturas recibidas un control de calidad previo a cualquier

estudio de los datos generados. Dicho control de calidad se llevó a cabo utilizando la

herramienta FastQC, la cual proporciona diferentes parámetros para evaluar la calidad de las

lecturas. El informe generado contiene datos estadísticos básicos sobre los archivos

cargados, como número total de secuencias, longitud y contenido GC de las mismas, además

de distintas gráficas con parámetros de calidad, presencia o ausencia de secuencias

sobrerrepresentadas, o contenido de adaptadores empleados por distintos sistemas de

secuenciación (Tabla 1; Ilustración 4). De cada una de las 12 muestras analizadas se ha

obtenido un total de 18 millones de lecturas, aproximadamente, con una longitud y

contenido GC medio de 150 pb y 46 %, respectivamente. (Los datos pertenecen a una

muestra control del segundo tiempo del ensayo, tomada como ejemplo).

Tabla 1. Parámetros de calidad de las lecturas originales y procesadas.

Medidas Secuencia original Secuencia procesada

Secuencias totales 17799939 14457838

Longitud de las secuencias 150 138

% GC 46 44

En cuanto a la gráfica de calidad por bases de las secuencias se muestra una

disminución en la calidad tanto de las primeras como de las últimas bases de las lecturas,

con un valor cercano a 30 (Ilustración 4A). El “score” asignado está basado en la puntuación

de calidad Phred, que define su valor como una propiedad que está relacionada

logarítmicamente con la probabilidad de error al asignar una base en una determinada

posición de una lectura.

Así, en la Ilustración 4A se aprecia como las bases que ocupan una posición

intermedia en las secuencias (entre las bases 10 y 80, aproximadamente) presentan los

Page 18: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 18

mejores resultados para Q, con un valor cercano a 40, lo que significa que las base que hay

en esas posiciones están determinadas con una precisión del 99,99 %. Además de esto, se

encontraron secuencias sobrerrepresentadas, duplicadas y pertenecientes a adaptadores

universales de Illumina.

Teniendo en cuenta estos datos preliminares, se empleó el conjunto de herramientas

FastX Toolkit para procesar las lecturas, presentando diferencias en los resultados obtenidos

respecto a las lecturas iniciales (Ilustración 4B).

Ilustración 4. Análisis de calidad de las secuencias. A) Secuencia original. B) Secuencia procesada con FastX Toolkit. La línea central roja representa la mediana, la caja amarilla el rango intercuartil, las marcas inferiores y superiores de las cajas los puntos 10 y 90 %, y la línea azul el valor de calidad media.

Tras filtrar las lecturas con menor calidad se han reducido el número de secuencias

totales por muestra aproximadamente un 20 %. Además, estas lecturas restantes no superan

los 138 pares de bases de longitud, y tienen un contenido GC ligeramente inferior a las

originales (Ilustración 4B). Además, se ha conseguido mejorar notablemente la calidad de las

secuencias, las cuales poseen un valor de 40 de Phred score, que cae ligeramente hasta 38

en las últimas posiciones (Ilustración 4B).

3. Análisis de expresión diferencial

Con las lecturas procesadas de las 12 muestras se procedió a realizar el análisis de

expresión diferencial.

Del análisis estadístico llevado a cabo en R, se obtuvieron 14 y 90 genes (Ilustración

5; Tabla 3 y Tabla 4) con una expresión diferencial significativa (FDR < 0.05 y un fold change

Page 19: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 19

de al menos ±2) para los tiempos 1 y 2 de sequía, respecto a sus correspondientes controles

(Ilustración 5). De los 14 genes con expresión diferencial significativa en T1, 8 genes

mostraron mayor nivel de expresión y 6 genes mostraron menor nivel de expresión con

respecto a los controles. De los 90 genes con expresión diferencial significativa en T2, 50

genes mostraron mayor nivel de expresión y 40 genes mostraron menor nivel de expresión

con respecto a los controles.

Ilustración 5. Número de genes con expresión diferencial en respuesta a sequía. Las barras en rojo representan los transcritos con niveles de expresión significativamente mayores a los controles, y las barras en azul representan los transcritos encontrados menores a los controles.

El hecho de que tras 20 días de sequía severa tan solo haya 14 transcritos con

expresión diferencial es otro indicio del grado de tolerancia basal que presenta Q. ilex a este

estrés. A medida que la fotosíntesis muestra una mayor inhibición (50 % en T2), la planta

necesita reajustar en mayor medida su expresión génica para sobrevivir al estrés, como se

demuestra con el gran incremento de transcriptos expresados diferencialmente a los 25

días. Este comportamiento contrasta con el encontrado en diferentes especies más

susceptibles a sequía, como en el caso de Verbena bonariensis, que muestra diferencias

muy notables en su transcriptoma tras 10 días de exposición al estrés (Wang et al., 2018).

3.1 Análisis diferencial tras los 20 días de sequía

Los resultados obtenidos se representaron empleando las gráficas más utilizadas en

transcriptómica, entre las que se incluyen las de tipo MA, Volcano y MDS (Ilustración 6,

Ilustración 7 e Ilustración 8). Las gráficas MA representan el logaritmo del fold change

0

20

40

60

T1 T2

me

ro d

e g

en

es

Tiempo

Genes con expresión diferencial significativa

Page 20: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 20

(denominado M, que corresponde al logaritmo del ratio de los niveles de lecturas alineadas

obtenidos para cada gen entre las dos condiciones, con y sin riego) frente al logaritmo de la

media (denominado A, que corresponde a la media de los niveles de cuentas para cada gen

entre las dos condiciones). Las gráficas MA son de utilidad para visualizar la reproducibilidad

entre las muestras de un experimento. Por su parte, las gráficas Volcano son de las más

empleadas en las ciencias -ómicas, ya que permiten la rápida identificación de los resultados

más significativos entre grandes cantidades de datos (Cui & Churchill, 2003). Así, esta gráfica

enfrenta la magnitud de cambio (fold change), frente a una medida de significancia

estadística, en el presente trabajo el FDR, elegido por ser más restrictivo. Por último, las

gráficas MDS (del inglés multidimensional scaling) permiten una representación de un

patrón de proximidades entre las distintas muestras de estudio. Tanto en las gráficas MA

como en las Volcano el logaritmo del fold change está en base 2, que por convenio es el más

empleado en transcriptómica.

Ilustración 6. Representación gráfica MA de los transcritos diferencialmente expresados a los 20 días. A) representación de todos los transcritos identificados tras alinearlos con el transcriptoma de referencia. B) representación de los 14 transcritos con expresión diferencial significativa.

Ilustración 7. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 20 días. A) representación del conjunto de todos los transcritos. B) representación de los 14 transcritos significativos en cuanto a sus diferencias en los niveles de expresión.

Page 21: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 21

Ilustración 8. Representación gráfica MDS de las muestras a los 20 días. Representación de las agrupaciones de las muestras en función de los niveles de transcriptos expresados diferencialmente. Las muestras control son representadas en color azul y las muestras sometidas a sequía se muestran en color naranja.

La Ilustración 8 muestra una clara tendencia en cuanto a la agrupación de los

conjuntos de transcritos con una expresión diferencial estadísticamente significativa en

función de si éstos provienen de muestras control o afectadas por el estrés de sequía.

Por último, para facilitar la discusión de los resultados obtenidos, los transcritos

obtenidos diferencialmente (Tabla 3) se clasificaron en distintos grupos funcionales

(Ilustración 9).

Ilustración 9. Categorización funcional de los transcritos expresados diferencialmente a los

20 días.

Page 22: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 22

Los resultados indican que una gran parte de los transcritos, aproximadamente el

29 %, están relacionados con el metabolismo primario, entendiendo este como el que

interviene de forma directa en la supervivencia, crecimiento y reproducción de las plantas.

(Ilustración 9). A su vez, de este porcentaje, el 75 % de los transcritos son relativos al

metabolismo de los carbohidratos. El reajuste del metabolismo de los carbohidratos en

condiciones de sequía ha sido previamente descrito en otras especies (Taji et al., 2002;

Bartels & Sunkar, 2005). En el presente estudio destacan el aumento de transcritos de la

piruvato quinasa o fosfoglucomutasa y la disminución para la fosfoenolpiruvato

carboxiquinasa. Esto podría implicar un aumento de la disponibilidad de glucosa y de la

glucolisis, en conjunción con una disminución de la gluconeogénesis, causando un aumento

del nivel energético. El incremento del metabolismo primario puede ser, por tanto, una

estrategia de tolerancia a la sequía (con una fotosíntesis inhibida un 30 %) al proporcionar

energía proveniente de moléculas de reserva, tanto carbohidratos como aminoácidos, que

permita a la planta activar los mecanismos de respuesta al estrés. Además, los carbohidratos

y derivados pueden tener una función directa en estrés por sequía, ya que pueden actuar

como osmolitos que ayudan a mantener la turgencia del interior celular, participando en la

protección de membranas y proteínas, e incluso pudiendo actuar como antioxidantes (Sami

et al., 2016).

Destacan también en T1 que hasta el 14 % de los transcritos aumentados están

relacionados con proteínas de función chaperona, como las de choque térmico (o HSP por

sus siglas en inglés, Heat Shock Protein), o la proteína ClpB (por sus siglas en inglés,

Caseinolytic peptidase B protein) (Ilustración 9). Las HSP son proteínas altamente

conservadas que se incrementan su expresión ante prácticamente cualquier situación de

estrés. Varios grupos de HSP presentan función chaperona, estabilizando proteínas,

manteniendo su estructura funcional y facilitando el replegamiento de proteínas mal

plegadas a causa de las condiciones estresantes (Al-Whaibi, 2011). El mantenimiento de la

conformación nativa y funcionalmente activa de enzimas y proteínas es esencial en la

supervivencia celular durante condiciones de estrés (Wang et al., 2004). El incremento de

estos transcritos en estrés por sequía también ha sido evidenciado en Q. lobata, especie

muy cercana taxonómicamente a Q. ilex (Gugger et al., 2017).

Con otro 15 %, un tercer grupo de transcritos que varían su expresión de manera

significativa en T1 son factores de transcripción (FT) de dedos de zinc (Ilustración 9). Estos

factores de transcripción son llamados así por poseer un dominio estructural conservado

Page 23: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 23

que cuenta con un ion de zinc coordinado, y mediante el cual son capaces de unirse al DNA.

Destaca la identificación de ZPR1, un factor de transcripción que ha sido caracterizado en

especies como el tomate, donde ha demostrado jugar un papel esencial en la respuesta a

sequía (Li et al., 2013). Esto es debido a que su promotor cuenta con elementos reguladores

en -cis que responden a ácido abscísico (ABA), la principal hormona vegetal que actúa en las

vías de señalización de respuesta a sequía; como el dominio ABRE (del inglés ABA-Responsive

Element), o el dominio de respuesta a factores de transcripción tipo MYB (del inglés

MYeloBlastosis transcription factor), también propio de este tipo de estrés (Li et al., 2013).

ZPR1 también es capaz de interaccionar con la proteína HyPRP (del inglés Hybrid Proline-Rich

Protein), un regulador negativo de la respuesta a ABA que interfiere con los sistemas

antioxidantes, esenciales durante estreses abióticos (Li et al., 2016).

Aproximadamente el 15 % de los transcritos identificados son relativos a proteínas

ribosomales (RP, del inglés Ribosomal Protein), destacando en T1 las asociadas a la

subunidad menor del ribosoma (40S), como la proteína ribosomal S21, o la S2-4 (Tabla 3). En

plantas, la mayor parte de los genes RP han mostrado una regulación diferencial de su

expresión (tanto positiva como negativamente) a causa de diversos factores ambientales,

entre los que se encuentra la sequía o la salinidad (Fromont-Racine et al., 2003). En cultivos

como el arroz, hasta el 57 % de los genes RP modulan su transcripción tras ser sometido a

sequía, de manera positiva la mayoría de ellos (Moin et al., 2017). El cambio en el patrón de

las proteínas ribosomales tras el comienzo del estrés es inmediato, y parece ser esencial

para el mantenimiento de la integridad y la estabilidad de los complejos ribosomales. Así,

éstos pueden seguir llevando a cabo la síntesis de proteínas, como de aquellas esenciales

para superar la situación de estrés (factores de transcripción, proteínas detoxificadoras o

chaperonas) (Moin et al., 2017). En base a los resultados, ya que el transcrito de la proteína

ribosomal S21 se encuentra sobreexpresado con un fold change de 7,43, y el de S2-4

disminuido con un fold change de 2,75, se propone que el recambio de una proteína por otra

en la subunidad pequeña ribosomal sea mecanismo importante en la tolerancia a sequía en

el T1 del ensayo.

Por último, los transcritos restantes, que suponen el 29 % del total, se relacionan con

proteínas de transporte de membranas, histonas y remodelación de cromatina, proteínas de

defensa y senescencia, y autofagia (Ilustración 9). En relación con último caso, el transcrito

de una proteína como es la 18b autophagy related (esencial en el control de la autofagia y el

recambio de componentes celulares) ha mostrado una represión en un estudio de estrés

Page 24: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 24

abiótico realizado en hojas de plantas de pimiento (Capsicum annuum) (Zhai et al., 2016), de

manera similar a lo que ocurre en nuestro estudio.

3.2 Análisis diferencial tras los 25 días de sequía

Las gráficas MA, Volcano y MDS para este segundo tiempo, al igual que en T1, usadas

para la representación de los resultados obtenidos en el presente análisis del RNA-Seq, se

encuentran en las Ilustración 10, Ilustración 11 e Ilustración 12, respectivamente.

Ilustración 10. Representación gráfica MA de los transcritos diferencialmente expresados a los 25 días. A) representación de todos los transcritos identificados tras alinearlos con el transcriptoma de referencia. B) representación de los 90 transcritos con expresión diferencial significativa.

Ilustración 11. Representación gráfica Volcano de los transcritos diferencialmente expresados a los 25 días. A) representación del conjunto de todos los transcritos. B) representación de los 90 transcritos significativos en cuanto a sus diferencias en los niveles de expresión.

Page 25: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 25

Ilustración 12. Representación gráfica MDS de las muestras a los 25 días. Representación de las agrupaciones de las muestras en función de los niveles de transcriptos expresados diferencialmente. Las muestras control son representadas en color verde y las muestras sometidas a sequía se muestran en color rojo.

La gráfica MDS para el T2 (Ilustración 12), al igual que la correspondiente al T1,

muestra una clara tendencia al agrupar los transcritos procedentes de los controles entre

ellos, a una distancia razonable del clúster formando por las réplicas de las muestras

sometidas a sequía.

También, como en T1, se realizó una separación funcional en distintas categorías en los

que se podían agrupar los transcritos expresados diferencialmente de T2 (Tabla 4). Un

mayor número de transcritos da lugar a un mayor número de categorías para agrupar todos

los transcritos expresados diferencialmente en T2 (Ilustración 13).

Ilustración 13. Categorización funcional de los transcritos expresados diferencialmente a

los 25 días.

Page 26: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 26

En T2, como ya se ha comentado, hay un mayor incremento de transcritos

identificados con una expresión diferencial respecto a T1 (90 transcritos frente a los 14

transcritos identificados en T1) (Ilustración 5; Tabla 4).

De los 90 transcritos identificados en T2, el 6,7 % de éstos están relacionados con los

sistemas antioxidantes de la planta, ausentes en T1 (Ilustración 9 e Ilustración 13). El

mantenimiento del balance entre producción de ROS y los sistemas de defensa, (enzimáticos

y no enzimáticos) en situaciones de estrés, es esencial , ya que estas especies pueden oxidar

múltiples componentes celulares como proteínas, lípidos, DNA y RNA, conduciendo, en

última instancia, a la muerte celular (Mittler, 2002). Transcritos encontrados

sobreexpresados dentro de este grupo, incluyen a los que codifican enzimas como catalasa,

triparredoxina o tiorredoxina (fold change de 8,3, 5,3 y 3,2), mientras que los de glutatión S-

transferasa 3 y peroxidasa se encuentran expresados a unos niveles inferiores a los controles

(fold change de -3,9 y -4, respectivamente). Dado una de las consecuencias inevitables del

estrés por sequía es un aumento en la producción de ROS (especialmente en mitocondrias y

cloroplastos), a priori cabría esperar una sobreexpresión de todos los transcritos

relacionados con la defensa del estrés oxidativo. Sin embargo, diversos estudios en distintas

especies han reflejado patrones diferentes de expresión de enzimas antioxidantes frente a

estrés por sequía que podrían estar relacionados con la edad de la planta, el nivel de

tolerancia, la estrategia para abordar la situación de estrés, así como la duración e

intensidad del mismo (Cruz de Carvalho, 2008).

Aunque el glutatión (GSH) y sus enzimas asociadas son capaces de reducir los

hidroperóxidos de lípidos de las membranas, las plantas preferentemente utilizan la

tiorredoxina como agente reductor (Cruz de Carvalho, 2008). Esto se corresponde con los

resultados obtenidos, ya que el transcrito de la tiorredoxina se encuentra aumentado y los

de enzimas relacionadas con el glutatión, como la glutatión S-transferasa, disminuidos (Tabla

4).

Por otra parte, los elevados niveles de transcrito de catalasa obtenidos, son un indicio

de que durante T2 del ensayo el estrés oxidativo era muy acusado, ya que ante un exceso

moderado H2O2 el ciclo del ascorbato/glutatión es suficiente para eliminarlo, y la catalasa no

suele mostrar sobreexpresión a nivel de transcrito (Lenne et al., 2002).

En T2 también aumenta el número de transcritos de genes que responden al ABA (6

transcritos en comparación con 1 transcrito en T1), indicio de que las respuestas a sequía

Page 27: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 27

controladas por esta hormona se llevan a cabo en situaciones de estreses más severas.

Resulta llamativo que aparezcan en mayor medida transcritos referentes a otros tipos de

estreses como son el inducido por altas temperaturas o estrés salino, con 7 y 11 transcritos

expresados de manera diferencial, respectivamente (Ilustración 13). Esto ocurre porque los

ambientes en los que se desarrollan las plantas son complejos, y a menudos las condiciones

que dan lugar a la presencia de los distintos estreses existen simultáneamente. De hecho, las

plantas han evolucionado en consecuencia y, aunque las principales rutas moleculares de

cada estrés abiótico tengan elementos específicos de señalización, también cuentan con

partes comunes y solapantes (Cramer et al., 2011).

De esta manera, aunque el experimento se haya llevado a cabo bajo condiciones

controladas de invernadero para recrear unas condiciones de estrés por sequía, se

alcanzaron temperaturas máximas de hasta 44 oC, lo que justifica la puesta en marcha de los

sistemas de defensa frente a un estrés por altas temperaturas (destaca la inducción de

chaperonas moleculares y HSPs); e inevitablemente, la excesiva pérdida de agua en las

plantas cesadas de riego, pudo ser la causa de la aparición de un estrés salino en el interior

celular, lo que explica la aparición de transcritos en relación con dicho estrés, como por

ejemplo, el transcrito del canal de potasio AKT1 o el transcrito de la bomba de protones

vacuolar de pirofosfato, siendo sus respectivas proteínas elementos clave en el

mantenimiento de la homeostasis celular iónica y osmótica (Assaha et al., 2017). Por otro

lado, al igual que con lo deducido del estrés oxidativo, estos otros dos estreses abióticos se

observaron solamente durante T2.

A su vez, la posible presencia de estrés salino y por altas temperaturas, junto con el

de sequía podrían justificar la aparición de otro grupo de transcritos (8 en total), la mayoría

de ellos (75 %) regulados negativamente, relacionados con estrés biótico (Ilustración 13).

Los factores abióticos alteran significativamente las rutas de señalización frente a agentes

patógenos, lo que puede conllevar a la desactivación de las respuestas de defensa y, por lo

tanto, a un mayor estado de susceptibilidad en las plantas en presencia de otros estreses de

naturaleza tanto abiótica, como biótica (Suzuki et al., 2014). Por ejemplo, la represión de los

transcritos de los genes NBS-LRR (del inglés Nucleotide-Binding Site Leucine-Rich Repeat) y

de resistencia a TMV (del inglés Tobacco Mosaic Virus), en nuestro caso con valores fold

change de -3,24 y -5,38, respectivamente, ha sido reportada en estudios en presencia de

altas temperaturas en A. thaliana (Zhu et al., 2010), evidencia adicional de que este tipo de

estrés abiótico también podría estar afectando a Q. ilex en nuestro ensayo. Por otra parte,

Page 28: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 28

la sobreexpresión de transcritos en relación con estreses bióticos (25 % restantes), puede ser

consecuencia de un incremento en los niveles de ABA inducido por el estrés por sequía, ya

que esta hormona ha mostrado inducir las cascadas de señalización relacionadas con

estreses bióticos por medio de factores de transcripción tipo MYC (del inglés

MYeloCytomatosis transcription factors), comunes a ambos estreses (Nguyen et al., 2016).

También, al igual que en T1, en T2 aparecen transcritos expresados diferencialmente

relacionados con proteínas ribosomales, procesamiento de los RNA ribosomales y

ensamblaje de los ribosomas (2 transcritos en T1 frente a 10 en T2) (Ilustración 13). Este

grupo de transcritos se encuentran regulados tanto positiva como negativamente, lo que

parece ser un patrón específico e indicativo de la importancia de la estabilización de los

ribosomas y del correcto mantenimiento de su función durante un estrés por sequía severa.

Uno de los grupos más numeroso de transcritos variables en T2, con un 22,2 %, se

relaciona con las principales rutas metabólicas celulares (Ilustración 13). Destacan cambios

en los transcritos relacionados con el metabolismo de los carbohidratos, el ciclo de Krebs, la

cadena de transporte de electrones mitocondrial, la asimilación del nitrógeno, el

metabolismo de los aminoácidos y el metabolismo de los ácidos grasos. Respecto al

metabolismo de los carbohidratos encontramos sobreexpresados transcritos relacionados

con la síntesis de almidón (almidón sintasa y UDP-glucosiltransferasa) y de trehalosa (3-

hidroxi-isobutiril-CoA hidrolasa 1), aunque también se encuentran sobreexpresados

transcritos relativos a enzimas catabólicas como amilasas y galactosidasas. Por otro lado,

encontramos transcritos aumentados y disminuidos relativos al de Krebs (isocitrato

deshidrogenasa y succinato deshidrogenasa, respectivamente), mientras que todos los

relacionados con la cadena de transporte de electrones y síntesis de ATP se encuentran

disminuidos. Teniendo en cuenta la caída fotosintética del 50 % en T2, estos reajustes

metabólicos (contradictorios en parte) podrían explicar un compromiso entre la acumulación

de azúcares como una posible fuente de energía de cara a una recuperación del estrés, y un

incremento del metabolismo celular como una estrategia para proveer a la célula energía

inmediata, necesaria para la activación de los sistemas de defensa (Wang et al., 2016). Por

otro lado, en la mayoría de las plantas sensibles a sequía, se han encontrado una

disminución en su función asimiladores de nitrógeno, como el posterior metabolismo de

aminoácidos y derivados en estreses severos, lo que se cree la principal causa de la

disminución del rendimiento de los cultivos bajo este tipo de estrés (Wang et al., 2016).

Enzimas como la aspartato aminotransferasa (AST), crucial en el metabolismo aminoacídico

Page 29: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 29

tras el ciclo GS/GOGAT, disminuye sus niveles en estudios con varias especies sensibles a

sequía como Triticum aestivum o Leymus chinensis (Xu & Huang, 2010); sin embargo, en este

estudio se han encontrado sobreexpresados los transcritos de esta enzima (fold change de

2,45) posible marcador del nivel de tolerancia de Q. ilex. La cisteína sintasa también presenta

elevados niveles de transcrito respecto a los controles (fold change de 5,19). Esto podría

atribuirse al papel central que este aminoácido ha demostrado tener en las respuestas a los

estreses abióticos en general, ya que la cisteína es precursor de la síntesis de varias

poliaminas que actúan como osmoprotectores; además, mediante el ratio entre cisteína

libre y su dímero (CySS/2Cys), ésta actúa como un sensor del potencial redox celular,

actuando en conjunción con proteínas integrantes de los sistemas antioxidantes, como la

tiorredoxina (mencionada anteriormente y cuyo transcrito se encuentras sobreexpresado

aquí), aunque estos mecanismos en relación al estrés hídrico no están dilucidados por

completo aún (Zagorchev et al., 2013). Finalmente, las variaciones en los niveles de

transcritos relacionados con la síntesis de lípidos, como la colina quinasa, pueden

relacionarse con cambios en la composición de las membranas lipídicas, ya que se ha

reportado que un incremento en el contenido de ácidos grasos insaturados en las

membranas puede contribuir a la tolerancia a la deshidratación en hojas de la especie

Cynodon dactylon (Zhong et al., 2011). Además, la colina es precursora de la glicín-betaína,

otro osmolito protector, cuyas vías metabólicas se han encontrado sobreexpresadas en

variedades de especies tolerantes a sequía, estrés salino y altas temperaturas, como Atriplex

halimus, Spinacia oleracea o Zea mays, entre otras especies (Chen & Murata, 2011).

Por último, cabe mencionar algunos conjuntos de transcritos, que suponen hasta el

21,1 % del total, y un cuya expresión diferencial con relación al estudio no está clara

(Ilustración 13). Aquí se incluyen quinasas, GTPasas y elementos de vías de señalización

mediadas por calcio, transcritos de proteínas relacionadas con la modificación de histonas y

remodelación de cromatina, maquinaria de degradación de proteínas (proteasoma y

ubiquitina) y algunos transcritos de proteínas de distintos sistemas de transporte.

4. Comparación de T1 y T2: análisis de términos de Ontología Génica

Los términos de Ontología Génica (o GO terms, del inglés Gene Ontology terms),

nacen de un proyecto colaborativo que tiene por objetivo aunar las descripciones de los

productos de los genes, de manera que el empleo de estos términos facilitara enormemente

la búsqueda cruzada entre las distintas bases de datos. El proyecto GO ha desarrollado tres

Page 30: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 30

vocabularios estructurados, independientes y no solapantes, (llamados ontologías) que

describen el producto de un gen en función del proceso biológico asociado, de los

componentes celulares, y de las funciones moleculares (Plessis et al., 2011). El empleo de

esta terminología es de gran utilidad en áreas de la investigación que manejan grandes

cantidades de datos, como son las tecnologías -ómicas en general y la transcriptómica, en

particular. Así, en este estudio, se han empleado los términos GO sobre el conjunto de

transcritos que han mostrado una expresión diferencial en ambos tiempos, para entender

los mecanismos subyacentes a la tolerancia a la sequía de una manera más integrada. Esto a

su vez puede ser de utilidad para establecer un perfil funcional del conjunto de transcritos

obtenidos. Las representaciones de las tres ontologías GO obtenidas para este ensayo se

muestran en las Ilustración 15, Ilustración 16 e Ilustración 17.

Entre las funciones moleculares más representativas de ambos tiempos se

encuentran categorías relacionadas con los ribosomas, como constituyentes estructurales de

los mismos o de unión a RNA (Ilustración 15). Esto se coincide con lo discutido en apartados

anteriores y reafirma la importancia del mantenimiento funcional de este orgánulo en la

tolerancia a estrés por sequía. Destacan también la aparición de actividades enzimáticas

relacionadas con el metabolismo primario (oxidorreductasas, isomerasas, hidrolasas) así

como vías de señalización (quinasas y GTPasas), especialmente en el segundo tiempo,

contrastando así con la categoría “unión a lípidos” que aparece únicamente en el primer

tiempo, pareciendo indicar que estos son más relevantes a T1 en cuanto a tolerancia se

refiere (Ilustración 15).

La ontología relativa a procesos biológicos indica que los genes cuyos transcritos

variaron más durante el experimento en ambos tiempos son los relacionados con la

respuesta a estreses (Ilustración 16). Los procesos catabólicos, biosintéticos y los

relacionados con el metabolismo de compuestos nitrogenados, precursores energéticos y

moléculas pequeñas también aparecen entre los más abundantes en el segundo tiempo,

evidencia de los complejos ajustes metabólicos que se llevan a cabo en el interior celular una

vez iniciado y avanzado el estrés hídrico. Junto con estos, la aparición de alteración en la

traducción y en la biogénesis de ribosomas reafirma una vez más lo discutido anteriormente.

Además, el hecho de que categorías como las relacionadas con cambios en el crecimiento,

división celular, y con el desarrollo anatómico y estructural, aparezcan entre las más

relevantes en el segundo tiempo, explican el negativo impacto que tienen los estreses en el

desarrollo normal de una planta (todo ello a causa de desajustes en las rutas de las

Page 31: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 31

principales fitohormonas) (Pandey et al., 2017), y lo que justificaría, a su vez, la inminente

necesidad del desarrollo de especies más tolerantes en un futuro cercano.

Por último, los términos GO relacionados con los distintos componentes celulares

(Ilustración 17), indican que los procesos más relevantes durante la respuesta al estrés

hídrico ocurren de manera predominante en el interior celular (frente al apoplasto),

especialmente en orgánulos como el cloroplasto (cambios metabólicos y energéticos), el

núcleo (regulación de la expresión génica), o los ribosomas (correcta síntesis de proteínas).

5. Integración de resultados: transcriptómica y proteómica

En la medida en que cada -ómica ofrece una visión parcial y sesgada del

funcionamiento de un sistema biológico, la integración de los datos provenientes de las

distintas -ómicas supone una poderosa herramienta para reconstruir y analizar las complejas

interacciones multidimensionales que ocurren en el interior celular en un tiempo

determinado bajo unas condiciones específicas. Mientras que la transcriptómica tiene como

ventaja su mayor potencial analítico, por la gran salida de datos que se generan, la

proteómica resulta de interés al encontrarse funcionalmente más cercana al fenotipo.

Además, son numerosos estudios de integración transcriptoma-proteoma los que muestran

una falta de correlación entre los mRNA y las correspondientes proteínas en determinadas

circunstancias experimentales, lo cual se explica por la existencia de mecanismos de control

de la expresión génica a nivel post-transcripcional, traduccional y/o post-traduccional (Peng

et al., 2015).

En este TFG se integran los datos transcriptómicos y proteómicos (Papa, 2018), con el

objetivo de una mejor compresión de los mecanismos de respuesta subyacentes a la

tolerancia en Q. ilex ante un estrés por sequía severa. Con tal fin, el material vegetal de

partida se dividió para, además de realizar el estudio transcriptómico por RNA-Seq, llevar a

cabo un ensayo proteómico doble, basado en gel (electroforesis monodimensional) y

mediante tecnología shotgun (Papa, 2018).

El estudio proteómico llevado a cabo previamente en Q. ilex en el primer tiempo

reveló cambios significativos en 344 proteínas pertenecientes a varios grupos funcionales,

185 de las cuales mostraban un aumento respecto a los controles, y 186 niveles inferiores

(± 2 fold change). De todos ellos, los relativos al metabolismo de los carbohidratos muestran

un aumento en la mayoría de las proteínas significativas identificadas (Ilustración 14 A). Esta

tendencia corresponde con los datos transcriptómicos discutidos anteriormente, en los que

Page 32: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 32

hasta el 75 % de los transcritos relacionados con el metabolismo de los carbohidratos

aumentaban de manera significativa para el primer tiempo (Ilustración 9). También

aparecen sobrerrepresentadas en el primer tiempo proteínas relacionadas con estreses

abióticos y bióticos, señalización redox y respuesta a estrés oxidativo, fotosíntesis y

organización celular (datos no mostrados), cuyos transcritos no han sido identificados en los

datos ya discutidos.

Ilustración 14. Grupos funcionales identificados en el estudio proteómico. A) Q. ilex, tiempo 1. B) Q. ilex, tiempo 2. En rojo las proteínas aumentadas, en azul las disminuidas. Las categorías son: 3. Metabolismo principal de carbohidratos; 4. Metabolismo menor de carbohidratos; 13. Metabolismo aminoácidos; 20. Estreses bióticos y abióticos; 21. Señalización redox y estrés oxidativo; 29. Síntesis/degradación de proteínas.

En el tiempo 2 se encontraron cambios significativos en los niveles de 331 proteínas, de

las cuales 195 se encontraban con los niveles incrementados en sequía, y 136 con los niveles

disminuidos respecto a los controles. Estas se encuadran dentro unos grupos funcionales

solapantes en mayor medida con los datos transcriptómicos del segundo tiempo (Ilustración

14), con algunas discrepancias. El aumento en los niveles de transcritos de proteínas

relacionadas con los estreses oxidativo, abióticos y bióticos, se corresponde con un

incremento significativo en las proteínas de estas categorías (Ilustración 13 e Ilustración

14B). La mayor parte de las proteínas estudiadas en relación con el metabolismo de los

aminoácidos se encuentran disminuidas, aunque se identifican varias proteínas relacionadas

con la síntesis de aminoácidos que se encuentran sobrerrepresentadas en las hojas en

sequía. Este hecho, en conjunción con los datos transcriptómicos, que muestran un

metabolismo aminoacídico inducido, parece indicar la necesidad de una mayor disposición

de aminoácidos libres. Una hipótesis que explica estos resultados es que dichos aminoácidos

son empleados en la síntesis de nuevas proteínas relacionadas con la tolerancia a sequía, ya

que la síntesis proteica total está inducida en el T2 frente a los controles (Papa, 2018). Esta

Page 33: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 33

hipótesis se refuerza teniendo en cuenta la identificación de un gran número de transcritos

relacionados con la estabilización y el mantenimiento funcional de los ribosomas, tanto en

T1 como en T2. Por otro lado, en relación con el metabolismo de los carbohidratos, muy

sobreexpresado a nivel de transcrito en T2, no encuentra tal correspondencia a nivel de

proteína. El resultado de la integración transcriptómica-proteómica se resume en la Tabla 5:

Tabla 5. Comparación de los datos generados por las aproximaciones de transcriptómica y proteómica. En rojo aparecen indicados las categorías funcionales cuya mayor parte de transcritos o proteínas presentan resultados significativos con cambios de fold change superiores a 2 respecto a los controles; en azul, inferiores a 2.

De la Tabla 5 se puede concluir que existe una elevada correspondencia funcional transcrito-proteína en condiciones de sequía severa en Q. ilex.

Page 34: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 34

Conclusiones

• El tratamiento de sequía severo durante 25 días no ocasionó muerte de las plantas, ni

daños visibles tales como marchitez, caída de hojas o clorosis. El contenido hídrico relativo

de las hojas y raíces fue similar entre las plantas control y las sometidas a sequía. Los valores

de fluorescencia de las hojas de las plantas control y de las sometidas a sequía mostraron un

descenso del 30 % a los 20 días, y un 50 % a los 25 días tras el cese del riego. Se confirmó el

carácter altamente tolerante de la encina a sequía.

• El procesamiento de las lecturas con FastX Toolkit permitió obtener secuencias de alta

calidad aptas para alinearlas con el transcriptoma de referencia de Q. ilex.

• El análisis transcriptómico reveló cambios cualitativos y cuantitativos en la expresión de

14 y 90 genes a los 20 y 25 días, respectivamente. A los 20 días, se observó un aumento y

una disminución de, respectivamente, 8 y 6 genes. A los 25 días, el número de genes

sobreexpresados fue de 50 y 40 los que disminuyeron.

• Los genes con expresión diferencial a los 20 días correspondieron a los siguientes grupos

funcionales: metabolismo de carbohidratos y aminoácidos, factores de transcripción dedos

de zinc, proteínas ribosomales y chaperonas moleculares. A los 25 días aparecieron

sobreexpresados, además, genes de respuesta a estrés y homeostasis redox.

• Para los grupos funcionales relacionados con el metabolismo de carbohidratos,

metabolismo de aminoácidos, metabolismo de poliaminas y nucleótidos, procesamiento de

RNA, estreses abióticos y bióticos, homeostasis redox, síntesis y degradación de proteínas y

transporte, existe una buena correlación entre los datos obtenidos con cada las

aproximaciones de transcriptómica y proteómica.

Page 35: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 35

Conclusions

• No drought symptoms such as wilting, leaf fall or chlorosis, were observed in the plants.

The relative water content in the leaves and roots was quite similar between control plants

and those subjected to drought. The fluorescence values between both treatments

decreased a 30 % and 50 % at 20 and 25 days, respectively. Thus, Q. ilex is a drought-tolerant

species.

• The processing of the readings using FastX Toolkit allowed obtaining high quality

sequences for aligning them with the de novo transcriptome of Q. ilex.

• The transcriptomic analysis showed both qualitative and quantitative changes in the

expression of 14 and 90 genes at 20 and 25 days, respectively. An increase and a decrease of

expression in 8 and 6 genes, respectively, was observed at 20 days. On the other hand, the

number of overexpressed and underexpressed genes was 50 and 40, respectively, at 25

days.

• The genes with differential expression at 20 days were grouped in several functional

groups such as carbohydrate and amino acid metabolism, transcription factors (zinc-fingers),

ribosomal proteins and chaperons. At 25 days, genes related to stress and redox

homeostasis were also overexpressed.

• A good correlation between the transcriptomic and proteomic data was observed in the

functional groups related to the carbohydrate metabolism, amino acid metabolism,

polyamine metabolism, biotic and abiotic stresses, redox homeostasis, synthesis and

degradation of proteins, and transport.

Page 36: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 36

Bibliografía

Al-Whaibi MH. 2011. Plant heat-shock proteins: A mini review. Journal of King Saud

University. Science 23, 139–150.

Aranda I, Ramírez-Valiente JA, Rodríguez-Calcerrada JR. 2014. Características funcionales

que influyen en la respuesta a la sequía de las especies del género Quercus: variación inter- e

intra-específica. Tree physiology 25, 1–14.

Assaha DVM, Ueda A, Saneoka H, Al-Yahyai R, Yaish MW. 2017. The Role of Na+ and K+

Transporters in Salt Stress Adaptation in Glycophytes. Frontiers in Physiology 8, 509–528.

Bartels D, Sunkar R. 2005. Drought and salt tolerance in plants. Critical Reviews in Plant

Sciences 24, 23–58.

Bonner F, Vozzo J. 1987. Seed Biology and Technology of Quercus. General Technical Report,

SO-66. New Orleans, LA: U.S. Dept. of Agriculture, Forest Service, Southern Forest

Experiment Station. 21 p.

Braitenberg V, Schüz A. 1998. Ecology of Mediterranean Evergreen Oak Forests. Berlin,

Heidelberg: Springer Berlin Heidelberg.

Caliskan S. 2014. Germination and seedling growth of holm oak (Quercus ilex L.): effects of

provenance, temperature, and radicle pruning. iForest - Biogeosciences and Forestry 7, 103–

109.

Cañellas I, Roig S, Poblaciones MJ, Gea-Izquierdo G, Olea L. 2007. An approach to acorn

production in Iberian dehesas. Agroforestry Systems 70, 3–9.

Chen THH, Murata N. 2011. Glycinebetaine protects plants against abiotic stress:

Mechanisms and biotechnological applications. Plant, Cell and Environment 34, 1–20.

Corbineau F, Xia Q, Bailly C, El-Maarouf-Bouteau H. 2014. Ethylene, a key factor in the

regulation of seed dormancy. Frontiers in Plant Science 5, 1–13.

Cramer GR, Urano K, Delrot S, Pezzotti M, Shinozaki K. 2011. Effects of abiotic stress on

plants: A systems biology perspective. BMC Plant Biology 11, 163–177.

Cruz de Carvalho MH. 2008. Drought stress and reactive oxygen species. 3, 156–165.

Cui X, Churchill GA. 2003. Statistical tests for differential expression in cDNA microarray

experiments. Genome Biology 4, 210–220.

Echevarría-Zomeño S, Abril N, Ruiz-Laguna J, Jorrín-Novo J, Maldonado-Alconada AM.

2012. Simple, rapid and reliable methods to obtain high quality RNA and genomic DNA from

Quercus ilex L. leaves suitable for molecular biology studies. Acta Physiologiae Plantarum 34,

Page 37: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 37

793–805.

Echevarría-Zomeño S, Ariza D, Jorge I, Lenz C, Del Campo A, Jorrín-Novo JV., Navarro RM.

2009. Changes in the protein profile of Quercus ilex leaves in response to drought stress and

recovery. Journal of Plant Physiology 166, 233–245.

Fromont-Racine M, Senger B, Saveanu C, Fasiolo F. 2003. Ribosome assembly in eukaryotes.

Gene 313, 17–42.

Gómez-Gálvez I. 2017. Análisis proteómico de la respuesta a sequía en encina (Quercus ilex

L.). Trabajo Final de Grado.

González C. 2008. Analysis of the Oak Decline in Spain; ‘la seca’. Tesis de licenciatura.

Guerrero-Sánchez VM, Maldonado-Alconada AM, Amil-Ruiz F, Jorrín-Novo JV. 2017. Holm

oak (Quercus ilex) Transcriptome. De novo Sequencing and Assembly Analysis. Frontiers in

Molecular Biosciences 4, 1–5.

Gugger PF, Peñaloza-Ramírez JM, Wright JW, Sork VL. 2017. Whole-transcriptome response

to water stress in a California endemic oak, Quercus lobata. Tree Physiology 37, 632–644.

Hansen KD, Brenner SE, Dudoit S. 2010. Biases in Illumina transcriptome sequencing caused

by random hexamer priming. Nucleic acids research 38, 1–7.

Hoagland DR, Arnon DI. 1950. The water-culture method for growing plants without soil.

California Agricultural Experiment Station Circular 347, 1–32.

Hou Z, Jiang P, Swanson SA, Elwell AL, Nguyen BKS, Bolin JM, Stewart R, Thomson JA. 2015.

A cost-effective RNA sequencing protocol for large-scale gene expression studies. Scientific

Reports 5, 1–5.

Jorrín-Novo JV., Maldonado AM, Echevarría-Zomeño S, Valledor L, Castillejo MA, Curto M,

Valero J, Sghaier B, Donoso G, Redondo I. 2009. Plant proteomics update (2007-2008):

Second-generation proteomic techniques, an appropriate experimental design, and data

analysis to fulfill MIAPE standards, increase plant proteome coverage and expand biological

knowledge. Journal of Proteomics 72, 285–314.

Lenne C, Leblanc N, Julien J, Roeckel-drevet P. 2002. Two GPX-like proteins from

Lycopersicon esculentum and Helianthus annuus are antioxidant enzymes with phospholipid

hydroperoxide glutathione peroxidase and thioredoxin peroxidase activities. European

Journal of Biochemistry 269, 2414–2420.

Li J, Ouyang B, Wang T, Luo Z, Yang C, Li H, Sima W, Zhang J, Ye Z. 2016. HyPRP1 gene

suppressed by multiple stresses plays a negative role in abiotic stress tolerance in tomato.

Frontiers in Plant Science 7, 1–14.

Page 38: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 38

Li J, Sima W, Ouyang B, Luo Z, Yang C, Ye Z, Li H. 2013. Identification and expression pattern

of a ZPR1 gene in wild tomato (Solanum Pennellii). Plant Molecular Biology Reporter 31,

409–417.

Lindner M, Maroschek M, Netherer S, Kremer A, Barbati A, Garcia-Gonzalo J, Seidl R,

Delzon S, Corona P, Kolström M, Lexer MJ, Marchetti M. 2010. Climate change impacts,

adaptive capacity, and vulnerability of European forest ecosystems. Forest Ecology and

Management 259, 698–709.

López-Hidalgo C, Guerrero-Sánchez VM, Gómez-Gálvez I, Sánchez-Lucas R, Castillejo-

Sánchez MA, Maldonado-Alconada AM, Valledor L, Jorrín-Novo JV. 2018. A multi-Omics

analysis pipeline for the metabolic pathway reconstruction in the orphan species Quercus

ilex. Frontiers in Plant Science 9, 1–16.

Lowe R, Shirley N, Bleackley M, Dolan S, Shafee T. 2017. Transcriptomics technologies. PLoS

Computational Biology 13, 1–23.

Manes F, Vitale M, Donato E, Giannini M, Puppi G. 2006. Different ability of three

Mediterranean oak species to tolerate progressive water stress. Photosynthetica 44, 387–

393.

Mittler R. 2002. Oxidative stress, antioxidants and and stress tolerance. Trends in plants science 7, 405-410.

Moin M, Bakshi A, Madhav MS, Kirti PB. 2017. Expression profiling of ribosomal protein

gene family in dehydration stress responses and characterization of transgenic rice plants

overexpressing RPL23A for water-use efficiency and tolerance to drought and salt stresses.

Frontiers in Chemistry 5, 1–16.

Moro R. 2002. Guía De Los Árboles De España (OMEGA, Ed.). Barcelona.

Nguyen D, Rieu I, Mariani C, van Dam NM. 2016. How plants handle multiple stresses:

hormonal interactions underlying responses to abiotic stress and insect herbivory. Plant

Molecular Biology 91, 727–740.

Pandey P, Irulappan V, Bagavathiannan MV, Sanchez LE. 2017. Impact of combined abiotic

and biotic stresses on plant growth and avenues for crop improvement by exploiting physio-

morphological Traits. 8, 1–15.

Papa Vettorazzi ME. 2018. Estudio de la variabilidad de respuesta a sequía en poblaciones

andaluzas de encina (Quercus ilex L.) mediante aproximaciones proteómicas. Trabajo Final

de Máster.

Pasta S, Rigo D De, Caudullo G. 2016. Quercus ilex in Europe : distribution, habitat, usage

Page 39: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 39

and threats. European Atlas of Forest Tree Species; European Union: Luxembourg 156–157.

Peguero-pina JJ, Mendoza-herrer Ó, Gil-pelegr E, Sancho-knapik D. 2018. Cavitation limits

the recovery of gas exchange after severe drought stress in Holm oak (Quercus ilex L.).

Forests 9, 443–456.

Peng X, Qin Z, Zhang G, Guo Y, Huang J. 2015. Integration of the proteome and

transcriptome reveals multiple levels of gene regulation in the rice dl2 mutant. Frontiers in

Plant Science 6, 351–362.

Plessis L, Nives S, Dessimoz C. 2011. The what, where, how and why of gene ontology - a

primer for bioinformaticians. 12, 723–735.

Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, Smyth GK. 2015. Limma powers

differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids

Research 43, e47.

Rohácêk K. 2002. Chlorophyll fluorescence parameters: the definitions, photosynthetic

meaning, and mutual relationships.

Romero-Rodríguez MC, Pascual J, Valledor L, Jorrín-Novo J. 2014. Improving the quality of

protein identification in non-model species. Characterization of Quercus ilex seed and Pinus

radiata needle proteomes by using SEQUEST and custom databases. Journal of Proteomics

105, 85–91.

Sami F, Yusuf M, Faizan M, Faraz A, Hayat S. 2016. Role of sugars under abiotic stress. Plant

Physiology and Biochemistry 109, 54–61.

Sghaier-Hammami B, Redondo-López I, Valero-Galván J, Jorrín-Novo JV. 2016. Protein

profile of cotyledon, tegument, and embryonic axis of mature acorns from a non-orthodox

plant species: Quercus ilex. Planta 243, 369–396.

Sghaier-Hammami B, Valero-Galván J, Romero-Rodríguez MC, Navarro-Cerrillo RM, Abdelly

C, Jorrín-Novo JV. 2013. Physiological and proteomics analyses of Holm oak (Quercus ilex

subsp. ballota [Desf.] Samp.) responses to Phytophthora cinnamomi. Plant Physiology and

Biochemistry 71, 191–202.

Suzuki N, Rivero RM, Shulaev V, Blumwald E, Mittler R. 2014. Abiotic and biotic stress

combinations. New Phytologist 203, 32–43.

Taji T, Ohsumi C, Iuchi S, Seki M, Kasuga M, Kobayashi M, Yamaguchi-Shinozaki K,

Shinozaki K. 2002. Important roles of drought- and cold-inducible genes for galactinol

synthase in stress tolerance in Arabidopsis thaliana. Plant Journal 29, 417–426.

Valero-Galván J, Jorrín-Novo JV, Cabrera AG, Ariza D, García-Olmo J, Cerrillo RMN. 2012.

Page 40: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 40

Population variability based on the morphometry and chemical composition of the acorn in

Holm oak (Quercus ilex subsp. ballota [Desf.] Samp.). European Journal of Forest Research

131, 893–904.

Valero-Galván J, Valledor L, Cerrillo RMN, Gil-Pelegrin E, Jorrín-Novo J V. 2011. Studies of

variability in Holm oak (Quercus ilex subsp. ballota [Desf.] Samp.) through acorn protein

profile analysis. Journal of Proteomics 74, 1244–1255.

Velculescu VE, Zhang L, Zhou W, Vogelstein J, Basrai MA, Bassett DE, Hieter P, Vogelstein

B, Kinzler KW. 1997. Characterization of the yeast transcriptome. Cell 88, 243–251.

Wang X, Cai X, Xu C, Wang Q, Dai S. 2016. Drought-responsive mechanisms in plant leaves

revealed by proteomics. International Journal of Molecular Sciences 17, 1706–1736.

Wang Z, Gerstein M, Snyder M. 2001. RNA-Seq: a revolutionary tool for transcriptomics

Zhong. Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins 10, 57–63.

Wang B, Lv XQ, He L, Zhao Q, Xu MS, Zhang L, Jia Y, Zhang F, Liu FL, Liu QL. 2018. Whole-

transcriptome sequence analysis of Verbena bonariensis in response to drought stress.

International Journal of Molecular Sciences 19, 1751–1771.

Wang W, Vinocur B, Shoseyov O, Altman A. 2004. Role of plant heat-shock proteins and

molecular chaperones in the abiotic stress response. Trends in Plant Science 9, 244–252.

Xu C, Huang B. 2010. Comparative analysis of drought responsive proteins in Kentucky

bluegrass cultivars contrasting in drought tolerance. Crop Science 50, 2543–2552.

Zagorchev L, Seal CE, Kranner I, Odjakova M. 2013. A central role for thiols in plant

tolerance to abiotic stress. International Journal of Molecular Sciences 14, 7405–7432.

Zhai Y, Guo M, Wang H, Lu J, Liu J, Zhang C, Gong Z, Lu M. 2016. Autophagy, a conserved

mechanism for protein degradation, responds to heat, and other abiotic stresses in

Capsicum annuum L. Frontiers in Plant Science 7, 1–13.

Zhong D, Du H, Wang Z, Huang B. 2011. Genotypic variation in fatty acid composition and

unsaturation levels in bermudagrass associated with leaf dehydration tolerance. Journal of

the American Society for Horticultural Science 136, 35–40.

Zhu Y, Qian W, Hua J. 2010. Temperature Modulates Plant Defense Responses through NB-

LRR Proteins. PLoS Pathogens 6, e1000844.

Page 41: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 41

Anexo Tabla 2. Valores de RIN de las preparaciones de RNA. El código de las muestras indica el origen (S, Sevilla), el tiempo de ensayo (1 o F, si es T1 o T2); el tratamiento (C, control o S, sequía), y el número de réplica 1-5).

Nº muestra Código RIN

1 S1-C3 8.40

2 S1-C4 8.20

3 S1-C5 8.30

4 SF-C1 8.40

5 SF-C3 8.20

6 SF-C4 -

7 S1-S2 8.30

8 S1-S3 8.50

9 S1-S5 8.10

10 SF-S1 8.80

11 SF-S2 8.20

12 SF-S5 8.30

Page 42: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 42

Tabla 3. Genes con expresión diferencial a los 20 días del ensayo. Los valores de fold change de los genes sobreexpresados o disminuidos en condiciones de sequía frente a los controles aparecen en rojo y en azul, respectivamente.

Nº #ID Gen Fold Change FDR Descripción

1 qilexmiraassembly_c15040 RPS21 7,434 1,39E-07 40S ribosomal protein S21 2 qilexmiraassembly_c23734 HSP70 4,004 0,011 Heat shock cognate 70 kDa protein 3 qilexmiraassembly_c317688 KPYG_RICCO 3,284 0,020 Pyruvate kinase 4 qilexmiraassembly_c86195 clpB 3,188 0,020 Chaperone protein ClpB 5 qilexmiraassembly_c76542 L484_018464 2,571 0,020 Zinc finger protein 6 qilexmiraassembly_c6669 zpr1 2,536 0,020 Zinc finger protein ZPR1 7 qilexmiraassembly_c142882 OEP16 2,167 0,045 Plastid 16-kDa outer membrane protein 8 qilexmiraassembly_c204436 pgm 2,167 0,045 Phosphoglucomutase 9 qilexmiraassembly_c128557 JD1 -2,524 0,020 1-acylglycerophosphocholine O-acyltransferase 1

10 qilexmiraassembly_c65939 ATG18B -2,676 0,020 Autophagy-related protein 18b 11 qilexmiraassembly_dn_c41725 RPS2D -2,750 0,034 40S ribosomal protein S2-4 12 qilexmiraassembly_c184180 pck -3,142 0,020 Phosphoenolpyruvate carboxykinase 13 qilexmiraassembly_c380446 BnaCnng75900D -3,867 0,020 BnaCnng75900D protein 14 qilexmiraassembly_c36413 ABE2 -5,629 0,045 Histone H2B

Page 43: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 43

Tabla 4. Genes con expresión diferencial a los 25 días del ensayo. Los valores de fold change de los genes sobreexpresados o disminuidos en condiciones de sequía frente a los controles aparecen en rojo y en azul, respectivamente.

Nº #ID Gen Fold change FDR Descripción

1 qilexmiraassembly_c81150 cat 8,343 0,019 Catalase 2 qilexmiraassembly_dn_c30296 rpsA 6,778 1,122E-05 30S ribosomal protein S1 3 qilexmiraassembly_c72161 PAB1 6,638 2,030E-05 Proteasome subunit alpha type-2-A 4 qilexmiraassembly_c17666 XW6 5,646 0,029 Pco131882 5 qilexmiraassembly_c102169 PIMT1 5,428 0,029 Protein-L-isoaspartate O-methyltransferase 1 6 qilexmiraassembly_c235002 TXN1 5,345 0,008 Tryparedoxin 7 qilexmiraassembly_c15739 MTK 5,232 0,028 Methylthioribose kinase

8 qilexmiraassembly_dn_c38735 CYSC1 5,191 0,019 Bifunctional L-3-cyanoalanine synthase/cysteine synthase C1, mitochondrial

9 qilexmiraassembly_c49796 pcmt 4,947 0,041 L-isoaspartyl protein carboxyl methyltransferase 10 qilexmiraassembly_c44819 nifU 4,705 0,000 Iron-sulfur cluster assembly factor 11 qilexmiraassembly_c68581 pAbp 4,646 0,019 PABP 12 qilexmiraassembly_c150586 SAS10 4,594 0,043 SAS10 13 qilexmiraassembly_c89041 ko 4,574 0,017 Ent-kaurene oxidase 14 qilexmiraassembly_c27045 pdha1 4,284 0,041 Pyruvate dehydrogenase E1 component subunit alpha 15 qilexmiraassembly_c114737 VAMP727 4,135 0,044 Vesicle-associated membrane protein 727 16 qilexmiraassembly_c143481 htrA 3,862 0,044 Strongly similar to serine protease 17 qilexmiraassembly_c139611 GWD 3,742 0,014 Alpha-glucan water dikinase, chloroplastic

18 qilexmiraassembly_c89767 At5g16180 3,705 0,016 Chloroplastic group IIA intron splicing facilitator CRS1, Chloroplastic

19 qilexmiraassembly_c74412 CBSCLC6 3,696 0,022 Putative chloride channel-like protein CLC-g 20 qilexmiraassembly_c22102 TOC34 3,683 0,044 Translocase of chloroplast 34

21 qilexmiraassembly_c42894 JAC1 3,572 0,040 J domain-containing protein required for chloroplast accumulation response 1

22 qilexmiraassembly_c173111 SGD 3,553 0,044 Strictosidine beta-D-glucosidase

23 qilexmiraassembly_c118937 ppa 3,517 0,019 Pyrophosphate-energized vacuolar membrane proton pump

Page 44: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 44

24 qilexmiraassembly_c111836 r7 3,498 0,029 Putative non-TIR-NBS-containing resistance protein 25 qilexmiraassembly_c71757 fca 3,491 0,044 Putative FCA orthologue 26 qilexmiraassembly_c193798 IDH (NADP+) 3,441 0,020 Putative isocitrate dehydrogenase

27 qilexmiraassembly_c404976 PGSC0003DMG4

00017062 3,380 0,035 NB-ARC domain disease resistance protein

28 qilexmiraassembly_dn_c212 SS3 3,380 0,030 Soluble starch synthase 3, chloroplastic/amyloplastic

29 qilexmiraassembly_c160617 UGT76A2 3,341 0,028 UDP-glucose iridoid glucosyltransferase

30 qilexmiraassembly_c26585 trxh 3,275 0,037 Thioredoxin

31 qilexmiraassembly_c113753 ipk1A 3,263 0,004 Inositol-pentakisphosphate 2-kinase

32 qilexmiraassembly_c28583 pap1 3,129 0,023 Purple acid phosphatase

33 qilexmiraassembly_c19071 CML21 3,066 0,022 Putative calcium-binding protein CML21

34 qilexmiraassembly_c39036 At5g40530 2,998 0,031 Ribosomal RNA-processing protein 8

35 qilexmiraassembly_c189605 fcl2 2,971 0,025 Methenyltetrahydrofolate synthase domain-containing protein

36 qilexmiraassembly_c40813 RPS26B 2,939 0,023 40S ribosomal protein S26-2

37 qilexmiraassembly_c123067 Os06g0184766 2,872 0,019 Os06g0184766 protein

38 qilexmiraassembly_c93193 At4g30990 2,745 0,044 Down-regulated in metastasis (DRIM) domain-containing protein

39 qilexmiraassembly_c45002 KCA1 2,628 0,044 Kinesin-like protein KCA1

40 qilexmiraassembly_c188928 PIM1 2,607 0,019 Cell differentiation, Rcd1-like protein

41 qilexmiraassembly_c6358 AGAL1 2,589 0,019 Alpha-galactosidase 1

42 qilexmiraassembly_c171676 dhx35 2,551 0,044 Putative ATP-dependent RNA helicase DHX35

43 qilexmiraassembly_c108827 GSO1 2,550 0,044 LRR receptor-like serine/threonine-protein kinase GSO1

44 qilexmiraassembly_c114584 AAT1 2,448 0,044 Aspartate aminotransferase

45 qilexmiraassembly_c86195 clpB 2,434 0,043 Chaperone protein ClpB

46 qilexmiraassembly_dn_c8891 RPS5 2,371 0,044 40S ribosomal protein S5

47 qilexmiraassembly_c147090 glysoja_014070 2,317 0,044 3-hydroxyisobutyryl-CoA hydrolase 1

48 qilexmiraassembly_c203407 CRK1 2,284 0,016 CDPK-related protein kinase

49 qilexmiraassembly_c57793 SNAP33 2,198 0,044 SNAP25 homologous protein SNAP33

50 qilexmiraassembly_c89253 CYP40 2,156 0,045 Peptidyl-prolyl cis-trans isomerase CYP40

51 qilexmiraassembly_dn_c441 RPL35 -2,120 0,044 60S ribosomal protein L35

Page 45: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 45

52 qilexmiraassembly_c6869 At2g22425 -2,314 0,033 Probable signal peptidase complex subunit 1

53 qilexmiraassembly_c9738 SFH8 -2,412 0,018 Phosphatidylinositol/phosphatidylcholine transfer protein SFH8

54 qilexmiraassembly_c87075 myb -2,656 0,046 MYB transcription factor R2R3 type

55 qilexmiraassembly_dn_c13879 adc1 -2,720 0,044 Arginine decarboxylase

56 qilexmiraassembly_c307432 AOF2 -3,044 0,019 Lysine-specific histone demethylase-like protein

57 qilexmiraassembly_dn_c41725 RPS2D -3,048 0,014 40S ribosomal protein S2-4

58 qilexmiraassembly_c102959 CXE1 -3,108 0,042 Carboxylesterase 1

59 qilexmiraassembly_c123906 ndhF -3,126 0,045 NADH-plastoquinone oxidoreductase subunit 5

60 qilexmiraassembly_c244652 akt2 -3,158 0,045 Potassium channel AKT1

61 qilexmiraassembly_c15174 CML19 -3,215 0,041 EF hand calcium-binding family protein

62 qilexmiraassembly_c168011 NLR3 -3,238 0,044 NBS-LRR-like protein

63 qilexmiraassembly_c403110 hsp70B -3,467 0,004 Heat shock protein 70B

64 qilexmiraassembly_c128665 acT2 -3,616 0,038 Putative PF02458-family acyl transferase 2

65 qilexmiraassembly_c225630 IRK1 -3,637 0,046 Serine/threonine-protein kinase

66 qilexmiraassembly_c34380 dhsb -3,656 0,028 Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial

67 qilexmiraassembly_c10376 A34 -3,750 0,022 Histone H2A

68 qilexmiraassembly_c16884 DGP6 -3,793 0,029 Large subunit GTPase 1

69 qilexmiraassembly_dn_c1439 ATH1 -3,820 0,044 Cytochrome P450

70 qilexmiraassembly_c100372 CHR24 -3,826 0,005 Protein CHROMATIN REMODELING 24

71 qilexmiraassembly_c113178 GST3 -3,916 0,044 Glutathione S-transferase 3

72 qilexmiraassembly_c223111 rbp1 -4,004 0,044 Peroxidase

73 qilexmiraassembly_c208868 NEC4 -4,088 0,044 Nectarin IV

74 qilexmiraassembly_c160420 NTF2 -4,282 0,001 Nuclear transport factor 2

75 qilexmiraassembly_c183689 RPS15A -4,326 0,046 40S ribosomal protein S15-1

76 qilexmiraassembly_c26850 LSM1B -4,555 0,016 Sm-like protein LSM1B

77 qilexmiraassembly_dn_c28238 PRMT10 -4,699 0,046 Protein arginine N-methyltransferase PRMT10

78 qilexmiraassembly_c31712 snrpf -4,700 0,029 Small nuclear ribonucleoprotein F

79 qilexmiraassembly_c124551 Sb03g038260 -4,850 0,023 Putative uncharacterized protein Sb03g038260

Page 46: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 46

80 qilexmiraassembly_c147600 PFK4 -4,862 0,044 ATP-dependent 6-phosphofructokinase 4, Chloroplastic

81 qilexmiraassembly_c49396 ubi3 -4,971 0,039 Ubiquitin 82 qilexmiraassembly_c109506 pan -5,013 0,021 26S protease regulatory subunit 4 83 qilexmiraassembly_c157838 UGT73B12 -5,174 0,044 Glycosyltransferase 84 qilexmiraassembly_c153571 GLIP5 -5,197 0,008 GDSL esterase/lipase 5 85 qilexmiraassembly_c377716 TMVRN -5,379 0,023 TMV resistance protein N 86 qilexmiraassembly_c149492 ck1 -5,862 0,045 Choline kinase 87 qilexmiraassembly_c8087 cen -5,901 0,017 Centrin-1 88 qilexmiraassembly_c59927 RPS30A -5,908 0,044 40S ribosomal protein S30 89 qilexmiraassembly_c48651 SGT1B -6,091 0,039 Protein SGT1 homolog B 90 qilexmiraassembly_dn_c1358 ce1 -6,389 0,039 Centrin

Page 47: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

Pág.47

Ilustración 15. Ontología Génica de las funciones moleculares. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.

Page 48: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 48

Ilustración 16. Ontología Génica de los procesos biológicos. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.

Page 49: Análisis e integración de datos -ómicos y su aplicación a la ...€¦ · este trabajo y me serán de utilidad en mi futuro profesional. Especial mención a Lola, que me ha demostrado

pág. 49

Ilustración 17. Ontología Génica de los componentes celulares. Los transcritos de los genes con expresión diferencial más significativa para el segundo tiempo del ensayo se muestran en rojo, y transcritos de los genes con expresión diferencial más significativa para el primer tiempo del ensayo se muestran en azul.