Por favor, use este identificador para citar o enlazar este ítem:
https://hdl.handle.net/11000/39843CXIP4 contiene un motivo ZCCHC, es esencial y participa en el splicing en Arabidopsis thaliana
| Título : CXIP4 contiene un motivo ZCCHC, es esencial y participa en el splicing en Arabidopsis thaliana |
| Autor : Aceituno Valenzuela, Uri Israel |
| Tutor: Ponce Molet, María Rosa Sarmiento Mañús, Raquel |
| Editor : Universidad Miguel Hernández |
| Departamento: Departamentos de la UMH::Biología Aplicada |
| Fecha de publicación: 2026 |
| URI : https://hdl.handle.net/11000/39843 |
| Resumen : La NF-kappa B Activating Protein (NKAP) humana participa en varias facetas del metabolismo del ARN, como la ligación de exones durante el splicing y la lectura de la marca epitranscriptómica m6A en los microARN (miARN) y los ARN mensajeros (ARNm); su presunta ortóloga en Arabidopsis es MORPHOLOGY OF ARGONAUTE1-52 SUPPRESSED (MAS2). El gen MAS2 fue identificado en el laboratorio de María Rosa Ponce, en una búsqueda de supresores extragénicos del fenotipo morfológico de argonaute1-52 (ago1-52), un alelo hipomorfo y viable de AGO1. La proteína AGO1 es una endorribonucleasa que juega un papel central en el silenciamiento postranscripcional mediado por miARN. El alelo ago1-52 es portador de una mutación que daña uno de los 5′SS (sitio 5′ o donante del splicing) y causa la retención parcial del correspondiente intrón. Los alelos mas2 identificados en el laboratorio de M.R. Ponce suprimen parcialmente el splicing aberrante del transcrito primario de ago1-52. En el laboratorio de M.R. Ponce se realizó también un ensayo del doble híbrido de la levadura para identificar interactores de la proteína MAS2. La presunta interactora más representada en dicha búsqueda fue CAX-INTERACTING PROTEIN 4 (CXIP4), que contiene un dedo de zinc de 18 aminoácidos denominado motivo ZCCHC o “zinc knuckle”, cuya estructura central es CX2CX4HX4C (C es cisteína, H es histidina, y X, cualquier aminoácido), flanqueada por dos aminoácidos no conservados en cada extremo. Se conocen muchas proteínas con motivos ZCCHC, pero son muy pocas las que se han caracterizado. En la parte inicial de esta Tesis se pretendió obtener una visión panorámica del conocimiento sobre las proteínas eucarióticas con motivos ZCCHC, que se ha plasmado en una revisión sistemática de estas proteínas presentes en Saccharomyces cerevisiae, Arabidopsis thaliana y Homo sapiens, en representación de los reinos de los hongos, las plantas y los metazoos, respectivamente. Hemos realizado búsquedas de proteínas que contienen la secuencia CX2CX4HX4C en bases de datos específicas de los tres organismos mencionados, utilizando los programas PatMatch para las de la levadura y Arabidopsis, y ScanProsite para las humanas. Hemos analizado la información estructural y funcional de todas estas proteínas disponible en UniProtKB, concluyendo que existen siete en la levadura, 34 en la especie humana y 69 en Arabidopsis. Aunque la mayoría de las proteínas que hemos considerado contenían un solo motivo ZCCHC, otras tenían más, hasta ocho. Los motivos ZCCHC estaban presentes en cualquier región de la proteína y aparecían solos o combinados con otros dominios o motivos, muchos de los cuales eran de unión a ARN. Además, encontramos que muchas proteínas que contienen motivos ZCCHC albergan regiones de baja complejidad, principalmente ricas en prolina (P), leucina (L), glicina (G), arginina (R) o serina (S). Muchas de las proteínas con motivos ZCCHC previamente estudiadas participan en diferentes facetas del metabolismo del ARNm, como la elongación de la transcripción, la poliadenilación, la traducción, el splicing, la exportación del ARNm maduro y su degradación, así como en la biogénesis de los ARN ribosómicos (ARNr) y los miARN, y en el silenciamiento génico postranscripcional mediado por estos últimos. Las proteínas con motivos ZCCHC son principalmente nucleares, aunque algunas tienen localización dual en el citoplasma y el núcleo, y muy pocas son exclusivamente citoplásmicas. Solo una de ellas se localiza en el cloroplasto de Arabidopsis, en donde participa en la regulación del splicing de los genes de este orgánulo que codifican ARNr. Las proteínas presuntamente ortólogas que hemos estudiado conservan su localización subcelular y el número de sus motivos ZCCHC; en algunos casos, estos motivos determinan la localización subcelular de dichas proteínas o su translocación o su unión a otras proteínas o ácidos nucleicos. Construimos un árbol filogenético con los 198 motivos ZCCHC que identificamos en siete proteínas de la levadura, 69 de Arabidopsis y 34 humanas. Encontramos que los motivos ZCCHC de la mayoría de los presuntos ortólogos se agrupan en clados, lo que indica la existencia de una mayor conservación de los aminoácidos distintos a las tres C y la H características de este motivo. La conservación de estos aminoácidos sugiere su importancia para la actividad de la proteína ancestral de la que derivan dichos ortólogos y para ellos mismos. Hemos estudiado en esta Tesis el gen CXIP4 de Arabidopsis, que está anotado como un ortólogo lejano del SREK1 Interacting Protein 1 (SREK1IP1) humano, al que se supone relacionado con el splicing. SREK1IP1 y CXIP4 solo presentan un motivo conocido: un ZCCHC, que está muy conservado y se agrupa en el árbol filogenético que hemos obtenido, lo que sugiere su trascendencia funcional. No se observan otras similitudes entre estas dos proteínas en el resto de su secuencia, aunque ambas presentan regiones de baja complejidad en su mitad carboxiterminal. Aunque existen presuntos ortólogos de CXIP4 y SREK1IP1 en muchas plantas y animales, no se ha descrito ningún alelo mutante. Hemos caracterizado los mutantes insercionales cxip4-1 y cxip4-2, que son portadores de un alelo nulo y otro hipomorfo de CXIP4, respectivamente. La letalidad postembrionaria temprana de cxip4-1 indica que CXIP4 es esencial en Arabidopsis. La viabilidad de cxip4-2 nos ha permitido establecer la implicación de CXIP4 en varias rutas de desarrollo, ya que este mutante presenta un fenotipo muy pleiotrópico en todas las fases de su ciclo de vida. La pleiotropía del fenotipo morfológico de cxip4-2 se corresponde con su perfil transcriptómico, ya que una parte importante de sus genes desregulados codifican factores de transcripción cuya desregulación podría explicar diferentes rasgos de su fenotipo. Hemos analizado el splicing global de las plantas mutantes cxip4-2, constatando un incremento del splicing alternativo, principalmente de los eventos de retención intrónica, aunque menor que los descritos en mutantes portadores de alelos de genes que codifican componentes del espliceosoma. Hemos confirmado algunos de los eventos de retención intrónica diferencial entre Col-0 y cxip4-2, utilizando para ello plantas del mutante presuntamente nulo cxip4-1, en el que las alteraciones del splicing son más evidentes, como esperábamos. Estos resultados sugieren que CXIP4 participa directa o indirectamente en el splicing de los pre-ARNm. El análisis del enriquecimiento en categorías funcionales de los genes que sufren splicing alternativo y se comportan diferencialmente en cxip4-2 respecto a la estirpe silvestre sugiere que CXIP4 controla el splicing alternativo de grupos específicos de genes, entre ellos los implicados en la degradación de ARNm mediante desadenilación y la represión epigenética mediante metilación guiada por ARN no codificantes. La acumulación nuclear de ARN poliadenilados que hemos observado en las plantas cxip4-2 es compatible con la implicación de CXIP4 en el splicing y refuerza la hipótesis de la conservación de las funciones de la SREK1IP1 humana y la CXIP4 de Arabidopsis. Human NF-kappa B Activating Protein (NKAP) participates in diverse facets of RNA metabolism, such as exon ligation during splicing, and reading of the epitranscriptomic mark m6A on microRNAs (miRNAs) and messenger RNAs (mRNAs). The putative orthologue of human NKAP in Arabidopsis is MORPHOLOGY OF ARGONAUTE1-52 SUPPRESSED (MAS2). The MAS2 gene was identified in the laboratory of María Rosa Ponce, in a screen for extragenic suppressors of the morphological phenotype of argonaute1-52 (ago1-52), a hypomorphic and viable allele of AGO1. The AGO1 protein is an endoribonuclease that plays a key role in miRNA-mediated post-transcriptional silencing. The ago1-52 allele carries a mutation that damages one of its 5′SS (splicing acceptor), causing partial retention of the corresponding intron. The mas2 alleles identified in the laboratory of M.R. Ponce partially suppress the aberrant splicing of the primary transcript of ago1-52. A yeast two-hybrid assay was also performed in the laboratory of M.R. Ponce to identify interactors of the MAS2 protein. The most represented putative interactor found in such search was CAX-INTERACTING PROTEIN 4 (CXIP4), which contains a zinc finger called the ZCCHC motif or "zinc knuckle" with the structure CX2CX4HX4C (C is cysteine, H is histidine, and X is any amino acid). Many proteins with ZCCHC motifs are known, but very few have been characterized. The initial part of this Thesis aimed to acquire a panoramic view of the state of the art on eukaryotic proteins with ZCCHC motifs, summarized in a systematic review of these proteins, covering Saccharomyces cerevisiae, Arabidopsis thaliana, and Homo sapiens, representing the fungal, plant, and metazoan kingdoms respectively. We conducted searches for proteins containing the CX2CX4HX4C sequence in databases specific of these organisms, using the programs Patmatch for yeast and Arabidopsis, and ScanProsite for humans. We analyzed the structural and functional information on these proteins available in UniProtKB, concluding that there are seven in yeast, 34 in humans, and 69 in Arabidopsis. While most of the proteins that we considered had a single ZCCHC motif, some had more, up to eight. These motifs were found in various regions of the protein, alone or combined with other domains or motifs, many of which are RNA-binding. Additionally, we found that many ZCCHC-containing proteins harbor regions of low complexity, mainly rich in proline (P), leucine (L), glycine (G), arginine (R), or serine (S), including RS domains found in proteins related to mRNA splicing. Many previously studied ZCCHC motif-containing proteins participate in different facets of RNA metabolism, including transcription elongation, polyadenylation, translation, splicing, export and degradation of mRNA, as well as miRNA and ribosomal RNA (rRNA) biogenesis, and miRNA-mediated post-transcriptional gene silencing. ZCCHC motif-containing proteins are primarily nuclear, although some have dual localization in the cytoplasm and nucleus, and very few are exclusively cytoplasmic. Only one of them is localized in the chloroplast of Arabidopsis, where it participates in splicing regulation of genes encoding rRNAs in this organelle. Subcellular localization and the number of ZCCHC motifs are often conserved in orthologous proteins. In some cases, these motifs determine subcellular localization, translocation, or binding to other proteins or nucleic acids. We constructed a phylogenetic tree with the 198 ZCCHC motifs identified in seven yeast proteins, 69 from Arabidopsis, and 34 human. Our analysis revealed that the ZCCHC motifs of most putative orthologs group into clades, indicating higher conservation of amino acids beyond the characteristic three cysteines (C) and one histidine (H) in this motif. The conservation of these amino acids suggests their importance for the activity of the ancestral protein from which these orthologs are derived, as well as for their own function. In this Thesis, we studied the Arabidopsis CXIP4 gene, which was already annotated as a distant ortholog of Human SREK1 Interacting Protein 1 (SREK1IP1), which is presumed to be related to splicing. SREK1IP1 and CXIP4 share only their single ZCCHC motif, which clearly cluster in our previously mentioned phylogenetic tree, suggesting its functional significance. No similarity was observed in the rest of the sequences of these two proteins, although both have regions of low complexity in their carboxy-terminal half. While putative orthologs of CXIP4 and SREK1IP1 exist in many plants and animals, no mutant alleles have been described. We characterized the insertional mutants cxip4-1 and cxip4-2, carrying a null and a hypomorphic allele of CXIP4, respectively. The early post-embryonic lethality of cxip4-1 indicates that CXIP4 is essential for Arabidopsis survival. The viability of cxip4-2 plants allowed us to establish the involvement of CXIP4 in various development pathways, as this mutant exhibits a highly pleiotropic phenotype throughout its life cycle. The pleiotropy of the morphological phenotype of cxip4-2 corresponds to its transcriptomic profile, with a significant portion of its deregulated genes encoding transcription factors, and some of them may explain several traits of its phenotype. We analyzed global splicing in cxip4-2 mutant plants, finding increased alternative splicing, mainly intron retention events, although less pronounced than that described in mutants carrying alleles of genes encoding spliceosome components. We confirmed some such differential intron retention events using the likely null mutant cxip4-1, whose splicing alterations are more pronounced. These observation suggests that CXIP4 directly or indirectly participates in pre-mRNA splicing but does not play a central role in this process. Functional category enrichment analysis of genes undergoing alternative splicing and behaving differently in cxip4-2 compared to the wild type suggests that CXIP4 controls alternative splicing of specific gene categories. Our results also suggest that CXIP4 is related to epigenetic repression via non-coding RNA-guided methylation. The nuclear accumulation of polyadenylated RNA that we observed in cxip4-2 plants is consistent with the involvement of CXIP4 in splicing and reinforces the hypothesis of functional conservation between human SREK1IP1 and Arabidopsis CXIP4. |
| Palabras clave/Materias: splicing alternativo metabolismo del ARN motivos ZCCHC Arabidopsis thaliana |
| Área de conocimiento : CDU: Ciencias puras y naturales: Biología: Bioquímica. Biología molecular. Biofísica CDU: Ciencias puras y naturales: Botánica |
| Tipo de documento : info:eu-repo/semantics/doctoralThesis |
| Derechos de acceso: info:eu-repo/semantics/openAccess Attribution-NonCommercial-NoDerivatives 4.0 Internacional |
| Aparece en las colecciones: Tesis doctorales - Ciencias e Ingenierías |
La licencia se describe como: Atribución-NonComercial-NoDerivada 4.0 Internacional.
.png)