regulacion de la expresion de genes endogenos en · pdf file87 número de...

54
19 OFICINA ESPAÑOLA DE PATENTES Y MARCAS ESPAÑA 11 Número de publicación: 2 250 103 51 Int. Cl. 7 : A01N 63/00 12 TRADUCCIÓN DE PATENTE EUROPEA T3 86 Número de solicitud europea: 00906882 .6 86 Fecha de presentación : 06.01.2000 87 Número de publicación de la solicitud: 1061805 87 Fecha de publicación de la solicitud: 27.12.2000 54 Título: Regulación de la expresión de genes endógenos en células utilizando proteínas de dedos de cinc. 30 Prioridad: 12.01.1999 US 229037 45 Fecha de publicación de la mención BOPI: 16.04.2006 45 Fecha de la publicación del folleto de la patente: 16.04.2006 73 Titular/es: Sangamo BioSciences, Inc. Suite A100, 501 Canal Boulevard Richmond, California 94804, US 72 Inventor/es: Cox, George, Norbert, III; Case, Casey, Christopher; Eisenberg, Stephen, P.; Jarvis, Eric, Edward y Spratt, Sharon, Kaye 74 Agente: Lehmann Novo, María Isabel Aviso: En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín europeo de patentes, de la mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europea de Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo se considerará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 del Convenio sobre concesión de Patentes Europeas). ES 2 250 103 T3 Venta de fascículos: Oficina Española de Patentes y Marcas. C/Panamá, 1 – 28036 Madrid

Upload: vudan

Post on 11-Feb-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

19© OFICINA ESPAÑOLA DEPATENTES Y MARCAS

ESPAÑA

11© Número de publicación: 2 250 10351© Int. Cl.7: A01N 63/00

12© TRADUCCIÓN DE PATENTE EUROPEA T3

86© Número de solicitud europea: 00906882 .686© Fecha de presentación : 06.01.200087© Número de publicación de la solicitud: 106180587© Fecha de publicación de la solicitud: 27.12.2000

54© Título: Regulación de la expresión de genes endógenos en células utilizando proteínas de dedos de cinc.

30© Prioridad: 12.01.1999 US 229037

45© Fecha de publicación de la mención BOPI:16.04.2006

45© Fecha de la publicación del folleto de la patente:16.04.2006

73© Titular/es: Sangamo BioSciences, Inc.Suite A100, 501 Canal BoulevardRichmond, California 94804, US

72© Inventor/es: Cox, George, Norbert, III;Case, Casey, Christopher;Eisenberg, Stephen, P.;Jarvis, Eric, Edward ySpratt, Sharon, Kaye

74© Agente: Lehmann Novo, María Isabel

Aviso: En el plazo de nueve meses a contar desde la fecha de publicación en el Boletín europeo de patentes, dela mención de concesión de la patente europea, cualquier persona podrá oponerse ante la Oficina Europeade Patentes a la patente concedida. La oposición deberá formularse por escrito y estar motivada; sólo seconsiderará como formulada una vez que se haya realizado el pago de la tasa de oposición (art. 99.1 delConvenio sobre concesión de Patentes Europeas).E

S2

250

103

T3

Venta de fascículos: Oficina Española de Patentes y Marcas. C/Panamá, 1 – 28036 Madrid

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

DESCRIPCIÓN

Regulación de la expresión de genes endógenos en células utilizando proteínas de dedos de cinc.

Campo de la invención

La presente invención proporciona métodos para regular la expresión génica de genes endógenos utilizando pro-teínas recombinantes de dedos de cinc.

Antecedentes de la invención

Muchos procesos patofisiológicos son el resultado de la expresión aberrante de los genes. Ejemplos incluyen laactivación inadecuada de citoquinas proinflamatorias en la artritis reumatoide, la infra-expresión del receptor hepáticode LDL en la hipercolesterolemia, la sobre-expresión de factores proangiogénicos, y la infra-expresión de factoresantiangiogénicos en el crecimiento de los tumores sólidos. Si existieran métodos terapéuticos para control de la expre-sión génica, muchas de estas patologías podrían ser tratadas óptimamente. En otro ejemplo, genes experimentalmentesilenciosos o inactivos por cualquier otra razón podrían activarse a fin de tratar un estado de enfermedad particular.Los genes inactivos están reprimidos por diversos mecanismos, que incluyen la estructura de la cromatina, represoresespecíficos con acción cis, y metilación del DNA (Travers, Cell 96:311 (1996); Beato y Eisfeld, Nucleic Acids Res.25:3559 (1997); Wolffe et al., PNAS 96:5894 (1999)). Ejemplos del beneficio terapéutico para la expresión de dichosgenes incluyen la activación de genes experimentalmente silenciosos de hemoglobina fetal para tratar la enfermedadde células falciformes y la activación de la eutrofina para tratar la distrofia muscular. Adicionalmente, organismospatógenos tales como virus, bacterias, hongos y protozoos podrían controlarse por alteración de la expresión géni-ca. Existe por consiguiente una necesidad clara y no satisfecha de métodos terapéuticos que actúen por regulaciónespecífica de la secuencia de genes relacionados con enfermedades.

Además de la utilidad terapéutica directa proporcionada por la capacidad para manipular la expresión génica, estacapacidad puede utilizarse experimentalmente para determinar la función de un gen de interés. Un método comúnexistente para determinar experimentalmente la función de un gen de nuevo descubrimiento consiste en clonar sucDNA en un vector de expresión dirigido por un promotor fuerte y medir la consecuencia fisiológica de su sobre-expresión en una célula transfectada. Este método es intensivo en mano de obra y no aborda las consecuencias fisioló-gicas de la regulación decreciente de un gen diana. Métodos simples que permitan la sobre- e infra-expresión selectivade genes no caracterizados serían de gran utilidad para la comunidad científica. Métodos que permitan la regulaciónde genes en sistemas celulares modelo, animales transgénicos y plantas transgénicas podrían encontrar uso extendidoen laboratorios académicos, compañías farmacéuticas, compañías genómicas y en la industria de la biotecnología.

Un uso adicional de herramientas que permitan la manipulación de la expresión génica es en la fabricación deproductos biológicos comercialmente útiles. Líneas de células, animales transgénicos y plantas transgénicas podríantransformarse por ingeniería genética para sobre-expresar un producto proteínico útil. Sirve como ejemplo la produc-ción de eritropoyetina por una línea de células de este tipo transformada por ingeniería genética. Análogamente, laproducción por caminos metabólicos podría ser alterada o mejorada por la regulación selectiva creciente o decrecientede un gen que codifique una enzima crucial. Un ejemplo de esto es la producción de plantas con niveles alterados desaturación de los ácidos grasos.

Existen actualmente en la técnica métodos que permiten alterar la expresión de un gen dado, v.g., utilizando ribozi-mas, tecnología antisentido, reguladores de moléculas pequeñas, sobre-expresión de clones de cDNA, y desactivaciónde genes. Estos métodos han demostrado hasta ahora ser generalmente insuficientes para muchas aplicaciones y porregla general no han demostrado alta eficacia de dianas o alta especificidad in vivo. Para resultados experimentales ytratamientos terapéuticos útiles se desean estas características.

La expresión génica se controla normalmente por alteraciones en la función de proteínas de fijación de DNAespecíficas de secuencia denominadas factores de transcripción. Estas proteínas se fijan en la proximidad general(aunque ocasionalmente a grandes distancias) del punto de iniciación de la transcripción de un gen. Las mismas actúaninfluyendo en la eficiencia de formación o función de un complejo de iniciación de la transcripción en el promotor. Losfactores de transcripción pueden actuar de una manera positiva (transactivación) o de manera negativa (transrepresión).

La función de un factor de transcripción puede ser constitutiva (“encendida” siempre) o condicional. La funcióncondicional puede ser impartida a un factor de transcripción por una diversidad de medios, pero la mayoría de estosmecanismos reguladores dependen de la secuestración del factor en el citoplasma y la liberación inducible y translo-cación nuclear subsiguiente, fijación de DNA y transactivación (o represión). Ejemplos de factores de transcripciónque funcionan de este modo incluyen receptores de progesterona, proteínas de fijación de elementos de respuesta aesteroles (SREBPs) y NF-kappa B. Existen ejemplos de factores de transcripción que responden a fosforilación oligandos de moléculas pequeñas por alteración de su capacidad para fijar su secuencia de reconocimiento de DNAcognada (Hou et al., Science 256:1701 (1994), Gossen y Bujard, PNAS 89:5547 (1992); Oligino et al., Gene Ther.5:491-496 (1998); Wang et al., Gene Ther. 4:432-441 (1997); Neering et al., Blood 88:1147-1155 (1996); y Rendahlet al., Nat. Biotechnol. 16:757-761 (1998)). Este mecanismo es común en procariotas, pero algo menos común eneucariotas.

2

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Las proteínas de dedos de cinc (“ZFPs”) son proteínas que pueden fijarse al DNA de una manera específica dela secuencia. Los dedos de cinc fueron identificados por primera vez en el factor de transcripción TFIIIA a partirde los oocitos del sapo de garras africano, Xenopus laevis. Las ZFPs están muy extendidas en las células eucariotas.Un motivo ilustrativo que caracteriza una clase de estas proteínas (clase C2H2) es -Cys-(X)2−4-Cys-(X)12-His-(X)3−5-His donde X es cualquier aminoácido). Un dominio de dedos simple tiene una longitud de aproximadamente 30 ami-noácidos y varios estudios estructurales han demostrado que el mismo contiene una hélice alfa que contiene los dosresiduos histidina invariantes coordinados a través de cinc con las dos cisteínas de una vuelta beta simple. Hasta lafecha, se han identificado más de 10.000 secuencias de dedos de cinc en varios millares de factores de transcrip-ción conocidos o supuestos. Las ZFPs están involucradas no sólo en el reconocimiento del DNA, sino también en lafijación del RNA y la fijación proteína-proteína. Estimaciones actuales son que esta clase de moléculas constituiráaproximadamente el 2% de todos los genes humanos.

La estructura cristalina por rayos X de Zif268, un dominio de tres dedos de un factor de transcripción murino, hasido resuelta en un complejo con su secuencia de DNA cognada y muestra que cada dedo puede estar superpuestosobre el siguiente por una rotación y traslación periódicas del dedo a lo largo del eje principal del DNA. La estructurasugiere que cada dedo interacciona independientemente con DNA a intervalos de 3 pares de bases, manteniéndose lascadenas laterales en las posiciones -1, 2, 3 y 6 de cada hélice de reconocimiento en contacto con subsitios de tripletesde DNA respectivos. El término amino de Zif268 está situado en el extremo 3’ de su subsitio de reconocimiento deDNA. Algunos dedos de cinc pueden estar fijados a una cuarta base en un segmento diana. La cuarta base se encuentraen la cadena opuesta de las otras tres bases reconocidas por el dedo de cinc y es complementaria a la base situadainmediatamente en 3’ del subsitio de tres bases.

La estructura del complejo Zif268-DNA sugería también que la especificidad de secuencia de DNA de una ZFPpodría alterarse efectuando sustituciones de aminoácidos en las cuatro posiciones de la hélice (-1, 2, 3 y 6) en unahélice de reconocimiento de dedos de cinc. Experimentos de presentación de fago utilizando genotecas combinatoriasde dedos de cinc para comprobar esta observación se publicaron en una serie de documentos en 1994 (Rebar et al.,Science 263:671-673 (1994); Jamieson et al., Biochemistry 33:5689-5695 (1994); Choo et al., PNAS 91:11163-11167(1994)). Se construyeron genotecas combinatorias con cadenas laterales aleatorias en el primer dedo o en el dedointermedio de Zif268 y se aislaron luego con un sitio de fijación de Zif268 alterado en el cual el sub-sitio de DNAapropiado estaba reemplazado por un triplete de DNA alterado. La correlación entre la naturaleza de las mutacionesintroducidas y la alteración resultante en la especificidad de secuencia dio lugar a una serie parcial de reglas desustitución para el diseño racional de ZFPs con especificidad de fijación alterada.

Greisman y Pabo, Science 275:657-661 (1997) exponen una elaboración de un método de presentación de fagoen el cual cada dedo de una proteína de dedos de cinc se somete sucesivamente a aleatorización y selección. Estedocumento consignaba la selección de ZFPs para un elemento de respuesta a hormonas nucleares, un sitio diana p53y una secuencia de caja TATA.

Se ha comunicado que las ZFPs recombinantes tienen la capacidad de regular la expresión génica de genes infor-madores expresados transitoriamente en células cultivadas (véase, v.g., Pomerantz et al., Science 267:93-96 (1995);Liu et al., PNAS 94: 5525-5530 (1997); y Beerli et al., PNAS 95:14628-14633 (1998)).

Por ejemplo, Pomerantz et al., Science 267:93-96 (1995) consignan un intento de diseñar una nueva proteína defijación de DNA por fusión de dos dedos de Zif268 con un homeodominio de Oct-1. La proteína híbrida se fusionóluego con un dominio activador o represor de la transcripción para expresión como una proteína quimérica. Segúnse comunicó, la proteína quimérica se fijaba a un sitio diana que representaba un híbrido de los subsitios de susdos componentes. Los autores construyeron luego un vector informador que contenía un gen de luciferasa enlazadooperativamente a un promotor y un sitio híbrido para la proteína quimérica de fijación de DNA en proximidad alpromotor. Los autores comunicaron que su proteína quimérica de fijación de DNA podía activar o reprimir la expresióndel gen de luciferasa.

Liu et al., PNAS 94:5525-5530, (1997) informan de la formación de una ZFP compuesta por utilización de unseparador peptídico para enlazar dos ZFPs componentes, cada una de las cuales tiene tres dedos. La proteína com-puesta se enlazó luego adicionalmente a dominios de activación o represión de la transcripción. Se consignó que laproteína quimérica resultante se unía a un sitio diana formado a partir de los elementos diana unidos por las dosZFPs componentes. Se consignó adicionalmente que la ZFP quimérica podría activar o reprimir la transcripción de ungen informador cuando su sitio diana se insertaba en un plásmido informador en proximidad a un promotor enlazadooperativamente al informador.

Beerli et al., PNAS 95: 14628-14633 (1998) comunican la construcción de una ZFP quimérica de seis dedosfusionada a un dominio represor de la transcripción KRAB, ERD, o SID, o al dominio de activación de la transcripciónVP16 o VP64. Esta ZFP quimérica se diseñó para reconocer un sitio diana de 18 pares de bases en la región 5’ notraducida del gen erbB-2 humano. Utilizando este constructo, los autores de este estudio consignan tanto la activacióncomo la represión de un constructo informador de luciferasa expresado transitoriamente, enlazado al promotor erbB-2.

Adicionalmente, se comunicó que una ZFP recombinante reprimía la expresión de un constructo plasmídico in-tegrado que codificaba un oncogén bcr-abl (Choo et al., Nature 372: 642-645 (1994) y WO 96/06166). El segmento

3

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

diana al que se unían las ZFPs era una secuencia de 9 bases GCA GAA GCC, seleccionada para superponerse a launión creada por una translocación oncogénica específica que fusionaba los genes codificantes de bcr y abl. La in-tención era que una ZFP específica para este sitio diana podría fijarse al oncogén sin fijarse a los genes componentesabl o bcr. Los autores utilizaron presentación de fago para seleccionar una ZFP variante que se fijaba a este segmentodiana. Se comunicó luego que la ZFP variante así aislada reprimía la expresión de un constructo bcr-abl transfectadode manera estable en una línea de células.

Hasta la fecha, estos métodos han estado enfocados en la regulación de genes expresados transitoriamente, o enla regulación de genes exógenos que se han integrado en el genoma. Los genes expresados transitoriamente descritospor Pomerantz et al., Liu et al., y Beerli et al. son episómicos y no se empaquetan en cromatina de la misma maneraque los genes cromosómicos. Además, incluso el gen expresado establemente descrito por Choo et al. está integradoaleatoriamente en el genoma y no se encuentra en un entorno nativo de cromatina en comparación con un gen endó-geno. En contraste, la regulación específica de un gen celular endógeno en su entorno nativo de cromatina utilizandouna ZFP no ha sido demostrada todavía en la técnica.

Sumario de la invención

La presente invención proporciona por tanto por primera vez métodos de regulación de la expresión endógena degenes celulares, en donde los genes endógenos se encuentran en su entorno nativo de cromatina, en contraste con genesque se han expresado transitoriamente en una célula, o aquéllos que se han integrado exógenamente en el genoma.Adicionalmente, la presente invención proporciona por primera vez la activación de un gen endógeno experimental-mente silencioso. Los métodos de regulación utilizan ZFPs quiméricas con un valor Kd menor que aproximadamente25 nM para activar o reprimir la transcripción génica. Las ZFPs de la invención pueden utilizarse por consiguiente parareprimir la transcripción de un gen celular endógeno en un 20% o más, y pueden utilizarse para activar la transcripciónde un gen celular endógeno en aproximadamente 1,5 veces o más.

En un aspecto, la presente invención proporciona un método de modulación de la expresión de un gen celular ensu contexto normal genómico y de cromatina en una célula aislada, comprendiendo el método el paso de:

poner en contacto la célula con:

(i) una primera proteína quimérica que comprende un primer dominio de dedos de cinc y un dominio regulador,en donde el dominio de dedos de cinc se ha transformado por ingeniería genética para reconocer un primersitio diana en el gen celular y tiene un valor Kd menor que 25 nM, o

(ii) un ácido nucleico que comprende secuencias codificantes de la primera proteína quimérica enlazada opera-tivamente a un promotor tal que la primera proteína quimérica se expresa en la célula con lo cual la primeraproteína quimérica se pone en contacto con el primer sitio diana, modulando con ello la expresión del gencelular, con la salvedad de que la célula no es una célula madre de embrión humano.

En otro aspecto, la presente invención proporciona una célula que comprende un gen celular en su contextonormal genómico y de cromatina a la cual se ha administrado (i) una primera proteína quimérica quecomprende un primer dominio de dedos de cinc y un dominio regulador, en donde el primer dominiode dedos de cinc se ha transformado por ingeniería genética para reconocer un primer sitio diana en elgen celular y tiene un valor Kd menor que 25 nM, o (ii) un ácido nucleico que comprende secuenciascodificantes de la primera proteína quimérica enlazada operativamente a un promotor tal que la primeraproteína quimérica se expresa en la célula, con la salvedad de que la célula no es una célula madre deembrión humano.

En otro aspecto, la presente invención proporciona una composición terapéutica que comprende una proteína qui-mérica, en al cual la proteína quimérica comprende un dominio de dedos de cinc y un dominio regulador, en la cual eldominio de dedos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular en sucontexto normal genómico y de cromatina y (ii) tiene un valor Kd menor que aproximadamente 25 nM.

En otro aspecto, la presente invención proporciona el uso de una proteína quimérica que comprende un dominio dededos de cinc y un dominio regulador para la fabricación de un medicamento para el tratamiento de una afección selec-cionada de enfermedad genética, cáncer, infección fúngica, de protozoo o bacteriana, isquemia, enfermedad vascular,artritis o trastornos inmunológicos, en donde el dominio de dedos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

En otro aspecto, la presente invención proporciona una composición terapéutica que comprende una moléculade ácido nucleico, en la cual la molécula de ácido nucleico comprende una secuencia codificante de una proteínaquimérica enlazada operativamente a un promotor,

4

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

en la cual la proteína quimérica comprende un dominio de dedos de cinc y un dominio regulador, en donde eldominio de dedos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular en sucontexto normal genómico y de cromatina y (ii) tiene un valor Kd menor que aproximadamente 25 nM.

En otro aspecto, la presente invención proporciona el uso de una molécula de ácido nucleico, que comprende unasecuencia codificante de una proteína quimérica enlazada operativamente a un promotor, para la fabricación de unmedicamento para el tratamiento de una afección seleccionada de enfermedad genética, cáncer, infección fúngica, deprotozoo o bacteriana, isquemia, enfermedad vascular, hepatitis o trastornos inmunológicos,

en la cual la proteína quimérica comprende un dominio de dedos de cinc y un dominio regulador,

en donde el dominio de dedos de cinc

(i) se ha transformador por ingeniería genética para reconocer un primer sitio diana en un gen celular, y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

De acuerdo con la presente invención, la expresión de un gen celular endógeno en una célula puede inhibirseponiendo en contacto un primer sitio diana en el gen celular endógeno con una primera proteína de dedos de cinc,en la cual el valor Kd de la proteína de dedos de cinc es menor que aproximadamente 25 nM, inhibiendo con ello laexpresión del gen celular endógeno en al menos aproximadamente 20%.

De acuerdo con la presente invención, la expresión de un gen celular endógeno en una célula puede inhibirseponiendo en contacto un sitio diana en el gen celular endógeno con una proteína de fusión de dedos de cinc quecomprende seis dedos y un dominio regulador, en donde el valor Kd de la proteína de dedos de cinc es menor queaproximadamente 25 nM; inhibiendo con ello la expresión del gen celular endógeno en al menos aproximadamente20%.

En una realización, la expresión del gen celular endógeno se inhibe al menos aproximadamente en 75%-100%. Enotra realización, la inhibición de la expresión impide la activación del gen.

De acuerdo con la presente invención, la expresión de un gen celular endógeno puede activarse poniendo encontacto un primer sitio diana en el gen celular endógeno con una primera proteína de dedos de cinc, en donde elvalor Kd de la proteína de dedos de cinc es menor que aproximadamente 25 nM; activando con ello la expresión delgen celular endógeno en al menos aproximadamente 150%.

De acuerdo con la presente invención, la expresión de un gen celular endógeno puede activarse poniendo encontacto un sitio diana en el gen celular endógeno con una proteína de fusión de dedos de cinc que comprende seisdedos y un dominio regulador, en donde el valor Kd de la proteína de dedos de cinc es menor que aproximadamente25 nM; activando con ello la expresión del gen celular endógeno en al menos aproximadamente 150%.

En una realización, la expresión del gen celular endógeno se activa hasta al menos aproximadamente 200-500%.En otra realización, la activación de la expresión génica impide la represión de la expresión del gen.

De acuerdo con la presente invención, la expresión de un gen celular endógeno en una célula puede modularseponiendo en contacto un primer sitio diana en el gen celular endógeno con una primera proteína de dedos de cinc;modulando con ello la expresión del gen celular endógeno.

En una realización, la proteína de dedos de cinc tiene dos, tres, cuatro, cinco o seis dedos.

De acuerdo con la presente invención, la expresión de un gen celular endógeno en una célula puede modularseponiendo en contacto un sitio diana en el gen celular endógeno con una proteína de fusión de dedos de cinc quecomprende seis dedos y un dominio regulador; modulando con ello la expresión del gen celular endógeno.

En una realización, el paso de puesta en contacto comprende adicionalmente poner en contacto un segundo sitiodiana en el gen celular endógeno con una segunda proteína de dedos de cinc. En otra realización, los sitios diana pri-mero y segundo son adyacentes. En otra realización, las proteínas de dedos de cinc primera y segunda están enlazadascovalentemente. En otra realización, la primera proteína de dedos de cinc es una proteína de fusión que comprendeun dominio regulador. En otra realización, la primera proteína de dedos de cinc es una proteína de fusión que com-prende al menos dos dominios reguladores. En otra realización, las proteínas de dedos de cinc primera y segunda sonproteínas de fusión, cada una de las cuales comprende un dominio regulador. En otra realización, las proteínas dededos de cinc primera y segunda son proteínas de fusión, cada una de las cuales comprende al menos dos dominiosreguladores.

En una realización, el gen celular endógeno se selecciona del grupo constituido por VEGF, ERα, IGF-I, c-myc, c-myb, ICAM, Her2/Neu, FAD2-1, EPO, GM-CSF, GDNF, y LDL-R. En otra realización, el gen celular endógeno es un

5

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

gen experimentalmente silencioso o inactivo por cualquier otra razón, v.g., EPO, GATA, proteínas de la familia de lasinterleuquinas, GM-CSF, MyoD, eutrofina, y las hemoglobinas fetales gamma y delta. En otra realización, el dominioregulador se selecciona del grupo constituido por un represor de la transcripción, un activador de la transcripción, unaendonucleasa, una metil-transferasa, una histona-acetiltransferasa, y una histona-desacetilasa.

En una realización, la célula se selecciona del grupo constituido por una célula animal, una célula vegetal, unacélula bacteriana, una célula de protozoo, o una célula fúngica. En otra realización, la célula es una célula de mamífero.En otra realización, la célula es una célula humana.

En una realización, el método comprende adicionalmente el paso de administrar en primer lugar a la célula unvehículo de suministro que comprende la proteína de dedos de cinc, en la cual el vehículo de suministro comprendeun liposoma o un polipéptido de translocación de membrana.

En una realización, la proteína de dedos de cinc está codificada por un ácido nucleico de proteína de dedos de cincenlazado operativamente a un promotor, y el método comprende adicionalmente el paso de administrar primeramenteel ácido nucleico a la célula en un complejo lípido:ácido nucleico o como ácido nucleico desnudo. En otra realización,la proteína de dedos de cinc está codificada por un vector de expresión que comprende un ácido nucleico de proteína dededos de cinc enlazado operativamente a un promotor, y el método comprende adicionalmente el paso de administraren primer lugar el vector de expresión a la célula. En otra realización, el vector de expresión es un vector de expresiónvírico. En otra realización, el vector de expresión es un vector de expresión de retrovirus, un vector de expresión deadenovirus, un vector de expresión plasmídico de DNA, o un vector de expresión de AAV.

En una, la proteína de dedos de cinc es codificada por un ácido nucleico enlazado operativamente a un promotorinducible. En otra realización, la proteína de dedos de cinc es codificada por un ácido nucleico enlazado operativamentea un promotor débil.

En una realización, la célula comprende menos de aproximadamente 1,5 x 106 copias de la proteína de dedos decinc.

En una realización, el sitio diana está situado aguas arriba de un sitio de iniciación de la transcripción del gencelular endógeno. En otra realización, el sitio diana es adyacente a un sitio de iniciación de la transcripción del gencelular endógeno. En otra realización, el sitio diana es adyacente a un sitio de pausa de RNA-polimerasa situado aguasabajo de un sitio de iniciación de la transcripción del gen celular endógeno.

En otra realización, la proteína de dedos de cinc comprende una cadena principal de SP-1. En una realización, laproteína de dedos de cinc comprende el dominio regulador y está humanizada.

Breve descripción de los dibujos

Figura 1: Esquema de amplificación por PCR para la producción de genes sintéticos codificantes de ZFP.

Figura 2. Expresión y purificación de ZFPs típicas. Fig. 2A: ZFP sin fusionar antes de la inducción (pista 1),después de la inducción (pista 2), y después de la purificación (pista 3). Fig. 2B: Expresión de MBP-VEGF antesde la inducción (pista 1), después de la inducción (pista 2), y después de lisis en Prensa Francesa (pista 3). Fig. 2C:Purificación de MBP-VEGF en una columna de afinidad de amilosa que muestra el flujo directo (FT), y las fraccionesiniciales (1-4). La fracción 2 se utilizó para ensayos de desplazamiento de movilidad electroforética (“EMSA”). M,marcadores de peso molecular.

Figura 3. Experimento EMSA típico con ZFP fusionada a MBP. La proteína MBP-VEGF1 se unía a DNA dúplexmarcado como se describe en el texto. Se realizó una serie de diluciones triples de proteína; cada punto representa elporcentaje desplazado para dicha concentración particular de proteína representado en un gráfico semi-logarítmico.La cuantificación se realizó por producción de imágenes de luminiscencia. En este caso, la concentración de proteínaque producía el 50% del desplazamiento máximo (el valor Kd aparente) era 2 nM.

Figura 4. Experimento de tasa de expulsión para comparación de VEGF1 con VEGF3a/1. Se pre-formaron com-plejos proteína-DNA y se incubaron con un exceso de 1000 veces de oligonucleótidos sin marcar. Las muestras sesometieron a electroforesis en diversos momentos y se midió la cantidad de producto desplazado por producción deimágenes de luminiscencia. Se utilizó ajuste de curvas para calcular las semi-vidas del complejo indicado.

Figura 5. Vector de expresión típico utilizado para la expresión transitoria de ZFP en células de mamífero.

Figura 6. Datos de co-transfección que muestran la represión de la actividad del informador luciferasa por laexpresión de la proteína VEGF-KRAB. Las barras de error muestran la desviación estándar de transfecciones tripli-cadas. pGL3-C (control de vector informador); pVFR1-4x (plásmido informador VEGF); VEGF1 (VEGF1-KRAB);VEGF3a (VEGF3a-KRAB); VEGF3a/1 (VEGF3a/1-KRAB).

Figura 7. Datos de co-transfección que muestran la activación de la actividad del informador luciferasa por laexpresión de la proteína VEGF-VP16. Las barras de error muestran la desviación estándar de transfecciones tripli-

6

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

cadas. pGL3-P (informador sin diana VEGF alguna); pcDNA (control de vector efector vacío); pVFR3-4x (plásmidoinformador de VEGF); VEGF1 (VEGF1-VP16); VEGF3a (VEGF3a-VP16); VEGF3a/1 (VEGF3a/1-VP16).

Figura 8. Datos ELISA de VEGF que muestran la represión de la expresión del gen endógeno VEGF debida atransfección de un plásmido efector VEGF ZFP-KRAB. Tratado con DFX (células de control tratadas con Dfx y notransfectadas; sin ZFP (control de pcDNA); VEGF1 (VEGF1-KRAB), VEGF3a/1 (VEGF3a/1-KRAB), CCR5 (CCR5-KRAB); no inducidas falsamente (células transfectadas falsamente, sin tratar con DFX). Las barras de error muestranla desviación estándar de transfecciones duplicadas.

Figura 9. Datos ELISA de VEGF que muestran la activación de la expresión del gen endógeno de VEGF debida atransfección de un plásmido efector VEGF ZFP-VP16. Falso (células transfectadas falsamente); sin ZFP (control deNVF), VEGF1 (VEGF1-VP16), VEGF3a/1 (VEGF3a/1-VP16). Las barras de error muestran la desviación estándarde transfecciones duplicadas.

Figura 10. Ensayo de protección contra RNasa que muestra los cambios en mRNA específico de VEGF por ZFPsespecíficas de VEGF. Panel A: Activación de mRNA de VEGF, control de NVF (sin ZFP), VEGF1-NVF (VEGF1-VP16), CCR5-5-NVF (CCD5-VP16), CCR5-3-NVF (CCR5-VP16). Panel B: Represión de mRNA de VEGF. Con-trol de NKF (sin ZFP), VEGF1-NKF (VEGF1-KRAB), VEGF3a/1-NKF (VEGF3a/1-KRAB), CCR5-3-NKF (CCR5-KRAB). El tamaño de la banda específica de VEGF de 148 nucleótidos se indica por una flecha. La sonda específicade VEGF se sintetizó a partir de un conjunto de moldes multi-sonda de angiogénesis humano (Pharmingen). Comocontrol, se muestran señales de los genes propios L32 y GAPDH (flechas).

Figura 11a-b: La Figura 11a muestra la activación de la expresión del gen endógeno EPO por medida de la pro-ducción de EPO en células Hep3B y 293, tal como se mide utilizando ELISA. La Figura 11b muestra la activación dela expresión del gen endógeno EPO en células Hep3B y células 293 por medida de la expresión de mRNA.

Descripción detallada de la invención

Introducción

La presente solicitud demuestra por primera vez que pueden utilizarse ZFPs para regular la expresión de un gencelular endógeno que está presente en su entorno nativo de cromatina. La presente invención proporciona por tantoproteínas de fijación de DNA de dedos de cinc que se han transformado por ingeniería genética para reconocer es-pecíficamente, con alta eficacia, genes celulares endógenos. Los experimentos descritos en esta memoria demuestranque una ZFP de tres dedos con una afinidad para el sitio diana menor que aproximadamente 10 nM (VEGF1) puedeutilizarse para activar o reprimir eficazmente la actividad de un gen endógeno. Adicionalmente, se demostró tambiénque una ZFP de seis dedos (VEGF3a/1) reprime eficazmente la actividad de un gen endógeno. Finalmente, puede utili-zarse una ZFP de tres dedos para activar EPO endógeno, un gen experimentalmente inactivo. Las ZFPs de la invenciónexhiben afinidad alta para sus sitios diana, con valores Kds menores que aproximadamente 25 nM o más bajos.

Como resultado, las ZFPs de la invención pueden utilizarse para regular la expresión de genes endógenos, tantopor activación como por represión de la transcripción de genes endógenos. Las ZFPs están unidas a dominios regula-dores, creando factores de transcripción quiméricos para activar o reprimir la transcripción. Los métodos de regulaciónutilizan ZFPs con un valor Kd menor que aproximadamente 25 nM para activar o reprimir la transcripción génica. LasZFPs de la invención pueden utilizarse por tanto para reprimir la transcripción de un celular endógeno en 20% o más,y pueden utilizarse para activar la transcripción de un gen celular endógeno en aproximadamente 1,5 veces o más.

Tales métodos de regulación de la expresión génica permiten nuevas aplicaciones terapéuticas humanas y en mamí-feros, v.g., el tratamiento de enfermedades genéticas, cáncer, infecciones fúngicas, de protozoos, bacterianas y víricas,isquemia, enfermedad vascular, artritis, trastornos inmunológicos, etc., proporcionando además medios para ensayosfuncionales de genómica, y medios para desarrollar plantas con fenotipos alterados, con inclusión de resistencia aenfermedades, maduración de los frutos, composición de azúcares y aceites, rendimiento, y color.

Como se describe en esta memoria, las ZFPs pueden diseñarse para reconocer cualquier sitio diana adecuado, pa-ra regulación de la expresión de cualquier gen endógeno de elección. Ejemplos de genes endógenos adecuados pararegulación incluyen VEGF, CCR5, ERα, Her2/Neu, Tat, Rev, HBV c, S, X, y P, LDL-R, PEPCK, CYP7, fibrinógeno,ApoB, ApoE, Apo(a), renina, NF-κB, I-κB, TNF-α, ligando FAS, proteína precursora de amiloides, factor natriuré-tico atrial, leptina ob, ucp-1, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6. IL-12, G-CSF, GM-CSF, Epo, PDGF, PAF p53, Rb,hemoglobina fetal, distrofina, eutrofina, GDNF, NGF, IGF-1, receptores flt y flk de VEGF, topoisomerasa, telomera-sa, bcl-2, ciclinas, angiostatina, IGF, ICAM-1, STATS, c-myc, c-myb, TH, PTI-1, poligalacturonasa, EPSP-sintasa,FAD2-1, delta-12-desaturasa, delta-9-desaturasa, delta-15-desaturasa, acetil-CoA carboxilasa, acil-ACP-tioesterasa,ADP-glucosa-pirofosforilasa, almidón-sintasa, celulosa-sintasa, sacarosa-sintasa, genes asociados con la senescencia,formadores de quelatos con metales pesados, hidroperóxido-liasa de ácidos grasos, genes víricos, genes de protozoos,genes fúngicos, y genes bacterianos.

En general, genes adecuados para ser regulados incluyen citoquinas, linfoquinas, factores de crecimiento, factoresmitógenos, factores quimiotácticos, factores onco-activos, receptores, canales de potasio, proteínas G, moléculas detransducción de señales, y otros genes relacionados con enfermedades. Genes experimentalmente inactivos preferidos

7

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

incluyen EPO, GATA, proteínas de la familia de las interleuquinas, GM-CSF, MyoD, eutrofina, y las hemoglobinasfetales gamma y delta.

Un tema general en la función de los factores de transcripción es que todo lo que se necesita en general es fi-jación simple y proximidad suficiente al promotor. El posicionamiento exacto con relación al promotor, la orienta-ción, y dentro de ciertos límites, la distancia, no son muy importantes para la modulación de la expresión por unaZFP. Esta característica permite una flexibilidad considerable en la elección de sitios para construir factores de trans-cripción artificiales. El sitio diana reconocido por la ZFP puede ser por consiguiente cualquier sitio adecuado en elgen diana que permita la activación o represión de la expresión génica por una ZFP enlazada a un dominio regu-lador. Sitios diana preferidos incluyen regiones adyacentes a, aguas abajo, o aguas arriba del sitio de comienzo dela transcripción. Adicionalmente, los sitios diana pueden estar localizados también en regiones intensificadoras, si-tios represores, sitios de pausa de RNA-polimerasas, y sitios reguladores específicos (v.g., sitios SP-1, elementos derespuesta a la hipoxia, elementos de reconocimiento de receptores nucleares, sitios de fijación de p53), sitios en laregión codificante de cDNA o en una región codificante de marcador de secuencia expresada (EST). Como se des-cribe más adelante, típicamente cada dedo reconoce 2-4 pares de bases, fijándose una ZFP de dos dedos a un sitiodiana de cuatro a siete pares de bases, fijándose una ZFP de tres dedos a un sitio de seis a diez pares de bases,y fijándose una ZFP de seis dedos a dos sitios diana adyacentes, teniendo cada sitio diana de seis a diez pares debases.

Como se describe en esta memoria, pueden administrarse dos ZFPs a una célula, reconociendo o bien el mismo gencelular endógeno diana, o genes celulares endógenos diana diferentes. La primera ZFP está asociada opcionalmentecon la segunda ZFP, sea covalentemente o no covalentemente. El reconocimiento de sitios diana adyacentes por ZFPsasociadas o individuales puede utilizarse para producir fijación cooperativa de las ZFPs, dando como resultado unaafinidad que es mayor que la afinidad de las ZFPs cuando están fijadas individualmente a su sitio diana.

En una realización, se producen dos ZFPs como una proteína de fusión enlazada por un enlazador de aminoácidos,y la ZFP de seis dedos resultante reconoce un sitio diana de aproximadamente 18 pares de bases (véase, v.g., Liu etal., PNAS 94: 5525-5530 (1997)). Se espera que un sitio diana de 18 pares de bases proporcione especificidad en elgenoma humano, dado que un sitio diana de dicho tamaño debería producirse solamente una vez en cada 3 x 1010 paresde bases, y el tamaño del genoma humano es 3,5 x 109 pares de bases (véase, v.g. Liu et al., PNAS 94: 5525-5530(1997)). En otra realización, las ZFPs están asociadas de modo no covalente, a través de una cremallera de leucina, undominio N-terminal de proteína STAT, o la proteína de fijación FK506 (véase, v.g., O’Shea, Science 254: 539 (1991),Barahmand-Pour et al., Curr. Top. Microbiol. Immunol. 211: 121-128 (1996); Klemm et al., Annu. Rev. Immunol. 16:561-592 (1998); Ho et al., Nature 382: 822-826 (1996)).

La ZFP está enlazada a al menos uno o más dominios reguladores, descritos más adelante. Dominios reguladorespreferidos incluyen dominios represores o activadores de factores de transcripción tales como KRAB y VP16, do-minios co-represores y co-activadores, metil-transferasas de DNA, histona-acetiltransferasas, histona-desacetilasas, yendonucleasas tales como Fok1. Para represión de la expresión génica, típicamente la expresión del gen se reduce enaproximadamente 20% (es decir, 80% de expresión no modulada por ZFP), de modo más preferible en aproximada-mente 50% (es decir, 50% de expresión no modulada por ZFP), y de modo más preferible en aproximadamente 75-100% (es decir, de 25% a 0% de expresión no modulada por ZFP). Para activación de la expresión génica, típicamentela expresión se activa en aproximadamente 1,5 veces (es decir, 150% de expresión no modulada por ZFP), preferible-mente dos veces (es decir, 200% de expresión no modulada por ZFP), más preferiblemente 5-10 veces (es decir, 500-1000% de expresión no modulada por ZFP), hasta al menos 100 veces o más.

La expresión de los activadores y represores de ZFP transformados por ingeniería genética puede estar controladatambién por sistemas tipificados por los sistemas regulados por tet y el sistema RU-486 (véase, v.g., Gossen y Bujard,PNAS 89: 5547 (1992); Oligino et al., Gene Ther. 5: 491-496 (1998); Wang et al., Gene Ther. 4: 432-441 (1997);Neering et al., Blood 88: 1147-1155 (1996); y Rendahl et al., Nat. Biotechnol. 16: 757-761 (1998)). Éstos impartenun control de moléculas pequeñas sobre la expresión de los activadores y represores de ZFP e imparten así control demoléculas pequeñas en el o los genes diana de interés. Esta característica ventajosa podría utilizarse en modelos decultivo celulares, en terapia génica, y en animales y plantas transgénicos.

Definiciones

Tal como se utilizan en esta memoria, los términos siguientes tienen los significados adscritos a los mismos a noser que se especifique otra cosa.

La expresión “proteína de dedos de cinc” o “ZFP” hace referencia a una proteína que tiene dominios de fijación deDNA que están estabilizados por cinc. Se hace referencia típicamente a los dominios de fijación de DNA individualescomo “dedos”. Una proteína de dedos de cinc tiene al menos un dedo, típicamente dos dedos, tres dedos, cuatro dedos,cinco dedos, o seis dedos o más. Cada dedo fija de 2 a 4 pares de bases de DNA, típicamente 3 ó 4 pares de bases deDNA. Una proteína de dedos de cinc se fija a una secuencia de ácido nucleico denominada un sitio diana o segmentodiana. Cada dedo comprende típicamente un subdominio de fijación de DNA coordinador de cinc de aproximadamente30 aminoácidos. Un motivo ilustrativo que caracteriza una clase de estas proteínas (la clase Cys2His2) es -Cys-(X)2−4-Cys-(X)12-His-(X)3−5-His (donde X es cualquier aminoácido). Estudios realizados han demostrado que un solo dedode cinc de esta clase está constituido por una hélice alfa que contiene los dos residuos invariantes histidina coordinados

8

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

con cinc a lo largo de los dos residuos cisteína de una vuelta beta simple (véase, v.g., Berg y Shi, Science 271: 1081-1085 (1996).

Un “sitio diana” es la secuencia de ácido nucleico reconocida con una proteína de dedos de cinc. Un sitio dianasimple tiene por lo general aproximadamente cuatro a aproximadamente diez pares de bases o más. Típicamente, unaproteína de dedos de cinc con dos dedos reconoce un sitio diana de cuatro a siete pares de bases, una proteína de dedosde cinc con tres dedos reconoce un sitio diana de seis a diez pares de bases, una proteína de dedos de cinc con seisdedos reconoce dos sitios diana adyacentes de nueve a diez pares de bases, y así sucesivamente para proteínas conmás de seis dedos. El sitio diana se encuentra en cualquier posición que permita la regulación de la expresión génica,v.g., adyacente a, aguas arriba o aguas abajo del sitio de iniciación de la transcripción; próximo a un intensificadoru otro elemento de regulación de la transcripción tal como un represor (v.g., sitios de fijación de SP-1, elementos derespuesta a la hipoxia, elementos de reconocimiento de receptores nucleares, sitios de fijación de p53, etc.), sitios depausa de RNA-polimerasas; y límites intrón/exón. La expresión “sitios diana adyacentes” hace referencia a sitios dianano solapantes que están separados por cero hasta aproximadamente 5 pares de bases.

“Kd” hace referencia a la constante de disociación para el compuesto, es decir, la concentración de un compuesto(v.g., una proteína de dedos de cinc) que da una fijación semi-máxima del compuesto a su diana. Es decir, que la mitadde las moléculas del compuesto están fijadas a la diana) en condiciones dadas (es decir, cuando [diana] <<Kd), talcomo se mide utilizando un sistema de ensayo dado (véase, v.g., la Patente U.S. No. 5.789.538). El sistema de ensayoutilizado para medir Kd debe seleccionarse de modo que proporcione la medida más exacta del valor Kd real de laZFP. Puede utilizarse cualquier sistema de ensayo, con tal que el mismo dé una medida exacta del valor Kd real de laZFP. En una realización, el valor Kd para las ZFPs de la invención se mide utilizando un ensayo de desplazamientode movilidad electroforética (“EMSA”), como se describe en el Ejemplo I y en la página 14 de la presente memoriadescriptiva. A no ser que se haga un ajuste en lo que respecta a la pureza o actividad de la ZFP, los cálculos de Kdrealizados utilizando el método del Ejemplo I pueden dar como resultado una infraestimación del valor Kd verdaderode una ZFP dada. El valor Kd de una ZFP utilizada para modular la transcripción de un gen celular endógeno es menorque aproximadamente 25 nM.

Un “gen celular endógeno” se refiere a un gen que es nativo para una célula, que se encuentra en su contextonormal genómico y de cromatina, y que no es heterólogo para la célula. Genes celulares de este tipo incluyen, v.g.,genes animales, genes vegetales, genes bacterianos, genes de protozoos, genes fúngicos, genes mitocondriales, y genesde cloroplastos.

Un “entorno nativo de cromatina” hace referencia a la relación estructural existente naturalmente de DNA genó-mico (v.g., bacteriano, animal, fúngico, vegetal, de protozoo, mitocondrial, y de cloroplastos) y proteínas de fijaciónde DNA (v.g., histonas, y la proteína II bacteriana de fijación de DNA), que forman juntos cromosomas. El gen celularendógeno puede encontrarse en un estado transcripcionalmente activo o inactivo en el entorno nativo de cromatina.

Un “gen experimentalmente silencioso” o un “gen inactivo” hace referencia a un gen cuya expresión está reprimidao desactivada, v.g., apagada, en ciertos tipos de células, durante ciertas etapas del desarrollo de un tipo de célula, odurante ciertos periodos de tiempo en un tipo de célula. Ejemplos de genes experimentalmente inactivos incluyen EPO,GATA, proteínas de la familia de las interleuquinas, GM-CSF, MyoD, eutrofina, y las hemoglobinas fetales gamma ydelta.

La expresión “adyacente a un sitio de iniciación de la transcripción” hace referencia a un sitio diana que está dentrode aproximadamente 50 bases aguas arriba o aguas abajo de un sitio de iniciación de la transcripción. “Aguas arriba”de un sitio de iniciación de la transcripción hace referencia a un sitio diana que está más de aproximadamente 50 basesen dirección 5’ del sitio de iniciación de la transcripción (es decir, en la región no transcrita del gen).

La expresión “sitio de pausa de RNA-polimerasas” se describe en Uptain et al., Annu. Rev. Biochem. 66: 117-172(1997).

“Humanizada” se refiere a una secuencia polipeptídica no humana que se ha modificado para minimizar la inmu-norreactividad en humanos, típicamente por alteración de la secuencia de aminoácidos a fin de mimetizar secuenciashumanas existentes, sin alterar sustancialmente la función de la secuencia polipeptídica (véase, v.g., Jones et al., Na-ture 321: 522-525 (1986), y la Solicitud de Patente del Reino Unido publicada No. 8707252). Las secuencias de lacadena principal para las deben seleccionarse preferiblemente de ZFPs C2H2 humanas existentes (v.g., SP-1). Losdominios funcionales se seleccionan preferiblemente de genes humanos existentes, (v.g., el dominio de activación dela subunidad p65 de NF-κB). En caso de ser posible, las secuencias de la hélice de reconocimiento se seleccionarána partir de los millares de dominios de reconocimiento de DNA de ZFP existentes proporcionados por la secuencia-ción del genoma humano. En la medida que sea posible, los dominios se combinarán como unidades a partir de lasmismas proteínas existentes. Todos estos pasos minimizarán la introducción de nuevos epítopes de unión en las ZFPsquiméricas y harán las ZFPs transformadas por ingeniería genética menos inmunógenas.

La “administración” de un vector de expresión, ácido nucleico, ZFP, o un vehículo de suministro a una célulacomprende transducción, transfección, electroporación, translocación, fusión, fagocitación, métodos de disparo o ba-lísticos, etc., es decir, cualquier medio por el cual una proteína o un ácido nucleico pueda ser transportado a través deuna membrana celular y preferiblemente al interior del núcleo de una célula.

9

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Un “vehículo de suministro” hace referencia a un compuesto, v.g., un liposoma, una toxina, o un polipéptido detranslocación de membrana, que se utiliza para administrar una ZFP. Los vehículos de suministro pueden utilizarsetambién para administrar ácidos nucleicos codificantes de ZFPs, v.g., un complejo lípido:ácido nucleico, un vector deexpresión, un virus, etcétera.

Los términos “modulación de la expresión”, “inhibición de la expresión” y “activación de la expresión” de un genhacen referencia a la capacidad de una ZFP para activar o inhibir la transcripción de un gen. La activación incluyeprevención de la inhibición de la transcripción (es decir, prevención o represión de la expresión génica) e inhibiciónincluye la prevención de la activación de la transcripción (es decir, prevención de la activación génica).

La frase “activación de la expresión génica que previene la represión de la expresión génica” hace referencia a lacapacidad de una proteína de dedos de cinc para bloquear o prevenir la fijación de una molécula represora.

La frase “inhibición de la expresión génica que previene la activación génica” hace referencia a la capacidad deuna proteína de dedos de cinc para bloquear o prevenir la fijación de una molécula activadora.

La modulación puede ensayarse por determinación de cualquier parámetro que se vea afectado directa o indi-rectamente por la expresión del gen diana. Parámetros de este tipo incluyen, v.g., cambios en los niveles de RNA oproteínas, cambios en la actividad de proteínas, cambios en los niveles de productos, cambios en la expresión génicaaguas abajo, cambios en la transcripción de geles informadores (luciferasa, CAT, β-galactosidasa, β-glucuronidasa,GFP (véase, v.g., Mistili y Spector, Nature Biotechnology 15:961-964 (1997)); cambios en la transducción de señales,fosforilación y desfosforilación, interacciones receptor-ligando, concentraciones de segundos mensajeros (v.g., cGMP,cAMP, IP3, y Ca2+), crecimiento celular, y neovascularización. Estos ensayos pueden realizarse in vitro, in vivo y exvivo. Dichos efectos funcionales pueden medirse por cualquier medio conocido por los expertos en la técnica, v.g.,medida de los niveles de RNA o proteínas, medida de la estabilidad del RNA, identificación de la expresión de genesaguas abajo o genes informadores, v.g., por quimioluminiscencia, fluorescencia, reacciones colorimétricas, fijación deanticuerpos, marcadores inducibles, ensayos de fijación de ligandos; cambios en segundos mensajeros intracelularestales como cGMP e inositol-trifosfato (IP3); cambios en los niveles intracelulares de calcio; liberación de citoquinas,etcétera.

Para determinar el nivel de la mutación de la expresión génica por una ZFP, las células puestas en contacto conZFPs se comparan con células de control, v.g., sin la proteína de dedos de cinc o con una ZFP inespecífica, paraexaminar la extensión de la inhibición o activación. Se asigna a las muestras de control un valor de actividad relativade la expresión génica de 100%. La modulación/inhibición de la expresión génica se consigue cuando el valor deactividad de la expresión génica con relación al control es aproximadamente 80%, preferiblemente 50% (es decir, 0,5x la actividad del control), más preferiblemente 25%, y más preferiblemente 5-0%. La modulación/activación de laexpresión génica se consigue cuando el valor de actividad de la expresión génica con relación al control es 110%, máspreferiblemente 150% (es decir, 1,5 x la actividad del control), más preferiblemente 200-500%, y más preferiblemente1000-2000% o más.

Un “activador de la transcripción” y un “represor de la transcripción” hacen referencia a proteínas o dominiosefectores de proteínas que tienen la capacidad de modular la transcripción, como se ha descrito arriba. Dichas proteínasincluyen, v.g., factores y co-factores de transcripción, v.g., KRAB, MAD, ERD, SID, la subunidad p65 del factornuclear kappa B, el factor 1 de respuesta del crecimiento precoz, y los receptores nucleares hormonales, VP16, VP64),endonucleasas, integrasas, recombinasas, metiltransferasas, histona-acetiltransferasas, histona-desacetilasas, etc. Losactivadores y represores incluyen co-activadores y co-represores (véase, v.g., Utley et al., Nature 394: 498-502 (1998)).

Un “dominio regulador” hace referencia a una proteína o un dominio proteínico que tiene actividad moduladorade la transcripción cuando está ligado a un dominio de fijación de DNA, v.g., una ZFP. Típicamente, un dominioregulador está enlazado covalente o no covalentemente a una ZFP para efectuar la modulación de la transcripción. Al-ternativamente, una ZFP puede actuar sola, sin un dominio regulador, para efectuar la modulación de la transcripción.

El término “heterólogo” es un término relativo, que cuando se utiliza con referencia a porciones de un ácidonucleico indica que el ácido nucleico comprende dos o más subsecuencias que no se encuentran en la misma relaciónuna con respecto a otra en la naturaleza. Por ejemplo, un ácido nucleico que se produce recombinantemente tiene porlo general dos o más secuencias de genes no relacionados dispuestas sintéticamente para producir un ácido nucleicofuncional nuevo, v.g., un promotor de una fuente y una región codificante de otra fuente. Los dos ácidos nucleicos sonpor tanto heterólogos uno con respecto al otro en este contexto. Cuando se añaden a una célula, los ácidos nucleicosrecombinantes serian también heterólogos respecto a los genes endógenos de la célula. Así, en un cromosoma, un ácidonucleico heterólogo podría incluir un ácido nucleico no nativo (no existente naturalmente) que se ha integrado en elcromosoma, o un ácido nucleico extracromosómico no nativo (no existente naturalmente). En contraste, un fragmentode cromosoma translocado naturalmente no se consideraría heterólogo en el contexto de esta solicitud de patente, dadoque el mismo comprende una secuencia de ácido nucleico endógeno que es nativa para la célula mutada.

Análogamente, una proteína heteróloga indica que la proteína comprende dos o más subsecuencias que no seencuentran en la misma relación una con respecto a otra en la naturaleza (v.g., una “proteína de fusión”, en la cual lasdos subsecuencias están codificadas por una sola secuencia de ácido nucleico). Véase, v.g., Ausubel, supra, para unaintroducción a las técnicas recombinantes.

10

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

El término “recombinante”, cuando se utiliza con referencia, v.g., a una célula, o ácido nucleico, proteína, o vector,indica que la célula, el ácido nucleico, la proteína o el vector ha sido modificado por la introducción de un ácidonucleico o proteína heterólogo o la alteración de un ácido nucleico o proteína nativo, o que la célula se deriva de unacélula modificada de este modo. Así, por ejemplo, las células recombinantes expresan genes que no se encuentran enla forma nativa (existente naturalmente) de la célula o expresan una segunda copia de un gen nativo que por lo demásse expresa normal o anormalmente, se infra-expresa o no se expresa en absoluto.

Un “promotor” se define como un sistema de secuencias de control de ácido nucleico que dirigen la transcrip-ción. Tal como se utiliza en esta memoria, un promotor incluye típicamente secuencias necesarias de ácido nucleicopróximas al sitio de comienzo de la transcripción, tales como, en el caso de ciertos promotores del tipo de la RNA-polimerasa II, un elemento TATA, intensificador, secuencia CCAAT, sitio SP1, etc. Tal como se utiliza en esta me-moria, un promotor incluye también opcionalmente elementos intensificadores o represores distales, que pueden estarlocalizados a una distancia tan grande como varios miles de pares de bases del sitio de comienzo de la transcripción.Los promotores tienen a menudo un elemento que es sensible a la transactivación por un resto de fijación de DNA talcomo un polipéptido, v.g., un receptor nuclear, Gal4, el represor lac y análogos.

Un promotor “constitutivo” es un promotor que es activo en la mayoría de las condiciones ambientales y dedesarrollo. Un promotor “inducible” es un promotor que es activo en ciertas condiciones ambientales o de desarrollo.

Un “promotor débil” hace referencia a un promotor que tiene aproximadamente la misma actividad que un promo-tor de timidina-quinasa (“tk”) del virus del herpes símplex (“HSV”) de tipo salvaje, o un promotor tk de HSV mutado,como se describe en Eisenberg y McKnight, Mol. Cell. Biol. 5: 1940-1947 (1985).

La expresión “enlazado operativamente” hace referencia a un enlace funcional entre una secuencia de control dela expresión de ácido nucleico (tal como un promotor, o conjunto de sitios de fijación de factores de transcripción) yuna segunda secuencia de ácido nucleico, en el cual la secuencia de control de la expresión dirige la transcripción delácido nucleico correspondiente a la segunda secuencia.

Un “vector de expresión” es un constructo de ácido nucleico, generado por recombinación o por síntesis, con unaserie de elementos especificados de ácido nucleico que permiten la transcripción de un ácido nucleico particular enuna célula hospedadora, y opcionalmente integración o replicación del vector de expresión en una célula hospedadora.El vector de expresión puede formar parte de un plásmido, virus, o fragmento de ácido nucleico, de origen vírico ono vírico. Típicamente, el vector de expresión incluye una “casete de expresión”, que comprende un ácido nucleicoa transcribir enlazado operativamente a un promotor. El término “vector de expresión” abarca también DNA desnudoenlazado operativamente a un promotor.

Por “célula hospedadora” se entiende una célula que contiene una ZFP o un vector de expresión o ácido nucleicoque codifica una ZFP. La célula hospedadora soporta típicamente la replicación o expresión del vector de expresión.Las células hospedadoras pueden ser células procariotas tales como E. coli, o células eucariotas tales como célulasde levadura, fúngicas, de protozoo, de plantas superiores, de insecto, o de anfibios, o células de mamífero tales comoCHO, HeLa, 293, COS-1, y análogas, v.g., células cultivadas (in vitro), explantes y cultivos primarios (in vitro y exvivo) y células in vivo.

“Ácido nucleico” hace referencia a desoxirribonucleótidos o ribonucleótidos y polímeros de los mismos en formamono- o bi-catenaria. El término abarca ácidos nucleicos que contienen análogos de nucleótidos conocidos o residuos oeslabones de cadena principal modificados, que son sintéticos, existentes naturalmente, y no existentes naturalmente,que tienen propiedades de fijación similares al ácido nucleico de referencia, y que se metabolizan de una manerasimilar a los nucleótidos de referencia. Ejemplos de tales análogos incluyen, sin carácter limitante, fosforotioatos,fosforamidatos, metil-fosfonatos, metil-fosfonatos quirales, 2-O-metil-ribonucleótidos, y ácidos nucleicos peptídicos(PNAs).

A no ser que se indique otra cosa, una secuencia de ácido nucleico particular abarca también implícitamentevariantes modificadas conservadoramente de la misma (v.g., sustituciones de codones degenerados) y secuencias com-plementarias, además de la secuencia indicada explícitamente. Específicamente, pueden obtenerse sustituciones decodones degenerados por generación de secuencias en las cuales la tercera posición de uno o más codones (o de latotalidad) está sustituida con residuos de bases mixtas y/o de desoxiinosina (Batzer et al., Nucleic Acid Res. 19: 5081(1991); Ohtsuka et al., J. Biol. Chem. 260: 2605-2608 (1985); Rossolini et al., Mol. Cell. Probes 8: 91-98 (1994)). Eltérmino ácido nucleico se utiliza intercambiablemente con gen, cDNA, mRNA, oligonucleótido, y polinucleótido.

Los términos “polipéptido”, “péptido” y “proteína” se utilizan intercambiablemente en esta memoria para hacerreferencia a un polímero de residuos de aminoácidos. Los términos se aplican también a polímeros de aminoácidosen los cuales uno o más residuos de aminoácidos es un mimético químico artificial de un aminoácido correspondienteexistente naturalmente, así como a polímeros de aminoácidos existentes naturalmente y polímeros de aminoácidos noexistentes naturalmente.

El término “aminoácido” hace referencia a aminoácidos existentes naturalmente y sintéticos, así como análogosde aminoácidos y aminoácidos miméticos que funcionan de una manera similar a los aminoácidos existentes natu-

11

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

ralmente. Los aminoácidos existentes naturalmente son los codificados por el código genético, así como aquellosaminoácidos que están modificados ulteriormente, v.g. hidroxiprolina, γ-carboxiglutamato, y O-fosfoserina. Los aná-logos de aminoácidos se refieren a compuestos que tienen la misma estructura química básica que un aminoácidoexistente naturalmente, es decir, un carbono á que está unido a un hidrógeno, un grupo carboxilo, un grupo amino, yun grupo R, v.g., homoserina, norleucina, metionina-sulfóxido, metionina-metil-sulfonio. Tales análogos tienen gruposR modificados (v.g., norleucina) o cadenas principales peptídicas modificadas, pero que retienen la misma estructuraquímica básica que un aminoácido existente naturalmente. EL término miméticos de aminoácidos hace referencia acompuestos químicos que tienen una estructura que es diferente de la estructura química general de un aminoácido,pero que funciona de una manera similar a un aminoácido existente naturalmente.

En esta memoria puede hacerse referencia a los aminoácidos por sus símbolos de tres letras conocidos comúnmen-te, o por los símbolos de una sola letra recomendados por la Comisión de Nomenclatura Bioquímica de la IUPAC-IUB. Asimismo, puede hacerse referencia a los nucleótidos por sus códigos de una sola letra aceptados comúnmente.

La expresión “variantes modificadas conservadoramente” es aplicable tanto a secuencias de aminoácidos como deácido nucleico. Con respecto a secuencias de ácido nucleico particulares, la expresión variantes modificadas conser-vadoramente se refiere a aquellos ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmenteidénticas, o en los casos en que el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencial-mente idénticas. Debido a la degeneración del código genético, un gran número de ácidos nucleicos funcionalmenteidénticos codifican cualquier proteína dada. Por ejemplo, los codones GCA, GCC, GCG y GCU codifican todos ellosel aminoácido alanina. Así pues, en cada posición en la cual una alanina es especificada por un codón, el codónpuede alterarse por cualquiera de los codones correspondientes descritos sin alterar el polipéptido codificado. Dichasvariaciones de ácido nucleico son “variaciones silenciosas”, que son una especie de variaciones modificadas conserva-doramente. Cada secuencia de ácido nucleico de esta memoria que codifica un polipéptido describe también cualquierposible variación silenciosa del ácido nucleico. Una persona con experiencia reconocerá que cada codón en un ácidonucleico (excepto AUC, que es ordinariamente el único codón para metionina, y TGG, que es ordinariamente el únicocodón para triptófano) puede modificarse para producir una molécula funcionalmente idéntica. De acuerdo con ello,cada variación silenciosa de un ácido nucleico que codifica un polipéptido está implícita en cada secuencia descrita.

En cuanto a las secuencias de aminoácidos, una persona con experiencia reconocerá que una sustitución, deleción,o adición individual a una secuencia de ácido nucleico, péptido, polipéptido, o proteína que altera, añade o delecionaun solo aminoácido o un pequeño porcentaje de aminoácidos en la secuencia codificada es una “variante” modificadaconservadoramente” en la cual la alteración da como resultado la sustitución de un aminoácido con un aminoácidoquímicamente similar. Tablas de sustituciones conservadoras que proporcionan aminoácidos funcionalmente similaresson bien conocidas en la técnica. Dichas variantes modificadas conservadoramente son adicionales a, y no excluyenvariantes polimórficas, homólogos interespecies, y alelos de la invención.

Los ocho grupos siguientes contienen cada uno aminoácidos que son sustituciones conservadoras unos de otros:

1) alanina (A), glicina (G);

2) ácido aspártico (D), ácido glutámico (E);

3) asparagina (N), glutamina (Q);

4) arginina (R), lisina (K);

5) isoleucina (I), leucina (L), metionina (M), valina (V);

6) fenilalanina (F), tirosina (Y), triptófano (W);

7) serina (S), treonina (T); y

8) cisteína (C), metionina (M)

(véase, v.g., Creighton, Proteins (1984)).

Diseño de ZFPs

Las ZFPs de la invención se transforman por ingeniería genética para reconocer un sitio diana seleccionado enel gen endógeno de elección. Típicamente, una cadena principal de cualquier ZFP C2H2 adecuada, tal como SP-1,SP-1C, o Zif268, se utiliza como el andamiaje para la ZFP transformada por ingeniería genética (véase, v.g., Jacobs,EMBO J. 11: 4507 (1992); Desjarlais y Berg, PNAS 90: 2256-2260 (1993)). Pueden utilizarse luego diversos métodospara designar y seleccionar una ZFP con afinidad alta para su diana (v.g., preferiblemente con un valor Kd menor queaproximadamente 25 nM). Como se ha descrito arriba, puede diseñarse o seleccionarse una ZFP para fijarse a cualquiersitio diana adecuado en el gen endógeno diana, con afinidad alta. La solicitud de patente USSN 09/229.007, tambiénen tramitación, presentada el 12 de enero de 1999, describe exhaustivamente métodos para el diseño, la construcción,y la expresión de ZFPs para sitios diana seleccionados.

12

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Puede utilizarse cualquier método adecuado conocido en la técnica para diseñar y construir ácidos nucleicos co-dificantes de ZFPs, v.g., presentación de fago, mutagénesis aleatoria, genotecas combinatorias, diseño computeriza-do/racional, selección por afinidad, PCR, clonación a partir de cDNA o genotecas genómicas, construcción por síntesisy análogos. (Véanse, v.g., Pat. U.S. No. 5.786.538; Wu et al., PNAS 92: 344-348 (1995); Jamieson et al., Biochemistry33: 5689-5695 (1994); Rebar y Pabo, Science 263: 671-673 (1994); Choo y Klug, PNAS, 31: 11163-11167 (1994);Choo y Klug, PNAS 91: 11168-11172 (1994); Desjarlais y Berg, PNAS 90: 2256-2260 (1993); Desjarlais y Berg,PNAS 89: 7345-7349 (1992); Pomerantz et al., Science 267: 93-96 (1995); Pomerantz et al., PNAS 92: 9752-9756(1995); y Liu et al., PNAS 94: 5525-5530 (1997); Griesman y Pabo, Science 275: 657-661 (1997); Desjarlais y Berg,PNAS 91: 11-99-11103 (1994)).

Una realización preferida, proporciona métodos que seleccionan un gen diana, e identifican un sitio diana dentrodel gen que contiene uno a seis (o más) sitios D-ables (véase la definición más adelante). Utilizando estos métodos,puede sintetizarse luego una ZFP que se fija al sitio preseleccionado. Estos métodos de selección de sitios diana estánbasados, en parte, en el reconocimiento de que la presencia de uno o más sitios D-ables en un segmento diana confiereel potencial para mayor afinidad de fijación en una ZFP seleccionada o diseñada para fijarse a dicho sitio con relacióna ZFPs que se fijan a segmentos diana que carecen de sitios D-ables (véase más adelante).

Un sitio o subsitio D-able es una región de un sitio diana que permite que un solo dedo de cinc diseñado adecuada-mente se fije a cuatro bases, en lugar de tres, del sitio diana. Un dedo de cinc de este tipo se fija a un triplete de basesen una cadena de un segmento diana bicatenario (cadena diana) y una cuarta base en la otra cadena. La fijación de unsolo dedo de cinc a un segmento diana de cuatro bases impone restricciones tanto en lo que respecta a la secuenciade la cadena diana como en lo referente a la secuencia de aminoácidos del dedo de cinc. El sitio diana dentro de lacadena diana debería incluir el motivo del sitio “D-able” 5’NNGK3’, en el cual N y K son códigos de ambigüedadconvencionales de la IUPAC-IUB. Un dedo de cinc para fijación a un sitio de este tipo debería incluir un residuoarginina en la posición -1 y un ácido aspártico (o menos preferiblemente un ácido glutámico) en la posición +2. Losresiduos arginina en la posición -1 interaccionan con el residuo G en el sitio D-able. El residuo de ácido aspártico (oácido glutámico) en la posición +2 del dedo de cinc interacciona con la base de la cadena opuesta complementaria ala base K en el sitio D-able. Es la interacción entre ácido aspártico (símbolo D) y la base de la cadena opuesta (cuartabase) lo que confiere el nombre de sitio D-able. Como resulta evidente a partir de la fórmula del sitio D-able, existendos subtipos de sitios D-ables: 5’NNGG3’ y 5’NNGT3’. Para el primer sitio, el ácido aspártico o ácido glutámico enla posición +2 de un dedo de cinc interacciona con un C en la cadena opuesta al sitio D-able. En el último sitio, elácido aspártico o ácido glutámico de la posición +2 de un dedo de cinc interacciona con un A en la cadena opuesta alsitio D-able. En general, se prefiere NNGG a NNGT.

En el diseño de una ZFP con tres dedos, debería seleccionarse un sitio diana en el cual al menos un dedo de laproteína, y opcionalmente, dos o los tres dedos tengan el potencial para fijar un sitio D-able. Ello puede conseguirsepor selección de un sitio diana del interior de un gen diana mayor que tenga la fórmula 5’-NNx aNY bNzc-3’, endonde

cada uno de los conjuntos (x,a), (y,b) y (z,c) es (N,N) o (G,K);

al menos uno de (x,a), (y,b), y (z,c) es (G,K), y

N y K son códigos de ambigüedad de la IUPAC-IUB.

Dicho de otro modo, al menos uno de los tres conjuntos (x,a), (y,b) y (z,c) es el conjunto (G,K), lo que significaque la primera posición del conjunto es G y la segunda posición es G o T. Aquéllos de los tres conjuntos (en sucaso) que no son (G,K) son (N,N), lo que significa que la primera posición del conjunto puede estar ocupada porcualquier nucleótido y la segunda posición del conjunto puede estar ocupada por cualquier nucleótido. Como ejemplo,el conjunto (x,a) puede ser (G,K) y los conjuntos (y,b) y (z,c) pueden ser ambos (N,N).

En la fórmula 5’-NNx aNy bNzc-3’, los tripletes de NNx aNy y bNzc representan los tripletes de bases en la cadenadiana fijados por los tres dedos en una ZFP. Si solamente uno de x, y y z es un G y este G va seguido por un K, el sitiodiana incluye un solo subsitio D-able. Por ejemplo, si únicamente x es G, y a es K, el sitio se lee 5’-NNG KNy bNzc-3’ con el subsitio D-able resaltado. Si tanto x como y, pero no z, son G, y a y b son K, entonces el sitio diana tiene dossubsitios D-ables solapantes como sigue: 5’-NNG KNG KNz c-3’, representándose un solo sitio de este tipo en negritay el otro en cursiva. Si x, y y z son todos ellos G y a, b y c son K, entonces el segmento diana incluye tres subsitios D-ables, como sigue: 5’NNG KNG KNG K3’,representándose los subsitios D-ables por negrita, cursiva y subrayado.

Estos métodos trabajan por consiguiente por selección de un gen diana, y búsqueda sistemática dentro de lassubsecuencias posibles del gen en cuanto a sitios diana que están de acuerdo con la fórmula 5’-NNx aNy bNcz-3’,como se ha descrito arriba. En algunos de tales métodos, cualquier subsecuencia posible de 10 bases contiguas encualquiera de las cadenas de un gen diana potencial se evalúa para determinar si la misma se ajusta a la fórmulaanterior y, si es así, cuántos sitios D-ables están presentes. Típicamente, dicha comparación se realiza por ordenador,y se emite una lista de sitios diana que se ajustan a la fórmula. Opcionalmente, dichos sitios diana pueden emitirse envarios subconjuntos de acuerdo con el número de sitios D-ables que están presentes.

En una variación, los métodos de la invención identifican segmentos diana primero y segundo, cada uno de los

13

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

cuales se ajusta independientemente a la fórmula anterior. En dichos métodos, los dos segmentos diana se ven for-zados a ser adyacentes o próximos (es decir, dentro de aproximadamente 0-5 bases) uno a otro en el gen diana. Laestrategia que subyace en la selección de segmentos diana próximos consiste en permitir el diseño de una ZFP for-mada por enlace de dos ZFPs componentes específicas para los segmentos diana primero y segundo, respectivamente.Estos principios pueden extenderse para seleccionar sitios diana que estén fijados por ZFPs con cualquier número dededos componentes. Por ejemplo, un sitio diana adecuado para una proteína de nueve dedos tendría tres segmentoscomponentes, cada uno de ellos ajustado a la fórmula anterior.

Los sitios diana identificados por los métodos anteriores pueden someterse a evaluación ulterior por otros criterioso pueden utilizarse directamente para diseño o selección (en caso necesario) y producción de una ZFP específica paradicho sitio. Un criterio adicional para evaluación de sitios diana potenciales es su proximidad a regiones particularesdentro de un gen. Si una ZFP debe utilizarse para reprimir un gen celular en sí mismo (es decir, sin enlazar la ZFP a unresto represor), entonces la localización óptima parece estar en, o a menos de, 50 pares de bases aguas arriba o aguasabajo del sitio de iniciación de la transcripción, para interferir con la formación del complejo de transcripción (Kimy Pabo, J. Biol. Chem. 272: 29795-296800 (1997)) o competir por una proteína de fijación intensificadora esencial.En cambio, si una ZFP está fusionada a un dominio funcional tal como el dominio represor KRAB o el dominioactivador VP16, la localización del sitio de fijación es considerablemente más flexible y puede estar situada fuerade regiones reguladoras conocidas. Por ejemplo, un dominio KRAB puede reprimir la transcripción en un promotorsituado hasta al menos tres kilopares de bases del punto en que está fijado KRAB (Margolin et al., PNAS 91: 4509-4513(1994)). Así pues, los sitios diana pueden seleccionarse de modo que no incluyan necesariamente o se solapen consegmentos de significación biológica demostrable con sitios diana, tales como secuencias reguladoras. Otros criteriospara evaluación ulterior de segmentos diana incluyen la disponibilidad previa de ZFPs que se fijen a tales segmentoso segmentos afines, y/o la facilidad de diseño de nuevas ZFPs para fijarse a un segmento diana dado.

Después que se ha seleccionado un segmento diana, puede proporcionarse una ZFP que se fija al segmento poruna diversidad de métodos. El método más sencillo consiste en proporcionar una ZFP precaracterizada a partir de unacolección existente que se sabe ya se fija al sitio diana. Sin embargo, en muchos casos, no existen tales ZFPs. Puedeutilizarse también un método alternativo para diseñar nuevas ZFPs, que utilizan la información contenida en una basede datos de ZFPs existentes y sus afinidades de fijación respectivas. Otro método consiste en diseñar una ZFP basadaen reglas de sustitución como se ha expuesto anteriormente. Otra alternativa adicional consiste en seleccionar unaZFP con especificidad para una diana dada por un proceso empírico tal como presentación de fago. En algunos detales métodos, cada dedo componente de una ZFP está diseñado o se selecciona independientemente de otros dedoscomponentes. Por ejemplo, cada dedo puede obtenerse de una ZFP preexistente diferente o cada dedo puede sometersea aleatorización y selección separadas.

Una vez que se ha seleccionado, diseñado o proporcionado de otro modo una ZFP para un segmento diana dado,se sintetizan la ZFP o el DNA que codifica la misma. Métodos ilustrativos para sintetizar y expresar DNA codificantede proteínas de dedos de cinc se describen más adelante. La ZFP o un polinucleótido codificante de la misma puedenutilizarse luego para modulación de la expresión, o análisis del gen diana que contiene el sitio diana al que se fija laZFP.

Expresión y purificación de ZFPs

Pueden fabricarse polipéptidos y ácidos nucleicos de ZFP utilizando técnicas rutinarias en el campo de la genéticarecombinante. Textos básicos que describen los métodos generales de uso en esta invención incluyen Sambrook etal., Molecular Cloning, A Laboratory Manual (segunda edición, 1989); Kriegler, Gene Transfer and Expression: ALaboratory Manual (1990); y Current Protocols in Molecular Biology (Ausubel et al., compiladores, 1994)). Ade-más, prácticamente cualquier ácido nucleico puede solicitarse mediante pedido de cualquiera de una diversidad defuentes comerciales. Análogamente, pueden solicitarse mediante pedido péptidos y anticuerpos de cualquiera de unadiversidad de fuentes comerciales.

Típicamente se utilizan dos métodos alternativos para crear las secuencias codificantes requeridas para la expresiónde péptidos de fijación de DNA de nuevo diseño. Un protocolo consiste en un procedimiento de ensamblaje basadoen PCR que utiliza seis oligonucleótidos solapantes (Figura 1). Tres oligonucleótidos (oligos 1, 3, y 5 en la Figura1) corresponden a secuencias “universales” que codifican porciones del dominio de fijación de DNA entre las hélicesde reconocimiento. Estos oligonucleótidos se mantienen constantes para todos los constructos de dedos de cinc. Losotros tres oligonucleótidos “específicos” (oligos 2, 4, y 6 en la Figura 1) están diseñados para codificar las hélices dereconocimiento. Estos oligonucleótidos contienen sustituciones que se encuentran fundamentalmente en las posiciones-1, 2, 3 y 6 de las hélices de reconocimiento, lo que los hace específicos para cada uno de los diferentes dominios defijación de DNA.

La síntesis por PCR se realiza en dos pasos. En primer lugar, se crea un molde de DNA bicatenario por combinaciónde los seis oligonucleótidos (tres universales y tres específicos) en una reacción PCR de cuatro ciclos con un paso dereasociación a temperatura baja, reasociando con ello los oligonucleótidos para formar un “andamiaje” de DNA.Los huecos en el andamiaje se rellenan con polimerasa termoestable de alta fidelidad, siendo también suficiente lacombinación de polimerasas Taq y Pfu. En la segunda fase de construcción, el molde de dedos de cinc se amplificapor medio de iniciadores externos diseñados para incorporar sitios de restricción en cualquiera de los extremos paraclonación en un vector lanzadera o directamente en un vector de expresión.

14

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Un método alternativo de clonación de las nuevas proteínas de fijación de DNA diseñadas está basado en la reaso-ciación de oligonucleótidos complementarios que codifican las regiones específicas de la ZFP deseada. Esta aplicaciónparticular requiere que los oligonucleótidos sufran fosforilación antes del paso de ligación final. Esto se realiza usual-mente antes del establecimiento de las reacciones de asociación, pero la quinasación puede ocurrir también despuésde la reasociación. Resumidamente, los oligonucleótidos “universales” que codifican las regiones constantes de lasproteínas (oligos 1, 2 y 3 citados anteriormente) se reasocian con sus oligonucleótidos complementarios. Adicional-mente, los oligonucleótidos “específicos” que codifican las hélices de reconocimiento de los dedos se reasocian consus oligonucleótidos complementarios respectivos. Estos oligos complementarios están diseñados para rellenar la re-gión que se rellenó previamente con polimerasa en el protocolo arriba descrito. Los oligos complementarios para losoligos 1 comunes y el dedo 3 se transforman por ingeniería genética para dejar secuencias colgantes específicas paralos sitios de restricción utilizados en la clonación del vector de elección. El segundo protocolo de ensamblaje difieredel protocolo inicial en los aspectos siguientes: el “andamiaje” que codifica la ZFP recién diseñada está compuestoenteramente por DNA sintético, eliminando con ello el paso de rellenado con polimerasa, y adicionalmente el frag-mento a clonar en el vector no requiere amplificación. Por último, el diseño de colgantes específicos de la secuenciarestante elimina la necesidad de digestiones con enzimas de restricción del fragmento de inserción.

El fragmento resultante que codifica la ZFP de nuevo diseño se liga a un vector de expresión. Vectores de expre-sión que se utilizan comúnmente incluyen, pero sin carácter limitante, un vector de expresión bacteriano pMAL-c2modificado (New England BioLabs, “NEB”) o un vector de expresión eucariota, pcDNA (Promega).

Puede utilizarse cualquier método adecuado de purificación de proteínas conocido por los expertos en la técnicapara purificar las ZFPs de la invención (véase Ausubel, supra, Sambrook, supra). Adicionalmente, puede utilizarsecualquier hospedador adecuado, v.g.,células bacterianas, células de insecto, células de levadura, células de mamífero,etcétera.

En una realización, la expresión de la ZFP fusionada a una proteína de fijación de maltosa (MBP-ZFP) en la cepabacteriana JM109 permite la purificación directa a través de una columna de amilosa (NEB). Altos niveles de expresiónde la proteína quimérica de dedos de cinc pueden obtenerse por inducción con IPTG, dado que la fusión MBP-ZFPen el plásmido de expresión pMal-c2 está bajo el control del promotor tac inducible por IPTG (NEB). Bacterias quecontienen los plásmidos de fusión MBP-ZFP se inoculan en medio 2xYT que contiene ZnCl2 10 µM, 0,02% de glucosa,más 50 µg/ml de ampicilina y se agitan a 37ºC mediante sacudidas. Se añade IPTG en crecimiento semi-exponenciala 0,3 mM y se dejan los cultivos en agitación mediante sacudidas. Después de 3 horas, se recogen las bacterias porcentrifugación, se disgregan por sonicación, y el material insoluble se separa por centrifugación. Las proteínas MBP-ZFP se capturan en una resina fijada con amilosa, se lavan extensamente con tampón que contiene Tris-HCl 20 mM (pH7,5), NaCl 200 mM, DTT 5 mM y ZnCl2 50 µM, y se eluyen luego con maltosa en un tampón esencialmente idéntico(la purificación se basa en un protocolo estándar de NEB). Las proteínas purificadas se cuantifican y se guardan paraanálisis bioquímico.

Las propiedades bioquímicas de las proteínas purificadas, v.g., Kd, pueden caracterizarse por cualquier ensayo ade-cuado. En una realización, se caracteriza Kd por ensayos electroforéticos de desplazamiento de movilidad (“EMSA”)(Buratowski y Codos, en Current Protocols in Molecular Biology, pp. 12.2.1-12.2.7 (Ausubel, compilador, 1996)). Semide la afinidad por titulación de la proteína purificada contra una cantidad baja fijada de diana de oligonucleótidobicatenario marcada. La diana comprende la secuencia del sitio de fijación natural (9 ó 18 pares de bases) flanqueadapor los tres pares de bases encontrados en la secuencia natural. Externa a la secuencia del sitio de fijación flanqueantemás existe una secuencia constante. Las dianas oligonucleotídicas reasociadas poseen un par de bases colgante enposición 5’ que permite la marcación eficiente de la diana con polinucleótido-quinasa del fago T4. Para el ensayo, seañade la diana a una concentración de 40 nM o inferior (la concentración real se mantiene al menos 10 veces menorque la dilución mínima de la proteína) y se deja que la reacción alcance el equilibrio durante al menos 45 min. Adi-cionalmente, la mezcla de reacción contiene también Tris 10 mM (pH 7,5), KCl 100 mM, MgCl2 1 mM, ZnCl2 0,1mM, DTT 5 mM, 10% de glicerol, 0,02% de BSA (poli(dIdC) o (dAdT) (Pharmacia) puede añadirse también a 10-100 µg/µl).

Las mezclas de reacción en equilibrio se cargan en un gel de poliacrilamida al 10%, que se ha pasado previamentedurante 45 min en tampón Tris/glicina, se fijan luego y la diana marcada sin fijar se resuelve por electroforesis a 150V (alternativamente, pueden utilizarse geles Tris-HCl en gradiente 10-20%, que contienen un apilador de poliacrila-mida al 4%). Los geles secados se visualizan por autorradiografía o producción de imágenes por luminiscencia, y sedetermina el valor Kd aparente por cálculo de la concentración de proteína que da la fijación semi-máxima.

Ensayos similares pueden incluir también la determinación de fracciones activas en las preparaciones de proteína.Las fracciones activas se determinan por desplazamientos en gel estequiométricos en los cuales las proteínas se titulancontra una concentración elevada del DNA diana. Las titulaciones se realizan a 100, 50, y 25% de la diana (usualmentea niveles micromolares).

En otra realización, pueden utilizarse genotecas de presentación de fago para seleccionar ZFPs con afinidad altapara el sitio diana seleccionado. Este método difiere fundamentalmente del diseño directo en que implica la generaciónde diversas genotecas de ZFPs mutagenizadas, seguida por el aislamiento de proteínas con propiedades deseadas de fi-jación de DNA utilizando métodos de selección por afinidad. Para utilizar este método, el analista procede típicamentecomo sigue.

15

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

En primer lugar, se somete a mutagénesis un gen para una ZFP para introducir diversidad en regiones importantespara especificidad y/o afinidad de fijación. En una aplicación típica, esto se realiza por aleatorización de un solo dedoen las posiciones -1, +2, +3, y +6, y quizás posiciones accesorias tales como +1, +5, +8, o +10.

A continuación, el gen sometido a mutagénesis se somete a clonación en un fago o vector de fagémido como unafusión con, v.g., el gen III del fago filamentoso, que codifica la proteína de la cubierta pIII. El gen de dedos de cinc seinserta entre segmentos del gen III que codifican el péptido de señal de exportación de membrana y el resto de pIII, detal manera que la ZFP se expresa como una fusión amino-terminal con pIII en la proteína madura procesada. Cuando seutilizan vectores de fagémido, el gen de dedos de cinc mutagenizado puede fusionarse también a una versión truncadadel gen III que codifica, mínimamente, la región C-terminal requerida para el ensamblaje de pIII en la partícula defago.

La genoteca de vectores resultante se transforma en E. coli y se utiliza para producir fago filamentoso que expresaZFPs variantes en su superficie como fusiones con la proteína de la cubierta pIII (si se utiliza un vector de fagémido,entonces este paso requiere superinfección con fago adyuvante). La genoteca de fagos se incuba luego con el sitiodel DNA diana, y se utilizan métodos de selección por afinidad para aislar el fago que fijan la diana con afinidadalta a partir del fago en masa. Típicamente, la diana de DNA se inmoviliza sobre un soporte sólido, que se lavaluego en condiciones suficientes para eliminar todos los fagos excepto el de fijación más fuerte. Después del lavado,cualesquiera fagos remanentes sobre el soporte se recuperan por elución en condiciones que rompen totalmente launión dedo de cinc-DNA.

Los fagos recuperados se utilizan para infectar E. coli reciente, que se amplifica luego y se utiliza para producir unnuevo lote de partículas de fago. Se repiten luego los pasos de fijación y recuperación tantas veces como sea necesariopara enriquecer suficientemente la agrupación de fagos en ligantes fuertes, de tal modo que éstos puedan identificarseutilizando métodos de secuenciación y/o clasificación.

Dominios reguladores

Las ZFPs de la invención están asociadas con dominios reguladores para modulación de la expresión génica.La ZFP puede estar asociada covalente o no covalentemente con uno o más dominios reguladores, alternativamentedos o más dominios reguladores, siendo los dos o más dominios dos copias del mismo dominio, o dos dominiosdiferentes. Los dominios reguladores pueden estar enlazados covalentemente a la ZFP, v.g., por la vía de un enlazadorde aminoácidos, como parte de una proteína de fusión. Las ZFPs pueden asociarse también con un dominio reguladorpor la vía de un dominio de dimerización no covalente, v.g., una cremallera de leucina, un dominio N-terminal deproteína STAT, o una proteína de fijación FK506 (véase, v.g., O’Shea, Science 254: 539 (1991), Barahmand-Pour etal., Curr. Top. Microbiol. Immunol. 211: 121-128 (1996); Klemm et al., Annu. Rev. Immunol., 16: 569-592 (1998);Klemm et al., Annu. Rev. Immunol., 16: 569-592 (1998); Ho et al., Nature, 382: 822-826 (1996); y Pomeranz et al.,Biochem. 37: 965 (1998)). El dominio regulador puede asociarse con la ZFP en cualquier posición adecuada, coninclusión del término C o N de la ZFP.

Dominios reguladores comunes para adición a la ZFP incluyen, v.g., dominios efectores de factores de transcrip-ción (activadores, represores, co-activadores, co-represores), silenciadores, receptores nucleares de hormonas, factoresde transcripción de oncogenes (v.g., miembros de las familias myc, jun, fos, myb, max, mad, rel, ets, bcl, mos, etc.);enzimas reparadoras de DNA y sus factores y modificadores asociados; enzimas de reordenamiento de DNA y susfactores y modificadores asociados; proteínas asociadas a cromatina y sus modificadores (v.g., quinasas, acetilasas ydesacetilasas); y enzimas modificadoras de DNA (v.g., metiltransferasas, topoisomerasas, helicasas, ligasas, quinasas,fosfatasas, polimerasas y endonucleasas) y sus factores y modificadores asociados.

Polipéptidos factores de transcripción a partir de los cuales se puede obtener un dominio regulador incluyen aqué-llos que están involucrados en la transcripción regulada y basal. Tales polipéptidos incluyen factores de transcripción,sus dominios efectores, coactivadores, silenciadores, receptores nucleares de hormonas (véase, v.g., Goodrich et al.,Cell. 84: 825-30 (1996) para una revisión de proteínas y elementos de ácido nucleico implicados en la transcripción;factores de transcripción en general se revisan en Barnes y Adcock, Clin. Exp. Allergy 25 Suplemento 2: 46-9 (1995)y Roeder, Methods Enzymol. 273: 165-71 (1996). Se conocen bases de datos dedicadas a factores de transcripción(véase, v.g., Science 269: 630 (1995)). Factores de transcripción nucleares de receptores de hormonas se describen,por ejemplo, en Rosen et al., J. Med. Chem. 38: 4855-74 (1995). La familia de factores de transcripción C/EBP serevisa en Wedel et al., Immunobiology 193: 171-85 (1995). Coactivadores y co-represores que median la regulaciónde la transcripción por receptores nucleares de hormonas se revisan, por ejemplo, en Meier, Eur. J. Endocrinol. 134(2): 158-9 (1996); Kaiser et al., Trends Biochem. Sci. 21: 342-5 (1996); y Utley et al. Nature 394: 498-502 (1998)).Factores de transcripción GATA, que están implicados en la regulación de la hematopoyesis se describen, por ejem-plo, en Simon, Nat. Genet. 11: 9-11 (1995); Weiss et al., Exp. Hematol. 23: 99-107. La proteína de fijación de la cajaTATA (TBP) y sus polipéptidos TAF asociados (que incluyen TAF30, TAF55, TAF80, TAF110, TAF150 y TAF250)se describen en Goodrich y Tjian, Curr. Opin. Cell Biol. 6: 403-9 (1994) y Hurley, Curr. Opin. Struct. Biol. 6: 69-75 (1996). La familia STAT de factores de transcripción se revisa, por ejemplo, en Barahmand-Pour et al., Curr. Top.Microbiol. Immunol. 211: 121-8 (1996). Factores de transcripción implicados en enfermedades se revisan en Aso etal., J. Clin. Invest. 97: 1561-9 (1996).

En una realización, el dominio de represión KRAB de la proteína KOX-1 humana se utiliza como un represor de la

16

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

transcripción (Thiesen et al., New Biologist 2: 363-374 (1990); Margolin et al., PNAS 91: 4509-4513 (1994); Pengueet al., Nucl. Acids Res. 22: 2908-2914 (1994); Witzgall et al., PNAS 91: 4514-4518 (1994); véase también el EjemploIII)). En otra realización, se utiliza con KRAB KAP-1, un co-represor KRAB (Friedman et al., Genes Dev. 10: 2067-2078 (1996)). Alternativamente, puede utilizarse KAP-1 solo con una ZFP. Otros factores de transcripción y dominiosde factores de transcripción preferidos que actúan como represores de la transcripción incluyen MAD (véase, v.g.,Sommer et al., J. Biol. Chem. 273: 6632-6642 (1998); Gupta et al., Oncogene, 16: 1149-1159 (1998); Queva et al.,Oncogene 16: 967-977 (1998); Larsson et al., Oncogene 15: 737-748 (1997); Laherty et al., Cell 89: 349-356 (1997);y Cultraro et al., Mol. Cell. Biol. 17: 2353-2359 (19977)); FKHR (cabeza de horquilla en el gen del rhabdosarcoma;Ginsberg et al., Cancer Res. 15: 3542-3546 (1998); Epstein et al., Mol. Cell. Biol. 18: 4118-4130 (1998)); EGR-1(producto-1 del gen de respuesta de crecimiento precoz; Yan et al., PNAS 95: 8298-8303 (1998); y Liu et al., CancerGene Ther. 5: 3-28 (1998)); el dominio represor del factor represor ets2 (ERD; Sgouras et al., EMBO J. 14: 4781-4793((19095)); y el dominio de interacción smSIN3 de MAD (SID; Ayer et al., Mol. Cell. Biol. 16: 5772-5781 (1996)).

En una realización, se utiliza el dominio de activación VP16 de HSV como activador de la transcripción (véase, v.g.,Hagmann et al., J. Virol. 71: 5952-5962 (1997)). Otros factores de transcripción preferidos que podrían suministrardominios de activación incluyen el dominio de activación de VP64 (SeiPel et al., EMBO J. 11: 4961-4968 (1996));receptores nucleares de hormonas (véase, v.g., Torchia et al., Curr. Opin. Cell. Biol. 10: 373-383 (1998)); la subunidadp65 del factor nuclear kappa B (Bitko y Barik, J. Virol. 72: 5610-5618 (1998) y Doyle y Hunt, Neuroreport 8: 2937-2942 (1997)); y EGR-1 (producto-1 del gen de respuesta del crecimiento precoz; Yan et al., PNAS 95: 8298-8303(1998); y Liu et al., Cancer Gene Ther. 5: 3-28 (1998)).

Quinasas, fosfatasas, y otras proteínas que modifican los polipéptidos implicados en la regulación génica son tam-bién útiles como dominios reguladores para ZFPs. Tales modificadores están implicados a menudo en la conmutaciónde encendido o apagado de la transcripción mediada, por ejemplo, por hormonas. Quinasas implicadas en la regulaciónde la transcripción se revisan en Davis, Mol. Reprod. Dev. 42: 459-67 (19958), Jackson et al., Adv. Second MessengerPhosphoprotein Res. 28: 279-86 (1993), y Boulikas, Crit. Rev. Eukaryot. Gene Expr. 5: 1-77 (1995), en tanto que lasfosfatasas se revisan, por ejemplo, en Schonthal y Semin, Cancer Biol. 6: 239-48 (1995). Tirosina-quinasas nuclearesse describen en Wang, Trends Biochem. Sci. 19: 373-6 (1994).

Como se ha descrito, pueden obtenerse también dominios útiles a partir de los productos génicos de oncogenes(v.g., miembros de las familias myc, jun, fos, myb, max, mad, rel, ets, bcl y mos) y sus factores y modificadoresasociados. Los oncogenes se describen, por ejemplo, en Cooper, Oncogenes, 2ª edición, The Jones and Bartlett Seriesin Biology, Boston, MA, Jones and Bartlett Publishers, 1995. Los factores de transcripción de ets se revisan en Waslylket al., Eur. J. Biochem. 211: 7-18 (1993) y Crepieux et al., Crit. Rev. Oncog. 5: 615-38 (1994). Los oncogenes mycse revisan, por ejemplo, en Ryan et al., Biochem., J. 314: 713-21 (1996). Los factores de transcripción jun y fos sedescriben, por ejemplo, en The Fos and Jun Families of Transcription Factors, Angel y Herrlich, compiladores (1994).El oncogén max se revisa en Hurlin et al., Cold Spring Harb. Symp. Quant. Biol. 59: 109-16. La familia de genes mybse revisa en Kanei-Ishii et al., Curr. Top. Microbiol. Immunol. 211: 89-98 (1996). La familia mos se revisa en Yew etal., Curr. Opin. Genet. Dev. 3: 19-25 (1993).

Las ZFPs pueden incluir dominios reguladores obtenidos a partir de enzimas reparadoras de DNA y sus factores ymodificadores asociados. Los sistemas de reparación de DNA se revisan, por ejemplo, en Vos, Curr. Opin. Cell Biol. 4:385-95 (1992); Sankar, Ann. Rev. Genet. 29: 69-105 (1995); Lehmann, Genet. Eng. 17: 1-19 (1995); y Wood, Ann. Rev.Biochem. 65: 135-67 (1996). Enzimas de reordenamiento del DNA y sus factores y modificadores asociados puedenutilizarse también como dominios reguladores (véase, v.g., Gangloff et al., Experientia 50: 261-9 (1994); Sadowski,PHASEB J. 7: 760-7 (1993)).

Análogamente, pueden derivarse dominios reguladores de enzimas modificadoras del DNA (v.g., DNA-metiltrans-ferasas, topoisomerasas, helicasas, ligasas, quinasas, fosfatasas, polimerasas) y sus factores y modificadores asociados.Las helicasas se revisan en Matson et al., Bioessays 16: 13-22 (1994), y las metiltransferasas se describen en Cheng,Curr. Opin. Struct. Biol. 5: 4-10 (1995). Las proteínas asociadas a cromatina y sus modificadores (v.g., quinasas, ace-tilasas y desacetilasas), tales como histona-desacetilasa (Wolffe, Science 272: 371-2 (1996)) son útiles también comodominios para adición a la ZFP de elección. En una realización preferida, el dominio regulador es una DNA-metil-transferasa que actúa como un represor de la transcripción (véase, v.g., Van den Wyngaert et al., FEBS Lett. 426: 283-289 (1998); Flynn et al., J. Mol. Biol. 279: 101-116 (1998); Okano et al., Nucleic Acids Res. 26: 2536-2540 (1998);y Zardo y Caiafa, J. Biol. Chem. 273: 16517-16520 (1998)). En otra realización preferida, se utilizan como represoresde la transcripción endonucleasas tales como Fok1, que actúan por escisión génica (véanse, v.g., los documentos WO95/09233, y PCT/US 94/01201).

Factores que controlan la cromatina y la estructura, el movimiento y la localización del DNA y sus factores y modi-ficadores asociados; factores derivados de microbios (v.g., procariotas, eucariotas y virus) y factores que están asocia-dos con o modifican los mismos pueden utilizarse también para obtener proteínas quiméricas. En una realización, seutilizan recombinasas e integrasas como dominios reguladores. En una realización, se utiliza histona-acetiltransferasacomo un activador de la transcripción (véase, v.g., Jin y Scotto, Mol. Cell. Biol. 18: 4377-4384 (1998); Wolffe, Science272: 371-372 (1996); Taunton et al., Science 272: 408-411 (1996); y Hassig et al., PNAS 95: 3519-3524 (1998)). Enotra realización, se utiliza histona-desacetilasa como un represor de la transcripción (véase, v.g., Jin y Scotto, Mol.Cell. Biol. 18: 4377-4384 (1998); Syntichaki y Thireos, J. Biol. Chem. 273: 24414-24419 (1998); Sakaguchi et al.,Genes Dev. 12: 2831-2841 (1998) y Martínez et al., J. Biol. Chem. 273: 23781-23785 (1998)).

17

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Pueden incluirse dominios enlazadores entre dominios polipeptídicos, v.g., entre dos ZFPs o entre una ZFP y undominio regulador. Tales enlazadores son típicamente secuencias polipeptídicas, tales como secuencias de poliglicinaque contienen entre aproximadamente 5 y 200 aminoácidos. Enlazadores preferidos son típicamente sub- secuenciasflexibles de aminoácidos que se sintetizan como parte de una proteína de fusión recombinante. Por ejemplo, en unarealización, se utiliza el enlazador DGGGS para unir dos ZFPs. En otra realización, el enlazador flexible que une dosZFPs es una subsecuencia de aminoácidos que comprende la secuencia TGEKP (véase, v.g., Liu et al., PNAS 5525-5530 (1997)). En otra realización, se utiliza el enlazador LRQKDGERP para enlazar dos ZFPs. En otra realización,se utilizan los siguientes enlazadores para unir dos ZFPs: GGRR (Pomerantz et al., 1995, supra), (G4S)n (Kim etal., PNAS 93, 1156-1160 (1996); y GGRRGGGS; LRQRDGERP; LRQKDGGGSERP; LRQKD(G3S)2ERP). Comoalternativa, pueden diseñarse racionalmente enlazadores flexibles utilizando programas de ordenador capaces de mo-delizar tanto los sitios de fijación de DNA como los péptidos propiamente dichos (Desjarlais y Berg, PNAS 90: 2256-2260 (1993), PNAS 91: 11099-11103 (1994) o por métodos de presentación de fago).

En otras realizaciones, se utiliza un enlazador químico para conectar secuencias de dominios producidas sintéticao recombinantemente. Tales enlazadores flexibles son conocidos por las personas expertas en la técnica. Por ejem-plo, enlazadores de poli(etilen-glicol) están disponibles de Shearwater Polymers, Inc. Huntsville, Alabama. Estosenlazadores tienen opcionalmente eslabones amídicos, eslabones sulfhidrilo, o eslabones hetero-funcionales. Ademásdel enlace covalente de las ZFPs a los dominios reguladores, pueden utilizarse métodos no covalentes para producirmoléculas con ZFPs asociadas con dominios reguladores.

Además de dominios reguladores, a menudo la ZFP se expresa como una proteína de fusión tal como la proteína defijación de maltosa (“MBP”), glutatión-S-transferasa (GST), hexahistidina, c-myc, y el epítope FLAG, para facilidadde purificación, monitorización de la expresión, o monitorización de la localización celular y subcelular.

Vectores de expresión para ácidos nucleicos que codifican ZFP

El ácido nucleico que codifica la ZFP de elección se somete típicamente a clonación en vectores intermediospara transformación en células procariotas o eucariotas para replicación y/o expresión, v.g., para la determinación deKd. Vectores intermedios son típicamente vectores procariotas, v.g., plásmidos, o vectores lanzadera, o vectores deinsecto, para almacenamiento o manipulación del ácido nucleico que codifica la ZFP o la producción de proteína.El ácido nucleico que codifica una ZFP se somete también típicamente a clonación en un vector de expresión, paraadministración a una célula vegetal, célula animal, preferiblemente una célula de mamífero o una célula humana,célula fúngica, célula bacteriana o célula de protozoo.

Para obtener la expresión de un gen o ácido nucleico clonado, se subclona típicamente una ZFP en un vector deexpresión que contiene un promotor para transcripción directa. Promotores bacterianos y eucariotas adecuados sonbien conocidos en la técnica, y se describen, v.g., en Sambrook et al., Molecular Cloning, A Laboratory Manual(2ª edición, 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); y Current Protocols inMolecular Biology (Ausubel et al., compiladores, 1994). Sistemas de expresión bacterianos para expresar la ZFPestán disponibles, v.g., en E. coli, Bacillus sp., y Salmonella (Palva et al., Gene 22: 229-235 (1983)). Kits para talessistemas de expresión están disponibles comercialmente. Sistemas de expresión eucariotas para células de mamífero,levadura y células de insecto son bien conocidos en la técnica y están también disponibles comercialmente.

El promotor utilizado para dirigir la expresión de un ácido nucleico de ZFP depende de la aplicación particular. Porejemplo, se utiliza típicamente un promotor constitutivo fuerte para la expresión y purificación de ZFP. En contraste,cuando se administra una ZFP in vivo para regulación génica, se utiliza un promotor constitutivo o un promotorinducible, dependiendo del uso particular de la ZFP. Adicionalmente, un promotor preferido para administración deuna ZFP puede ser un promotor débil, tal como HSV TK o un promotor que tenga actividad similar. El promotorpuede incluir también típicamente elementos que son sensibles a la transactivación, v.g., elementos de respuesta a lahipoxia, elementos de respuesta a Gal4, el elemento de respuesta al represor lac, y sistemas de control de moléculaspequeñas tales como sistemas regulados por tet y el sistema RU-486 (véase, v.g., Gossen y Bujard, PNAS 89: 5547(1992); Oligino et al., Gene Ther. 5: 491-496 (1998); Wang et al., Gene Ther. 4: 432-441 (1997); Neering et al., Blood88: 1147-1155 (1996); y Rendahl et al., Nat. Biotechnol. 16: 757-761 (1998)).

Además del promotor, el vector de expresión contiene típicamente una unidad de transcripción o casete de expre-sión que contiene todos los elementos adicionales requeridos para la expresión del ácido nucleico en células hospeda-doras, sea procariotas o eucariotas. Así, una casete de expresión típica contiene un promotor enlazado operativamente,v.g., a la secuencia de ácido nucleico que codifica la ZFP, y señales requeridas, v.g., para la poliadenilación eficientedel material transcrito, terminación de la transcripción, sitios de fijación de ribosoma, o terminación de la traducción.Elementos adicionales de la casete pueden incluir, v.g., intensificadores, y señales intrónicas heterólogas cortadas yempalmadas.

El vector de expresión particular utilizado para transportar la información genética a la célula se selecciona conrelación al uso propuesto de la ZFP, v.g., expresión en plantas, animales, bacterias, hongos, protozoos, etc. (véanse losvectores de expresión descritos más adelante y en la sección de Ejemplos). Vectores de expresión bacterianos estándarincluyen plásmidos tales como plásmidos basados en pBR322, pSKF, pET23D, y sistemas de expresión de fusióndisponibles comercialmente tales como GST y LacZ. Una proteína de fusión preferida es la proteína de fijación demaltosa, “MBP”. Tales proteínas de fusión se utilizan para purificación de la ZFP. Pueden añadirse también etiquetas

18

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

de epítopes a proteínas recombinantes para proporcionar métodos convenientes de aislamiento, para monitorizaciónde la expresión, y para monitorización de la localización celular y subcelular, v.g., c-myc o FLAG.

Vectores de expresión que contienen elementos reguladores de virus eucariotas se utilizan a menudo en vectoresde expresión eucariotas, v.g., vectores SV40, vectores del virus del papiloma, y vectores derivados del virus Epstein-Barr. Otros vectores eucariotas ilustrativos incluyen pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, pDSVE debaculovirus, y cualquier otro vector que permita la expresión de proteínas bajo la dirección del promotor precoz deSV40, el promotor tardío de SV40, el promotor de metalotioneína, el promotor del virus del tumor mamario murino,el promotor del virus del sarcoma de Rous, el promotor de polihedrina, u otros promotores que han demostrado sereficaces para expresión en células eucariotas.

Algunos sistemas de expresión tienen marcadores para la selección de líneas de células transfectadas de manera es-table tales como timidina-quinasa, higromicina-B-fosfotransferasa, y dihidrofolato-reductasa. Son también adecuadossistemas de expresión de alto rendimiento, tales como la utilización de un vector de baculovirus en células de insecto,con una secuencia codificante de ZFP bajo la dirección del promotor de polihedrina u otros promotores fuertes debaculovirus.

Los elementos que se incluyen típicamente en vectores de expresión incluyen también un replicón que funciona enE. coli, un gen que codifica la resistencia a antibióticos para permitir la selección de bacterias que albergan plásmidosrecombinantes, y sitios de restricción singulares en regiones no esenciales del plásmido que permiten la inserción desecuencias recombinantes.

Se utilizan métodos estándar de transfección para producir líneas de células bacterianas, de mamífero, de levadurao de insecto que expresan grandes cantidades de proteína, las cuales se purifican luego utilizando técnicas estándar(véase, v.g., Colley et al., J. Biol. Chem. 264: 17619-17622 (1989); Guide to Protein Purification, in Methods inEnzymology, vol. 182 (Deutscher, compilador, 1990)). La transformación de células eucariotas y procariotas se realizade acuerdo con técnicas estándar (véase, v.g., Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss y Curtiss, Methodsin Enzymology 101: 347-362 (Wu et al., compiladores, 1983).

Puede utilizarse cualquiera de los procedimientos bien conocidos para introducir secuencias de nucleótidos ex-trañas en células hospedadoras. Éstos incluyen el uso de transfección con fosfato de calcio, polibreno, fusión deprotoplastos, electroporación, liposomas, microinyección, DNA desnudo, vectores plasmídicos, vectores víricos, tantoepisómicos como integradores, y cualquiera de los otros métodos bien conocidos para introducción de DNA genómicoclonado, cDNA, DNA sintético u otro material genético extraño en una célula hospedadora (véase, v.g., Sambrooket al., supra). Únicamente es necesario que el procedimiento de ingeniería genética particular utilizado sea capaz deintroducir con éxito al menos un gen en la célula hospedadora capaz de expresar la proteína de elección.

Ensayos para determinar la regulación de la expresión génica por ZFPs

Pueden utilizarse una diversidad de ensayos para determinar el nivel de regulación de la expresión génica por lasZFPs. La actividad de una ZFP particular puede evaluarse utilizando una diversidad de ensayos in vitro y in vivo, pormedida, v.g., de los niveles de proteína o mRNA, niveles de producto, actividad enzimática, crecimiento de tumores;activación o represión de la transcripción de un gen informador; niveles se segundos mensajeros (v.g., cGMP, cAMP,IP3, DAG, Ca2+); niveles de producción de citoquinas y hormonas; y neovascularización, utilizando, v.g., inmunoensa-yos (v.g., ELISA y ensayos inmunohistoquímicos con anticuerpos), ensayos de hibridación (v.g., protección contra lasRNasas, Northerns, hibridación in situ, estudios de conjuntos de oligonucleótidos), ensayos colorimétricos, ensayosde amplificación, ensayos de actividad enzimática, ensayos de crecimiento de tumores, ensayos fenotípicos, etcétera.

Las ZFPs se ensayan por lo general primeramente respecto a actividad in vitro utilizando células cultivadas, v.g.,células 293, células CHO, células VERO, células BHK, células HeLa, células COS, etcétera. Preferiblemente se utili-zan células humanas. La ZFP se ensaya primeramente en muchos casos utilizando un sistema de expresión transitoriocon un gen informador, y a continuación se ensaya la regulación del gen endógeno diana en células y en animales,tanto in vivo como ex vivo. La ZFP puede expresarse recombinantemente en una célula, expresarse recombinante-mente en células trasplantadas a un animal, o expresarse recombinantemente en un animal transgénico, así comoadministrarse como una proteína a un animal o una célula utilizando vehículos de suministro descritos más adelante.Las células pueden estar inmovilizadas, estar en solución, inyectarse en un animal, o encontrarse naturalmente en unanimal transgénico o no transgénico.

La modulación de la expresión génica se ensaya utilizando uno de los ensayos in vitro o in vivo descritos en estamemoria. Las muestras o los ensayos se tratan con una ZFP y se comparan con muestras de control sin el compuestode ensayo, para examinar la extensión de la modulación. Como se ha descrito arriba, para regulación de la expresiónde genes endógenos, la ZFP tiene típicamente un valor Kd de 200 nM o menos, más preferiblemente 100 nM o menos,más preferiblemente 50 nM, y muy preferiblemente 25 nM o menos.

Los efectos de las ZFPs pueden medirse por examen de cualquiera de los parámetros arriba descritos. Puede utili-zarse cualquier cambio adecuado de la expresión génica, fenotípico o fisiológico, para evaluar la influencia de una ZFP.Cuando se determinan las consecuencias funcionales utilizando células o animales intactos, puede medirse también

19

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

una diversidad de efectos tales como crecimiento de tumores, neovascularización, liberación de hormonas, cambios detranscripción para marcadores genéticos tanto conocidos como no identificados (v.g., transferencias Northern o estu-dios de conjuntos oligonucleotídicos), cambios en el metabolismo celular tales como cambios de crecimiento celularo de pH, y cambios en segundos mensajeros intracelulares tales como cGMP.

Los ensayos preferidos para la regulación por ZFP de la expresión de genes endógenos pueden realizarse in vitro.En un formato de ensayo in vitro preferido, la regulación por ZFP de la expresión de genes endógenos en célulascultivadas se mide por examen de la producción de proteína utilizando un ensayo ELISA (véanse los Ejemplos VI yVII). La muestra de ensayo se compara con células de control tratadas con un vector vacío o una ZFP no afín que estádireccionada a otro gen.

En otra realización, la regulación por ZFP de la expresión de genes endógenos se determina in vitro por la medidadel nivel de la expresión de mRNA por el gen diana. El nivel de expresión génica se mide utilizando amplificación, v.g.,utilizando PCR, LCR, o ensayos de hibridación, v.g., hibridación Northern, protección contra RNasas, y transferenciade mancha. En una realización se utiliza la protección contra RNasas (véase Ejemplo VIII y Figura 10). El nivel deproteína o mRNA se detecta utilizando agentes de detección marcados directa o indirectamente, v.g., ácidos nucleicosmarcados por fluorescencia o radiactividad, anticuerpos marcados por radiactividad o enzimáticamente, y métodosanálogos, como se describe en esta memoria.

Alternativamente, puede idearse un sistema de gen informador utilizando el promotor del gen diana enlazadooperativamente a un gen informador tal como luciferasa, proteína fluorescente verde, CAT, o β-gal. El constructoinformador se somete típicamente a co-transfección en una célula cultivada. Después de tratamiento con la ZFP deelección, se mide la cantidad de transcripción, traducción, o actividad del gen informador de acuerdo con métodosestándar conocidos por quienes poseen experiencia en la técnica.

Otro ejemplo de un formato de ensayo preferido útil para monitorizar la regulación por ZFP de la expresión degenes endógenos se realiza in vivo. Este ensayo es particularmente útil para examinar ZFPs que inhiben la expresiónde genes promotores de tumores, genes implicados en el soporte de tumores, tales como la neovascularización (v.g.,VEGF), o que activan genes supresores de tumores tales como p53. En este ensayo, células tumorales cultivadas queexpresan la ZFP de elección se inyectan subcutáneamente en un ratón con sistema inmunitario deteriorado tal como unratón atímico, un ratón irradiado, o un ratón SCID. Después de un periodo de tiempo adecuado, preferiblemente 4-8semanas, se mide el crecimiento del tumor, v.g., por volumen o por sus dos dimensiones máximas, y se compara con elcontrol. Se dice que los tumores que tienen una reducción estadísticamente significativa (utilizando, v.g., el ensayo T deStudent) tienen crecimiento inhibido. Alternativamente, puede medirse también la extensión de la neovascularizaciónde los tumores. Se utilizan inmunoensayos que emplean anticuerpos específicos de células endoteliales para tincióncon respecto a la vascularización del tumor y el número de vasos en el tumor. Se dice que los tumores que tienenuna reducción estadísticamente significativa en el número de vasos (utilizando, v.g., el ensayo T de Student) tienenneovascularización inhibida.

Se utilizan también animales tanto transgénicos como no transgénicos como una realización preferida para examende la regulación de la expresión de genes endógenos in vivo. Los animales transgénicos expresan típicamente la ZFPde elección. Alternativamente, pueden utilizarse animales que expresan transitoriamente la ZFP de elección, o a loscuales se ha administrado la ZFP en un vehículo de suministro,. La regulación de la expresión de genes endógenos seensaya utilizando uno cualquiera de los ensayos descritos en esta memoria.

Ácidos nucleicos codificantes de ZFPs y terapia génica

Pueden utilizarse métodos de transferencia de genes convencionales tanto de base vírica como no vírica paraintroducir ácidos nucleicos que codifican ZFP transformadas por ingeniería genética en células o tejidos diana demamífero. Tales métodos pueden utilizarse para administrar ácidos nucleicos codificantes de ZFPs a células in vitro.Preferiblemente, los ácidos nucleicos codificantes de ZFPs se administran para usos de terapia génica in vivo o ex vivo.Sistemas de suministro de vectores no víricos incluyen plásmidos de DNA, ácido nucleico desnudo, y ácido nucleicocomplejado con un vehículo de suministro tal como un liposoma. Sistemas de suministro de vectores víricos incluyenvirus de DNA y RNA, que tienen genomas episómicos o integrados después del suministro a la célula. Para una revisiónde los procedimientos de terapia génica, véase Anderson, Science 256: 808-813 (1992); Nabel y Felgner, TIBTECH11: 211-217 (1993); Mitane y Caskey, TIBTECH 11: 162-166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller,Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6(10): 1149-1154 (1988); Vigne, Restorative Neurology andNeuroscience 8: 35-36 (1995); Kremer y Perricaudet, British Medical Bulletin 51(1): 31-44 (1995); Haddada et al., enCurrent Topics in Microbiology and Immunology, Doerfler y Böhm (compiladores) (1995); y Yu et al., Gene Therapy1: 13-26 (1994).

Métodos de suministro no vírico de ácidos nucleicos codificantes de ZFPs transformadas por ingeniería genéti-ca incluyen lipofección, microinyección, métodos balísticos, virosomas, liposomas, immunoliposomas, conjugadospolicatión o lípido:ácido nucleico, DNA desnudo, viriones artificiales, y absorción de DNA intensificada por agen-tes. La lipofección se describe, v.g., en los documentos US 5.049.386, US 4.946.787; y US 4.897.355) y reactivosde lipofección se venden en el comercio (v.g., TransfectamTM y LipofectinTM). Lípidos catiónicos y neutros que sonadecuados para lipofección eficiente de reconocimiento de receptores de polinucleótidos incluyen los de Felgner, do-

20

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

cumentos WO 91/17424, y WO 91/16024. El suministro puede hacerse a células (administración ex vivo) o tejidosdiana (administración in vivo).

La preparación de complejos lípido:ácido nucleico, con inclusión de liposomas direccionados tales como comple-jos de inmunolípidos, es bien conocida por los expertos en la técnica (véase, v.g., Crystal, Science 270: 404-410 (1995);Blaese et al., Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382-389 (1994); Remy et al.Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); Patentes U.S. Núms. 4.186.183, 4.217.344, 4.235.871, 4.261.975, 4.485.054, 4.501.728, 4.774.085,4.837.028, y 4.946.787).

El uso de sistemas de RNA o DNA basados en virus para el suministro de ácidos nucleicos que codifican ZFPtransformadas por ingeniería genética aprovecha la ventaja de procesos muy evolucionados para direccionamientode un virus a células específicas en el cuerpo y transporte de la carga vírica útil al núcleo. Los vectores víricospueden administrarse directamente a pacientes (in vivo) o pueden utilizarse para tratar células in vitro y las célulasmodificadas se administran posteriormente a los pacientes (ex vivo). Sistemas convencionales basados en virus parael suministro de ZFPs podrían incluir vectores de retrovirus, de lentivirus, de adenovirus, de virus adenoasociados ydel virus del herpes símplex para transferencia génica. Los vectores víricos son actualmente el método más eficiente yversátil de transferencia génica en células y tejidos diana. La integración en el genoma hospedador es posible con losmétodos de transferencia génica de retrovirus, lentivirus, y virus adeno-asociados, dando a menudo como resultado unaexpresión de larga duración del transgén insertado. Adicionalmente, se han observado altas eficiencias de transducciónen muchos tipos de células y tejidos diana diferentes.

El tropismo de un retrovirus puede alterarse por incorporación de proteínas de envoltura extrañas, que expandenla población diana potencial de células diana. Los vectores de lentivirus son vectores retrovíricos que son capaces detransducir o infectar células que no se dividen y producen típicamente títulos de virus altos. La selección de un sistemade transferencia de un gen retrovírico dependería por consiguiente del tejido diana. Los vectores retrovíricos estánconstituidos por repeticiones terminales largas con acción cis que tienen capacidad de empaquetamiento para hasta 6-10 kilobases de secuencia extraña. Las LTRs mínimas de acción cis son suficientes para replicación y empaquetamientode los vectores, los cuales se utilizan luego para integrar el gen terapéutico en la célula diana a fin de proporcionaruna expresión permanente del transgén. Vectores retrovíricos muy utilizados incluyen los basados en el virus de laleucemia murina (MuLV), el virus de la leucemia del gibón (GaLV), el virus de la Inmunodeficiencia de los Simios(SIV), el virus de la inmunodeficiencia humana (HIV), y combinaciones de los mismos (véase, v.g., Buchscher et al.,J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommerfelt et al., Virol. 176: 58-59(1990); Wilson et al., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220-2224 (1991); PCT/US 94/05700).

En aplicaciones en las que se prefiere la expresión transitoria de la ZFP, se utilizan típicamente sistemas basadosen adenovirus. Los vectores basados en adenovirus son capaces de una eficiencia de transducción muy alta en muchostipos de células y no requieren división celular. Con tales vectores, se han obtenido altos títulos y niveles de expresión.Este vector puede producirse en grandes cantidades en un sistema relativamente simple. Se utilizan también vectoresde virus adeno-asociados (“AAV”) para transducir células con ácidos nucleicos diana, v.g., en la producción in vitrode ácidos nucleicos y péptidos, y para procedimientos de terapia génica in vivo y ex vivo (véanse, v.g., West et al.,Virology 160: 38-47 (1987); Patente U.S. No. 4.797.368; documento WO 93/24641; Kotin Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1351 (1994)). La construcción de vectores AAV recombinantes sedescribe en numerosas publicaciones, con inclusión de la Patente U.S. No. 5.173.414; Tratschin et al., Mol. Cell. Biol.5: 3251-3260 (1985); Tratschin et al., Mol. Cell. Biol: 2072-281 (1984); Hermonat y Muzyczka, PNAS 81: 6466-6470(1984); y Samulsky et al., J. Virol. 63: 03822-3828 (1989).

En particular, al menos seis enfoques de vectores víricos están disponibles actualmente para transferencia génicaen pruebas clínicas, siendo los vectores retrovíricos con mucho el sistema utilizado más frecuentemente. Todos estasvectores víricos utilizan métodos que implican complementación de vectores defectuosos por geles insertados en líneasde células adyuvantes para generar el agente de transducción.

pLASN y MFG-S son ejemplos de vectores retrovíricos que se han utilizado en pruebas clínicas (Dunbard et al.,Blood 85: 3048-305 (1995); Kohn et al., Nat. Med. 1: 1017-102 (1995); Malech et al., PNAS 94:22 12133-12138(1997)). PA317/pLASN fue el primer vector terapéutico utilizado en una prueba de terapia génica. (Blaese et al.,Science 270: 475-480 (1995)). Se han observado eficiencias de transducción de 50% o mayores para vectores empa-quetados en MFG-S. (Ellem et al. Immunol. Immunother. 44(1): 10-20 (1997); Dranoff et al., Hum. Gene Ther. 1: 111-2 (1997).

Los vectores de virus recombinantes adeno-asociados (rAAV) son un sistema de suministro de genes alternativoprometedor basado en el virus tipo 2 deficiente y no patógeno de parvovirus adeno-asociado. Todos los vectores sederivan de un plásmido que retiene solamente las repeticiones terminales invertidas de 145 pares de bases de AAV queflanquean la casete de expresión del transgén. Una transferencia génica eficiente y suministro de transgenes establedebido a la integración en los genomas de la célula transducida son características clave para este sistema de vectores.Wagner et al., Lancet 351:9117, 1702-3 (1998), Kearns et al., Gene Ther. 9: 748-55 (1996)).

Los vectores de adenovirus (Ad) recombinantes deficientes en replicación se utilizan predominantemente paraterapia génica del cáncer de colon, debido a que pueden producirse con título alto e infectan fácilmente numerosos

21

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

tipos de células diferentes. La mayoría de los vectores de adenovirus se transforman por ingeniería genética de talmanera que un transgén reemplaza los genes Ad E1a, E1b, y E3; subsiguientemente, el vector tránsfuga de replicaciónse propaga en células 293 humanas que suministran la función del gen delecionado en trans. Los vectores Ad puedentransducir tipos múltiples de tejidos in vivo, con inclusión de células diferenciadas que no se dividen tales comolas encontradas en los tejidos de los sistemas hepático, renal y muscular. Los vectores Ad convencionales tienenuna gran capacidad de transporte. Un ejemplo del uso de un vector Ad en una prueba clínica implicaba la terapiacon polinucleótidos para inmunización antitumoral con inyección intramuscular (Sterman et al., Hum. Gene Ther. 7:1083-9 (1998)). Ejemplos adicionales del uso de vectores de adenovirus para transferencia génica en pruebas clínicasincluyen Rosenecker et al., Infection 24:1, 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7, 1083-1089 (1998); Welshet al., Hum. Gene Ther. 2: 205-18 (1995); Álvarez et al., Hum. Gene Ther. 5: 597-613 (1997); Topf et al., Gene Ther.5: 507-513 (1998); Sterman et al., Hum. Gene Ther. 7: 1083-1089 (1998).

Se utilizan células de empaquetamiento para formar partículas de virus que son capaces de infectar una célulahospedadora. Células de este tipo incluyen células 293, que empaquetan adenovirus, y células ψ2 o células PA317,que empaquetan retrovirus. Los vectores víricos utilizados en terapia génica son generados usualmente por una lí-nea de células productora que empaqueta un vector de ácido nucleico en una partícula vírica. Los vectores contienentípicamente las secuencias víricas mínimas requeridas para empaquetamiento e integración subsiguiente en un hos-pedador, estando reemplazadas otras secuencias víricas por una casete de expresión para la proteína a expresar. Lasfunciones víricas ausentes son suministradas en trans por la línea de células de empaquetamiento. Por ejemplo, losvectores AAV utilizados en terapia génica poseen típicamente sólo secuencias ITR del genoma de AAV que se re-quieren para empaquetamiento e integración en el genoma hospedador. El DNA vírico se empaqueta en una líneade células, que contiene un plásmido adyuvante que codifica los otros genes de AAV, a saber rep y cap, pero quecarece de secuencias ITR. La línea de células se infecta también con adenovirus como adyuvante. El virus adyuvantepromueve la replicación del vector AAV y la expresión de los genes de AAV del plásmido adyuvante. El plásmidoadyuvante no se empaqueta en cantidades significativas debido a una carencia de secuencias ITR. La contamina-ción con adenovirus puede reducirse mediante, v.g., tratamiento térmico, al cual es más sensible el adenovirus queAAV.

En muchas aplicaciones de terapia génica, es deseable que el vector de terapia génica se suministre con un altogrado de especificidad para un tipo de tejido particular. Un vector de terapia génica se modifica típicamente de modoque tenga especificidad para un tipo de célula dado por expresión de un ligando como una proteína de fusión conuna proteína de la cubierta vírica en la superficie externa de los virus. El ligando se selecciona de modo que tengaafinidad para un receptor que se sabe está presente en el tipo de célula de interés. Por ejemplo, Han et al., PNAS92: 9747-9751 (1995), comunicaron que el virus de la leucemia murina de Moloney puede modificarse para expresarla herregulina humana fusionada a gp70, y el virus recombinante infecta ciertas células de cáncer de mama humanoque expresan el receptor del factor del crecimiento epidérmico humano. Este principio puede extenderse a otros paresde virus que expresan una proteína de fusión de ligandos y células diana que expresan un receptor. Por ejemplo, elfago filamentoso puede transformarse por ingeniería genética para presentar fragmentos de anticuerpos (v.g., FAD oFv) que tienen afinidad de fijación específica para virtualmente cualquier receptor celular seleccionado. Aunque ladescripción anterior se aplica fundamentalmente a vectores víricos, los mismos principios pueden aplicarse a vectoresno víricos. Vectores de este tipo pueden transformarse por ingeniería genética de modo que contengan secuencias deabsorción específicas que se cree favorecen la absorción por células diana específicas.

Pueden suministrarse vectores de terapia génica in vivo por administración a un paciente individual, típicamentepor administración sistémica (v.g. intravenosa, intraperitoneal, intramuscular, subdérmica, o por infusión intracraneal)o aplicación tópica, como se describe más adelante. Alternativamente, los vectores pueden suministrarse ex vivo acélulas, tales como células procedentes de explantes de un paciente individual (v.g., linfocitos, aspirados de médulaósea, biopsia de tejidos) o células madre hematopoyéticas donantes universales, seguido por reimplantación de lascélulas en un paciente, usualmente después de selección para células que tengan incorporado el vector.

La transfección de células ex vivo para diagnósticos, investigación, o para terapia génica (v.g., por re-infusión de lascélulas transfectadas en el organismo hospedador) es bien conocida por los expertos en la técnica. En una realizaciónpreferida, las células se aíslan del organismo en cuestión, se transfectan con un ácido nucleico de ZFP (gen o cDNA),y se re-infunden de nuevo en el organismo en cuestión (v.g., el paciente). Diversos tipos de células adecuadas paratransfección ex vivo son bien conocidos por los expertos en la técnica (véase, v.g., Freshney et al., Culture of AnimalCells, A Manual of Basic Technique (3ª edición, 1994)) y las referencias citadas en dicho lugar para una exposicióndel modo de aislamiento y cultivo de células de pacientes).

En una realización, se utilizan células madre en procedimientos ex vivo para transfección celular y terapia génica.La ventaja de la utilización de células madre es que las mismas pueden diferenciarse en otros tipos de células in vitro, opueden introducirse en un mamífero (tal como el donante de las células) donde aquéllas se injertarán en la médula ósea.Se conocen métodos para diferenciar células CD34+ in vitro en tipos de células inmunitarias clínicamente importantesutilizando citoquinas tales como una GM-CSF, IFN-γ y TNF-α (véase Inaba et al., J. Exp. Med. 176: 1693-1702(1992)).

Las células madre se aíslan para transducción y diferenciación utilizando métodos conocidos. Por ejemplo, lascélulas madre se aíslan de células de la médula ósea por lavado en batea de las células de la médula ósea con anti-cuerpos que se fijan a las células no deseadas, tales como CD4+ y CD8+ (células T), CD45+ (células panB), GR-1

22

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

(granulocitos), e Iad (células presentadoras de antígeno diferenciadas) (véase Inaba et al., J. Exp. Med. 176: 1693-1702 (1992)).

Vectores (v.g., retrovirus, adenovirus, liposomas, etc.) que contienen ácidos nucleicos terapéuticos de ZFP pue-den administrarse también directamente al organismo para transducción de células in vivo. Alternativamente, puedeadministrarse DNA desnudo. La administración se realiza por cualquiera de las rutas utilizadas normalmente parala introducción de una molécula en contacto último con sangre o células de tejidos. Métodos adecuados de admi-nistración de tales ácidos nucleicos están disponibles y son bien conocidos por los expertos en la técnica, y, aunquepuede utilizarse más de una ruta para administrar una composición particular, a menudo una ruta particular puedeproporcionar una reacción más inmediata y más eficaz que otra ruta.

Los vehículos farmacéuticamente aceptables están determinados en parte por la composición particular que seadministra, así como por el método particular utilizado para administrar la composición. De acuerdo con ello, existeuna gran diversidad de formulaciones adecuadas de composiciones farmacéuticas de la presente invención, como sedescribe más adelante (véase, v.g., Remington’s Pharmaceutical Sciences, edición 17ª, 1989).

Vehículos de suministro para ZFPs

Un factor importante en la administración de compuestos polipeptídicos, tales como las ZFPs, es asegurarse deque el polipéptido tiene la capacidad de atravesar la membrana plasmática de una célula, o la membrana de un com-partimiento intra-celular tal como el núcleo. Las membranas celulares están compuestas de bicapas lípido-proteínaque son libremente permeables para compuestos lipófilos no iónicos pequeños y son inherentemente impermeables acompuestos polares, macromoléculas, y agentes terapéuticos o diagnósticos. Sin embargo, se han descrito proteínas yotros compuestos tales como liposomas, que tienen capacidad para translocar polipéptidos tales como ZFPs a travésde una membrana celular.

Por ejemplo, los “polipéptidos de translocación de membranas” tienen subsecuencias de aminoácidos anfifílicoso hidrófobos que tienen la capacidad de actuar como vehículos de translocación de membranas. En una realización,proteínas de homeodominio tienen la capacidad de translocarse a través de las membranas celulares. Se encontróque el péptido internalizable más corto de una proteína de homeodominio, Antennapedia, es la tercera hélice de laproteína, desde la posición del aminoácido 43 al 58 (véase, v.g., Prochiantz, Current Opinion in Neurobiology, 6:629-634 (1996)). Se encontró que otra subsecuencia, el dominio h (hidrófobo) de péptidos de señal, tiene caracte-rísticas similares de translocación de la membrana celular (véase, v.g., Lin et al., J. Biol. Chem. 270: 14255-14258(1995)).

Ejemplos de secuencias peptídicas que pueden enlazarse a una ZFP de la invención, para facilitar la absorciónde ZFP en las células, incluyen, pero sin carácter limitante: un péptido de 11 aminoácidos de la proteína tat de HIV;una secuencia peptídica de 20 residuos que corresponde a los aminoácidos 84-103 de la proteína p16 (véase Fahraeuset al., Current Biology 6: 84 (1996)); la tercera hélice del homeodominio largo de 60 aminoácidos de Antennapedia(Derossi et al., J. Biol. Chem. 269: 10444 (1994)); la región h de un péptido de señal tal como la región h del factorde crecimiento de los fibroblastos de Kaposi (K-FGF) (Lin et al., supra); o el dominio de translocación VP22 deHSV (Elliot y O’Hare, Cell 88: 223-233 (1997)). Otros restos químicos adecuados que proporcionan absorción celularintensificada pueden enlazarse también químicamente a ZFPs.

Las moléculas de toxinas tienen también la capacidad de transportar polipéptidos a través de las membranas ce-lulares. A menudo, tales moléculas están compuestas por al menos dos partes (denominadas “toxinas binarias”): undominio o polipéptido de translocación o fijación y un dominio o polipéptido de toxina separado. Típicamente, eldominio o polipéptido de translocación se fija a un receptor celular, y a continuación se transporta la toxina al interiorde la célula. Varias toxinas bacterianas, con inclusión de la toxina iota de Clostridium perfringens, la toxina de ladifteria (DT), la exotoxina A de Pseudomonas (PE), la toxina de la tos ferina (PT), la toxina de Bacillus anthracis,y la adenilato-ciclasa de la tos ferina (CYA), han sido utilizadas en intentos de suministrar péptidos al citosol celularcomo fusiones internas o amino-terminales (Arora et al., J. Biol. Chem. 268: 3334-3341 (1993); Perelle et al., Infect.Immun., 61: 5147-5156 (1993); Stenmark et al., J. Cell Biol. 113: 1025-1032 (1991); Donnelly et al., PNAS 90: 3530-3534 (1993); Carbonetti et al., Abstr. Annu. Meet. Am. Soc. Microbiol. 95: 295 (1995); Sebo et al., Infect. Immun. 63:3851-3857 (1995); Klimpel et al., PNAS U.S.A. 89: 10277-10281 (1992); y Novak et al., J. Biol. Chem. 267: 17186-17193 (1992)).

Subsecuencias de este tipo pueden utilizarse para translocar ZFPs a través de una membrana celular. Las ZFPspueden fusionarse convenientemente a o derivatizarse con dichas secuencias. Típicamente, la secuencia de transloca-ción se proporciona como parte de una proteína de fusión. Opcionalmente, puede utilizarse un enlazador para unir laZFP y la secuencia de translocación. Puede utilizarse cualquier enlazador adecuado, v.g., un enlazador peptídico.

La ZFP puede introducirse también en una célula animal, preferiblemente una célula de mamífero, por la vía deliposomas y derivados de liposomas tales como inmunoliposomas. El término “liposoma” hace referencia a vesículasconstituidas por una o más bicapas lipídicas ordenadas concéntricamente, que encapsulan una fase acuosa. La faseacuosa contiene típicamente el compuesto a suministrar a la célula, es decir, una ZFP.

El liposoma se fusiona con la membrana plasmática, liberando con ello el fármaco en el citosol. Alternativamente,

23

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

el liposoma sufre fagocitosis o es absorbido por la célula en una vesícula de transporte. Una vez en el endosoma ofagosoma, el liposoma se degrada o se fusiona con la membrana de la vesícula de transporte y libera su contenido.

En los métodos actuales de suministro de fármacos mediante liposomas, el liposoma llega a hacerse finalmentepermeable y libera el compuesto encapsulado (en este caso, una ZFP) en el tejido o célula diana. Para suministrosistémico o específico de tejidos, esto puede realizarse, por ejemplo, de una manera pasiva en la cual la bicapa delliposoma se degrada a lo largo del tiempo por la acción de diversos agentes existentes en el cuerpo. Alternativamente,la liberación del fármaco activo implica el uso de un agente para inducir un cambio de permeabilidad en la vesícula delliposoma. Pueden construirse membranas liposómicas de tal modo que las mismas lleguen a desestabilizarse cuando elentorno se vuelve ácido cerca de la membrana del liposoma (véase, v.g., PNAS 84: 7851 (1987); Biochemistry 28: 908(1989)). Cuando los liposomas se incluyen por endocitosis en una célula diana, por ejemplo, llegan a desestabilizarsey liberan sus contenidos. Esta desestabilización se denomina fusogénesis. La dioleoilfosfatidiletanolamina (DOPE) esla base de muchos sistemas “fusogénicos”.

Tales liposomas comprenden típicamente una ZFP y un componente lipídico, v.g., un lípido neutro y/o catiónico,incluyendo opcionalmente una molécula de reconocimiento de receptores tal como un anticuerpo que se fija a un recep-tor o ligando predeterminado de la superficie celular (v.g., un antígeno). Están disponibles una diversidad de métodospara la preparación de liposomas, como se describe, v.g., en Szoka et al., Ann. Rev. Biophys. Bioeng. 9: 467 (1980), yen las patentes U.S. Núms. 4.186.183, 4.217.344, 4.235.871, 4.261.975, 4.485.054, 4.501.728, 4.774.085, 4.837.028,4.235.871, 4.261,975, 4.485.054, 4.501.728, 4.774.085, 4.837.028, 4.946.787, publicación PCT No. WO 91/17424,Deamer y Bangham, Biochim. Biophys. Acta 443: 629-634 (1976); Fraley et al., PNAS 76: 3348-3352 (1979); Hope etal., Biochim. Biophys. Acta 812: 55-65 (1985); Mayer et al., Biochim. Biophys. Acta 858: 161-168 (1986); Williams etal., PNAS 85: 242-246 (1988); Liposomes (Ostro (compilador), 1983, capítulo 1); Hope et al., Chem. Phys. Lip. 40: 89(1986); Gregoriadis, Liposome Technology (1984) y Lasic, Liposomes: from Physics to Applications (1993)). Métodosadecuados incluyen, por ejemplo, sonicación, extrusión, presión elevada/homogeneización, microfluidización, diálisiscon detergente, fusión de vesículas pequeñas de liposomas inducida por calcio y métodos éter-fusión, todos los cualesson bien conocidos en la técnica.

En ciertas realizaciones de la presente invención, es deseable direccionar los liposomas de la invención utilizandorestos de direccionamiento que son específicos para un tipo de célula, tejido, etcétera, particular. El direccionamientode liposomas utilizando una diversidad de restos de direccionamiento (v.g., ligandos, receptores, y anticuerpos mono-clonales) ha sido descrito previamente (véanse, v.g., las Patentes U.S. Núms. 4.957.773 y 4.603.044).

Ejemplos de restos de direccionamiento incluyen anticuerpos monoclonales específicos para antígenos asociadoscon neoplasmas, tales como el antígeno específico del cáncer de próstata y MAGE. Los tumores pueden diagnosticarsetambién por detección de productos génicos resultantes de la activación o sobre-expresión de oncogenes, tales comoras o c-erbB2. Adicionalmente, muchos tumores expresan antígenos que son expresados normalmente por tejido fetal,tales como la alfafetoproteína (AFP) y el antígeno carcinoembrionario (CEA). Pueden diagnosticarse sitios de infec-ción vírica utilizando diversos antígenos víricos tales como los antígenos de núcleo y de superficie de la hepatitis B(HBVc, HBVs), antígenos de la hepatitis C, antígenos del virus Epstein-Barr, antígenos del virus tipo 1 de la inmuno-deficiencia humana (HIV1) y antígenos del virus del papiloma. La inflamación puede detectarse utilizando moléculasreconocidas específicamente por moléculas de superficie que se expresan en sitios de inflamación tales como integrinas(v.g., VCAM-1), receptores de selectina (v.g., ELAM-1), etcétera.

Pueden utilizarse métodos estándar para acoplamiento de agentes de direccionamiento a liposomas. Estos métodosimplican generalmente incorporación en componentes lipídicos de liposomas, v.g., fosfatidiletanolamina, que puedenactivarse para fijación de agentes de direccionamiento, o compuestos lipófilos derivatizados, tales como bleomicinaderivatizada con lípidos. Pueden construirse liposomas direccionados a anticuerpos utilizando, por ejemplo, liposomasque incorporan proteína A (véase Renneisen et al., J. Biol. Chem., 265: 16337-16342 (1990) y Leonetti et al., PNAS87: 2448-2451 (1990).

Dosis de ZFPs

Para aplicaciones terapéuticas de ZFPs, la dosis administrada a un paciente en el contexto de la presente invención,debe ser suficiente para efectuar una respuesta terapéutica beneficiosa en el paciente a lo largo del tiempo. Adicional-mente, pueden ser útiles regímenes de dosificación particulares para determinar cambios fenotípicos en una situaciónexperimental, v.g., en estudios funcionales de genómica, y en modelos celulares o animales. La dosis estará determi-nada por la eficacia y el valor Kd de la ZFP particular empleada, el volumen nuclear de la célula diana, y el estado delpaciente, así como el peso corporal o el área superficial del paciente a tratar. El tamaño de la dosis estará determinadotambién por la existencia, naturaleza y extensión de cualesquiera efectos secundarios adversos que acompañen a laadministración de un compuesto o vector particular en un paciente particular.

La dosificación máxima terapéuticamente eficaz de ZFP para una fijación de aproximadamente 99% a los sitiosdiana se calcula que está comprendida en el intervalo que va desde menos de aproximadamente 1,5 x 105 a 1,5 x 106

copias de la molécula ZFP específica por célula. El número de ZFPs por célula para este nivel de fijación se calculacomo sigue, utilizando el volumen de un núcleo de célula HeLa (aproximadamente 1000 µm3 o 10−12 L; Cell Biology,(Altman y Katz, compiladores (1976)). Dado que el núcleo HeLa es relativamente grande, este número de dosificaciónse recalcula en caso necesario utilizando el volumen del núcleo de la célula diana. Este cálculo no tiene tampoco

24

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

en cuenta la competición para la fijación de ZFP por otros sitios. Este cálculo supone además que prácticamente latotalidad de la ZFP se localiza en el núcleo. Se utiliza un valor de 100 x Kd para calcular aproximadamente el 99% defijación al sitio diana, y se utiliza un valor de 10 x Kd para calcular aproximadamente el 90% de fijación al sitio diana.Para este ejemplo, Kd = 25 nM

ZFP + sitio diana↔ complejo

es decir, DNA + proteína↔ complejo DNA: proteína

Kd =[DNA][proteína]

[complejo DNA : proteína]

Cuando se fija el 50% de ZFP, Kd = [proteína]

Así, cuando [proteína] = 25 nM y el volumen de núcleo es 10−12 L [proteína] = (25 x 10−9 moles/L)(10−12

L/núcleo)(6 x 1023 moléculas/mol) = 15.000 moléculas/núcleo para 50% de fijación

Cuando se fija 99% de la diana; 100 x Kd = [proteína]

100 x Kd = [proteína] = 2,5 µM

(2,5 x 10−6 moles/L)(10−12 L/núcleo) (6 x 1023 moléculas/mol) = aproximadamente 1.500.000 moléculaspor núcleo para 99% de fijación del sitio diana.

La dosis apropiada de un vector de expresión que codifica una ZFP puede calcularse también teniendo en cuenta latasa media de expresión de ZFP por el promotor y la tasa media de degradación de ZFP en la célula. Preferiblemente,se utiliza un promotor débil tal como un HSV TK de tipo salvaje o mutante, como se ha descrito arriba. La dosis deZFP en microgramos se calcula teniendo en cuenta el peso molecular de la ZFP particular que se emplee.

En la determinación de la cantidad eficaz de la ZFP a administrar en el tratamiento o la profilaxis de una en-fermedad, el médico evalúa los niveles circulantes en plasma de la ZFP o del ácido nucleico que codifica la ZFP,las toxicidades potenciales de la ZFP, la progresión de la enfermedad, y la producción de anticuerpos anti-ZFP. Laadministración puede realizarse en dosis simples o divididas.

Composiciones farmacéuticas y administración

Las ZFPs y los vectores de expresión que codifican ZFPs pueden administrarse directamente al paciente paramodulación de la expresión génica y para aplicaciones terapéuticas o profilácticas, por ejemplo, cáncer, isquemia,retinopatía diabética, degeneración macular, artritis reumatoide, psoriasis, infección de HIV, anemia de células falci-formes, enfermedad de Alzheimer, distrofia muscular, enfermedades neurodegenerativas, enfermedad vascular, fibrosisquística, derrame cerebral, etcétera. Ejemplos de microorganismos que pueden ser inhibidos por terapia génica conZFP incluyen bacterias patógenas, v.g., clamidia, bacterias rickettsianas, micobacterias, estafilococos, estreptococos,pneumococos, meningococos y gonococos, klebsiella, proteus, serratia, pseudomonas, legionella, difteria, salmone-lla, bacilos, cólera, tétanos, botulismo, ántrax, peste, leptospirosis, y bacterias de la enfermedad de Lyme; hongosinfecciosos, v.g., especies de Aspergillus y Candida; protozoos tales como esporozoos (v.g., Plasmodia), rizópodos(v.g., Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); enfermedades víricas, v.g.,hepatitis (A, B o C), herpes-virus (v.g., VZV, HSV-1, HSV-6, HSV-II, CMV, y EBV), HIV, Ebola, adenovirus, virusde la gripe, flavivirus, ecovirus, rinovirus, virus coxsackie, cornovirus, virus respiratorio sincitial, virus de las pa-peras, rotavirus, virus del sarampión, virus de la rubéola, parvovirus, virus vaccinia, virus HTLV, virus del dengue,papilomavirus, poliovirus, virus de la rabia, y virus de la encefalitis arbovírica, etc.

La administración de cantidades terapéuticamente eficaces se realiza por cualquiera de las rutas utilizadas normal-mente para introducir ZFP en contacto último con el tejido a tratar. Las ZFPs se administran de cualquier maneraadecuada, preferiblemente con vehículos farmacéuticamente aceptables. Métodos adecuados de administración de ta-les moduladores están disponibles y son bien conocidos por los expertos en la técnica, y, aunque puede utilizarsemás de una ruta para administrar una composición particular, una ruta particular puede proporcionar a menudo unareacción más inmediata y más eficaz que otra ruta.

Los vehículos farmacéuticamente aceptables están determinados en parte por la composición particular que seadministra, así como por el método particular utilizado para administrar la composición. De acuerdo con ello, existeuna gran diversidad de formulaciones adecuadas de composiciones farmacéuticas de la presente invención (véase, v.g.,Remington’s Pharmaceutical Sciences, edición 17ª (1985)).

Las ZFPs, solas o en combinación con otros componentes adecuados, pueden prepararse en formulaciones de aero-sol (es decir, las mismas pueden “nebulizarse”) para ser administradas por inhalación. Las formulaciones de aerosolpueden disponerse en propelentes presurizados aceptables, tales como diclorodifluorometano, propano, nitrógeno, yanálogos.

25

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Formulaciones adecuadas para administración parenteral, tales como, por ejemplo, por rutas intravenosa, intra-muscular, intradérmica y subcutánea, incluyen soluciones de inyección acuosas y no acuosas isotónicas estériles, lascuales pueden contener antioxidantes, tampones, bacteriostáticos, y solutos que hacen la formulación isotónica con lasangre del receptor propuesto, y suspensiones estériles acuosas y no acuosas que pueden incluir agentes de suspensión,solubilizadores, agentes espesantes, estabilizadores, y conservantes. En la práctica de esta invención, las composicio-nes pueden administrarse, por ejemplo, por infusión intravenosa, o por vías oral, tópica, intraperitoneal, intravesical,o intrate-cal. Las formulaciones de los compuestos pueden presentarse en envases monodosis o multidosis herméti-camente cerrados, tales como ampollas y viales. Las soluciones y suspensiones para inyección se pueden preparar apartir de polvos estériles, gránulos, y tabletas de la clase descrita previamente.

Regulación de la expresión génica en las plantas

Las ZFPs pueden utilizarse para transformar por ingeniería genética plantas en cuanto a características tales comoresistencia incrementada a enfermedades, modificación de polisacáridos estructurales y de reserva, sabores, proteínas,y ácidos grasos, maduración de los frutos, rendimiento, color, características nutricionales, capacidad de almacena-miento mejorada, etcétera. En particular, presenta interés la transformación por ingeniería genética de especies decosechas para producción incrementada de aceite, v.g., la modificación de los ácidos grasos producidos en las semillasoleaginosas.

Los aceites de semillas están compuestos fundamentalmente por triacilgliceroles (TAGs), que son ésteres glicéricosde ácidos grasos. La producción comercial de estos aceites vegetales está representada fundamentalmente por seiscosechas de aceite principales (soja, palma de aceite, colza, girasol, semilla de algodón, y cacahuete). Se utilizanpredominantemente aceites vegetales (el 90%) para consumo humano como margarina, manteca, aceites para ensaladay aceite para freír. El 10% restante se utiliza para aplicaciones no alimentarias tales como lubricantes, productosoleoquímicos, bio-combustibles, detergentes, y otras aplicaciones industriales.

Las características deseadas del aceite utilizado en cada una de estas aplicaciones varían ampliamente, en particularen términos de la longitud de cadena y el número de enlaces dobles presentes en los ácidos grasos que constituyen losTAGs. Estas propiedades son manipuladas por la planta para controlar la fluidez de la membrana y la sensibilidad ala temperatura. Las mismas propiedades pueden controlarse utilizando ZFPs para producir aceites con característicasmejoradas para usos alimentarios e industriales.

Los ácidos grasos fundamentales en los TAGs de las cosechas de semillas oleaginosas tienen 16 a 18 carbonos delongitud y contienen 0 a 3 enlaces dobles. Predominan ácido palmítico (16:0 [16 carbonos:0 enlaces dobles]), ácidooleico (18:1), ácido linoleico (18:2), y ácido linolénico (18:3). El número de enlaces dobles, o grado de saturación,determina la temperatura de fusión, la reactividad, la eficiencia de cocción, y los atributos de salubridad del aceiteresultante.

La enzima responsable de la conversión del ácido oleico (18:1) en ácido linoleico (18:2) (que es luego el precursorpara la formación de 18:3) es la ∆12-oleato-desaturasa, a la que se hace referencia también como omega-6-desaturasa.Un bloqueo en este paso del camino de desaturación de los ácidos grasos daría como resultado la acumulación deácido oleico a expensas de poliinsaturados.

En una realización, se utilizan ZFPs para regular la expresión del gen FAD2-1 en la soja. Dos genes codificantesde ∆6-desaturasas microsómicas han sido clonados recientemente a partir de la soja, y se hace referencia a los mismoscomo FAD2-1 y FAD2-2 (Heppard et al., Plant Physiol. 110: 311-319 (1996)). La FAD2-1 (delta-12-desaturasa)parece controlar el grueso de la desaturación del ácido oleico en la semilla de la soja. Por tanto, pueden utilizarseZFPs para modular la expresión génica de FAD2-1 en las plantas. Específicamente, se pueden utilizar ZFPs parainhibir la expresión del gen FAD2-1 en la soja a fin de aumentar la acumulación de ácido oleico (18:1) en la semillaoleaginosa. Además, pueden utilizarse ZFPs para modular la expresión de cualquier otro gen vegetal, tal como delta-9-desaturasa, delta-12-desaturasas de otras plantas, delta-15-desaturasa, acetil-CoA-carboxilasa, acil-ACP-tioesterasa,ADP-glucosa-pirofosforilasa, almidón-sintasa, celulosa-sintasa, sacarosa-sintasa, genes asociados con la senescencia,formadores de quelatos con metales pesados, hidroperóxido-liasa de ácidos grasos, poligalacturonasa, EPSP-sintasa,genes víricos de plantas, genes patógenos fúngicos de plantas, y genes patógenos bacterianos de plantas.

Se utilizan también vectores de DNA recombinantes adecuados para transformación de células vegetales parasuministrar la ZFP de la invención a células vegetales. Técnicas para la transformación de una gran diversidad deespecies de plantas superiores son bien conocidas y se describen en la bibliografía técnica y científica (véase, v.g.,Weising et al., Ann. Rev. Genet. 22: 421-477 (1988)). Una secuencia de DNA que codifica la ZFP deseada se combinacon secuencias reguladoras de iniciación de la transcripción y la traducción que dirigirán la transcripción de la ZFP enlos tejidos deseados de la planta transformada.

Por ejemplo, puede emplearse un fragmento promotor vegetal que dirigirá la expresión de la ZFP en todos lostejidos de la planta regenerada. Se hace referencia en esta memoria a dichos promotores como promotores “constitu-tivos”, los cuales son activos en la mayoría de las condiciones ambientales y estados de desarrollo o diferenciacióncelular. Ejemplos de promotores constitutivos incluyen la región de iniciación de la transcripción 35S del virus del mo-saico de la coliflor (CaMV), el promotor 1’ o 2’ derivado de T-DNA de Agrobacterium tumefaciens; y otras regionesiniciadoras de la transcripción de diversos genes vegetales conocidos por los expertos en la técnica.

26

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Alternativamente, el promotor vegetal puede dirigir la expresión de la ZFP en un tejido específico o puede estarde otro modo bajo control ambiental o experimental más preciso. En esta memoria se hace referencia a dichos promo-tores como promotores “inducibles”. Ejemplos de condiciones ambientales que pueden afectar a la transcripción porpromotores inducibles incluyen condiciones anaerobias o la presencia de luz.

Ejemplos de promotores bajo control experimental incluyen promotores que inician la transcripción únicamenteen ciertos tejidos, tales como frutos, semillas, o flores. Por ejemplo, el uso de un promotor de poligalacturonasa puededirigir la expresión de la ZFP en el fruto, y un promotor CHS-A (calcona-sintasa-A de la petunia) puede dirigir laexpresión de la ZFP en la flor de una planta.

El vector que comprende la secuencia ZFP comprenderá típicamente un gen marcador que confiere un fenotiposeleccionable a las células vegetales. Por ejemplo, el marcador puede codificar resistencia a biocidas, particularmenteresistencia a antibióticos, tal como resistencia a kanamicina, G418, bleomicina, higromicina, o resistencia a herbicidas,tal como resistencia a clorosulfurón o Basta.

Tales constructos de DNA pueden introducirse en el genoma de la planta hospedadora deseada por una diversidadde técnicas convencionales. Por ejemplo, el constructo de DNA puede introducirse directamente en el DNA genómi-co de la célula vegetal utilizando técnicas tales como electroporación y microinyección de protoplastos de la célulavegetal, o los constructos de DNA pueden introducirse directamente en un tejido vegetal utilizando métodos balís-ticos, tales como bombardeo con partículas de DNA. Alternativamente, los constructos de DNA pueden combinarsecon regiones flanqueantes adecuadas de T-DNA e introducirse en un vector hospedador convencional de Agrobacte-rium tumefaciens. Las funciones de virulencia del hospedador Agrobacterium tumefaciens dirigirán la inserción delconstructo y el marcador adyacente en el DNA de la célula vegetal cuando la célula es infectada por las bacterias.

Métodos de microinyección se conocen en la técnica y se describen detalladamente en la bibliografía científicay de patentes. La introducción de constructos de DNA utilizando precipitación con polietilen-glicol se describe enPaszkowski et al., EMBO J. 3: 2717-2722 (1984). Técnicas de electroporación se describen en Fromm et al., PNAS82: 5824 (1985). Técnicas de transformación balísticas se describen en Klein et al., Nature 327: 70-73 (1987).

Técnicas de transformación mediadas por Agrobacterium tumefaciens han sido descritas detalladamente en labibliografía científica (véase, v.g., Horsch et al., Science 233: 496-498 (1984)); y Fraley et al., PNAS 80: 4803 (1983)).

Las células vegetales transformadas que se derivan por cualquiera de las técnicas de transformación anteriorespueden cultivarse para regenerar una planta entera que posee el genotipo transformado y por consiguiente el fenotipodeseado controlado por ZFP. Dichas técnicas de regeneración están basadas en la manipulación de ciertas fitohormonasen un medio de crecimiento en cultivo de tejidos, que se basa típicamente en un marcador biocida y/o herbicida queha sido introducido junto con las secuencias nucleotídicas de ZFP. La regeneración de plantas a partir de protoplastoscultivados se describen en Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176 (1983); y Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73 (1985). La regeneración puede obtenersetambién a partir de callos de plantas, explantes, órganos o partes de los mismos. Dichas técnicas de regeneración sedescriben en líneas generales en Klee et al., Ann. Rev. of Plant Phys. 38: 467-486 (1987).

Ensayos funcionales de genómica

Las ZFPs tienen uso también para ensayos con objeto de determinar las consecuencias fenotípicas y la función de laexpresión génica. Los recientes avances en técnicas analíticas, acoplados con esfuerzos enfocados en la secuenciaciónen gran escala, han creado la oportunidad para identificar y caracterizar muchas más dianas moleculares que las queestaban disponibles anteriormente. Esta nueva información acerca de genes y sus funciones acelerará la comprensiónbiológica básica y ofrecerá muchas nuevas dianas para intervención terapéutica. En algunos casos, las herramientasanalíticas no han avanzado al ritmo de la generación de nuevos datos. Un ejemplo lo proporcionan los recientes avan-ces en la medida de la expresión génica diferencial global. Estos métodos, tipificados por microsistemas de expresiónde genes, frecuencias de clonación diferencial de cDNA, hibridación sustractiva y métodos de presentación diferencial,pueden identificar con gran rapidez genes que están regulados en sentido creciente o decreciente en diferentes tejidoso en respuesta a estímulos específicos. Dichos métodos están siendo utilizados cada vez más para explorar procesosbiológicos tales como transformación, progresión de tumores, la respuesta inflamatoria, trastornos neurológicos, etc.Actualmente es posible generar con gran facilidad largas listas de genes expresados diferencialmente que están corre-lacionados con un fenómeno fisiológico dado, pero la demostración de una relación causal entre un gen individualexpresado diferencialmente y el fenómeno es difícil. Hasta ahora, los métodos simples para la asignación de funcionesa genes expresados diferencialmente no han avanzado al mismo ritmo que la posibilidad de monitorizar la expresióngénica diferencial.

Utilizando enfoques moleculares convencionales, la sobre-expresión de un gen candidato puede realizarse por clo-nación de un cDNA de longitud total, subclonación del mismo en un vector de expresión de mamífero y transfeccióndel vector recombinante en una célula hospedadora apropiada. Este enfoque es sencillo pero intensivo en mano de obra,particularmente cuando el gen candidato inicial está representado por un marcador de secuencia expresada (EST) sim-ple. La infra-expresión de un gen candidato por métodos “convencionales” es todavía más problemática. Los métodosantisentido y métodos que están basados en ribozimas direccionadas son poco fiables, teniendo éxito únicamente parauna pequeña fracción de las dianas seleccionadas. La desactivación de genes por recombinación homóloga funciona

27

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

aceptablemente bien en las células madre recombinógenas, pero muy ineficazmente en líneas de células derivadassomáticamente. En ambos casos, deberían aislarse grandes clones de DNA genómico singeneico (del orden de 10 kb)para recombinación a fin de poder funcionar eficientemente.

La tecnología ZFP puede utilizarse para analizar rápidamente estudios de expresión génica diferencial. Las ZFPstransformadas por ingeniería genética pueden utilizarse fácilmente para regular en sentido creciente o decrecientecualquier gen diana endógeno. Se requiere muy poca información de secuencia para crear un dominio de fijaciónde DNA específico de un gen. Esto hace que la tecnología en ZFP sea ideal para análisis de largas listas de genesexpresados diferencialmente no bien caracterizados. Es posible construir simplemente un dominio de fijación de DNAbasado en dedos de cinc para cada gen candidato, crear factores de transcripción artificiales quiméricos de regulacióncreciente y decreciente y ensayar la consecuencia de la regulación creciente o decreciente sobre el fenotipo objeto delestudio (transformación, respuesta a una citoquina, etc.) por encendido o apagado de los genes candidato de uno enuno en un sistema modelo.

Este ejemplo específico de la utilización de ZFPs transformadas por ingeniería genética para aportar informaciónfuncional a datos genómicos es meramente ilustrativo. Cualquier situación experimental que pudiera beneficiarse dela regulación específica creciente o decreciente de un gen o genes podría beneficiarse de la fiabilidad y facilidad deuso de las ZFPs transformadas por ingeniería genética.

Adicionalmente, puede impartirse mayor control experimental por las ZFPs que el que puede conseguirse pormétodos más convencionales. Esto se debe a que la producción y/o función de una ZFP transformada por ingenieríagenética puede ponerse bajo control de moléculas pequeñas. Ejemplos de este enfoque son proporcionados por el sis-tema Tet-On, el sistema regulado por ecdisona y un sistema que incorpora un factor quimérico que incluye un receptormutante de progesterona. Estos sistemas son todos ellos capaces de impartir indirectamente control por moléculaspequeñas sobre cualquier gen endógeno de interés o cualquier transgén por ubicación de la función y/o expresión deun regulador de ZFP bajo control de moléculas pequeñas.

Ratones transgénicos

Una aplicación adicional de la tecnología ZFP es la manipulación de la expresión génica en animales transgénicos.Como en el caso de las líneas de células, la sobre-expresión de un gen endógeno o la introducción de un gen heterólogoen un animal transgénico, tal como un ratón transgénico, es un proceso bastante sencillo. La tecnología ZFP constituyeuna mejora en estos tipos de métodos debido a que puede soslayarse la necesidad de generar clones de cDNA delongitud total del gen que se estudia.

Análogamente, como en el caso de los sistemas basados en células, la regulación convencional decreciente de laexpresión génica en animales transgénicos está plagada de dificultades técnicas. La desactivación de genes por recom-binación homóloga es el método aplicado más frecuentemente en la actualidad. Este método requiere la desactivaciónde un clon genómico relativamente largo del gen (aprox. 10 kilobases). Típicamente, se inserta un marcador selec-cionable en un exón del gen de interés para efectuar la rotura del gen, y se proporciona un segundo marcador contra-seleccionable fuera de la región de homología para seleccionar los recombinantes homólogos de los no homólogos.Este constructo se somete a transfección en células madre embrionarias y se seleccionan en cultivo los recombinantes.Las células madre recombinantes se combinan con embriones en etapa muy temprana generando animales quimé-ricos. Si el estado quimérico se extiende a la línea germinal, pueden aislarse animales homocigóticos desactivadosgénicamente por retro-cruzamiento. Cuando la tecnología se aplica con éxito, pueden generarse animales génicamentedesactivados en aproximadamente un año. Lamentablemente, dos problemas frecuentes impiden a menudo la apli-cación con éxito de la tecnología de desactivación génica: la letalidad embrionaria y la compensación a lo largo deldesarrollo. La letalidad embrionaria se produce cuando el gen a desactivar juega un papel esencial en el desarrollo.Esto puede manifestarse a su vez como una falta de estado quimérico, ausencia de transmisión en la línea germinal oincapacidad de generar retrocruzamientos homocigóticos. Los genes pueden jugar papeles fisiológicos significativa-mente diferentes durante el desarrollo frente a su comportamiento en los animales adultos. Por esta razón, la letalidadembrionaria no se considera como una base racional para descartar una diana génica como diana útil para intervenciónterapéutica en adultos. La letalidad embrionaria significa en muchos casos simplemente que el gen de interés no puedeser estudiado fácilmente en modelos de ratón, utilizando métodos convencionales.

La compensación a lo largo del desarrollo es la sustitución por un producto génico afín en lugar del productogénico que ha sido desactivado. Los genes existen a menudo en familias extensas. La selección o inducción duranteel curso del desarrollo puede desencadenar en algunos casos el reemplazo por un miembro de una familia de otromiembro mutante. Este tipo de sustitución funcional puede no ser posible en el animal adulto. Un resultado típico dela compensación a lo largo del desarrollo podría ser la falta de un fenotipo en un ratón con algún gen desactivadocuando la ablación de la función de dicho gen en un adulto causaría en caso contrario un cambio fisiológico. Éste esun tipo de resultado negativo falso que a menudo confunde la interpretación de los modelos convencionales de ratonescon algún gen desactivado.

Se han desarrollado varios métodos nuevos para evitar la letalidad embrionaria. Estos métodos se tipifican por unenfoque que utiliza la recombinasa cre y los elementos de reconocimiento de DNA lox. Los elementos de reconoci-miento se insertan en un gen de interés utilizando recombinación homóloga (como se ha descrito arriba) y la expresiónde la recombinasa inducida en ratones adultos posterior al desarrollo. Esto causa la deleción de una porción del gen

28

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

diana y evita complicaciones experimentales. El método es intensivo en mano de obra y adolece de estado quiméricodebido a la inducción no uniforme de la recombinasa.

El uso de ZFPs transformadas por ingeniería genética para manipular la expresión génica puede restringirse a ani-males adultos utilizando los sistemas regulados por moléculas pequeñas descritos en la sección anterior. La expresióny/o función de un represor basados en dedos de cinc puede apagarse durante el desarrollo y encenderse a discreciónen los animales adultos. Este enfoque está basado en la adición del módulo de expresión de la ZFP únicamente; no serequiere recombinación homóloga. Dado que los represores ZFP son trans-dominantes, no existe problema alguno encuanto a la transmisión de la línea germinal u homocigosis. Estos problemas afectan espectacularmente al tiempo yla mano de obra requeridos para pasar de un candidato génico caracterizado deficientemente (un cDNA o clon EST)a un modelo de ratón. Esta posibilidad puede utilizarse para identificar y/o validar rápidamente dianas génicas paraintervención terapéutica, generar nuevos sistemas modelo y permitir el análisis de fenómenos fisiológicos complejos(desarrollo, hematopoyesis, transformación, función neural, etc.). Pueden derivarse ratones direccionados quiméricosde acuerdo con Hogan et al., Manipulating the Mouse Embryo: A Laboratory Manual, (1988); Teratocarcinomas andEmbryonic Stem Cells: A Practical Approach, Robertson, compilador, (1987); y Capecchi et al., Science 244: 1288(1989).

Ejemplos

Los ejemplos siguientes se proporcionan únicamente a modo de ilustración y no tienen carácter limitante. Losexpertos en la técnica reconocerán fácilmente una diversidad de parámetros no críticos que podrían cambiarse o mo-dificarse para producir resultados esencialmente similares.

Ejemplo I

Diseño y ensayo de ZFPs direccionadas al gen VEGF humano

Este primer ejemplo demuestra la construcción de ZFPs de diseño para reconocer secuencias de DNA contenidasen el promotor del gen del factor de crecimiento endotelial vascular (VEGF) humano. VEGF es una glicoproteína deaproximadamente 46 kDa que es un mitógeno específico de las células endoteliales inducido por hipoxia. La VEGF seha visto implicada en la angiogénesis asociada con cáncer, diversas retinopatías, y otras enfermedades graves. El sitiodiana de DNA seleccionado fue una región que rodea el sitio de iniciación de la transcripción del gen. Los dos sitiosde 9 pares de bases (pb) seleccionados se encuentran dentro de la secuencia agcGGGGAGGATcGCGGAGGCTtgg,donde las letras mayúsculas representan dianas reales de 9 pares de bases. La proteína direccionada hacia la diana denueve pares de bases situada aguas arriba se designó VEGF1, y la proteína direccionada a la diana de 9 pares de basessituada aguas abajo se designó VEGF3a. El sitio de comienzo mayor de la transcripción para VEGF se encuentra enla T situada en el extremo 3’ de la primera diana de 9 pares de bases, que está subrayada en la secuencia anterior.

Se utilizó el factor de transcripción de SP-1 humana como molécula progenitora para la construcción de las ZFPsde diseño. SP-1 tiene un dominio de fijación de DNA de tres dedos afín al bien estudiado Zif268 murino (Christy et al.,PNAS 85: 7857-7861 (1988)). Experimentos de mutagénesis orientada que utilizan este dominio han demostrado quelas “reglas de reconocimiento” propuestas que operan en Zif268 pueden utilizarse para adaptar SP-1 a otras secuenciasde DNA diana (Desjarlais y Berg, PNAS 91: 11099-11103 (1994)). La secuencia de SP-1 utilizada para la construcciónde clones con dedos de cinc corresponde a los aminoácidos 533 a 624 en el factor de transcripción de SP-1.

La selección de aminoácidos en las hélices de reconocimiento de las dos ZFPs de diseño, VEGF1 y VEGF3a, seresume en la Tabla 1.

TABLA 1

Aminoácidos seleccionados para las hélices de reconocimiento de ZFPs que reconocen VEGF

Posición: Dedo 1 Dedo 2 Dedo 3

Proteína -1 2 3 6 -1 2 3 6 -1 2 3 6

VEGF1 T S N R R S N R R D H R

VEGF3A Q S D R R S N R R D E R

Las secuencias codificantes para expresar estos péptidos se construyeron utilizando un procedimiento de ensam-blaje basado en PCR que utiliza seis oligonucleótidos solapantes (Figura 1). Tres oligonucleótidos (oligos 1, 3, y 5 enla Figura 1) corresponden a secuencias “universales” que codifican porciones del dominio de fijación de DNA entrelas hélices de reconocimiento. Estos oligonucleótidos se mantienen constantes para cualquier constructo de dedos decinc. Los otros tres oligonucleótidos “específicos” (oligos 2, 4, y 6 en la Figura 1) se diseñaron para codificar las hé-lices de reconocimiento. Estos oligonucleótidos contenían sustituciones en las posiciones -1, 2, 3 y 6 en las hélices de

29

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

reconocimiento para hacerlas específicas para cada uno de los dominios de fijación de DNA diferentes. Se seleccionópreferencia de codones para permitir la expresión tanto en células de mamífero como en E. coli.

La síntesis por PCR se llevó a cabo en dos pasos. En primer lugar, se creó el molde de DNA bicatenario porcombinación de los seis oligonucleótidos (tres universales y tres específicos) y utilización de una reacción PCR decuatro ciclos con un paso de reasociación a temperatura baja (25º). A esta temperatura, los seis oligonucleótidosse unen para formar un “andamiaje” de DNA. Los huecos en el andamiaje se rellenaron con una combinación depolimerasas Taq y Pfu. En la segunda fase de construcción, el molde de dedos de cinc se amplificó en treinta ciclospor medio de iniciadores externos que se diseñaron para incorporar sitios de restricción para clonación en pUC19. Laexactitud de los clones para las ZFPs de VEGF se verificó por secuenciación del DNA. Las secuencias de DNA decada uno de los dos constructos se enumeran a continuación.

La capacidad de las ZFPs de diseño para fijarse a sus sitios diana se comprobó por expresión y purificación de laproteína recombinante de E. coli y realización de ensayos de desplazamiento de movilidad electroforética (EMSAs).La expresión de las ZFPs se llevó a cabo en dos sistemas diferentes. En el primero, los péptidos de fijación de DNAse expresaron en E. coli por inserción de los mismos en el vector pET15b disponible comercialmente (Novagen). Estevector contiene una secuencia promotora T7 que dirige la expresión de la proteína recombinante. Los constructosse introdujeron en células BL21/DE3 de E. coli (lacIq), que contienen una polimerasa T7 inducible por IPTG. Loscultivos se complementaron con ZnCl2 50 µM, se dejaron proliferar a 37ºC hasta una DO a 600 nm de 0,5-0,6, yse indujo la producción de proteína con IPTG durante 2 horas. Se observó la expresión de ZFP a niveles muy altos,aproximadamente 30% de la proteína celular total (Figura 2). Se hace referencia a estas proteínas como ZFPs “sinfusionar”.

Se produjeron ZFPs sin fusionar parcialmente puras como sigue (adaptado de Desjarlais y Berg, Proteins: Struc-ture, Function and Genetics 12: 101-104 (1992)). Se resuspendió un pelet de células congeladas en 1 cincuentavo desu volumen de NaCl 1M, Tris-HCl 25 nM (pH 8,0), ZnCl2 100 µM, y DTT 5 mM. Las muestras se hirvieron durante10 min y se centrifugaron durante 10 min a ∼3.000 x g. En este punto, la proteína ZFP contenida en el sobrenadante

30

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

tenía una pureza >50% como se estimó por tinción de geles de SDS-poliacrilamida con azul Coomassie, y el productomigraba al peso molecular predicho de aproximadamente 11 kDa (Figura 2).

El segundo método de producción de ZFPs consistió en expresarlas como fusiones a la Proteína de Fijación deMaltosa (MBP) de E. coli. Se construyeron fusiones de MBP N-terminales a las ZFPs por amplificación mediantePCR de los clones pET15b e inserción en el vector pMal-c2 bajo el control del promotor Tac (New England BioLabs).La fusión permite la purificación y detección simples de la proteína recombinante. Se había comunicado previamenteque las proteínas de fijación de DNA con dedos de cinc pueden ser expresadas por este vector en forma soluble aniveles altos en E.coli y pueden fijarse eficientemente a la diana de DNA apropiada sin replegado (Liu et al., PNAS 94:5525-5530 (1997)). La producción de proteínas fusionadas a MBP se realizó como se describe por el fabricante (NewEngland BioLabs). Los transformantes se dejaron proliferar en medio LB complementado con glucosa y ampicilina,y se indujeron con IPTG durante 3 horas a 37ºC. Las células se lisaron con una prensa francesa, y se expusieron luegoa una resina de amilosa basada en agarosa, que se fija específicamente al resto de MBP, actuando así como una resinade afinidad para esta proteína. La proteína de fusión con MBP se eluyó con maltosa 10 mM (Figura 2C) para liberarZFP de pureza superior a 50%. En algunos casos, las proteínas se concentraron ulteriormente utilizando una unidadde filtración Centricon 30 (Amicon).

Las ZFPs sin fusionar parcialmente purificadas y las de fusión con MBP se ensayaron por EMSA para evaluarla fijación a sus secuencias de DNA diana. Las concentraciones de proteína en las preparaciones se midieron por elensayo Bradford (BioRad). Dado que los geles de SDS-poliacrilamida demostraron una homogeneidad mayor que50% por cualquier método de purificación, no se hizo ajuste alguno respecto a la pureza de ZFP en los cálculos.Adicionalmente, podían existir cantidades importantes de proteína inactiva en las preparaciones. Por esta razón, losdatos siguientes generados por EMSAs representan una infraestimación de la afinidad verdadera de las proteínas parasus dianas (es decir, sobre-estimación de los valores Kds). Se hicieron dos preparaciones separadas para cada proteínacon objeto de favorecer el control en cuanto a las diferencias en la actividad de ZFP.

Los sitios diana de DNA de VEGF para los experimentos EMSA se generaron por incrustación de los sitiosde fijación de 9 pares de bases en oligonucleótidos dúplex de 29 pares de bases. Las secuencias de la cadena dereconocimiento (“superior”) y sus complementos (“inferior”) utilizadas en los ensayos son como sigue:

Los sitios diana de DNA de VEGF están subrayados. Los tres pares de bases a cada lado del sitio de fijación de9 pb se derivaban también de la secuencia de DNA de VEGF real. La cadena superior de cada sitio diana se marcócon polinucleótido-quinasa y γ-32P dATP. Las cadenas superior e inferior se reasociaron en una reacción que conteníacada oligonucleótido a 0,5 µM, Tris-HCl 10 mM (pH 8,0), EDTA 1 mM, y NaCl 50 mM. La mezcla se calentó a 95ºCdurante 5 min y se enfrió lentamente a 30ºC durante 60 min. La formación de dúplex se confirmó por electroforesisen gel de poliacrilamida. El marcador libre y el ssDNA que quedaban en las preparaciones diana no parecían interferircon las reacciones de fijación.

La fijación de las ZFPs a los oligonucleótidos diana se realizó por titulación de la proteína contra una cantidadfijada de sustrato dúplex. Reacciones de fijación de 20 microlitros contenían 10 femtomoles (0,5 nM) de DNA dianabicatenario marcado en 5’ con 32P, Tris-HCl 35 mM (pH 7,8), KCl 100 mM, MgCl2 1 mM, ditiotreitol 1 mM, glicerolal 10%, 20 µg/ml de poli dI-dC (opcionalmente), 200 µg/ml de seroalbúmina bovina, y ZnCl2 25 µM. Se añadióproteína como un quinto de su volumen a partir de una serie de dilución preparada en NaCl 200 mM, Tris 20 mM (pH7,5), y DTT 1 mM. Se dejó que la fijación progresara durante 30 min a la temperatura ambiente. Se llevó a cabo laelectroforesis en gel de poliacrilamida a 4ºC utilizando geles de Tris-HCl prefundidos a 10% o 10-20% (BioRad) ytampón de desplazamiento estándar de Tris-Glicina que contenía ZnCl2 0,1 mM.

Los resultados de un EMSA típico utilizando una ZFP fusionada a MBP se muestran en la Figura 3. En este caso, seutilizó una serie de dilución al triple de la proteína MBP-VEGF1. El producto desplazado se cuantificó en un equipode producción de imágenes por luminiscencia (Molecular Dynamics) y se representó gráficamente la señal relativa(porcentaje del valor de meseta) frente al log10 de concentración nM de proteína. Se encontró un valor Kd aparente pordeterminación de la concentración de proteína que daba la fijación semi-máxima de MBP-VEGF1 a su sitio diana, queen este experimento era aproximadamente 2 nM.

Las afinidades de fijación determinadas para las proteínas VEGF pueden resumirse como sigue. VEGF1 exhibíala afinidad de fijación de DNA más fuerte; en análisis EMSA múltiples, se determinó que el valor medio aparente deKd era aproximadamente 10 nM cuando se fijaba al sitio 1 de VEGF. VEGF3a se fijaba bien a su sitio diana, perocon un valor Kd aparente mayor que VEGF1; el valor medio de Kd para VEGF3a era aproximadamente 200 nM. En

31

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

ambos casos las versiones fusionada con MBP y no fusionada de las proteínas se fijaban con afinidades similares. Sedeterminaron también los valores Kds en estas condiciones para fusiones con MBP de la Zif268 de tipo salvaje y ZFPsde SP-1, que proporcionaron valores Kds de 60 y 65 nM, respectivamente. Estos resultados son similares a las cons-tantes de fijación consignadas en la bibliografía para Zif268 de aproximadamente 2-30 nM (véase, v.g.,Jamieson et al.,Biochemistry 33: 5689-5695 (1994)). Los valores Kds para las ZFPs de VEGF sintéticas se comparan por consiguientemuy favorablemente con los determinados para estas proteínas de fijación de DNA existentes naturalmente.

En suma, este ejemplo demuestra la generación de dos nuevas proteínas de fijación de DNA dirigidas a dianasespecíficas cerca del comienzo de la transcripción del gen VEGF. Estas proteínas se fijan con afinidades similares alas de factores de transcripción existentes naturalmente que se fijan a sus dianas.

Ejemplo II

Enlace de las ZFPs para fijarse a una diana de 18 pb en el gen VEGF humano

Una consideración importante en el diseño de ZFP es la longitud de la diana de DNA. Para DNA aleatorio, podíaesperarse que una secuencia de n nucleótidos ocurriera una sola vez cada 0,5 x 4n pares de bases. Así pues, losdominios de fijación de DNA diseñados para reconocer solamente 9 pb de DNA podrían encontrar sitios cada 130.000pb y podrían fijarse por consiguiente a localizaciones múltiples en un genoma complejo (del orden de 20.000 sitios enel genoma humano). Se han seleccionado secuencias de fijación a represores supuestos de 9 pb para VEGF en la UTR5’, donde aquéllas podrían interferir directamente con la transcripción. Sin embargo, por si los dominios de dedos decinc que reconocen sitios de 9 pb carecen de la afinidad o especificidad necesaria cuando se expresan en el interiorde las células, se construyó un dominio mayor para reconocer 18 pares de bases por unión de dominios separados detres dedos con una secuencia enlazadora para formar una proteína de seis dedos. Esto debería asegurar que el represorestá direccionado específicamente a la secuencia apropiada, particularmente en condiciones en las cuales se estánproduciendo sólo pequeñas cantidades del represor. Los sitios diana de 9 pb en VEGF se seleccionaron en VEGFde modo que fueran adyacentes unos a otros a fin de que los dedos de cinc pudieran enlazarse para reconocer unasecuencia de 18 pb. Se seleccionó el enlazador DGGGS debido a que el mismo permite la fijación de ZFPs a dos sitiosde 9 pb que están separados por un hueco de un solo nucleótido, como sucede para los sitios VEGF1 y VEGF3a (véasetambién Liu et al., PNAS 5525-5530 (1997)).

La secuencia codificante de la proteína de seis dedos VEGF3a/1 se generó como sigue. Se amplificó VEGF3apor PCR utilizando los iniciadores SPE7 (5’-GAGCAGAATTCGGCAAGAAGAAGCAGCAC) y SPEamp12 (5’-GTGGTCTAGACAGCTCGTCACTTCGC) para generar sitios de restricción EcoRI y XbaI en los extremos (lossitios de restricción están subrayados). Se amplificó VEGF1 por PCR utilizando los iniciadores SPEamp13 (5’-GGAGCCAAGGCTGTGGTAAAGTTTACGG) y SPEamp11 (5’-GGAGAAGCTTGGATCCTCATTATCCC) para ge-nerar sitios de restricción Sty1 y HindIII en los extremos (los sitios de restricción están subrayados). Utilizandooligonucleótidos sintéticos, se ligó la secuencia siguiente entre los sitios XbaI y StyI, donde XbaI y StyI estánsubrayados:

Esto introdujo la secuencia enlazadora DGGGS entre los dos dominios de SP-1. El producto de ligación se reampli-ficó con los iniciadores SPE7 y SPEamp11 y se clonó en pUC19 utilizando los sitios EcoRI y HindIII. Las secuenciasde ZFP enlazadas se amplificaron luego con los iniciadores

para introducir sitios KpnI y BamHI para clonación en el vector de expresión pMAL-c2 modificado como se hadescrito arriba.

32

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

La secuencia de nucleótidos de la ZFP de diseño de seis dedos VEGF3a/1 desde KpnI hasta BamHI es:

La traducción de los aminoácidos de VEGF3a/1 (utilizando el código de una sola letra) es:

La proteína de fijación de 18 pares de bases VEGF3a/1 se expresó en E. coli como una fusión con MBP, se purificópor cromatografía de afinidad, y se ensayó en experimentos EMSA como se describe en el Ejemplo I. Se prepararonlos oligonucleótidos diana como se describe y comprendían las secuencias complementarias siguientes:

Para los estudios EMSA, mezclas de reacción de fijación de 20 µl contenían 10 femtomoles (0,5 nM) de DNAdiana bicatenario marcado en 5’ con 32P, Tris-HCl 35 mM (pH 7,8), KCl 100 mM, MgCl2 1 mM, ditiotreitol 5 mM,10% de glicerol, 20 µg/ml de poli-dI-dC, 200 µg/ml de seroalbúmina bovina, y ZnCl225 µM. Se añadió proteína comoun quinto de volumen a partir de una serie de dilución al triple. Se dejó que transcurriera la fijación durante 60 min ala temperatura ambiente o a 37ºC. Se llevó a cabo electroforesis en gel de poliacrilamida a la temperatura ambiente oa 37ºC utilizando geles Tris-HCl prefundidos al 10% o al 10-20% (BioRad) y tampón de desplazamiento estándar deTris-Glicina. Los ensayos a la temperatura ambiente proporcionaron un valor Kd aparente para esta proteína VEGF3a/1de aproximadamente 1,5 nM. Así pues, la ZFP de fijación de 18 pb se fijaba con afinidad alta a su sitio diana. En unexperimento paralelo, se ensayó la proteína VEGF1 contra su diana utilizando los oligonucleótidos descritos en elEjemplo I, proporcionando un valor Kd aparente de aproximadamente 2,5 nM. Cuando la fijación y la electroforesisse llevaron a cabo a 37ºC, el valor Kd aparente de VEGF3a/1 era aproximadamente 9 nM cuando se ensayó contra ladiana de 18 pb, en comparación con un valor Kd de 40 nM para la VEGF1 ensayada contra su diana. Esto indica quela diferencia en las afinidades de fijación se acentúa a la temperatura más alta.

El valor Kd aparente es una medida útil de la afinidad de una proteína para su diana de DNA. Sin embargo, para unsitio de fijación de DNA in vitro o in vivo, su ocupación está determinada en gran proporción por la tasa de expulsiónde la proteína de fijación de DNA. Este parámetro puede medirse por los experimentos de competición como se

33

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

muestra en la Figura 4. Las condiciones para EMSA fueron como se ha descrito arriba; la fijación y la electroforesisse realizaron a 37ºC. Estos datos indican que la semi-vida del complejo proteína-DNA es más de 10 veces mayor paraVEGF3a/1 que para VEGF1. Así pues, en estas condiciones in vitro, la ocupación del sitio diana es mucho mayor parala proteína de fijación de 18 pb que para la proteína de fijación de 9 pb.

Ejemplo III

Fusión de secuencias ZFP de diseños a dominios funcionales en vectores de expresión de mamífero

Este ejemplo describe el desarrollo de vectores de expresión para producción de ZFPs en células de mamífero, latranslocación de las mismas al núcleo, y la provisión de dominios funcionales que están localizados en la secuenciade DNA diana por la ZFP. Los dominios funcionales empleados son el dominio de represión de la Caja Asociada aKruppel (KRAB) y el dominio de activación VP16 del virus del herpes símplex (HSV-1).

Ciertas proteínas de fijación de DNA contienen dominios separables que funcionan como represores de la trans-cripción. Aproximadamente 20% de las ZFPs contienen un dominio que no se fija a DNA de aproximadamente 90aminoácidos que funciona como un represor de la transcripción (Thiesen, The New Biologist 2: 363-374 (1990); Mar-golin et al., PNAS 91: 4509-4513 (1994); Pengue et al., (1994), supra; Witzgall et al., (1994), supra). Este dominio,designado como el dominio KRAB, es modular y puede unirse a otras proteínas de fijación de DNA para bloquear laexpresión de genes que contienen la secuencia de DNA diana (Margolin et al., (1994); Pengue et al., (1994); Witzgallet al., (1994), supra). El dominio KRAB no tiene efecto alguno por sí mismo; precisa estar ligado a una secuencia deDNA por la vía de una proteína de fijación de DNA para funcionar como represor. Se ha demostrado que el dominioKRAB bloquea la iniciación de la transcripción y puede funcionar a una distancia de hasta al menos 3 kb del sitio decomienzo de la transcripción. El dominio KRAB de la proteína humana KOX-1 (Thiesen, The New Biologist 2: 363-37 (1990)) se utilizó para los estudios descritos en esta memoria. Este dominio de 64 aminoácidos puede fusionarse aZFPs y se ha demostrado que confiere represión en cultivo de células (Liu et al., supra).

La proteína VP16 de HSV-1 ha sido estudiada extensamente, y se ha demostrado que los 78 aminoácidos delterminal C pueden actuar como un dominio de activación trans cuando se fusionan a un dominio de fijación de DNA(Hagmann et al., J. Virology 71: 5952-5962 (1997)). Se ha demostrado también que VP16 funciona a distancia y demodo independiente de la orientación. Para estos estudios, se utilizaron los aminoácidos 413 a 490 en la secuencia dela proteína VP16. El DNA codificante de este dominio se amplificó por PCR a partir del plásmido pMSVP16∆C+119utilizando iniciadores con las secuencias siguientes:

El iniciador de aguas abajo, JVF25, se diseñó de modo que incluyera una secuencia codificante del epítope FLAGaguas abajo.

Se construyeron tres vectores de expresión para estos estudios. El diseño general se resume en la Figura 5. Losvectores se derivan de pcDNA3.1(+) (Invitrogen), y ponen los constructos de ZFP bajo el control del promotor decitomegalovirus (CMV). El vector lleva marcadores de ampicilina y neomicina para selección en cultivo de célulasbacterianas y de mamífero, respectivamente. Se incorporó una secuencia Kozak para iniciación apropiada de la tra-ducción (Kozak, J. Biol. Chem. 266: 19867-19870 (1991)). Para conseguir la localización nuclear de los productos,se añadió la secuencia de localización nuclear (NLS) del antígeno grande T de SV40 (Pro-Lys-Lys-Lys-Arg-Lys-Val)(Kalderon et al., Cell 39: 499-509 (1984)). El sitio de inserción para la secuencia codificante de ZFP está seguido porla secuencia del dominio funcional. Las tres versiones de este vector difieren en el dominio funcional; “pcDNA-NKF”lleva la secuencia del dominio de represión KRAB, “pcDNA-NVF” lleva el dominio de activación de VP16, y “NF-Control” no lleva dominio funcional alguno. Siguiendo al dominio funcional se encuentra la secuencia del epítopeFLAG (Kodak) que permite la detección específica de las ZFPs.

Se construyeron los vectores como sigue. Se construyó el plásmido pcDNA-∆HB por digestión del plásmidopcDNA3.1(+) (Invitrogen) con HindIII y BamHI, relleno de los extremos cohesivos con Klenow, y religación. Estoeliminó los sitios HindIII, KpnI, y BamHI en el polienlazador. El vector pcDNA3.1(+) se describe en el catálogo deInvitrogen. Se generó el plásmido pcDNA-NKF por inserción de un fragmento en los sitios EcoRI/XhoI de pcDNA-∆HB que contenían lo siguiente: 1) un segmento desde EcoRI hasta KpnI que contenía la secuencia Kozak incluyendoel codón de iniciación y la secuencia NLS de SV40, que comprendían en conjunto la secuencia de DNA

34

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

donde los sitios EcoRI y KpnI están subrayados; y 2) un segmento desde KpnI a XhoI que contenía un sitio BamHI,la caja KRAB-A de KOX1 (coordenadas de los aminoácidos 11-53 en Thiesen, 1990, supra), el epítope FLAG (delcatálogo Kodak/IBI), y un sitio HindIII, que comprendían en conjunto la secuencia

donde los sitios KpnI, BamHI y XhoI están subrayados.

El plásmido efector VEGF3a/1-KRAB se generó insertando una casete KpnI-BamHI que contenía las secuenciasde ZFP en pcDNA-NKF digerido con KpnI y BamHI. Los plásmidos efectores VEGF1-KRAB y VEGF3a-KRAB seconstruyeron de una manera similar excepto que las secuencias de ZFP se clonaron primeramente en las secuenciasNLS-KRAB-FLAG en el contexto del plásmido pLitmus 28 (New England BioLabs) y se movieron subsiguiente-mente a los sitios BamHI-XhoI de pcDNA3.1(+) como una casete BglII-XhoI, donde el sitio BglII estaba localizadoinmediatamente aguas arriba del sitio EcoRI (véase el Ejemplo IV para la expresión de estos vectores).

Los plásmidos efectores utilizados en el Ejemplo V se construyeron como sigue. Se construyó el plásmido pcD-NA-NVF por amplificación mediante PCR del dominio de transactivación de VP16, como se ha descrito arriba, einserción del producto en los sitios BamHI/HindIII de pcDNA-NKF, reemplazando la secuencia KRAB. La secuenciadel fragmento insertado, desde BamHI hasta HindIII, era:

Los vectores VEGF1-VP16 y VEGF3a/1-VP16 se construyeron por inserción de una casete KpnI-BamHI quecontenía las secuencias de ZFP en pcDNA-NVF digerido con KpnI y BamHI.

Los plásmidos efectores utilizados en el Ejemplo VI se construyeron como sigue. El plásmido NF-Control segeneró por inserción de la secuencia

en los sitios EcoRI-XhoI de pcDNA-NKF, reemplazando de este modo las secuencias NLS-KRAB-FLAG con NLS-FLAG solamente.

Se construyeron VEGF1-NF y VEGF-3a/1-NF insertando una casete KpnI-BamHI que contenía las secuenciasZFP en NF-Control digerido con KpnI y BamHI. Se construyó CCR5-KRAB de la misma manera que los vectoresVEGF KRAB, excepto que las secuencias ZFP se diseñaron de modo que fueran específicas para un sitio diana deDNA que no está relacionado con las dianas de VEGF.

35

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Finalmente, se construyeron versiones de control de ambos plásmidos de expresión KRAB y VP16. El plásmidoNKF-Control se diseñó de modo que expresara NLS-KRAB-FLAG sin secuencias de proteínas de dedos de cinc; elplásmido NVF-Control se diseñó de modo que expresara NLS-VP16-FLAG sin secuencias ZFP. Estos plásmidos seprepararon por digestión de pcDNA-NKF y -NVF, respectivamente, con BamHI, relleno de los extremos con Klenow,y religación a fin de poner los dominios situados aguas abajo en el marco de lectura apropiado. Estos plásmidos sirvencomo controles rigurosos para estudios de cultivo de células.

Se demostró la expresión en células de mamífero y la localización nuclear de las ZFPs transformadas por ingenieríagenética con VEGF por estudios de inmunofluorescencia. Se transfectaron células 293 (riñón de embrión humano) conel plásmido de expresión que codificaba la quimera NLS-VEGF1-KRAB-FLAG. Se utilizó Lipofectamina como sedescribe más adelante. Después de 24-48 horas, las células se fijaron y se expusieron a un anticuerpo primario contrael epítope FLAG. Se aplicó un anticuerpo secundario marcado con Rojo Texas, y las células se sometieron a contra-tinción con DAPI. Se observó que la tinción con Rojo Texas estaba co-localizaba consistente-mente con la tinciónDAPI, lo que indicaba que la ZFP que era expresada por este plásmido estaba localizada en el núcleo.

Ejemplo IV

Represión de los informadores de VEGF en experimentos de co-transfección

Este ejemplo demuestra el uso de estudios de co-transfección transitoria para medir la actividad de las proteínasrepresoras ZFP en las células. Dichos experimentos implican co-transfección de los plásmidos de expresión ZFP-KRAB (“efectores”) con plásmidos informadores que llevan los sitios diana de VEGF. La eficacia se evalúa por larepresión de la expresión de los genes informadores en presencia del plásmido efector con relación a los controles devector vacío.

El sistema de plásmidos informadores estaba basado en vectores de luciferasa de luciérnaga pGL3 (Promega). Seinsertaron cuatro copias de los sitios diana de VEGF aguas arriba del promotor SV40, que dirige el gen de la luciferasade luciérnaga, en el plásmido pGL3-Control para crear pVFR1-4x. Este plásmido contiene el intensificador de SV40y expresa la luciferasa de luciérnaga a niveles altos en muchos tipos de células. Se realizaron inserciones por ligaciónconjunta de copias en tándem de los dos oligonucleótidos complementarios de 42 pb, JVF9 y JVF10, descritos enel Ejemplo II. Se ligaron luego secuencias adaptadoras, y el ensamblaje se insertó en los sitios MluI/BglII de pGL3-Control. Esto dio como resultado la inserción de la secuencia siguiente entre dichos sitios:

Los seis primeros y los seis últimos nucleótidos que se muestran son los sitios MluI y BglII; las letras minúsculasindican sitios HindIII. Los sitios de fijación para VEGF1 y VEGF3a están subrayados.

La construcción del plásmido efector se ha descrito anteriormente. Los vectores de expresión VEGF1-KRAB,VEGF3a-KRAB, y VEGF3a/1-KRAB se diseñaron para producir una fusión de la secuencia de localización nuclearde SV40, la ZFP de VEGF, el dominio de represión de KRAB, y un marcador del epítope FLAG, todo ello bajo elcontrol del promotor de CMV. El vector de expresión pcDNA3.1 vacío se utilizó como control (pcDNA).

Todos los vectores se prepararon utilizando kits de purificación de DNA Qiagen. La Figura 6 muestra una serietípica de transfecciones utilizando células COS-1 (de riñón de mono verde africano). Se sembraron aproximadamente40.000 células en cada pocillo de una placa de 24 pocillos y se dejó que proliferaran durante una noche en medioEagle Modificado de Dulbecco (D-MEM) que contenía 10% de suero bovino fetal a 37ºC con 5% de CO2. Las célulasse lavaron con PBS y se cubrieron con una capa de 200 µl de D-MEM exento de suero. Se introdujeron plásmidosutilizando Lipofectamina (Gibco-BRL). Cada pocillo se transfectó con aproximadamente 0,3 µg de plásmido efector,0,3 µg de plásmido informador, y 0,01 µg del plásmido pRL-SV40 (Promega) que se había complejado con 6 µl deLipofectamina y 25 µl de D-MEM durante 30 min a 37ºC. Las transfecciones se realizaron por triplicado. Despuésde 3 horas, se añadió a cada pocillo 1 ml de medio que contenía 10% de suero. Las células se recogieron 40-48horas después de la transfección. Se realizaron los ensayos de luciferasa utilizando el Sistema Dual de LuciferasaTM

(Promega). El tercer plásmido transfectado, pRL-SV40, lleva el gen de luciferasa de Renilla y se co-transfectó comoun estándar para eficiencia de transfección. Los datos que se muestran en la Figura 6 son los valores medios de ensayostriplicados normalizados contra la actividad de Renilla.

Para el plásmido informador de control pGL3-Control (pGL3-C), la presencia o ausencia del plásmido de expresiónZFP-KRAB no influye en el nivel de expresión de luciferasa. Sin embargo, para pVFR1-4x, el informador que contienecuatro copias del sitio diana VEGF, la presencia del plásmido de expresión VEGF1 (ZFP de fijación de 9 pares de

36

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

bases) o VEGF3a/1 (ZFP de fijación de 18 pares de bases) reduce la expresión de luciferasa con un factor de 2-3 conrelación al control vector pcDNA vacío. El plásmido de expresión VEGF3a (ZFP de fijación de 9 pb) parece exhibirpoco o ningún efecto. Estos experimentos demuestran claramente que una ZFP de diseño es capaz de funcionar en unacélula para reprimir la transcripción de un gen cuando está presente su sitio diana. Adicionalmente, parece ser que serequiere cierto nivel de afinidad para la función; es decir, VEGF1 y VEGF3a/1, con valores Kds de 10 nM o menos,son funcionales, mientras que VEGF3a, con un valor Kd de 200 nM, no lo es.

Se construyó un segundo plásmido informador, pVFR2-4x, por retirada de las cuatro copias de los sitios dianaVEGF utilizando HindIII e inserción de las mismas en el sitio HindIII de pGL3-Control (en la orientación directa).Esto coloca los sitios diana entre el sitio de comienzo de la transcripción para el promotor SV40 y el codón deiniciación de la traducción del gen de luciferasa. En experimentos de co-transfección similares a los descritos, seobservó una represión de aproximadamente 3-4 veces de la señal de luciferasa con los represores VEGF1-KRAB, oVEGF3a/1-KRAB con relación a los controles de pcDNA (datos no presentados). Esto indica que los represores sonactivos cuando están fijados aguas arriba o aguas abajo del comienzo de la transcripción.

Ejemplo V

Activación de los informadores de VEGF en experimentos de co-transfección

Este ejemplo demuestra el uso de estudios de co-transfección transitoria para medir la actividad de los activadoresde la transcripción de ZFP en células. El montaje experimental es similar al del Ejemplo IV, excepto que se utilizaronun método de transfección diferente, una línea de células diferente, y un conjunto diferente de plásmidos informadoresy efectores.

Para los experimentos de activación, se construyó un informador marcado pVFR3-4x. Este informador contienelas cuatro copias de las dianas de VEGF, con la secuencia que se muestra anteriormente, en los sitios MluI/BglIIdel plásmido pGL3-Promotor (Promega). Este vector ha sido delecionado en la secuencia intensificadora SV40 y porconsiguiente tiene un nivel basal inferior de expresión de la luciferasa de luciérnaga. Se construyó pVFR3-4x porintercambio del fragmento KpnI/NcoI de pVFR1-4x en los sitios KpnI/NcoI de pGL3-Promotor.

La construcción del plásmido efector se ha descrito anteriormente. Se diseñaron los vectores de expresión VEGF1-VP16, VEGF3a-VP16, y VEGF3a/1-VP16 para producir una fusión de la secuencia de localización nuclear de SV40,la ZFP de VEGF, el dominio de trans-activación de VP16, y un marcador epitópico FLAG, todo ello bajo el controldel promotor CMV. Se utilizó como control el vector de expresión pcDNA3 vacío.

Todos los vectores se prepararon utilizando kits de purificación de DNA Qiagen. La Figura 7 muestra una serietípica de transfecciones utilizando células 293 (de riñón de embrión humano). Se sembraron aproximadamente 40.000células en cada pocillo de una placa de 24 pocillos y se dejaron proliferar durante una noche en medio D-MEM quecontenía 10% de suero bovino fetal a 37ºC con 5% de CO2. Las células se lavaron con D-MEM exento de suero y secubrieron con 200 µl del mismo. Se introdujeron los plásmidos utilizando un kit de transfección de fosfato de calcio(Gibco-BRL) de acuerdo con las instrucciones del fabricante. Las células contenidas en cada pocillo se transfectaroncon 1,5 µg de plásmido informador, 1,5 µg de plásmido efector, y 0,5 µg de un plásmido actina/β-gal. Se combinaronlos plásmidos con 15 µl de CaCl2 y se llevaron a 100 µl con dH2O. Se añadieron gota a gota 100 µl de solución HEPESmientras se agitaba enérgicamente. La mezcla se incubó durante 30 min a la temperatura ambiente. Se añadieron luegoal medio contenido en cada pocillo los 200 µl de DNA tratado con fosfato de calcio. Las transfecciones se realizaronpor triplicado. Después de 5 horas, se retiró el medio y se añadió 1 ml de un medio que contenía 10% de suero.Las células se recogieron 40-48 horas después de la transfección. Los ensayos de luciferasa se realizaron utilizandoel sistema Dual-LightTM (Tropix). El tercer plásmido transfectado, actina/β-gal, lleva el gen de β-galactosidasa bajoel control del promotor actina y se sometió a co-transfección como un estándar para eficiencia de transfección. Losensayos de β-galactosidasa se realizaron también de acuerdo con el protocolo del fabricante (Tropix). Los datos que semuestran en la Figura 7 son el valor medio de ensayos triplicados normalizados contra la actividad de β-galactosidasa.

Para el plásmido informador de control, pGL3-Promotor (pGL3-P), la presencia o ausencia del plásmido de ex-presión ZFP-VP16 no influye significativamente en el nivel de expresión de luciferasa. Para pVFR3-4x, el informadorque contiene cuatro copias del sitio diana de VEGF, la presencia de VEGF1 (la ZFP de fijación de 9 pares de bases)exhibe una activación muy ligera con relación al control de vector pcDNA vacío. El plásmido de expresión VEGF3a/1(la ZFP de fijación de 18 pb) activa la expresión de luciferasa muy sustancialmente, exhibiendo aproximadamente unaumento de 14 veces con relación a pcDNA. Estos experimentos demuestran claramente que una ZFP de diseño, cuan-do se fusiona al dominio de activación de VP16, es capaz de funcionar en una célula para activar la transcripción deun gen cuando está presente su sitio diana. Adicionalmente, estos resultados demuestran claramente que una proteínade fijación de 18 pb, VEGF3a/1, es un activador mucho mejor en este ensayo que una proteína VEGF1 de fijación de9 pb. Esto podría ser resultado de la afinidad mejorada o de la tasa de expulsión reducida de la proteína VEGF3a/1.

Se construyó un cuarto plásmido informador de VEGF por clonación del fragmento KpnI/NcoI de pVFR2-4xen pGL3-Promotor para crear el plásmido pVFR4-4x. Se observó activación en las co-transfecciones utilizando esteinformador en combinación con los plásmidos efectores que expresaban las fusiones VEGF1-VP16 y VEGF3a/1-VP16 (datos no presentados). Esto indica que estos trans-activadores artificiales son funcionales cuando se fijan aguasarriba o aguas abajo del comienzo de la transcripción.

37

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Estos datos de co-transfección demuestran que las ZFPs pueden utilizarse para regular la expresión de genesinformadores. Dichos experimentos sirven como una herramienta útil para identificar ZFPs para uso ulterior comomoduladores de la expresión de genes celulares endógenos. Como se muestra más adelante, los resultados de la mo-dulación pueden variar entre los experimentos de co-transfección y los experimentos con genes endógenos, si bien seutiliza el mismo constructo de ZFP.

Ejemplo VI

Represión de un gen VEGF endógeno en células humanas

Este ejemplo demuestra que una ZFP de diseño puede reprimir la expresión de un gen celular endógeno que seencuentra en su contexto y estructura de cromatina naturales. Específicamente, plásmidos efectores que expresabanZFPs de VEGF fusionadas al dominio de represión KRAB se introdujeron en células y se demostró que regulaban ensentido decreciente el gen VEGF.

Se construyeron vectores de expresión eucariotas que fusionan la las ZFPs de VEGF3a/1 y VEGF1 al NLS deSV40 y KRAB, como se ha descrito arriba en el Ejemplo III. Las transfecciones se realizaron utilizando Lipofec-tamina, una preparación de liposomas disponible comercialmente de GIBCO-BRL. Todos los DNAs plasmídicos seprepararon utilizando el sistema de purificación de DNA Qiagen Midi. Se mezclaron 10 µg del plásmido efector con100 µg de Lipofectamina (50 µl) en un volumen total de 1600 µl de Opti-MEM. Se incluyó también en la mezcla deDNA un plásmido pCMVβ-gal (Promega) como un control interno para la eficiencia de transfección. Después de unaincubación de 30 minutos, se añadieron 6,4 ml de DMEM y se estratificó la mezcla sobre 3 x 106 células 293. Despuésde 5 horas, se retiró la mezcla DNA-Lipofectamina, y se estratificó sobre las células medio de cultivo reciente quecontenía 10% de suero de bovino fetal.

Dieciocho horas después de la transfección, las células 293 se indujeron por tratamiento con DFX (desferrioxami-na) 100 µM, dando como resultado una activación rápida y duradera de la transcripción del gen VEGF y también unaumento gradual en la estabilidad del mRNA de VEGF (Ikeda et al., J. Biol. Chem., 270: 19761-19766 (1995)). Encondiciones de cultivo rutinarias, las células 293 secretan un nivel bajo de VEGF en los medios de cultivo. Se dejaronlas células en incubación durante 24 horas más antes de recoger los sobrenadantes para determinación de los nivelesde VEGF por un ensayo ELISA.

En experimentos paralelos que demostraron un nivel de represión similar, se monitorizó la viabilidad de las célulasutilizando el ensayo de proliferación de células Promega Celltiter 96® Aqueous One Solution (Promega). Después detratamiento con Dfx durante 18 horas, se retiraron 500 µl de los 2 ml originales de medio y se analizaron en cuantoa la expresión de VEGF, como se ha descrito arriba. Para evaluación de la viabilidad celular, se añadieron 300 µldel Reactivo Promega Celltiter 96® Aqueous One Solution (Promega) a los 1,5 ml restantes. Se incubaron luego lascélulas a 37ºC durante aproximadamente 2 horas. Se transfirieron 100 µl de cada pocillo a una placa de 96 pocillos yse leyeron en un lector de placas ELISA a DO 490 nm. No se apreció reducción significativa alguna en la viabilidadde las células que expresaban el constructo VEGF3a/1-KRAB con relación a las transfectadas con controles de vectorvacío, lo que indicaba que la represión de VEGF observada no era debida a una muerte celular generalizada.

Se observó una disminución de 40-50 veces en la expresión de VEGF en las células tratadas con DFX transfectadascon VEGF3a/1-KRAB, un vector de expresión que codifica la ZFP de fijación de 18 pb de alta afinidad de VEGF. Seobservó una disminución de dos veces en la expresión cuando las células se transfectaron con VEGF1-KRAB, unvector de expresión que codifica la ZFP de fijación de 9 pb de alta afinidad de VEGF. No se observó disminuciónsignificativa alguna en la expresión de VEGF en las células que se transfectaron con una ZFP distinta de VEGF(CCR5-KRAB) o NKF-Control (Figura 8). Se han obtenido resultados similares en tres experimentos de transfecciónindependientes.

En un experimento separado, se obtuvieron los resultados siguientes (datos no presentados). VEGF1-NF, queexpresa la ZFP de fijación de 9 pb de VEGF1 sin un dominio funcional, no exhibía efecto alguno sobre la expresióndel gen VEGF. Se observó una reducción significativa en la expresión de VEGF con VEGF3a/1-NF, que expresa laproteína de fijación de 18 pb sin un dominio funcional. Este resultado sugiere que la fijación al sitio de comienzo de latranscripción, incluso sin un dominio de represión, interfiere con la transcripción. Aun cuando se fusiona al dominioKRAB, la ZFP de VEGF3a es incapaz de afectar a los niveles de expresión (plásmido VEGF3a-KRAB). Sin embargo,la VEGF1 fusionada a KRAB (VEGF1-KRAB) da como resultado una disminución espectacular de la expresión.VEGF3a/1 fusionada a KRAB (VEGF3a/1-KRAB) impide totalmente la expresión de VEGF.

Estos datos indican que una ZFP de diseño es capaz de localizar y fijarse a su sitio diana en el cromosoma y prevenirla expresión de un gen diana celular endógeno. En particular, los resultados indican que ZFPs con un valor Kd inferiora aproximadamente 25 nM (v.g., VEGF1 tiene un valor Kd medio aparente de aproximadamente 10 nM) proporcionandisminuciones espectaculares de la expresión. Adicionalmente, los datos demuestran que el domino funcional KRABmejora la silenciación génica. Debido a que en este experimento la introducción del represor tiene lugar antes de añadirel inductor de VEGF (DFX), los datos demuestran la capacidad de un represor diseñado para impedir la activaciónde un gen ya en reposo. Adicionalmente, estos resultados demuestran que una ZFP de seis dedos transformada poringeniería genética (VEGF3a/1) con afinidad nanomolar para su diana es capaz de inhibir la respuesta hipóxica delgen VEGF cuando se fija la misma a una diana que está superpuesta al sitio de comienzo de la transcripción.

38

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Ejemplo VII

Activación del gen VEGF endógeno en células humanas

Este ejemplo demuestra que una ZFP de diseño puede activar la expresión de un gen que se encuentra en su contextoy estructura de cromatina naturales. Específicamente, plásmidos efectores que expresaban ZFPs de VEGF fusionadasal dominio de activación de VP16 se introdujeron en células y se demostró que regulaban en sentido creciente el genVEGF.

Se construyeron vectores de expresión eucariotas que fusionan las ZFPs de VEGF3a/1 y VEGF 1 al NLS deSV40 y VP16, como se describe en el Ejemplo III. Las transfecciones se realizaron utilizando Lipofectamina, unapreparación de liposomas disponible comercialmente de GIBCO-BRL. Todos los DNAs plasmídicos se prepararonutilizando el sistema de purificación de DNA Qiagen Midi. Se mezclaron 10 µg del plásmido efector (que contenía laZFP transformada por ingeniería genética) con 100 µg de Lipofectamina (50 µl) en un volumen total de 1600 µl deOpti-MEM. Se incluyó también un plásmido pCMVβ-gal (Promega) en la mezcla de DNA como un control internopara eficiencia de transfección. Después de 30 minutos de incubación, se añadieron 6,4 ml de DMEM y la mezclase estratificó sobre 3 x 106 células 293. Después de 5 horas, se retiró la mezcla DNA-Lipofectamina, y se estratificósobre las células una capa de medio de cultivo reciente que contenía 10% de suero de bovino fetal. Un día después,se añadió medio reciente y se recogió el sobrenadante 24 horas más tarde para determinación de los niveles de VEGFutilizando un kit ELISA disponible comercialmente (R&D Systems).

Para la ZFP de tres dedos específica de VEGF1 (VEGF1-VP16), se observó un aumento de 7 a 10 veces en laexpresión de VEGF cuando se comparó con el plásmido de control (NVF-Control) y células falsamente transfectadas(Figura 9). Se han obtenido resultados similares en 5 experimentos independientes. Es importante observar que elnivel de secreción de VEGF en las células transfectadas con VEGF1-VP16 era equivalente o mayor que el nivel en lascélulas que tratadas con DFX (Figura 9). La introducción de VEGF3a/1-VP16 estimulaba una inducción más modestade VEGF. Este resultado es consistente con el descubrimiento del Ejemplo VI, en el cual la expresión de la proteína defijación de 18 pb sin un dominio funcional impedía la activación en cierto grado. Este resultado sugería que la fuertefijación de esta proteína al sitio de comienzo de la transcripción interfiere con la activación.

Estos datos indican que una ZFP de diseño es capaz de localizar y fijarse a su sitio diana en el cromosoma,presentando un dominio de activación de la transcripción, y mejorando espectacularmente el nivel de expresión dedicho gen. En particular, los resultados indican que ZFPs con un valor Kd menor que aproximadamente 25 nM (v.g.,VEGF1 tiene un valor Kd medio aparente de aproximadamente 10 nM) proporcionan aumentos espectaculares en laexpresión.

Ejemplo VIII

Ensayo de protección contra las RNasas

Para demostrar adicionalmente los resultados de los Ejemplos VI y VII, se realizó un ensayo de protección contralas ribonucleasas (RPA) para correlacionar el nivel incrementado de proteína VEGF con un aumento en los nivelesde mRNA de VEGF (Ejemplo VII), y correlacionar el nivel reducido de proteína VEGF con una disminución en losniveles de mRNA de VEGF (Ejemplo VI).

Se aisló RNA de las células transfectadas utilizando un kit de aislamiento de RNA (Pharmingen). Se prepararonsondas multi-molde radiomarcadas, que incluían una sonda específica de VEGF, por transcripción in vitro y se hibrida-ron durante una noche a 56ºC a 5 µg de cada uno de los RNAs de las células experimentales y transfectadas de control.La mezcla de hibridación se trató con RNasa y las sondas protegidas se purificaron y sometieron a electroforesis engel desnaturalizante de poliacrilamida al 5%, y se evaluó la radiactividad por autorradiografía. Las células 293 trans-fectadas con la VEGF1-VP16 tenían un aumento de 2-4 veces en el nivel de mRNA de VEGF cuando se compararoncon células transfectadas con NVF-Control (Figura 10, panel A; véase el Ejemplo VII para detalles experimentales).El tamaño de la sonda protegida era idéntico al tamaño de la sonda generada a partir del RNA humano de controlproporcionado como control para integridad de RNA. (Figura 10, panel A).

En un experimento separado, se cuantificó también el nivel de mRNA específico de VEGF en células que se habíantransfectado con un plásmido efector VEGF-KRAB (Figura 10, panel B; véase el Ejemplo VI para detalles experi-mentales). Los detalles de la transfección se describen en el Ejemplo VI. Se observó una disminución espectacular enel nivel de mRNA de VEGF cuando las células se transfectaron con el plásmido efector VEGF3a/1-KRAB. No se ob-servó disminución significativa alguna en el mRNA de VEGF cuando las células se transfectaron con NKF-Control ouna ZFP no específica de VEGF (CCR5-5-KRAB y CCR5-3-KRAB, que reconocen sitios diana de CCR5 diferentes).

Este experimento demuestra que el aumento en la proteína VEGF observado después de transfección con el factorde transcripción quimérico VEGF1-VP16 está mediado por un aumento en el nivel de mRNA de VEGF. Análogamen-te, la disminución en la proteína VEGF observada después de transfección con el factor de transcripción quiméricoVEGF3a/1-KRAB está mediada por una disminución en el nivel de mRNA de VEGF.

39

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

Ejemplo XI

Activación de EPO, un gen experimentalmente silencioso

EPO es una hormona glicoproteínica de 30,4 kD y juega un papel fundamental en el control de la producción de losglóbulos rojos de la sangre. El gen EPO se expresa normalmente sólo en hígado fetal, y en el riñón adulto en respuestaa la hipoxia. El mismo actúa por interacción con el receptor de EPO en las células progenitoras eritroides de la médulaósea para estimular su proliferación y diferenciación en eritrocitos maduros (Jelkmann, Physiological Reviews 72: 449(1992); Semenza, Hematology/Oncology Clinics of North America 8: 863 (1994); Ratcliffe et al., J. Exp. Bio. (1991)).Productos recombinantes humanos del gen EPO se han utilizado con éxito para tratar la anemia y la insuficiencia renalcrónica (Egrie, Pharmacotherapy 10: 3S (1990)).

Se diseñó la ZFP EPO2C para reconocer un sitio de fijación de DNA de 9 pb localizado 853 pb aguas arriba delsitio de iniciación de la transcripción de EPO.

La secuencia del sitio de fijación de EPO2C es GCGGTGGCT.

Se construyeron vectores de expresión eucariotas por fusión de la secuencia codificante de ZFP EPO2C con laseñal de localización nuclear de SV40 (NLS) y el dominio de transactivación VP16 de HSV.

Todos los DNAs plasmídicos se prepararon utilizando el sistema de preparación Qiagen Midi.

Se sembraron 2 x 106 células Hep3B (una línea de células derivada de carcinoma hepatocelular humano) o 5 x 106

células HEK293 (una línea de células derivada de epitelio de riñón embrionario) en placas de 6 pocillos un día antes dela transfección. Se transfectaron transitoriamente 500 ng del plásmido efector (que codificaba la ZFP transformada poringeniería genética) en las células utilizando Lipofectamina (GIBCO-BRL). Como controles sirvieron una transfecciónfalsa y una transfección con un vector de expresión vacío. Un día más tarde se retiró el medio de crecimiento, y seañadió DMEM reciente. Los sobrenadantes de cultivo se recogieron 24 horas más tarde para determinación de losniveles de expresión de la proteína EPO utilizando un kit ELISA disponible comercialmente (R&D Systems).

Los resultados que se muestran en la Figura 11a indican que la transfección de un vector codificante de la proteínade transactivación ZFP de EPO2c aumentaba significativamente el nivel de expresión de EPO cuando se comparó conel vector de control (pcDNANVF) o células falsamente transfectadas. Esta activación se observó tanto en las célulasHep3B como en las células HEK293 (Figura 11a).

Se sabe que las células Hep3B son capaces de expresar el gen EPO en ciertas condiciones (Goldberg et al., PNAS84: 7972 (1987)). Estas células se derivan de hepatocitos, la fuente fetal de EPO. En las células Hep3B, la hipoxia (oel tratamiento con CoCl2, que mimetiza la hipoxia) activa la expresión del gen EPO, que en caso contrario permanecesilencioso (véase Figura 11a). La expresión de VEGF está controlada también por hipoxia en las células Hep3B.

La hipoxia o el tratamiento con CoCl2 activan la expresión de VEGF en las células HEK293, demostrando quela respuesta hipóxica funciona normalmente en esta línea de células (véase Figura 8). Sin embargo, la hipoxia o eltratamiento con CoCl2 no es capaz de inducir la expresión de EPO en las células HEK293 (Figura 11a). Este resultadose produce debido a que las células HEK293 se derivan de células epiteliales de riñón embrionario, tejido que no actúacomo fuente de EPO. A pesar de la desactivación de EPO en estas células, la ZFP quimérica EPO2C-VP16 es capazde activar el gen EPO (Figura 11a).

Se demostró que los efectos de CoCl2 y los efectos de ZFP sobre la expresión del gen EPO son efectos sobre latranscripción de EPO. Se realizó una RT-PCR cuantitativa utilizando un método conocido como ensayo TaqMan (PEApplied Biosystems). Los datos se muestran en la Figura 11b.

40

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

REIVINDICACIONES

1. Un método de modulación de la expresión de un gen celular en su contexto normal genómico y de cromatina enuna célula aislada, comprendiendo el método el paso de:

poner en contacto la célula con:

(i) una primera proteína quimérica que comprende un primer dominio de dedos de cinc y un dominio regulador,en donde el dominio de dedos de cinc se ha transformado por ingeniería genética para reconocer un primersitio diana en el gen celular y tiene un valor Kd menor que 25 nM, o

(ii) un ácido nucleico que comprende secuencias codificantes de la primera proteína quimérica enlazada opera-tivamente a un promotor tal que la primera proteína quimérica se expresa en la célula con lo cual la primeraproteína quimérica se pone en contacto con el primer sitio diana, modulando con ello la expresión del gencelular, con la salvedad de que la célula no es una célula madre de embrión humano.

2. Una célula aislada que comprende un gen celular en su contexto normal genómico y de cromatina a la que seha administrado (i) una primera proteína quimérica que comprende un primer dominio de dedos de cinc y un dominioregulador, en la cual el primer dominio de dedos de cinc se ha transformado por ingeniería genética para reconocerun primer sitio diana en el gen celular y tiene un valor Kd menor que 25 nM, o (ii) un ácido nucleico que comprendesecuencias que codifican la primera proteína quimérica enlazada operativamente a un promotor tal que la primeraproteína quimérica se expresa en la célula, con la salvedad de que la célula no es una célula de embrión humano.

3. El método de la reivindicación 1, en donde el paso de puesta en contacto comprende adicionalmente poner encontacto un segundo sitio diana en el gen con una segunda proteína que comprende un dominio de dedos de cinc.

4. El método de la reivindicación 3, en donde los sitios diana primero y segundo son adyacentes.

5. El método de la reivindicación 4, en donde las proteínas primera y segunda están enlazadas covalentemente.

6. El método de la reivindicación 1, en donde la primera proteína es una proteína de fusión que comprende almenos dos dominios reguladores.

7. El método de la reivindicación 3, en donde las proteínas primera y segunda son proteínas de fusión, cada una delas cuales comprende un dominio regulador.

8. El método de la reivindicación 7, en donde las proteínas primera y segunda son proteínas de fusión, cada una delas cuales comprende al menos dos dominios reguladores.

9. El método de una cualquiera de las reivindicaciones anteriores, en donde la célula se selecciona del grupoconstituido por una célula animal, una célula vegetal, una célula bacteriana, una célula de protozoo o una célulafúngica.

10. El método de la reivindicación 9, en donde la célula es una célula de mamífero.

11. El método de la reivindicación 1, en donde la célula es una célula humana.

12. El método o la célula de una cualquiera de las reivindicaciones anteriores, en donde el gen celular endógeno seselecciona del grupo constituido por VEGF, ERα, IGF-I, c-myc, c-myb, ICAM, Her2/Neu, FAD2-1, EPO, GM-CSF,GDNF, LDL-R, GATA, hemoglobina gamma, hemoglobina delta, una interleuquina, eutrofina y MyoD.

13. El método o la célula de la reivindicación 12, en donde el gen celular endógeno es VEGF.

14. El método de la reivindicación 1 o la reivindicación 6 o la reivindicación 7 o la célula de la reivindicación 2,en donde el dominio regulador se selecciona del grupo constituido por un represor de la transcripción, un activador dela transcripción, una endonucleasa, una metil-transferasa, una histona-acetiltransferasa, y una histona-desacetilasa.

15. El método de cualquiera de las reivindicaciones 1 ó 3-14, en donde el método comprende adicionalmente elpaso de administrar en primer lugar a la célula un vehículo de suministro que comprende la proteína, en donde elvehículo de suministro comprende un liposoma o un polipéptido de translocación de membrana.

16. El método de una cualquiera de las reivindicaciones 1 ó 3 a 14, en donde el dominio de dedos de cinc estácodificado por un ácido nucleico enlazado operativamente a un promotor, y en donde el método comprende adicio-nalmente el paso de administrar en primer lugar el ácido nucleico a la célula en un complejo lípido:ácido nucleico ocomo ácido nucleico desnudo.

41

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

17. El método de una cualquiera de las reivindicaciones 1 ó 3 a 14, en donde el dominio de dedos de cinc estácodificado por un vector de expresión que comprende un ácido nucleico con dominios de dedos de cinc enlazadooperativamente a un promotor, y en donde el método comprende adicionalmente el paso de administrar en primerlugar el vector de expresión a la célula.

18. El método de la reivindicación 17, en donde el vector de expresión es un vector de expresión vírico.

19. El método de la reivindicación 17, en donde el vector de expresión es un vector de expresión de retrovirus, unvector de expresión de adenovirus, o un vector de expresión de AAV.

20. El método de una cualquiera de las reivindicaciones 17, 18 ó 19, en donde el dominio de dedos de cinc estácodificado por un ácido nucleico enlazado operativamente a un promotor inducible.

21. El método de una cualquiera de las reivindicaciones 17, 18 ó 19, en donde el dominio de dedos de cinc estácodificado por un ácido nucleico enlazado operativamente a un promotor débil.

22. El método o la célula de una cualquiera de las reivindicaciones anteriores, en donde el sitio diana está situadoaguas arriba de un sitio de iniciación de la transcripción del gen.

23. El método o la célula de una cualquiera de las reivindicaciones anteriores, en donde el sitio diana es adyacentea un sitio de iniciación de la transcripción del gen.

24. El método o la célula de una cualquiera de las reivindicaciones anteriores, en donde el sitio diana es adyacentea un sitio de pausa de RNA-polimerasa situado aguas abajo de un sitio de iniciación de la transcripción del gen.

25. El método o la célula de una cualquiera de las reivindicaciones anteriores, en donde el dominio de dedos decinc comprende una cadena principal de SP-1.

26. El método de la reivindicación 25, en donde el dominio de dedos de cinc comprende un dominio regulador yestá humanizado.

27. El método de cualquiera de las reivindicaciones 1 ó 3-26, en donde la modulación es activación de la expresióngénica.

28. El método de cualquiera de las reivindicaciones 1 ó 3-26, en donde la modulación es inhibición de la expresióngénica.

29. El método de la reivindicación 28, en donde la expresión del gen celular endógeno se inhibe en al menosaproximadamente 75%-100%.

30. El método de la reivindicación 27, en donde la expresión del gen celular endógeno se activa hasta al menosaproximadamente 200-500%.

31. El método de cualquiera de las reivindicaciones 1 ó 3-26, en donde la modulación de la expresión génicaimpide la activación del gen.

32. El método de cualquiera de las reivindicaciones 1 ó 3-26, en donde la modulación de la expresión génicaimpide la represión de la expresión del gen.

33. El método de cualquiera de las reivindicaciones 1 ó 3-26, en donde el gen es experimentalmente silencioso oinactivo.

34. El método de la reivindicación 27, en donde la expresión del gen se activa hasta al menos aproximadamente150%.

35. Una composición terapéutica que comprende una proteína quimérica, en la cual la proteína quimérica com-prende un dominio de dedos de cinc y un dominio regulador, en donde el dominio de dedos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular en sucontexto normal genómico y de cromatina y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

36. Uso de una proteína quimérica que comprende un dominio de dedos de cinc y un dominio regulador parala fabricación de un medicamento para el tratamiento de una afección seleccionada de enfermedad genética, cáncer,infección fúngica, de protozoo o bacteriana, isquemia, enfermedad vascular, artritis o trastornos inmunológicos, endonde el dominio de dedos de cinc

42

5

10

15

20

25

30

35

40

45

50

55

60

65

ES 2 250 103 T3

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

37. El uso de la reivindicación 36, en donde el tratamiento comprende el paso de:

poner en contacto el primer sitio diana en el gen celular con la proteína quimérica, en donde el gen celular seencuentra en su contexto normal genómico y de cromatina.

38. Una composición terapéutica que comprende una molécula de ácido nucleico, en donde la molécula de ácidonucleico comprende una secuencia que codifica una proteína quimérica enlazada operativamente a un promotor, endonde la proteína quimérica comprende un dominio de dedos de cinc y un dominio regulador, en donde el dominio dededos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular en sucontexto normal genómico y de cromatina y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

39. Uso de una molécula de ácido nucleico, que comprende una secuencia que codifica una proteína quiméricaenlazada operativamente a un promotor, para la fabricación de un medicamento para el tratamiento de una afecciónseleccionada de enfermedad genética, cáncer, infección fúngica, de protozoo o bacteriana, isquemia, enfermedad vas-cular, artritis o trastornos inmunológicos, en donde la proteína quimérica comprende un dominio de dedos de cinc yun dominio regulador,

en donde el dominio de dedos de cinc

(i) se ha transformado por ingeniería genética para reconocer un primer sitio diana en un gen celular y

(ii) tiene un valor Kd menor que aproximadamente 25 nM.

40. El uso de acuerdo con la reivindicación 39, en donde el tratamiento comprende el paso de:

administrar la molécula de ácido nucleico a la célula en condiciones tales que la secuencia se expresa y el dominiode dedos de cinc se pone en contacto con el primer sitio diana en el gen celular, en donde el gen celular se encuentraen su contexto normal genómico y de cromatina.

43

ES 2 250 103 T3

44

ES 2 250 103 T3

45

ES 2 250 103 T3

46

ES 2 250 103 T3

47

ES 2 250 103 T3

48

ES 2 250 103 T3

49

ES 2 250 103 T3

50

ES 2 250 103 T3

51

ES 2 250 103 T3

52

ES 2 250 103 T3

53

ES 2 250 103 T3

54