Note: Descriptions are shown in the official language in which they were submitted.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
1
GENE CODANT POUR L'ERBIN, ET UTILISATIONS DIAGNOSTIQUES ET THERAPEUTIQUES
La présente invention a trait à un nouveau gène, qui code pour une
protéine, désignée Erbin, qui interagit avec le récepteur ERBB2/HER-2.
ERBB2/HER-2 est un récepteur à activité tyrosine kinase de la
famille des récepteurs à l'EGF impliqué dans les carcinomes (cancers
épithéliaux) touchant de nombreux organes humains tels que le foie, le rein et
le
sein par exemple (Ross et al, 1999 ; Klapper et al, 2000). Cette implication
est
directement liée à l'activité enzymatique du récepteur (dite tyrosine kinase)
et sa
signalisation intracellulaire, comme de nombreuses études in vitro l'ont
montré.
Le gène erbb2 est amplifié dans environ 30% des cancers du sein et constitue
un
facteur de mauvais pronostic en terme de survie du patient. Le fait que ce
récepteur soit surexprimé sur les cellules tumorales et qu'il présente une
activité
enzymatique exacerbée suscite un vif intérêt en thérapeutique humaine. Deux
approches sont actuellement mises en oeuvre pour cibler ce récepteur et
diminuer son effet tumorigène chez l'homme.
La première consiste à bloquer l'excès de ERBB2/HER-2 et donc la
croissance des tumeurs grâce à une anticorps monoclonal appelé Herceptin~ ou
Trastuzumab~ (commercialisé par GENENTECH) utilisé dans les cancers du
sein. Mais ce médicament n'a été efficace que chez la moitié des femmes qui
l'ont testé. La deuxième approche est l'utilisation d'inhibiteurs de
I°activité
enzymatique du récepteur. Aucun médicament mettant à profit cette approche
n'est mis sur le marché actuellement. II existe donc un besoin de disposer
d'autres moyens susceptibles de moduler l'activité du récepteur et/ou son
expression dans les tumeurs.
Les auteurs de la présente invention sont maintenant parvenus à
identifier de manière précise un nouveau gène qui code pour une protéine qui
se
fixe à la partie intracellulaire du récepteur, constitue un nouvel adaptateur
spécifique de ERBB2, et est impliqué dans sa localisation sub-cellulaire.
Cette
nouvelle protéine a été dénommée Erbin, pour "Erbb2 Interacting protein".
CA 02405124 2002-10-04
WO 01/77323 PCT/FR01/01078
2
En annexe se trouve une liste de séquences, dans laquelle la
séquence SEQ ID n° 1 représente le fragment d'ADNc du gène de l'Erbin
chez
l'homme correspondant au cadre de lecture ouvert (ORF). Cet ORF (nucléotides
324 à 4436 sur SEQ ID n° 1 ) code pour une protéine de 1371 acides
aminés,
dont la séquence est présentée SEQ ID n° 2.
Trois régions sont définies dans la protéine
- région amino-terminale (résidus 1 à 501 ) contenant des motifs
LRR ;
- région carboxy-terminale (résidus 1279 à 1371 ) comprenant le
domaine PDZ ;
- région centrale (résidus 502 à 1278). C'est une région spécifique
de l'Erbin, non conservée dans d'autres protéines, dont la fonction est de
fixer
d'autres protéines, à activité enzymatique (phosphatase, kinase...) ou sans
activité enzymatique, impliquées dans la fonction de l'Erbin ou sa
localisation. Ce
fragment protéique ou les polypeptides comprenant ce fragment font également
partie de l'invention. L'association peut être constitutive ou modulée par une
modification post-traductionnelle de l'Erbin (phosphorylation....). Au regard
de la
séquence primaire de cette région, des domaines SH3 ou W1N de protéines
cytosoliques peuvent se fixer sur les résidus 971 à 977, les résidus 1100 à
1105,
les résidus 1115 à 1121. Ces fragments protéiques ou les peptides ou
polypeptides comprenant ces fragments font également partie de l'invention.
La liste des séquences annexée comprend également un fragment
d'ADNc du gène de l'Erbin chez la souris (SEQ ID n° 3) dont la partie
codante
(nucléotides 1 à 1485 de SEQ ID n° 3) code pour une protéine incomplète
de 495
acides aminés, représentée par SEQ ID n° 4.
Cette séquence peptidique de souris est homologue à la séquence
peptidique de l'Erbin humaine (plus de 80 % d'identité au niveau protéique et
nucléotidique, entre le résidu 914 et le résidu 1371 de la séquence humaine
SEQ
ID n° 2), à l'exception du peptide entre les résidus 296 et 334 de SEQ
ID n° 4
(correspondant aux nucléotides 889 à 1006 sur SEQ ID n° 3), spécifique
de la
séquence de souris. Ces fragments spécifiques murins font également partie de
l'invention.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
3
La séquence SEQ ID n° 5 comprend une séquence partielle
génomique de l'Erbin de souris. Elle contient le premier exon de l'Erbin
(nucléotides 2347 à 2535 sur SEQ ID n° 5, qui présentent une identité
de 94
avec la séquence humaine et codent pour les résidus 1 à 63 de l'Erbin de
souris
sur SEQ ID n° 4, identiques à 100 % à la séquence humaine). L'acide
nucléique
isolé comprenant une séquence comprenant les nucléotides 2347 à 2535 sur
SEQ ID n° 5 fait également partie de l'invention.
La séquence SEQ ID n°6 est une séquence nucléotidique que l'on
retrouve insérée entre les nucléotides 3956 et 3957 de l'Erbin humaine (SEQ ID
n° 1 ), en conservant son cadre de lecture ouverte, chez un variant.
Cette séquence SEQ ID n° 6 code pour le peptide SEQ ID n°
7, qui
s'insère entre les acides aminés 1211 et 1212 de SEQ ID n° 2.
La séquence SEQ ID n° 8 est une sonde en 5' de la séquence
humaine de l'Erbin (nucléotides 74 à 750 de SEQ ID n° 1), tandis que la
séquence
SEQ ID n° 9 est une sonde en 3' (nucléotides 4240 à 4600 de SEQ ID
n° 1 ).
Les séquences SEQ ID n° 10 à SEQ ID n° 20 sont des amorces
utiles
pour amplifier l'ADNc de l'Erbin humaine par PCR, selon le tableau suivant:
SEQ ID n correspondance de nuclotides sur SEQ
ID n 1
136 166
11 174265
12 327 350
13 2788 2809
14 2812 2840
2892 2922
16 2993 3036
17 3199 3230
18 3339 3371
19 4458 4486
4490 4518
La squence SEQ ID n 21 reprsente les neuf derniers
acides
amins carboxy-terminaux
de ERBB2.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
4
La présente invention a donc pour objet un acide nucléique isolé,
comprenant la séquence SEQ ID n° 1, n° 3 ou n° 5. II est
entendu que sont
également comprises les séquences homologues, définies comme
i) des séquences similaires à au moins 70 % de la séquence
SEQ ID n° 1, n° 3 ou n° 5 ; ou
ii) des séquences hybridant avec la séquence SEQ ID n° 1, n° 3
ou n° 5 ou sa séquence complémentaire, dans des conditions stringentes
d'hybridation, ou
iii) des séquences codant pour le polypeptide, dénommé Erbin,
tel que défini précédemment.
De préférence, une séquence nucléotidique homologue selon
l'invention est similaire à au moins 75 % des séquences SEQ ID n°1,
n° 3 ou n°5,
de préférence encore au moins 85 %, ou au moins 90 %.
De manière préférentielle, une telle séquence nucléotidique
homologue hybride spécifiquement aux séquences complémentaires de la
séquence SEQ ID n° 1, n° 3 ou n° 5 dans des conditions
stringentes. Les
paramètres définissant les conditions de stringence dépendent de la
température
à laquelle 50% des brins appariés se séparent (Tm).
Pour les séquences comprenant plus de 30 bases, Tm est définie
par la relation : Tm=81,5+0,41 (%G+C)+16,6Log(concentration en cations) -
0,63(%formamide) -(600/nombre de bases) (Sambrook et al., 1989).
Pour les séquences de longueur inférieure à 30 bases, Tm est
définie par la relation : Tm= 4(G+C) + 2 (A+T).
Dans des conditions de stringence appropriées, auxquelles les
séquences aspécifiques n'hybrident pas, la température d'hybridation peut être
de préférence de 5 à 10°C en dessous de Tm, et les tampons
d'hybridation
utilisés sont de préférence des solutions de force ionique élevée telle qu'une
solution 6xSSC par exemple.
Le terme "séquences similaires" employé plus haut se réfère à la
ressemblance parfaite ou identité entre les nucléotides comparés mais aussi à
la
ressemblance non parfaite que l'on qualifie de similitude. Cette recherche de
similitudes dans les séquences nucléiques distingue par exemple les purines et
les pyrimidines.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
Une séquence nucléotidique homologue à l'ORF représentée à la
SEQ ID n° 1, n° 3 ou n° 5 inclut donc toute séquence
nucléotidique qui diffère de
la séquence SEQ ID n° 1, n° 3 ou n° 5 par mutation,
insertion, délétion ou
substitution d'une ou plusieurs bases, ou par la dégénérescence du code
génétique, pour autant qu'elle code pour un polypeptide présentant l'activité
biologique de l'Erbin, comme définie plus bas.
Parmi de telles séquences homologues, sont comprises les
séquences des gènes de mammifères autres que l'homme, codant pour l'Erbin,
de préférence d'un primate, d'un bovin, ovin ou porc, ou encore d'un rongeur,
ainsi que les variants alléliques.
La présente invention a également pour objet un polypeptide isolé,
dénommé Erbin, comprenant la séquence d'acides aminés SEQ ID n° 2 ou
n° 4.
II est entendu que sont également comprises les séquences homologues,
définies comme
i) les séquences similaires à au moins 70% de la séquence SEQ ID
n°2oun°4;ou
ü) les séquences codées par une séquence d'acide nucléique
homologue telle que définie précédemment c'est-à-dire une séquence d'acide
nucléique hybridant avec la séquence SEQ ID n° 2 ou n° 4 ou sa
séquence
complémentaire, dans des conditions stringentes d'hybridation.
Là encore, le terme "similaires" se réfère à la ressemblance parfaite
ou identité entre les acides aminés comparés mais aussi à la ressemblance non
parfaite que l'on qualifie de similitude. Cette recherche de similitudes dans
une
séquence polypeptidique prend en compte les substitutions conservatives qui
sont des substitutions d'acides aminés de même classe, telles que des
substitutions d'acides aminés aux chaînes latérales non chargées (tels que
l'asparagine, la glutamine, la serine, la thréonine, et la tyrosine), d'acides
aminés
aux chaînes latérales basiques (tels que la lysine, l'arginine, et
l'histidine),
d'acides aminés aux chaînes latérales acides (tels que l'acide aspaitique et
l'acide glutamique) ; d'acides aminés aux chaînes latérales apolaires (tels
que la
glycine, l'alanine, la valine, la leucine, l'isoleucine, la proline, la
phénylalanine, la
méthionine, le tryptophane, et la cystéine).
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
6
Plus généralement, par « séquence d'acides aminés homologue »,
on entend donc toute séquence d'acides aminés qui diffère de la séquence SEQ
ID n° 2 ou n° 4 par substitution, délétion et/ou insertion d'un
acide aminé ou d'un
nombre réduit d'acides aminés, notamment par substitution d'acides aminés
naturels par des acides aminés non naturels ou pseudoacides aminés à des
positions telles que ces modifications ne portent pas significativement
atteinte à
l'activité biologique de l'Erbin.
De préférence, une telle séquence d'acides aminés homologue est
similaire à au moins 85 % de la séquence SEQ ID n° 2 ou n° 4, de
préférence au
moins 95 %.
L'homologie est généralement déterminée en utilisant un logiciel
d'analyse de séquence (par exemple, Sequence Analysis Software Package of
the Genetics Computer Group, University of Wisconsin Biotechnology Center,
1710 University Avenue, Madison, WI 53705). Des séquences d'acides aminés
similaires sont alignées pour obtenir le maximum de degré d'homologie (i.e.
identité ou similitude, comme défini plus haut). A cette fin, il peut être
nécessaire
d'introduire de manière artificielle des espaces (« gaps ») dans la séquence.
Une
fois l'alignement optimal réalisé, le degré d'homologie est établi par
enregistrement de toutes les positions pour lesquelles les acides aminés des
deux séquences comparées sont identiques, par rapport au nombre total de
positions.
"L'activité biologique de l'Erbin" se réfère à sa capacité de fixation
sur la partie intracellulaire du récepteur ERBB2/HER-2 et à sa capacité de
cibler
le récepteur vers l'épithélium basolatéral, où il peut participer à la
transduction de
signaux.
L'invention a également pour objet les variants de l'Erbin, tels que
les deux variants suivants
- variant désigné "1302", comprenant la séquence SEQ ID n° 1
avec une délétion des nucléotides 3957 à 4163, conservant le cadre de lecture
ouverte. La protéine codée par ce variant a pour séquence la séquence SEQ ID
n° 2 délétée des résidus 1212 à 1280. Le polypeptide isolé comprenant
la
séquence des acides aminés 1212 à 1280 de SEQ ID n° 2 fait également
partie
de l'invention.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
7
- variant désigné "1419", comprenant la séquence SEQ ID n° 1
avec une insertion entre les nucléotides 3956 et 3957 de cette séquence du
fragment SEQ ID n° 6, qui code pour le peptide SEQ ID n° 7.
L'ensemble des références à la séquence nucléotidique SEQ ID n°
1 ou à la séquence d'acides aminés SEQ ID n° 2 dans la présente
description
s'étend à ces variants.
L'invention a également pour objet le peptide de séquence SEQ ID
n° 7 et l'acide nucléique qui code pour ce peptide, tel que l'acide
nucléique de
séquence SEQ ID n° 6.
Le polypeptide de la présente invention peut être synthétisé par
toutes les méthodes bien connues de l'homme du métier. Le polypeptide de
l'invention peut par exemple être synthétisé par les techniques de la chimie
de
synthèse, telles que la synthèse de type Merrifield qui est avantageuse pour
des
raisons de pureté, de spécificité antigénique, d'absence de produits
secondaires
non désirés et pour sa facilité de production.
Une protéine recombinante peut également étre produite par un
procédé, dans lequel un vecteur contenant un acide nucléique comprenant la
séquence SEQ ID n° 1 ou n° 3 ou une séquence homologue est
transféré dans
une cellule hôte qui est mise en culture dans des conditions permettant
l'expression du polypeptide correspondant.
La protéine produite peut ensuite être récupérée et purifiée.
Les procédés de purification utilisés sont connus de l'homme du
métier. Le polypeptide recombinant obtenu peut être purifié à partir de lysats
et
extraits cellulaires, du surnageant du milieu de culture, par des méthodes
utilisées individuellement ou en combinaison, telles que le fractionnement,
les
méthodes de chromatographie, les techniques d'immunoaffinité à l'aide
d'anticorps mono- ou polyclonaux spécifiques, etc.
La séquence d'acide nucléique d'intérêt, codant pour l'Erbin, peut
étre insérée dans un vecteur d'expression, dans lequel elle est liée de
manière
opérante à des éléments permettant la régulation de son expression, tels que
notamment des promoteurs, activateurs et/ou terminateurs de transcription.
CA 02405124 2002-10-04
WO 01/77323 PCT1FR01/01078
8
Les signaux contrôlant l'expression des séquences nucléotidiques
(promoteurs, activateurs, séquences de terminaison...) sont choisis en
fonction
de l'hôte cellulaire utilisé. A cet effet, les séquences nucléotidiques selon
l'invention peuvent être insérées dans des vecteurs à réplication autonome au
sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi. De tels
vecteurs
seront préparés selon les méthodes couramment utilisées par l'homme du métier,
et les clones en résultant peuvent être introduits dans un hôte approprié par
des
méthodes standard, telles que par exemple l'électroporation ou la
précipitation au
phosphate de calcium.
Les vecteurs de clonage et/ou d'expression tels que décrits ci-
dessus, contenant une séquence nucléotidique définie selon l'invention font
également partie de la présente invention.
L'invention vise en outre les cellules hôtes transfectées, de manière
transitoire ou stable, par ces vecteurs d'expression. Ces cellules peuvent
étre
obtenues par l'introduction dans des cellules hôtes, procaryotes ou
eucaryotes,
d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus,
puis la mise en culture desdites cellules dans des conditions permettant la
réplication et/ou l'expression de la séquence nucléotidique transfectée.
Des exemples de cellules hôtes incluent notamment des cellules de
mammifères, telles que les cellules COS-7, 293, MDCK, des cellules d'insectes
telles que les cellules SF9, des bactéries telles que E. coli et des souches
de
levures telles que L40 et Y90.
Les séquences nucléotidiques de l'invention peuvent étre d'origine
artificielle ou non. II peut s'agir de séquences d'ADN ou d'ARN, obtenues par
criblage de banques de séquences au moyen de sondes élaborées sur la base
de la séquence SEQ ID n° 1, n° 3, n° 5 ou 6. De telles
banques peuvent étre
préparées par des techniques classiques de biologie moléculaire, connues de
l'homme de l'art.
La séquence nucléotidique selon l'invention peuvent également être
préparées par synthèse chimique, ou encore par des méthodes mixtes incluant la
modification chimique ou enzymatique de séquences obtenues par criblage des
banques.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
9
La séquence nucléotidique de l'invention permet la réalisation de
sondes ou amorces, hybridant spécifiquement avec la séquence SEQ ID n°
1, n°
3, n° 5 ou 6 selon l'invention, ou son brin complémentaire. Les
conditions
d'hybridation appropriées correspondent aux conditions de température et de
force ionique usuellement utilisées par l'homme du métier, de préférence dans
des conditions stringentes telles que définies précédemment. Ces sondes
peuvent étre utilisées comme outil de diagnostic in vitro pour la détection,
par des
expériences d'hybridation, notamment d'hybridation "in situ", de transcrits
spécifiques du polypeptide de l'invention dans des échantillons biologiques ou
pour la mise en évidence de synthèses aberrantes ou d'anomalies génétiques
résultant d'un polymorphisme, de mutations ou d'un mauvais épissage.
Les acides nucléiques de l'invention utiles comme sondes
comportent au minimum 15 nucléotides, préférentiellement au moins 20
nucléotides, préférentiellement encore au moins 100 nucléotides.
Les acides nucléiques utiles comme amorces comportent au
minimum 15 nucléotides, de préférence au moins 18 nucléotides, et
préférentiellement moins de 40 nucléotides.
Plus précisément, la présente invention a pour objet un acide
nucléique ayant au moins 15 nucléotides, qui hybride spécifiquement avec l'une
des séquences d'acide nucléique SEQ ID n° 1 ou son complémentaire, dans
des
conditions stringentes d'hybridation.
On peut par exemple utiliser comme sonde les acides nucléiques
constitués des séquences SEQ ID n° 8 ou SEQ ID n° 9.
On peut également utiliser comme sondes les fragments d'acide
nucléique allant des nucléotides 1 à 750 de SEQ ID n° 1 et les
fragments d'acide
nucléique allant des nucléotides 4240 à 6412 de SEQ ID n° 1.
On peut par ailleurs utiliser comme amorce, pour une amplification
(par exemple par PCR), les acides nucléiques constitués des séquences SEQ ID
n°10àSEQIDn°20.
Préférentiellement, les sondes ou amorces de l'invention sont
marquées, préalablement à leur utilisation. Pour cela, plusieurs techniques
sont à
la portée de l'homme du métier comme par exemple le marquage fluorescent,
radioactif, chimioluminescent ou enzymatique.
CA 02405124 2002-10-04
WO 01/77323 PCT/FROI/01078
Les méthodes de diagnostic in vitro dans lesquelles ces
oligonucléotides sont mis en oeuvre pour la détection de mutations ou de
remaniements génomiques, au niveau du gène de l'Erbin, sont incluses dans la
présente invention.
L'homme du métier connaît bien les méthodes standard pour
analyser l'ADN contenu dans un échantillon biologique et pour diagnostiquer un
désordre génétique. De nombreuses stratégies d'analyse génotypique sont
disponibles (Antonarakis et al., 1989 ; Cooper et al., 1991 ).
De préférence, on peut utiliser la méthode DGGE (Electrophorèse
sur gel de gradient dénaturant), la méthode SSCP (Polymorphisme de
conformation simple brin) ou la méthode DHPLC (Chromatographie liquide haute
performance dénaturante ; Kuklin et al., 1997 ; Huber et al., 1995) pour
détecter
une anomalie dans le gène de l'Erbin. De telles méthodes sont de préférence
suivies par un séquençage direct. Le procédé de RT-PCR peut étre
avantageusement mis en oeuvre pour détecter des anomalies dans le transcript
de l'Erbin, car il permet de visualiser les conséquences d'une mutation
d'épissage provoquant la perte d'un ou plusieurs exons au niveau du transcrit,
ou
un épissage aberrant dû à l'activation d'un site cryptique. Ce procédé est
également de préférence suivi d'un séquençage direct. Les procédés plus
récemment développés utilisant des puces à ADN peuvent également étre mis en
oeuvre pour détecter une anomalie dans le gène de l'Erbin (Bellis et al.,
1997).
Le clonage du gène de l'Erbin ainsi que l'identification de diverses
mutations responsables du développement de tumeurs permettent d'envisager
des diagnostics directs. La présente invention a donc pour objet l'utilisation
d'au
moins un acide nucléique tel que défini précédemment, pour la détection d'une
anomalie dans le gène de l'Erbin, défini comme comprenant une séquence
d'acide nucléique SEQ ID n° 1, n° 3, n° 5 ou n° 6
dans son transcrit.
L'invention a, par suite, pour objet un procédé de diagnostic in vitro
d'une tumeur ou d'une prédisposition à développer une tumeur, comprenant les
étapes consistant à
- mettre en présence un échantillon biologique contenant de l'ADN
ou de l'ARN avec des oligonucléotides spécifiques permettant l'amplification
de
CA 02405124 2002-10-04
WO 01/77323 PCT/FROI/01078
11
tout ou partie du gène de l'Erbin ou de son transcrit, défini comme comprenant
une séquence SEQ ID n° 1, n° 3, n° 5 ou n° 6 ;
- amplifier ledit ADN ou ARN ;
- détecter les produits d'amplification ;
- comparer les produits d'amplification obtenus à ceux obtenus avec
un échantillon contrôle, et détecter de cette manière une éventuelle anomalie
dans ledit gène de l'Erbin ou dans son transcrit, indicatrice d'une
prédisposition à
développer une tumeur.
L'échantillon biologique en question peut notamment être du sang,
ou un fragment tissulaire prélevé chez un patient.
L'expression de l'Erbin étant retrouvée sur des cellules
cancéreuses, les méthodes d'évaluation de l'expression de cette protéine à
partir
de prélèvements de tissus suspects chez des patients sont également
particulièrement avantageuses dans des tests diagnostiques, en
anatomopathologie.
Ces méthodes peuvent viser à détecter l'ARNm codant pour l'Erbin
ou la protéine Erbin elle-même.
Selon le premier mode de réalisation, l'invention concerne une
méthode de diagnostic in vitro d'une tumeur ou d'une prédisposition à
développer
une tumeur, comprenant les étapes consistant à
- mettre en présence un échantillon biologique contenant de
l'ARNm obtenu à partir d'un prélèvement de cellules suspectes chez un patient,
avec des oligonucléotides spécifiques permettant l'amplification de tout ou
partie
du transcrit du gène de l'Erbin, défini comme comprenant une séquence SEQ ID
n°1,n°3,n°5oun°6;
- amplifier ledit transcrit ;
- détecter et quantifier les produits d'amplification ;
une modification du taux de transcrit de l'Erbin par rapport au
contrôle normal étant indicatrice d'une tumeur ou d'une prédisposition à
développer une tumeur.
Selon un deuxième mode de réalisation, l'invention concerne une
méthode in vitro pour la détection ou la mesure du taux d'expression de
l'Erbin
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
12
dans un prélèvement biologique, comprenant la mise en contact d'au moins un
anticorps dirigé contre l'Erbin avec ledit prélèvement biologique dans des
conditions permettant la formation éventuelle de complexes immunologiques
spécifiques entre l'Erbin et le ou lesdits anticorps et la détection des
complexes
immunologiques spécifiques éventuellement formés.
L'invention concerne plus particulièrement la mise en oeuvre de la
méthode ci-dessus pour le diagnostic in vitro d'une tumeur ou d'une
prédisposition à développer une tumeur sur un échantillon biologique obtenu à
partir d'un prélèvement de cellules suspectes chez un patient.
La présence de la protéine Erbin ou du gène transcrit du gène en
quantités différentes de la normale peut étre correlée à un pronostic plus ou
moins grave, en terme d'agressivité de la tumeur par exemple.
L'invention a également pour objet des anticorps dirigés contre le
polypeptide Erbin tel que défini précédemment, ou contre les fragments
spécifiques de celle-ci, tels que le fragment défini entre les résidus 502 à
1278 de
la séquence SEQ ID n° 2, ou de manière avantageuse contre le fragment
défini
entre les résidus 914 et 1371 de la séquence SEQ ID n° 2.
II peut s'agir d'anticorps poly- ou monoclonaux ou de leurs
fragments, d'anticorps chimériques, notamment humanisés ou
immunoconjugués.
Les anticorps polyclonaux peuvent étre obtenus à partir du sérum
d'un animal immunisé contre un polypeptide selon les modes opératoires usuels.
Selon un mode de réalisation de l'invention, on peut utiliser comme
antigène un fragment peptidique approprié, tel que défini plus haut, pouvant
étre
couplé par l'intermédiaire d'un résidu réactif à une protéine ou un autre
peptide.
Des lapins sont immunisés avec l'équivalent de 1 mg de l'antigène peptidique
selon la procédure décrite par Benoit et al. (1982). A des intervalles de
quatre
semaines, les animaux sont traités par des injections de 200 Ng d'antigène et
saignés 10 à 14 jours plus tard. Après la troisième injection, l'anti-sérum
est
examiné pour déterminer sa capacité à se lier au peptide antigène radiomarqué
à
l'iode, préparé par la méthode chloramine-T et est ensuite purifié par une
chromatographie sur colonne échangeuse d'ion carboxyméthyl cellulose (CMC).
Les molécules d'anticorps sont ensuite recueillies dans les mammifères et
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
13
isolées jusqu'à la concentration souhaitée par les méthodes bien connues de
l'homme de l'art, par exemple, en utilisant DEAE Sephadex pour obtenir la
fraction IgG.
Afin d'augmenter la spécificité du sérum polyclonal, les anticorps
peuvent étre purifiés par une chromatographie d'immuno-affinité en utilisant
des
polypeptides immunisant en phase solide. L'anticorps est mis en contact avec
le
polypeptide immunisant en phase solide pendant une durée suffisante de façon à
faire immuno-réagir le polypeptide avec la molécule d'anticorps afin de former
un
complexe immunologique en phase solide.
Les anticorps monoclonaux peuvent étre obtenus selon la méthode
classique de culture d'hybridomes décrite par Kdhler et Milstein (1975).
Les anticorps ou fragments d'anticorps de l'invention peuvent être
par exemple des anticorps chimériques, des anticorps humanisés, des
fragments Fab et F(ab')2. Ils peuvent également se présenter sous forme
d'immunoconjugués ou d'anticorps marqués.
Les anticorps de l'invention, en particulier les anticorps
monoclonaux, peuvent notamment étre utilisés pour l'analyse par
immunohistochimie de l'Erbin sur des coupes de tissus spécifiques, par exemple
par immunofluorescence, marquage à l'or, immunoperoxydase...
Les anticorps ainsi produits peuvent être avantageusement mis en
oeuvre dans toute situation où l'expression de l'Erbin doit être observée.
L'invention a plus généralement pour objet l'utilisation d'au moins un
anticorps ainsi produit pour la détection ou la purification d'un polypeptide
tel que
défini précédemment dans un échantillon biologique.
L'invention a également pour objet un kit pour la mise en oeuvre de
cette méthode comprenant
au moins un anticorps spécifique de l'Erbin, éventuellement fixé
sur un support ;
- des moyens de révélation de la formation de complexes
antigènes/anticorps spécifiques entre l'Erbin et ledit anticorps et/ou des
moyens
de quantification de ces complexes.
L'invention a également pour objet un procédé d'obtention d'animal
non humain transgénique, de préférence une souris, dans lequel on invalide le
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
14
gène de l'Erbin. L'animal susceptible d'étre obtenu par ce procédé fait
également
partie de l'invention. Un tel animal, désigné "knock-out" pour ce gène, est un
modèle utile pour étudier la susceptibilité à développer des tumeurs candidats
pour supprimer des tumeurs, ou au contraire évaluer la cytotoxicité de
certaines
molécules.
Le polypeptide de l'invention ou l'acide nucléique codant pour ce
polypeptide sont utiles à titre de médicament, notamment pour le traitement
des
tumeurs, dans lesquelles on observe par exemple l'expression d'une Erbin
modifiée, et pour le traitement desquelles on cherche à restaurer l'activité
de
l'Erbin sauvage. il peut s'agir de tout type de tumeur, dont les carcinomes
mais
aussi les tumeurs touchant le cerveau.
L'invention a également pour objet une composition
pharmaceutique comprenant un polypeptide tel que défini précédemment ou un
acide nucléique codant pour ledit polypeptide, en association avec un véhicule
pharmaceutiquement acceptable.
Les modes d'administration, les posologies et les formes
galéniques des compositions pharmaceutiques selon l'invention, contenant au
moins un polypeptide, peuvent être déterminées de manière usuelle par l'homme
du métier, notamment selon les critères généralement pris en compte pour
l'établissement d'un traitement thérapeutique adapté à un patient, comme par
exemple l'âge ou le poids corporel du patient, la gravité de son état général,
la
tolérance au traitement, et les effets secondaires constatés, etc.
De manière générale, une quantité thérapeutiquement ou
prophylactiquement efficace variant d'environ 0,1 pg à environ 1 mg peut être
administrée à des adultes humains.
L'invention a également pour objet une composition
pharmaceutique comprenant un acide nucléique tel que défini précédemment,
codant pour l'Erbin et un véhicule pharmaceutiquement acceptable, ladite
composition étant destinée à être utilisée en thérapie génique. L'acide
nucléique
de préférence inséré dans un vecteur généralement viral (tels que les
adénovirus
et les rétrovirus) peut être administré sous forme nue, exempt de tout
véhicule
favorisant le transfert à la cellule cible, tels que des liposomes anioniques,
des
lipides cationiques, des microparticules, par exemple des microparticules
d'or,
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
des agents de précipitation, par exemple du phosphate de calcium, ou tout
autre
agent facilitant la transfection. Dans ce cas, le polynucléotide peut être
simplement dilué dans une solution physiologiquement acceptable, telle qu'une
solution stérile ou une solution stérile tampon, en présence ou en l'absence
d'un
véhicule.
De manière alternative, un acide nucléique de l'invention peut être
associé à des agents qui facilitent la transfection. II peut être, entre
autres, (i)
associé à un agent chimique qui modifie la perméabilité cellulaire tel que la
bupivaca~ine ; (ü) encapsulé dans des liposomes, éventuellement en présence de
substances supplémentaires facilitant la transfection ; ou (iii) associé à des
lipides cationiques ou des microparticules de silice, d'or ou de tungstène.
Lorsque les constructions d'acide nucléique de l'invention
recouvrent des microparticules, celles-ci peuvent être injectées par voie
intradermique ou intraépidermique par la technique du canon à gènes, "gene
gun" (W0 94/24263).
La quantité à utiliser comme médicament dépend notamment de la
construction d'acide nucléique elle-même, de l'individu auquel cet acide
nucléique est administré, du mode d'administration et du type de formulation,
et
de la pathologie. De manière générale, une quantité thérapeutiquement ou
prophylactiquement efficace variant d'environ 0,1 Ng à environ 1 mg, de
préférence d'environ 1 Ng à environ 800 Ng et, de manière préférentielle
d'environ
pg à environ 250 pg, peut être administrée à des adultes humains.
Les constructions d'acides nucléiques de l'invention peuvent être
administrées par toute voie d'administration conventionnelle telle que
notamment
par voie parentérale. Le choix de la voie d'administration dépend en
particulier de
la formulation choisie. Une administration ciblée au site des tumeurs visées
peut
être particulièrement avantageuse.
L'invention a donc enfin pour objet une méthode de traitement
thérapeutique, dans laquelle on administre à un patient nécessitant un tel
traitement, une quantité efficace d'un polypeptide Erbin tel que défini
précédemment ou un acide nucléique codant pour ce polypeptide, dans le cadre
d'une thérapie génique.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
16
Le patient visé est généralement un être humain, mais l'application
peut également être étendue à tout mammifère le cas échéant.
Un autre aspect de l'invention concerne les tumeurs cancéreuses
dans lesquelles le récepteur ERBB2/HER-2 est impliqué, une surexpression de
ce récepteur étant dans ces cas souvent observée. Parmi ces tumeurs, on peut
citer plus particulièrement les carcinomes (cancers épithéliaux) touchant par
exemple le foie, le rein, le sein ou le colon.
Une stratégie peut être alors d'inhiber l'interaction entre l'Erbin et le
récepteur pour le délocaliser.
Une autre stratégie consiste à bloquer l'expression de l'Erbin native,
par exemple au moyen d'oligonucléotides anti-sens empêchant la transcription
de
l'ARN nu du gène de l'Erbin.
L'invention a donc en outre pour objet une méthode de criblage de
telles molécules inhibant la liaison entre l'Erbin et le récepteur ERBB2,
cette
méthode comprenant la mise en contact d'une molécule à tester avec
(i) un premier partenaire de liaison qui est le récepteur
ERBB2/HER-2 ou un fragment de celui-ci qui se fixe à l'Erbin, et
(ü) un deuxième partenaire de liaison qui est l'Erbin ou un fragment
de celle-ci qui se fixe au récepteur,
le(s)dit(s) premier et/ou deuxième partenaires) de liaison étant
marqués) de manière à être détectés,
et l'évaluation de l'inhibition de l'interaction entre lesdits partenaires
de liaison par la molécule à tester.
Pour mettre en oeuvre ces tests de liaison compétitifs, par exemple
du type ELISA ou IRMA, on peut donc utiliser un fragment du récepteur
ERBB2/HER-2 qui se fixe à l'Erbin. Ce fragment comprend au minimum les neuf
derniers acides aminés C-terminaux du récepteur, à savoir la séquence
EYLGLDVPV représentée par SEQ ID n° 21. D'autre part, on peut utiliser
l'Erbin
recombinante ou un fragment de celle-ci, qui se fixe au récepteur, à savoir un
fragment qui comprend le domaine PDZ de l'Erbin.
L'un ou l'autre de ces partenaires de liaison est marqué de manière
détectable, les moyens de marquage des protéines étant bien connus de
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
17
l'homme du métier. II peut s'agir d'un agent de marquage fluorescent qui se
lie
chimiquement aux protéines sans dénaturation pour former un fluorochrome
colorant qui est un indicateur immunofluorescent utile. L'agent de marquage
peut
aussi être une enzyme, telle que la peroxydase (HRP) ou la glucose oxydase.
Des éléments radioactifs peuvent être également utilisés comme agents de
marquage.
De manière préférentielle, on utilise une protéine (de préférence,
l'Erbin) fusionnée ou couplée à une protéine de type biotine, glutathion-S-
transferase, poly-histidine....
L'un ou l'autre des partenaires de liaison (de préférence, le
récepteur) peut être immobilisé de manière avantageuse sur une phase solide
(membrane, billes, plastique...).
L'interaction entre les partenaires de liaison est donc ainsi mise en
évidence par un test enzymatique, de fluorescence, ou par autoradiographie,
...
Les molécules présentant une activité inhibitrice sélectionnées par
cette méthode peuvent ensuite être soumises à un test de précipitation du
récepteur ERBB2/HER-2 produit dans des cellules de mammifères. Le récepteur
est précipité à partir d'un lysat cellulaire grâce à la protéine recombinante
comprenant le domaine PDZ de l'Erbin et révélé par Western Blot ou par toute
autre méthode suffisamment sensible.
Les molécules dont l'activité inhibitrice de l'interaction Erbin-
récepteur est confirmée sont retenues pour être testées sur des cellules
épithéliales polarisées, afin d'évaluer leur capacité à induire une
délocalisation du
récepteur.
Alternativement, un test triple-hybride dans la levure peut être mis
en oeuvre à cette fin (Zhang J. et al, 1996).
Les molécules ainsi criblées représentent d'excellents candidats
dans une stratégie de thérapie anticancéreuse consistant à inhiber
l'interaction
entre Erbin et ERBB2 dans les cellules tumorales, afin de délocaliser le
récepteur
et le rendre inactif.
A l'inverse, il peut être avantageux, dans le cas où un individu
exprime une protéine Erbin altérée ou un récepteur ERBB2 muté, tels que
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
18
l'interaction Erbin-récepteur est diminuée par rapport à un contrôle normal,
de
rechercher des activateurs de cette interaction.
A cette fin, est proposée une méthode de criblage de molécules
activant la liaison entre l'Erbin et le récepteur ERBB2, qui peut étre
aisément
mise en oeuvre sur le modèle de la méthode de criblage d'inhibiteurs décrite
plus
haut ou par la technique du triple hybride.
L'invention a également pour objet un procédé d'identification des
mutants de l'Erbin qui augmentent ou diminuent l'interaction entre cette
protéine
et ERBB2, dans lequel on effectue une mutation sur l'Erbin et on évalue
l'effet de
cette mutation sur l'interaction de celle-ci avec le récepteur ERBB2.
La mutagénèse peut étre ciblée ou réalisée au hasard selon les
techniques connues de l'homme du métier. L'évaluation de l'effet de la
mutation
peut étre réalisée par un test de précipitation de ERBB2 ou de double hybride
tel
que décrit dans les exemples, ou encore au moyen d'une banque d'expression.
Dans cette dernière technique, le domaine PDZ muté est exprimé
au moyen de phages ou de bactéries étalés sur des boîtes de culture. Après
transfert des protéines produites sur membrane de type nitrocellulose, le
peptide
de ERBB2 marqué par radioactivité, biotinylation ou autre méthode est incubé
avec la membrane. Les mutants qui abolissent l'interaction et ne fixent plus
le
peptide sont prélevés et la séquence nucléotidique est analysée pour connaître
la
mutation introduite.
L'invention a également pour objet les mutants de l'Erbin, qui
augmentent ou diminuent l'interaction entre le domaine PDZ de cette protéine
et
ERBB2.
La mutation de l'histidine (position 1347) en leucine (mutant HL) ou
la mutation des résidus leucine (position 1291 ) en méthionine et de la
phénylalanine (position 1293) en isoleucine (mutant MI) provoquent en
particulier
une augmentation de l'interaction entre le domaine PDZ d'ERBIN et ERBB2.
La mutation de l'histidine (position 1347) en tyrosine et de la glycine
(position 1348) en acide aspaitique (mutant YD) ou la mutation de la thréonine
(position 1316) en asparagine et de l'arginine (position 1317) en sérine
(mutant
NS) provoquent par contre une diminution de l'interaction entre le domaine PDZ
d'ERBIN et ERBB2.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
19
L'invention a également pour objet un procédé d'identification de
mutants du récepteur ERBB2, qui inhibent ou qui augmentent l'interaction avec
l'Erbin, dans lequel on effectue une mutation du récepteur ERBB2 et on évalue
l'effet de cette mutation sur l'interaction de ce récepteur avec l'Erbin. La
séquence du récepteur ERBB2 humain est accessible par exemple sur la base
de données EMBL (numéro d'accès X03363).
Un test double hybride dans la levure peut être particulièrement
approprié à cette fin.
Des mutations ont ainsi été introduites dans les 9 derniers acides
aminés carboxy-terminaux de ERBB2 (peptide EYLGLDVPV) (SEQ ID n° 21 ).
Le
changement de l'un des acides aminés soulignés dans le peptide, par exemple,
en alanine, inhibe l'interaction avec le domaine PDZ de ERBIN.
Les mutants de ERBB2 susceptibles d'étre identifiés par ce procédé
font également partie de l'invention.
Les auteurs de la présente invention ont plus particulièrement
déterminé que les mutants de ERBB2 mutés sur les positions 5 (L) et 6 (D) de
SEQ ID n° 21 sont incapables de lier l'Erbin, mais restent capables
de lier
d'autres domaines PDZ d'autres protéines, telles que PICK1.
Ces mutants sont en particulier utiles pour discriminer des
molécules inhibitrices de l'interaction du domaine PDZ de l'Erbin dans des
procédés de criblage.
Ces mutants de l'Erbin ou du récepteur ERBB2 peuvent être utilisés
dans des tests de criblage d'autres composés inhibant ou activant
l'interaction
entre l'Erbin et le récepteur ERBB2. Ils peuvent également étre mis à profit
dans
le cadre d'une thérapie, par administration de ces formes mutées ou des acides
nucléiques codant pour ces formes mutées.
En particulier, les formes activatrices de l'interaction Erbin-ERBB2
peuvent étre mises à profit comme médicament utile chez un individu qui
exprime
une protéine Erbin altérée ou un récepteur ERBB2 muté, et chez lequel
l'interaction Erbin-récepteur est diminuée par rapport à un contrôle normal.
A l'inverse, les formes inhibitrices de l'interaction Erbin-ERBB2
peuvent être utiles comme médicament dans le cas par exemple d'une
surexpression du récepteur.
CA 02405124 2002-10-04
WO 01/77323 PCT/FROl/01078
LEGENDE DES FIGURES
- La figure 1 représente un Western Blot montrant l'interaction
spécifique du domaine PDZ de l'Erbin avec ERBB2 mais pas avec EGF-R. Les
protéines liées transférées sur nitrocellulose ont été révélées par des
anticorps
anti-ERBB2 et anti-EGF-R. Un dixième du lysat a été déposé sur le gel (lysat
total TL). La GST seule ou le domaine GST-X11 a PDZ (X11 ) ont été utilisés
comme contrôle. Les polypeptides GST-Erbin utilisés sont : GST-Erbin (914-
1371 ) piste 1, GST-Erbin (914-1240) piste 2 et domaine PDZ de la GST-Erbin
piste 3.
- La fi u~ représente un transfert sur une membrane de
nitrocellulose d'un gel SDS-PAGE dans lequel a été déposée une protéine de
fusion formée des 9 derniers acides aminés des récepteurs apparentés à EGF-R
fusionnés à la protéine GST. Le domaine PDZ de la GST-Erbin soluble marqué
au 32P ou les protéines de fusion GST-LIN-7 ont été utilisés pour sonder la
membrane. Après incubation, les membranes ont été lavées et les protéines
liées
ont été révélées par autoradiographie.
- La fi u~re 3 représente un Western Blot de lysats totaux de
différents tissus murins et lignées cellulaires soumis à une électrophorèse
sur
SDS-PAGE, transfert sur nitrocellulose et mise en contact avec un anticorps
anti-
Erbin purifié. L'Erbin est une protéine de 180 kD indiquée par les flèches.
EXEMPLES
EXEMPLE 1
Clonage de l'Erbin, un gène codant pour une protéine à
domaine PDZ interagissant avec le récepteur ERBB2.
Les récepteurs ERBB reçoivent leurs ligands, venant du stroma, sur
l'épithélium basolatéral où ils sont localisés (Klapper et al, 2000).
L'analyse de la
séquence peptidique carboxy-terminale des récepteurs ERBB a révélé que le
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
21
récepteur ERBB2 contenait un site de liaison à un domaine PDZ conservé entre
les humains, les souris, les cailles et les chiens (Songyang et al, 1997).
Les auteurs de l'invention ont alors criblé une banque d'ADNc de
rein de souris en utilisant le système à deux hybrides avec les 9 derniers
acides
aminés de ERBB2 fusionnés avec le domaine de liaison à l'ADN de GAL4 ("GAL-
B D").
Procédure à deux hybrides
Les neuf derniers acides aminés de ERBB2 ont été fusionnés à la
sous-unité GAL4-BD en utilisant le vecteur pc97 qui porte LEU2. Une banque
d'ADNc de rein embryonnaire de souris amorcée avec une séquence oligo-dT,
clonée dans un vecteur pc86 qui porte le marqueur Trp1 comme marqueur de
sélection a été criblée en utilisant l'appât GAL4-BD-ERBB2 et la souche de
levure Y190 suivant le protocole au lithium-acétate. Approximativement, 106
transformants TRP+LE(J+ ont été sélectionnés sur des plaques d'agar contenant
un milieu déficient en tryptophane, leucine et histidine lors du criblage
primaire et
contenant 10 mM de 3-aminotriazole (3AT). L'activité (3-galactosidase a été
testée en transférant les levures sur filtres lors du criblage secondaire.
Après récupération, l'ADN des clones sélectionnés a été
retransformé dans une levure Y190 contenant GAL4-BD-ERBB2 ou GAL4-BD
fusionné à des peptides contrôles.
De manière alternative, les 15 derniers acides aminés de ERBB2,
de ERRB2 muté (mutant VA : mutant chez lequel le résidu valine de l'extrémité
C-terminale de ERBB2, résidu crucial pour l'interaction au domaine PDZ, a été
muté en alanine) et de ERBB4 ont été fusionnés à la protéine LexA en utilisant
le
vecteur pBTM116 qui porte Trp1. Le domaine PDZ de l'Erbin a été fusionné à la
région GAL4-AD codé par le vecteur pACT2 qui porte Leu. Des interactions ont
été réalisées dans la souche de levure de L40.
Procédures relatives aux protéines
Les cellules ont été lavées deux fois avec une solution de tampon
phosphate PBS froid et lysées dans un tampon de lyse (50 mM HEPES pH 7,5,
% glycérol, 150 mM NaCI, 1 % Triton X-100, 1,5 mM MgCl2, 1 mM EGTA)
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
22
complémenté avec 1 mM de PMSF (fluorure de phénylméthylsulfonyle), 10 Ng/ml
d'aprotinine et 10 pg/ml de leupeptine. De l'orthovanadate de sodium à 200 NM
de concentration finale a été ajouté au tampon de lyse lorsque les cellules
ont été
stimulées avec de l'EGF. Après centrifugation à 16,000 g pendant 20 minutes,
la
teneur en protéine du lysat était normalisée en utilisant le kit de dosage
protéique
de Bio-Rad. Pour l'immunoprécipitation, les lysats ont été incubés avec des
anticorps une nuit à 4°C. De la protéine A-agarose a été ajoutée et les
complexes
immuns liés aux billes ont été récupérés après une heure, lavés trois fois
dans du
tampon HNTG (50 mM HEPES pH 7,5, 10 % glycérol, 150 mM NaCI, 0,1
Triton X-100), bouillis dans du tampon d'essai 1X et séparés par SDS-PAGE. Le
transfert et l'immunoblot sur nitrocellulose en utilisant la méthode de
chimioluminescence à l'aide des anticorps HRP anti-lapin ou HRP anti-souris
ont
été réalisés comme décrit par Borg et al, 1996. Pour les essais dits de "Far
Western", la membrane a été incubée deux heures à température ambiante avec
des protéines de fusion GST solubles marquées avec la protéine kinase A et du
a2PYATP dilué dans du TBS-lait écrémé à 5 %, 1 mM DTT (106 cpm/ml). Après
rinçage dans du tampon TBS- 0,1 % Triton X-100 et du tampon TBS, la GST liée
était révélée par autoradiographie. La transfection cellulaire, la production
de
GST et les dosages de liaison du GST ont été réalisés comme décrit
précédemment (Borg et al, 1996).
Les lysats fractionnés ont été préparés comme suit : les cellules ont
été lysées dans du tampon hypotonique (10 mM Tris-CI [pH 7,4], 0,2 mM MgCl2,
mM KCI) complémentées avec 1 mM de PMSF, 10 Ng/ml d'aprotonine et 10
Nglml de leupeptine. La lyse a été complétée par 20 passages dans un
homogénéisateur à froid (piston B). Du saccharose a été ajouté à l'homogénat,
dénommé fraction cytoplasmique. Le culot a été resuspendu dans une volume de
tampon de lyse (tel que décrit ci-dessus) équivalent au volume de fraction
cytoplasmique. Après 30 minutes sur la glace, les débris insolubles ont été
enlevés par centrifugation à 16 000 g pendant 30 minutes à 4°C. Le
supernageant résultant a été dénommé fraction membranaire.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
Résultats
23
Les auteurs de l'invention ont ainsi isolé un clone d'ADNc partiel
codant pour les 457 derniers acides aminés d'une nouvelle protéine désignée
Erbin pour "ERBB2 Interacting protein". Le clone tiré de la banque de rein de
GAL-4-BD-ERBB2 contient les résidus 914 à 1371 de l'Erbin murine et est appelé
Erbin (914-1371 ). Les protéines de fusion avec GST sont produites en
utilisant
les séquences peptidiques de l'Erbin (914-1371 ), Erbin (914-1240) et Erbin
(1240-1371 ). La protéine de fusion GST-Erbin (1240-1371 ) sera désignée dans
le
texte comme le domaine PDZ de GST-Erbin.
La souche de levure Y190 cotransformée par des vecteurs codant
pour l'appât fusionné à Lex A et la proie fusionnée à GAL4-BD a été ensemencée
sur du milieu Trp-Leu-His contenant 10 mM de 3AT. Dans le tableau suivant, les
signes + signifient croissance sur le milieu sélectif (-His) et activité ~-
galactosidase positive.
pACT-Erbin 914-1371 1240-1371
LexA ~igal -His ~igal -His
ERBB2 + + + +
ERBB2.VA
ERBB4
Aucune interaction n'est observée avec ERBB2 mutée sur le résidu
valine C-terminal. Le domaine PDZ trouvé à l'extrémité C-terminale de l'Erbin
est
suffisant pour se lier à ERBB2.
Aucune liaison n'a été observée avec EPHB2, MUSK, PDGFRa et
PDGFR~i. Les protéines GST-Erbin (914-1371 ) et GST-Erbin PDZ se lient à la
chimère EGF-R/ERBB2 (HER 1/2), mais pas à EGF-R, dans des essais "pull-
down" de précipitation de protéines (fi ure 1 ). Les domaines GST-DLG, LIN-2
et
X11a ne se lient pas à HER 1/2. La liaison directe du domaine PDZ de l'Erbin
aux extrémités carboxy-terminales des récepteurs ERBB a été évaluée par essai
"Far Western". Le domaine PDZ de l'Erbin radiomarqué se lie au peptide ERBB2
mais pas au peptide EGF-R, ERBB3 et ERBB4 et ne se lie que faiblement au
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
24
peptide LET-23 (fi ure 2). Le domaine PDZ de LIN-7 se lie seulement à LET-23.
Le domaine PDZ de l'Erbin présente une forte identité avec le domaine PDZ de
DENSIN-180 (71 %) et une identité de 35 % avec les domaines PDZ de classe I
(Songyang et al, 1997 ; Fanning et al, 1998) trouvée dans les protéines LIN-7
et
PSD-95 selon l'alignement des séquences. La substitution d'un motif His-Gly
présent dans l'hélice aB de l'Erbin en un motif Tyr-Asp présent dans le
domaine
PDZ de classe III de NOS inhibe l'interaction avec ERBB2. Ces résultats
montrent que le domaine PDZ de l'Erbin interagit spécifiquement et directement
avec ERBB2.
Un ADNc de pleine longueur codant pour l'Erbin humaine a été
cloné par RT-PCR à partir de Daudi, une lignée cellulaire de lymphocytes B
humains, en utilisant le kit MARATHON, selon les recommandations du fabricant
(Clontech). Un cadre de lecture ouverte précédé de codons stop dans les trois
cadres code pour une protéine de 1371 acides aminés. L'Erbin contient 16
motifs
LRR dans son extrémité amino-terminale (résidus 48-416) et un seul domaine
PDZ C-terminal. Une large région intermédiaire de 863 acides aminés entre les
domaines LRR et PDZ contient des extensions riches en proline qui peuvent
représenter des sites de liaison ou des domaines SH3 et W1N.
EXEMPLE 2
Caractérisation de l'Erbin, membre d'une nouvelle famille PDZ
Une sonde de l'Erbin humaine spécifique a permis de détecter un
transcrit de 7,2 kb dans la plupart des tissus humains et murins testés. Cette
analyse a été réalisée par Northern Blot à l'aide de la technique "Multiple
Tissues" de Clontech, à partir de 2 Ng d'ARNm poly(A)+ isolé à partir de
divers
tissus humains. Des anticorps spécifiques contre l'Erbin ont été préparés.
Préparation des anticorps
L'anticorps monoclonal anti-Mc 9E10 (Oncogene Research
Products, Cambridge, MA) a été utilisé pour l'immunoprécipitation et
l'immunoblot. Des anticorps monoclonaux de lapins anti-ERBB2 et anti-EGF-R
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
ont été obtenus par injection des peptides à des lapins. L'anticorps
monoclonal
408 anti-EGF-R a été utilisé pour l'immunoprécipitation. L'anticorps
monoclonal
anti-EGF-R (clone LA22) de Upstate Biotechnology (UBI) a été utilisé pour
l'immunofluorescence. Les anticorps polyclonaux anti-SHC et monoclonal 4610
mAb (anti-PY) ont été obtenus chez UBI. Des IgG de chèvre anti-lapin et anti-
souris couplées à une peroxydase de raifort ont été achetées auprès du
Laboratoire Jackson et Dako, respectivement. Un anticorps polyclonal de lapin
anti-Erbin a été produit en injectant une protéine de fusion GST-Erbin (914-
1371 ).
L'anticorps anti-Erbin a été en outre purifié par affinité avec une Erbin
marquée
par l'histidine (914-1371 ) lié à des billes d'agarose et de nickel (Qiagen).
Ces anticorps spécifiques contre l'Erbin ont détecté une protéine de
180 kD sous la forme d'un doublet dans le cerveau, le foie, le rein, la rate,
les
intestins et les muscles squelettiques ainsi que dans les lignées cellulaires
épithéliales Caco-2 et MDCK (figure 3). L'expression de l'ADNc de l'Erbin de
pleine longueur dans les cellules COS a permis la production d'une protéine de
taille similaire à la protéine détectée par l'anticorps en question dans les
tissus et
les extraits cellulaires.
Culture cellulaire
Les cellules COS-1 et MDCK sont cultivées dans du milieu DMEM
(milieu de Eagle modifié par Dulbecco) contenant 100 Uiml de pénicilline et
100
Ngiml de sulfate de streptomycine, complémenté avec du sérum de veau fcetal à
10 % (FCS). Les cellules Caco-2 ont été maintenues dans du milieu DMEM
complémenté avec 20 % de FCS et 1 % d'acides aminés non essentiels. Toutes
les transfections cellulaires ont été réalisées en utilisant un réactif Fugene
6
selon les recommandations du fabricant (Boehringer Mannheim).
L'homologie structurelle entre Erbin, DENSIN-180, VARTUL,
KAA0147 et F26D11.11 ont conduit les auteurs de l'invention à considérer ces
protéines comme des membres d'une nouvelle famille PDZ désignée LAP pour
"LRR and PDZ domain proteins".
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
26
EXEMPLE3:
Interaction de l'Erbin avec un récepteur activé HER1/2
L'interaction in vivo entre l'Erbin et le récepteur ERBB2 a été testée
par co-immunoprécipitation dans des cellules COS.
1 ) HER 1/2 a été coexprimé de manière transitoire avec les
polypeptides Erbin, SAP97 ou PSD-95 fusionnés à l'épitoge myc dans des
cellules COS-1. Après une lyse, HER 1/2 été immunoprécipité avec l'anticorps
anti-EGF-R (clone 408) et les protéines liées ont été révélées par des
anticorps
anti-myc et anti-ERBB2, respectivement. Seule l'Erbin était associée à HER
1/2.
2) HER 1/2 et EGF-R ont été coexprimés transitoirement avec
l'Erbin dans les cellules COS-1. Après traitement à l'EGF, les cellules ont
été
lysées et une fraction aliquote d'un extrait protéique a été déposé sur SDS-
PAGE, soumis à une électrophorèse et transféré sur une membrane de
nitrocellulose. Une quantité égale d'Erbin et de récepteur a été trouvée dans
les
lysats. Les récepteurs ont été immunoprécipités avec un anticorps anti-EGF-R,
les protéines liées ont été soumises à un Western Blot et révélées avec des
anticorps anti-Erbin et anti-récepteur. Seul HER 1/2 interagissait avec
l'Erbin.
Comme contrôle, la protéine p52 SHC a été imunoprécipitée de manière
croissante avec HER 1/2 et EGF-R après stimulation par EGF.
3) HER 1/2 et EGF-R ont été exprimés transitoirement dans les
cellules COS-1. Après 5 minutes de stimulation avec du milieu ne contenant pas
de facteurs de croissance ou contenant 200 ng/ml d'EGF, les cellules ont été
lysées, et des essais GST "pull down" de précipitation de protéines ont été
réalisés en utilisant les domaines GST-SHC PTB ou GST-ERBIN PDZ fixés sur
des billes d'agarose. Les protéines précipitées ont été révélées par une
analyse
en Western Blot en utilisant un anticorps anti-PY (panneaux supérieurs). Après
déshybridation des anticorps, les membranes ont été révélées avec des
anticorps
anti-ERBB2 et anti-EGF-R respectivement (anti-RTK). Tandis que seuls les
récepteurs phosphorylés se liaient au domaine SHC PTB, HER 1/2 non
phosphorylé interagissait avec le domaine de PDZ de l'Erbin.
4) HER 1/2 contenant une mutation de la valine carboxy-terminale
(mutant VA) ou un HER 1/2 "kinase-dead", c'est-à-dire dépourvu d'activité
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
27
catalytique (mutant KA) ont été exprimés dans des cellules COS-1 et
l'interaction
avec les protéines de fusion avec GST a été testée comme décrit précédemment.
La mutation VA dans HER 1/2 n'a pas affectée la phosphorylation sur résidus
tyrosine au récepteur tandis que le mutant KA n'était pas phosphorylé sur
tyrosines. Comme attendu, le mutant HER 1/2 KA ne s'est pas lié au domaine
SHC PTB (figure 3d). D'un autre côté, le domaine PDZ de l'Erbin précipite de
manière efficace HER 1/2 KA mais par HER 1/2 VA. Pris dans leur ensemble,
ces résultats montrent que le domaine PDZ de l'Erbin interagit seulement avec
le
récepteur HER 1/2 non activé.
Les auteurs de l'invention se sont donc demandé si les protéines se
comportaient de manière identique in vivo, en coexprimant de l'Erbin marquée
par myc avec HER 1/2 dans les cellules COS. II a été trouvé que le pool de HER
1/2 associé avec l'Erbin n'était pas phosphorylé au site de la tyrosine après
stimulation d'EGF. En revanche, les protéines SHC interagissaient avec le
récepteur phosphorylé. L'Erbin est un substrat pour la kinase ERBB2 et aucune
phosphorylation de l'Erbin n'a été trouvée lors de l'expression du récepteur
HER
1/2 KA. Ces données montrent que l'Erbin interagit avec HER 1/2 non
phosphorylé sur la tyrosine et identifient l'Erbin comme un substrat de la
kinase
ERBB2. Comme un site de liaison SHC PTB a été trouvé à l'extrémité C-
terminale de ERBB2, deux résidus en amont du site de liaison au domaine PDZ
(Borg et al, 1978), le recrutement des protéines SHC à ce site, après
stimulation
par EGF, pourrait empécher la fixation du domaine PDZ de l'Erbin. La
phosphorylation de la tyrosine en elle-méme n'est pas suffisante pour altérer
l'interaction du domaine HER 1/2 PDZ puisque le peptide phosphorylé au niveau
de la tyrosine inhibe cette interaction aussi efficacement qu'un peptide non
phosphorylé. L'interaction du domaine PDZ est donc susceptible d'étre inhibé
par
compétition avec des modules protéiques de la machinerie de la signalisation.
EXEMPLE 4
La localisation basolatérale de ERBB2 dans les cellules
épithéliales est dépendante du site d'interaction avec l'Erbin
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
28
Afin d'étudier plus finement la localisation sub-cellulaire de ERBB2
et de l'Erbin, les auteurs de l'invention ont utilisé la lignée Caco-2, lignée
cellulaire de carcinome de colon humain, exprimant les deux protéines à la
fois.
Le fractionnement des cellules Caco-2 a montré que l'Erbin était
principalement présente dans la fraction membranaire tandis que les protéines
SHC étaient prédominantes dans la fraction cytolosique. Une immunocoloration a
alors été réalisée sur les cellules Caco-2 polarisées avec un anticorps anti-
Erbin
purifié. Pour cela, les cellules Caco-2 ont été ensemencées sur des lamelles
de
verre, fixées, perméabilisées et colorées avec les anticorps primaires
indiqués,
puis soumises à une coloration avec les anticorps secondaires conjugués à
différents fluorochromes selon le protocole ci-après.
Immunolocalisation ef marquage des sun'aces cellulaires
Pour les procédures d'immunocoloration, les cellules MDCK ont été
cultivées sur les lamelles de verre pendant trois jours après confluence et
étaient
marquées comme décrit dans Le Bivic et al, 1989 avec un anticorps monoclonal
contre EGF-R et un anticorps polyclonal contre gp114 (marqueur apical des
cellules MDCK) (Le Bivic et al, 1990). Les cellules Caco-2 ont été cultivées
sur
des lamelles de verre pendant 10 jours après confluence pour assurer une
différenciation complète puis ont été soumises au même traitement que les
cellules MDCK. L'anticorps contre Ag525 (marqueur basolatéral des cellules
intestinales humaines) a été décrit précédemment (Le Bivic et al, 1988). Des
sections congelées (0,5 à 1 pm) de colon humain ont été obtenues comme décrit
précédemment (Le Bivic et al, 1988).
Pour la biotinylation des surfaces cellulaires, les cellules cultivées
sur des filtres pendant trois jours après confluence ont été marquées une nuit
avec du "35S-promix ready vue" de Amersham (18,5 MBq/ml) sur la face
basolatérale. Les cellules ont été marquées avec Sulfo-NHS-LC-biotin (Pierce)
pendant une chasse de 90 minutes dans du milieu normal soit sur la face
apicale
soit sur la face basolatérale et EGF-R ou les chimères ont été
immunoprécipitées
avec de la streptavidine comme décrit dans Le Bivic et al, 1989. Les
échantillons
ont été analysés par SDS-PAGE et visualisés par fluorographie. Les
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
29
autoradiogrammes ont été quantifiés en utilisant Intelligent Quantifier de
Biolmage (Ann Arbor, MI).
L'Erbin a été trouvée sur la face basolatérale de la membrane
plasmique de Caco-2 puisque la co-localisation a été obtenue par co-coloration
avec l'anticorps monoclonal 525, marqueur spécifique de l'épithélium
basolatéral.
En outre, ERBB2 était également basolatéral et colocalisait avec
l'Erbin. La coloration de section de colon humain avec l'anticorps anti-Erbin
a
confirmé la localisation basolatérale de la protéine dans ses tissus.
Les auteurs de l'invention ont ensuite produit des cellules MDCK
exprimant de manière stable EGF-R, HER 1/2 et HER 1/2.VA. MDCK exprimait
de faibles niveaux de récepteurs EGF-R et ERBB2 endogènes contrairement
aux populations cellulaires transfectées avec les construits, qui permettaient
une
expression de EGF-R et HER 1/2 (sauvage et mutant).
Des expériences d'immunofluorescence ont été menées avec LA22,
qui est un anticorps monoclonal anti-EGF-R humain spécifique. EGF-R et HER
1/2 étaient localisés sur la face basolatérale tandis que la mutation de HER
1/2
(HER 1/2.VA) empêchait la localisation basolatérale de HER 1/2. La
biotinylation
de la surface cellulaire a été réalisée sur les faces apicales et
basolatérales des
transfectants MDCK et les quantités de récepteurs ont été quantifiées par
autoradiographie. Tandis que EGF-R et HER 1/2 étaient localisés à 82 % du côté
basolatéral, le mutant HER 1/2.VA était seulement à 52 % basolatéral. Ainsi,
l'élimination du site d'interaction de l'Erbin a conduit à une dépolarisation
de
ERBB2 dans les cellules épithéliales.
EXEMPLE 5 : Production d'une souris "knock-out"
La stratégie consiste à éliminer le premier exon du gène Erbin
codant pour les 63 premiers acides aminés de l'Erbin et de le remplacer par
une
cassette codant pour le gène de résistance de la néomycine. La disparition du
codon d'initiation de la traduction et des 62 acides aminés suivants provoque
une
perte d'expression de la protéine de l'Erbin fonctionnelle.
CA 02405124 2002-10-04
WO 01/77323 PCT/FR01/01078
Le vecteur de recombinaison homologue de type pPNT3 substitue
des séquences du gène Erbin (exon 1 ) par une cassette de gène de résistance
pour la néomycine. II comprend
- le gène de résistance à la néomycine (néon) muni de deux
promoteurs reconnus dans les cellules eucaryotes et procaryotes.
- La cassette PGK-TK est constituée du promoteur minimal de
la phosphoglycérate kinase (PGK) et de séquences codantes de la thymidine
kinase du virus Herpes simplex. Le promoteur de la PGK est normalement activé
dans les cellules ES et permet d'effectuer une sélection négative au cours de
la
sélection des clones recombinants. Cette cassette est placée en 5' des régions
d'homologie de l'Erbin. Le vecteur de recombinaison est construit à partir de
6 kb
de séquence génomique de l'Erbin : 1.5 kb en amont du 1 er exon (bras 5') et
4.5
kb (bras 3') en aval du 1e~ exon. Le vecteur de recombinaison final présente
les
séquences d'ADN suivantes en enfilade : 5' Cassette PGK-TK---- bras 5' erbin---
-gène néon----bras 3' erbin 3'. Après linéarisation du vecteur de
recombinaison,
celui-ci est transféré par électroporation dans des cellules ES 129 (cellules
souches embryonnaires) et les cellules transfectées sont sélectionnées par
addition de généticine dans le milieu de culture, en suivant le protocole
décrit
dans " Gene targeting : a practical approach ", Editions A.L. Joyner 1993 IRL
Press. Afin de mettre en évidence les clones dont le génome comporte
l'événement de recombinaison homologue, une contre-sélection au ganciclovir
est utilisée. Les clones sont vérifiés selon le protocole proposé dans " Gene
targeting : a practical approach ", Editions A.L. Joyner 1993 IRL Press, par
PCR
et Southern blot, et Fiore et al., Int.J.Dev.Biol. 41 : 639-642 (1997).
Les clones sélectionnés sont injectés dans des blastocystes de
souris C57BL/6 prélevés à 3,5 jours de gestation. Les blastocystes sont
réimplantés dans des souris SWISS pseudo-gestantes de 2,5 jours. La mise en
évidence des chimères se fait par la couleur de leur pelage (noir et marron
pour
les chimères). Les mâles chimériques sont croisés avec des femelles C57BU6 et
les queues de nouveau-nés agouti sont prélevés et leur génotype analysé par
southern blot pour détecter l'allèle recombiné. Le croisement de souris
hétérozygotes entre elles permet d'obtenir les mutants homozygotes pour la
mutation (génération F2) (vérification par southern blot).
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
31
EXEMPLE 6 : Mutagénèse du domaine PDZ de l'Erbin
Des mutations ponctuelles effectuées dans le domaine PDZ de
l'Erbin ont des effets inverses sur l'interaction avec ERBB2/HER2.
Pour montrer l'effet de ces mutations, on peut notamment mettre en
oeuvre les deux techniques suivantes : précipitation de ERBB2 par des
protéines
de fusion recombinantes et système à double hybride chez la levure.
Des protéines de fusion recombinantes GST-PDZ ERBIN sauvages
ou mutées fixées à une matrice solide sont incubées avec un lysat cellulaire
contenant ERBB2/HER2. Après deux heures, les billes sont lavées et les
complexes résolus par SDS-PAGE. Après transfert, ERBB2 est révélé par un
anticorps spécifique (western blot).
Pour le système à double hybride chez la levure, l'appât est
constitué de LEXA-BD fusionné au peptide ERBB2. La proie est constituée de
GAL4-AD fusionné au domaine PDZ de ERBIN sauvage ou muté.
Ces deux tests ont donné des résultats identiques : les mutants
PDZ YD (de l'histidine 1347 en tyrosine et de la glycine (position 1348) en
acide
aspaitique) et NS (de la thréonine 1316 en asparagine et de l'arginine
(position
1317) en sérine) présentent moins d'affinité pour le récepteur ERBB2 et les
mutants HL (de l'histidine (position 1347) en leucine) et MI (de la leucine
1291 en
méthionine et de la phénylalanine (position 1293) en isoleucine) présentent
plus
d'affinité pour ERBB2.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
32
RÉFÉRENCES BIBLIOGRAPHIQUES
- Antonarakis S.E., Diagnosis of genetic disorders at the DNA level.
N Engl J. Med. 320:153-163 (1989).
- Bellis et al., medecine/sciences, 13:1317-24, (1997).
- Benoit et al., PNAS USA, 79, 917-921 (1982).
- Borg et al (1996), The Phosphotyrosine Interaction Domains of
X11 and FE65 bind to distinct sites on the YENPTY motif of amyloid precursor
protein. Molecular and Cellular 8iology 16: 6229-6241
- Borg et al, (1998), Function of PTB domains. Curr. Top. Microbiol.
Immunol. 228: 23-38
- Borg et al, (1998), Identification of an evolutionarily conserved
heterotrimeric protein complex involved in protein targeting. J.8iol.Chem.
273(48): 31633-31636
- Cooper et al., Diagnosis of genetic disease using recombinant
DNA, 3'd Édition, Hum Genet., 87:519-560 (1991 ).
- Fanning, A.S. & Anderson, J.M. PDZ domains and the formation of
protein networks at the plasma membrane. Curr. Top. Microbiol. Immunol. 228:
209-233 (1998).
- Huber, C.G. et al., Rapid and accurate sizing of DNA fragments by
ion-pair chromatography on alkylated nonporous poly(styrenedivinylbenzene)
particles. Anal. Chem. 67, 578-585 (1995).
Klapper et al (2000), Biochemical and clinicat implications of the
ErbB/HER signaling network of growth factor receptors. Adv Cancer Res 77: 25-
79.
- K~hler et Milstein, Nature, 256, 495-497, (1975).
- Kuklin, A. et al., Detection of single-nucleotide polymorphisms with
the WAVET"" DNA fragment analysis system. Genetic Testing 1, 201-206
(1997/98).
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
33
- Le Bivic et al (1988) Characterization of a glycoprotein expressed
on the basolateral membrane of human intestinal epithelial cells and cultured
colonic cell lines. Eur J Cell Biol 46: 113-120.
- Le Bivic et al (1989) Vectorial targeting of apical and basolateral
plasma membrane proteins in a human adenocarcinoma epithelial cell line. Proc
Natl Acad Sci U S A 86: 9313-9317.
- Le Bivic et al (1990) Vectorial targeting of an endogenous apical
membrane sialoglycoprotein and uvomorulin in MDCK cells. J Cell Biol 110:
1533-1539.
- Ross et al, (1999), HER-2ineu (c-erb-B2) gene and protein in
breast cancer, Am. J. Clin. Pathol. 992:S53-67
- Sambrook et al., Molecular cloning, a laboratory manual Spring
Harbor Laboratory Press, 9.54-62 (1989)
- Songyang et al (1997) Recognition of unique carboxyl-terminal
motifs by distinct PDZ domains. Science 275: 73-77.
- Zhang et al, (1996) A yeast three-hybrid-method to clone ternary
protein complex components, Analytical Biochemistry, 242, 68-72.
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
1
LISTE DE SEQUENCES
<110> INSERM
<120> Gène codant pour l'Erbin, protéine qui interagit avec
le récepteur ERBB2/HER-2, et utilisations diagnostiques
et thérapeutiques
<130> BFF 00/0117
<140>
<141>
<160> 23
<170> PatentIn Ver. 2.1
<210> 1
<211> 6412
<212> ADN
<213> Homo sapiens
<220>
<221> CDS
<222> (324)..(4436)
<400> 1
aaagatcttt tttttttttt tttctttttt tttcggcgga gatcctcgtt ggggctggga 60
aactcctgca aaactcgaga ccaggaagcc agcccgcacc ccaaccccca ccaaagccac 120
ctactcttct tctgtgggag gccagtccac atccgctctc acccgagaga gatattcagc 180
tggatccaaa gtgactgatg aagggaagga aatcatgtca agcgaagcct tgaaaaagct 240
gccctgagac ggtgtcccgc cgaaagaatg ttggctcaat taagaaacat cagggagata 300
aattcaaccc agtgtgtcta aaa atg act aca aaa cga agt ttg ttt gtg cgg 353
Met Thr Thr Lys Arg Ser Leu Phe Val Arg
1 5 10
ttg gta cca tgt cgc tgt cta cga ggg gaa gag gag act gtc act act 401
Leu Val Pro Cys Arg Cys Leu Arg Gly Glu Glu Glu Thr Val Thr Thr
15 20 25
ctt gat tat tct cat tgc agc tta gaa caa gtt ccg aaa gag att ttt 449
Leu Asp Tyr Ser His Cys Ser Leu Glu Gln Val Pro Lys Glu Ile Phe
30 35 40
act ttt gaa aaa acc ttg gag gaa ctc tat tta gat gct aat cag att 497
Thr Phe Glu Lys Thr Leu Glu Glu Leu Tyr Leu Asp Ala Asn Gln Ile
45 50 55
gaa gag ctt cca aag caa ctt ttt aac tgt cag tct tta cac aag ctg 545
Glu Glu Leu Pro Lys Gln Leu Phe Asn Cys Gln Ser Leu His Lys Leu
60 65 70
agt ttg cca gac aat gat tta aca acg tta cca gca tcc att gca aac 593
Ser Leu Pro Asp Asn Asp Leu Thr Thr Leu Pro Ala Ser Ile Ala Asn
75 80 85 90
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
2
ctt att aat ctc agg gaa ctg gat gtc agc aag aat gga ata cag gag 641
Leu Ile Asn Leu Arg Glu Leu Asp Val Ser Lys Asn Gly Ile Gln Glu
95 100 105
ttt cca gaa aat ata aaa aat tgt aaa gtt ttg aca att gtg gag gcc 689
Phe Pro Glu Asn Ile Lys Asn Cys Lys Val Leu Thr Ile Val Glu Ala
110 115 120
agt gta aac cct att tcc aag ctc cct gat gga ttt tct cag ctg tta 737
Ser Val Asn Pro Ile Ser Lys Leu Pro Asp Gly Phe Ser Gln Leu Leu
125 130 135
aac cta acc cag ttg tat ctg aat gat gct ttt ctt gag ttc ttg cca 785
Asn Leu Thr Gln Leu Tyr Leu Asn Asp Ala Phe Leu Glu Phe Leu Pro
140 145 150
gca aat ttt ggc aga tta act aaa ctc caa ata tta gag ctt aga gaa 833
Ala Asn Phe Gly Arg Leu Thr Lys Leu Gln Ile Leu Glu Leu Arg Glu
155 160 165 170
aac cag tta aaa atg ttg cct aaa act atg aat aga ctg acc cag ctg 881
Asn Gln Leu Lys Met Leu Pro Lys Thr Met Asn Arg Leu Thr Gln Leu
175 180 185
gaa aga ttg gat ttg gga agt aac gaa ttc acg gaa gtg cct gaa gta 929
Glu Arg Leu Asp Leu Gly Ser Asn Glu Phe Thr Glu Val Pro Glu Val
190 195 200
ctt gag caa cta agt gga ttg aaa gag ttt tgg atg gat gct aat aga 977
Leu Glu Gln Leu Ser Gly Leu Lys Glu Phe Trp Met Asp Ala Asn Arg
205 210 215
ctg act ttt att cca ggg ttt att ggt agt ttg aaa cag ctc aca tat ï025
Leu Thr Phe Ile Pro Gly Phe Ile Gly Ser Leu Lys Gln Leu Thr Tyr
220 225 230
ttg gat gtt tct aaa aat aat att gaa atg gtt gaa gaa gga att tca 1073
Leu Asp Val Ser Lys Asn Asn Ile Glu Met Val Glu Glu Gly Ile Ser
235 240 245 250
aca tgt gaa aac ctt caa gac ctc cta tta tca agc aat tca ctt cag 1121
Thr Cys Glu Asn Leu Gln Asp Leu Leu Leu Ser Ser Asn Ser Leu Gln
255 260 265
cag ctt cct gag act att ggt tcg ttg aag aat ata aca acg ctt aaa 1169
Gln Leu Pro Glu Thr Ile Gly Ser Leu Lys Asn Ile Thr Thr Leu Lys
270 275 280
ata gat gaa aac cag tta atg tat ctg cca gac tct ata gga ggg tta 1217
Ile Asp Glu Asn Gln Leu Met Tyr Leu Pro Asp Ser Ile Gly Gly Leu
285 290 295
ata tca gta gaa gaa ctg gat tgt agt ttc aat gag gtt gaa gct ttg 1265
Ile Ser Val Glu Glu Leu Asp Cys Ser Phe Asn Glu Val Glu Ala Leu
300 305 310
cct tca tct att ggg cag ctt act aac tta aga act ttt gct gct gat 1313
Pro Ser Ser Ile Gly Gln Leu Thr Asn Leu Arg Thr Phe Ala Ala Asp
315 320 325 330
CA 02405124 2002-10-04
WO 01/77323 PCT/FROI/01078
3
cat aat tac tta cag cag ttg ccc cca gag att gga agc tgg aaa aat 1361
His Asn Tyr Leu Gln Gln Leu Pro Pro Glu Ile Gly Ser Trp Lys Asn
335 340 345
ata act gtg ctg ttt ctc cat tcc aat aaa ctt gag aca ctt cca gag 1409
Ile Thr Val Leu Phe Leu His Ser Asn Lys Leu Glu Thr Leu Pro Glu
350 355 360
gaa atg ggt gat atg caa aaa tta aaa gtc att aat tta agt gat aat 1457
Glu Met Gly Asp Met Gln Lys Leu Lys Val Ile Asn Leu Ser Asp Asn
365 370 375
aga tta aag aat tta ccc ttt agc ttt aca aag cta cag caa ttg aca 1505
Arg Leu Lys Asn Leu Pro Phe Ser Phe Thr Lys Leu Gln Gln Leu Thr
380 385 390
gct atg tgg ctc tca gat aat cag tcc aaa ccc ctg ata cct ctt caa 1553
Ala Met Trp Leu Ser Asp Asn Gln Ser Lys Pro Leu Ile Pro Leu Gln
395 400 405 410
aaa gaa act gat tca gag acc cag aaa atg gtg ctt acc aac tac atg 1601
Lys Glu Thr Asp Ser Glu Thr Gln Lys Met Val Leu Thr Asn Tyr Met
415 420 425
ttc cct caa cag cca agg act gag gat gtt atg ttt ata tca gat aat 1649
Phe Pro Gln Gln Pro Arg Thr Glu Asp Val Met Phe Ile Ser Asp Asn
430 435 440
gaa agt ttt aac cct tca ttg tgg gag gaa cag agg aaa cag cgg gct 1697
Glu Ser Phe Asn Pro Ser Leu Trp Glu Glu Gln Arg Lys Gln Arg Ala
445 450 455
caa gtt gca ttt gaa tgt gat gaa gac aaa gat gaa agg gag gca cct 1745
Gln Val Ala Phe Glu Cys Asp Glu Asp Lys Asp Glu Arg Glu Ala Pro
460 465 470
ccc agg gag gga aat tta aaa aga tat cca aca cca tac cca gat gag 1793
Pro Arg Glu Gly Asn Leu Lys Arg Tyr Pro Thr Pro Tyr Pro Asp Glu
475 480 485 490
ctt aag aat atg gtc aaa act gtt caa acc att gta cat aga tta aaa 1841
Leu Lys Asn Met Val Lys Thr Val Gln Thr Ile Val His Arg Leu Lys
495 500 505
gat gaa gag acc aat gaa gac tca gga aga gat ttg aaa cca cat gaa 1889
Asp Glu Glu Thr Asn Glu Asp Ser Gly Arg Asp Leu Lys Pro His Glu
510 515 520
gat caa caa gat ata aat aaa gat gtg ggt gtg aag acc tca gaa agt 1937
Asp Gln Gln Asp Ile Asn Lys Asp Val Gly Val Lys Thr Ser Glu Ser
525 530 535
act act aca gta aaa agc aaa gtt gat gaa aga gaa aaa tat atg ata 1985
Thr Thr Thr Val Lys Ser Lys Val Asp Glu Arg Glu Lys Tyr Met Ile
540 545 550
gga aac tct gta cag aag atc agt gaa cct gaa gct gag att agt cct 2033
Gly Asn Ser Val Gln Lys Ile Ser Glu Pro Glu Ala Glu Ile Ser Pro
555 560 565 570
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
4
ggg agt tta cca gtg act gca aat atg aaa gcc tct gag aac ttg aag 2081
Gly Ser Leu Pro Val Thr Ala Asn Met Lys Ala Ser Glu Asn Leu Lys
575 580 585
cat att gtt aac cat gat gat gtt ttt gag gaa tct gaa gaa ctt tct 2129
His Ile Val Asn His Asp Asp Val Phe Glu Glu Ser Glu Glu Leu Ser
590 595 600
tct gat gaa gag atg aaa atg gcg gag atg cga cca cca tta att gaa 2177
Ser Asp Glu Glu Met Lys Met Ala Glu Met Arg Pro Pro Leu Ile Glu
605 610 615
acc tct att aac cag cca aaa gtc gta gca ctt agt aat aac aaa aaa 2225
Thr Ser Ile Asn Gln Pro Lys Val Val Ala Leu Ser Asn Asn Lys Lys
620 625 630
gat gat aca aag gaa aca gat tct tta tca gat gaa gtt aca cac aat 2273
Asp Asp Thr Lys Glu Thr Asp Ser Leu Ser Asp Glu Val Thr His Asn
635 640 645 650
agc aat cag aat aac agc aat tgt tct tct cca tct cgg atg tct gat 2321
Ser Asn Gln Asn Asn Ser Asn Cys Ser Ser Pro Ser Arg Met Ser Asp
655 660 665
tca gtt tct ctt aat act gat agt agt caa gac acc tca ctc tgc tct 2369
Ser Val Ser Leu Asn Thr Asp Ser Ser Gln Asp Thr Ser Leu Cys Ser
670 675 680
cca gtg aaa caa act cat att gat att aat tcc aaa atc agg caa gaa 2417
Pro Val Lys Gln Thr His Ile Asp Ile Asn Ser Lys Ile Arg Gln Glu
685 690 695
gat gaa aat ttt aac agc ctt tta caa aat gga gat att tta aac agt 2465
Asp Glu Asn Phe Asn Ser Leu Leu Gln Asn Gly Asp Ile Leu Asn Ser
700 705 710
tca aca gag gaa aag ttc aaa gct cat gat aaa aaa gat ttt aac tta 2513
Ser Thr Glu Glu Lys Phe Lys Ala His Asp Lys Lys Asp Phe Asn Leu
715 720 725 730
cct gaa tat gat ttg aat gtt gaa gag cga tta gtt cta att gag aaa 2561
Pro Glu Tyr Asp Leu Asn Val Glu Glu Arg Leu Val Leu Ile Glu Lys
735 740 745
agt gtt gac tca aca gcc aca gct gat gac act cac aaa tta gat cat 2609
Ser Val Asp Ser Thr Ala Thr Ala Asp Asp Thr His Lys Leu Asp His
750 755 760
atc aat atg aat ctt aat aaa ctt ata act aat gat aca ttt caa cca 2657
Ile Asn Met Asn Leu Asn Lys Leu Ile Thr Asn Asp Thr Phe Gln Pro
765 770 775
gag atc atg gaa aga tca aaa aca cag gat att gtg ctt gga aca agc 2705
Glu Ile Met Glu Arg Ser Lys Thr Gln Asp Ile Val Leu Gly Thr Ser
780 785 790
ttt tta agc att aat tct aaa gag gaa act gag cac ttg gaa aat gga 2753
Phe Leu Ser Ile Asn Ser Lys Glu Glu Thr Glu His Leu Glu Asn Gly
795 800 805 810
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
aac aag tat cct aat ttg gaa tcc gta aat aag gta aat gga cat tct 2801
Asn Lys Tyr Pro Asn Leu Glu Ser Val Asn Lys Val Asn Gly His Ser
815 820 825
gag gaa act tcc cag tct cct aat agg act gaa cca cat gac agt gat 2849
Glu Glu Thr Ser Gln Ser Pro Asn Arg Thr Glu Pro His Asp Ser Asp
830 835 840
tgt tct gtt gac tta ggt att tcc aaa agc act gaa gat ctc tcc cct 2897
Cys Ser Val Asp Leu Gly Ile Ser Lys Ser Thr Glu Asp Leu Ser Pro
845 850 855
cag aaa agt ggt cca gtt gga tct gtt gtg aaa tct cat agc ata act 2945
Gln Lys Ser Gly Pro Val Gly Ser Val Val Lys Ser His Ser Ile Thr
860 865 870
aat atg gag att gga ggg cta aaa atc tat gat att ctt agt gat aat 2993
Asn Met Glu Ile Gly Gly Leu Lys Ile Tyr Asp Ile Leu Ser Asp Asn
875 880 885 890
gga cct cag cag cca agt aca acc gtt aaa atc aca tct gct gtt gat 3041
Gly Pro Gln Gln Pro Ser Thr Thr Val Lys Ile Thr Ser Ala Val Asp
895 900 905
gga aaa aat ata gtc agg agc aag tct gcc aca ctg ttg tat gat caa 3089
Gly Lys Asn Ile Val Arg Ser Lys Ser Ala Thr Leu Leu Tyr Asp Gln
910 915 920
cca ttg cag gta ttt act ggt tct tcc tca tct tct gat tta ata tca 3137
Pro Leu Gln Val Phe Thr Gly Ser Ser Ser Ser Ser Asp Leu Ile Ser
925 930 935
gga aca aag gca att ttc aag ttt gat tca aat cat aat ccc gaa gag 3185
Gly Thr Lys Ala Ile Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu
940 945 950
cca aat ata ata aga ggc ccc aca agt ggc cca caa tct gca cct caa 3233
Pro Asn Ile Ile Arg Gly Pro Thr Ser Gly Pro Gln Ser Ala Pro Gln
955 960 965 970
ata tat ggt cct cca cag tat aat atc caa tac agt agc agt gct gca 3281
Ile Tyr Gly Pro Pro Gln Tyr Asn Ile Gln Tyr Ser Ser Ser Ala Ala
975 980 985
gtc aaa gac act ttg tgg cac tcc aaa caa aat ccc caa ata gac cat 3329
Val Lys Asp Thr Leu Trp His Ser Lys Gln Asn Pro Gln Ile Asp His
990 995 1000
gcc agt ttt cct cct cag ctc ctt cct aga tca gag agc aca gaa aat 3377
Ala Ser Phe Pro Pro Gln Leu Leu Pro Arg Ser Glu Ser Thr Glu Asn
1005 1010 1015
caa agt tat gct aaa cat tct gcc aat atg aat ttc tct aat cat aac 3425
Gln Ser Tyr Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn
1020 1025 1030
aat gtt cga gct aat act gca tac cat tta cat cag aga ctt ggc cca 3473
Asn Val Arg Ala Asn Thr Ala Tyr His Leu His Gln Arg Leu Gly Pro
1035 1040 1045 1050
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
6
gca aga cat ggg gaa atg tgg gcc atc tca cca aac gac cga ctt att 3521
Ala Arg His Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Ile
1055 1060 1065
cct gca gta act cga agt aca atc cag cga caa agt agt gtg tcc tcc 3569
Pro Ala Val Thr Arg Ser Thr Ile Gln Arg Gln Ser Ser Val Ser Ser
1070 1075 1080
aca gcc tct gta aat ctt ggt gat cca ggc tct aca agg cgg gct cag 3617
Thr Ala Ser Val Asn Leu Gly Asp Pro Gly Ser Thr Arg Arg Ala Gln
1085 1090 1095
att cct gaa gga gat tat tta tca tac aga gag ttc cac tca gcg gga 3665
Ile Pro Glu Gly Asp Tyr Leu Ser Tyr Arg Glu Phe His Ser Ala Gly
1100 1105 1110
aga act cct cca atg atg cca gga tca cag aga ccc ctt tct gca cga 3713
Arg Thr Pro Pro Met Met Pro Gly Ser Gln Arg Pro Leu Ser Ala Arg
1115 1120 1125 1130
aca tac agc ata gat ggt cca aat gca tca aga cct cag agt gct cga 3761
Thr Tyr Ser Ile Asp Gly Pro Asn Ala Ser Arg Pro Gln Ser Ala Arg
1135 1140 1145
ccc tct att aat gaa ata cca gag aga act atg tca gtt agt gat ttc 3809
Pro Ser Ile Asn Glu Ile Pro Glu Arg Thr Met Ser Val Ser Asp Phe
1150 1155 1160
aat tat tca cgg act agt cct tca aaa aga cca aat gca agg gtt ggt 3857
Asn Tyr Ser Arg Thr Ser Pro Ser Lys Arg Pro Asn Ala Arg Val Gly
1165 1170 1175
tct gag cat tct tta tta gat cct cca gga aaa agt aaa gtt cct cgt 3905
Ser Glu His Ser Leu Leu Asp Pro Pro Gly Lys Ser Lys Val Pro Arg
1180 1185 1190
gac tgg aga gaa caa gta ctt cga cat att gaa gcc aaa aag tta gaa 3953
Asp Trp Arg Glu Gln Val Leu Arg His Ile Glu Ala Lys Lys Leu Glu
1195 1200 1205 . 1210
aag atg cct ttg agt aat gga cag atg ggc cag cct ctc agg cct cag 4001
Lys Met Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln
1215 1220 1225
gca aat tat agt caa ata cat cac ccc cct cag gca tct gtg gca agg 4049
Ala Asn Tyr Ser Gln Ile His His Pro Pro Gln Ala Ser Val Ala Arg
1230 1235 1240
cat ccc tct aga gaa caa cta att gat tac ttg atg ctg aaa gtg gcc 4097
His Pro Ser Arg Glu Gln Leu Ile Asp Tyr Leu Met Leu Lys Val Ala
1245 1250 1255
cac cag cct cca tat aca cag ccc cat tgt tct cct aga caa ggc cat 4145
His Gln Pro Pro Tyr Thr Gln Pro His Cys Ser Pro Arg Gln Gly His
1260 1265 1270
gaa ctg gca aaa caa gag att cga gtg agg gtt gaa aag gat cca gaa 4193
Glu Leu Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu
1275 1280 1285 1290
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
7
cttggattt agcata tcaggtggt gtcggg ggtagaggaaac ccattc 4241
LeuGlyPhe SerIle SerGlyGly ValGly GlyArgGlyAsn ProPhe
1295 1300 1305
agacctgat gatgat ggtatattt gtaaca agggtacaacct gaagga 4289
ArgProAsp AspAsp GlyIlePhe ValThr ArgValGlnPro GluGly
1310 1315 1320
ccagcatca aaatta ctgcagcca ggtgat aaaattattcag gctaat 4337
ProAlaSer LysLeu LeuGlnPro GlyAsp LysIleIleGln AlaAsn
1325 1330 1335
ggctacagt tttata aatattgaa catgga caagcagtgtcc ttgcta 4385
GlyTyrSer PheIle AsnIleGlu HisGly GlnAlaValSer LeuLeu
1340 1345 1350
aaaactttc cagaat acagttgaa ctcatc attgtacgagaa gtttcc 4433
LysThrPhe GlnAsn ThrValGlu LeuIle IleValArgGlu ValSer
1355 1360 1365 1370
tcataagcactgt ttattggaag 4486
ggacaaaaaa
agcggggaag
acagcaagat
Ser
atacttacag gggaaattaa tattttgact atttttatat ataaagaaga actcaaaaaa 4546
ttatgttcaa atttgtacat taatgaaata atggataaag gagactgttg aattcatacc 4606
atataaaact tgttaggttt ttaaacatag caatcaaggc tacaaaaaca aacctgtgtt 4666
gtttttgtat agattgtagg tttatttttg gatttcatat acatgactga actgtgtgca 4726
aggcaatagt tagccttgat tttagcccag agacagatgg cagagctatc tctctcatag 4786
cttttatgcc cttattttta ttcaactggt attaatgttt ttctcctgaa actacttttt 4846
ttgatgtggg caagagattt gaagtgttgg cttttgctat gtgcatattg aattgaagag 4906
tgagtaggtg aaggtggtgc tggtgggttc actttccaag gccagactaa aacagttatt 4966
ttctataaaa atctggaagc aaagaatggg gatggggaga gctacgtggt agtatgtttt 5026
tattaggaga ataatgcaat aaaatatgta atgtcttttt tataaagcaa aaaagacaat 5086
aattgcattt atgagctcgg caggatctgt tcttgtcata gccattgact atacatttgc 5146
tactggtgat tcagttttta attttttagt cacaggaaat ttttaactct actgtagatg 5206
catgtccatg cattttctgt gttatggaaa tccactgatt tttttttttt tttcaaatgg 5266
tggtacttgc aatctgtttt ataattagtg ctccatttaa atctaattta taatttttat 5326
tttaagcagc aaatgaaaca aaaatggcca gttttaagat tgtgttgcct gtaacacaaa 5386
atgttacgaa ggtttaggaa agcctctttg atttttgttt ggccttgcat tggcccttgg 5446
taaagtaaaa ggaaacagta cacttggagc taggaaacca aagcaagctt tgtgaaactg 5506
gcacagtgat agagaattgc tgtggagagt tatagagcaa agggatgggt ccttgaggcc 5566
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
8
tgccagtgtg taaaggtgtt caaataaagg gctgtttcta caggtaacat taaatgtgaa 5626
ctcaacactt ccagagtctt taaagggttt ctatgtgtat cagtgtaata gtgttttacc 5686
accaactgcc tttctttgtt cctagttact gtaacaaata tttgatgata gaggtttatt 5746
aattttgttt atccagacca ttaattttat ttgtttttgt ctatgtaatc aaataaaatt 5806
tgagtaacat gtaatggtaa ggattaatgc atggttattt ggaccagaaa aaagtgccat 5866
agaagaccaa taactgttta gttgaggcta gtctggaacc tttcattaga gcaatatttg 5926
gttattgcac ttcattttta tttactaaga aatgcaattt gggaattttt aatctgttat 5986
gctttgttta tcaaccttga ttttaattaa gacttttata agactagctt aaaacaccaa 6046
ccaacattat ttttgcaaaa gtgagttgga ctcactttcc attcttgcta gtcagagtaa 6106
gtaggcagca cttttaaaaa tatgtgaact caaatattgc acttctttca agatgttatc 6166
aattggttat tgtactgtat agttttaata attttgattg aaacccttta acaactcttt 6226
gtaaatttta actcatttta gttgattttc agtactattt acataggaat tgatttttat 6286
ggatatagta gaagaaatgt gctgtatttt gataaaattc acttattgta tgtgtgttgt 6346
aatctaaaaa aaaaaagaat gacaaacagc ttctttaaga caaaaaaaaa aaaaaaaaaa 6406
aaatat 6412
<210>
2
<211> 371
1
<212>
PRT
<213> sapiens
Homo
<400>
2
Met ThrLys ArgSerLeu PheValArg LeuValPro CysArg Cys
Thr
1 5 10 15
Leu GlyGlu GluGluThr ValThrThr LeuAspTyr SerHis Cys
Arg
20 25 30
Ser GluGln ValProLys GluIlePhe ThrPheGlu LysThr Leu
Leu
35 40 45
Glu LeuTyr LeuAspAla AsnGlnIle GluGluLeu ProLys Gln
Glu
50 55 60
Leu AsnCys GlnSerLeu HisLysLeu SerLeuPro AspAsn Asp
Phe
65 70 75 80
Leu ThrLeu ProAlaSer IleAlaAsn LeuIleAsn LeuArg Glu
Thr
85 90 95
Leu ValSer LysAsnGly IleGlnGlu PheProGlu AsnIle Lys
Asp
100 105 110
Asn LysVal LeuThrIle ValGluAla SerValAsn ProIle Ser
Cys
115 120 125
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
9
Lys Leu Pro Asp Gly Phe Ser Gln Leu Leu Asn Leu Thr Gln Leu Tyr
130 135 140
Leu Asn Asp Ala Phe Leu Glu Phe Leu Pro Ala Asn Phe Gly Arg Leu
145 150 155 160
Thr Lys Leu Gln Ile Leu Glu Leu Arg Glu Asn Gln Leu Lys Met Leu
165 170 175
Pro Lys Thr Met Asn Arg Leu Thr Gln Leu Glu Arg Leu Asp Leu Gly
180 185 190
Ser Asn Glu Phe Thr Glu Val Pro Glu Val Leu Glu Gln Leu Ser Gly
195 200 205
Leu Lys Glu Phe Trp Met Asp Ala Asn Arg Leu Thr Phe Ile Pro Gly
210 215 220
Phe Ile Gly Ser Leu Lys Gln Leu Thr Tyr Leu Asp Val Ser Lys Asn
225 230 235 240
Asn Ile Glu Met Val Glu Glu Gly Ile Ser Thr Cys Glu Asn Leu Gln
245 250 255
Asp Leu Leu Leu Ser Ser Asn Ser Leu Gln Gln Leu Pro Glu Thr Ile
260 265 270
Gly Ser Leu Lys Asn Ile Thr Thr Leu Lys Ile Asp Glu Asn Gln Leu
275 280 285
Met Tyr Leu Pro Asp Ser Ile Gly Gly Leu Ile Ser Val Glu Glu Leu
290 295 300
Asp Cys Ser Phe Asn Glu Val Glu Ala Leu Pro Ser Ser Ile Gly Gln
305 310 315 320
Leu Thr Asn Leu Arg Thr Phe Ala Ala Asp His Asn Tyr Leu Gln Gln
325 330 335
Leu Pro Pro Glu Ile Gly Ser Trp Lys Asn Ile Thr Val Leu Phe Leu
340 345 350
His Ser Asn Lys Leu Glu Thr Leu Pro Glu Glu Met Gly Asp Met Gln
355 360 365
Lys Leu Lys Val Ile Asn Leu Ser Asp Asn Arg Leu Lys Asn Leu Pro
370 375 380
Phe Ser Phe Thr Lys Leu Gln Gln Leu Thr Ala Met Trp Leu Ser Asp
385 390 395 400
Asn Gln Ser Lys Pro Leu Ile Pro Leu Gln Lys Glu Thr Asp Ser Glu
405 410 415
Thr Gln Lys Met Val Leu Thr Asn Tyr Met Phe Pro Gln Gln Pro Arg
420 425 430
Thr Glu Asp Val Met Phe Ile Ser Asp Asn Glu Ser Phe Asn Pro Ser
435 440 445
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
Leu Trp Glu Glu Gln Arg Lys Gln Arg Ala Gln Val Ala Phe Glu Cys
450 455 460
Asp Glu Asp Lys Asp Glu Arg Glu Ala Pro Pro Arg Glu Gly Asn Leu
465 470 475 480
Lys Arg Tyr Pro Thr Pro Tyr Pro Asp Glu Leu Lys Asn Met Val Lys
485 490 495
Thr Val Gln Thr Ile Val His Arg Leu Lys Asp Glu Glu Thr Asn Glu
500 505 510
Asp Ser Gly Arg Asp Leu Lys Pro His Glu Asp Gln Gln Asp Ile Asn
515 520 525
Lys Asp Val Gly Val Lys Thr Ser Glu Ser Thr Thr Thr Val Lys Ser
530 535 540
Lys Val Asp Glu Arg Glu Lys Tyr Met Ile Gly Asn Ser Val Gln Lys
545 550 555 560
Ile Ser Glu Pro Glu Ala Glu Ile Ser Pro Gly Ser Leu Pro Val Thr
565 570 575
Ala Asn Met Lys Ala Ser Glu Asn Leu Lys His Ile Val Asn His Asp
580 585 590
Asp Val Phe Glu Glu Ser Glu Glu Leu Ser Ser Asp Glu Glu Met Lys
595 600 605
Met Ala Glu Met Arg Pro Pro Leu Ile Glu Thr Ser Ile Asn Gln Pro
610 615 620
Lys Val Val Ala Leu Ser Asn Asn Lys Lys Asp Asp Thr Lys Glu Thr
625 630 635 640
Asp Ser Leu Ser Asp Glu Val Thr His Asn Ser Asn Gln Asn Asn Ser
645 650 655
Asn Cys Ser Ser Pro Ser Arg Met Ser Asp Ser Val Ser Leu Asn Thr
660 665 670
Asp Ser Ser Gln Asp Thr Ser Leu Cys Ser Pro Val Lys Gln Thr His
675 680 685
Ile Asp Ile Asn Ser Lys Ile Arg Gln Glu Asp Glu Asn Phe Asn Ser
690 695 700
Leu Leu Gln Asn Gly Asp Ile Leu Asn Ser Ser Thr Glu Glu Lys Phe
705 710 715 720
Lys Ala His Asp Lys Lys Asp Phe Asn Leu Pro Glu Tyr Asp Leu Asn
725 730 735
Val Glu Glu Arg Leu Val Leu Ile Glu Lys Ser Val Asp Ser Thr Ala
740 745 750
Thr Ala Asp Asp Thr His Lys Leu Asp His Ile Asn Met Asn Leu Asn
755 760 765
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
11
Lys Leu Ile Thr Asn Asp Thr Phe Gln Pro Glu Ile Met Glu Arg Ser
770 775 780
Lys Thr Gln Asp Ile Val Leu Gly Thr Ser Phe Leu Ser Ile Asn Ser
785 790 795 800
Lys Glu Glu Thr Glu His Leu Glu Asn Gly Asn Lys Tyr Pro Asn Leu
805 810 815
Glu Ser Val Asn Lys Val Asn Gly His Ser Glu Glu Thr Ser Gln Ser
820 825 830
Pro Asn Arg Thr Glu Pro His Asp Ser Asp Cys Ser Val Asp Leu Gly
835 840 845
Ile Ser Lys Ser Thr Glu Asp Leu Ser Pro Gln Lys Ser Gly Pro Val
850 855 860
Gly Ser Val Val Lys Ser His Ser Ile Thr Asn Met Glu Ile Gly Gly
865 870 875 880
Leu Lys Ile Tyr Asp Ile Leu Ser Asp Asn Gly Pro Gln Gln Pro Ser
885 890 895
Thr Thr Val Lys Ile Thr Ser Ala Val Asp Gly Lys Asn Ile Val Arg
900 905 910
Ser Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val Phe Thr
915 920 925
Gly Ser Ser Ser Ser Ser Asp Leu Ile Ser Gly Thr Lys Ala Ile Phe
930 935 940
Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asn Ile Ile Arg Gly
945 950 955 960
Pro Thr Ser Gly Pro Gln Ser Ala Pro Gln Ile Tyr Gly Pro Pro Gln
965 970 975
Tyr Asn Ile Gln Tyr Ser Ser Ser Ala Ala Val Lys Asp Thr Leu Trp
980 985 990
His Ser Lys Gln Asn Pro Gln Ile Asp His Ala Ser Phe Pro Pro Gln
995 1000 1005
Leu Leu Pro Arg Ser Glu Ser Thr Glu Asn Gln Ser Tyr Ala Lys His
1010 1015 1020
Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg Ala Asn Thr
025 1030 1035 1040
Ala Tyr His Leu His Gln Arg Leu Gly Pro Ala Arg His Gly Glu Met
1045 1050 1055
Trp Ala Ile Ser Pro Asn Asp Arg Leu Ile Pro Ala Val Thr Arg Ser
1060 1065 1070
Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser Val Asn Leu
1075 1080 1085
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
12
Gly Asp Pro Gly Ser Thr Arg Arg Ala Gln Ile Pro Glu Gly Asp Tyr
1090 1095 1100
Leu Ser Tyr Arg Glu Phe His Ser Ala Gly Arg Thr Pro Pro Met Met
105 1110 1115 1120
Pro Gly Ser Gln Arg Pro Leu Ser Ala Arg Thr Tyr Ser Ile Asp Gly
1125 1130 1135
Pro Asn Ala Ser Arg Pro G1n Ser Ala Arg Pro Ser Ile Asn Glu Ile
1140 1145 1150
Pro Glu Arg Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser
1155 1160 1165
Pro Ser Lys Arg Pro Asn Ala Arg Val Gly Ser Glu His Ser Leu Leu
1170 1175 1180
Asp Pro Pro Gly Lys Ser Lys Val Pro Arg Asp Trp Arg Glu Gln Val
185 1190 1195 1200
Leu Arg His Ile Glu Ala Lys Lys Leu Glu Lys Met Pro Leu Ser Asn
1205 1210 1215
Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala Asn Tyr Ser Gln Ile
1220 1225 1230
His His Pro Pro Gln Ala Ser Val Ala Arg His Pro Ser Arg Glu Gln
1235 1240 1245
Leu Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln Pro Pro Tyr Thr
1250 1255 1260
Gln Pro His Cys Ser Pro Arg Gln Gly His Glu Leu Ala Lys Gln Glu
265 1270 1275 1280
Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly Phe Ser Ile Ser
1285 1290 1295
Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro Asp Asp Asp Gly
1300 1305 1310
Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala Ser Lys Leu Leu
1315 1320 1325
Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr Ser Phe Ile Asn
1330 1335 1340
Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr Phe Gln Asn Thr
345 1350 1355 1360
Val Glu Leu Ile Ile Val Arg Glu Val Ser Ser
1365 1370
<210> 3
<211> 1647
<212> ADN
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
13
<213> Mus musculus
<220>
<221> CDS
<222> (1)..(1485)
<400> 3
gcg tcc ggc aag tct gcc aca ctg ctg tat gat cag ccc ctg cag gtg 48
Ala Ser Gly Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val
1 5 10 15
ttc act gct gcc tcc tca tct tct gag tta ctg tca ggt aca aag gca 96
Phe Thr Ala Ala Ser Ser Ser Ser Glu Leu Leu Ser Gly Thr Lys Ala
20 25 30
gtt ttc aag ttt gat tca aat cac aac cct gaa gag cca gat ata ata 144
Val Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asp Ile Ile
35 40 45
aga gct gcc aca gta tct ggc cca cag tct aca cct cac ctg tat ggt 192
Arg Ala Ala Thr Val Ser Gly Pro Gln Ser Thr Pro His Leu Tyr Gly
50 55 60
ccc cca caa tat aat gtc cag tac agt ggc agt gct aca gtg aaa gac 240
Pro Pro Gln Tyr Asn Val Gln Tyr Ser Gly Ser Ala Thr Val Lys Asp
65 70 75 80
acc ttg tgg cac cct aaa cag aat cca caa ata gat cct gtc agt ttt 288
Thr Leu Trp His Pro Lys Gln Asn Pro Gln Ile Asp Pro Val Ser Phe
85 90 95
cct cct cag cgc ctt cca aga tct gag agt gca gaa aat cac agt tat 336
Pro Pro Gln Arg Leu Pro Arg Ser Glu Ser Ala Glu Asn His Ser Tyr
100 105 ï10
gca aag cat tct gcc aac atg aat ttc tct aac cat aac aat gtt aga 384
Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg
115 120 125
gcc aat act gga tac cac tta caa cag aga ctt gcc cca gcc agg cat 432
Ala Asn Thr Gly Tyr His Leu Gln Gln Arg Leu Ala Pro Ala Arg His
130 135 140
gga gaa atg tgg gct atc tcc ccg aat gac cga cta gtg cca gca gtc 480
Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Val Pro Ala Val
145 150 155 160
act cgg act act att cag aga cag agt agc gtg tct tca acg gct tct 528
Thr Arg Thr Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser
165 170 175
gta aat ctc ggt gac ccc aca agg cgt act gaa gga gat tac tta tcg 576
Val Asn Leu Gly Asp Pro Thr Arg Arg Thr Glu Gly Asp Tyr Leu Ser
180 185 190
tac aga gag tta cat tca atg gga aga act cca gtc atg tca gga tca 624
Tyr Arg Glu Leu His Ser Met Gly Arg Thr Pro Val Met Ser Gly Ser
195 200 205
cag aga cct ctt tct gca cga gcg tac agc atc gat ggc cca aat aca 672
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
14
Gln Arg Pro Leu Ser Ala Arg Ala Tyr Ser Ile Asp Gly Pro Asn Thr
210 215 220
tcc agg cct cag agt gcc cgt ccc tct att aat gaa ata cca gag aga 720
Ser Arg Pro Gln Ser Ala Arg Pro Ser Ile Asn Glu Ile Pro Glu Arg
225 230 235 240
act atg tca gtt agt gat ttc aat tac tca cgg act agt cct tca aaa 768
Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser Pro Ser Lys
245 250 255
aga cca aat aca agg gtc ggg tct gaa cat tct ctg tta gat cct cca 816
Arg Pro Asn Thr Arg Val Gly Ser Glu His Ser Leu Leu Asp Pro Pro
260 265 270
gga aaa agc aag gtt cct cat gac tgg cgg gaa caa gta cta cga cac 864
Gly Lys Ser Lys Val Pro His Asp Trp Arg Glu Gln Val Leu Arg His
275 280 285
att gag gcc aaa aag tta gaa aag cat ccg cag aca tcc agt cca gga 912
Ile Glu Ala Lys Lys Leu Glu Lys His Pro Gln Thr Ser Ser Pro Gly
290 295 300
gag tgt tgc caa gat gat aga ttc atg tca gaa gag cag aac cac cca 960
Glu Cys Cys Gln Asp Asp Arg Phe Met Ser Glu Glu Gln Asn His Pro
305 310 315 320
tca ggt gca ctt agt cac aga ggt ctt cca gac agc ctg atg aaa atg 1008
Ser Gly Ala Leu Ser His Arg Gly Leu Pro Asp Ser Leu Met Lys Met
325 330 335
cct ttg agt aat gga caa atg ggc cag cct ctc agg cct cag gca cat 1056
Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala His
340 345 350
tat agt caa acc cat cac ccc cct cag gca tct gtg gca agg cat ccc 1104
Tyr Ser Gln Thr His His Pro Pro Gln Ala Ser Val Ala Arg His Pro
355 360 365
tct aga gaa caa cta att gat tat ttg atg ctg aaa gtg gcc cac cag 1152
Ser Arg Glu Gln Leu Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln
370 375 380
cct cca tat aca cat ccc cat tgt tct cct aga caa ggc cat gaa ctg 1200
Pro Pro Tyr Thr His Pro His Cys Ser Pro Arg Gln Gly His Glu Leu
385 390 395 400
gca aag caa gag att cga gta aga gta gaa aag gat cca gaa ctt gga 1248
Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly
405 410 415
ttt agc ata tca gga ggt gtc ggc ggc aga gga aac cct ttc aga cct 1296
Phe Ser Ile Ser Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro
420 425 430
gat gat gat ggt ata ttt gta aca agg gta caa cct gaa gga cca gca 1344
Asp Asp Asp Gly Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala
435 440 445
tca aaa tta cta cag cca gga gat aaa att att cag gct aat ggc tac 1392
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
Ser Lys Leu Leu Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr
450 455 460
agt ttt atc aac att gaa cat ggg caa gcg gtg tcc ttg tta aaa act 1440
Ser Phe Ile Asn Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr
465 470 475 480
ttc cat aat gca gta gat ctc atc att gta cga gaa gtt tct tca 1485
Phe His Asn Ala Val Asp Leu Ile Ile Val Arg Glu Val Ser Ser
485 490 495
taagcactat agacaaaaac aatgggggaa gatagcaaga tttatggaag acacttgcaa 1545
gggaaatgac tattttgctt atttttatat ataaagaaga actcaactgt tggtttgaaa 1605
cttgtacatt actgaaataa tggaccttgt ggttagaggg aa 1647
<210> 4
<211> 495
<212> PRT
<213> Mus musculus
<400> 4
Ala Ser Gly Lys Ser Ala Thr Leu Leu Tyr Asp Gln Pro Leu Gln Val
1 5 10 15
Phe Thr Ala Ala Ser Ser Ser Ser Glu Leu Leu Ser Gly Thr Lys Ala
25 30
Val Phe Lys Phe Asp Ser Asn His Asn Pro Glu Glu Pro Asp Ile Ile
35 40 45
Arg Ala Ala Thr Val Ser Giy Pro Gl~ Ser Thr Pro His Leu Tyr Gly
50 55 60
Pro Pro Gln Tyr Asn Val Gln Tyr Ser Gly Ser Ala Thr Val Lys Asp
65 70 75 80
Thr Leu Trp His Pro Lys Gln Asn Pro Gln Ile Asp Pro Val Ser Phe
85 90 95
Pro Pro Gln Arg Leu Pro Arg Ser Glu Ser Ala Glu Asn His Ser Tyr
100 105 110
Ala Lys His Ser Ala Asn Met Asn Phe Ser Asn His Asn Asn Val Arg
115 120 125
Ala Asn Thr Gly Tyr His Leu Gln Gln Arg Leu Ala Pro Ala Arg His
130 135 140
Gly Glu Met Trp Ala Ile Ser Pro Asn Asp Arg Leu Val Pro Ala Val
145 150 155 160
Thr Arg Thr Thr Ile Gln Arg Gln Ser Ser Val Ser Ser Thr Ala Ser
165 170 175
Val Asn Leu Gly Asp Pro Thr Arg Arg Thr Glu Gly Asp Tyr Leu Ser
180 185 190
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
16
Tyr Arg Glu Leu His Ser Met Gly Arg Thr Pro Val Met Ser Gly Ser
195 200 205
Gln Arg Pro Leu Ser Ala Arg Ala Tyr Ser Ile Asp Gly Pro Asn Thr
210 215 220
Ser Arg Pro Gln Ser Ala Arg Pro Ser Ile Asn Glu Ile Pro Glu Arg
225 230 235 240
Thr Met Ser Val Ser Asp Phe Asn Tyr Ser Arg Thr Ser Pro Ser Lys
245 250 255
Arg Pro Asn Thr Arg Val Gly Ser Glu His Ser Leu Leu Asp Pro Pro
260 265 270
Gly Lys Ser Lys Val Pro His Asp Trp Arg Glu Gln Val Leu Arg His
275 280 285
Ile Glu Ala Lys Lys Leu Glu Lys His Pro Gln Thr Ser Ser Pro Gly
290 295 300
Glu Cys Cys Gln Asp Asp Arg Phe Met Ser Glu Glu Gln Asn His Pro
305 310 315 320
Ser Gly Ala Leu Ser His Arg Gly Leu Pro Asp Ser Leu Met Lys Met
325 330 335
Pro Leu Ser Asn Gly Gln Met Gly Gln Pro Leu Arg Pro Gln Ala His
340 345 350
Tyr Ser Gln Thr His His Pro Pro Gln Ala Ser Val Ala Arg His Pro
355 360 365
Ser Arg Glu Gln Len Ile Asp Tyr Leu Met Leu Lys Val Ala His Gln
370 375 380
Pro Pro Tyr Thr His Pro His Cys Ser Pro Arg Gln Gly His Glu Leu
385 390 395 400
Ala Lys Gln Glu Ile Arg Val Arg Val Glu Lys Asp Pro Glu Leu Gly
405 410 415
Phe Ser Ile Ser Gly Gly Val Gly Gly Arg Gly Asn Pro Phe Arg Pro
420 425 430
Asp Asp Asp Gly Ile Phe Val Thr Arg Val Gln Pro Glu Gly Pro Ala
435 440 445
Ser Lys Leu Leu Gln Pro Gly Asp Lys Ile Ile Gln Ala Asn Gly Tyr
450 455 460
Ser Phe Ile Asn Ile Glu His Gly Gln Ala Val Ser Leu Leu Lys Thr
465 470 475 480
Phe His Asn Ala Val Asp Leu Ile Ile Val Arg Glu Val Ser Ser
485 490 495
<210> 5
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
17
<211> 3996
<212> ADN
<213> Mus musculus
<400> 5
gcggccgcgg taggatcagg cttgtagtcc taacttccga ggctgaggca ggaggctcac 60
ttgcctccag gaggccagcc gaggctacat gagaccttgt ctcaaacaaa caaacaaaca 120
aacaaacaga gtaagtaaag aaaaatctga atttagtctg acatttgaat tactcttttt 180
gtagcctttg tccacaaaag ttttgagtgt gcatgctatg tggcttccta gaacaaatca 240
catatttaat actccttttc tctattaatt gtcctgttat aattttgtat ccatttgctc 300
tgtgaagaca aattattaga aactttcaat ttttcaatat catatccaaa atacagtgtc 360
tttcagatta catacattag gtaataacat cccataccat tcattatatt tctaaatcta 420
gaatggtttc tgggaaatgc attttttaaa aagccatatc atccaggttc ttatacaccg 480
tcactgaaca cttatttgtt cagacgtgtt tgttaatgta tggtatgtga gaatcgtagt 540
ttgaatcact gaagtaattc tatgcaattg aactttctat aatgatggga atattatgta 600
atgtttgagc cactttggta tccttagtag ggaataagga aatgacattt taaattttat 660
ttgatttaac cttaatatta agcatgtata tctactggct accataccgg acatcaggta 720
gcaggttatc ttattagtat acaacgataa gcttaatccc tttttatcag ttacattcct 780
tattgaatga attgtttatt cctggtggta aaatgtgcat ttttataaac attaagtttt 840
tataaacaca aagttttcct ctaaaatctt tatctagaaa taagcataca aaaaaagaga 900
atagaattct tactctgtgt gtgtgatcgg attctaaccc aggacaagcc atacatggtc 960
atgttgtcat tgcctcagat gaaaacatcg ggtgtttcac ttactagatt tttaaaaaat 1020
ctttaaatag tgtataaata gacctattga tactaggttt tgaggatcta gttcaaatgt 1080
atattatatg ctttttcaaa aatctgtttt atgagtctgt gtagttctaa aaaagcaact 1140
cttaagtacc atgttaaaga tctttatttt tgactgttgt ttgtagttaa gaaaatctgg 1200
ttctctatgg aagcagtagg atattctcta aaaaattgta atgaagataa agaaaatatt 1260
tataaacatt atccaaagag ctacagcata gtgcctgatg attgagtaaa gtcagtgtag 1320
aaacagttgt actgggttgg ctgaagtatc gttaagtggg aagcagagcc tttagtgcca 1380
cattgtatcc tgaggtaagg aaaaaccaat gttggttgta tacactttac ttaaacattc 1440
gcattttgtt cataaatgat tattctttta agtaattaga gtatttaaag tattgccttg 1500
ctgatttttt gttactttct tatattttat gcctgaggtc ttactgattt aactctggct 1560
taatgctgtt taaaagtatt gtttctgtac ctaaggcaag aattatattc atgtacaaag 1620
aattactaac caattggtga tcattctcat tttcttaagt aatttcactg ctagtttact 1680
cttagcctag ttagaattta tacacaactt cttaataaaa ctggccttgt gaatttttat 1740
taattcaaag ttggctttct ctccctgtta actgagagac tgtattttaa gtgagtttat 1800
gcatatataa tcttaaacaa cttagaacct ataagctagt attagattaa aacaaaatta 1860
tacttggagt agatgggact tttcatgtag gagaatcata agaaagttaa atgtggttga 1920
tctctgatga acggttgaga agacctgaaa atgtctgcac agtcatttcc tattcagaaa 1980
tgcacagtca ggttcttgac taagagacag aactcttagt tggaaattag aggaaaacct 2040
tttactgttt ttaacagcta agcagacttc acaacgcatg gttttataaa aacgtaggag 2100
tattttgttt tgtgttgtat tcttggattg ttttgtaaag taccagagag cctgagttta 2160
atttgaagtc cagtagactg tcaactgttg atattaatag gctcagttgg gtgtatgtgg 2220
tggtggaggt attgtttgtc tgtggcatgt ggaattgtgc tgtatggacg gtcatttgtt 2280
ggaaaagttg ttgttatatt atatgcattc tgatttgttt ttatgttcat gctgcagcat 2340
ttaaaaatga ctacaaaacg aagtttgttt gtgcggttgg taccatgtcg ctgtctacga 2400
ggagaagagg agacagtcac tactctagat tattctcatt gcagcttgga acaagttccc 2460
aaagagattt tcacctttga aaaaacttta gaggagctct atttagatgc taatcagatt 2520
gaagagcttc caaaggtatg ttaatactat caagaattat attaggtaat gtctatgcat 2580
agcagtttat attcttatat tgttgtatat atgtgttcct gtttattggt ttagtcttac 2640
tgtaagcaca attcaaaatg atgtagaact ttgttcaagt tgtttaagta cttgtgtgga 2700
taattgaatt ttatttttac ttataacaat taaaatagat aatcagtata tatgacttct 2760
ggaaccatta gatttaacca gactaagaaa agtgaactct tactgtaatt tctataagca 2820
ctttatatgc attgctaaca ttgttacttc cattgctaca gcttttatgg ttctgtaact 2880
tcttagaggt gggattctgc tgttttccat tttgtatgga attgatttgg agacagtgca 2940
tctctgaagt ctagtaacaa ctggtagggg acagattgct gctgtgacgt tctttctcag 3000
attgccactg tgtttattat tgttatttta gtaagctctt ttttctctta tctgtgtttg 3060
ttttcctgtg tatgaaaagg ttgcagtagc tttaaattgt ttattacagt ctgtatccct 3120
ctgaatggca gacagggtct taccttgtag actagactgt cctcaactct cagagatctg 3180
cctgcccttg ctttccaagg ctgtggttga aggtgtacac caccttgctc tttgaagctg 3240
taaatggaga cttgaaattg atggcttaaa aaacaagtta gactttggca tggtggtacc 3300
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
18
taaatgagaa agatttctag ttcaaggcca gtctgaccta cacagtgggt tctgtcatgg 3360
cctggatcat atatataatc agaccttggt ttcaaaacct cctgaccatg gtcacgaatg 3420
aacaatttaa tatgcattac cagaattctg aaaaataaac tgtaatttgg actatgagat 3480
ttagacgaca aaattataga atacttagaa tttctgatga aaaagaaatc gtgtaaatgt 3540
gcagtgtgta ggataaacta aaaaactgtt tatctgaaat tcacatttaa ttgggtgtct 3600
cgtaattaat ccagcaaccc taactgaaat gtaacaggta atatatcttg ttgcatatag 3660
actttattta atgaaatagt tgttttcaat atttatgttt gtgaacattc tgaatgacag 3720
tattcaaaag catttgaaag ccactgctgt cctaggtaat gaagttttac aaaactttat 3780
tgagacagga tctcactttg tgatctagac aaacttcaaa cttcattgca atcctcctgc 3840
ctcagcttcc cagatctggg gattataggc tgagccacta tgcctggttt attcttaata 3900
atgtggagaa gtctagaact tttctatttg tgcacagtaa aggtcttcag tttaacatgg 3960
atttgtgaat cacacctgat gcctgcgatt gtagtg 3996
<210> 6
<211> 144
<212> ADN
<213> Homo sapiens
<400> 6
agcatgctgt caaggtcctt taattccaat tttactactg taagcagttt tcactgtggc 60
agctctaggg atctgcatgg cagccagggc agtcttgcct tgagtgttgc agacagaaga 120
ggttctggtg ggcacatttt tcga 144
<210> 7
<211> 48
<212> PRT
<213> Homo sapiens
<400> 7
Ser Met Leu Ser Arg Ser Phe Asn Ser Asn Phe Thr Thr Val Ser Ser
1 5 10 15
Phe His Cys Gly Ser Ser Arg Asp Leu His Gly Ser Gln Gly Ser Leu
20 25 30
Ala Leu Ser Val Ala Asp Arg Arg Gly Ser Gly Gly His Ile Phe Arg
35 40 45
<210> 8
<211> 676
<212> ADN
<213> Homo sapiens
<400> 8
ctcgagacca ggaagccagc ccgcacccca acccccacca aagccaccta ctcttcttct 60
gtgggaggcc agtccacatc cgctctcacc cgagagagat attcagctgg atccaaagtg 120
actgatgaag ggaaggaaat catgtcaagc gaagccttga aaaagctgcc ctgagacggt 180
gtcccgccga aagaatgttg gctcaattaa gaaacatcag ggagataaat tcaacccagt 240
gtgtctaaaa atgactacaa aacgaagttt gtttgtgcgg ttggtaccat gtcgctgtct 300
acgaggggaa gaggagactg tcactactct tgattattct cattgcagct tagaacaagt 360
tccgaaagag atttttactt ttgaaaaaac cttggaggaa ctctatttag atgctaatca 420
gattgaagag cttccaaagc aactttttaa ctgtcagtct ttacacaagc tgagtttgcc 480
agacaatgat ttaacaacgt taccagcatc cattgcaaac cttattaatc tcagggaact 540
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
19
ggatgtcagc aagaatggaa tacaggagtt tccagaaaat ataaaaaatt gtaaagtttt 600
gacaattgtg gaggccagtg taaaccctat ttccaagctc cctgatggat tttctcagct 660
gttaaaccta acccag 676
<210> 9
<211> 366
<212> ADN
<213> Homo sapiens
<400> 9
ccattcagac ctgatgatga tggtatattt gtaacaaggg tacaacctga aggaccagca 60
tcaaaattac tgcagccagg tgataaaatt attcaggcta atggctacag ttttataaat 120
attgaacatg gacaagcagt gtccttgcta aaaactttcc agaatacagt tgaactcatc 180
attgtacgag aagtttcctc ataagcactg tggacaaaaa aagcggggaa gacagcaaga 240
tttattggaa gatacttaca ggggaaatta atattttgac tatttttata tataaagaag 300
aactcaaaaa attatgttca aatttgtaca ttaatgaaat aatggataaa ggagactgtt 360
gaattc 366
<210> 10
<211> 31
<212> ADN
<213> Homo sapiens
<400> 10
gggaggccag tccacatccg ctctcacccg a 31
<210> 11
<211> 32
<212> ADN
<213> Homo sapiens
<400> 11
attcagctgg atccaaagtg actgatgaag gg 32
<210> 12
<211> 20
<212> ADN
<213> Homo sapiens
<400> 12
actacaaaac gaagtttgtg 20
<210> 13
<211> 22
<212> ADN
<213> Homo sapiens
<400> 13
gtttcctcag aatgtccatt ta 22
<210> 14
<211> 29
<212> ADN
<213> Homo sapiens
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
<400> 14
atgtggttca gtcctattag gagactggg 29
<210> 15
<211> 30
<212> ADN
<213> Homo sapiens
<400> 15
cagatccaac tggaccactt ttctgagggg 30
<210> 16
<211> 44
<212> ADN
<213> Homo sapiens
<400> 16
cagcagatgt gattttaacg gttgtacttg gctgctgagg tcca 44
<210> 17
<211> 31
<212> ADN
<213> Homo sapiens
<400> 17
gaggccccac aagtggccca caatctgcac c 31
<210> 18
<2i1> 33
<212> ADN
<213> Homo sapiens
<400> 18
cctcctcagc tccttcctag atcagagagc aca 33
<210> 19
<211> 29
<212> ADN
<213> Homo sapiens
<400> 19
cttccaataa atcttgctgt cttccccgc 29
<210> 20
<211> 29
<212> ADN
<213> Homo sapiens
<400> 20
atagtcaaaa tattaatttc ccctgtaag 29
<210> 21
CA 02405124 2002-10-04
WO 01/77323 PCT/FRO1/01078
21
<211> 9
<212> PRT
<213> Séquence artificielle
<220>
<223> Description de la séquence artificielle : extrémité C-terminale
de ERBB2/HER2
<400> 21
Glu Tyr Leu Gly Leu Asp Val Pro Val
1 5
1
21