Language selection

Search

Patent 2371500 Summary

Third-party information liability

Some of the information on this Web page has been provided by external sources. The Government of Canada is not responsible for the accuracy, reliability or currency of the information supplied by external sources. Users wishing to rely upon this information should consult directly with the source of the information. Content provided by external sources is not subject to official languages, privacy and accessibility requirements.

Claims and Abstract availability

Any discrepancies in the text and image of the Claims and Abstract are due to differing posting times. Text of the Claims and Abstract are posted:

  • At the time the application is open to public inspection;
  • At the time of issue of the patent (grant).
(12) Patent Application: (11) CA 2371500
(54) English Title: EXPRESSION PRODUCTS OF GENES INVOLVED IN DISEASES RELATED TO CHOLESTEROL METABOLISM
(54) French Title: PRODUITS D'EXPRESSION DE GENES IMPLIQUES DANS DES AFFECTIONS DU METABOLISME DU CHOLESTEROL
Status: Dead
Bibliographic Data
(51) International Patent Classification (IPC):
  • C12N 15/12 (2006.01)
  • C07K 14/47 (2006.01)
  • C12Q 1/68 (2006.01)
(72) Inventors :
  • DENEFLE, PATRICE (France)
  • ROSIER-MONTUS, MARIE-FRANCOISE (France)
  • ARNOULD-REGUIGNE, ISABELLE (France)
  • PRADES, CATHERINE (France)
  • CLEPET, CHRISTIAN (France)
(73) Owners :
  • AVENTIS PHARMA S.A. (France)
(71) Applicants :
  • AVENTIS PHARMA S.A. (France)
(74) Agent: ROBIC
(74) Associate agent:
(45) Issued:
(86) PCT Filing Date: 2000-05-25
(87) Open to Public Inspection: 2000-11-30
Availability of licence: N/A
(25) Language of filing: French

Patent Cooperation Treaty (PCT): Yes
(86) PCT Filing Number: PCT/FR2000/001426
(87) International Publication Number: WO2000/071710
(85) National Entry: 2001-10-24

(30) Application Priority Data:
Application No. Country/Territory Date
99/06587 France 1999-05-25
60/139,450 United States of America 1999-06-16

Abstracts

English Abstract

The invention concerns nucleic acids expressed from genes located in the human genome in the 9q31-34 region of chromosome 9, likely to be involved in diseases genetically related to said chromosomal locus, in particular diseases of the plasmatic lipoprotein metabolism, more particularly the reverse transport of cholesterol. The invention also concerns polypeptides encoded by certain nucleic acids and antibodies specifically directed against such polypeptides, useful as diagnostic reagents. The invention further concerns vectors and recombinant host cells comprising said nucleic acids or fragments thereof.


French Abstract




La présente invention concerne des acides nucléiques exprimés à partir de
gènes localisés dans le génome humain dans la région 9q31-34 du chromosome 9,
susceptibles d'être impliqués dans des maladies génétiquement liées à ce locus
chromosomique, notamment les affections du métabolisme des lipoprotéines
plasmatiques, plus particulièrement le transport inverse du cholestérol.
L'invention concerne également des polypeptides codés par certains de ces
acides nucléiques ainsi que des anticorps dirigés spécifiquement contre de
tels polypeptides, utiles comme réactifs de diagnostic. L'invention est enfin
relative à des vecteurs et des cellules hôtes recombinantes comprenant ces
acides nucléiques ou des fragments de ceux-ci.

Claims

Note: Claims are shown in the official language in which they were submitted.





143

REVENDICATIONS

1. Acide nucléique codant pour une protéine ayant une séquence
en acides aminés choisie dans le groupe des séquences d'aminoacides
SEQ ID N°129 à SEQ ID N°160 ou un fragment peptidique ou un
variant
de cette dernière, ou un acide nucléique de séquence complémentaire.

2. Acide nucléique comprenant au moins huit nucléotides
consécutifs d'un polynucléotide choisi dans le groupe constitué des
séquences nucléotidiques SEQ ID N°1 à SEQ ID N°81, ou un acide
nucléique de séquence complémentaire.

3. Acide nucléique selon la revendication 2 comprenant au moins
vingt nucléotides consécutifs d'un polynucléotide choisi dans le groupe
constitué des séquences nucléotidiques SEQ ID N°1 à SEQ ID N°81,
ou
un acide nucléique de séquence complémentaire.

4. Acide nucléique ayant au moins 80% d'identité en nucléotides
avec un acide nucléique selon l'une quelconque des revendications 1 à
3, ou un acide nucléique de séquence complémentaire.

5. Acide nucléique hybridant, dans des conditions d'hybridation de
forte stringence, avec un acide nucléique selon l'une quelconque des
revendications 1 à 4, ou un acide nucléique de séquence
complémentaire.

6. Sonde ou amorce nucléotidique comprenant au moins huit
nucléotides consécutifs d'un acide nucléique selon l'une quelconque des
revendications 1 à 5.



144

7. Sonde ou amorce nucléotidique selon la revendication 6 ayant
une longueur de 15 à 300 nucléotides.

8. Sonde ou amorce nucléotidique selon la revendication 6 ayant
une longueur de 20 à 200 nucléotides.

9. Sonde ou amorce nucléotidique comprenant au moins huit
nucléotides consécutifs d'un polynucléotide choisi parmi les séquences
SEQ ID N o 82 à 101 et 102 à 128.

10. Procédé pour l'amplification d'un acide nucléique selon l'une
quelconque des revendications 1 à 5 contenu dans un échantillon, ladite
méthode comprenant les étapes de:
a) mise en contact de l'échantillon dans lequel la présence de
l'acide nucléique cible est suspectée avec une paire d'amorces
nucléotidiques dont la position d'hybridation est localisée respectivement
du côté 5' et du côté 3' de la région de l'acide nucléique cible dont
l'amplification est recherchée, en présence des réactifs nécessaires à la
réaction d'amplification; et
b) détection des acides nucléiques amplifiés.

11. Procédé d'amplification selon la revendication 10, caractérisé
en ce que les amorces nucléotidiques sont choisies parmi les amorces
selon l'une quelconque des revendications 6 à 9.

12. Nécessaire pour l'amplification d'un acide nucléique selon
l'une quelconque des revendications 1 à 5 comprenant:


145

a) un couple d'amorces nucléotidiques dont la position
d'hybridation est localisée respectivement du côté 5' et du côté 3' de
l'acide nucléique cible dont l'amplification est recherchée; .
b) le cas échéant, les réactifs nécessaires à la réaction
d'amplification.

13. Nécessaire pour l'amplification d'un acide nucléique selon la
revendication 12, caractérisé en ce que les amorces nucléotidiques sont
choisies dans le groupe constitué des amorces selon l'une des
revendications 6 à 9.

14. Sonde nucléotidique selon l'une quelconque des
revendications 6 à 9, caractérisée en ce qu'elle comprend un composé
marqueur dont la présence est détectable.

15. Procédé de détection de la présence d'un acide nucléique
selon l'une quelconque des revendications 1 à 5 dans un échantillon,
ladite méthode comprenant les étapes de:
a) mettre en contact une ou plusieurs sondes nucléiques selon
l'une des revendications 6 à 9 et 14 avec l'échantillon à tester;
b) détecter le complexe éventuellement formé entre la ou les
sondes et l'acide nucléique présent dans l'échantillon.

16. Procédé de détection selon la revendication 15, caractérisé en
ce que la ou les sondes sont immobilisées sur un support.



146

17. Nécessaire pour la détection de la présence d'un acide
nucléique selon l'une quelconque des revendications 1 à 5 dans un
échantillon, ledit nécessaire comprenant:

a) une ou plusieurs sondes nucléotidiques selon l'une quelconque
des revendications 6 à 9 et 14;
b) le cas échéant, les réactifs nécessaires à la réaction
d'hybridation.

18. Nécessaire de détection selon la revendication 17, caractérisé
en ce que la ou les sondes sont immobilisées sur un support.

19. Vecteur recombinant comprenant un acide nucléique selon
l'une quelconque des revendications 1 à 5.

20. Cellule hôte recombinante comprenant un acide nucléique
selon l'une quelconque des revendications 1 à 5.

21. Cèllule hôte recombinante comprenant un vecteur
recombinant selon la revendication 18.

22. Polypeptide choisi dans le groupe des polypeptides suivants:
a) un polypeptide comprenant une séquence d'au moins 15 acides
aminés choisi dans le groupe constitué des peptides de séquences SEQ
ID No129 à SEQ ID No160, ou un fragment peptidique ou un variant de
ce dernier ;
b) un polypeptide ayant au moins 80% d'identité en acides aminés avec
un polypeptide tel que défini en a).

23. Polypeptide comprenant des modifications d'acides aminés
de 1 ,2, 3, 4, 5, 10 à 20 substitutions, additions ou délétions d'un acide




147
aminé par rapport à la séquence en acides aminés d'un polypeptide
selon la revendication 21.
24. Anticorps dirigé contre un polypeptide selon l'une des
revendications 21 ou 22.
25. Anticorps selon la revendication 23, caractérisé en ce qu'il
comprend un composé détectable.
26. Procédé pour détecter la présence d'un polypeptide selon
l'une des revendications 21 ou 22 dans un échantillon, comprenant les
étapes de:
a) mise en contact de l'échantillon avec un anticorps selon l'une
des revendications 23 ou 24;
b) détection du complexe antigène/anticorps formé .
27. Nécessaire de diagnostic pour la détection de la présence
d'un polypeptide selon l'une des revendications 21 ou 22 dans un
échantillon, ledit nécessaire comprenant:
a) un anticorps selon l'une des revendications 23 ou 24;
b) un réactif permettant la détection des complexes
antigènes/anticorps formés.
28. Procédé pour le criblage d'une molécule ou d'une substance
candidate interagissant avec un polypeptide selon l'une des
revendications 21 ou 22, ladite méthode comprenant les étapes de:


148
a) mettre en contact un polypeptide selon l'une des revendications
21 ou 22 avec la substance ou molécule candidate;
b) détecter les complexes éventuellement formés entre ledit
polypeptide et ladite substance candidate.
29. Nécessaire pour le criblage d'une molécule ou substance
candidate interagissant avec un polypeptide selon l'une des
revendications 21 ou 22, ledit nécessaire comprenant
a) un polypeptide selon l'une des revendications 21 ou 22:
b) le cas échéant, des moyens nécessaires à la détection du
complexe formé entre ledit polypeptide et la molécule ou substance
candidate

Description

Note: Descriptions are shown in the official language in which they were submitted.





DEMANDES OU BREVETS VOLUMINEUX
LA PRÉSENTE PARTIE I)E CETTE DEMANDE OU CE BREVETS
COMPRI~:ND PLUS D'UN TOME.
CECI EST ~.E TOME 1 DE 2
NOTE: Pour les tomes additionels, veillez contacter le Bureau Canadien des
Brevets.
JUMBO APPLICATIONS / PATENTS
THIS SECTION OF THE APPLICATION / PATENT CONTAINS MORE
THAN ONE VOLUME.
TRIS IS VOLUME 1 OF 2
NOTE: For additional vohxmes please contact the Canadian Patent Oi~ice.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
2
La plupart des apolipoprotéines possèdent des régions
amphipatiques en hélice (apolipoprotéine A-I, A-II, A-IV, C-I, C-II, C-III et
E).
La densité des particules de lipoprotéine est inversement
proportionnelle à leur taille, leur densité reflétant les quantités relatives
de lipides non polaires de faible densité contenues dans le noyau et de
protéines de surface de haute densité présentes.
Parmi les lipoprotéines de grande taille on connait les
chylomicrons, sécrétés par les entérocytes, dans lesquels l'apo B-48 est
io majoritaire, et les VLDL, sécrétées par les hépatocytes, qui contiennent
la protéine apo B-100.
Les classes de lipoprotéines les plus petites, LDL et HDL,
contiennent majoritairement des esters de cholestérol dans leur noyau.
Les formes matures de ces particules ne sont pas sécrétées directement
~s à partir des cellules mais sont plus particulièrement produites par des
voies métaboliques au sein du plasma sanguin.
Les particules LDL représentent les produits finaux du
métabolisme des particules VLDL.
Certains composants des particules HDL sont dérivés à partir des
2o chylomicrons.
Ainsi, les lipoprotéines de haute densité (HDL) sont l'une des
quatre classes majeures de lipoprotéines qui circulent dans le plasma
sanguin .
Ces lipoprotéines sont impliquées dans différentes voies
2s métaboliques telles que le transport lipidique, la formation des acides
biliaires, la stéroïdogénèse, la prolifération cellulaire et en outre
interfèrent avec les systèmes de protéinase plasmatique.
Les HDL sont de parfaits accépteurs de cholestérol libre et, en
combinaison avec les protéines de transfert d'ester de cholestérol
30 (CETP), la lipoprotéine lipase (LPL), la lipase hépatique (HL) et la
lécithine : cholestérol acyltransférase (LCAT), jouent un rôle majeur dans
le transport inverse du cholestérol, c'est à dire le transport du cholestérol
en excès dans les cellules périphériques vers le foie pour son élimination
de l'organisme sous forme d'acide biliaire.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
3
Les HDL ne transportent pas seulement le cholestérol des cellules
périphériques vers le foie mais le distribuent également aux cellules
productrices de stéroïdes ou aux cellules périphériques appauvries en
cholestérol.
Les précurseurs des HDL sont sécrétés sous forme discoidale à
partir de l'intestin et du foie, à partir desquels les particules sphériques
sont formées grâce à la formation d'esters de cholestérol qui migrent au
coeur de la particule lipoprotéique.
Les particules naissantes de HDL contiennent des apo A-I et apo
~o A-IV, alors que les particules de HDL hépatiques naissantes sont riches
en apo A-I, apo E et apo A-II.
La partie lipidique de ces particules consiste en des
phospholipides et de petites quantités de cholestérol libre et de
triglycéride.
II a été démontré que les HDL jouent un rôle central dans le
transport du cholestérol des tissus périphériques vers le foie.
L'excès de cholestérol non estérifié des cellules périphériques
riches en cholestérol est capté par les HDL et subit une estérification par
l'action de la LCAT. Ces HDL enrichies en esters de cholestérol sont
2o captées par des protéines de liaison ou récepteurs des HDL à la surface
des hépatocytes et y délivrent leurs esters de cholestérol.
Le rôle protecteur des HDL dans le transport inverse du
cholestérol est confirmée par les études épidémiologiques démontrant
une relation inverse entre les concentrations de cholestérol dans ces
25 HDL et le risque d'apparition de maladies coronariennes, ou encore par
des observations selon lesquelles les HDL acceptent efficacement les
excès de cholestérol intracellulaire à partir de types cellulaires variés.
Les lipoprotéines athérogènes sont ingérées par les macrophages
ou cellules périphériques et dégradées dans les lysosomes. Le
3o cholestérol est relargué des lysosomes et. est ré-estérifié dans le
compartiment cytoplasmique.
II a été en particulier montré que les HDL riches en apo A-I
stimulent les flux de cholestérol à partir des macrophages ou des
cellules périphériques vers le compartiment extracellulaire, suite à une


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
4
interaction avec des protéines de liaison des HDL présentes à la surface
de ces cellules.
Diverses maladies liées à une déficience en HDL ont été décrites;
s comprenant la maladie de Tangier, la déficience en HDL et la déficience
en LCAT.
La déficience impliquée dans la maladie de Tangier est reliée à un
déficit cellulaire dans la translocation du cholestérol cellulaire dans
lequel les précurseurs de HDL sont dégradés dans les lysosomes.
io Néanmoins, pour la maladie de Tangier, la nature exacte du déficit n'a
pas encore été précisément définie.
Dans la maladie de Tangier, ce déficit cellulaire conduit à une
perturbation du métabolisme lipoprotéique. Les HDL n'incorporant pas
de cholestérol à partir des cellules périphériques et ne pouvant pas être
~s métabolisée correctement, sont éliminée rapidement de l'organisme. La
concentration plasmatique en HDL de ces patients est donc
extrêmement réduite et les HDL n'assurent plus le retour du cholestérol
vers le foie. Ce cholestérol s'accumule dans ces cellules périphériques
et provoquent des manifestations cliniques caractéristiques telles que la
2o formation d'amygdales orangées. De plus, d'autres perturbations
lipoprotéiques comme une surproduction de triglycérides ainsi qu'une
synthèse et un catabolisme intracellulaire accrus des phospholipides
sont observées.
La maladie de Tangier, dont les symptômes ont été décrits ci
2s dessus, est classée parmi les affections familiales liées au métabolisme
des HDL qui sont les plus couramment détectées chez les patients
affectés de maladies coronariennes.
De nombreuses études ont montré qu'un niveau réduit de
cholestérol HDL est un excellent facteur de risque permettant de dépister
~o une affection coronarienne.
Dans ce contexte, des syndromes liés aux déficiences en HDL ont
présenté un intérét accru durant la décennie passée du fait qu'elles
permettent d'accroître la compréhension du rôle des HDL dans
l'athérogénèse.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
J
Plusieurs mutations dans le gène apo A-I ont été caractérisées.
Ces mutations sont rares et peuvent conduire à une absence de
production de apo A-I.
Des mutations dans les gènes codant pour la lipoprotéine lipase
(LPL) ou son activateur apoC-II sont associées avec des
hypertriglycéridémies sévères et des niveaux de HDL-c fortement
réd u its.
Des mutations dans le gène codant pour l'enzyme lécithine:
cholestérol, acyltransférase (LCAT) sont également associées à une
to déficience sévère en HDL.
II existe donc un besoin croissânt dans l'état de la technique
d'identifier des gènes impliqués dans le métabolisme du cholestérol
etlou des lipoprotéines, et en particulier de gènes associés à des
dysfonctionnements du transport inverse du cholestérol des cellules
is périphériques vers le foie.
Récemment, une étude de la ségrégation de différentes formes
alléliques de 343 marqueurs microsatellites répartis sur l'ensemble du
génome et distants entre eux en moyenne de 10,3 cM a été réalisée.
2o L'étude de liaison (linkage) a porté sur une famille bien
caractérisée sur onze générations, dont de nombreux membres sont
affectés par la maladie de Tangier, la famille comportant cinq lignées de
consanguinité.
25 Cette étude a permis d'identifier une région localisée dans le locus
9q31 du chromosome 9 humain statistiquement associé à l'affection
(Rust S. et al., Nature Genetics, vol. 20, Septembre 1998, pages 96-98).
Toutefois, l'étude de RUST et al. définit seulement une large
région du génome dont des altérations sont susceptibles d'ëtre
3o associées à la maladie de Tangier. II est simplement précisé que la
région du locus 9q31-34 concernée contient des ESTs mais aucun gène
connu.
II a désormais été montré qu'une région d'environ 15cM située
dans le locus 9q31-34 chez l'homme était associée, de manière
~s générale, à des déficiences familiales en HDL .


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
6
Plus particulièrement, on a montré selon l'invention que des
molécules d'ARN messager étaient exprimées à partir de séquences
localisées dans le génome dans une région d'environ 15 cM centrée sur
le marqueur microsatellite D9S1784, identifié comme le marqueur
s microsatellite donnant la liaison génétique la plus forte avec la déficience
familiale en HDL et la maladie de Tangier.
De plus, la région 9q31-34 considérée contient potentiellement
des gènes susceptibles de jouer un rôle dans l'initiation ou le
développement de diverses maladies, telles que
~o - les maladies osseuses comme les chondrosarcomes myxoides, des
retards mentaux liés aux anomalies du chromosome 9 (MRD) ;
- les maladies rénales comme les néphrophtisies infantiles (NPH2) ;
- les maladies musculaires, comme la dystrophie musculaire des
ceintures (LGMD2H) ;
ts - les maladies psychiatriques comme la schizophrénie ;
- les maladies digestives comme la maladie de Hirschprung liée à RET
(SHSCR2).
Du fait de la localisation des gènes candidats positionnels dans
cette intervalle chromosomique, les ARN messagers et les polypeptides
zo correspondants, tels qu'isolés et caractérisés selon l'invention, sont
potentiellement impliqués dans certaines des pathologies humaines
décrites ci-dessus, soit encore dans d'autres pathologies également
liées génétiquement à cette région du chromosome 9.
Pour certaines des séquences comprises dans ces ARN
2s messagers isolées et caractérisées par le demandeur, une phase de
lecture ouverte putative a été déterminée et la séquence de la protéine
correspondante en a été déduite. Les polypeptides correspondants sont
potentiellement impliqués dans une affection liée au métabolisme des
lipoprotéines, plus particulièrement liée à un déficit du transport inverse
~o du cholestérol.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
7
DESCRIPTION DETAILLEE DE L'INVENTION
La présente invention décrit ainsi des polynucléotides et des
s polypeptides dont une altération de la séquence ou de l'expression est
potentiellement associée à un déficit dans le métabolisme des
lipoprotéines plasmatiques, plus particulièrement à un déficit dans le
transport inverse des HDL .
La présente invention décrit aussi des polynucléotides et des
to polypeptides dont une altération de la séquence ou de l'expression est
potentiellement associée à des maladies génétiquement liées au locus
9q31-34 du chromosome 9.
DEFINITIONS GENERALES
t5
Le terme " isolé " au sens de la présente invention désigne un
matériel biologique (acide nucléique ou protéine) qui a été soustrait à
son environnement originel (l'environnement dans lequel il est localisé
naturellement).
2o Par exemple un polynucléotide présent à l'état naturel dans une
plante ou un animal n'est pas isolé. Le méme polynucléotide séparé des
acides nucléiques adjacents au sein desquels il est naturellement inséré
dans le génome de la plante ou l'animal est considéré comme " isolé ".
Un tel polynucléotide peut ëtre inclus dans un vecteur etlou un tel
25 polynucléotide peut être inclus dans une composition et demeurer
néanmoins à l'état isolé du fait que le vecteur ou la composition ne
constitue pas son environnement naturel.
Le terme " purifié " ne nécessite pas que le matériel soit présent
sous une fôrme de pureté absolue, exclusive de la présence d'autres
~o composés. II s'agit plutôt d'une définition relative.
Un polynucléotide est à l'état " purifié " après purification du
matériel de départ ou du matériel naturel d'au moins un ordre de
,. grandeur, de préférence 2 ou 3 et préférentiellement 4 ou 5 ordres de
grandeur.
3s Aux fins de la présente description, l'expression " séquence
nucléotidique " peut être employée pour désigner indifféremment un


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
8
polynucléotide ou un acide nucléique. L'expression " séquence
nucléotidique " englobe le matériel de génétique lui-même et n'est donc
pas restreinte à l'information concernant sa séquence.
Les termes " acide nucléique ", " polynucléotide ";
s " oligonucléotide " ou encore " séquence nucléotidique " englobent des
séquences d'ARN, d'ADN, d'ADNc ou encore des séquences hybrides
ARNlADN de plus d'un nucléotide, indifféremment sous la forme simple
chaîne ou sous la forme de duplex.
Le terme " nucléotide " désigne à la fois les nucléotides naturels
io (A, T, G, C) ainsi que des nucléotides modifiés qui comprennent au ,
moins une modification telle que (1) un analogue d'une purine, (2) un
analogue d'une pyrimidine, ou (3) un sucre analogue, des exemples de
tels nucléotides modifiés étant décrits par exemple dans la demande
PCT N°WO 95/04 064.
i5 Aux fins de la présente invention, un premier polynucléotide est
considéré comme étant " complémentaire " d'un second polynucléotide
lorsque chaque base du premier nucléotide est appariée à la base
complémentaire du second polynucléotide dont l'orientation est inversée.
Les bases complémentaires sont A et T (ou a et U), ou C et G.
2o Par " variant " d'un acide nucléique selon l'invention, on entendra
un acide nucléique qui diffère d'une ou plusieurs bases par rapport au
polynucléotide de référence. Un acide nucléique variant peut être
d'origine naturel, tel qu'un variant allélique retrouvé naturellement, ou
peut être aussi un variant non naturel obtenu par exemple par des
2s techniques de mutagénèse.
En général, les différences entre l'acide nucléique de référence et
l'acide nucléique variant sont réduites de telle sorte que les séquences
nucléotidiques de l'acide nucléique de référence et de l'acide nucléique
variant sont très proches et, dans de nombreuses régions, identiques.
~o Les modifications de nucléotides présentent dans un acide nucléique
variant peuvent être silencieuses, ce qui signifie qu'elles n'altèrent pas
les séquences d'aminoacides codées par ledit acide nucléique variant.
Cependant, les changements de nucléotides dans un acide
nucléique variant peuvent aussi résulter dans des substitutions,
~~ additions, délétions dans le polypeptide codé par l'acide nucléique


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
9
variant par rapport aux peptides codés par l'acide nucléique de
référence. En outre, des modifications de nucléotides dans les régions
codantes peuvent produire des substitutions, conservatives ou non
conservatives dans la séquence d'aminoacides.
De préférence, les acides nucléiques variants selon l'invention
codent pour des polypeptides qui conservent sensiblement la méme
fonction ou activité biologique que le polypeptide de l'acide nucléique de
référence ou encore lacapacité à étre reconnus par des anticorps dirigés
contre les polypeptides codés par l'acide nucléique initial.
~o Certains acides nucléiques variants coderont ainsi pour des
formes mutées des polypeptides dont l'étude systématique permettra de
déduire des relations structure activité des protéines en question. La
connaissance de ces mutations par rapport à la maladie étudiée est
fondamentale puisqu'elle permet de comprendre la cause moléculaire de
~5 la pathologie.
On entendra par " fragment " un acide nucléique de référence
selon l'invention, une séquence nucléotidique de longueur réduite par
rapport à l'acide nucléique de référence et comprenant, sur la partie
commune, une séquence en nucléotides identique à l'acide nucléique de
2o référence.
Un tel " fragment " d'acide nucléique selon l'invention peut être le
cas échéant, compris dans un polynucléotide plus grand duquel il est
constitutif.
De tels fragments comprennent, ou alternativement consistent en,
2s des oligonucléotides de longueur allant de 8, 10, 12, 15, 18, 20 à 25, 30,
40, 50, 70, 80, 100, 200, 500, 1000 ou 1500 nucléotides consécutifs d'un
acide nucléique selon l'invention.
Par " variant " d'un polypeptide selon l'invention, on entendra
principalement un polypeptide dont la séquence d'acides aminés
~o contient une ou plusieurs substitutions, additions ou délétions d'au moins
un résidu d'acide aminé, par rapport à la séquence d'acides aminés du
polypeptide de référence, étant entendu que les substitutions
d'aminoacides peuvent être indifféremment conservatives . ou non
conservatives.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
Par " fragment " d'un polypeptide selon l'invention, on entendra un
polypeptide dont la séquence d'acides aminés est plus courte que celle
du polypeptide de référence et qui comprend sur toute la partie
commune avec ces polypeptides de référence, une séquence en acides
s aminés identique.
De tels fragments peuvent, le cas échéant, ëtre compris au sein
d'un polypeptide plus grand duquel ils font partie.
De tels fragments d'un polypeptide selon l'invention peuvent avoir
une longueur de 10, 15, 20, 30 à 40, 50, 100, 200 ou 300 acides aminés.
~o Le " pourcentage d'identité " entre deux séquences de nucléotides
ou d'acides aminés, au sens de la présente invention, peut être
déterminé en comparant deux séquences alignées de manière optimale,
à travers une fenêtre de comparaison.
La partie de la séquence nucléotidique ou polypeptide dans la
~; fenêtre de comparaison peut ainsi comprendre des additions ou des
délétions (par exemple des " gaps ") par rapport à la séquence de
référence (qui ne comprend pas ces additions ou ces délétions) de
manière à obtenir un alignement optimal des deux séquences.
Le pourcentage est calculé en déterminant le nombre de positions
?o auquel une base nucléique ou un résidu d'aminoacide identique est
observé pour les deux séquences (nucléique ou peptidique) comparées,
puis en divisant le nombre de positions auquel il y a identité entre les
deux bases ou résidus d'aminoacides par le nombre total de positions
dans la fenêtre de comparaison, puis en multipliant le résultat par 100
2s afin d'obtenir le pourcentage d'identité de séquence.
L'alignement optimal des séquences pour la comparaison peut
être réalisé de manière informatique à l'aide d'algorithmes connus
contenus dans le package de la Société WISCONSIN GENETICS
SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575
~o Science Doctor , Madison, WISCONSIN.
A titre d'illustration, le pourcentage d'idéntité de séquence pourra
ëtre effectué à l'aide du logiciel BLAST (versions BLAST 1.4.9 de mars
1996, BLAST 2Ø4 de février 1998 et BLAST 2Ø6 de septembre 1998),
en utilisant exclusivement les paramètres par défaut (S. F Altschul et al,
~s J. Mol. Biol. 1990 215 : 403-410, S. F Altschul et al, Nucleic Acids Res.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
11
1997 25: 3389-3402). Blast recherche des séquences
similaires/homologues à une séquence " requête " de référence, à l'aide
de l'algorithme d'Altschul et al. La séquence requête et les bases de
données utilisées peuvent être peptidiques ou nucléiques, toute
s combinaison étant possible.
Par " conditions d'hybridation de forte stringence " au sens de la
présente invention, on entendra les conditions suivantes
to 1- Compétition des membranes et PRE HYBRIDATION
- Mélanger : 40N1 ADN sperme de saumon (l0mg/ml)
+ 40 NI ADN placentaire humain (10mg/ml)
ts - Dénaturer 5 mn à 96°C, puis plonger dans la glace le mélange.
- Oter le SSC 2X et verser 4 ml de mix formamide dans le tube
d'hybridation contenant les membranes.
20 - Ajouter le mélange des deux ADNs dénaturés.
- Incubation à 42°C pendant 5 à 6 heures, avec rotation.
2- Compétition de la sonde marquée
~o
- Ajouter à la sonde marquée et purifiée 10 à 50 NI ADN Cot I, selôn la
quantité de repeats.
- Dénaturer 7 à 10 mn à 95°C.
- Incuber à 65°C pendant 2 à 5 heures.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
12
3- HYBRIDATION
- Oter le mix de pré hybridation.
- Mélanger 40 NI ADN sperme de saumon + 40 NI ADN placentaire
humain ; dénaturer 5 mn à 96°C, puis plonger dans la glace.
- Ajouter dans le tube d'hybridation 4 ml de mix formamide, le mélange
~o des deux ADN et la sonde marquée/ADN Cot I dénaturée.
- Incuber 15 à 20 heures à 42°C, avec rotation.
1~
4- Lavages
- Un lavage à température ambiante dans du SSC 2X, pour rincer.
- 2 fois 5 minutes à température ambiante SSC 2X et SDS 0,1 % à 65°C.
- 2 fois 15 minutes à 65°C SSC 1X et SDS 0,1% à 65°C.
?o Envelopper les membranes dans du Saran et exposer.
Les conditions d'hybridation décrites plus haut sont adaptées à
l'hybridation dans des conditions de forte stringence, d'une molécule
?s d'acide nucléique d'une longueur variable de 20 nucléotides à plusieurs
centaines de nucléotides.
II va sans dire que les conditions d'hybridation ci-dessus décrites
peuvent être adaptées en fonction de la longueur de l'acide nucléique
dont l'hybridation est recherchée ou du type de marquage choisi, selon
~o des techniques connues de l'homme du métier.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
13
Les conditions convenables d'hybridation peuvent par exemple
être adaptées selon l'enseignement contenu dans l'ouvrage de HAMES
et HIGGINS (1985) ou encore dans l'ouvrage de F.AUSUBEL et al
(1999).
DETAIL DES ACIDES NUCLEIQUES ET DES POLYPEPTIDES SELON
L'INVENTION
Une brève description des séquences d'acides nucléiques et des
~o séquences d'acides aminés selon l'invention est représentée dans le
Tableau I, à la suite des exemples.
Gène GS9002S31.
Acides) nucléiques)
~s II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS9002S31.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°1.
La séquence SEQ ID N°1 a une longueur de 552 nucléotides.
2o Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°1
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+ de différents tissus ont permis
2s de montrer que le gène GS9002S31 était exprimé dans le cerveau foetal,
le foie et le placenta.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
14
Gène GS910331.
Acides) nucléiques)
II a été isolé selon l'invention deux séquences d'ARN messager
correspondant à un transcrit du gène désigné ici sous le n° GS910331.
s La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°2.
La séquence SEQ ID N°2 a une longueur de 1246 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°3.
~o La séquence SEQ ID N° 3 a une longueur de 3035 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110 et Version
115).
Les analyses d'expression du transcrit de séquence SEQ ID N°2
ts ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS310331 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression .du transcrit par Northern
blot, à l'aide respectivement des sondes de séquences SEQ ID N°82 et
20 83, a révélé la présence de transcrits dans le blot commercialisé par la
Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ ID

82 est respectivement de 1,65 kb dans le foie et le coeur et de 1,4 kb
dans le cerveau.
2s La taille des transcrits détectés avec la sonde de séquence SEQ ID

83 est respectivement de 1,65 kb et 2,4 kb dans le coeur et de 1,65 kb
dans le foie.
Ce gène constitue un candidat positionne) causal d'une maladie due à
~o un dysfonctionnement du flux inverse du cholestérol, et plus


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
1J
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
s Gène GS914554
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS94554.
to La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°4.
La séquènce SEQ ID N°4 a une longueur de 1479 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
~s Les analyses d'expression du transcrit de séquence SEQ ID N°4
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS94554 était exprimé dans le cerveau foetal, le
placenta et le foie.
zo De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide respectivement de
la sonde de séquence SEQ ID N°58, a révélé la présence de transcrits
dans le blot commercialisé par la Société Clontech (Ref. N° 7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
2s ID N°84 est respectivement de
- 1,0, 1,3, 1,7 et 2,8 kb dans le pancréas et le placenta ;
- 1,0, 1,3 et 1,7 kb dans le rein, le muscle squelettique, le coeur et le
foie ;
- 1,7 kb dans le cèrveau et le poumon.
~o


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
16
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Gène GS914739.
Acides) nucléiques)
II a été isolé selon l'invention deux séquences d'ARN messager
io correspondant à un transcrit du gène désigné ici sous le n° GS14739.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N 5.
La séquence SEQ ID N°5 a une longueûr de 5169 nucléotides.
Aucune homologie de séquence avec la séquence SEQ ID N° 5
~5 n'a été retrouvée lors d'une recherche dans la base de données
GenBank (Version 110).
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N 6.
La séquence SEQ ID N°6 a une longueur de 7723 nucléotides.
zo Cette séquence comprend un cadre ouvert de lecture (ORF) allant du
nucléotide en position 121 au nucléotide en position 1517 de la
séquence SEQ ID N° 6. Le codon d'initiation de la traduction débute au
nucléotide en position 132 de la séquence SEQ ID N° 6. La séquence
codante débute au nucléotide en position 132 et se termine au
zs nucléotide en position 1517 de la séquence SEQ ID N° 6. La séquence
SEQ ID N°6 comprend un signal de polyadénylation de séquence
" ATTAAA " débutant au nucléotide en position 7686 de la séquence
SEQ ID N°6. Le motif de Kozak de. séquence " CCA CTC GCC ATG "
débute au nucléotide en position 123 de la séquence SEQ ID N°6.
~o


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
17
Deux homologies de séquence de 100% ont été retrouvées lors
d'une recherche dans la base de données GenBank (Version 115, N°
d'accès AF088031 ), respectivement
- du. nucléotide en position 1 au nucléotidé en position 146 de la
s séquence SEQ ID N°6 ; et
- du nucléotide en posüton 243 au nucléotide en position 573 de la
séquence SEQ ID N° 6
Les analyses d'expression du transcrit de séquence SEQ ID N°5
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
~o analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS914739 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
blot, à l'aide de la sonde de séquence SEQ ID N°85, a révélé la
présence de transcrits dans le blot commercialisé par la Société
~s Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°85 est de 1 kb dans le coeur, le foie, lé muscle squelettique
et le
rein.
2o Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
2s
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 6
Le cadre ouvert de lecture de la séquence nucléotidique SEQ ID
N° 6 code potentiellement pour un polypeptide de 461 acides aminés
de
30 longueur constituant la séquence SEQ ID N° 129.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
18
Sur les régions nucléotidiques 240-1481 et 1511-
1675 de la séquence SEQ ID N° 129, une identité de
séuqnce d'environ 30% a été retrouvée avec dans les
bases Genpept115, Swissprot38, trEMBL et PIR vace les
s numéro d'accès suivants : AF035360 (homo), AF186461
(rattus), AF186460 (musspretus); AF196481 (homo sapiens
), AF196480(musmusc) et avec des T09482{homme) et
T09013(mouse) ( ring finger Fxy ). Quelques homologies de
séquence ont été retrouvées également avec les numéros
d'accès suivants : DA191 P20.2, A49656 et 149642.
Le polypeptide de séquence SEQ ID N° 129 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
~s locus 9q31-34 du chromosome 9.
Gène S915574.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
2o un transcrit du gène désigné ici sous le n° GS915574.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°7.
La séquence SEQ ID N°7 a une longueur de 1046 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
2s recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°7
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS915574 était exprimé dans le cerveau foetal,


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
19
l'utérus, le cerveau, le coeur, la prostate, le foie foetal, le foie, le
placenta,
le testicule et le rein.
Ce gène constitue un candidat positionne) causal d'une maladie due à
s un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Gène GS930321
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS930321.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°8.
La séquence SEQ ID N°8 a une longueur de 280 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
2o Les analyses d'expression du transcrit de séquence SEQ ID N°8
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS930321 était exprimé dans le cerveau foetal,
le foie et le coeur.
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à urie maladie génétiquement liée au locus
9q31-34 du chromosome 9.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
Gène S931311.
Acides) nucléiques)
s II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS931311.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°9.
La séquence SEQ ID N°9 a une longueur de 479 nucléotides.
to Cette séquence comprend un cadre ouvert de lecture (ORF) partiel allant
du nucléotide en position 3 au nucléotide en position 98 de la séquence
SEQ ID NO 9
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
ts Les analyses d'expression du transcrit de séquence SEQ ID N°9
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS931311 était exprimé dans le cerveau foetal,
le foie, le cceur, le placenta, le testicule et le rein.
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
2s 9q31-34 du chromosome 9.
Polypeptide codé par l'acide nucléique de séquence SEQ ID N~ 9


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
21
Le cadre ouvert de lecture partiel de la séquence d'acides
nucléique SEQ ID N°9 code potentiellement pour un polypeptide de 32
aminoacides de longueur constituant la séquence SEQ ID N°130.
Aucune homologie significative avec BLAST n'a été retrouvée
s avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999) et PRODOM:
(domaines homologues obtenus dans Swissprot, version 34.2, novembre
1997).
Le polypeptide de séquence SEQ ID N° 130 est susceptible
o d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
~ s Gène S934660.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS934660.
La séquence nucléique de l'ADNc correspondant à ce transcrit
2o constitue la séquence SEQ ID N°10.
La séquence SEQ ID N°10 a une longueur de 2599 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°10
zs ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS934660 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
blot, à l'aide .de la sonde de séquence SEQ ID N°86, selon le protocole


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
22
décrit de l'Exemple 1, a révélé la présence de transcrits dans le blot
commercialisé par la Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°86 est respectivement de
s - 1 kb, 2 kb, 3 kb et 7,5 kb dans le placenta ;
- 2, 3 et 7,5 kb dans le coeur ;
- 7,5 kb dans le rein, le pancréas, le muscle squelettique, le poumon et
le cerveau.
~o Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Gène GS938315.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS938315.
2o La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°11.
La séquence SEQ ID N°11 a une longueur de 222 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
zs Les analyses d'expression du transcrit de séquence SEQ ID N°11
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS938315 était exprimé dans le cerveau foetal,
le foie, le coeur et le rein.
~o


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
23
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
s 9q31-34 du chromosome 9.
Gène GS93953
Acides) nucléiques)
~o II a été isolé selon l'invention deux ARNs
messagerscorrespondant à un transcrit du gène désigné ici sous le n°
GS93953.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°12.
ts La séquence SEQ ID N°12 a une longueur de 3422 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 13.
2o La séquence SEQ ID N° 13 a une longueur de 5791 nucléotides.
Elle comprend un cadre ouvert de lecture (ORF) partiel allant du
nucléotide en position 3 au nucléotide en posüton 554 de la séquence
SEQIDN°13.
Quelques homologies de séquence ont été retrouvées entre la
2s séquence SEQ ID N° 13 et les numéros d'accès suivants de la base de
données GenBank (Version 116) : AC013740.2, AC013783.2 et
AF086175.1.
Les analyses d'expression du transcrit de séquence SEQ ID N°12
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
24
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS93953 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
blot, , selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
s séquence SEQ ID N°87, a révélé la présence de transcrits dans le blot
commercialisé par la Société Clontech (Ref. N° 7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°87 est de 8 kb dans le coeur, le cerveau, le placenta, le
poumon, le
foie, le muscle squelettique, le rein et le pancréas.
~o
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement. liée au locus
~5 9q31-34 du chromosome 9.
Polypeptide codé par l'acide nucléigue de séquence SEQ ID N° 13.
Le cadre de lecture ouvert partiel de la séquence d'acide
2o nucléique SEQ ID N°13 code potentiellement pour un polypeptide de
183 acides aminés de longueur constituant la séquence SEQ ID N° 131.
II a été observé une homologie de 45% entre la région 6-162 de
la séquence SEQ ID N° 131 et la séquence n° g3878571 (Z46381) de
la
base de données Gen Bank (Version 115) et la séquence n<°
25 . EM :Q21453 M01 F1.4 PROTEIN de la base de données trEMBL
(Version de Aoüt 1999).
Le polypeptide de séquence SEQ ID N° 131 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
2J
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Gène GS939874.
s Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS939874.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°14.
io La séquence SEQ ID N°14 a une longueur de 2615 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La deuxième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 15.
is La séquence SEQ ID N° 15 a une longueur de 2551 nucléotides.
Elle comprend un cadre ouvert de lecture allant du nucléotide en position
50 au nucléotide en position 958 et une séquence codante allant du
nucléotide en position 67 au nucléotide en position 958.
Une homologie de 99% d'identité sur 2044 nucléotides de la
2o séquence SEQ ID N° 15 a été observée avec la séquence de la base de
données GenBank (Version 116j ayant le numéro d'accès AK001355.
Les analyses d'expression du transcrit de séquence SEQ ID N°14
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
2s de montrer que le gène GS939874 était exprimé dans le cerveau foetal,
l'utérus, le cerveau, le cour, la prostate, le foie foetal, le foie, le
placenta,
le testicule et le rein.
Ce gène constitue un candidat positionnel causal d'une maladie
~o due à un dysfonctionnement du flux inverse du cholestérol, et plus


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
26
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
s Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 15.
Le cadre ouvert de lecture de l'acide nucléique de séquence SEQ
ID N° 15 code potentiellement pour un polypeptide de 291 acides
aminés de longueur constituant la séquence SEQ ID N° 132.
io Une homologie de 35% sur 233 acides aminés (14-246 de SEQ
ID N° 132) a été retrouvée avec la séquence référencée dans la
base de
données GenPept (Version 115) sous le n° 85832945 (AL117195).
Une homologie de 32% sur 245 acides aminés (30-274 de SEQ
ID N° 132) a été retrouvée avec la séquence référencée dans la
base de
i5 données GenPept (Version 115) sous le n° 85832942 (AL117195).
Le polypeptide de séquence SEQ ID N° 132 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
2o familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Gène GS911370
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS911370.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°16.
~o La séquence SEQ ID N°16 a une longueur de 775 nucléotides.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
27
Cette séquence comprend un cadre ouvert de lecture partiel
(ORF) allant du nucléotide en position 1 au nucléotide en position 144 de
la séquence SEQ ID N°16.
Une homologie en nucléotides a été retrouvée avec les
s séquences suivantes
~ 96% d'homologie sur 229 pb (position 52-280 pb) avec la
séquence GenBank: gi~1022224~ - Fragment Mse1
~o d'ADN génomique d'Homo sapiens, contenant un ilot
CpG ( clone 92e10, lecture inverse de cpg92e10.rt1a)
~ 100% d'homologie sur 145 pb (position 1-144 pb) avec la
séquence GenBank: gi~459833~ de l'ARNm humain de la
~5 sous unité béta du complexe Sec61.
Les analyses d'expression du transcrit de séquence SEQ ID N°16
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
2o de montrer que le gène GS911370 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide respectivement des
sondes de séquence SEQ ID N° 88 et 89, a révélé la présence de
transcrits dans le blot commercialisé par la Société Clontech (Ref. N°
25 7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N° 88 ainsi qu'avec la sonde de séquence SEQ ID N°89 est
de 7,4
kb dans le pancréas.
~o Ce gène constitue un candidat positionne) causal d'une maladie
due à un dysfonctionnement du flux inversé du cholestérol, et plus


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
28
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
s Polypepfide codé par l'acide nucléique de séquence SEQ ID N° 96
Le cadre ouvert de lecture partiel de la séquence d'acides
nucléiques SEQ ID N°16 code potentiellement pour un polypeptide de 48
aminoacides de longueur constituant la séquence SEQ ID N°133.
~o Homologies observées au niveau de la séquence protéique
Cette ORF potentielle (48 aa) possède une identité sur 33 aa (position
16-48 aa) avec la protéine de transport sous unité béta du complexe
Sec61 humaine dont les séquences sont sp~P38391 ~, gb~AAA19639.1 ~,
PIR: (Séquences PIR non redondantes, version 57)~S~S42410 et 18652
Is p34.2 (1) respectivement dans les bases de données Swissprot (version
36, dernière remise à jour du 3 mai 1999))Genpept: (traduction de
Genbank v110 et 111, dernière remise à jour le 7 mai 1999), PIR:
(SEQUENCES PIR NON REDONDANTES, VERSION 57) non
redondante et PRODOM: (domaines homologues détectés dans
2o Swissprot, version 34.2, novembre 1997).
Cette identité est retrouvée dans les différentes bases de
données protéiques ( PIR: (SEQUENCES PIR NON REDONDANTES,
VERSION 57), PRODOM: (domaines homologues détectés dans
Swissprot, version 34.2, novembre 1997)) et les traductions de Genbank
2s et EMBL (TrEMBL (SP-TrEMBL, version 7, novembre 1998), Genpept:
(traduction de Genbank v110 et 111, dernière remise à jour le 7 mai
1999)).
Fonction putative
Le complexe de protéines sec61 est un composant central de la
~o machinerie cellulaire de translocation des protéines naissantes dans le


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
29
réticulum endoplasmique. Le gène GS911370 pourrait donc être, de part
son homologie avec la sous unité beta du complexe sec61, un gène
codant pour un nouveau composant de cette machinerie. Par
conséquent son rôle possible dans la translocation des protéines et par
s conséquent du trafic des protéines impliquées dans le mécanisme
d'efflux du cholestérol en fait un gène d'intérêt dans l'étude du déficit
observée chez les patients Tangier/FHD.
Le polypeptide de séquence SEQ ID N°133 est ainsi susceptible
d'intervenir dans la régulatiôn du flux de cholestérol, et plus
io particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Le polypeptide de séquence SEQ ID N133 est donc susceptible
d'intervenir dans une étape importante impliquée dans le transport
inverse du cholestérol par les HDL.
is Le polypeptide de séquence SEQ ID N° 133 est également
susceptible d'intervenir dans une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Gène GS913920.
2o Acide(sJ nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS913920.
Une première séquence a été isolée et caractérisée ; il s'agit de la
séquence nucléique de l'ADNc constituant la séquence SEQ ID N°17.
z, La séquence SEQ ID N°17 a une longueur de 491 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
~o Les analyses d'expression du transcrit de séquence SEQ ID N°17
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS913920 était exprimé dans le foie et,le coeur.
A partir de la séquence SEQ ID N° 17, deux amorces
nucléotidiques respectivement de séquences SEQ ID N° 102 et SEQ ID
s N° 103 ont été synthétisées. Ces amorces nucléotidiques ont permis
d'amplifier un ADNc du gène GS913920 constituant la séquence SEQ ID
N° 18.
Les réactions d'amplification sont réalisées dans les conditions
suivantes, applicables à l'ensemble des gènes candidats selon
~o l'invention pour lesqueles des amorces spécifiques sont décrites et
mises en oeuvre pour isoler des séquences du transcrit d'intérêt
Chaque réaction de PCR est effectuée avec 400 NM de chaque
dNTP, 0.5 NM de chaque amorce, 2.5 mM de MgCl2, 50 ng d'ADN ou
environ 25 ng d'ADNc et 2 unités de Thermus aquaticus (Taq) DNA
i5 polymérase (Ampli Taq Gold; Perkin Elmer) en présence de son tampon.
Les réactions sont réalisées en micro-plaques 96 puits, dans des
thermo-cycleurs 9700 (Perkin Elmer). Après une première dénaturation à
94°C pendant 10 min, un programme de 30 cycles est appliqué
dénaturation de 30 s. à 94°C, hybridation de 30 s. à 64°C (2
cycles),
2o 61 °C (2 cycles), 58°C (2 cycles) et 55°C (28 cycles),
élongation de 1
min/kb à 72°C. Le programme s'achève par une élongation de 7 min à
72°C.
La séquence nucléique SEQ ID N° 18 a une longueur de 293
2s nucléotides. Elle comprend un cadre de lecture ouvert (ORF) partiel
allant du nucléotide en posüton 227 au nucléotide en position 293.
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du ,flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
31
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Polypepfide codé par l'acide nucléique de séquence SEQ ID NO 18
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°18 code potentiellement pour un polypeptide de 22
aminoacides de longueur constituant la séquence SEQ ID N°134.
Aucune homologie significative avec BLAST n'a été retrouvée
~o avec les séquences référencées dans les bases de données Genpept:
(traduction de Genbank v115), TrEMBL (SP-TrEMBL, Version Août
1999), Swissprot (Version 38) et PIR: (SEQUENCES PIR NON
REDONDANTES, Version 62-Septembre 1999).
Le polypéptide de séquence SEQ ID N°134 est susceptible
is d'intervenir dans la régulation du flux de cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Le polypeptide de séquence SEQ ID N°134 est donc susceptible
d'intervenir dans une étape importante impliquée dans le transport
2o inverse du cholestérol par les HDL.
Le polypeptide de séquence SEQ ID N° 134 est également
susceptible d'intervenir dans une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
2s Gène GS91437.
Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS91437.
La première séquence nucléique de l'ADNc correspondant à ce
3o transcrit constitue la séquence SEQ ID N°19.


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
32
La séquence SEQ ID N°19 a une longueur de 2442 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 2 au nucléotide en position 286 de
la séquence SEQ ID N°19.
s Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 20.
La séquence SEQ ID N°20 a une longueur de 4608 nucléotides.
~o Elle comprend un cadre ouvert de lecture (ORF) partiel allant du
nucléotide en position 1 au nucléotide en position 327.
II a ete trouvé les homologies de séquence suivantes dans la
base de données GenBank (Version 116) avec la séquence SEQ Id N°
~s ~ 100% d'homologie sur 213 pdb (positions [85-297]) avec les
positions [2807-2595] de la sequence 87020279 (AK000294) Homo
sapiens cDNA FLJ20287 fis, clone HEP04390 Length = 3043;
deposee le 22-02-2000 dans Genbank.
~ 88% sur 219 pdb (positions [82-300]) avec la sequence 83850048
zo (AJ 004828) Mus musculus clone XX-BAC394, Length = 170351 ***
SEQUENCING IN PROGRESS ***, in unordered pieces;
Les analyses d'expression du transcrit de séquence SEQ ID N°19
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
2s analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS91437 était exprimé dans le cerveau foetal, le
foie, le coeur, la prostate, le placenta, l'utérus, le testicule, le rein, le
muscle squeletttique.
3o Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
33
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Polypeptide codé par l'acide nucléique de séquence SEQ ID N°19
s
Le cadre ouvert de lecture partiel de la séquence d'acides
nucléiques SEQ ID N°19 code potentiellement pour un polypeptide de 95
aminoacides de longueur constituant la séquence SEQ ID N°135.
Aucune homologie significative avec BLAST n'a été retrouvée
~o avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999), PRODOM:
(domaines homologues détectés dans Swissprot, versions 34.2 et
38,)Genpept: (traduction de Genbank v110 et 111 ainsi que 115,), PIR:
(SEQUENCES PIR NON REDONDANTES, VERSION 57), PDB:
~s (PROTEIN DATA BANK, FEVRIER 1999) et TrEMBL (SP-TrEMBL,
version 7, novembre 1998).
Le polypeptide de séquence SEQ ID N° 135 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
2o familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 20
2s Le cadre ouvert de lecture (ORF) contenu dans l'acide nucléique
de séquence SEQ ID N° 20 code potentiellement pour un polypeptide de
108 acides aminés constituant la séquence SEQ ID N° 136.
Aucune homologie de séquence n'a été retrouvé avec les bases
de deonnées Swissprot (Version 38), Genpept (Versiôn 115), PIR
~o (Version 62, Septembre 1999) et trEMBL (Version de Août 1999).


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
34
Le polypeptide de séquénce SEQ ID N° 136 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
s locus 9q31-34 du chromosome 9.
Gène GS91507.
Acides) nucléiques)
~o II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS91507.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°21.
La séquence SEQ ID N°21 a une longueur de 1627 nucléotides.
is Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 1 au nucléotide en position 640 de
la séquence SEQ ID N°21.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
zo La deuxième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 22.
La séquence SEQ ID N° 22 a une longueur de 2333 nucléotides.
Elle comprend un cadre ouvert de lecture (ORF) complet allant du
nucléotide en position 368 au nucléotide en position 1348. Le début du
zs codon d'initiation de la traduction est localisé sur le nucléotide en
position 371 de la séquence SEQ ID N° 22. La séquence codante
débute au nucléotide en position 371 et se termine au nucléotide en
position 1348.
~o La séquence SEQ ID N° 22 possède une homologie avec la
séquence suivante référencée dans la base de données GenBank
(Version 116) suivante


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
Identité nucléique de 99% sur 2316 pb (position 115 à 2420 pb)
avec Homo sapiens cDNA FLJ20300 fis, clone HEP06465 ( 2331
pb). Accession AK000307
s
Les analyses d'expression du transcrit de séquence SEQ ID N°21.
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS91507 était exprimé dans le cerveau foetal.
io De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
séquence SEQ ID N°90, a révélé la présence de transcrits dans le blot
commercialisé par la Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
t5 ID N°90 est respectivement de
- 2 kb et 7,5 kb dans le pancréas, le rein, le muscle squelettique, le
poumon, le placenta et le cerveau.
Ce gène constitue un candidat positionnel causal d'une maladie
2o due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Polypeptide codé par l'acide nucléique de séguence SEQ ID NO 27
2s Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°21 code potentiellement pour un polypeptide de 213
aminoacides de longueur constituant la séquence SEQ ID N°137.
Homologies observées au niveau de la séquence protéique:
Cette ORF potentielle de 213 aa possède un domaine ayant des
~o homologies de type motif avec différentes protéines telles que


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
36
~ 29% d'homologie sur 155 aa (position 4-158 aa) avec
des séquences de Swissprot (version 36, dernière
remise à jour du 3 mai 1999) sp~Q10022~ et avec des
séquences de PRODOM: (domaines homologues
s détectés dans Swissprot, version 34.2, novembre 1997)
28705 p34.2 (1 ) YSX3 CAEEL - domaine de la protéine
hypothétique (39KD) T28D9.3 localisé sur le
chromosome II.
~ 25% d'homologie sur 127 aa (position 6-132 aa) avec
1o des séquences de PIR: (SEQUENCES PIR NON
REDONDANTES, VERSION 57) non-redondante: PIR:
(Séquences PIR non redondantes, version 57)~S~S66668
- protéine induite par le peroxyde d'hydrogène
(fragment d'une séquence de souris).
De plus, des homologies avec des séquences codantes traduites
de Genbank et EMBL (TrEMBL (SP-TrEMBL, version 7, novembre
1998), Genpept: (traduction de Genbank v110 et 111, dernière remise à
jour le 7 mai 1999)) montreraient des annotations avec des protéines
2o potentielles de type " acide phosphatidique phosphatase "
~ 34% d'homologie sur 200 aa (position 6-205 aa) avec
des séquences de SP-TrEMBL (SP-TrEMBL, version 7,
novembre 1998): sp~P97544~P97544 - protéine
2s transmembranaire du réticulum endoplasmique.
~ 33% d'homologie sur 204 aa (position 6-209 aa) avec
des séquences de Genpept: (traduction de Genbank
v110 et 111, dernière remise à jour le 7 mai 1999):
gi~4105139~- acide phosphatidique phosphatase-beta,


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
37
type2 ; phosphatidate phosphohydrolase ; phospholipide
phosphatase chez l'Homme. ; et avec des séquences
de Genpept: (traduction de Genbank v110 et 111,
dernière remise à jour le 7 mai 1999): gi~3047173~
s homologue de l'acide phosphatidique phosphohydrolase
de l'Homme, et avec gi~2467300~ ~- acide phosphatidique
phosphatase 2b.
~ 31 % d'homologie sur 203 aa (position 6-208 aa) avec
~o des séquences de Genpept: (traduction de Genbank
v110 et 111, dernière remise à jour le 7 mai 1999):
gi~1487873~~- acide phosphatidique phosphatase de
souris
i5 ~ 31% d'homologie sur 203 aa (position 6-208 aa) avec
des séquences de SP-TrEMBL (SP-TrEMBL, version 7,
novembre 1998): sp~Q61469~Q61469 ~- acide
phosphatidique phosphatase 2A
2o Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 22.
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
ID N°22 code potentiellement pour un polypeptide de 325
aminoacides
de longueur constituant la séquence SEQ ID N°138.
2s Homologies observées au niveau de la séquence proteique
Homologies avec des séquences codantes traduites de Genbank
(Version 116) et EMBL (TrEMBL (Version de Août 1999), Genpept
[Version 115]) montreraient des annotations avec des protéines
potentielles de type " acide phosphatidique phosphatase ".


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
38
~ 30% d'homologie sur 316 aa (position 2-317 aa) avec
SP-trEMBL: sp~P97544~P97544 ER TRANSMEMBRANE
PROTEIN
~ 30% d'homologie sur 320 aa (position 2-321 aa) avec
s Genpept116 gi~4105139~AF043329 type-2 phosphatidic
acid phosphatase-beta; phosphatidate
phosphohydrolase; phospholipid phosphatase [Homo
sapiens] et avec Genpept116: gi~3047173~AF01786
phosphatidic acid phosphohydrolase homolog [Homo
~o sapiens] et avec gi~2467300~AB000889 phosphatidic
acid phosphatase 2b
~ 30% d'homologie sur 316 aa (2-317 aa)
avecGenpept116 gi 1684745 Y07783 transmembrane
protein [Battus norvegicus] Length = 312 aa
~s
~ 30% d'homologie sur 320 aa (position 2-317 aa) avec
SP-trEMBL EM:014495 PHOSPHATIDIC ACID
PHOSPHATASE 2B. Length = 311 aa
Fonction putative des polypeptides de séquence SEQ ID N° 137
et 138:
Le gène GS91507 présente un intérét pour l' =étude fonctionelle de la
maladie de Tangier et du FHD en ce sens qu'il s'agit à la fois d'un
2s candidate positionnel et d'un gène codant pour une nouvelle protéine
dont les fonctions putatives (phosphatidic acid phosphatase) pourraient
jouer un rôle dans la cascade de signalisation intracellulaire liée à l'efflux
du cholestérol intracellulaire médié par les particules HDL, impliqué dans
la maladie de Tangier et la déficience familiale en HDL (FHD).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
39
Les polypeptides de séquence SEQ ID N° 137 et 138 est
susceptible d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
s locus 9q31-34 du chromosome 9.
Gène GS915231.
Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
io correspondant à un transcrit du gène désigné ici sous le n°
GS915231.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°23.
La séquence SEQ ID N°23 a une longueur de 2764 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
~s partiel allant du nucléotide en position 3 au nucléotide en position 1220
de la séquence SEQ ID N°23.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La deuxième séquence nucléique de l'ADNc correspondant à ce
zo transcrit constitue la séquence SEQ ID N° 24.
La séquence SEQ ID N° 24 a une longueur de 3228 nucléotides
Elle comprend un cadre ouvert de lecture (ORF) allant du nucléotide en
position 37 au nucléotide en position 1304. La séquence codante débute
au nucléotide en position 49 et se termine au nucléotide en position
zs 1304 de la séquence SEQ ID N° 24. Le début du codon d'initiation de
la
traduction est localisé sur le nucléotide en position 49. II existe un signal
de polyadénylation débutant sur le nucléotide en position 3142 de la
séquence SEQ ID N° 24.
Des homologies de séquence ont été observées entre la
~o séquence SEQ ID N° 24 et les séquences suivantes référencées dans la
base de données GenBank (Version 116)


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
~ 100% d'homologie sur 217 pdb (positioris [2704-2920]) matchant
avec les positions [1-217] de la sequence 84884337 (AL050130)
Homo sapiens mRNA; cDNA DKFZp586H051 (from clone
DKFZp586H051). Length = 1795; deposee le 18-FEB-2000 ; Direct
s Submission ; Submitted (15-MAY-1999) MIPS, Am Klopferspitz 18a,
D-82152, Martinsried, GERMANY,
~ 4 fragments d'homologie : 100%sur 393 pdb [2773-3165]; 100% sur
153 pdb [913-1065]; 100% sur 111 pdb [1083-1193]; 84% sur 84 pdb
~o [2341-2424] avec la sequence g6539402(AC016904) Homo sapiens
clone RP11-307P9, *** SEQUENCING IN PROGRESS ***, 36
unordered pieces. Length = 203456;
~ Differents fragments d'homologie : 83% sur 258 pdb (529-786]; 89%
~s sur 66pdb [1195-1260]; 80% sur 185pdb [91-275] avec la sequence
85305227 (AF029260) Gallus gallus transcription factor ReIB (relb)
mRNA, complete cds. Length = 2851
Les analyses d'expression du transcrit de séquence SEQ ID N°23
20 ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS915231 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
2s séquence SEQ ID N°91, a révélé la présence de transcrits dans le
blot
commercialisé par la Société Clontech (Ref. N° 7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°91 est respectivement de
- 1,3 kb, 2 kb, 4 kb, 4,4 kb et 7,5 kb dans le coeur,et le muscle
~o squelettique


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
41
- 1,3 kb, 2 kb, 4 kb et 4,4 kb dans le foie et le rein ;
- 1.,3 kb, 2 kb, 4,4 kb et 7,5 kb dans le cerveau ;
- 1,3 kb, 2 kb et 4,4 kb dans le pancréas.
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
io
Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 23
Le cadre ouvert de lecture partiel de la séquence d'acides
nucléiques SEQ ID N°23 code potentiellement pour un polypeptide de
406 aminoacides de longueur constituant la séquence SEQ ID N°139.
~s Homologies observées au niveau de la séquence protéique
~ 51 % d'homologie avec des séquences de Genpept:
(traduction de Genbank v110 et 111, dernière remise à
jour le 7 mai 1999): gi:2731377 est la traduction
2o protéique de la séquence gb~AAB93456.1 ~ (U28739)
similaire à l'alcool déshydrogénase/ribitol
déshydrogénase de C. elegans et des séquences de
SP-TrEMBL (SP-TrEMBL, version 7, novembre
1998):Q09979 sur 401 aa (position 1-401 aa).
~ 30% d'homologie sur 164 aa (position 47-205 aa) avec
les séquences de Protein Data Banks : gi~1827713~
correspondant à la protéine 1AHI~A Chain A, 7 Alpha-
Hydroxysteroid Dehydrogenase Complexed Wifh Nadh
~o And 7-Oxo Glycochenodeoxycholic Acid et avec


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
42
gi~1827714~ correspondant à la protéine 1AHI~B Chain 8,
7 Alpha-Hydroxysteroid Dehydrogenase Complexed
Wifh Nadh And 7-Oxo Glycochenodeoxycholic Acid et
- avec gi~1827715~ correspondant à la protéine 1AHH~A
s Chain A, 7 Alpha-Hydroxysteroid Dehydrogenase
Complexed With Nad+ et avec gi~1827716~
correspondant à la protéine 1AHH~B Chain 8, 7 Alpha-
Hydroxysteroid Dehydrogenase Complexed With Nad+
et avec gi~1943533~ correspondant à la protéine 1FMC~A
~o Chain A, 7-Alpha-Hydroxysteroid Dehydrogenase
Complex With Nadh And 7-Oxo Glycochenodeoxycholic
Acid et avec gi~1943534~ correspondant à la protéine
1 FMC~B Chain 8, 7-Alpha-Hydroxysteroid
Dehydrogenase Complex With Nadh And 7-Oxo
~ s Glycochenodeoxycholic Acid
~ 29% d'homologie sur 131 aa (position 53-183 aa) avec
des séquences de Protein Data Bank: gi~2624497~
correspondant à la protéine Cis-Biphenyl-2,3-
zo Dihydrodiol-2,3-Dehydrogenase de Pseudomonas Sp.
Lb400
~ 27% d'homologie sur 194 aa (position 3-196 aa) avec
des séquences de la base PIR: (SEQUENCES PIR NON
2s REDONDANTES, VERSION 57): PIR: (Séquences PIR
non redondantes, version 57)~D69930~ correspondant à
la protéine 3-oxoacyl- acyl-carrier protein reductase
homolog yoxD de - Bacillus subtilis et avec des
séquences de Swissprot (version 36, dernière remise à
~o jour du 3 mai 1999): sp~P14802~ correspondant à la


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
43
protéine YOXD_BACSU - oxidoreductase hypothétique
présente dans la région RTP-PELB (ORF238)
s ~ 52% d'homologie sur 44 aa (position 353-396 aa) avec
des séquences de PRODOM: (domaines homologues
détectés dans Swissprot, version 34.2, novembre 1997)
(homologous domains detected in Swissprot (version 36,
dernière remise à jour du 3 mai 1999)): 2675 p34.2 (11)
to NLTP(5) DHB4(3) PX18(2) correspondant à la protéine
LIPID-TRANSFER STEROL CARRIER SCP-2
NONSPECIFIC PRECURSOR ESTRADIOL BETA-
DEHYDROGENASE 17-BETA=HYDROXYSTEROID
~s ~ 27% d'homologie sur 167 aa (position 233-399 aa) avec
des séquences de Swissprot (version 36, dernière
remise à jour du 3 mai 1999) : sp~P51659~ correspondant
à la protéine DHB4 HUMAN ESTRADIOL 17 BETA-
DEHYDROGENASE 4 (EC 1.1.1.62) (17-BETA-HSD 4)
ao (17-BETA-HYDROXYSTEROID DEHYDROGENASE 4)
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 24
Le cadre ouvert de lecture (ORF) de la séquence d'acide
nucléique SEQ ID N° 24 code potentiellement pour un pôlypeptide de
2s 422 acides aminés de longueur constituant la séquence SEQ ID N° 140.
Les homologies de séquences suivantes ont été retrouvées
Homologies observées au niveau de la séquence protéique
~ 51 % d'homologie avec Genpept: gi:2731377 et SP
trEMBL:Q09979 sur 416 aa (position 11-417 aa).
~o Genpept: gi:2731377 est la traduction protéique de la


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
44
séquence gb~AAB93456.1 ~ (U28739) similaire à l'alcool
déshydrogénase/ribitol déshydrôgénase de C. elegans
~ 30% d'homologie sur 164 aa (position 47-205 aa) avec
s Protein Data Bank: gi~1827713~ correspondant à la
protéine 1AHI~A Chain A, 7 Alpha-Hydroxysteroid
Dehydrogenase Complexed With Nadh And 7-Oxo
Glycochenodeoxycholic Acid et avec gi~1827714~
correspondant à la protéine 1AHI~B Chain B, 7 Alpha-
io Hydroxysteroid Dehydrogenase Complexed With Nadh
And 7-Oxo Glycochenodeoxycholic Acid et avec
gi~1827715~ correspondant à la protéine 1AHH~A Chain
A, 7 Alpha-Hydroxysteroid Dehydrogenase Complexed
With Nad+ et avec gi~1827716~ correspondant à la
is protéine 1AHH~B Chain B, 7 Alpha-Hydroxysteroid
Dehydrogenase Compléxed With Nad+ et avec
gi~1943533~ correspondant à 1â protéine 1FMC~A Chain
A, 7-Alpha-Hydroxysteroid Dehydrogenase Complex
With Nadh And 7-Oxo Glycochenodeoxycholic Acid et
zo avec gi~1943534~ correspondant à la protéine 1FMC~B
Chain B, 7-Alpha-Hydroxysteroid Dehydrogenase
Complex With Nadh And 7-Oxo Glycochenodeoxycholic
Acid
2s ~ 29% d'homologie sur 131 aa (position 53-183 aa) avec
Protein Data Bank: gi~2624497~ correspondant à la
protéine Cis-Biphenyl-2,3-Dihydrodiol-2,3-
Dehydrogenase From Pseudomonas Sp. Lb400


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
~ 27% d'homologie sur 202 aa (position 6-212 aa) avec
Non redondant PIR: pir~D69930~ correspondant à la
protéine 3-oxoacyl- acyl-carrier protein reductase
- homolog yoxD - Bacillus subtilis et avec Swissprot:
s sp~P14802~ correspondant à la protéine YOXD_BACSU
HYPOTHETICAL OXIDOREDUCTASE IN RTP-PELB
INTERGENIC REGION (EC 1.-.-.-) (ORF238)
~ 52% d'homologie sur 44 aa {position 353-396 aa) avec
io Prodom (homologous domains detected in Swissprot):
2675 p34.2 (11) NLTP(5) DHB4(3) PX18(2)
correspondant à la protéine LIPID-TRANSFER STEROL
CARRIER SCP-2 NONSPECIFIC PRECURSOR
ESTRADIOL BETA-DEHYDROGENASE 17-BETA
~5 HYDROXYSTEROID
~ 27% d'homologie sur 183 aa (position 249-415 aa) avec
Swissprot : sp~P51659~ correspondant à la protéine
DHB4 HUMAN ESTRADIOL 17 BETA-
zo DEHYDROGENASE 4 (EC 1.1.1.62) (17-BETA-HSD 4)
(17-BETA-HYDROXYSTEROID DEHYDROGENASE 4)
~ 44% d'homologie sur 272 AA ( positions 12-280 AA )
avec la sequence g2072661 (Z95120) hypothetical
25 protein Rv3224 [Mycobacterium tuberculosis] Length =
282
~ Homologie avec des NONSPECIFIC LIPID-TRANSFER
PROTEIN PRECURSOR (NSL-TP):


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
46
35 % sur 106 AA ([318-417] ) avec la sequence
SP:NLTP BOVIN NONSPECIFIC LIPID-TRANSFER
PROTEIN (STEROL CARRIER PROTEIN 2) (SCP-2).
Length = 121
s et 30% sur 133 AA [294-417J avec la sequence
SP:NLTP RAT NONSPECIFIC LIPID-TRANSFER
PROTEIN PRECURSOR (NSL-TP) (STEROL CARRIER
PROTEIN 2) (SCP-2) (STEROL CARRIER PROTEIN X)
(SCP-X) (SCPX).Length = 547
~o
Fonction putative
L'ORF de 422 acides aminés possède des homologies avec différentes
protéines enzymatiques putatives impliquées dans les mécanismes de
deshydrogénation des sterols de plusieurs organismes: homme, souris,
~s E. coli, S. cerevisiae, C. elegans. De plus nous avons pu mettre en
évidence une homologie avec une séquence de la protéine SCP-2
impliquée dans le transport intracellulaire des lipides. De ce fait, le gène
GS15231 code pour une protéine d'intérêt de par sa fonction possible
dans le défaut de trafic intracellulaire du cholestérol chez les patients
2o Tangier/FHD, ce qui renforce l'intérêt de l'étude du gène GS15231.
De plus le gène 6515231 est par sa localisation un gène candidat
positionne) pour l'étude et la caractérisation du défaut génétique observé
dans la maladie de Tangier ou le défaut familial en HDL.
Les polypeptides de séquences SEQ ID N° 139 et 140 sont
2s susceptibles d'intervenir dans la régulation du flux du cholestérol, et
plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
47
Gène GS915528.
Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS915528.
s La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°25.
La séquence SEQ ID N°25 a une longueur de 3106 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 1 au nucléotide en position 1272
~o de la séquence SEQ ID N°25
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La deuxième séquence nucléique de l'ADNC correspondant à ce
transcrit constitue la séquence SEQ ID N° 26.
is La séquence SEQ ID N° 26 a une longueur de 3313 nucléotides.
Elle comprend un cadre ouvert de lecture (ORF) partiel allant du
nucléotide en position 3 au nucléotide en position 1370, qui correspond
aussi à la séquence codante. Un signal de polyadénylation débute au
nucléotide en position 3280 de la séquence SEQ ID N° 26.
2o Les homologies de séquence des la SEQ ID N° 26 ont été
observées avec des séquences référencées dans la base de données
GenBank (Version 116)
- 99% d'identité nucléiqûe sur 2755pb (position 119-2873) avec
25 g7020444 AK000388 Homo sapiens cDNA FLJ20381 fis, clone
KAIA2329 Length = 2970 pb
- 99% d'identité nucléique avec un BAC en cours de séquençage
g6514007 AC013568 Homo sapiens clone RP11-1 B9, WORKING
DRAFT SEQUENCE 10 fragments non ordonnés


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
48
Les analyses d'expression du transcrit de séquence SEQ ID N°25
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de .montrer que le gène GS915528 était exprimé dans le cerveau foetal,
s le foie, la prostate, le coeur, le placenta, l'utérus, le testicule et le
cerveau.
De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
séquence SEQ ID N°92, a révélé la présence de transcrits dans le blot
to commercialisé par la Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°92 est respectivement de
- 1,9 kb, 3,2 kb et 3,8 kb dans le pancréas ;
- 1 kb, 1,9 kb et 3,8 kb dans le cceur ;
t5 - 1 kb, 1,9 kb et 3,2 kb dans le foie ;
- 1 kb et 1,9 kb dans le rein ;
- 1,9 kb dans le muscle squelettique et le cerveau.
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
2o particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Polypeptide codé par l'acide nucléique de séquence SEQ ID IVO 25
2s Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°25 code potentiellement pour un polypeptide de 424
aminoacides de longueur constituant la séquence SEQ ID N°141.
Homologies observées au niveau de la séquence protéique
JO


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
49
Cette ORF de 424 aa possède des homologies de type motif avec des
domaines conservés de différentes protéines tyrosine phosphatase dans
différentes bases de données protéiques telles que : .
~ 49% d'homologie sur 364 aa (position 3-366 aa) avec
s des séquences de SP-TrEMBL (SP-TrEMBL, version 7,
novembre 1998): sp~P91433~P91433 codé par l'ADNc
YK65E9.3 de C. elegans et avec des séquences de
Genpept: (traduction de Genbank v110 et 111, dernière
remise à jour le 7 mai 1999): gi~1708767~ contenant un
io domaine trouvé dans la bande 4.1, ezrin, moesin, radixin
et talin chez C. elegans
~ 44% d'homologie sur 322 aa (position 1-322 aa) sur des
séquences de SP-TrEMBL (SP-TrEMBL, version 7,
i; novembre 1998): sp~043491 X043491 PROTEIN 4.1-G
~ 43% d'homologie sur 227 aa (position 7-233 aa) avec
des séquences de PRODOM: (domaines homologues
détectés dans Swissprot, version 34.2, novembre 1997):
20 894 p34.2 (29) MOES(4) RADI(3) EZRI(3) correspondant
au domaine protéine tyrosine phosphatase des proteines
MOESIN BAND P81 VILLIN-2 EZRIN RADIXIN
impliquées dans l'organisation membranaire.
zs ~ 42% d'homologie sur 313 aa (position 9-321 aa) sur des
séquences de Swissprot (version 36, dernière remise à
jour du 3 mai 1999): sp~P29074~PTN4_HUMAN -
protéine tyrosine phosphatase humaine MEG1 (EC
3.1.3.48) .


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
s0
~ 41 % d'homologie sur 320 aa (position 7-326 aa) avec
des séquences de PIR: (SEQUENCES PIR NON
REDONDANTES, VERSION 57) non-redondante: PIR:
(Séquences PIR non redondantes, version 57)~S~JU0188
s - protéine band 4.1 appartenant à la super-famille des
protéines tyrosine phosphatase de souris. et des
séquences de Swissprot (version 36, dernière remise à
jour du 3 mai 1999): sp~P52963~NBL4 mouse - protéine
NBL4 et des séquences de SP-TrEMBL (SP-TrEMBL,
to version 7, novembre 1998): sp~057457~ protéine
similaire à la protéine band 4.1et des séquences de
Genpept: (traduction de Genbank v110 et 111, dernière
remise à jour le 7 mai 1999): gi~466548~ - protéine NBL4
de mus musculus
~ 41 % d'homologie sur 314 aa (position 9-322 aa) sur des
séquences de Swissprot (version 36, dernière remise à
jour du 3 mai 1999) : sp~P11171 ~41_HUMANPROTEIN
4.7 (BAND 4.1) (P4.1)
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 26
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
ID N° 26 code potentiellement pour un polypeptide de 455 acides
aminés de longueur constituant la séquence SEQ ID N° 142.
2s
Homologies observées au niveau de la séquence protéique
Cette ORF de 455 aa possède des homologies de type motif avec des
domaines conservés de différentes protéines tyrosine phosphatase dans
différentes bases de données protéiques telle que .


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
51
~ 50% d'homologie sur 374 aa (position 24-397 aa) avec
SP-trEMBL: sp~P91433~P91433 CODED FOR BY C.
ELEGANS CDNA YK65E9.3 et avec Genpept115:
gi~1708767~ 080955 contenant un domaine trouvé dans
s la bande 4.1, ezrin, moesin, radixin et talin chez c.
elegans
~ 45% d'homologie sur 333 aa (position 21-353 aa) sur
SP-trEMBL: sp~043491~043491 PROTEIN 4.1-G.
~ 43% d'homologie sur 227 aa (position 7-233 aa) avec
Prodom: 894 p34.2 (29) MOES(4) RADI(3) EZRI(3)
correspondant à la PROTEIN PHOSPHATASE
PROTEIN-TYROSINE MOESIN BAND P81 VILLIN-2
~5 EZRIN RADIXIN MEMBRANE-ORGANIZING
~ 42% d'homologie sur 329 aa (position 24-352 aa) sur
Swissprot38: sp~P29074~PTN4_HUMAN PROTEIN-
TYROSINE PHOSPHATASE MEG1 (EC 3.1.3.48)
20 (PTPASE-MEG1) (MEG).
~ 42% d'homologie sur 335 aa (position 23-357aa) avec
PIR non-redondante: pir~S~JU0188 band 4.1 protein
tyrosine-phosphatase superfamily member protein de
Zs souris et Swissprot: sp~P52963~NBL4 mouse NBL4
protein et SP-trEMBL: sp~057457~ band 4.1-like protein
4 et Genpept: gi~466548~ NBL4 mus musculus protein


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
52
~ 41 % d'homologie sur 332 aa (position 22-353 aa) sur
Swissprot : sp~P11171~41_HUMAN PROTEIN 4.1 (BAND
4.1 ) (P4.1 ).
s Fonction putative
Le gène GS915528 présente un intérêt pour l' =étude fonctionnelle de la
maladie de Tangier et du FHD en ce sens .qu'il s'agit à la fois d'un
candidat positionnel et d'un gène codant pour une nouvelle protéine dont
les fonctions putatives (tyrosine phosphatase) pourraient jouer un rôle
~o dans la cascade de signalisation intracellulaire liée à l'efflux du
cholestérol intracellulaire médié par les particules HDL, impliqué dans la
maladie de Tangier et la déficience familiale en HDL (FHD).
Les polypeptides de séquences SEQ ID N° 141 et 142 sont
susceptibles d'intervenir dans la régulation du flux du cholestérol, et plus
ts particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
2o Gène GS99817
Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS99817.
La première séquence nucléique de l'ADNc correspondant à ce
25 transcrit constitue la séquence SEQ ID N°27.
La séquence SEQ ID N°27 a une longueur de 1539 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 3 au nucléotide en position 698 de
la séquence SEQ ID N°27.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
53
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitute la séquence SEQ ID N° 28.
s La séquence SEQ ID N° 28 a une longueur de 3404 nucléotides.
Elle comprend un cadre ouvert de lecture (ORF) partiel allant du
nucléotide en position 1 au nucléotide en position 792 de la séquence
SEQ ID N° 28.
Des homologies de séquence de la SEQ ID N° 28 ont été
~o retrouvées avec des séquences référencées dans la base de données
GenBank (Version 116)
- Identité de 97% sur 380 pb avec un BAC END CIT-HSP-2166G6.TR
CIT-HSP Homo sapiens genomic clone 216666, genomic survey
sequence Length = 380gi~2975337~gb~B93000.1 ~B93000[2975337]
~s
- Identité de 100% sur 315 pb avec un BAC END HS 2166 A2_D03 MR
CIT Approved Human Genomic Sperm Library D Homo sapiens genomic
clone Plate=2166 Col=6 Row=G, genomic survey sequence Length =
316 gi~3480271~gb~AQ104915.1~AQ104915[3480271]
Les analyses d'expression du transcrit de séquence SEQ ID N°27
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS99817 était exprimé dans le cerveau foetal.
2s De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
séquence SEQ ID N°93, a révélé la présence de transcrits dans le blot
commercialisé par la Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
~o ID N°93 est respectivement de


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
sa
- 1,5 kb, 2 kb et 4,4 kb dans le coeur et le cerveau ;
- .2 kb et 4,4 kb dans le pancréas ;
- 1,5 kb at 4,4 kb dans le rein et le muscle suqelettique.
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
io
Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 27
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
ID N°27 code potentiellement pour un polypeptide de 232
aminoacides
de longueur constituant la séquence SEQ ID N°143.
~s Homologies observées au niveau de la séquence protéique
27% d'homologie sur 211 aa (position 11-221 aa) avec des séquences
deGenpept: (traduction de Genbank v110 et 111, dernière remise à jour
le 7 mai 1999): gi~3876730~ et des séquences de TrEMBL (SP-TrEMBL,
version 7, novembre 1998): sp~Q20021 ~ correspondant à la traduction de
20 la séquence d'un cosmide de nématode F35C11.4 (Caenorhabditis
elegans).
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 28
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
2s ID N° 28 code potentiellement pour un polypeptide de 263 acides
aminés de longueur constituant la séquence SEQ ID N° 144.
II a été observé des homologies entre la séquence SEQ ID N° 144 et
les
séquences suivantes
Homologies observées au niveau de la séquence protéique:


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
28% d'homologie sur 255 aa (position 1-255 aa) avec Genpept:
gi~3876730~ et trEMBL: sp~Q20021 ~ correspondant à la traduction
de la séquence d'un cosmide de nématode F35C11,4
- (Caenorhabditis elegans).
5
Fonction putative
Ce gène est un candidat pour l'étude de la maladie de TangierlFHD du
fait de la localisation chromosomique.
Les polypeptides de séquences SEQ ID N° 143 et 144 sont
~o susceptibles d'intervenir dans la régulation du flux du cholestérol, et
plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
~s
Gène GS916229.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS916229.
zo La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°29.
La séquence SEQ ID N°29 a une longueur de 792 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF) allant
du nucléotide en position 1 au nucléotide en position 203 de la séquence
z5 SEQ ID N°29.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°29
~o ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
~6
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS916229 était exprimé dans le cerveau foetal,
le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal,
l'utérus,
le testicule et le rein.
s
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
~0 9q31-34 du chromosome 9.
Polypepfide codé par l'acide nucléigue de séquence SEQ ID NO 29
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°29 code potentiellement pour un polypeptide de 68
~s aminoacides de longueur constituant la séquence SEQ ID N°145.
Aucune homologie significative avec BLAST n'a été retrouvée
avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999) et PRODOM:
(domaines homologues détectés dans Swissprot, version 34.2,
2o novembre 1997).
Le polypeptide de séquence SEQ ID N° 145 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
2s familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Gène GS92544
~o Acide(s) nucléiques)


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
57
II a été isolé selon l'invention trois ARN messagers correspondant
respectivement à un transcrit long et deux transcrits courts du gène
désigné ici sous le n° GS92544.
La séquence nucléique de l'ADNc correspondant au transcrit long
s constitue la séquence SEQ ID N°30.
La séquence SEQ ID N°30 a une longueur de 2733 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 1 au nucléotide en position 2160
de la séquence SEQ ID N°30.
~o
La première séquence nucléique de l'ADNc correspondant au
transcrit court constitue la séquence SEQ ID N°31.
La séquence SEQ ID N°31 a une longueur de 2694 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
~s partiel allant du nucléotide en position 1 au nucléotide en position 2121
de la séquence SEQ ID N°31.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La seconde séquence nucléique de l'ADNc correspondant au
2o second transcrit court constitue la séquence SEQ ID N° 32.
La séquence SEQ ID N° 32 a une longueur de 2765 nucléotides.
Elle comprend un cadre ouvert de lecture complet allant du nucléotide
en position 56 au nucléotide en position 2287 de la séquence SEQ ID N°
32. La séquence codante débute au nucléotide en position 410 et se
2s termine au nucléotide en position 2160 de la séquence SEQ ID N° 32..
Le codon d'initiation de la traduction débute sur le nucléotide en position
410 de la séquence SEQ ID N° 32.
La séquence SEQ ID N° 32 possède des homologies avec les
séquences référencées dans la base de données GenBank (Version
30 116) suivantes


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
58
~ 100% d'homologie sur 2419 pdb (positions [485-2903] ) matchant
avec les positions [ 1-2419] de la sequence g6807990 (AL137432 )
Homo sapiens mRNA; cDNA DKFZp761 E1824 (from clone
OKFZp761 E1824); partial cds , length=2438 pdb , deposee le 18-
s FEB-2000, sur Chromosome 9, et annotee " similaire au CR2
receptor "
~ 97 % d'homologie sur 157 pdb (positions [1271-1427] )avec les
positions [431-277] de g3590696 (AQ192074)
io HS 3228_B2_H11 T7 CIT Approved Human Genomic Sperm Library
D Homo sapiens genomic clone Plate=3228 Col=22 Row=P, genomic
survey sequence. Length = 513
~ Plusieurs fragments de 99% à 100% d'identité avec la sequence
is gi~6982613~ ~AL138756 : Homo sapiens chromosome 9 clone RP11-
4O1 map q31.3-33.1, *** SEQUENCING IN PROGRESS ***, 41
unordered pieces
~ Plusieurs fragments de 100% d'identité avec la sequence g7230026
20 (AC010824) Homo sapiens clone RP11-5A23, *** SEQUENCING IN
PROGRESS ***, 32 unordered pieces. Length = 162010
Les analyses d'expression du transcrit long et du transcrit court
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
2s analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS92544 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression de ces transcrits par
Northern blot, à l'aide respectivement des sondes de séquence SEQ ID
N°94, a révélé la présence de transcrits dans le blot commercialisé
par la
~o Société Clontech (Ref. N° 7759-1).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
59
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°94 est respectivement de 4 kb et de 6 kb dans le placenta.
Ce -gène constitue un candidat positionnel causal d'une maladie due à
s un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
~o Polypeptides codés parles acides nucléiques de séguences SEQ !D
NO 30 et 31
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°30 (transcrit long) code potentiellement pour un
polypeptide
de 720 aminoacides de longueur constituant la séquence SEQ ID N°146.
~s Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°31 (transcrit court) code potentiellement pour un
polypeptide
de 707 aminoacides de longueur constituant la séquence SEQ ID N°147.
Homologies observées au niveau de la séquence protéique:
Cette séquence possède des homologies significatives des positions
zo 139-194 aa / 199 - 254 aa avec des domaines conservés sushi.HMM de
la base de données Pfam (HMMER 2.0 (June 1998).
Cette ORF possède une annotation dans Genpept: (traduction de
Genbank v110 et 111, dernière remise à jour le 7 mai 1999) et TrEMBL
zs (SP-TrEMBL, version 7, novembre 1998) avec la traduction BIastX de
nombreuses séquences telles que
~ 42% d'homologie sur 115 aa (position 2-116 aa) avec
des séquences de gi~340164~ précurseur humain de
l'uromoduline et gi~340166~ uromoduline [Homo sapiens]


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
sur Genpept: (traduction de Genbank v110 et 111,
dernière remise à jour le 7 mai 1999)
~ 37% d'homologie sur 141 a (position 2-142 aa) avec des
s séquences de SP-TrEMBL (SP-TrEMBL, version 7,
novembre 1998): sp~P87363~P87363 un frament de la
FIBRILLINE-1.
~ 30% d'homologie sur 234 aa (position 7-240 aa) avec
~o des séquences de Genpept: (traduction de Genbank
v110 et 111, dernière remisé à jour le 7 mai 1999):
gi~306746~ et gi~1335064~ fibrilline humaine.
~ 30% d'homologie sur 194 aa (position 8-201 aa) avec
i5 des séquences de SP-TrEMBL (SP-TrEMBL, version 7,
novembre 1998): sp~035806~035806 LATENT TGF-
BETA BINDING PROTEIN-2 LIKE PROTEIN
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 32
Zo Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
ID N° 32 code potentiellement pour un polypeptide de 713 acides
aminés de longueur constituant la séquence SEQ ID N° 148.
Des homologies de la séquence SEQ ID N° 148 ont été
observées avec des séquences référencées dans des bases de
2s données. Les homologies sont les suivantes
~ homologie avec Genpept: gi~340164~ uromodulin
precursor [Homo sapiens) et Genpept: gi~340166~
uromodulin [Homo sapiens]
~ homologie avec SP-trEMBL: sp~P87363~P87363
3o FIBRILLIN-1 (FRAGMENT).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
61
~ homologie avec Genpept: gi~306746~ et gi~1335064~
fibrillin [Homo sapiens]
~ homologie avec SP-trEMBL: sp~035806~035806
LATENT TGF-BETA BINDING PROTEIN-2 LIKE
s PROTEIN
~ homologie avec 8784994 (X81479) EMR1 [Homo
sapiens] Length = 886
~ homologie avec 84379069 (X94630) seven-span
transmembrane protein [Homo sapiens]
~o ~ Autres homologies avec des protéines telles que
EMR1, CD97, fibulins, complement receptor...
La séquence SEO ID N° 148 possède des motifs caractéristiques tels
que 3 domaines EGF dont 2 calcium binding, un site de tyrosine
~s phosphatase, un domaine hydrophobe en N-terminal ; Nombreux sites
de glycosylation ; 2 camp sites de phosphorylation ; 2sites Asp
hydroxylation.
Fonction putative
2o De par son homologie avec l'uromoduline, le produit du gène
GS92544 est putativement une protéine associée à la membrane
comme l'uromoduline qui est une protéine ancrée au moyen d'un
glycosylphosphatidylinositol (GPI). Ces résultats basés sur les études
d'homologie de séquence partielles en acides aminés suggèrent que le
2s produit du gène GS92544 pourrait être associé à la membrane par une
liaison aux lipides membranaires et donc pourrait être associé au déficit
d'efflux du cholestérol cellulaire observé chez les patients FHD ou
Tangier.
Les polypeptides de séquences SEQ ID N° 146, 147 et 148 sont
~o. susceptibles d'intervenir dans la régulation du flux du cholestérol, et
plus


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
62
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
s Gène GS930824
Acides) nucléiques)
II a été isolé selon l'invention deux ARNs messagers
correspondant à un transcrit du gène désigné ici sous le n° GS930824.
La première séquence nucléique de l'ADNc correspondant à ce
~o transcrit constitue la séquence SEQ ID N°33.
La séquence SEQ ID N°33 a une longueur de 4745 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 2 au nucléotide en position 514 de
la séquence SEQ ID N°33.
ts Homologies observées au niveau de la séquence nucléotidique:
90% d'homologie avec Genbank :AF115435, syntaxine 17 de rat sur 510
pb (position 22-531 pb).
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 34 .
zo La séquence SEQ ID N° 34 a une longueur de 5241 nucléotides.
Elle comprend un cadre ouvert de lecture (ORF) complet allant du
nucléotide en position 57 au nucléotide en position 1013 de la séquence
SEQ ID N°34. La séquence codante débute au nucléotide en position
105 et se termine au nucléotide en position 1013 de la séquence SEQ ID
zs N° 34. Le codon d'initiation de la traduction débute sur le
nucléotide en
position 105 de la séquence SEQ ID N°34.
La séquence SEQ ID N° 34 possède des homologies avec des
séquences référencées dans la base de données GenBank (Version
116). II s'agit des homologies suivantes
~o
~ 90% d'homologie avec Genbank :AF115435, syntaxine 17 de rat sur
510 pb (position 22-531 pb).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
63
~ 92 % d'homologie sur 475 pdb (positions [540-1036] ) et 84% sur
406 pdb (positions [102-507]) avec la sequence 84206160
AF115435 ) Rattus norvegicus syntaxin 17 mRNA, complete
s cds.Length = 1678;
~ 98% d'homologie sur 431 pdb (positions [1899-2329]) et 91% sur 62
pdb ( positions [1819-1880]) avec la sequence 84652677
(AQ474416) CITBI-E1-258819.TF CITBI-E1 Homo sapiens genomic
~o clone 258819, genomic survey sequence.Length = 525;
~ 99% d'homologie sur 331 pdb ( positions (6394-6724]) avec la
sequence 82929043 ( B87911) RPC111-30N20.TP RPCI-11 Homo
sapiens genomic clone RPCI-11-30N20, genomic survey
~s sequence.Length = 425;
~ 99% d'homologie sur 2662 pdb ( positions [20-2681] ) avec la
sequence 87020892 ( AK000658) Homo sapiens cDNA FLJ20651
fis, clone KAT01814.Length = 2678; Submitted (15-FEB-2000) to the
zo DDBJ/EMBL/GenBank databases, projet NEDO.
Les analyses d'expression du transcrit de séquence SEQ ID N°33
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
zs de montrer que le gène GS930824 était exprimé dans le cerveau foetal,
le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal,
l'utérus,
le testicule, le rein et le muscle squelettique.
De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide respectivement des
~o sondes de séquence SEQ ID N° 95 et 96, a révélé la présence de


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
64
transcrits dans le blot commercialisé par la Société Clontech (Ref. N°
7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°95 est respectivement de
s - 1,1 kb, 1,6 kb, 2,6 kb, 4,9 kb.et 7 kb dans le pancréas, le rein, le
muscle squelettique, le foie, le cerveau et le coeur ;
- 1,6 kb, 2,6 kb, 4,9 kb.et 7 kb dans le poumon et le placenta.
La taille des transcrits détectés avec la sonde de séquence SEQ
~o ID N°96 est respectivement de
- 1,35 kb, 2,4 kb, 3,5 kb et 10 kb dans le placenta ;
- 1,35 kb et 2,4 kb dans le pancréas, le rein et le foie ;
- 1,35 kb dans le poumon ;
- 2,4 kb dans le muscle squelettique, le cerveau et le coeur.
~s
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Polypeptide codé par l'acide nucléigue de séquence SEQ ID NO 33
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°33 code potentiellement pour un polypeptide de 170
aminoacides de longueur constituant la séquence SEQ ID N°149.
2s Aucune homologie significative avec BLAST n'a été retrouvée
avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999) et PRODOM:
(domaines homologues détectés dans Swissprot, version 34.2,
novembre 1997).
~o Homologies observées au niveau de la séquence protéique:


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
72% d'homologie avec des séquences de Genpept: (traduction de
Genbank v11 D et 111, dernière remise à jour le 7 mai 1999) :gi4206161
sur 170 acides aminés (position 1-170 aa) gi4206161 est la traduction
protéique du gène codant pour la syntaxine 17 de rat..Genpept:
s (traduction de Genbank v110 et 111, dernière remise à jour le 7 mai
1999)
Polypeptide codé par l'acide nucléigue de séguence SEQ ID N° 34
Le cadre ouvert de lecture de la séquence SEQ ID N° 34 code
~o potentiellement pour un polypeptide de 318 acides aminés constituant la
séquence SEQ ID N° 150.
Les homogies suivantes ont été observées
- 72% d'homologie avec Genpept :gi4206161 sur 170 acides aminés
~s (position 1-170 aa). Genpept :gi4206161 est la traduction protéique du
gène codant pour la syntaxine 17 de rat.
Homologie protéique sur Genpept115, Trembl et PIR
- 75% d'homologie sur 302 AA ( positions [105-1010) ) avec toute la
20 longeur la sequence traduite g4206161 (AF115435) syntaxin 17
[Battus norvegicusJLength = 301; de la g4206161
Le polypeptide de séquence SEQ ID N° 150 possède un motif
caractéristique d'une syntaxine entre les nucléotides en positions 1 et
?s 243 du cadre de lecture ouvert.
Fonction putative
Les polypeptides de séquence SEQ ID N°149 et 150
s'apparentent donc à une protéine de la famille des syntaxines impliquée
~o dans le transport vésiculaire intracellulaire. Ce mécanisme sous-tendu


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
66
par un adressage spécifique médié par ces protéines est d'intérêt par
rapport à la maladie de Tangier/FHD qui est décrite par un défaut du
mécanisme de transport et de translocation des pools de cholestérol
intracellulaire vers les particules HDL accepteurs. Les polypeptides de
s séquence SEQ ID N°149 et 150 sont donc susceptibles d'intervenir dans
une étape importante impliquée dans le transport inverse du cholestérol
par les HDL.
Les polypeptides de séquences SEQ ID N° 149 et 150 sont
également susceptibles d'intervenir dans une maladie génétiquement
io liée au locus 9q31-34 du chromosome 9.
Gène GS93382.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
~s un transcrit du gène désigné ici sous le n° GS93382.
La séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°35.
La séquence SEQ ID N°35 a une longueur de 3014 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
zo partiel allant du nucléotide en position 3 au nucléotide en position 371 de
la séquence SEQ ID N°35.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
2s Les analyses d'expression du transcrit de séquence SEQ ID N°35
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS93382 était exprimé dans le cerveau foetal.
De plus, une analyse de l'expression du transcrit par Northern
~o blot, selon le protocôle décrit de l'Exemple 1, à l'aide de la sonde de


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
67
séquence SEQ ID N°97, a révélé la présence de transcrits dans le blot
commercialisé par la Société Clontech (Ref. N° 7759-1).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°97 est respectivement de
s - 2 kb et 7,5 kb dans le cerveau ;
- 2 kb dans le pancréas, le rein, le muscle squelettique, le foie et le
coeur.
Ce gène constitue un candidat positionne) causal d'une maladie
o due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
is Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 35
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEQ ID N°35 code potentiellement pour un polypeptide de 123
aminoacides de longueur constituant la séquence SEQ ID N°151.
Aucune homologie significative avec BLAST n'a été retrouvée
2o avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999), PRODOM:
(domaines homologues détectés dans Swissprot, version 34.2,
novembre 1997),Genpept: (traduction de Genbank v110 et 111, dernière
remise à jour le 7 mai 1999), Swissprot (version 36, dernière remise à
2s jour du 3 mai 1999), TrEMBL (SP-TrEMBL, version 7, novembre 1998),
PIR: (SEQUENCES PIR NON REDONDANTES, VERSION 57) et PDB:
(PROTEIN DATA BANK, FEVRIER 1999).
Le polypeptide de séquence SEQ ID N° 151 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
3o particulièrement de la maladie de Tangier, dans des déficiences


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
68
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
s Gène GS946300.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS946300.
La séquence nucléique de l'ADNc correspondant à ce transcrit
io constitue la séquence SEQ ID N°36.
La séquence SEQ ID N°36 a une longueur de 1575 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 3 au nucléotide en position 176 de
la séquence SEQ ID N°36.
~s Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°36
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
zo analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS946300 était exprimé dans le cerveau foetal,
le foie, le cerveau, le coeur, la prostate, le placenta, le foie foetal,
l'utérus,
le testicule et le rein.
zs Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
69
Polypeptide codé par l'acide nucléique de séquence SEQ ID ND 36
Le cadre ouvert de lecture de la séquence d'acides nucléiques
SEO ID N°36 code potentiellement pour un polypeptide de 58
aminoacides de longueur constituant la séquence SEQ ID N°152.
s Aucune homologie significative avec BLAST n'a été retrouvée
avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999) et PRODOM:
(domaines homologues détectés dans Swissprot, version 34.2,
novembre 1997).
~o Le polypeptide de séquence SEQ ID N°152 est susceptible
d'intervenir dans la régulation du flux de cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
Le polypeptide de séquence SEQ ID N°152 est donc susceptible
~s d'intervenir dans une étape importante impliquée dans le transport
inverse du cholestérol par les HDL.
Gène GS937345.
zo Acide(s) nucléiques)
II a été isolé selon l'invention deux ARN messagers correspondant
respectivement à un transcrit long et un transcrit court du gène désigné
ici sous le n° GS937345.
Une première séquence nucléique de l'ADNc correspondant au
zs transcrit long a été isolée et constitue la séquence SEQ ID N°37.
La séquence SEQ ID N°37 a une longueur de 1607 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 2 au nucléotide en position 109 de
la séquence SEQ ID N°37.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
A partir de la séquence SEQ ID N° 37, deux amorces de
séquences respectives SEQ ID N° 104 et 105 ont été synthétisées et ont
permis d'amplifier un ADNc à partir d'une banque d'ARNm polyA+ de
différents tissus humains commercialisée par la société Clontech.
s La séquence d'ADNc amplifiée à l'aide des amorces de séquence
SEQ ID N° 104 et 105 constitue la séquence SEQ ID N° 38. La
séquence SEQ ID N° 38 a une longueur de 1161 nucléotides.
Des homologies ont été retrouvées entre la séquence SEQ ID N°
38 et des séquences référencées dans la base de données GenBank
~o (Version 116). Les homologies sont les suivantes
~ 99% d'homologie sur 1096 pdb (positions [1-1093]) matchant avec
les positions [8-1102] de la sequence
gi~6841231 ~gb~AF161409.1 ~AF161409[6841231]Homo sapiens
is HSPC291 mRNA, partial cds. Length = 1102;
unpublished ;
~ 99% sur 1025 pdb (positions (119-1148]) matchant avec les
positions [8-1030] de la sequence
2o gi~6841235~gb~AF161411.1~AF161411[6841235] Homo sapiens
HSPC293 mRNA, partial cds. Length = 1045; unpublished ;
~ 99% sur 1161 pdb (positions [1-1161] ) matchant avec les positiosn
2s [43-1202] de la sequence
gi~7020861 ~dbj~AK000637.1 ~AK000637[7020861] Homo sapiens
cDNA FLJ20630 fis, clone KAT03874.Length = 1538; deposee le 22-
FEB-2000, projet NEDO ; unpublishèd .
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
71
~ 92 % sur 1003 pdb (positions [1-1043]) et 94% sur 38 pdb (positions
[1048-1085]) avec la sequence
gb~AC021286.2~AC021286[6899766] Homo sapiens clone RP11
. 21 H22, WORKING DRAFT SEQUENCE, 19 unordered pieces.
Length = 175143 ;
La séquence nucléique de l'ADNc correspondant au transcrit court
constitue la séquence SEQ ID N°39.
La séquence SEQ ID N°39 a une longuéur de 1332 nucléotides.
~o
Aucune identité de séquence n'a été retrouvée pour les
séquences respectives du transcrit long et du transcrit court lors d'une
recherche dans la base de données GenBank (Version 110).
~s Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
zo
Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 37
Le cadre ouvert de lecture partiel du transcrit long de séquence
d'acides nucléiques SEQ ID N°37 code potentiellement pour un
polypeptide de 36 aminoacides de longueur constituant la séquence
zs SEQ ID N°153.
Homologies observées au niveau de la séquence nucléotidique:
41 % d'identité sur 22 aa (position 6 à 29 aa) avec des séquences de
Swissprot (version 36, dernière remise à jour du 3 mai 1999): sp~P23596~
PRTD ERVVCH Proteases secretion ATP- Binding protein PRTD.
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
72
Ce gène est un candidat pour l'étude de la maladie de Tangier/FHD du
fait de la localisation chromosomique.
Gène GS99556
s Acides) nucléiques)
II a été isolé selon l'invention deux ARN messagers correspondant
respectivement à un transcrit long et à un transcrit court du gène désigné
ici sous le n° GS99556.
La séquence nucléique de l'ADNc correspondant au transcrit long
~o constitue la séquence SEQ ID N°40.
La séquence SEQ ID N°40 a une longueur de 10419 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 2 au nucléotide en position 1954
de la séquence SEQ ID N°40.
~s Le codon d'initiation (ATG) débute au nucleotide en position 29 du
transcrit long de séquence SEQ ID N°40.
La séquence nucléique de l'ADNc correspondant au transcrit court
constitue la séquence SEQ ID N°41.
2o La séquence SEQ ID N°41 a une longueur de 1813 nucléotides.
2s
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
Les analyses d'expression du transcrit de séquence SEQ ID N°40
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de montrer que le gène GS99556 était exprimé dans le cerveau foetal, le
~o foie, le cerveau, le coeur, la prostate, le placenta et le foie foetal.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
73
De plus, une analyse de l'expression du transcrit par Northern
blot, selon le protocole décrit de l'Exemple 1, à l'aide respectivement des
sondes de séquence SEQ ID N°98 et SEQ ID N°99, a révélé la
présence
de transcrits dans le blot commercialisé par la Société Clontech (Ref.

s 7759-1 ).
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°98 est respectivement de
- 2,6 kb , 4,2 kb, 5 kb et 10 kb dans le cerveau ;
- 2,6 kb et 5 kb dans le foie, le poumon, le placenta et le coeur ;
~o - 2,6 kb et 5 kb dans le rein ;
- 2,6 kb dans le muscle squelettique ;
- 5 kb dans le pancréas.
La taille des transcrits détectés avec la sonde de séquence SEQ
ts ID N°99 est respectivement de
- 2,2 kb dans le foie ;
- 2,4 kb et 4,4 kb dans le coeur ;
- 9 kb dans le cerveau, le placenta, le rein, le pancréas et le poumon.
?o La taille des transcrits détectés avec la sonde de séquence SEQ
ID N° 100 est respectivement de
- 5 kb et 7 kb dans le placenta et le coeur ;
- 5 kb dans le cerveau, le rein et le pancréas.
2s Ce gène constitue un candidat positionnel causal d'une maladie
due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
7a
Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 40
Le cadre ouvert de lecture partiel de la séquence d'acides
nùcléiques SEQ ID N°40 code potentiellement pour un polypeptidé de
s. 651 aminoacides de longueur constituant la séquence SEQ ID N°154.
Homologies observées au niveau de la séquence protéique
Cette ORF possède des homologies avec des séquences de Genpept:
(traduction de Genbank v110 et 111, dernière remise à jour le 7 mai
1999) et de TrEMBL (SP-TrEMBL, version 7, novembre 1998)
io (traduction BIastX des séquences suivantes)
~ 32% d'homologie sur 403 aa dansGenpept:
(traduction de Genbank v110 et 111, dernière
remise à jour le 7 mai 1999) avec gi~4529890~
~s NG22 [Homo sapiens]
~ 25% d'homologie sur 693 aa dans Genpept:
(traduction de Genbank v110 et 111, dernière
remise à jour le 7 mai 1999) avec gi~3986770~
20 NG22 [Mus musculus]
24% d'homologie sur 683 aa dansGenpept: (traduction de Genbank
v110 et 111, dernière remise à jour le 7 mai 1999) avec gi~1072187~
correspondant à l'ADNc CEESB82F de C elegans -
~ 24% d'homologie sur 683 aa avec TrEMBL (SP-
TrEMBL, version 7, novembre 1998) sp~Q20026~
codé par l'ADNc CEESB82F de C elegans
~o Fonction putative


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
Ce gène est un candidat pour l'étude de la maladie de Tangier/FHD du
fait de la localisation chromosomique.
Le polypeptide de séquence SEQ ID N° 154 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
s particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
~o Gène GS96663.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS96663. Six séquences
nucléiques représentatives de ce transcrit ont été déterminées
is La première séquence nucléique partielle de l'ADNc
correspondant à ce transcrit constitue la séquence SEQ ID N°42.
La séquence SEQ ID N°42 a une longueur de 1377 nucléotides.
La seconde séquence nucléique partielle de l'ADNc
zo correspondant à ce transcrit constitue la séquence SEQ ID N°43.
La séquence SEQ ID N°43 a une longueur de 452 nucléotides.
La troisième séquence nucléique partielle de l'ADNc
correspondant à ce transcrit constitue la séquénce SEQ ID N°44.
?s La séquence SEQ ID N°44 a une longueur de 562 nucléotides.
La quatrième séquence nucléique partielle de l'ADNc
correspondant à ce transcrit constitue la séquence SEQ ID N°45.
La séquence SEQ ID N°45 a une longueur de 1766 nucléotides.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
76
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
A partir de la séquence SEQ ID N° 42, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
s SEQ ID N° 106 et 107.
A partir de la séquence SEQ ID N° 43, on a synthétisé une
amorce nucléotidique de séquence SEQ ID N° 108.
A partir de la séquence SEQ ID N° 45, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
io SEQ ID N° 109 et 110.
Ces amorces ont permis d'amplifier une cinquième et une sixième
séquence nucléotidique représentatives du transcrit du gène GS96663.
La cinquième séquence nucléique correspondant au transcrit du
gène GS96663 constitue la séquence SEQ ID N° 46. La séquence
ts nucléique SEQ ID N° 46 a une longueur de 601 nucléotides.
La sixième séquence nucléique correspondant au transcrit du
gène GS96663 constitue la séquence SEQ ID N° 47. La séquence SEQ
ID N° 47 a une longueur de 3706 nucléotides. Elle comprend un
cadre
20 ouvert de lecture partiel allant du nucléotide en position 1 au nucléotide
en position 3202 de la séquence SEQ ID N° 47.
Des homologies ont été observées entre la séquence SEQ ID
N° 47 et des séquences référencées dans la base de données GenBank
(Version 116). Ces homologies sont les suivantes
~ 99 % d'homologie sur 2423 pdb (positions [1030-3451]) matchant
avec les positions [1-2419 ] de la sequence
gi~5102585~emb~AL079279.1 ~HST000009[5102585] Homo sapiens
mRNA full length insert cDNA clone EUROIMAGE 248114 . Length =
~0 2450 ; /chromosome="9" /map="D9S176-D9S279" ; deposee le 14-
JUN-1999 ; Unpublished.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
77
~ 98% sur 1623 pdb (positions [1946-3559] ) matchant avec les
positions [16-1638] de la sequence
g3012351 (176197 ) Sequence 1 from patent US 5691147.Length~ _
1638 pdb ; deposee le 03-APR-1998 ; AUTHORS : Draetta,G. and
s Gyuris,J. TITLE : CDK4 binding assay JOURNAL : Patent: US
5691147-A 1 25-NOV-1997;
~ Differents fragments d'homologie de 99% a 100% sur 2372 pdb
~o (positions [1-2372]) et de 97% a 100% sur 1160 pdb (positions [2547-
3706]) avec la sequence
gi~7228016~emb~AL158158.3~AL158158[7228016] ; Homo sapiens
chromosome 9 clone RP11-427L11 map q31.2-32, ***
SEQUENCING IN PROGRESS ***, 37 unordered pieces ; deposee le
~ s 08-MAR-2000 ;
Les analyses d'expression du transcrit des séquences SEQ ID
N°42 à 47 ont été réalisées par RT PCR, comme décrit dans
l'Exemple
20 1. Ces analyses effectuées à partir d'ARN polyA+de différents
tissus ont permis de montrer que le gène GSS96663 était exprimé dans
le cerveau foetal, le foie, le cerveau, le cceur, la prostate, le placenta, le
foie fcetal, l'utérus, le testicule, le rein et le muscle squelettique.
25 Ce gène constitue un candidat positionnel causal d'une maladie
due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
78
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 47
Le cadre ouvert de lecture partiel de la séquence d'acide
nucléique SEQ ID N° 47 code potentiellement pour ûn polypeptide de
1066 acides aminés de longueur qui constitue la séquence SEQ ID N°
s 155..
Des homologies entre la séquence SEQ ID N° 155 et des
séquences répertoriées dans les bases de donneées. Ces homologies
sont les suivantes
~ 27% d'homologie sur 1068 AA avec des sequences de
~o type " complement receptor " CR1 (g30186 ; 8809019 ;
8451303 ;8306680 ) et CR2
(818192 ;8181940 ;8599776)
~ Homologie de 24% sur environ 1000 AA avec des
is sequences "complement facteur H " ; sequences
gi~31965~emb~CAA68704.1 ~[31965] (Y00716) factor H
[Homo sapiens], PIR :NBHUH et PIR :NBMSH ;
EM:Q14006 et EM :Q61408.
20 ~ Homologie de 25% sur 900 AA avec les sequences de
P-selectin et E-selectin : sequences
sp~p16581 (lem2 human e-selectin precursor (endothelial
leukocyte adhesion molecule 1) (elam-1) (leukocyte-
endothelial cell adhesion molecule 2) (lecam2) (cd62e)
2s et sp~p16109~1em3 human p-selectin precursor (granule
membrane protein 140) (gmp-140) (padgem) (cd62p)
(leukocyte-endothelial cell adhesion molecule 3)
(lecam3) et avec pir non-redondante: pir~s~a30359 p-
selectin precursor - human..
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
79
~ 24% d' homologie sur 637 AA avec la sequence
g183391 (M25322) granule membrane protein-140
(GMP-140) precursor [domo sapiens] , Length = 830
s
~ Homologie avec la " cell adhesion molecule " trEMBL:
sp~Q28290~Q28290 CELL ADHESION MOLECULE
PRECURSOR (FRAGMENT).
io ~ Differents fragments d'homologie de 25% a 29% sur la
sequence " apolipoprotein H precursor -
human PIR:NBHU Length - 345; apolipoprotein H
precursor - human. avec uné homologie de 29% sur
256 AA.
~s
~ Homologie avec des sequences " membrane
cofacteur protein cofacteur " (PIR :S01896,
PIR :154479, PIR :A57278 et EM :P79138,
EM :Q9ZOM4, EM :019121 ) et EM :062837
2o membrane cofacteur proteine CD46.
~ Differents fragments (de 400 a 500 AA) d'homologie de
25% a 27% avec la sequence PIR:T16833 hypothetical
2s protein T07H6.5 - Caenorhabditis elegans retrouvee
dans genpept (g1255889(U53344).
~o Fonction putative


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
Le produit du gène GS96663, de par son homologie en acides aminés
avec les précurseurs de la P-sélective et de la E-sélective humaines,
s'apparente à cette classe de protéines membranaires. Son rôle dans
l'efflux du cholestérol intracellulaire, médié par des protéines
s membranaires n'est pas exclu d'autant que le gène est localisé dans
l'interval génétique défini par clonage positionnel.
Le polypeptide de séquence SEQ ID N° 155 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
to familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Gène GS941675.
Acides) nucléigue(s)
~ s II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS941675. Deux séquences
nucléiques sont représentatives de ce transcrit:
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°48.
zo La séquence SEQ ID N°48 a une longueur de 373 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°49.
La séquence SEQ ID N°49 a une longueur de 459 nucléotides.
?s
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
La troisième séquence nucléique de l'ADNc correspondant à ce
~o transcrit constitue la séquence SEQ ID N° 50.
La séquence SEQ ID N° 50 a une longueur de 2575 nucléotides


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
81
Dés homologies entre la séquence SEQ ID N° 50 et des
séquences référencées dans la base de données GenBank (Version
116) ont été observées. Ces homologies sont les suivantes
s - 98% d'identité sur 720 pb avec un BAC END 86348761 AQ892571
HS 3143 A1 G01 T7C CIT Approved Human Genomic Sperm Library
lenght 848pb
Ce gène constitue un candidat positionne) causal d'une maladie
to due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
~s Gène GS929341.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS929341. Deux séquences
nucléiques représentatives de ce transcrit ont été déterminées.
2o La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°51.
La séquence SEQ ID N°51 a une longueur de 231 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
2s transcrit constitue la séquence SEQ ID N°52.
La séquence SEQ ID N°52 a une longueur de 344 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF) partiel allant
du nucléotide en position 3 au nucléotide en position 131 de la séquence
SEQ ID N°52.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
82
Aucune identité avec les séquences SEQ ID N° 51 et 52 n'a été
retrouvée lors d'une recherche dans la base de données GenBank
(Version 110).
s La troisième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 53.
La séquence SEQ ID N° 53 a une longueur de 402 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF) partiel allant
du nucléotide en position 1 au nucléotide en position 188 de la séquence
to SEQ ID N° 53.
Aucune identité avec les séquences SEQ ID N° 51 à 53 n'a été
retrouvée lors d'une recherche dans la base de données GenBank
(Version 116).
ts Les analyses d'expression du transcrit des séquences SEQ ID
N°51 et 52 ont été réalisées par RT PCR, comme décrit dans
l'Exemple
1. Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS929341 était exprimé dans le cerveau
foetal, le foie, le cerveau, le coeur, la prostate, le placenta, le foie
foetal,
20 l'utérus, le testicule, le rein, le muscle squelettique et le poumon.
Ce gène constitue un candidat positionnel causal d'une maladie
due à un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
zs familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Polypeptide codé par l'acide nucléique de séquence SEQ ID NO 52
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
~o ID N°52 code potentiellement pour un polypeptide de 43 aminoacides
de
longueur constituant la séquence SEQ ID N°156.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
83
Aucune homologie significative avec BLAST n'a été retrouvée
avec les séquences référencées dans les bases de données Swissprot
(version 36, dernière remise à jour du 3 mai 1999) et PRODOM:
(dômaines homologues détectés dans Swissprot, version 34.2,
s novembre 1997).
Polypeptide codé par l'acide nucléique de séquence SEQ ID N° 53
Le cadre ouvert de lecture de la séquence d'acide nucléique SEQ
ID N° 53 code potentiellement pour un polypeptide de 61 acides
aminés
~o de longueur constituant la séquence SEQ ID N° 157.
Aucune homologie significative avec BLAST n'a été retrouvée
avec les séquences référencées dans les bases de données Swissprot
(version 38), PIR (Version 62, Septembre 1999), trEMBL (Version de
Aoüt 1999) et Gen Pept (Version 115).
~s Les polypeptides de séquences SEQ ID N°156 et 157 sont
susceptibles d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Gène GS915742.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
2s un transcrit du gène désigné ici sous le n° GS915742. Trois
séquences
nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°54.
La séquence SEQ ID N°54 a une longuéur de 228 nucléotides.
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
sa
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°55.
La séquence SEQ ID N°55 a une longueur de 270 nucléotides. .
s La troisième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 56.
La séquence SEQ ID N° 56 a une longueur de 1130 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Versions 110 et 116).
io
Les analyses d'expression du transcrit des séquences SEQ ID
N°54 et 55 ont été réalisées par RT PCR, comme décrit dans
l'Exemple
1. Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS915742 était exprimé dans le cerveau
is foetal, le foie, le placenta et le rein.
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
2o particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
zs Gène GS913018.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS913018. Deux séquences
représentatives de ce transcrit sont représentées ci-après.
~o La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°57.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
La séquence SEQ ID N°57 a une longueur de 463 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°58.
s La séquence SEQ ID N°58 a une longueur de 289 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 57
et 58 n'a été retrouvée lors d'une recherche dans la base de données
GenBank (Version 110).
A partir de la séquence SEQ ID N° 57, on a synthétisé deux
amorces nucléotidiques, respectivement les. amorces de séquences
SEQIDN°111et112.
A partir de la séquence SEQ ID N° 58, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
SEQIDN°113et114.
~5 .Les amorces de séquences SEQ ID N° 111 à 114 ont permis
d'amplifier un ADNc, à partir d'une banque d'ARNm polyA+ de
différentes tissus humains commercialisée par fa Société Clontech une
troisième séquence nucléique de l'ADNc correspondant au transcrit du
gène GS913018.
La troisième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 59.
La séquence SEQ ID N° 59 a une longueur de 1542 nucléotides.
Des homologies ont été retrouvées sur la séquence SEQ ID N°
2s 59, en particulier différents fragments d'identité sur les positions [735-
1268] [1-357] [559-710] et [373-501] de la séquence SEQ ID N° 59 avec
la sequence g6563616 (AC013740)Homo sapiens clone RP11-115J22,
WORKING DRAFT SEQUENCE, 15 unordered pieces:Length =180711,
reépertoriées dans GenBank (Version 116).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
86
Les analyses d'expression du transcrit des séquences SEQ ID
N°57 et 58 ont été réalisées par RT PCR, comme décrit dans
l'Exemple
1. Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS913018 était exprimé dans le cerveau
s foetal, le foie, le cerveau, le coeur, la prostate, le placenta, le foie
foetal,
l'utérus, le testicule et le rein.
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
io particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
~s Gène GS911742.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS911742. Trois séquence
représentatives de ce transcrit ont été déterminées.
2o La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°60.
La séquence SEQ ID N°60 a une longueur de 1417 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
2s transcrit constitue la séquence SEQ ID N°61.
La séquence SEQ ID N°61 a une longueur de 696 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 60
et 61 n'a été retrouvée lors d'une recherche dans la base de données
3o GenBank (Version 110).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
87
La troisième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N° 62.
La séquence SEQ ID N° 62 a une longueur de 2702 nucléotides.
Cette séquence comprend un cadre ouvert de lecture (ORF) partiel allant
du nucléotide en position 1 au nucléotide en position 792 de la séquence
SEQ ID N° 62. La séquence codante potentielle débute au nucléotide
en
position 49 et se termine au nucléotide en position 792 de la séquence
SEQ ID N° 62. Le codon d'initiation de la traduction débute au
nucléotide
en position 49 de la séquence SEQ ID N° 62. Cette séquence comprend
1o un motif de Kozak de séuqence " GC CGC GCC ATG C " qui débute au
nucléotide en position 41 de la séquence SEQ ID N° 62.
Des homologies avec la séquence SEQ ID N° 62 ont été
observées avec des séquences répertoriées dans la base de données
GenBank (Version 116). Ces homologies sont les suivantes
IS
~ 98 % d'homologie sur 1410 pdb (positions [4-1413]) avec la
sequence gi~5912095~emb~
AL117557.1 ~HSM801083[5912095] Homo sapiens mRNA; cDNA
DKFZp564D177 (from clone DKFZp564D177); partial cds. Length =
20 1431; deposee le 18-FEB-2000 ; Submitted (15-SEP-1999) MIPS,
Am Klopferspitz 18a, D-82152 Martinsried, GERMANY, Bloecker,H.,
Boecher,M., Brandt,P., Wiemann,S.
2s ~ 97 % d'homologie sur 10139 pdb [1-1039] et 97% sur 380 pdb [1082-
1458] et 90% sur 51 pdb [1506-1556] avec la sequence
gi~6841247~gb~AF161417.1 ~AF161417[6841247] Homo sapiens
HSPC299 mRNA, partial cds. Length = 1659; deposee le 01-FEB-
2000 ; Direct Submission ; Submitted (14-MAY-1999) Shanghai
~o Institute of Hematology, Shanghai Second Medical University, Rui-Jin
Hospital, 197 Rui-Jin Road II,


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
88
~ 98 % d'homologie sur 1410 pdb [4-1413] avec la sequence 85912095
(AL117557) Homo sapiens mRNA; cDNA DKFZp564D177 (from
clone DKFZp564D177); partial cds. Length = 1431; deposee le 18-
FEB-2000 ; Direct Submission ; Submitted (15-SEP-1999) MIPS, Am
s Klopferspitz 18a, D-82152 ; Martinsried, GERMANY, Bloecker,H.,
Boecher,M., Brandt,P., Mewes,H.W., Gassenhuber,J. and
Wiemann,S.
~ 93% sur 911 pdb (positions [1-911] ) et 93% sur 179 pdb( positions
~o [1395-1573]) et 81% sur 131 pdb (positions [992-1122] )avec la
sequence gi~7023832~dbj~AK002137.1 ~AK002137[7023832] Homo
sapiens cDNA FLJ11275 fis, clone PLACE1009375. Length = 1564;
deposee le 22-FEB-2000 ; NEDO human cDNA sequencing project ;
Unpublished
~s
~ Differents fragments d'homologie( de 90% a 100%) avec la
sequence 85932616 (AC009594) Homo sapiens chromosome 4
clone 363 G 01 map 4, *** SEQUENCING IN PROGRESS ***, 9
unordered pieces. Length = 150108;
Les analyses d'expression du transcrit des séquences SEQ ID
N°60 et 61 ont été réalisées par RT PCR, comme décrit dans
l'Exemple
1. Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS911742 était exprimé dans le cerveau
2s foetal, le foie, le coeur et le placenta.
De plus, une analyse de l'expression du transcrit par Northern
blot, , selon le protocole décrit de l'Exemple 1, à l'aide de la sonde de
séquence SEQ ID NO 101, a révélé la présence de transcrits dans le
~o blot commercialisé par la Société Clontech (Ref. N° 7759-1).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
89
La taille des transcrits détectés avec la sonde de séquence SEQ
ID N°101 est de 1,9 kb dans le pancréas, le rein, le muscle
squelettique,
le poumon et le placenta.
s Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL.
io Polypeptide codé par l'acide nucléique de séquence SEQ !D NO 62
Le cadre ouvert de lecture partiel de la séquence d'acide
nucléique SEQ ID N°62 code potentiellement pour un polypeptide de
263 aminoacides de longueur constituant la séquence SEQ ID N°158.
Homologies observées au niveau de la séquence protéique
is traduite en six phases
~ 99% d'homologie sur 262 AA (position [4-789]) avec la sequence
85912096 (AL117557) hypothetical protein [Homo sapiens] Length =
263 ; note= "similarity to NIPSNAP1" ; deposee le 18-FEB-2000 ;
Direct Submission ; Submitted (15-SEP-1999) MIPS, Am Klopferspitz
20 18a, D-82152 , Martinsried, GERMANY, Bloecker,H., Boecher,M.,
Brandt,P:, Mewes,H.W., Gassenhuber,J. and Wiemann,S,
~ Homologies avec des sequences NISNAP2 et NISNAP2
27 % d'homologie sur 179 AA avec la sequence 82769254
zs (AJ001259) NIPSNAP2 protein [Homo sapiens] Length = 285 et 24%
d'homologie sur 211 AA avec la sequence 82769649 (AJ001258)
NIPSNAP1 protein [Homo sapiens] Length = 284
~ 27 % d'homologie sur 179 AA avec la sequence 83403167
~o (AF029786) GBAS [Homo sapiens]


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
Length = 286 . GBAS : guanine nucletide-binding protein, alpha-
subunit (adenylate cyclase-stimulating G alpha protein).
Cette proteine est decrite avec un site de phosphorylation et une
-region transmembranaire.
s Les " guanine nucletide-binding proteins " ont un rote de modulateurs
ou transducteurs dans differents sytemes de signalisation
transmembranaires.
21% d'identité avec la protéine YMQ1 ÇAEEL (Base de données
~o Prodom, VERSION ?) qui a une simiralité avec la protéien SNAP25 et
la 4-nitrophenylphosphatase.
Le polypeptide de séquence SEQ ID N° 158 comprend
des sites de glycosylation, des sites de phosphorylation tels que des
is sites de phosphorylation cAMP- et cGMP-dépendants de protéine kinase
et de caséine kinese de type II.
2o Fonction putative
Le polypeptide de séquence SEQ ID N°158 s'apparente donc par son
motif retrouvé dans le domaine PD013981 de PRODOM: (domaines
homologues détectés dans Swissprot, version 34.2, novembre 1997) à
une protéine putativement impliquée dans le transport vésiculaire
2s intracellulaire. Ce mécanisme sous-tendu par un adressage spécifique
médié par ces protéines est d'intérët par rapport à la maladie de
TangierJFHD qui est décrite par un défaut du mécanisme de transport et
de translocation des pools de cholestérol intracellulaire vers les
particules HDL acceptrices. Le polypeptide de séquence SEQ ID N°158


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/0142G
91
est donc susceptible d'intervenir dans une étape importante impliquée
dans le transport inverse du cholestérol par les HDL.
Le polypeptide de séquence SEQ ID N° 158 est susceptible
s d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
to Gène GS98601.
Acides) nucléiques)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS98601. Trois séquences
nucléiques représentatives de ce transcrit ont été déterminées.
ts La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°63.
La séquence SEQ ID N°63 a une longueur de 335 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
recherche dans la base de données GenBank (Version 110).
zo
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°64.
La séquence SEQ ID N°64 a une longueur de 447 nucléotides.
Aucune identité de séquence n'a été retrouvée lors d'une
2s recherche dans la base de données GenBank (Version 110).
La troisième séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°65.
La séquence SEQ ID N°65 a une longueur de 2324 nucléotides.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
92
Cette séquence comprend un cadre ouvert de lecture (ORF)
partiel allant du nucléotide en position 3 au nucléotide en position 611 de
la séquence SEQ ID N°65.
Homologies observées au niveau de la séquence nucléotidique
s (307)
~ 99% d'homologie sur 514 pb (position 1508-2021 pb)
avec des séquences de GenBank: gi~3483520~
correspondant au clone ZB95F02 d'ADNc (Homo
io sapiens) dont la séquence est complète.
~ 98% d'homologie sur 170 pb (position 862-1031 pb)
avec des séquences de GenBank: gi~1184671~ ( région
3'UTR partielle de l'ARN m, codant pour la protéine
~s inductible du virus de la maladie de newcastle)
Les analyses d'expression du transcrit de séquence SEQ ID N°45
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
2o de montrer que le gène GS98601 était exprimé dans le cerveau, le
placenta et l'utérus.
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnément du flux inverse du cholestérol, et plus
2~ particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
93
Polypepride codé par l'acide nucléique de séquence SEQ ID IVO 65
Le cadre ouvert de lecture de la troisième séquence d'acides
nucléiques SEQ ID N°65 code potentiellement pour un polypeptide de
203 aminoacides de longueur constituant la séquence SEQ ID N°159.
s Homologies observées au niveau de la séquence protéique (307):
34% d'homologie sur 180 aa (position 3-182 aa) avec des séquences de
Genpept:~ (traduction de Genbank v110 et 111, dernière remise à jour le
7 mai 1999): gi~3878571~gnI~PID~e1348103 (Z46381)- faible similarité
avec la .protéine de levure Ysy6 - (PIR: (SEQUENCES PIR NON
~o REDONDANTES, VERSION 57) numéro d'accès JQ0912);EST d'ADNc
EMBL:D32318 provient de ce gène ; EST d'ADNc EMBL:D33688
provient de ce gène EST d'ADNc EMBL:D34664 provient de ce gène ;
EST d'ADNc EMBL:D36574 provient de ce gène et des séquences de
SP-TrEMBL (SP-TrEMBL, version 7, novembre 1998): sp~Q21453~
~s correspondant à la protéine M01 F1.4 de C elegans
Le polypeptide de séquence SEQ ID N° 159 est susceptible
d'intervenir dans la régulation du flux du cholestérol, et plus
particulièrement de la maladie de Tangier, dans des déficiences
zo familiales en HDL, ou encore dans une maladie génétiquement liée au
locus 9q31-34 du chromosome 9.
Fonction putative
Ce gène est un candidat par sa localisation chromosomique pour les
2s pathologies Tangier/FHD.
Gène GS94852.
Acides) nucléiques)


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
94
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS94852. Trois séquences
nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
s transcrit constitue la séquence SEQ ID N°66. .
La séquence SEQ ID N°66 a une longueur de 447 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°67.
~o La séquence SEQ ID N°67 a une longueur de 564 nucléotides.
A partir de la séquence SEQ ID N° 66, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
SEQ ID N° 115 et 116.
is A partir de la séquence SEQ ID N° 67, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
SEQ ID N° 117 et 118
.Les amorces de séquences SEQ ID. N° 115 à 118 ont permis
d'amplifier un ADNc, à partir d'une banque d'ARNm polyA+ de différents
2o tissus humains commercialisée par la Société Clontech une troisième
séquence nucléique de l'ADNc correspondant au transcrit du gène
GS94852.
La troisième séquence nucléique correspondant au transcrit du
gène GS94852 constitue la séquence SEQ ID N° 68.
2s La séquence SEQ ID N° 68 a une longueur de 604 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 66 à
68 n'a été retrouvée lors d'une recherche dans .la base de données
GenBank (Versions 110 et 116).
'JO


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
Les analyses d'expression du transcrit de séquence SEQ ID N°67
ont été réalisées par RT PCR, comme décrit dans l'Exemple 1. Ces
analyses effectuées à partir d'ARN polyA+de différents tissus ont permis
de-montrer que le gène GS94852 était exprimé dans le foie et le coeur.
s
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
io 9q31-34 du chromosome 9.
Gène S935135.
Acides) nucléigue(s)
II a été isolé selon l'invention un ARN messager correspondant à
ts un transcrit du gène désigné ici sous le n° GS935135. Trois
séquences
nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°69.
La séquence SEQ ID N°69 a une longueur de 482 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°70. '
La séquence SEQ ID N°70 a une longueur de 402 nucléotides.
Aucune identité de séquence n'a été retrouvée avec les
2s séquences SEQ ID N° 69 et 70 lors d'une recherche dans la base de
données GenBank (Version 110).
On a synthétisé une première amorce nucléotidique de séquence
SEQ ID N° 119 à partir de la séquence SEQ ID N°69 et une
seconde
~o amorce nucléotidique de séquence SEQ ID N 120 à partir de la


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
96
séquence SEQ ID N° 70. Ces amorces ont permis d'amplifier une
troisième séquence nucléique représentatve du transcrit du gène
GS935135 constituant la séquence SEQ ID N° 71.
La séquence nucléiqque SEQ ID N° 71 a une longueur de 758
s nucléotides.
Des homologies ont été retrouvées avec des séquences
répertoriées dans la base de données GenBank (Version 116). Ces
homologies sont les suivantes
~ 80 a 85% d'homologie sur 3 fragments ( 156+197+93 pdb) avec la
sequence 82168141
(gi~2168141 ~emb~Z93019.1 ~HS49C23[2168141) Human DNA
sequence from PAC 49C23 on chromosome X contains malate
dehydrogenase pseudogene and STS. Length = 153078
is
~ 81 % a 90% d'homologie sur 4 fragments ( 144+gg+197+137 pdb)
avec la sequence 82828782
(gi~2828782~gb~AC002319.1 ~AC002319[2828782)) Homo sapiens
zo chromosome 9q34, clone 70C11, complete sequence. Length =
46305
2s Les analyses d'expression du transcrit de séquence SEQ ID N°69
ou 70 ont été réalisées par RT PCR, comme décrit dans l'Exemple 1.
Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS935135 était exprimé dans le cerveau
foetal, le foie, le cerveau, la prostate, le placenta, le foie foetal,
l'utérus, le
~o testicule et le rein.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
97
Ce gène constitue un candidat positionnel causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiençes
familiales en HDL, ou encore à une maladie génétiquement liée au locus
s 9q31-34 du chromosome 9.
Gène GS914669.
Acides) nucléiques)
io II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS914669. Trois séquences
nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
~s transcrit constitue la séquence SEQ ID N°72.
La séquence SEQ ID N°72 a une longueur de 673 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°73.
zo La séquence SEQ ID N°73 a une longueur de 554 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 72
et 73 n'a été retrouvée lors d'une recherche dans la base de données
GenBank (Version 110).
zs A partir de la séquence SEQ ID N° 72, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
SEQ ID N° 121 et 122.
A partir de la séquence SEQ ID N° 73, on a synthétisé deux
amorces nucléotidiques, respectivement les amorces de séquences
~o SEQ ID N° 123 et 124.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
98
.Les amorces de séquences SEQ ID N° 121 à 124 ont permis d'amplifier
un ADNc, à partir d'une banque d'ARNm polyA+ de différents tissus
humains commercialisée par la Société Clontech une troisième
séquence nucléique de l'ADNc correspondant au transcrit du gène
s GS914669. Cette séquence constitue la séquence SEQ ID N° 74. La
séquence SEQ ID N° 74 a une longueur de 1794 nucléotides. Elle
comprend un cadre ouvert de lecture allant du nucléotide en position 1
au nucléotide en position 258 de la séquence SEQ ID N° 74 ainsi qu'une
séquence codante localisée identiquement. Cette séquence comprend
io un site de polyadénylation débutant au nucléotide en position 1751 de la
SEQ ID N° 74.
Des homologies avec la séquence SEQ ID N° 74 ont été
retrouvées dans les séquences répertoriées dans la base de données
GenBank (Version 116). Ces homologies sont les suivantes
is 99% d'identité sur 1000pb (792 a 1793pb) g6807977 AL137422 Homo
sapiens mRNA; cDNA DKFZp761A1623 (from clone DKFZp761A1623);
partial cds Length = 1000
Identité avec un BAC en cours de séquençage AL137023 g6982086
2o Homo sapiens chromosome 9 clone RP11-403A22 map q34.13-34.3, ***
SEQUENCING IN PROGRESS ***, 19 unordered pieces. Length =
184814
Les analyses d'expression du transcrit de séquence SEQ ID N°72
2s ou 73 ont été réalisées par RT PCR, comme décrit dans l'Exemple 1.
Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS914669 était exprimé dans le cerveau
foetal et le coeur.
3o Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
99
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Polypeptide codé pâr l'acide nucléique de séquence SEQ ID N° 74
s Le cadre de lecture ouvert de la séquence d'acide nucléique SEQ
ID N° 74 code potentiellement pour le polypeptide de séquence SEQ
ID
N° 160 d'une longueur de 85 acides aminés.
Aucune homologie de séquence n'a été observée avec les
séquences répertoriées dans les bases de données Genpept (Version
io 115), Svrvissprot (Version 38), trEMBL (Version de Août 1999) et PIR
(Version 62 de Septembre 1999).
Gène GS913839.
Acides) nucléiques)
~s II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS913839. Trois séquences
nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
Zo transcrit constitue la séquence SEQ ID N°75.
La séquence SEQ ID N°75 a une longueur de 507 nucléotides.
La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°76.
2s La séquence SEQ ID N°76 a une longueur de 415 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 75
et 76 n'a été retrouvée lors d'une recherche dans la base de données
GenBank (Version 110).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
100
A partir de la séquence SEQ ID N° 75, on a synthétisé une
amorce nucléotidique de séquence SEQ ID N° 125.
A partir de la séquence SEQ ID N° .76, on a synthétisé une
amorce nucléotidique de séquence SEQ ID N° 1126
s .Les amorces de séquences SEQ ID N° 125 et 126 ont permis
d'amplifier un ADNc, à partir d'une banque d'ARNm polyA+ de différents
tissus humains commercialisée par la Société Clontech une troisième
séquence nucléique de l'ADNc correspondant au transcrit du gène
GS94852. Cette séquence constitue la séquence SEQ ID N° 77.
La séquence SEQ ID N° 77 a une longueur de 1318
nucléotides.
Des homologies de la séquence SEQ ID N° 77 ont été
observées avec des séquences répertoriées dans la base de données
GenBank (Version 116). Ces homologies sont les suivantes
~s
~ 99% d'homologie sur 1320 pdb (positions [1-1318)) avec la sequence
86006243 (AC011096) Homo sapiens clone 2_D_21, ***
SEQUENCING IN PROGRESS ***, 15 unordered pieces.Length =
135130;
~ 99% d'homologie sur 1320 pdb (positions [1-1318]) avec la sequence
87263520 (AL161631) Homo sapiens chromosome 9 clone RP11
70K10, *** SEQUENCING IN PROGRESS ***, 45 unordered pieces.
zs Length = 100562;
Les analyses d'expression du transcrit de séquence SEQ ID N°75
ou 76 ont été réalisées par RT PCR, comme décrit dans l'Exemple 1.
~o Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
101
permis de montrer que le gène GS913839 était exprimé dans le cerveau
foetal et le foie.
Ce gène constitue un candidat positionnel causal d'une maladie
s due à un dysfonctionnement du flux inverse du cholestérol; et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
~o
Gène GS912639.
Acides) nucléigue(s)
II a été isolé selon l'invention un ARN messager correspondant à
un transcrit du gène désigné ici sous le n° GS912639. Trois séquences
~s nucléiques représentatives de ce transcrit ont été déterminées.
La première séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°78.
La séquence SEQ ID N°78 a une longueur de 530 nucléotides.
zo La seconde séquence nucléique de l'ADNc correspondant à ce
transcrit constitue la séquence SEQ ID N°79.
La séquence SEQ ID N°79 a une longueur de 495 nucléotides.
Aucune identité de séquence avec les séquences SEQ ID N° 78
et 79 n'a été retrouvée lors d'une recherche dans la base de données
2s GenBank (Version 110).
A partir de la séquence SEQ ID N° 78, on a synthétisé une
amorce nucléotidique de séquence SEQ ID N° 127.
A partir de la séquence SEQ ID N° 79, on a synthétisé une
amorce nucléotidique de séquence SEQ ID N° 128


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
102
.Les amorces de séquences SEQ ID N° 127 et 128 ont permis
d'amplifier un ADNc, à partir d'une banque d'ARNm polyA+ de différents
tissus humains commercialisée par la Société Clontech une troisième
séquence nucléique de l'ADNc correspondant au transcrit du gène
s GS912639. Cette séquence constitue la séquence SEQ ID N° 80.
La séquence SEQ ID N° 80 a une longueur de 594 nucléotides.
1o
20
Des homologies de séquence de la sEQ ID N° 80 ont été
retrouvées avec des séquences référencées dans la base de données
GenBank (Version 116). Ces homologies sont les suivantes
~ 99% d'homologie sur 522 pdb (positions [204-725]) avec la
sequence g2603415 (gi~2603415~gb~
851178.1 ~B51178[2603415]) CIT978SK-95K15.TV CIT978SK Homo
sapiens genomic clone 95K15, genomic survey sequence.Length = 524;
~ 99% d'homologie sur 501 pdb(positions [204-704] ) avec la
sequence g2866378 (gi~2866378~gb~B79355.1
~B79355[2866378]) CIT978SK-95K15.TV.1 CIT978SK Homo sapiens
genomic clone 95K15, genomic survey sequence.Length = 529;
~ 94% d'homologie sur 309 pdb (positions [205-513] ) avec la
sequence g2602442 (i~2602442~gb~B50205.1 ~
B50205[2602442] ) CIT978SK-96F5.TV CIT978SK Homo sapiens
genomic clone 96F5,genomic survey sequence.Length = 309;
Les analyses d'expression du transcrit de séquence SEQ ID N°78
ou 79 ont été réalisées par RT PCR, comme décrit dans l'Exemple 1.
Ces analyses effectuées à partir d'ARN polyA+de différents tissus ont
permis de montrer que le gène GS912639 était exprimé dans le foie.
~o


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
103
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
s 9q31-34 du chromosome 9.
Gène GS933630.
Acides) nucléique(s)
II a été isolé selon l'invention un ARN messager correspondant à
~o un transcrit du gène désigné ici sous le n° GS933630. Une séquence
nucléique représentative de ce transcrit a été déterminée.
Cette séquence nucléique de l'ADNc correspondant à ce transcrit
constitue la séquence SEQ ID N°81.
La séquence SEQ ID N° 81 a une longueur de 582 nucléotides.
is Aucune homologie n'a été observée avec les séquences
référencées dans la base de données GenBank (Version 116).
Ce gène constitue un candidat positionne) causal d'une maladie due à
un dysfonctionnement du flux inverse du cholestérol, et plus
zo particulièrement de la maladie de Tangier ou encore des déficiences
familiales en HDL, ou encore à une maladie génétiquement liée au locus
9q31-34 du chromosome 9.
Caractéristiques de l'invention
2s
L'invention concerne ainsi un acide nucléique codant pour une
protéine ayant une séquence en acides aminés choisie dans le groupe
des séquences d'aminoacides SEQ ID N°129 à SEQ ID N°160 ou un
fragment peptidique ou un variant de cette dernière ou un acide
~o nucléique de séquence complémentaire.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
loa
De manière générale, les acides nucléiques selon l'invention se
présentent sous une forme isolée ou purifiée.
L'invention concerne également un acide nucléique comprenânt
au moins huit nucléotides consécutifs d'un polynucléotide choisi dans le
groupe constitué des séquences nucléotidiques SEQ ID N°1 à SEQ ID
N°81 et SEQ ID N°82 à SEQ ID N°101, ou un acide
nucléique de
séquence complémentaire.
L'invention est aussi relative à un acide nucléique comprenant au
~o moins 20, 30, 40, 50, 100 ou 150 nucléotides consécutifs d'un
polynucléotide choisi dans le groupe constitué des séquences
nucléotidiques SEQ ID N°1 à SEQ ID N°81 et SEQ ID N°82 à
SEQ ID
N°101, ou un acide nucléique de séquence complémentaire.
Selon un autre aspect, l'invention concerne aussi un acide
is nucléique ayant au moins 90% d'identité en nucléotides avec un acide
nucléique choisi dans le groupe constitué des séquences nucléotidiques
SEQ ID N°1 à SEQ ID N°81 et SEQ ID N°82 à SEQ ID
N°101,
avantageusement 80%, de préférence 95, 99%, 99,5%, et de manière
tout à fait préférée 99,8% d'identité en nucléotides avec un acide
2o nucléique choisi dans le groupe constitué des séquences nucléotidiques
SEQ ID N°1 à SEQ ID N°81 et SEQ ID N°82 à SEQ ID
N°101, ou un
acide nucléique de séquence complémentaire.
Selon encore un autre aspect, l'invention est relative à un acide
nucléique hybridant, dans des conditions d'hybridation de forte
2s stringence, avec un acide nucléique tel que défini ci-avant, et plus
particulièrement un acide nucléique choisi dans le groupe constitué des
séquences nucléotidiques SEQ ID N°1 à SEQ ID N°81 et SEQ ID
N°82 à
SEQ ID N°101, ou un acide nucléique de séquence complémentaire.
~o Comme cela a été décrit en détails plus haut, chacune des
séquences nucléotidiques SEQ ID N°1 à SEQ ID N°81 constitue des
ADNc dont la séquence nucléotidique est retrouvée dans les transcrits
de gènes potentiellement impliqués dans des affections liées à un
dysfonctionnement du métabolisme des lipoprotéines, en particulier le
~s transport inverse du cholestérol.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
105
Pour certains de ces acides nucléiques, une phase de lecture
ouverte a été déterminée, qui code pour un polypeptide dont une
altération dans la séquence d'acides aminés ou dans l'expression est
potentiellement associée à l'une de ces affections, ce qui indique que les
s séquences nucléotidiques comprenant les phases de lecture ouvertes
constituent des acides nucléiques d'intérêt potentiellement
thérapeutique.
En conséquence, l'invention a en outre pour objet un acide
nucléique ayant au moins 80% d'identité en nucléotides avec un
~o polynucléotide comprenant, ou alternativement constitué de, un cadre de
lecture ouvert complet ou partiel, tel que défini ci-avant dans la présente
description.
Les acides nucléiques ci-dessus qui comprennent, totalement ou
partiellement, la région codante des produits de transcription de
is séquences SEQ ID N°1 à SEQ ID N°81 peuvent être exprimés dans
une
cellule hôte désirée, lorsque ces acides nucléiques sont placés sous le
contrôle de signaux d'expression convenables.
De tels signaux d'expression peuvent être indifféremment les
signaux d'expression contenus dans les régions régulatrices de chacun
2o des gènes correspondants ou au contraire constitués des séquences
nucléiques régulatrices exogènes.
Un tel acide nucléique placé sous le _ contrôle d'une séquence
régulatrice fonctionnelle dans la cellule hôte désirée peut être aussi
inséré dans un vecteur en vue de son expression.
2s
SONDES ET AMORCES NUCLEOTIDIQUES
Les fragments d'acides nucléiques dérivés de l'une quelconque
des séquences nucléotidiques SEQ ID N°1 à SEQ ID N°81 sont
utiles
~o pour la détection de la présence d'au moins une copie d'une séquence
nucléotidique choisie parmi les séquences SEQ ID N°1 à SEQ ID
N°81
ou encore d'un fragment ou d'un variant de . cette dernière dans un
échantillon.
Les sondes ou les amorces nucléotidiques selon l'invention
3s comprennent au moins huit nucléotides consécutifs d'un acide nucléique


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
106
choisi dans le groupe constitué des séquences SEQ ID N°1 à SEQ ID
N°81, ou d'un acide nucléique de séquence complémentaire.
De préférence, des sondes ou amorces nucléotidiques selon
l'inv_ention auront une longueur de 10, 12, 15, 18 ou 20 à 25, 35, 40, 50,
s 70, 80, 100, 200, 500, 1000, 1500 nucléotides consécutifs d'un acide
nucléique selon l'invention, en particulier un acide nucléique de
séquence nucléotidique choisie parmi les séquences SEQ ID N°1 à SEQ
ID N°81 ou d'un acide nucléique de séquence complémentaire.
Alternativement, une sonde ou une amorce nucléotidique selon
~o l'invention consistera et/ou comprendra les fragments d'une longueur de
12, 15, 18, 20, 25, 35, 40, 50, 100, 200, 500, 1000, 1500 nucléotides
consécutifs d'un acide nucléique selon l'invention, plus particulièrement
d'un acide nucléique choisi parmi les séquences SEQ ID N°1 à SEQ ID
N°81, ou d'un acide nucléique de séquence complémentaire.
~s La définition d'une sonde et d'une amorce nucléotidique selon
l'invention englobe donc des oligonucléotides qui hybrident, dans les
conditions d'hybridation de forte stringence définies ci-avant, avec un
acide nucléique choisi parmi les séquences SEQ ID N°1 à SEQ ID
N°81
ou avec une séquence complémentaire de ces derniers.
2o Des sondes et amorces préférées selon l'invention comprennent
tout ou partie d'un polynucléotide choisi parmi les séquences
nucléotidiques SEQ ID N°82 à 101, ou des acides nucléiques de
séquence complémentaire, ou encore parmi les séquences
nucléotidiques SEQ ID N° 102 à 128, ou des acides nucléiques de
2s séquence complémentaire.
Une amorce ou une sonde nucléotidique selon l'invention peut
être préparée par toute méthode adaptée bién connue de l'homme du
métier, y compris par clonage et action d'enzymes de restriction ou
encore par synthèse chimique directe selon des techniques telles que la
~o méthode au phosphodiester de NARANG et al. (1979) ou de BROWN et
al. (1979), la méthode aux diéthylphosphoramidites de BEAUCAGE et
al. (1980) ou encore la technique. sur support solide décrite dans le
brevet EU N°EP 0 707 592.
Chacun des acides nucléiques selon l'invention, y compris les
3s sondes et amorces oligonucléotidiques décrites ci-dessus, peuvent être


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
107
marqués, si désiré, en incorporant un marqueur détectable par des
moyens spectroscopiques, photochimiques, biochimiques,
immunochimiques ou encore chimiques.
Par exemple, de tels marqueurs peuvent consister en des
s isotopes radioactifs (32p, ssP, , sH, ssS, ), des molécules fluorescentes (5
bromodeoxyuridine, fluorescéine , acétylaminofluorène, digoxigénine) ou
encore des ligands tels que la biotine.
Le marquage des sondes est fait de préférence par incorporation
de molécules marquées au sein des polynucléotides par extension
~o d'amorces, ou bien par rajout sur les extrémités 5' ou 3'
Des exemples de marquage non radioactifs de fragments d'acides
nucléiques sont décrits notamment dans le brevet français n° FR 78 109
75 ou encore dans les articles de URDEA et al. (1988) ou SANCHEZ-
PESCADOR et al. (1988).
~s De manière avantageuse, les sondes selon l'invention peuvent
avoir des caractéristiques structurelles de .nature à permettre une
amplification du signal, telles que les sondes décrites par URDEA et al.
(1991) ou encore dans le brevet européen n° EP-0 225 807 (CHIRON).
Les sondes oligonucléotides selon l'invention peuvent étre
2o utilisées notamment dans des hybridations de type Southern à l'ADN
génomique ou encore dans des hybridations à l'ARN messager
correspondant lorsque l'expression du transcrit correspondant est
recherchée dans un échantillon.
Les sondes selon l'invention peuvent aussi être utilisées pour la
2s détection de produits d'amplification PCR ou encore pour la détection de
mésappariements.
Des sondes ou amorces nucléotidiques selon l'invention peuvent
être immobilisées sur un support solide. De tels supports solides sont
bien connus de l'homme du métier et comprennent des surfaces des
3o puits de plaques de miçrotitration, des lits de polystyrène, des lits
magnétiques, des bandes de nitrocellulose, ou encore des
microparticules telles que des particules de latex.
En conséquence, la présente invention concerne également un
procédé de détection de la présence d'un acide nucléique tel que décrit
ci-avant dans un échantillon, ladite méthode comprenant les étapes de


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
108
1) mettre en contact une ou plusieurs sondes nucléotidiques selon
l'invention avec l'échantillon à tester ;
2) détecter le complexe éventuellement formé entre la ou les
sondes et l'acide nucléique présent dans l'échantillon.
Selon un mode de réalisation particulier du procédé de détection
selon l'invention, la ou les sondes oligonucléotidiques sont immobilisées
sur un support.
Selon un autre aspect, les sondes oligonucléotidiques
io comprennent un marqueur détectable.
L'invention concerne en outre un nécessaire ou kit pour la
détection de la présence d'un acide nucléique selon l'invention dans un
échantillon, ledit nécessaire comprenant
a) une ou plusieurs sondes nucléotidiques telles que décrites ci-
~s dessus ;
b) le cas échéant, les réactifs nécessaires à la réaction
d'hybridation.
Selon un premier aspect, le nécessaire ou kit de détection est
zo caractérisé en ce que la ou les sondes sont immobilisées sur un support.
Selon un second aspect, le nécessaire ou kit de détection est
caractérisé en ce que les sondes oligonucléotidiques comprennent un
marqueur détectable.
Selon un mode de réalisation particulier du kit de détection décrit
2s ci-dessus, un tel kit comprendra une pluralité de sondes
oligonucléotidiques conformes à l'invention qui pourront être utilisées
pour détecter des séquences cibles d'intérêt ou alternativement détecter
des mutations dans les régions codantes ou les régions non codantes
des acides nucléiques selon l'invention, plus particulièrement des acides
~o nucléiques de séquences SEQ ID N°1 à SEQ ID N°81 ou les
acides
nucléiques de séquence complémentaire.
Des sondes préférées comprendraient tout ou partie des
polynucléotides de séquences SEQ ID N°82 à SEQ ID N°101.
Ainsi, les sondes selon l'invention immobilisées sur un support
~s peuvent étre ordonnées en matrices telles que les " puces à ADN ". De


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
109
telles matrices ordonnées ont été en particulier décrites dans le brevet
US N° 5,143,854, dans les demandes PCT N° WO 90/150 70 et
92/10092.
Des matrices supports sur lesquelles des sondes
s oligvnucléotidiques ont été immobilisées à une haute densité sont par
exemple décrites dans les brevets US N°5,412,087 et dans la demande
PCT N°WO 95/11995.
Les amorces nucléotidiques selon l'invention peuvent être
utilisées pour amplifier l'un quelconque des acides nucléiques selon
~o l'invention, et plus particulièrement tout ou partie d'un acide nucléique
de
séquences SEQ ID N°1 à SEQ ID N°81, ou encore un variant de
celui-ci.
Un autre objet de l'invention concerne un procédé pour
l'amplification d'un acide nucléique selon l'invention, et plus
particulièrement un acide nucléique de séquences SEQ ID N°1 à SEQ ID
is N°81 ou un fragment ou un variant de celui-ci contenu dans un
chantillon, ledit procédé comprenant les étapes de
a) mettre en contact l'échantillon dans lequel la présence de
l'acide nucléique cible est suspectée avec une paire d'amorces
nucléotidiques dont la position d'hybridation est localisée respectivement
2o du côté 5' et du côté 3' de la région de l'acide nucléique cible dont
l'amplification est recherchée, en présence des réactifs nécessaires à la
réaction d'amplification ; et
b) détection des acides nucléiques amplifiés.
zs Pour mettre en oeuvre le procédé d'amplification tel que défini ci-
dessus, on aura avantageusement recours à l'une quelconque des
amorces nucléotidiques décrites ci-avant.
L'invention a en outre pour objet un nécessaire ou kit pour
l'amplification d'un acide nucléique selon l'invention, et plus
~o particulièrement tout ou partie d'un acide nucléique de séquences SEQ
ID N°1 à SEQ ID N°81, ledit nécessaire ou kit comprenant
a) un couple d'amorces nucléotidiques conformes à l'invention,
dont la position d'hybridation est localisée respectivement du côté 5' et
du côté 3' de l'acide nucléique cible dont l'amplification est recherchée ;


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
110
b) le cas échéant, les réactifs nécessaires à la réaction
d'amplification.
Un tel nécessaire ou kit d'amplification comprendra
s avantageusement au moins une paire d'amorces nucléotidiques telles
que décrites ci-dessus.
Vecteurs recombinants
L'invention est également relative à un vecteur recombinanl
to comprenant un acide nucléique selon l'invention.
Avantageusement, un tel vecteur recombinant comprendra un
acide nucléique choisi parmi les acides nucléiques suivants
a) un acide nucléique codant pour une protéine ayant une
séquence en acides aminés choisie dans le groupe des séquences SEQ
~s ID N°129 à SEQ ID N°160 ou un fragment peptidique ou un
variant de
cette dernière ;
b) un acide nucléique comprenant un polynucléotide choisi dans
le groupe constitué des séquences SEQ ID N°1 à SEQ ID N°81, ou
un
fragment ou un variant de ce dernier ;
2o c) un acide nucléique ayant au moins 80% d'identité en
nucléotides avec un acide nucléique choisi dans le groupe constitué des
séquences SEQ ID N°1 à SEQ ID N°81 ou un fragment ou un variant
de
ce dernier ;
d) un acide nucléique hybridant, dans des conditions d'hybridation
25 de forte stringence, avec un acide nucléique de séquences SEQ ID N°1
à SEQ ID N°81, ou un fragment ou un variant de ce dernier.
Par " vecteur " au sens de la présente invention on entendra une
molécule d'ADN ou d'ARN circulaire ou linéaire qui est indifféremment
~o sous forme de simple brin ou double brin.
Selon un premier mode de réalisation, un vecteur recombinant
selon l'invention est utilisé afin d'amplifier l'acide nucléique qui y est
inséré après transformation ou transfection de l'hôte cellulaire désiré.
Selon un second mode de réalisation, il s'agit de vecteurs
~s d'expression comprenant, outre un acide nucléique conforme à


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
111
l'invention, des séquences régulatrices permettant d'en diriger la
transcription et/ou la traduction.
Selon un mode de réalisation avantageux, un vecteur recombinant
selon l'invention comprendra notamment les éléments suivants
s (1) des éléments de régulation de l'expression de l'acide
nucléique à insérer, tels que des promoteurs et des enhanceurs ;
(2) la séquence codante comprise dans l'acide nucléique
conforme à l'invention à insérer dans un tel vecteur, ladite séquence
codante étant placée en phase avec les signaux de régulation décrits
~o aux (1) ; et
(3) des séquences d'initiation et d'arrêt de la transcription
appropriées.
En outre, les vecteurs recombinants selon l'invention pourront
~s inclure une ou plusieurs origines de réplication chez les hôtes cellulaires
dans lesquels leur amplification ou leur expression est recherchée, des
marqueurs ou des marqueurs de sélection.
A titre d'exemples, les promoteurs bactériens pourront être les
promoteurs Lacl, LacZ, les promoteurs de l'ARN polymérase du
2o bactériophage T3 ou T7, les promoteurs PR, ou PL du phage lambda.
Les promoteurs pour cellules eucaryotes comprendront le
promoteur de la thymidine kinase du virus HSV ou encore le promoteur
de la métallothionéine-L de souris.
De manière générale, pour le choix d'un promoteur adapté,
2s l'homme du métier pourra avantageusement se référer à l'ouvrage de
SAMBROOK et al. (1989) précité ou encore aux techniques décrites par
FULLER et al. (1996).
Les vecteurs bactériens préférés selon l'invention sont par
exemple les vecteurs pBR322(ATCC37017) ou encore des vecteurs tels
3o que pAA223-3 (Pharmacia, Uppsala, Suède), et pGEM1 (Promega
Biotech, Madison, WI, ETATS-UNIS).
On peut encore citer d'autres vecteurs commercialisés tels que
' les vecteurs pQE70, pQE60, pQE9 (Qiagen), psiX174, pBluescript SA,
pNHBA, pNH16A, pNH18A, pNH46A, pWLNEO, pSV2CAT, pOG44,
~s pXTI, pSG(Stratagene).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
112
II peut s'agir également de vecteurs de type baculovirus tel que le
vecteur pVL1392/1393 (Pharmingen) utilisé pour transfecter les cellules
de la lignée Sf9 (ATCC N°CRL 1711) dérivées de Spodoptera
frugiperda.
s II peut encore s'agir de vecteurs adénoviraux tels que l'adénovirus
humain de type 2 ou 5.
Un vecteur recombinant selon l'invention peut aussi être un
vecteur rétroviral ou encore un vecteur adéno-associé (AAV). De tels
vecteurs adéno-associés sont par exemple décrits par FLOTTE et al.
io (1992), SAMULSKI et al. (1989), ou encore McLAUGHLIN BA et al.
(1996).
Cellules hôtes recombinantes
ts L'invention concerne aussi une cellule hôte recombinante
comprenant un acide nucléique conforme à l'invention, et plus
particulièrement un acide nucléique de séquences SEQ ID N°1 à SEQ ID
N°81 ou encore un acide nucléique comprenant tout ou partie de la
région codante de ces derniers.
2o Selon un autre aspect, l'invention est également relative à une
cellule hôte recombinante comprenant un vecteur recombinant tel que ci-
dessus décrit.
Les cellules hôtes préférées selon l'invention sont par exemple les
suivantes
a) cellules hôtes procaryotes: souches d'Escherichia coli (souche
DH5-a), de Bacilius subtilis, de Salmonelia typhimurium, ou encore des
souches d'espèces telles que Pseudomonas, Sfrepfomyces et
Staphylococus ;
~o
b) cellules hôtes eucaryotes: cellules HeLa (ATCC N°CCL2),
cellules Cv 1 (ATCC N°CCL70), cellules COS (ATCC N°CRL 1650),
cellules Sf-9 (ATCC N°CRL 1711), cellules CHO (ATCC N°CCL-61) ou
encore cellules 3T3 (ATCC N°CRL-6361 ).
3s


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
113
Selon un autre aspect, l'invention concerne un polypeptide
comprenant une séquence en acides aminés choisie dans le groupe
constitué des peptides de séquences SEQ ID N°129 à SEQ ID N°160,
ou un fragment peptidique ou un variant de ce dernier.
s L'invention concerne aussi un polypeptide comprenant au moins
15 acides aminés consécutifs d'une séquence en acides aminés choisie
dans le groupe constitué des peptides de séquences SEQ ID N°129 à
SEQ ID N°160, ou un fragment peptidique ou un variant de ce
dernier
L'invention est également relative à un polypeptide comprenant
~o une séquence en acides aminés ayant au moins 80% d'identité en
acides aminés avec une séquence en acides aminés choisie dans le
groupe constitué des peptides de séquences .SEQ ID N°129 à SEQ ID
N°160, ou un fragment peptidique ou un variant de ce dernier.
Avantageusement, fait partie de l'invention un polypeptide ayant
~s au moins 85%, 90%, 95% ou 99% d'identité en acides aminés avec une
séquence en acides aminés choisie dans le groupe constitué des
peptides de séquences SEQ ID N°129 à SEQ ID N°160, ou un
fragment
peptidique ou un variant de ce dernier.
2o De préférence, des polypeptides selon l'invention auront une
longueur de 15, 18 ou 20 à 25, 35, 40, 50, 70, 80, 100 ou 200 acides
aminés consécutifs d'un acide nucléique selon l'invention, en particulier
un polypeptide de séquence en acides aminés choisie parmi les
séquences SEQ ID N°129 à SEQ ID N°160 .
Alternativement, un polypeptide selon l'invention consistera et/ou
comprendra les fragments d'une longueur de 15, 18, 20, 25, 35, 40, 50,
100 ou 200 acides aminés consécutifs d'un polypeptide selon l'invention,
plus particulièrement d'un polypeptide choisi parmi les séquences SEQ
~o ID N°129 à SEQ ID N°160.
De manière générale, les polypeptides selon la présente invention
se présentent sous une forme isolée ou purifiée.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
lla
L'invention concerne aussi un polypeptide comprenant des
modifications d'acides aminés de 1, 2, 3, 4, 5, 10 à 20 substitutions,
additions ou délétions d'un acide aminé par rapport à la séquence en
acides aminés d'un polypeptide de séquences SEQ ID N°129 à SEQ ID
s N°160, ou encore d'un fragment ou d'un variant de ce dernier.
L'invention est également relative à un procédé pour la production
de l'un des polypeptides de séquences SEQ ID N°129 à SEQ ID
N°160
ou d'un fragment peptidique ou d'un variant de ce dernier, ladite
méthode comprenant les étapes de
~o a) insérer un acide nucléique codant pour ledit polypeptide dans
un vecteur approprié ;
b) cultiver, dans un milieu de culture approprié, une cellule hôte
préalablement transformée ou transfecter avec le vecteur recombinant
de l'étape a) ;
is c) récupérer le milieu de culture conditionné ou lyser la cellule
hôte, par exemple par sonication ou par choc osmotique ;
d) séparer et purifier à partir dudit milieu de culture ou encore à
partir des lysats cellulaires obtenus à l'étape c), ledit polypeptide ;
e) le cas échéant, caractériser le polypeptide recombinant produit.
Les peptides selon l'invention peuvent être caractérisés par
fixation sur une colonne de chromatographie d'immunoaffinité sur
laquelle les anticorps dirigés contre ce polypeptide ou contre un
fragment ou un variant de ce dernier ont été préalablement immobilisés.
2s Selon un autre aspect, un polypeptide recombinant selon
l'invention peut étre purifié par passage sur une série appropriée de
colonnes de chromatographie, selon les méthodes connues de l'homme
de l'art et décrites par exemple dans F.Ausubel et al (1999).
Un polypeptide selon l'invention peut étre également préparé par
~o les techniques classiques de synthèse chimique indifféremment en
solution homogène ou phase solide.
A titre illustratif, un polypeptide selon l'invention pourra ëtre
préparé par la technique ou en solution homogène décrite par
HOUBENWEYL (1974) ou encore la technique de synthèse en phase
35 solide décrite par MERRIFIELD (1965a; 1965b).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
115
Font également partie de l'invention des polypeptides dits
" homologues " à l'un quelconque des polypeptides de séquences
d'acides aminés SEQ ID N°129 à SEQ ID N°160, ou de leurs
fragments
ou variants.
s De tels polypeptides homologues ont des séquences d'acides
aminés possédant une ou plusieurs substitutions d'un acide aminé par
un acide aminé équivalent, par rapport aux polypeptides de référence.
On entendra par acide aminé équivalent selon la présente
invention, par exemple remplacement d'un résidu sous la forme L par un
io résidu sous la forme D ou encore le remplacement d'un acide
glutamique (E) par un acide pyro-glutamique selon des techniques bien
connues de l'homme du métier. A titre illustratif, la synthèse de peptide
contenant au moins un résidu sous la forme D est décrite par KOCH
( 1977).
~s Selon un autre aspect, sont également considérés comme des
acides aminés équivalents deux acides aminés appartenant à la même
classe, c'est-à-dire deux acides aminés acide, basique, non polaire ou
encore polaire non chargé.
Font également partis de l'invention des polypeptides comprenant
2o au moins une liaison non peptidique telle qu'une liaison rétro-inverso
(NHCO), une liaison carba (CHzCH2) ou encore une liaison
cétométhylène (CO-CH2).
De préférence, les polypeptides selon l'invention comprenant une
ou plusieurs additions, délétions, substitutions d'au moins un acide
2s aminé conserveront leur capacité à étre reconnus par des anticorps
dirigés contre les polypeptides non modifiés.
Anticorps
~o
Les polypeptides selon l'invention, en particulier les polypeptides
de séquences en acides aminés SEQ ID N°129 à SEQ ID N°160 ou les
fragments et les variants de ces derniers ainsi que les peptides
homologues peuvent être utilisés pour la préparation d'anticorps.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
116
Par " anticorps " au sens de la présente invention, on entendra
notamment des anticorps polyclonaux ou monoclonaux ou des
fragments (par exemple les fragments F (ab)'2, Fab) ou encore tout
polypeptide comprenant un domaine de l'anticorps initial reconnaissant
s le polypeptide ou le fragment de polypeptide cible selon l'invention .
Des anticorps monoclonaux peuvent être préparés à partir
d'hybridomes selon la technique décrite par KOHLER et MILSTEIN
(1975).
~o La présente invention concerne ëgalement des anticorps dirigés
contre un polypeptide tel que décrit ci-dessus ou un fragment ou un
variant de ce dernier, tels que produits dans la technique du trioma ou
encore la technique d'hybridome décrite par KOZBOR et al. (1983).
is L'invention a également trait à des fragments d'anticorps simple
chaîne Fv (ScFv) tels que décrits dans le brevet US N° 4,946,778 ou
encore par MARTINEAU et al. (1998).
Les anticorps selon l'invention comprennent également des
fragments d'anticorps obtenus à l'aide de banques de phages RIDDER
2o et al., (1995) ou encore des anticorps humanisés REIMANN et al.
(1997); LEGER et al., (1997).
Les préparations d'anticorps selon l'invention sont utiles dans des
tests de détection immunologiques destinés à l'identification de la
présence et/ou de la quantité d'antigènes présents dans un échantillon.
2s Un anticorps selon l'invention pourra comprendre en outre un
marqueur détectable isotopique ou non-isotopique, par exemple
fluorescent ou encore ëtre couplé à une molécule telle que la biotine,
selon des techniques bien connues de l'homme du métier.
Ainsi, la mention a en outre pour objet un procédé pour détecter la
~o présence d'un polypeptide conforme à l'invention dans un échantillon,
ledit procédé comprenant les étapes de
a) mettre en contact l'échantillon à tester avec un anticorps tel que
décrit ci-dessus ; '
b) détecter le complexe antigène/anticorps formé.
~s


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
117
L'invention est également relative à un nécessaire ou kit de
diagnostic ou pour la détection de la présence d'un polypeptide
conforme à l'invention dans un échantillon, ledit nécessaire comprenant
a) un anticorps tel que défini ci-dessus ;
s ~ b) un réactif permettant la détection des complexes
antigène/anticorps formés.
Méthode de criblage d'une molécule ou d'une substance se fixant
sur un polypepfide selon l'invention.
~o Un polypeptide selon l'invention peut être utilisé pour cribler des
molécules se fixant sur celui-ci.
La fixation du polypeptide avec la molécule ou substance peut
activer (molécule agoniste) ou inhiber (molécule antagoniste) l'activité
dudit polypeptide.
is De telles molécules capables de se fixer sur l'un quelconque des
polypeptides selon l'invention comprennent des anticorps, des
oligonucléotides, d'autres protéines et de manière générale des petites
molécules de toutes natures.
Dans un tel test de criblage, on peut simplement mettre en
zo évidence la fixation de la molécule candidate aux polypeptides, l'un des
deux partenaires étant marqué par un composé détectable (polypeptide
d'intérêt ou molécule candidate), la visualisation du complexe
polypeptide/molécule candidate étant alors visualisée par détection du
marqueur détectable, après élimination des molécules candidates non
2s liées spécifiquement.
A titre d'exemple, un test de criblage d'une molécule candidate
capable de se fixer sur un polypeptide selon l'invention pourra
comprendre avantageusement une première étape au cours de laquelle
le polypeptide d'intérêt ou la molécule candidâte est immobilisé sur un
~o support, une seconde étape au cours de laquelle le second partenaire
(molécule candidate ou polypeptide d'intérêt) est mis en présence du
premier composé préalablement immobilisé sur le support, une troisième
étape au cours de laquelle un ou plusieurs lavages sont effectués dans
des conditions appropriées à l'élimination des composés n'étant pas liés
35 spécifiquement, et enfin une quatrième étape au cours de laquelle le


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
118
complexe éventuellement formé entre le polypeptide d'intérêt et la
molécule candidate est détecté.
Dans le mode de réalisation du test de criblage selon lequel. la
molécule candidate est préalablement immobilisée sur un support, puis
s mise en présence du polypeptide d'intérêt selon l'invention, la détection
du complexe formé par la molécule candidate et le polypeptide d'intérêt
selon l'invention pourra être avantageusement réalisée à l'aide d'un
anticorps tel que décrit ci-dessus.
Dans un autre mode de réalisation du test de criblage selon lequel
~o c'est le polypeptide d'intérêt selon l'invention qui est préalablement
immobilisé sur un support, la molécule candidate sera avantageusement
marquée à l'aide d'un marqueur détectable préalablement à sa mise en
contact avec le polypeptide d'intérêt immobilisé.
Un tel marqueur détectable peut être radioactif ou non radioactif,
~s par exemple fluorescent ou correspondre à un ligand pour un troisième
partenaire utilisé pour la détection comme une molécule de biotine.
En conséquence, l'invention a également pour objet un procédé
de criblage d'une molécule ou d'une substance candidate interagissant
2o avec un polypeptide selon l'invention, ladite méthode comprenant les
étapes de
a) mettre en contact un polypeptide conforme à l'invention avec la
substance ou molécule candidate à tester ;
b) détecter les complexes éventuellement formés entre ledit
2s polypeptide et ladite substance ou molécule candidate.
L'invention concerne également un nécessaire ou kit pour le
criblage d'une molécule ou d'une substance candidate interagissant
avec un polypeptide selon l'invention, ledit nécessaire comprenant
~o a) un polypeptide conforme à l'invention ;
b) le cas échéant, des moyens nécessaires à la détection du
complexe formé entre ledit polypeptide et la molécule ou substance
candidate.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
119
La présente invention est en outre illustrée, sans pour autant être
limitée, par les exemples suivants
EXEMPLES
s
Exemple 1: Distribution tissulaire des transcrits selon l'invention
Le profil d'expression des polynucleotides selon la présente
invention est déterminé selon les protocoles d'analyse de Northern blot
~o et de transcription inverse couplée à la PCR décrits notamment par
Sambrook et al (ref. CSN Sambrook, J., Fritsch, E.F., and Maniatis, T.
(1989). " Molecular Cloning : A Laboratory Manual, " 2"d ed., Cold Spring
Harbor Laboratory Press, Cold Spring Harbor, NY.).
~ s Par exemple, dans le cas d'une analyse par transcription inverse,
un couple d'amorces synthétisées à partir de l'une quelconque des
séquences nucléotidiques des transcrits SEQ ID N°1 à SEQ ID N°81
est
utilisé pour détecter l'ADNc correspondant.
2o La réaction de polymérise en chaîne (PCR) est réalisée sur des
matrices d'ADNc correspondant à des ARNm polyA+ (Clontech)
rétrotranscrits. La transcription inverse en ADNc est réalisée avec
l'enzyme SUPERSCRIPT II (GibcoBRL, Life Technologies) selon les
conditions décrites par le fabricant.
?s La réaction de polymérise en chaîne est réalisée selon des
conditions standard, dans 20 NI de mélange réactionnel avec 25 ng de la
préparation d'ADNc. Le mélange réactionnel est composé de 400 NM de
chacun des dNTP, de 2 unités de Thermus aquaticus (Taq) ADN
polymérise (Ampli Taq Gold ; Perkin Elmer), de 0,5 NM de chaque
3o amorce, de 2,5 mM MgCl2, et de tampon PCR. Trente quatre cycles de
PCR ( dénaturation 30 s à 94 °C, hybridation de 30 s décomposé


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
120
comme suit lors des 34 cycles : 64°C 2 cycles, 61 °C 2 cycles,
58°C 2
cycles et 55°C 28 cycles et une élongation d'une minute par kilobase à
72°C) sont réalisés après une première étape de dénaturation à
94°C
durant 10 min dans un thermocycler Perkin Elmer 9700. Les réactions
s de PCR sont visualisées sur gel d'agarose par électrophorèse. Les
fragments d'ADNc obtenus peuvent être utilisés comme sondes pour
une analyse par Northern blot et peuvent également étre utilisés pour la
détermination exacte de la séquence polynucléotidique.
~o Dans le cas d'une analyse par Northern Blot, une sonde d'ADNc
produite comme décrit ci-dessus est marquée au 32P grâce au système
de marquage d'ADN High Prime (Boehringer) selon les instructions
indiquées par le fabricant. Après marquage, la sonde est purifiée sur une
microcolonne de Sephadex G50 (Pharmacia) selon les instructions
~s indiquées par le fabricant. La sonde marquée et purifiée est alors utilisée
pour la détection de l'expression des ARNm dans différents tissus.
Le Northern blot contenant des échantillons d'ARN de différents
tissus humains ((Multiple Tissue Northern , MTN, Clontech) Blot 2,
référence 77759-1) est hybridé avec la sonde marquée.
20 . Le protocole suivi pour les hybridations et lavages peut ëtre soit
directement celui décrit par le fabricant (Manuel d'utilisation PT1200-1)
soit une adatation de ce protocole en utilisant les méthodes connues de
l'homme de l'art et décrites par exemple dans F.AUSUBEL et al (1999).
On pourra ainsi faire varier par exemple les températures de
2s préhybridation et d'hybridation en présence de formamide.
Par exemple on pourra utiliser le protocole suivant
1- Compétition des membranes et pré-hybridation:
~o
- Mélanger : 40p1 ADN sperme de saumon (10mg/ml)
+ 40 p1 ADN placentaire humain (10mg/ml)


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
121
- Dénaturer 5 mn à 96°C, puis plonger dans la glace le mélange.
- Oter le SSC 2X et verser 4 ml de mix formamide dans le tube
s d'hybridation contenant les membranes.
- Ajouter le mélange des deux ADN dénaturés
1o
- Incubation à 42°C pendant 5 à 6 heures, avec rotation.
2- Compétition de la sonde marguée
- Ajouter à la sonde marquée et purifiée 10 à 50 NI ADN Cot I, selon la
quantité de repeats.
- Dénaturer 7 à 10 mn à 95°C.
- Incuber à 65°C pendant 2 à 5 heures.
3- HYBRIDATION
- Oter le mix de pré hybridation.
- Mélanger 40 NI ADN sperme de saumon + 40 NI ADN placentaire
2s humain ; dénaturer 5 mn à 96°C, puis plonger dans la glace.
- Ajouter dans le tube d'hybridation 4 ml de mix formamide, le mélange
des deux ADN et la sonde marquée/ADN Cot I dénaturée.
- Incuber 15 à 20 heures à 42°C, avec rotation.
4- Lavages
40
- Un lavage à température ambiante dans du SSC 2X, pour rincer.
- 2 fois 5 minutes à température ambiante SSC 2X et SDS 0,1% à 65°C.
- 2 fois 15 minutes à 65°C SSC 1X et SDS 0,1% à 65°C.
Après hybridation et lavage, le blot est analysé après une nuit
d'exposition au contact d'un écran au phosphore révélé à l'aide du Storm
(Molecular Dynamics, Sunnyvale, CA).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
122
Exemple 2: Obtention de fragments d'ADNc complets
correspondant aux transcrits selon l'invention
- Différentes approches peuvent être utilisées pour isoler l'ADNc
s correspondant à un des clones particulier parmi les séquences SEQ ID
N° 1 à SEQ ID N° 81.
Par exemple un clone complet peut être directement isolé par
hybridation en criblant une banque d'ADNc au moyen d'une sonde
polynucléotidique spécifique de la séquence du gène d'intérêt.
~o En particulier une sonde spécifique de 30-40 nucléotides est
synthétisée en utilisant un synthétiseur de marque Applied
Biosystem/Perkin Elmer selon la séquence choisie.
L'oligonucléotide obtenu est radiomarqué, par exemple au 32P-y
ATP en utilisant la T4 polynucléotide kinase et est purifié selon les
~s méthodes usuelles (e.g. Maniatis et al. Molecular cloning : A Laboratory
Manual, Cold Spring Harbor Press, Cold Spring, NY 1982 ou encore
F.Ausubel et al . (Current Protocols in Molecular Biology, J.Wiley and
Sons Eds, 1999).
zo La banque de clones contenant l'ADNc que l'on veut cribler est
étalée sur milieu de culture en boîte de Pétri (1.5% agar) contenant les
antibiotiques appropriés selon les méthodes usuelles citées ci dessus
(F.Ausubel et al.). Les colonies ainsi produites après incubation sont
transférées sur filtres de nitrocellulose et criblées au moyen de la sonde
2s nucléotidique radiomarquée, selon les méthodes usuelles et les colonies
hybridant avec la sonde sont isolées et sous clonées.
L'ADN des clones ainsi repéré est préparé et analysé par
séquençage. Les clones contenant les fragments correspondant à
~o l'ADNc complet sont purifiés et recloués dans le vecteur pcDNA3 selon


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
123
les protocoles connus de l'homme de l'art et présentés par exemple
dans F.Ausubel et al (1999) .
Différentes méthodes sont connues pour identifier les extrémités
s 5' et 3' du cDNA correspondant aux gènes décrits dans la présente
demande. Ces méthodes incluent mais ne se limitent pas au clonage par
hybridation, au clonage utilisant des protocoles similaires ou identiques à
la 3' ou 5' RACE-PCR (Rapid Amplification of cDNA End-PCR) qui sont
bien connues de l'homme de l'art.
io
Par exemple, on pourra utiliser le kit commercialisé par la société
Clontech (Marathon ReadyTM cDNA kit , protocole référencé PT1156-1)
ou alternativement une méthode similaire à la 5'RACE est disponible
pour caractériser l'extrémité 5' manquante d'un cDNA (Fromont-Racine
is et al. Nucleic Acid Res.21(7) :1683-1684 (1993)). En bref, un
oligonucléotide d'ARN est ligaturé à l'extrémité 5' d'une population
d'ARNm. Après retrotranscription en cDNA, un jeu d'amorces
spécifiques respectivement de l'adaptateur ligaturé en 5' et d'une
séquence située en 3' du gène d'intérët est utilisé en PCR pour amplifier
?o la portion 5' du cDNA recherché. Le fragment amplifié est ensuite utilisé
pour reconstruire l'ADNc complet.
Exemple 3 : Analyse du profil d'expression génique pour la maladie
2s de Tanaier
La vérification de la perte d'expression du gène candidat
entraînant le phénotype cellulaire de Tangier peut-étre déterminé par
hydridation de ces séquences avec des sondes correspondant aux


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
12a
ARNm provenant de fibroblastes de sujets atteints ou non de la maladie,
selon les méthodes décrites ci-dessous
1. Préparation des ARN totaux des ARNm poly(A)+ et de sondes d_e
cDNA
Les ARN totaux sont obtenus à partir de cultures cellulaires des
fibroblastes de sujets normaux ou bien atteints de la maladie de Tangier
par la méthode à l'isothiocyanate de guanidine(Chomczynski & Sacchi,
1987). Les ARNm poly(A)+ sont obtenus par chromatographie d'affinité
~o sur colonnes d'oligo(dT)-cellulose (Sambrook et al., 1989) et les cDNA
utilisés comme sondes sont obtenus par RT-PCR (DeRisi et al., 1997)
avec des oligonucléotides marqués avec un produit fluorescent
(Amersham Pharmacia Biotech ; CyDyeT"").
~s 2. Hydridation et détection des niveaux d'expressions
Les membranes de verre contenant les séquences présentées
dans cette demande de brevet, correspondant au gène Tangier sont
hydridées avec les sondes de cDNA, obtenues à partir des fibroblastes
20 (lyer et al., 1999). L'utilisation du système Amersham/molecular
Dynamics (Avalanche MicroscannerT"") permet la quantification des
expressions des produits de séquences sur le type cellulaire sain ou
affecté.
2s Exemple 4: Construction du vecteur d'expression dans des
cellules de mammifères
Le gène d'intérêt peut étre exprimé dans des cellules de
mammifères. Un vecteur d'expression eukaryote typique contient un
~o promoteur qui permet l'initiation de la transcription de l'ARNm, une


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
125
séquence codant pour la protéine, et les signaux requis pour la
terminaison de la transcription et pour la polyadénylation du transcrit. II
contient aussi des signaux supplémentaires comme des enhancers, .la
séquence (de) Kozak et des séquences nécessaires pour l'épissage de
s l'ARNm. Une transcription efficace est obtenue avec les éléments early
et late des promoteurs du virus SV40, les LTR rétroviraux ou le
promoteur early du virus CMV. Cependant des éléments cellulaires
comme le promoteur de l'active peuvent aussi ëtre employés. De
nombreux vecteurs d'expression peuvent être employés pour mettre en
~o oeuvre la présente invention comme le vecteur pcDNA3.
Exemple 5 : Production des polypeptides
Le polypeptide correspondant au transcrit partiel du gène GS
t5 N°XX ou au cDNA complet décrit dans l' Exemple 2 (clonage du cDNA
complet) peut être facilement produit dans un système d'expression
bactérienne, de cellules d'insectes en utilisant les vecteurs baculovirus
ou encore dans des cellules de mammifères avec ou sans les vecteurs
du virus de la vaccine. Toutes les méthodes sont aujourd'hui largement
2o décrites et connues de l'homme de l'art. On en trouvera par exemple
une description détaillée dans F.Ausubel et al. (1999).
Exemple 6 : Production d'un anticorps dérivé d'un polypeptide
Les anticorps dans la présente invention peuvent être préparés
par différentes méthodes (Current Protocols In Molecular Biology
Volume 1 edited by Frederick M. Ausubel, Roger Brent, Robert E.
Kingston, David D. Moore, J.G. Seidman, John A. Smith, Kevin Struhl -
~o Massachusetts General Hospital Hanrard Medical School, chapitre 11 ).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00101426
126
Par exemple, les cellules exprimant un polypeptide de la présente
invention sont injectées dans un animal afin d'induire la production de
serum contenant les anticorps. Dans une des méthodes décrites, les
proteines sont préparées et purifiées afin d'éviter des contaminations.
s Une telle préparation est alors introduite dans l'animal dans le but de
produire des antisera polyclonaux de plus grande activité.
Dans la méthode préférée, les anticorps de la présente invention
sont des anticorps monoclonaux. De tels anticorps monoclonaux
peuvent ëtre préparés en utilisant (a technique d'hybridome. (Këhler et
io al, Nature 256 :495 (1975) ; Kdhler et al, Eur. J. Immunol. 6 :511 (1976) ;
Kijhler et al, Eur. J. Immunol. 6:292 (1976) ; Hammeling et al., in
Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., pp. 563-
681 51981). En général, de telles méthodes impliquent d'immuniser
l'animal (préférentiellement une souris) avec un polypeptide ou, mieux
~s encore, avec une cellule exprimant le polypeptide. Ces cellules peuvent
être mises en culture dans un milieu de culture tissulaire adéquat.
Cependant, il est préferable de cultiver les cellules dans un milieu Eagle
(Earle modifié) supplementé avec 10% de serum bovin foetal (inactivé à
56°C) et additionné d'environ 10 g /I d'acides aminés non essentiels,
de
20 1000 U/ml de pénicilline et d'environ 100 Ng/ml de streptomycine.
Les splenocytes de ces souris sont extraits et fusionnés avec une
lignée cellulaire de myelome adéquate. Cependant, il est préférable
d'utiliser la lignée cellulaire de myelome parentale (SP20) disponible à
l'ATCC. Après fusion; les cellules d'hybridomes résultantes sont
2s sélectivement maintenues en milieu HAT puis clonées par dilution limite
comme décrit par Wands et al. (Gastroentérology 80:225-232 (1981)).
Les cellules d'hybridomes obtenues après une telle sélection sont
testées afin d'identifier les clones sécrétant des anticorps capables de se
fixer au polypeptide.
~o D'autre part, d'autres anticorps capables de se fixer au
polypeptide peuvent être produits selon une procédûre en 2 étapes


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
127
utilisant des anticorps anti-idiotypique une telle méthode est fondée sur
le fait que les anticorps sont eux-mêmes des antigènes et en
conséquence il est possible d'obtenir un anticorps reconnaissant un
autre anticorps. Selon cette méthode, les anticorps spécifiques de la
s protéine sont utilisés pour immuniser un animal, préférentiellement une
souris. Les splénocytes de cet animal sont ensuite utilisés pour produire
des cellules hybridomes, et ces dernières sont criblées pour identifier les
clones qui produisent un anticorps dont la capacité à se fixer au
complexe proteine-anticorps spécifique peut-être bloqué par le
io polypeptide. Ces anticorps peuvent être utilisés pour immuniser un
animal afin d'induire la formation en plus grande quantité d'anticorps
spécifiques de la protéine.
II serait apprécié que Fab et F(ab')2 et les autres fragments des
anticorps de la présente invention puissent être utilisés selon les
~s méthodes décrites ici. De tels fragments sont typiquement produits par
clivage protéolytique à l'aide d'enzymes telles que la Papaïne (pour
produire les fragments Fab) ou la Pepsine (pour produire les fragments
F(ab')2). Sinon, les fragments sécrétes reconnaissant la protéine
peuvent être produits en appliquant la technologie de l'ADN recombinant
zo ou de la chimie de synthése.
Pour l'utilisation in vivo d'anticorps chez l'homme il serait
préférable d'utiliser des anticorps monoclonaux chimériques
" humanisés ". De tels anticorps peuvent être produits en utilisant des
constructions génétiques dérivés de cellules d'hybridomes produisant les
2s anticorps monoclonaux décrits ci-dessus. Les méthodes pour produire
les anticorps chimériques sont connus par l'homme de l'art. (Pour revue,
voir : Morrison, Science 229 :1202 (1985) ; Oi et al., Biotechnique 4 :214
(1986) ; Cabilly et al., US patent n°4,816,567 ; Taniguchi et al., EP
171496 ; Morrison et al., EP 173494 ; Neuberger et al., WO 8601533 ;
~o Robinson et al., WO 8702671 ; Boulianne et al ; Nature 312 :643
(1984) ; Neuberger et al., Nature 314 : 268 (1985)).


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
128
Exemple 7 : Correction du phénotype cellulaire de la maladie de
Tanaier
La maladie de Tangier est caractérisée par un catabolisme
accéléré des particules lipoprotéiques de haute densité (HDL) et une
accumulation de cholestérol dans les tissus. Notamment, les fibroblastes
de peau des patients atteints de la maladie de Tangier ont une capacité
io réduite à éliminer leur contenu en cholestérol par le processus d'efflux
de cholestérol assuré par l'apolipoprotéine A-I (apoA-I), protéine majeure
des HDL (Francis et al., 1995). Cette caractéristique correspondant à
une perte de fonction est aussi retrouvée dans d'autres cellules
fibroblastiques de patients atteints de déficit familial en HDL (Marcil et
i s al., 1999).
La correction du phénotype des fibroblastes de Tangier peutêtre
assurée par la transfection des ADNc complets correspondant aux
séquences proposées, dans lesdites cellules. L'ADNc est inséré dans un
2o vecteur d'expression qui est ensuite transfecté selon les méthodes
décrites ci-dessous
1. Préparation des cultures fibroblastiaues de sujets normaux et de
sujets atteints de la maladie de Tangier
25 Les fibroblastes primaires de peau humaine sont obtenus par la
mise en culture de biopsie de peau provenant de l'avant bras. Ces
biopsies sont effectuées sur des patients atteints de la maladie de
Tangier ayant les particularités cliniques et biochimiques des
" homozygotes ", c'est à dire des amygdales oranges, des
3o concentrations plasmatiques d'apoA-I et de cholestérol-HDL inférieur au


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
129
Sème percentile. Les lignées de fibroblastes normaux sont obtenus chez
l'American Type Culture Collection (Rockville, MD). Les fibroblastes sont
cultivés dans un milieu EMMEM (Eagle-modified minimium essential
medium ; GIBCO) complété par 10% de sérum de veau foetal, de la
s glutamine à 2 mM, 100 UI/ml de pénicilline et 100 Ng/ml de steptomycine
(milieu désigné par EMMEM10). En vue de la réalisation de l'étude de
l'efflux de cholestérol, ces cellules sont pré-chargées en cholestérol par
incubation de 24 heures avec 50pg/ml de cholestérol dans le milieu
décrit ci-dessus sans sérum de veau mais contenant 2 mglml d'albumine
to bovine (BSA, fraction V),
2. Etude de l'efflux de cholestérol
Les fibroblastes pré-chargés en cholestérol à confluence sur des
plaques à 24 puits sont incubés dans le milieu EMMEM10 et 1 NCilml de
~s 1,2 3H-cholestérol (50 Ci/mmol ; Dupont ; Wilmington, DE) durant 48
heures. Environ 100 000 coups par minute sont obtenus par puits ou
1000 coups par minutepar Ng de protéine cellulaire. Les cellules sont
lavées trois fois avec du milieu EMMEM/BSA, ét incubées avec ce milieu
durant 24 heures avant de transfecter le gène d'intérêt et de démarrer
20 l'efflux par ajout de 10 Ng/ml de protéoliposome contenant l'apoA-I en
milieu EMMEM/BSA. Ces protéoliposomes sont préparés par sonication
de phosphatidylcholine et d'apoA-I humaine purifiée (Jouas, 1986). La
transfection cellulaire s'effectue par la technique de précipitation de
phosphate de calcium (Sambrook et al., 1989). Après la période d'efflux,
2s en général 20 heures, le milieu est collecté, centrifugé (1000 g, 5 min),
et
la radioactivité déterminée par comptage en scintillation liquide. La
radioactivité résiduelle dans les cellules est aussi déterminée sur la nuit
après extraction des lipides dans l'isopropanol. Le pourcentage d'efflux
est calculé en divisant la radioactivité mesurée dans le surnageant par la
~o somme des radioactivités mesurées, dans le surnageant et l'extrait
cellulaire.Un contrôle interne est réalisé pâr transfection d'un gène


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
130
marqueur et l'incubation sur 24 heures avec un milieu EMMEM/BSA
sans protéoliposome contenant l'apoA-I. L'efflux de cholestérol cellulaire
à partir de fibroblastes normaux et transfectés par une gène témoin
correspondent à 6~2% alors que celui obtenu à partir de fibroblastes
s atteints de la maladie de Tangier et transfectés par ce gène témoin est
inférieur à 1 %. En revanche la transfection des fibroblastes atteints de la
maladie de Tangier par un plasmide correspondant aux gènes proposés
dans ce dossier permettrait de restaurer la capacité de ces cellules à
éliminer leur excès de cholestérol à un niveau correspondant à celui de
io fibroblastes normaux.
Exemple 8 : Isolement des clones aénomigues correspondantà un
polynucléotide
L'isolement des clones génomiques correspondant à un transcrit
is est réalisé par criblage de la banque de BAC d'ADN génomique humain
(par exemple celle fournie par Mel Simon, CaITech., ref : Kim et al.
Genomics (1996), 34 :213-218)) par PCR avec des amorces spécifiques
de la séquence d'ADNc correspondant aux séquences des transcrits
SEQ ID N°1à SEQ ID N°81 selon l'invention, selon la méthode
décrite
2o dans l'Exemple 1.
Exemple 9 : Détermination de polymorphisme/mutation de l'un des
gènes correspondant aux transcrits selon l'invention
La détection de polymorphismes et ou de mutations dans les
2s séquences des transcrits peut être réalisée selon différents protocoles.
La méthode de choix est le séquençage direct.
Dans le cas d'un transcrit où la structure du gène correspondant
est inconnue ou partiellement connue il est nécessaire de déterminer
précisément sa structure intron-exon ainsi que la séquence génomique
o du gène correspondant. II s'agit donc dans un premier temps d'isoler le


CA 02371500 2001-10-24
W O 00/71710 PCT/FR00/0142G
131
ou les clones de BAC d'ADN génomique correspondant au transcrit
étudié selon la méthode décrite dans l'exemple 8, de séquencer l'insert
du ou des clones correspondants et de déterminer la structure intron
exon en comparant la séquence de l'ADNc à celle de l'ADN génomique
obtenu.
La technique de détection de mutation par séquençage direct
consiste à comparer les séquences génomiques du gène correspondant
à l'ADNc SEQ ID N° 1 à SEQ ID N°81 obtenues à partir d'au moins
8
individus ( 4 individus affectés par la pathologie étudiée et 4 individus
io non affectés). Les divergences de séquenceconstituent des
polymorphismes. Tous ceux modifiant la séquence en acides aminés de
la protéine sauvage sont des mutations susceptibles d'affecter la
fonction de ladite protéine qu'il est intéressant de considérer plus
particulièrement dans les études d'association casltémoin décrite dans
is l'Exemple 8.
Exemple 10 : Identification du gène causal par la mutation causale
ou une différence transcriptionnelle
Parmi les mutations identifiées selon la méthode décrite dans
?o l'Exemple 9, toutes celles associées au phénotype malade sont
susceptibles d'être causales. La validation de ces résultats est faite en
séquençant le gène chez tous les individus atteints et leurs apparentés
(dont l'ADN est disponible).
D'autre part, la réalisation de Northern blot nu RT_PrR ~Am., m
?s méthode décrite dans l'Exemple 1, à partir d'ARN spécifique d'individus
atteints et non-atteints permet de détecter des variations notables du
niveau d'expression du gène étudié, en particulier une absence de
transcription du gène. .


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
132
TABLEAU I
BREVE DESCRIPTION DES SEQUENCES SELON L'INVENTION
N de SquenceDsignation


1 ADNc correspondantgne GS9002S31
au


2 1' ADNc correspondantau gne GS910331


3 2 ADNc correspondantau gne GS910331


4 ADNc correspondantgne GS914554
au


1 ADNc correspondantau gne GS914739


6 2 ADNc correspondantau gne GS914739


7 ADNc correspondantgne GS915574
au


8 ADNC correspondantgne GS930321
au


9 ADNc correspondantgne GS931311
au


ADNc correspondantgneG5934660
au


11 ADNc correspondantgne GS938315
au


12 1' ADNc correspondantau gne GS93953


13 2 ADNc correspondantau gne GS93953


14 1" ADNc correspondantau gneGS939874


2 ADNc correspondantau gneGS939874


16 ADNc correspondantgne GS911370
au


17 1" ADNC correspondantau gneGS913920


18 2 ADNc correspondantau gneGS913920


19 1' ADNc correspondantau gneGS91437


2 ADNc correspondantau gneGS91437


21 1~' ADiVc correspondantau gne GS91507


2.2 2 ADNc correspondant
au gne GS91507


23 1' ADNc correspondantau gneGS915231


24 2 ADNc correspondant
au gneGS915231


1" ADNc correspondantau gne GS915528


26 2 ADNc correspondant
au gne GS915528


27 1' ADNc correspondantau gne GS99817




CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
133
TABLEAU I (suite 1)
BREVE DESCRIPTION DES SÉQUENCES SELON L'INVENTION
N de SquenceDsignation


28 2 ADNccorrespondantaugne GS99817


29 ADNc gne
correspondant GS916229
au


30 1 ' correspondant-au
ADNc gne
GS92544


31 2 ADNccorrespondantaugne GS92544


32 3 ADNccorrespondantaugne GS92544


33 1'ADNCcorrespondantau GS930284
gne


34 2 ADNccorrespondantaugne GS930284


35 ADNc gne
correspondant GS93382
au


36 ADNc gne
correspondant GS946300
au


37 1'ADNccor?-espondantaugne GS937345


38 2 ADNccorrespondantaugne GS937345


39 3 ADNccorrespondantaugne GS937345


40 1~ADNccorrespondantaugne GS99556


41 2 ADNccorrespondantaugne GS99556


42 1~ADNccorrespondantaugne GS96663


43 2 ADNccorrespondantaugne GS96663


44 3 ADNccorrespondantaugne GS96663


45 4 ADNccorrespondantaugne GS96663


46 5 ADNccorrespondantaugne GS96663


47 6 ADNccorrespondantaugne GS96663


48 1"ADNccorrespondantaugne GS941675


49 2 ADNccorrespondantaugne GS941675


50 3 ADNccorrespondantaugne GS941675


51 1'ADNccorrespondantaugne GS929341


52 2 ADNccorrespondantaugne GS929341




CA 02371500 2001-10-24
W O 00/71710 PCT/FR00/0142G
134
TABLEAU I (suite 2)
BREVE DESCRIPTION DES SÉQUENCES SELON L'INVENTION
N de SquenceDsignation
~


53 3 ADNccorrespondantau gne GS929341


54 1" ADNc
correspondant
au
gne
GS915742


55 2 ADNccorrespondantau gne GS915742


56 3 ADNccorrespondantau gne GS915742


57 1' ADNccorrespondantau gne GS913018


58 2 ADNccorrespondantau gne GS913018


59 3 ADNccorrespondantau gne GS913018


60 l~rADNccorrespondantau gne GS911742


61 2 ADNccorrespondantau gne GS911742


62 3 ADNccorrespondantau gne GS911742


63 1C ADNccorrespondantau gne GS98601


64 2 ADNccorrespondantau gne GS98601


65 3 ADNccorrespondantau gne GS98601


66 lesADNccorrespondantau gne GS94852


67 2 ADNccorrespondantau gne GS94852


68 3 ADNccorrespondantau gne GS94852


69 1C~ADNCcorrespondantau gne GS935135


70 2 ADNccorrespondantau gne GS935135


71 3 ADNccorrespondantau gne GS935135


72 1 ADNccorrespondantau gne GS914669
'


73 2 ADNCcorrespondantau gne GS914669


74 3 ADNccorrespondant GS914669
au gne


75 1 ADNccorrespondantau gne GS913839
'


76 2 ADNc
correspondant
au
gne
GS913839


77 3
ADNc
correspondant
au
gne
GS913839


78 1 ADNccorrespondantau gne GS912639


79 2
ADNc
correspondant
au
gne
GS912639





CA 02371500 2001-10-24
W O 00/71710 PCT/FR00/0142G
135
TABLEAU I (suite 3
BREVE DESCRIPTION DES SEQUENCES SELON L'INVENTION
N de SquenceDsignation


80 3 rrespondant au GS912639
ADNc gne
co


81 ADNc correspondant gneGS 933630
au


82 Sondepour lasquence SEQID NO2


83 Sondepour lasquence SEQID NO2


84 Sondepour lasquence SEQID NO4


85 Sondepour lasquence SEQID NO5


86 Sondepour lasquence SEQID NO10


87 Sondepour lasquence SEQID NO12


88 Sondepour lasquence SEQID No16


89 Sondepour lasquence SEQID NO16


90 Sondepour lasquence SEQID NO21


91 Sondepour lasquence SEQID NO23


92 Sondepour lasquence SEQID NO25


93 Sondepour lasquence SEQID NO27


94 Sondepour lasquence SEQID NO30


95 Sondepour lasquence SEQID NO33


96 Sondepour lasquence SEQID NO33


97 Sondepour lasquence SEQID NO35


98 Sondepour lasquence SEQID NO40


99 Sondepour lasquence SEQID NO40


100 Sondepour lasquence SEQID NO40


101 Sondepour lasquence SEQID NO60


102 Amorcedans SEQ
ID
NO
17


103 Amorcedans SEQ
ID
NO
17


104 Amorcedans SEQ
ID
NO
37


105 Amorcedans SEQ
ID
NO
37


106 Amorcedans SEQ
ID
NO
42




CA 02371500 2001-10-24
W O 00/71710 PCT/FR00/01426
136
TABLEAU I (suite 4)
BREVE DESCRIPTION DES SÉQUENCES SELON L'INVENTION
N de SquenceDsignation


107 Amorce dans ID NO 42
SEQ


108 Amorce dans ID NO 43
SEQ


109 Amorce dans ID NO 45
SEQ


110 Amorce dans ID NO 45
SEQ


111 Amorce dans ID NO 57
SEQ


112 Amorce dans ID NO 57
SEQ


113 Amorce dans ID NO 58
SEQ


114 Amorce dans ID NO 58
SEQ


115 Amorce dans ID NO 66
SEQ


116 Amorce dans ID NO 66
SEQ


117 Amorce.dans ID NO 67
SEQ


118 Amorce dans ID NO 67
SEQ


119 Amorce dans ID NO 69
SEQ


120 Amorce dans ID NO 70
SEQ


121 Amorce dans ID NO 72
SEQ


122 Amorce dans ID NO 72
SEQ


123 Amorce dans ID NO 73
SEQ


124 Amorce dans ID NO 73
SEQ


125 Amorce dans ID NO 75
SEQ


126 Amorce dans ID NO 76
SEQ


127 Amorce dans
SEQ ID NO
78


128 Amorce dans
SEQ ID NO
79


129 Polypeptide par la squence SEQ ID NO
cod 6


130 Polypeptide par la squence SEQ ID NO
cod 9


131 I Polypeptide par la squence SEQ ID NO
cod 13




CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
137
TABLEAU I (suite 5)
BREVE DESCRIPTION DES SÉQUENCES SELON L'INVENTION
N de Squence Dsignation


132 Polypeptidecod par lasquence SEQIDNO 15


133 Polypeptidecod par lasquence SEQIDNO 16


134 Polypeptidecod par lasquence SEQIDNO 18


135 Polypeptidecod par lasquence SEQIDNO 19


136 Polypeptidecod par lasquence SEQIDNO 20


137 Polypeptidecod par lasquence SEQIDNO 21


138 Polypeptidecod par lasquence SEQIDNO 22


139 Polypeptidecod par lasquence SEQIDNO 23


140 Polypeptidecod par lasquence SEQIDNO 24


141 Polypeptidecod par lasquence SEQIDNO 25


142 Polypeptidecod par 1asquence SEQIDNO 26


143 Polypeptidecod par 1asquence SEQIDN027


144 Polypeptidecod par 1asquence SEQIDNO 28


145 Polypeptidecod par lasquence SEQIDN029


146 Polypeptidecod par lasquence SEQIDNO 30


147 Polypeptidecod par lasquence SEQIDNO 31


148 Polypeptidecod par lasquence SEQIDNO 32


149 Polypeptidecod par lasquence SEQIDNO 33


150 Polypeptidecod par lasquence SEQIDNO 34


151 Polypeptidecod par lasquence SEQIDNO 35


152 Polypeptidecod par lasquence SEQIDNO 36


153 Polypeptidecod par lasquence SEQIDNO 37


154 Polypeptidecod par lasquence SEQIDNO 40


155 Polypeptidecod par lasquence SEQIDNO 47


156 Polypeptidecod par lasquence SEQIDNO 52_




CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
138
TABLEAU I (suite 6)
BREVE DESCRIPTION DES SEQUENCES SELON L'INVENTION
N~de Squence Dsignation



157 Polypeptidecod parla squence.SEQ ID NO
53


158 Polypeptidecod parla squenceSEQ ID NO
62


159 Polypeptidecod parla squenceSEQ ID NO
65


160 IPolypeptidecod parla squenceSEQ ID NO
74




CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
139
REFERENCES:
~ BUSH et al., 1997, J. Chromatogr., 777: 311-328.
s ~ FLOTTE et al., 1992, Am. J. ResPIR: (Séquences PIR non
redondantes, version 57). Cell Mol. Biol., 7: 349-356.
~ HIGGINS et al. 1996, Methods Enzymol. 266: 383-402.
~ KOCH Y., 1977, Biochem. Biophys. Res. Commun., 74:488-491.
~ KOHLER G. and MILSTEIN C., 1975, Nature, 256: 495.
~o ~ KOZBOR et al., 1983, Hybridoma, 2(1):7-16.
~ McLAUGHLIN BA et al., 1996, Am. J. Hum. Genet, 59 : 561-569.
~ MERRIFIELD RB, 1965a, Nature, 207(996):522-523.
~ REIMANN KA , et al. 1997, AIDS Res Hum Retroviruses. 13(11):933-
943.
is ~ Ausubel et al., 1989, Current Protocols in Molecular Biology, Green
Publishing Associates and Wiley Interscience, N.Y
~ Beaucage et al., Tefrahedron Leff 1981, 22: 1859-1862
~ Brown EL, Belagaje R, Ryan MJ, Khorana HG, Methods Enzymol
1979;68:109-151
20 ~ Bush et al., 1997, J. Chromatogr., 777 : 311-328.
~ Flotte et al., 1992, Am. J. Respir Cell Mol. Biol., 7 : 349-356.
~ Fuller S.A. et al., 1996, Immunology in Currenf Protocols in Molecular
Biology, Ausubel et al.
~ Hames BD and Higgins SJ, 1985, "Nucleic acid hybridization : a
2s practical approach", Hames and Higgins Ed., IRL Press, Oxford.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
lao
~ Higgins et al., 1996, Methods Enzymol. 266:383-402.
~ Houbenweyl, 1974, in Meuthode der Organischen Chemie, E. Wunsch
Ed., Volume 15-I et 15-II,
~ Koch Y., 1977, Biochem. Biophys. Res. Commun., 74:488-491
~ Kohler G. and Milstein C., 1975, Nature, 256 : 495.
~ Kozbor et al., 1983, Hybridoma, 2(1):7-16.
~ Leger OJ, et al., 1997, Hum Antibodies, 8(1): 3-16
~ Martineau P, Jones P, Winter G, 1998, J Mol Biol, 280(1):117-127~
~ McLaughlin BA et al., 1996, Am. J. Hum. Genet., 59 : 561-569.
~o ~ Merrifield RB, 1965a, Nature, 207(996): 522-523.
~ Merrifield RB., 1965b, Science, 150(693): 178-185.
~ Narang SA, Hsiung HM, Brousseau R, Mefhods Enzymol 1979;68:90-
98
~ Reimann KA, et al., 1997, AIDS Res Hum Retroviruses. 13(11): 933-
is 943
~ Ridder R, Schmitz R, Legay F, Gram H, 1995, Biotechnology (N Y)
13(3):255-260
~ Rust S. et al., Nature Genetics, vol. 20, Septembre 1998, pages 96-98
~ Samulski et al., 1989, J. Virol., 63 : 3822-3828.
20 ~ Sanchez-Pescador R., 1988, J. Clin. Microbiol., 26(10):1934-1938~
~ Urdea M.S., 1988, Nucleic Acids Research, 11: 4937-4957
~ Urdea MS et al., 1991, NucIeicAcids Symp Ser., 24: 197-200.
~ Chomczynski, P., & Sacchi, N. (1987) Anal Biochem 762, 156-9.
~ DeRisi, J., lyer, V., 8~ Brown, P. (1997) Science 278, 680-6.


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
lal
~ Francis, G. A., Knopp, R. H., & Oram, J. F. (1995) Journal of Clinicat
Investigation 96, 78-87.
~ lyer, V., Eisen, M., Ross, D., Schuler, G., Moore, T., Lee, J., Trent,
J.,
s ~ Staudt, L., Hudson, J. J., Boguski, M., Lashkari, D., Shalon, D.,
Botstein,
~ , & Brown, P. (1999) Science 283, 83-7.
~ Jonas, A. (1986) Reconsfitufion ôf High Density Lipoprotein, Vol.
128,
Academic Press, London.
~ Marcil, M., Yu, L., Krimbou, L., Boucher, B., Oram, J., Cohn, J., &
Genest,
J. J. (1999) Arterioscler Thromb Vasc Biol 19, 159-69.
~ Remaley, A. T., Schumacher, U. K., Stonik, J. A., Farsi, B. D.,
ts Nazih, H., 8~
Brewer, H. B. (1997) Arteriosclerosis Thrombosis and Vascular
Biology 17,
1813-1821.
~ Sambrook, J., Fritsch, E. F., & Maniatis, T. (1989) Molecular Cloning,
2o a Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold
Spring Harbor, N.Y.
~ F.Ausubel et al . Current Protocols in Molecular Biology, J.Wiley and
Sons Eds, 1999
~ Fromont-Racine et al. Nucleic Acid Res.21 (7) :1683-1684 (1993)
2s Current Protocols In Molecular Biology Volume 1 edited by Frederick M.
Ausubel, Roger Brent, Robert E. Kingston, David D. Moore, J.G.
Seidman, John A. Smith, Kevin Struhl - Massachusetts General Hospital
Harvard Medical School, chapitre 11


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
1a2
~ K6hler et al, Nature 256 :495 (1975)
~ K~hler et al, Eur. J. Immunol. 6 :511 (1976)
K~hler et al, Eur. J. Immunol. 6:292 (1976) .
~ Hammeling et al., in : Monoclonal Antibodies and T-Cell Hybridomas,
s Elsevier, N.Y., pp. 563-681 51981 )
~ Wands et al. (Gastroentérology 80:225-232 (1981 )
~ Morrison, Science 229 :1202 (1985)
~ Oi et al., Biotechnique 4 :214 (1986)
~ Cabilly et al., US patent n°4,816,567
io ~ Taniguchi et al., EP 171496
~ Morrison et al., EP 173494
~ Neuberger et al., WO 8601533
~ Robinson et al., WO 8702671 ;
~ Boulianne et al ; Nature 312 :643 (1984)
~ s ~ Neuberger et al., Nature 314 : 268 (1985)


CA 02371500 2001-10-24
WO 00/71710 PCT/FR00/01426
1
LISTE DE SEQUENCES
<110> AVENTIS PHARMA S.A.
<120> Produits d'expression de gènes impliqués dans des
maladies génétiquement liées au locus 9q31-34.
<130> Extension FR61610K - AVENTIS
<140>
<141>
<160> 160
<170> PatentIn Ver. 2.1
<210> 1
<211> 552
<212> ADN
<213> Homo sapiens
<400> 1
gggtaaatag ttgtgaacat aactattgtg aatactatgt tatatgttat agttgtgaat 60
gtaaatagta ttcacaattg tgaatacaat gtaaatagct ttcacaattg tgaatacaat 120
gtaagtagct atgtaaatag tgaatacaat gtaaatagct atgtaaatag ttgttatgct 180
gattagggaa taatgagaag gaaaaaaagt atacatattc agtacagatg cagtcatctt 240
tttttcccct cgaacatttt tgatccacaa ttggttgaat ccacagatgg ggaacacaca 300
gtcttggtaa atttaaccaa caaggagggt aaacgcatcc caacagggaa ggtaaactgc 360
acatccatca gtacctcttn gaggggcatc actggtttat aggcttcaat tacagtggac 420
tatnttccag gantaatggg ccttttagtt tttccccnga angnttaant tggnggnttg 480
ccntttgttt ggantgagnt tantcnaacn tattgangta atttttaaag gggntttcat 540
aacagaaggc ct 552
<210> 2
<211> 1246
<212> ADN
<213> Homo sapiens
<400> 2
tagtggaatc agtaaggctt ggcagttgac cttgtttgtt ggagagaagg gataagattt 60
taaagctaca tgtctgaaag aatgatgctg ctgattgaaa taaaggaaga aaggatgcat 120
ttcgggctcc aacctgtcct aggaaggcct agacctcaaa caccaacacc tccatgcatt 180
tcctctttgg ctactatgtc ttttccctga cttctgcctc tccagctctc tgggctgctg 240
cttccacctg ttcatctgac ttagaccctc cctgctgggt ccttgttcac ctactcattt 300
ggtgcttcgt ctgccatcag tacctccatt gcagctggtg ggatgtcagt caccatctct 360
tatatttgct tcccactaga aagatcaaga gaagttattt ctttcccttg cgctccaatt 420
tttctctaga cagttggtat ccacaatttt aaaaaatgtt ccatgttgta taaacaagca 480


CA 02371500 2001-10-24
WO 00/71710 - PCTlFR0010142G
-r
ttcgctgaga ggggctgtta atacacatcg tgcccctttt ataaaaattc atgcatggaa 540
tcctacatta ttatgcatca aaatctccag aaatgtctta ggatttttgc agggagaata 600
ttaaatgcat tgttttgctt tgttttgaag agactagatg tgcagaggaa gagaggtggc 660
atggtgggag ggtacatttg agttgtcaac agtctctgca gtgtcaggtc aattacatca 720
gcacttggac tggaccaggg aaaggaatga ttctgcttcc tgggaatgtc agaaggacct 780
gatgattata tttggcaaag ccaggaggag tggctttgaa tgtcattgct aagaattaca 840
ctttgagtag catttctgga tgtctgagct tttcaaatga tacttctttt ctgctgtggc 900
tttcctttct gttggactgg ttcccagagg gtcctcttgt ttgtccttgc cctcgctttt 960
atatcagttc atgttttctc ttctgtcatc ttccttccca gcgctgtttc tccaccccct 1020
cctgctgcac tcacaacagc ttcccctctc ctgtttagag gtggaagcat gtaagaatgc 1080
gtttgagggg gatgcttgcc aaaggacagc atattcaaca tctggtatca acaaggtaat 1140
gtttaacctt agactagcca aactagtgat gacctgcttc catgctgcat ctgctgcttt 1200
ttgtgttgat gggactcaga aatcatgaga aaggtcttca gtgatc 1246
<210> 3
<211> 3035
<212> ADN
<213> Homo sapiens
<400> 3
aactgagcaa agattgcctt tgcttcacct attgacacat ttaagaacct.cgttttatag 60
agagtacgga gtggggtctg agattctaca tttcttacaa gttcctggtt tatgccagtt 120
ctgtttgtct ggtcaccaca cttctgaata gcaaggtttc agaggactct atgaagtttt 180
tatttctcaa aaatttggct taggtacatc tttacataca gtggtgctag atattattct 240
ttcagaactt aaccatgcaa caatgcagaa gaatacaaaa aatgcttgca cacagtagtg 300
tattttaatg gaactataaa agcattgaac tgattcctaa ctttacatat aaaggataat 360
taaaccagca gcctaaagca ccttgctcta ctgttaatgg tacttatgag tttataacag 420
tagcttccaa ccttggctat gcattagaaa cagcatttta taaatgatta gtcccactgc 480
gtcccatttc cacaggattc tgattcaatt tacctgggct ggggccttgt cctctatatt 540
tttcagaagc tttacagggg attatgatgc ataattggga ttgagaatna ctgatgtagc 600
attcacaact gtgtctcatt ttattcttaa tcccatgagg ccatgcagaa ggaaggaaat 660
gatgctcaga gaagaaccac ctggtgtcaa gcagatagct agccgaatgg caaagcagaa 720
cctcaatccc agatttcttg actccaaaat atgtagtcca aactgcctgc ccttgtccca 780
ttccttgagc tctatcatga attggtttta tcctgagagt cagatcacat tacagggtac 840
ttgtttcagt gtctccattt gtgagcaagt atatcacaat tcatttcact tttgagcagt 900
ttcttacccg aggtagaaat gcaataacca tttcttggta ggtggtgtag gggatagaca 960
ggtaaatatt aagacacagt tcatcatccc ccaccttggc aaattacgga cacagcccag 1020
tagggagtat aagggttgta cacagctatc atgcgcttga tcagtgcatg tcttcaaagt 1080
gcacttgtac ctcagcagag agctaagaag catgaaggaa gtcttcatgg aggagatggc 1140
actggagcta agtcttcaga gtcggcattt tggcaggtgg agattgggaa accagaggaa 1200
cttcactaga tgcaaggtcc tgttgaagat tcaaggtaat gagacacata attgagaggg 1260
agtgacagca tggggaattt ctgagtttgg gcagtaatgt gatcagaact gtactccagg 1320
aagaagagta gaagaaagaa ctgagtggag agaagactgg agtaggggat acgtaggagg 1380
gtttgtccct ggttaggatg agatgatagc aggacccaga agaggttgca gtaaaaccaa 1440
gagagacagc cgggtgcggt ggctcacgcc tgtaatccca gcacattggg aggccaaggc 1500
gggtggatca cctgaggtca ggagttcgcg agcagcctgg ccaacatggt gaaaccccgt 1560
ctatactaaa aatacaaaaa gatagccaga cgtggtggca ggcgcctgta atcctagcta 1620


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
3
cttgggaggc tgaggcaaga gaattgcttg aacccaggag gtggacgttg tagtgagcca 1680
agatcacacc attgcactcc agcctgggta acaagagtga aactccgtct ccaaacaaac 1740
aaacaaacaa acaaacccac gagggagatc agtgtgaagg gcattgccaa agtggaatca 1800
gtaaggcttg gcagttgacc ttgtttgttg gagagaaggg ataagatttt aaagctacat 1860
gtctgaaaga atgatgctgc tgattgaaat aaaggaagaa aggatgcatt tcgggctcca 1920
acctgtccta ggaaggccta gacctcaaac accaacacct ccatgcattt cctctttggc 1980
tactatgtct tttccctgac ttctgcctct ccagctctct gggctgctgc ttccacctgt 2040
tcatctgact tagaccctcc ctgctgggtc cttgttcacc tactcatttg gtgcttcgtc 2100
tgccatcagt acctccattg cagctggtgg gatgtcagtc accatctctt atatttgctt 2160
cccactagaa agatcaagag aagttatttc tttcccttgc gctccaattt ttctctagac 2220
agttggtatc cacaatttta aaaaatgttc catgttgtat aaacaagcat tcgctgagag 2280
gggctgttaa tacacatcgt gcccctttta taaaaattca tgcatggaat cctacattat 2340
tatgcatcaa aatctccaga aatgtcttag gatttttgca gggagaatat taaatgcatt 2400
gttttgcttt gttttgaaga gactagatgt gcagaggaag agaggtggca tggtgggagg 2460
gtacatttga gttgtcaaca gtctctgcag tgtcaggtca attacatcag cacttggact 2520
ggaccaggga aaggaatgat tctgcttcct gggaatgtca gaaggacctg atgattatat 2580
ttggcaaagc caggaggagt ggctttgaat gtcattgcta agaattacac tttgagtagc 2640
atttctggat gtctgagctt ttcaaatgat acttcttttc tgctgtggct ttcctttctg 2700
ttggactggt tcccagaggg tcctcttgtt tgtccttgcc ctcgctttta tatcagttca 2760
tgttttctct tctgtcatct tccttcccag cgctgtttct ccaccccctc ctgctgcact 2820
cacaacagct tcccctctcc tgtttagagg tggaagcatg taagaatgcg tttgaggggg 2880
atgcttgcca aaggacagca tattcaacat ctggtatcaa caaggtaatg .tttaacctta 2940
gactagccaa actagtgatg acctgcttcc atgctgcatc tgctgctttt tgtgttgatg 3000
ggactcagaa atcatgagaa aggtcttcag tgatc 3035
<210> 4
<211> 1479
<212> ADN
<213> Homo sapiens
<400> 4
gtctgcagaa ttcgcccttg ctgccaccta tgtaccagct attccagatg accaagccct 60
gctagaataa agactgactt ttcattgtga cctctgaagg atgtgcagct cagctttcac 120
ctatccccac gttcacccaa gccaaaaaga agaattgttc attcaaactg gaaatgatct 180
ccagcttgga aatgagactc ctcatgagct tattctaaga tcagagtctg aaaattattt 240
tctcaaaagt tacaaataaa tgtcttttaa cagtactgtc agactagtga ccaacaagtt 300
actttatgag gatggatgat gatattagag ttcaagcaat tgtccagttt gtttcgatgc 360
cacagtttgc ttttaaattc ccatagtgag cttccatctt gagacccact caacacagaa 420
ggattacata aaggttgatc acccacgctc tacagatgaa caaattgaga cccagagatg 480
ctaaactgct ctgcaggtca caaacctgaa cagcagcata gccaaaatgg gaacg-gagct 540
cttctgactt caagcccctg cacttttttc ttaaccacat taattttatg aatatctatg 600
tggtcaaagt ctcttttgta aaatctgagt ataagctgaa ctagatcatg tctctgtaag 660
ctaagatggc agaaacacat tgtcatgtta gtttggagga gcaaacagat ataagtatgt 720
gttgtaatgt tatagtgagc tgttatgtat cccccagcaa tgtccaaagt gatcagagct 780
actagatgac ttattacaat gttcagatcc cactccttca ttcctcctct ctcagtgacc 840
tgtctacccc caagctttag aactgagctc tctccaactt agaactcatt agagtttgtt 900
gcattagtga ttggatctcc tcatgaaagt tttttgacca atgacagtag agccccttta 960


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
4
agctagccag gcccaagata gggaagcact gctggtttac atttctgctc tttctaattc 1020
agttgtctat tgcatgcaga catcccctgc ccgacttctc cattatggaa ggctaaggcc 1080
atccttcctt gtccagtttc tctacctaca cactaacatg ccttttcccc atggagtgaa 1140
ctctgccagt tgtctttgga cattttctgc agatgcaggc tcagttctgc tcttttgttc 1200
ccacccactt ctagatcttc ctccatttaa tcccttattc ttataaggag tctaattttt 1260
gtgtattgtc cttgâttâgg gcagctgaca gctttacacc aaagctgaag tctctcactt 1320
aatcctaagc aaggggctag ggagaactaa gatatccttc ccatatcaag ggatataggt 1380
tactagaagg gtggaggtct cttaacaggc tcactcacct ttcagagttt aaattatggt 1440
caggcttaag aagctctctc ttgtgactga gtgtattgc 1479
<210> 5
<211> 5169
<212> ADN
<213> Homo sapiens
<400> 5
cagttctttt cattccatca ctttaggtga tgggtaagat ttttgaaagc cttatatttt 60
ttgattttgt tgtctagttt aatcctacct ttaatagttg tgtttggtaa aattcccact 120
tgaatgtgac actgataata attatgctga tttttagcat ctcttatagg aatcaaagtt 180
tattaaagtt acatagagga ttgaaaaatg tatatcactc aatttttatc taagaaggat 240
aggttataaa gggaggtacc taaatactca aataatgtat atattctttt.tcataacata 300
tggaatgctt taagcaattg ttttgaaaaa aatctgcgta tctttgactt aattggcaca 360
tgactttttc aagcagccat tcattcagag gtttgttttc tctcagtcct tttgctacat 420
tcactttctt ttcaaagaaa tgttaattat tacaaaaatt gacatagata tctttcccaa 480
acttggggta aaacccatgg ttatgtggaa cataactgtt cttaaaaagt caattataat 540
ttgtaactca catcctttga gctaaactaa attaaaatta cagtatttaa taattctttg 600
ggcattttta agaggtctga atttgtattt ttcttcattt ttgaaacttt acatttgttg 660
actttttttc attctcattt aaaatatatt gtgctatgat aaccaacctt cttccaagga 720
gtgaccatta ctgcctacat ttgcgttgct ttctacatag agacttgtat aatagtatta 780
atagtagctc attctctcta aaaatttact gcccactgag aggatgtttt gtttccttga 840
taaaacaaat gtaaatgagg aattttattt gaattggaat attgtttttc tagaggacat 900
tcatatctgc actattatct gatgacatgt tggtaatttt aaagactgca aggcagttta 960
gagaatgaag taaaccaata gatactcttt tgattctcca aagaaatata attttggttt 1020
ttgttcctca gagagagttt gaaagaaatt ttcagatgtt ctgttcccta tagagggcct 1080
attccaggat ctaaatgaat gggaatttat aattcctttc atagactcaa acctgaaagc 1140
agaaattttt agtagttgag ttgctttaag tgaattttaa caaatatgac acagaaaagg 1200
tcagatgctg ttgtataaaa ttttttacta gtgtgtctta tataattctt tcttctcatt 1260
aattcagtgc ctttttcctc taagcatact cttggtccat gccccatgca gtgtcaactg 1320
atgtttaagc tacagagcat tgttgtagtg gtgagggccc tctgttgcag gggcatgggg 1380
aaatgcatat attaatcagg ggctggagga gtatacatga ttcttgtgtt catgttgtca 1440
tttgaaactc ttcacataaa attttctaat attcatttgg aaaacctctc cactggagag 1500
gtttcatctc tgagaggttt tgtaataata gtgtaagttc agtaaatcca gtccaaattc 1560
tcatcacatg tattatttga tactaaattt tcaattatta cttcaaaata agagtctgag 1620
gatttcttct tactggcgtt cttaaaggtc tctaaaatta aagaacaaga tgtggttttt 1680
tgtttaagac gtttttagtt tatttgttgt taagttaaac tggagaaagt ttgtcatcct 1740
cattttcaaa ctgaaaacta atcaaatata gtgcctattt agtctcaaaa taaggtaact 1800
attaacttga ttatactata taatattctc aattacattt gaatttaaaa atattgagct 1860


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
cttgattaca atttaataca ttgtaaaaag tattaaatcc tttgaaacat cttttgttgc 1920
ttatttagtt tttgtttcta caggtcaaac atgattgctt tctataaaag aaatgcttga 1980
gaggttgact ataatggata tgtcacaggt ataaaacagt tgttttctaa aaacatgcat 2040
ttagtatggc attctctttt agcaactgaa ttcccaacga gttttattaa gctggatatc 2100
gaaatgaagg agctgcctta agcactttag aaaaagaatt tttttacaat tcattttgac 2160
tctcatggct gaccatgtca ttatgtcttt aaattttggt aaatatgtag ataccaagca 2220
ttaataacta atgcacacag aaatttaata tacagcaatt ctttgaatgt tccaggtgta 2280
cgtaaactaa ctgaaagtat taaggacatg cctgtctata catgggtttc attgatggta 2340
tctgtatcat cttgacaaat cgtgaactgc tgctgtatgg ctagactttg cctatttact 2400
ctgttatgca aacagtaatt tttccctatg ttatgaagag agacatattg gcttgcttta 2460
atttacttat ttatgaaatt aaagcatgaa taatatgtat aatttgaatt ttttgtgact 2520
gatccttggc agtataaatg ataaaagtaa atgtaatgga atcttttaat taggctaaga 2580
tatgctattt cataacttat gtagaatgat ttttatctat atactttgtc cataaaatta 2640
taattgttta tgtaatttta ttgtttctta tggaaacaat tggaaaagta tatggaaaat 2700
gattatttca aagaatattt atttaaagag ggaagtgtag acttcttact gtaaaatatg 2760
tgattccagg cttaagaaat tgattatatt ttaaaataat tattttttta aaaacgtaat 2820
ttgtttttaa aagatgagtc tccattcatt ggctaatcca tacagcaaat atttgagtgt 2880
ttgtgatatg gcagtaaaaa tgtgattact ttgtatatac attaaccaaa accagtgaag 2940
tttgatggac tgtgcataga gttttgcagc ttttgagtag tgtgacagag tttgcctctt 3000
aaaattgttt tgctaataag tcagaagttt aaaatgtgtt atagtttgct aaaaaaaaat 3060
caaattaact gcatataaaa tggttcactt ttatatagtc acatgtaatg ggcctgaaaa 3120
agtttcttct ttgattatgt agttactcta gatacattct tttagggaag tgtatggtca 3180
acatatattt actcagtata cagataacca caaagttgtt atttttaacc aaaatataca 3240
tttcataatg ttggcactgg agtattataa gagatcatga atgtttcctt aattatcatg 3300
gcaagattac ctcacgttca gtatagttta gttttgtgtg tatcttacag tatgcatgtt 3360
ctgaaattat ttgtgatcct gatatgtcac atataatagc tttgttacct ggagtatttg 3420
attaacctaa acagtttaag cattttgaat tagttggagt ttaaatggat tacatttggt 3480
gtatattgtc ttcattgaaa agatattgtt ggatatgcca catcagagtt agcattgact 3540
tataaataaa taccagaatt taccagagta cacttttctc ttcagatgac tcaattatta 3600
aataaaagaa tatttcttat ttctgggtca atataaggta ctgacttctg atgcataatc 3660
acttaagcta tgtgagttta aactggtatc ttttcttagt ggtacccatt caatgtaagc 3720
tggtccatgg gaatggacat gaagaggatt tcacagtatg tagagcagaa ggcacgtgaa 3780
tgtgtttgct ttggcttgga gcttattaag ttttgactac ggttaaaata agtcaaatag 3840
taagtggtaa aacacatttt tgttagtatt ggaactttct ggagaacata agggctatga 3900
gaatgcatat atatattttt taacatttcc tatatatcta aggtaccaaa gcactgagtc 3960
taatttacct attaagggag actctttaaa atcaacttta taactaattc atactataag 4020
acagataata gctaaagttt tggaataatt tatattaaaa gccgcaagtc ttaaaaatcc 4080
ctggatatga cataaaaagg attttggctt cttttttgaa gtatttaaaa ttaatcacct 4140
tagctctacc atatactaga tctgtgaccg ctacacaaat tgtttatcat ctttgggtct 4200
ctattgcctt ctttataaaa taagtgtaag ttgttcagcc tgcctcacag ggctgttgtg 4260
aggaaataaa atgaaatgga gtatgtgaaa ttgcttcagc aacagcaaag tgctacgtaa 4320
atgtaaagtg ttgtttttag ctaataatgg atttaagtgt ttggataatt gtagatgcat 4380
ttactttgat aaagcgtgtg cttaaagtgg tatcaccagt gatttctaac atgattttaa 4440
aaaaataaaa ccccaattaa aatgttcttt aatattcatt taatttgtgc atgacttgtg 4500
gcctttttgt attttctcaa gcctattact ctagagctgt aaaagctctt gcacagcatt 4560
gttgtgtcag tgtagaatag tggcataaat aaatgaatta agctacattt ccatgcaggc 4620
atttgcactt tgaagttagg gctgcccagt gccacatgca aagagtgtat ttggtctaaa 4680
cagttctttc caaacaacca aatggctggg cagcttgttg tcacggataa atgatataaa 4740


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
G
atgtaaccac tgaacatttg acaactttgt tgcattatca tttttaaaaa aagatgaagc 4800
atttcaaaat cttgttaacc tggttatctc ttggtatctc tcctgacata tttgttttgc 4860
tttaaattgg attaaatggt ttacaggtta tctgaatcta cagatttagt atgtctatta 4920
tctggacatg attttgctat gcagttgtga taataaaaat tctaattcct caggtttggc 4980
cttttaagtt atggctgaag acctttaatg atacttatga tgcactcagt gccatacaat 5040
agtgttttaa gaagcacatg gcctcatttt ccttagaaac aagacaaagc ctttttaaaa 5100
tgtttttttt tcactttaaa atagggtatt caaagtggag taacgtgtat tttgaaatga 5160
ttttgtgtt
5169
<210> 6
<211> 7723
<212> ADN
<213> Homo sapiens
<400> 6
gtggggccgg gcggtgccgg tgcgggctgg ggcagtgcag tgagtagcgg tcttggggtg 60
tgcgatctcg ctgagcctcc tcacacggtt cgtcgtctcg ggttcgagcc cagtgggctt 120
agccactcgc catggactcc cagaaatact gctttaagga gaatgaaaac gttacagttg 180
ataaagcctg ttttctgatc tctaacatca ctattggacc agagtctatt aacttgcagc 240
aggaagctct acagaggatc atttcaactc tggcaaataa aaatgatgaa attcagaact 300
ttattgatac actacatcat acactaaaag gagttcagga aaattcgtcc .aacatactct 360
cagagttaga tgaagaattt gatagtttat actctatact ggatgaagta aaagaaagta 420
tgattaactg tatcaagcag gaacaagctc gtaaatccca agagttacag agtcagatta 480
gtcaatgtaa taatgccctg gagaactctg aagaactatt agaatttgca acaaggtcat 540
tagatataaa ggaacctgaa gaattttcaa aggctgccag acagatcaag gatagagtca 600
caatggcttc agcctttcgc ctttctttga aaccaaaggt cagtgacaac atgactcatt 660
taatggtgga tttctcacag gaaagacaga tgctgcaaac tttgaagttt ttgccagtcc 720
ccaaagctcc agagatagat ccagtagagt gtttggtggc agataactct gtaacagtgg 780
cttggagaat gccagaagaa gataataaga ttgaccattt tatactggaa cataggaaga 840
ctaattttga tggacttcca cgtgtaaagg atgagcgatg ctgggagata attgataata 900
ttaagggtac tgaatataca ctatcaggct taaaatttga ttcaaagtat atgaatttca 960
gagtgcgagc ttgtaacaag gctgtggctg gagagtattc tgatccagtg actctagaga 1020
ccaaagcact taacttcaat ttggataact cctcatccca tttgaacctg aaagttgaag 1080
atacatgtgt agagtgggat cctactggag gaaaaggtca agaaagtaaa attaaaggaa 1140
aagagaacaa gggcagtgtc catgttactt cactgaagaa acatacaaga agtggtacac 1200
catccccaaa acgaacatct gtaggctcca ggccaccagc agtaagaggc agtagagatc 1260
gttttactgg agaatcatac acagtgctgg gagacactgc tattgaaagt ggacaacatt 1320
attgggaggt caaggcccag aaggattgta aatcctacag tgtgggagta gcatacaaaa 1380
cgttggggaa atttgaccaa ttgggaaaga caaacactag ttggtgtatc catgtcaaca 1440
actggctaca aaacacattt gcagcaaagc ataataataa agtcaaagct ttggatgtta 1500
ctgttctgaa aaaataggtg tattttgtga ttttgatggg ggtcaacttt cattctatga 1560
tgcaaattct aaacagttgc tatattcctt taagacaaaa tttactcagc cagtactacc 1620
tggtttcatg gtatggtgtg gtggactttc tttgagtact gggatgcagg ttccaagtgc 1680
tgtgagaaca cttcagaaaa gtgaaaatgg aatgactggt tcagctagca gcctgaacaa 1740
tgttgttact caatagtgtc tactcagaat acgtttaccc tccgtcttga ttaggtggcc 1800
ttttctgtgc agttactaat cacaggaatt tggtagtagt gaaaatcagg tttgctgtgt 1860
tctgctttga ggcctggaat cttttatcat taaacaccta gtacgaagca tttgcaggaa 1920


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
7
cctactgtgc agtatcatag aggcaagcag ataccaagca aaaaactgat gattgaagag 1980
taaatggggg aaaaggcagt gtttaattaa cataaaaact catttttgta tttcttggat 2040
tactttgact attctaatgt ttaattacat atggtaaccc taaggcctgg ggagaaaagc 2100
ttttaaatct tgccttcttt cttctgtact ttgtcttttt aaaatctcat tactatctat 2160
tatttagttc taacacagaa gctttaaaaa tacatagtca tccaaggttt tctaaaaatt 2220
gaaatcatat gttgggaatg gtaaaaaggt tttcaaatgg tttatttttc ctcttttata 2280
aataagtttt acaaaatttt cctcttttgt ttattgacta gattgtatat aattttcttt 2340
tttccaaaat attgtgataa gaaatttcta gacacaacag cttaaaatca cccaaatttc 2400
agttctttac ctaactgcac taacaatggc aaggggggta ttctttatat gttgccttgt 2460
ttaactacag ttcttttcat tccatcactt taggtgatgg gtaagatttt tgaaagcctt 2520
atattttttg attttgttgt ctagtttaat cctaccttta atagttgtgt ttggtaaaat 2580
tcccacttga atgtgacact gataataatt atgctgattt ttagcatctc ttataggaat 2640
caaagtttat taaagttaca tagaggattg aaaaatgtat atcactcaat ttttatctaa 2700
gaaggatagg ttataaaggg aggtacctaa atactcaaat aatgtatata ttctttttca 2760
taacatatgg aatgctttaa gcaattgttt tgaaaaaaat ctgcgtatct ttgacttaat 2820
tggcacatga ctttttcaag cagccattca ttcagaggtt tgttttctct cagtcctttt 2880
gctacattca ctttcttttc aaagaaatgt taattattac aaaaattgac atagatatct 2940
ttcccaaact tggggtaaaa cccatggtta tgtggaacat aactgttctt aaaaagtcaa 3000
ttataatttg taactcacat cctttgagct aaactaaatt aaaattacag tatttaataa 3060
ttctttgggc atttttaaga ggtctgaatt tgtatttttc ttcatttttg aaactttaca 3120
tttgttgact ttttttcatt ctcatttaaa atatattgtg ctatgataac caaccttctt 3180
ccaaggagtg accattactg cctacatttg cgttgctttc tacatagaga cttgtataat 3240
agtattaata gtagctcatt ctctctaaaa atttactgcc cactgagagg atgttttgtt 3300
tccttgataa aacaaatgta aatgaggaat tttatttgaa ttggaatatt gtttttctag 3360
aggacattca tatctgcact attatctgat gacatgttgg taattttaaa gactgcaagg 3420
cagtttagag aatgaagtaa accaatagat actcttttga ttctccaaag aaatataatt 3480
ttggtttttg ttcctcagag agagtttgaa agaaattttc agatgttctg ttccctatag 3540
agggcctatt ccaggatcta aatgaatggg aatttataat tcctttcata gactcaaacc 3600
tgaaagcaga aatttttagt agttgagttg ctttaagtga attttaacaa atatgacaca 3660
gaaaaggtca gatgctgttg tataaaattt tttactagtg tgtcttatat aattctttct 3720
tctcattaat tcagtgcctt tttcctctaa gcatactctt ggtccatgcc ccatgcagtg 3780
tcaactgatg tttaagctac agagcattgt tgtagtggtg agggccctct gttgcagggg 3840
catggggaaa tgcatatatt aatcaggggc tggaggagta tacatgattc ttgtgttcat 3900
gttgtcattt gaaactcttc acataaaatt ttctaatatt catttggaaa acctctccac 3960
tggagaggtt tcatctctga gaggttttgt aataatagtg taagttcagt aaatccagtc 4020
caaattctca tcacatgtat tatttgatac taaattttca attattactt caaaataaga 4080
gtctgaggat ttcttcttac tggcgttctt aaaggtctct aaaattaaag aacaagatgt 4140
ggttttttgt ttaagacgtt tttagtttat ttgttgttaa gttaaactgg agaaagtttg 4200
tcatcctcat tttcaaactg aaaactaatc aaatatagtg cctatttagt ctcaaaataa 4260
ggtaactatt aacttgatta tactatataa tattctcaat tacatttgaa tttaaaaata 4320
ttgagctctt gattacaatt taatacattg taaaaagtat taaatccttt gaaacatctt 4380
ttgttgctta tttagttttt gtttctacag gtcaaacatg attgctttct ataaaagaaa 4440
tgcttgagag gttgactata atggatatgt cacaggtata aaacagttgt tttctaaaaa 4500
catgcattta gtatggcatt ctcttttagc aactgaattc ccaacgagtt ttattaagct 4560
ggatatcgaa atgaaggagc tgccttaagc actttagaaa aagaattttt ttacaattca 4620
ttttgactct catggctgac catgtcatta tgtctttaaa ttttggtaaa tatgtagata 4680
ccaagcatta ataactaatg cacacagaaa tttaatatac agcaattctt tgaatgttcc 4740
aggtgtacgt aaactaactg aaagtattaa ggacatgcct gtctatacat gggtttcatt 4800


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
s
gatggtatct gtatcatctt gacaaatcgt gaactgctgc tgtatggcta gactttgcct 4860
atttactctg ttatgcaaac agtaattttt ccctatgtta tgaagagaga catattggct 4920
tgctttaatt tacttattta tgaaattaaa gcatgaataa tatgtataat ttgaattttt 4980
tgtgactgat ccttggcagt ataaatgata aaagtaaatg taatggaatc ttttaattag 5040
gctaagatat gctatttcat aacttatgta gaatgatttt tatctatata ctttgtccat 5100
aaaattataa ttgtttatgt aattttattg tttcttatgg aaacaattgg aaaagtatat 516b
ggaaaatgat tatttcaaag aatatttatt taaagaggga agtgtagact tcttactgta 5220
aaatatgtga ttccaggctt aagaaattga ttatatttta aaataattat ttttttaaaa 5280
acgtaatttg tttttaaaag atgagtctcc attcattggc taatccatac agcaaatatt 5340
tgagtgtttg tgatatggca gtaaaaatgt gattactttg tatgtacatt aaccaaaacc 5400
agtgaagttt gatggactgt gcatagagtt ttgcagcttt tgagtagtgt gacagagttt 5460
gcctcttaaa attgttttgc taataagtca gaagtttaaa atgtgttata gtttgctaaa 5520
aaaaaatcaa attaactgca tataaaatgg ttcactttta tatagtcaca tgtaatgggc 5580
ctgaaaaagt ttcttctttg attatgtagt tactctagat acattctttt agggaagtgt 5640
atggtcaaca tatatttact cagtatacag ataaccacaa agttgttatt tttaaccaaa 5700
atatacattt cataatgttg gcactggagt attataagag atcatgaatg tttccttaat 5760
tatcatggca agattacctc acgttcagta tagtttagtt ttgtgtgtat cttacagtat 5820
gcatgttctg aaattatttg tgatcctgat atgtcacata taatagcttt gttacctgga 5880
gtatttgatt aacctaaaca gtttaagcat tttgaattag ttggagttta aatggattac 594'0
atttggtgta tattgtcttc attgaaaaga tattgttgga tatgccacat cagagttagc 600D
attgacttat aaataaatac cagaatttac cagagtacac ttttctcttc agatgactca 6060
attattaaat aaaagaatat ttcttatttc tgggtcaata taaggtactg acttctgatg 6120
cataatcact.taagctatgt gagtttaaac tggtatcttt tcttâgtggt acccattcaa 6180
tgtaagctgg tccatgggaa tggacatgaa gaggatttca cagtatgtag agcagaaggc 6240
acgtgaatgt gtttgctttg gcttggagct tattaagttt tgactacggt taaaataagt 6300
caaatagtaa gtggtaaaac acatttttgt tagtattgga actttctgga gaacataagg 6360
gctatgagaa tgcatatata tattttttaa catttcctat atatctaagg taccaaagca 6420
ctgagtctaa tttacctatt aagggagact ctttaaaatc aactttataa ctaattcata 6480
ctataagaca gataatagct aaagttttgg aataatttat attaaaagcc gcaagtctta 6540
aaaatccctg gatatgacat aaaaaggatt ttggcttctt ttttgaagta tttaaaatta 6600
atcaccttag ctctaccata tactagatct gtgaccgcta cacaaattgt ttatcatctt 6660
tgggtctcta ttgccttctt tataaaataa gtgtaagttg ttcagcctgc ctcacagggc 6720
tgttgtgagg aaataaaatg aaatggagta tgtgaaattg cttcagcaac agcaaagtgc 6780
tacgtaaatg taaagtgttg tttttagcta ataatggatt taagtgtttg gataattgta 6840
gatgcattta ctttgataaa gcgtgtgctt aaagtggtat caccagtgat ttctaacatg 6900
attttaaaaa aataaaaccc caattaaaat gttctttaat attcatttaa tttgtgcatg 6960
acttgtggcc tttttgtatt ttctcaagcc tattactcta gagctgtaaa agctcttgca 7020
cagcattgtt gtgtcagtgt agaatagtgg cataaataaa tgaattaagc tacatttcca 7080
tgcaggcatt tgcactttga agttagggct gcccagtgcc acatgcaaag agtgtatttg 7140
gtctaaacag ttctttccaa acaaccaaat ggctgggcag cttgttgtca cggataaatg 7200
atataaaatg taaccactga acatttgaca actttgttgc attatcattt ttaaaaaaag 7260
atgaagcatt tcaaaatctt gttaacctgg ttatctcttg gtatctctcc tgacatattt 7320
gttttgcttt aaattggatt aaatggttta caggttatct gaatctacag atttagtatg 7380
tctattatct ggacatgatt ttgctatgca gttgtgataa taaaaattct aattcctcag 7440
gtttggcctt ttaagttatg gctgaagacc tttaatgata cttatgatgc actcagtgcc 7500
atacaatagt gttttaagaa gcacatggcc tcattttcct tagaaacaag acaaagcctt 7560
tttaaaatgt ttttttttca ctttaaaata gggtattcaa agtggagtaa cgtgtatttt 7620
gaaatgattt tgtgttctat atagaatgtc ccagttaaga ttttacagaa gcacctggaa 7680


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
9
tatctcatta aaaatttaaa aactcttaaa aaaaaaaaaa aaa 7723
<210> 7
<211> 1046
<212> ADN -
<213> Homo sapiens
<400> 7
ccttcagtgc tcagaggagc agacacagtt gctcactctc cactcaaagt tggtccaggc 60
cttgtgctaa ttaaaggagg aagcactgct gtagcgcaga aggaaaaggc cagtcctcca 120
cctgttcagc atgataatgc agctcccctg tggtaagggt tggtcggact acaatatctt 180
tgtgactttg atgaaagcat ctgcagttat aatgtggcaa agaaaaggat aattccagaa 240
tttcccattt ccatcatttg agcttgaaat atctgaatag atatttacaa aaccttgtga 300
agaagtcacc ttatttctca tgtttctaat gaacatatat aaacttctca tttccagctc 360
taggataagc aaacagcaaa aaattaccaa tgaaaagtta ggagttcaaa agaagtagtc 420
tgaactagat agattagatg tcatcctgtg aaataggttt accacatgat agggaagaac 48D
tttcaaacag tacagggtct attttcagtt attcactatg aaatgagaac atttcacagt 540
tgttaaaggt tgctttcaga agaaaagccc aactgatgaa tgtttttaaa aatgcactat 600
tgagagcgaa caacagactg gatgccataa ttttatagtc aagtttggga caagttttaa 660
gaaactgtgt tacaattcag agaaaagaca gttggtgagc atattaagag atatagggaa 72D
cagatttaga tgatccaata tgcttattat cagaattcca gaaaaaggca ,tgaaatcata 780
aagaagacag aataccaggc aaaattaatg aaaaaatatt aatccaaaca catataataa 840
aaagtatcaa tttcaagaat aaaagaatta tataagcatt taacacacat aaacattggt 9D0
tacctgtaaa aggtgaaaaa aaaaaacagg ttcagatttt ctgcttaaat atcaaagggc 960
aaatggaaca tttttacgat cacctaaaat tcttgaaata ggccaagatt tttcatatac 1020
aaaggcaaca gccttcttgc cacaac 1046
<210> 8
<211> 280
<212> ADN
<213> Homo sapiens
<400> 8
gggagaggag gcagaggcca gatcctgaaa aactcttcag tggtggactg aggtgcctgg 60
acttcagagg cgacaggagg gtagtgaggt ttctggagca ggctggtcaa agtcagcagc 120
acccttgttt gatatccatc ccattccctc accccacatc tacctgggac ttgcttctct 180
gaccctcctg ctgtggcaag atcctgattg tcccaggtgc acatggctct acttcctgac 240
tgctcatcct cacgcagtcc tcagccctct atgacccccc 2gD
<210> 9
<211> 479
<212> ADN
<213> Homo sapiens
<400> 9


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
aaatcaagaa catcattctc tcggtatctt tatggagcaa aatgtttatg gtagagacag 60
gtgaccttgc agctagccta accacattct ccaagtgtta attagatggt gcaatattca 120
catagaccta gagtccactg actatgaaag gctctgacct ttttgcggct tctttaccag 180
gagtgtataa tcttcctagt tcctaaatct ttctaagaga acctgactac ctccaggtct 240
agagggagca gccccttcac tatataacca atttccctga ctgcacatat ggtaattcca 300
tctatggtga ataatgaatc cattctaggc caaatagata ctcttatgca gagcccagct 360
gggacagtca cgtgcaagga gaaaagagaa agccagactg cagacatagc taatgcaaag 420
gcacggagat acagactaca caaactagaa gaaacgtaga gtaagctgct ttgtctctt 479
<210> 10
<211> 2599
<212> ADN
<213> Homo sapiens
<400> 10
gaaatccagg ggaccaatgc attttatcac taaaactatt tttatataat tttaagaata 60
taccaaaagt tgtctgattt aaagttgtaa tacatgattt ctcactttca tgtaaggtta 120
tccacttttg ctgaagatat tttttattga atcaaagatt gagttacaat tatacttttc 180
ttacctaagt ggataaaatg tacttttgat gaatcaggga atttttttaa agttggagtt 240
tagttctaaa ttgactttac gtattactgc agttaattcc ttttttggct agggatggtt 300
tgataaacca caattggctg atattgaaaa tgaaagaaac ttaaaaggtg ggatggatca 360
tgattactgt cgataactgc agataaattt gattagagta ataattttgt catttaaaaa 420
cacagttgtt tatactgccc atcctaggat gctcaccttc caagattcaa cgtggctaaa 480
acatcttctg gtaaattgtg cgtccatatt cattttgtca gtagccagga gaaatgggga 540
tgggggaaat acgacttagt gaggcataga catccctggt ccatcctttc tgtctccagc 600
tgtttcttgg aacctgctct cctgcttgct ggtccctgac gcagagaccg ttgcctcccc 660
cacagccgtt tgactgaagg ctgctctgga gacctagagt aaaacggctg atggaagttg 720
tgggacccac ttccatttcc ttcagtcatt agaggtggaa gggaggggtc tccaagtttg 780
gagattgagc agatgaggct tgggatgccc ctgctttgac ttcagccatg gatgaggagt 840
gggatggcag caaggtggct cctgtggcag tggagttgtg ccagaaacag tggccagttg 900
tatcgcctat aagacagggt aaggtctgaa gagctgagcc tgtaattctg ctgtaataat 960
gatagtgctc aagaagtgcc ttgagttggt gtacagtgcc atggccatca agaatcccag 1020
atttcaggtt ttattacaaa atgtaagtgg tcacttggcg attttgtagt acatgcatga 1080
gttacctttt ttctctatgt ctgagaactg tcagattaaa acaagatggc aaagagatcg 1140
ttagagtgca caacaaaatc actatcccat tagacacatc atcaaaagct tatttttatt 1200
cttgcactgg aagaatcgta agtcaactgt ttcttgacca tggcagtgtt ctggctccaa 1260
atggtagtga ttccaaataa tggttctgtt aacactttgg cagaaaatgc cagctcagat 1320
attttgagat actaaggatt atctttggac atgtactgca gcttcttgtc tctgttttgg 1380
attactggaa tacccatggg ccctctcaag agtgctggac ttctaggaca ttaagatgat 1440
tgtcagtaca ttaaactttt caatcccatt atgcaatctt gtttgtaaat gtaaacttct 1500
aaaaatatgg ttaataacat tcaacctgtt tattacaact taaaaggaac ttcagtgaat 1560
ttgtttttat tttttaacaa gatttgtgaa ctgaatatca tgaaccatgt tttgataccc 1620
ctttttcacg ttgtgccaac ggaatagggt gtttgatatt tcttcatatg ttaaggagat 1680
gcttcaaaat gtcaattgct ttaaacttaa attacctctc aagagaccaa ggtacattta 1740
cctcattgtg tatataatgt ttaatatttg tcagagcatt ctccaggttt gcagttttat 1800
ttctataaag tatgggtatt atgttgctca gttactcaaa tggtactgta ttgtttatat 1860
ttgtacccca aataacatcg tctgtacttt ctgttttctg tattgtattt gtgcaggatt 1920


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
II
ctttaggctt tatcagtgta atctctgcct tttaagatat gtacagaaaa tgtccatata 1980
aatttccatt gaagtcgaat gatactgaga agcctgtaaa gaggagaaaa aaacataagc 2040
tgtgtttccc cataagtttt tttaaattgt atattgtatt tgtagtaata ttccaaaaga 2100
atgtaaatag gaaatagaag agtgatgctt atgttaagtc ctaacactac agtagaagaa 2160
tggaagcagt gcaaataaat tacatttttc ccaagtgcca gtggcatatt ttaaaataaa 2220
gtgtatacgt tggaâtgagt catgccatat gtagttgctg tagatggcaa ctagaacctt 228'0
tgagttacaa gagtctttag aagttttcta accctgccta gtgcaagtta caatattata 2340
gcgtgttcgg ggagtgccct cctgtctgca ggtgtgtctc tgtgcctggg ggcttttctc 2400
cacatgctta ggggtgtggg tcttccattg gggcatgatg gacctgtcta caggtgatct 2460
ctgttgcctt tgggtcagca catttgttag tctcctgggg gtgaaaactt ggcttacaag 2520
agaactggaa aaatgatgag atgtggtccc caaacccttg attgactctg gggaggggct 2580
ttgtgaatag gattgctct 2599
<210> 11
<211> 222
<212> ADN
<213> Homo sapiens
<400> 11
gtaggagaga agtatggcta cctttcactt ccaaagccaa tggtaagtag aagaattatg 60
tacattgcag aatgttttta ttcagaattc aaattatgct cttgttgcct gttgctgctc 120
ccctctacca caaataattg acatgacaga aaaaagttag gatattaatg ttgacttcag 180
agttgttatt ctgggtagca atctagttgt ggcttacact ct 222
<210> 12
<211> 3422
<212> ADN
<213> Homo sapiens
<400> 12
gaagtcactg ataattataa ttagtttaaa tttattctta cactacttaa gaaaaatttc 60
atttagaaaa ggctaccatg agatcttttg actatatgga gtagactgca tacagatctc 120
tttatttcta ttatgaatat tttagcgatt ataatcagct attccactga gtattagatt 180
tggtcactaa gtaactcatg tttttcttta gtcaatcatt cattcattca ctaaaacatt 240
tgttgagagt tggctaaact ctagattctg tgccaggcac tgtacagggt gatggagatc 300
actcataaga aggcctcttg ctcttagcca gatcatatgt aatactaaat ttaaattttt 360
tgcattaaaa ggctaaaaaa tcatttgttt ttgttaatta tatactggtt gatttataga 420
tgtaattagc acatattcat aagagacaaa tatatacaat gagttactat acatatacaa 480
agtgatttta gctgtataaa gtgatattgc aaaaaactac agctaatgtt tcttgctggg 540
taattattag cataaatatc aggttcttag aggtctttaa gagaatactt tagagctacc 600
aaaattagca gcagtgatgt aatatcaccc tgaaatacca ggagcagagg tgccccagag 660
tgcttcacag ctatgatcag gaaacttgac ctgccccatt gctacagcaa cggcataagg 720
actaggaagg tccactagct ggggaggtct tggaaccctc cgagcc~gaa agaagcattc 780
cagcatgatt cctcagatgc aatgaggaag gtttacagaa ttttcacagg gcaacagaga 840
tcaagtggta tgaaaaggta ggagttttaa gctcaagtct caaagataac ctacctttac 900
attctcagtc agaatttgac ccagaaagag gaagtttctt caggaacaga ccgtacgttg 960


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
12
atgaagtaga agtcatttca gtaaaaacgg agtacagaac ttggtcataa tatcttgcat 1020
tttatagatt tattaaagat tagtttcaag ttcacattcg ctattcagtt gtaaaccgaa 1080
tggatgggag gggagaaaat acaagctctc cacacaggta tgctcctctc ttttctgaga 1140
gagaaggcat gggattttca gcataaattc catgttatgt gagtgctgtt tgagttctga 1200
agttcctatc aatatctgtt cctgcaagtg atctctgtaa gaccacctta catgctggtc 1260
ttagttattg ttaaaattgc aaggtttctt cacaccctct ttgataagaa gtgtttagct 1320
ggcagagctt tcccttgact tctgagtcta gtgtgggttg gcccatgaca gtgggaagaa 1380
atccaacatg ttacatggag accttgtatg taaacaaact ctgtagcctt tgaaagtgga 1440
actgcttttt acagttaaag ggctgctaaa tggcttgcag atgagatctt ctggctcacc 1500
ttgatcttca catgaaccca ttgtgaccta tctggatttc ctagga~ctg tagtttccat 1560
ttgggttata ttagtgcctc aggaatgtgt cactactggt caagcaatac tcagaaattc 1620
aggctgtgag gggttagatt agaggaaagt aatttaggtg agctatccag agctttcaac 1680
ctcagggttt ataggaaaaa aaaacaaaat acaaaaaccc ttaggacttc tcatactcta 1740
gccctgacct tgcagtctcc tctgaggggc ctcctaagac ccttaaaata atattacaat 1800
aggactttga gtgtgcattt cacatgtgga aatacctctg gctagcatta cttccaaatg 1860
ctagttccag ctaaaaacaa gtacttttta ttagtttctt gtctttcaac attctgccat 1920
caaaatatat tcattttatt aacttaccga ttattgggaa cctgcaaaaa aaaaaaaaaa 1980
aacacacatg ctgtctgcag ccactgtttg gttatttttg atagtttaag agaattataa 2040
atcaagttgt tctgtctact agagtcagaa attctgtgct agaatgggac ttctaaaatt 2100
aggtggtcct gtcactttct agagaaagac ccaaattcat aggtttaagt ggcttgtctg 2160
acatacacat acagccagtt agtaacagaa ttcagaatag aatagagttc ttttttttct 2220
gtcagtccgt tgttctactt ctctttcctt ttcttcatgg ttgagcagct tttggcaaaa 2280
tgtgttccat atagcagtag ttccaagaga tgttaataga tgtaagaaaa aaagtgtgtg 2340
tgtgttgggg gtgggggatt gcatggtcaa ttaaaatgaa ggaatgctga gtttgtttcc 2400
ttactgtagg acttctaaga gttttgaaca tgctattaca cattgtgaat ttataaaagg 2460
ggacaaacac tgtttgacct tagactgcac tccccttctt tattcctcag agcatctcaa 2520
aggactacag ggtcctttga gaaacatggc ccttgatcaa gtttacaact ctttgagaag 2580
acatccctaa tggaaatact gaatggcaga tctattactg tggtaccatg tagtgtgtaa 2640
taaatcttga agtccagaaa gcaagtatat ttgctgttta gagctatact taaggtatag 2700
agattctttt ccacctgtgg tgtgtaaaat cagtattgtg tttaattttg caggtttttc 2760
aaggatcaac taatgtgcaa atacagtggt gatatattga tattacâttt taataatgct 2820
tttgtatggc actttatagt tttcagacac cttttgtaac agccctgtga gacagacaat 2880
attatcctta ttgtacagat gggggggctc tggaggctct gaaaagtttt tggtgatatt 2940
cccctaagtt tataccacaa aatgatggag ccagaattta gttgcagaac ttctgactcc 3000
aagtccagag ttctttacta gacatctggt ttcttactag ctttttgcta gctttttatt 3060
ttacagtgaa aagtatggaa gcaaatcctg ataattttgg cttattatca aatatcattt 3120
attttttatt gcagagaccc agcagatgta actctcattg tagccatccc aaagaaaacc 3180
cttctttgcc ctttgcagtg ccacttattt aggtaactga agtgtatttc cagtacaatt 3240
tgattttgaa ctaagatttg atatagagtt gtaattgctt acataactct ttgaaaatgt 3300
atcatccctg ggttctcagg tgaaggaggc aattcaaaag taaaaaagaa tattcgaata 3360
caataaatac cctctgttct cacacaaatg ctgtttctta gctaacttgc tttgacaacc 3420
ta
3422
<210> 13
<211> 5791
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
13
<400> 13
ctaatattat tggccagtct gtggaagaag ctatcagagg ggtgtttgat gcttccctca 60
aaatggctgg cttctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 120
ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 180
actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 240
ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 300
ctgacatatc aggaggtggc catccttacc tgacaggctt ggcagtggcc ggtggagcat 360
actacctagg cctggaagga gcaatcatcg gtcctattct tctctgcata cttgtggttg 420
cttccaatat ctatagtgcc atgctagtga gtcccacgaa ttcagttccc acgccaaacc 480
agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 540
cttcagtagg ttgatgtggt ttcctctgca gtgatttttc taggaagttc aaatttgaca 600
gcgagttcag ctcagctgtg gccntctgcc cttccagctg tgcctagcaa gcaaaaccca 660
ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc 720
tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcac 780
ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 840
atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 900
ctctaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 960
tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1020
tgtagttgag tgagcaggaa aaatgaatct tctacccttc tcccacaatg tattatacgc 1080
tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttt 1140
tatattataa ccctgggaga tacaaagact gaagctcttc ctcctcttcc ttttctcttc 1200
acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaatac 1260
ttattaagct gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1320
ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 1380
atccgtttca ttatttggaa ctctgccaat aagttagttt tcagcagaat tttgtattta 1440
tgtagtattt tcccatctct tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1500
tgaattgaat tgcagcttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1560
cattttacaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1620
agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1680
accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1740
gcagattctg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttang 1800
agattggtgt tgctatccat ttgttgtgaa tgaagacttg tcctatagta catgacaggg 1860
ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1920
ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 1980
gtggctcaca tctgtaatcc cagcactttg gaaggctgag gtgggtggat tgcttgagcc 2040
cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2100
aaaaaaaaaa aaattagctg ggcacggtgg tgtggctata gtctgagcta ctcaggaggc 2160
tgatgtatga ggatcacctg agtccaggag gtcgaggctg cagtgagcca agatggcgcc 2220
actgcactcc agcctgggtg agagagtgag acactgtccc aaggaaaaaa aaaagtgttg 2280
gggggtagtt cttaagcgtt gaagatttcc tttttggaaa gtatttaaag gtagaaatat 2340
taataatttt tcctaaaaca tctccctaag aagtcactga taattataat tagtttaaat 2400
ttattcttac actacttaag aaaaatttca tttagaaaag gctaccatga gatcttttga 2460
ctatatggag tagactgcat acagatctct ttatttctat tatgaatatt ttagcgatta 2520
taatcagcta ttccactgag tattagattt ggtcactaag taactcatgt ttttctttag 2580
tcaatcattc attcattcac taaaacattt gttgagagtt ggctaaactc tagattctgt 2640
gccaggcact gtacagggtg atggagatca ctcataagaa ggcctcttgc tcttagccag 2700
atcatatgta atactaaatt taaatttttt gcattaaaag gctaaaaaat catttgtttt 2760


CA 02371500 2001-10-24
WO 00/71710 PCTlFR00lOla2G
ia
tgttaattat atactggttg atttatagat gtaattagca catattcata agagacaaat 2820
atatacaatg agttactata catatacaaa gtgattttag ctgtataaag tgatattgca 2880
aaaaactaca gctaatgttt cttgctgggt aattattagc ataaatatca ggttcttaga 2940
ggtctttaag agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct 3000
gaaataccag gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc 3060
tgccccattg ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt 3120
ggaaccctcc gagccagaaa gaagcattcc agcatgattc ctcagatgca atgaggaagg 3180
tttacagaat tttcacaggg caacagagat caagtggtat gaaaaggtag gagttttaag 3240
ctcaagtctc aaagataacc tacctttaca ttctcagtca gaatttgacc cagaaagagg 3300
aagtttcttc aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga 3360
gtacagaact tggtcataat atcttgcatt ttatagattt attaaagatt agtttcaagt 3420
tcacattcgc tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc 3480
acacaggtat gctcctctct tttctgagag agaaggcatg ggattttcag cataaattcc 3540
atgttatgtg agtgctgttt gagttctgaa gttcctatca atatctgttc ctgcaagtga 3600
tctctgtaag accaccttac atgctggtct tagttattgt taaaattgca aggtttcttc 3660
acaccctctt tgataagaag tgtttagctg gcagagcttt cccttgactt ctgagtctag 3720
tgtgggttgg cccatgacag tgggaagaaa tccaaca.tgt tacatggaga ccttgtatgt 3780
aaacaaactc tgtagccttt gaaagtggaa ctgcttttta cagttaaagg gctgctaaat 3840
ggcttgcaga tgagatcttc tggctcacct tgatcttcac atgaacccat tgtgacctat 3900
ctggatttcc taggacctgt agtttccatt tgggttatat tagtgcctca ggaatgtgtc 3960
actactggtc aagcaatact cagaaattca ggctgtgagg ggttagatta gaggaaagta 4020
atttaggtga gctatccaga gctttcaacc tcagggttta taggaaaaaa aaacaaaata 4080
caaaaaccct taggacttct catactctag ccctgacctt gcagtctcct ctgaggggcc 4140
tcctaagacc cttaaaataa tattacaata ggactttgag tgtgcatttc acatgtggaa 4200
atacctctgg ctagcattac ttccaaatgc tagttccagc taaaaacaag tactttttat 4260
tagtttcttg tctttcaaca ttctgccatc aaaatatatt cattttatta acttaccgat 4320
tattgggaac ctgcaaaaaa aaaaaaaaaa acacacatgc tgtctgcagc cactgtttgg 4380
ttatttttga tagtttaaga gaattataaa tcaagttgtt ctgtctacta gagtcagaaa 4440
ttctgtgcta gaatgggact tctaaaatta ggtggtcctg tcactttcta gagaaagacc 4500
caaattcata ggtttaagtg gcttgtctga catacacata cagccagtta gtaacagaat 4560
tcagaataga atagagttct tttttttctg tcagtccgtt gttctacttc tctttccttt 4620
tcttcatggt tgagcagctt ttggcaaaat gtgttccata tagcagtagt tccaagagat 4680
gttaatagat gtaagaaaaa aagtgtgtgt gtgttggggg tgggggattg catggtcaat 4740
taaaatgaag gaatgctgag tttgtttcct tactgtagga cttctaagag ttttgaacat 4800
gctattacac attgtgaatt tataaaaggg gacaaacact gtttgacctt agactgcact 4860
ccccttcttt attcctcaga gcatctcaaa ggactacagg gtcctttgag aaacatggcc 4920
cttgatcaag tttacaactc tttgagaaga catccctaat ggaaatactg aatggcagat 4980
ctattactgt ggtaccatgt agtgtgtaat aaatcttgaa gtccagaaag caagtatatt 5040
tgctgtttag agctatactt aaggtataga gattcttttc cacctgtggt gtgtaaaatc 5100
agtattgtgt ttaattttgc aggtttttca aggatcaact aatgtgcaaa tacagtggtg 5160
atatattgat attacatttt aataatgctt ttgtatggca ctttatagtt ttcagacacc 5220
ttttgtaaca gccctgtgag acagacaata ttatccttat tgtacagatg ggggggctct 5280
ggaggctctg aaaagttttt ggtgatattc ccctaagttt ataccacaaa atgatggagc 5340
cagaatttag ttgcagaact tctgactcca agtccagagt tctttactag acatctggtt 5400
tcttactagc tttttgctag ctttttattt tacagtgaaa agtatggaag caaatcctga 5460
taattttggc ttattatcaa atatcattta ttttttattg cagagaccca gcagatgtaa 5520
ctctcattgt agccatccca aagaaaaccc ttctttgccc tttgcagtgc cacttattta 5580
ggtaactgaa gtgtatttcc agtacaattt gattttgaac taagatttga tatagagttg 5640


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
taattgctta cataactctt tgaaaatgta tcatccctgg gttctcaggt gaaggaggca 5700
attcaaaagt aaaaaagaat attcgaatac aataaatacc ctctgttctc acacaaatgc 5760
tgtttcttag ctaacttgct ttgacaacct a 5791
<210> 14
<211> 2615
<212> ADN
<213> Homo sapiens
<400> 14
acccaaactt caaaactggt caataattaa caatgtatta attttgaaaa gtttttaact 60
gtaagagtat caaatataat acagagctct taaatactta aagctttctg tcacaatatt 120
aaaaataaaa cttcttagca ttccaagact atgaaaagtg ccccctccca attttttaag 180
caagtaatag tatctgctgg tgtttatatt tgttaaaaat ttaaaataac aacaacaaaa 240
aaaaaacttc taacttgaat gtgatgtgac ttgagtactt ctaaaccatc gaaaatacct 300
gatacgggga gtaggttcat ggttttggta aaagaaacta tgtcacagag ttttaatatt 360
ataactggac ttctaaatca taaagtaaga aaattaacat catttagtat cttttcttgt 420
ttgtttttta ttttgctaag aaggaaccag attttatatc atcattcttc atctaaatgg 480
actgccatat gaagttctgg tttctctgtt tcttcttggt tagctggtta ctaccaaatg 540
cctaaggaca attctcagag catttccaca tgaaggtgat tagttttcat ttaataaaat 600
taataacaca ttacatgtag atgaaaatat aacaaaacca tacgaaagct tgtcagagat 660
attcaactag aaaactaaaa cagtagccac tagaaaaaag acatagtgga aaaatttttg 720
aacggatatg ctttttgttg aataattaca gtaattacta ccaatatatt cagaccaaca 780
aagattagaa agaacatgca aaatgctgag aaaatttctc ctacaattaa aacaaatgtg 840
tttttatgag agagaaaaaa ataagtcaag ctcctaaaat gaaaattaca aaacatagga 900
ttaacaattt attaaaaatt acacccttga tttttttgag gccaaaaaaa gtagtttttt 960
taaaacaagg gcatgaaaaa gacttcagat taagactcat actctgttct aaatgaaaag 1020
tagtaaaact acttctagta gaaaatacct gctatggaaa aaaaatttca gatattttcc 1080
atttgatgta ggtattaata aaaaatatga tgtttatatc taaaatataa actagcaatt 1140
tattttcatt tataatataa agtgttttag gaaaagttta ctcttctcag tgttcaaaat 1200
aaaataggaa ttgttctcca tacctagcaa ttttaatgat aatgtcaagt aaaaatttaa 1260
ttctgctgaa ctaaagctca aatagattca aattttaaaa atatgaaaaa tctacatttt 1320
taaaagctta aaatttttgt tactttgcaa tgacagatct gctttttcta acatttaaaa 1380
aattttgtct tcttttatta atataaaact attcaaataa tcacaacaga atctcttata 1440
ccggtaaagc ataatcacat gatacactcg taacactcta caaatacaat ccagaaaggg 1500
gaagtctccc tcaaacaaag aatttctttc tttctgtcac ctccattcca tatatatagt 1560
cttcatttca catcacatac atagaaaaat tagcacaata taacaggtag ataagaaaaa 1620
aaatttttgg ccttgtagag ctcatcacgt aaatttattc attcttctta gtatgtttct 1680
ttttaacatt atctgaggca acatctaccg gctttgaggc caatgaccca acgccattgg 1740
aaggtgactt tgcttcactt ttcttctcac atgatgaaaa cggctgctgc cagccaaata 1800
gcatccaact caatgtatcc tcaaaaggag caaatgtcat agtagaagtc tgtgtagtca 1860
tcatggttat ctttgtggcc acaataaaga tggtataaag gaacataaga ttatgctttg 1920
atattgccag atgctgggtg tgctggaatg tgaagataac tgaccccagc agggttacct 1980
tggcagggta tgacatcttc agccattcat caccttctgg tttccaatct ccttttacca 2040
acctctcaaa attcgttata atggtaccac ctgcacctcg ggcccatcca atagctatca 2100
tgactatcca gccatttttg taatagctat tagcatgtgt gactccacct actattttcc 2160
aagttctggt cacttccttc attcccgaag ccagtagttg aacaggtaga tatgaatagc 2220


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
IG
cctgggaaac taggtcatgc gggcaaaaaa atgtaatata ccagattgaa gatgccagta 2280
atatgttagt gtggtttgca agaaacttca atggaggctc tgcaagcagt agacaggata 2340
aaattcctcc accaaaacag tggagcatag cagtaaacca gcttgaaata ggattcttcc 2400
atgccaatgc agctgctccc ggctgacgtt tcaccgccat cactgacact agatagtgcg 2460
cgatgtcaaa aaagggaaac atggacgtgc gggagaaggc cagagccaac tcgtcccatg 2520
gagaatccat aacgaccacc gaccgcggca accgaagcag ccgcggctac tggttccccg 2580
cgctcgcgcg gtgaggagta ggagagggca cagcc 2615
<210> 15
<211> 2551
<212> ADN
<213> Homo sapiens
<400> 15
ggctgtgccc tctcctactc ctcaccgcgc gagcgcgggg aaccagtagc cgcggctgct 60
tcggttgccg cggtcggtgg tcgttatgga ttctccatgg gacgagttgg ctctggcctt 120
ctcccgcacg tccatgtttc ccttttttga catcgcgcac tatctagtgt cagtgatggc 180
ggtgaaacgt cagccgggag cagctgcatt ggcatggaag aatcctattt caagctggtt 240
tactgctatg ctccactgtt ttggtggagg aattttatcc tgtctactgc ttgcagagcc 300
tccattgaag tttcttgcaa accacactaa catattactg gcatcttcaa tctggtatat 360
tacatttttt tgcccgcatg acctagtttc ccagggctat tcatatctac ctgttcaact 420
actggcttcg ggaatgaagg aagtgaccag aacttggaaa atagtaggtg gagtcacaca 480
tgctaatagc tattacaaaa atggctggat agtcatgata gctattggat gggcccgagg 540
tgcaggtggt accattataa cgaattttga gaggttggta aaaggagatt ggaaaccaga 600
aggtgatgaa tggctgaaga tgtcataccc tgccaaggta accctgctgg ggtcagttat 660
cttcacattc cagcacaccc agcatctggc aatatcaaag cataatctta tgttccttta 720
taccatcttt attgtggcca caaagataac catgatgact acacagactt ctactatgac 780
atttgctcct tttgaggata cattgagttg gatgctattt ggctggcagc agccgttttc 840
atcatgtgag aagaaaagtg aagcaaagtc accttccaat ggcgttgggt cattggcctc 900
aaagccggta gatgttgcct cagataatgt taaaaagaaa catactaaga agaatgaata 960
aatttacgtg atgagctcta caaggccaaa aatttttttt cttatctacc tgttatattg 1020
tgctaatttt tctatgtatg tgatgtgaaa tgaagactat atatatggaa tggaggtgac 1080
agaaagaaag aaattctttg tttgagggag acttcccctt tctggattgt atttgtagag 1140
tgttacgagt gtatcatgtg attatgcttt accggtataa gagattctgt tgtgattatt 1200
tgaatagttt tatattaata aaagaagaca aaatttttta aatgttagaa aaagcagatc 1260
tgtcattgca aagtaacaaa aattttaagc ttttaaaaat gtagattttt catattttta 1320
aaatttgaat ctatttgagc tttagttcag cagaattaaa tttttacttg acattatcat 1380
taaaattgct aggtatggag aacaattcct attttatttt gaacactgag aagagtaaac 1440
ttttcctaaa acactttata ttataaatga aaataaattg ctagtttata ttttagatat 1500
aaacatcata ttttttatta atacctacat caaatggaaa atatctgaaa ttttttttcc 1560
atagcaggta ttttctacta gaagtagttt tactactttt catttagaac agagtatgag 1620
tcttaatctg aagtcttttt catgcccttg ttttaaaaaa actacttttt ttggcctcaa 1680
aaaaatcaag ggtgtaattt ttaataaatt gttaatccta tgttttgtaa ttttcatttt 1740
aggagcttga cttatttttt tctctctcat aaaaacacat ttgttttaat tgtaggagaa 1800
attttctcag cattttgcat gttctttcta atctttgttg gtctgaatat attggtagta 1860
attactgtaa ttattcaaca aaaagcatat ccgttcaaaa atttttccac tatgtctttt 1920
ttctagtggc tactgtttta gttttctagt tgaatatctc tgacaagctt tcgtatggtt 1980


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
17
ttgttatatt ttcatctaca tgtaatgtgt tattaatttt attaaatgaa aactaatcac 2040
cttcatgtgg aaatgctctg agaattgtcc ttaggcattt ggtagtaacc agctaaccaa 2100
gaagaaacag agaaaccaga acttcatatg gcagtccatt tagatgaaga atgatgatat 2160
aaaatctggt.tccttcttag caaaataaaa aacaaacaag aaaagatact aaatgatgtt 2220
aattttctta ctttatgatt tagaagtcca gttataatat taaaactctg tgacatagtt 2280
tcttttacca aaaccatgaa cctactcccc gtatcaggta ttttcgatgg tttagaagta 2340
ctcaagtcac atcacattca agttagaagt tttttttttg ttgttgttat tttaaatttt 2400
taacaaatat aaacaccagc agatactatt acttgcttaa aaaattggga gggggcactt 2460
ttcatagtct tggaatgcta agaagtttta tttttaatat tgtgacagaa agctttaagt 2520
atttaagagc tctgtattat atttgatact c 2551
<210> 16
<211> 775
<212> ADN-
<213> Homo sapiens
<400> 16
tctatccgtc cgcgtcagcg ccttgccacc ctcatctcca atatgcctgg tccgaccccc 60
agtggcacta acgtgggatc ctcagggcgc tctcccagca aagcagtggc cgcccgggcg 120
gcgggatcca ctgtccggca gaggtaagga accctgcagt tcgttcgctt ccagactcgg 180
agataggacc cagaacctcg ctgattctgg ggtggagacc ctagcatgtg aagattgaca 240
aaggcaaaat gagcttctag tgacgtggcc gtgggagtag ttaaaggcct tttgggagga 300
aggcgacatt ttttttctcg ttgctcagtt tagggcacta ctcttaaaaa aggaaagtta 360
acaaactgga atagagtcag agataacttt gagaaaaccg atgtcattaa actggtgtct 420
ctggacctga ggtttgcact cacatttcca tctggcggcc ccataagcaa tctgtcctac 480
agataactcg tcctacacaa aacttagtct cttttcagct cagctctctc actctcaatt 540
atatctcctt acttccatat ggcactgttg tacactcatt tactcagagc cagaaacgtc 600
agcgtcatct tggatttttc ttatgctctt tctctctcta gtcatatgcc agactttaaa 660
ctctgcttga aagctttctc ataagctctt tccttttccc tttctactgc tttgcatttg 720
ctacttaacc cttttcttca ggctgtttgc tttccagtcc atcgttcgct ctgct 775
<210> 17
<211> 491
<212> ADN
<213> Homo sapiens
<400> 17
ccctcctttc ccaccagaca ctcccttaca ccatgcacat ttatttaatn atgtacttaa 60
ttcaaactta acacccaggc aacacttatc ctaaactatg tgctttcctt aagaagttcc 120
cagggctaat gtggaagaga aaaccaggcc tggnagatcc agtttcaaaa atnccagaga 180
ttacctcaaa ggccgtttgt caacaacccc agctattact gagatggagg ccaccatgct 240
ccnnggtggg accacggact caaggatagc cactggaaac aaggacacag aggaccttgt- 300
gcccaggcaa cactcccgca tgcctcccat tccaaggttc cctttttang cccctctctt 360
ccagccaaag ttgnaaatgg ggtttnttta nggcactagc cttgggntat ttttacccnn 420
tgnnngctnt ggnagggaan gtcantttcc tttcactgnn tctcaccttt gttacctggc 480
tttgcaagtg g 491


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
18
<210> 18
<211> 293
<212> ADN
<213> Homo sapiens
<400> 18
caccatgcac atttatttaa ttatgtactt attcaactta caccaggcac acttatctaa 60
ctatgtgctt tcttagaagt tccagggcta atgtggagag aaaccaggcc tggagatcca 120
gtttcaaaat tccagagatt acctcaaggc cgtttgtcaa caacccagct attactgaga 180
tgaggccacc atgctccagg tggaccacga ctcaagatag ccactgaaac aagacacaga 240
gaccttgtgc ccagcaacac tcccgcatgc ctcccattcc aaggttccct ttt 293
<210> 19
<211> 2442
<212> ADN
<213> Homo sapiens
<400> 19
tatgtgggat tttagggcaa ggattttcaa cagtcaacag tactggaagc..tgaggcttca 60
gaacccaggt atggaaggca gggagtttga actatgctcc ttgcacagaa tgggaagcca 120
ggaaaatgca aatgtcaaac tatcctacag ggaagtctct ataaacctcc acagaactcc 180
cacaaaagac acacttaggg aaaaggtatg cagcccaaaa tatacaagtc tgttcaactt 240
gctccctaaa ataagggaga atgccgacac cgcaggaaaa aggagctaat ggaactaaca 300
agaactttaa agaaacacca ataaaccaag aacacgcgaa aatgacaaaa taccaaataa 360
aaatccaaaa tagaaacaaa tccaaaagaa aacaaaagtt gatgaaataa aatctcagta 420
ggaggattaa gtaaaagaat tagcaaattg aaagattttt aagagacgaa gacagaataa 480
aaagctccct atgtttaaaa ggagttttta gaagaaaata gaaacaatgg gggaagatgg 540
ttaaaaatta ataataactt tccagacttg aagaaaaaaa actgaatctt cacattacag 600
aagcacacta tgtctagggc aggataaata acaaatctac actaggacac atcctgatct 660
gcaacacact gaagataaag agagaacagt aaaaatatag attactacct gtaagattac 720
tacctacaaa ctaagagggc tcagactaac agcagatttt ttcattagtt aacactgagg 780
caaggagaca atagaacagt atcttcaagg cacagcagac agtactaaac aactcaactc 840
ggtcaaacct aactttctgg ccagcacttg tgaaatcaaa ggctccccag taatttgatt 900
agcactttca tcattttgta atcttataaa caccttctcc agtggggaag aaatagccca 960
aatgggaatt ttaggtacct aagacttcgg ctgccaactg tgcctaatat cctagtaatg 1020
ttaacctttc cagtacccag tatagaatac ccctacaact gggcatttta aacaggcaaa 1080
caagtattac acacacttaa ttttgttcat tccagccaca tgaagtcaaa ggatgtttct 1140
ctataagaaa ctacaataga tctttgaaac tttgcatgaa.gttgttttag gggccatact 1200
tcaagtgaca ggaaataaca aatagcaata cacacacatt tcattaagtg gggatcttat 1260
aaaatctcta gaaccctgag aagttccttg ctacttataa agccttttct tgacctgtca 1320
gacctaatgt ttgatgatgt ataagaaaac tatcgtcgaa tttatgttat gcataaattt 1380
tatagtatat ttaaagtgaa atacacaatt tttttctatg cacatactct tactggaaaa 1440
aatttgaatg ctgacaataa aatggctaag ttatggtaca tgcatgtaac agaatactat 1500
agagcagact gagcaaacta tggccacagg ccaaatccag cccatggtaa gtatttgtaa 1560
atagttttac tggaacacaa ttatactcat ttatttacat attatctatt gatgctttca 1620


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
19
cactaccgtg gtagtgctga gtagccatga cagagaccta atggtctgca aaacctaaaa 1680
tatttactaa etaacccttt atagaaagaa ctttgctgaa ccctggtatg gagaaataaa 1740
aacgaatgaa atacagctga atgagtcaac ttcaatcaat ctcaaaagca atgctgagag 1800
aatcaaatca caaaaaatac atgcagtata attcccatta caaaaaatcc acaaatatgc 1860
aaaacaaacc tgatactgtt cacaaatgca cataaaacca tttttttttt taaggtaatg 1920
aagttgatca acaccaagtg atctggggca gaggggtacg tagaagacat ttaactgtgc 1980
agggtacatt aacagtatat gtgctgatga tattctatat ccgaacctgg ggttggttaa 2040
atggaggttc agtttataat taccttttaa actacataaa tgttttttta tacattcagt 2100
atatgtattt tcatgtcatt taaaagttca aaaaagacca aaaaggcaca tatcaaaaca 2160
ttaacagcag gtgacagaat atttgccaac ctgttagcag gttttaaaac cttctacaat 2220
gaacttttaa tgggcacaca aataagaaca caagcataaa atacttttta aaattaaagt 2280
aaaatcttcc caactacgct aaaagctcta gcctgaatat tttatatacg agcaaaagta 2340
ctaattaaaa gcactagcat cttagaagaa tttccttaaa tccaagattt taaaattccc 2400
actctggcta gctctaatga agctcaaaac aaaatacaaa gg 2442
<210> 20
<211> 4608
<212> ADN
<213> Homo sapiens
<400> 20
ctcaaaacac actttccccc atgcccccgt cataaattca ttcttatgct aatactgcaa 60
agcctccggt accatgcttc ttaccgtgat attcttgatg atctgctgca ccaagatcgc 120
attggtcaac atatgagtcc tgaggggtgc atgctgaagc agcagtcgaa gcagctggcc 180
cacaacaggc agctcctcag gcccaactct gttcacccgc aggctctgca gcatcaacct 240
gaggactcga ggcaagagag ccaggatgga gacacagacc ccccacagct tgtccctaca 300
ataacagaga cagaaatgag tcagtgagca aatgcccaca ggaaaagccc cccttctata 360
ttcccccaaa gtgaaatgtc cttttaagga acatgttttc caataacatt taaactgaga 420
gccaaatcaa gaacgcaatc tcacttacaa tagccacaca cactaaatac ctaggaatac 480
atctaaccaa ggaggtgaaa gatctctaca agaaaaacta cagaacactg ctgagagaaa 540
tcacagatga cacagataaa tggaaaaaca ttccatgctc atgaattgga ataatcagta 600
ttgttaaaat ggccacactg ctcaaagcaa cctacagatt caactgtatt cctatcaaac 660
taccaacatc attcttcaca caattaaaaa aaaatattct aaaattcaca tggaaccaaa 720
aaagccagaa tggccaaagc aatcctaagc aaaaacaacc tgacttcaca gtacactaca 780
aggctacagt agccaaaaca gcatggtaat gatagagaac aacagacaga taaaccaatg 840
gaacagaaaa gagaacccag aaataaagcc acatacctac aactatctca tcttcaacta 900
aggtgacaaa aacaagcaac agggcaagga ttccctattc aataaatggt gctgggacaa 960
ttggctatcc ttttgtagaa gaataaaaat ggatccctat ctttcatcat atacaaaaaa 1020
ttaactcggc caggcgcggt ggctcacgcc tgtaatccca gcactttggg aggctgaggc 1080
aggtggatca cgaagtcaag aaatcaagac catcctggcc aacatggaga aaccccgtct 1140
ctactacaga tacaaaatta gccaggcatg gtggcacgcg cctgcagtcc cagctactcg 1200
ggaggctgag gcaggagaat tgcttgaatc cgggaggtgg aggttgtagt gagccgagat 1260
cacaccactg cattccagcc tggcaaaaga atgagactcc gtctcaaaaa aaaaattaac 1320
tcaagataga ttaagaattc attactaagt cctcaaaagc aattgcaaaa acaaaaaatg 1380
acaagtgggc cctaattaaa cttaagaaca agagaaacta tccacatttc aataaacatg 1440
gtgtttttca ctaacattta ggctaagagc caaatcaaga acatcattct ctcggtatct 1500
ttatggagca aaatgtttat ggtagagaca ggtgaccttg cagctagcct aaccacattc 1560


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
tccaagtgtt aattagatgg tgcaatattc acatagacct agagtccact gactatgaaa 1620
ggctctgacc tttttgcagc ttctttacca ggagtgtata âtcttcctag ttcctaaatc 1680
tttctaagag aacctgacta cctccaggtc tagagggagc agccccttca ctatataacc 1740
aatttccctg actgcacata tggtaattcc atctatggtg aataatgaat ccattctagg 1800
ccaaatagat actcttatgc agagcccagc tgggacagtc acgtgcaagg agaaaagaga 1860
aagccagact gcagacatag ctaatgcaaa ggcacggaga tacagactac acaaactaga 1920
agaaacgtag agtaagctgc tttgtctctt gctaaatttc taattcctag cccttgggtt 1980
ttacaagtta ctcctgtaat aatcaaatat tttcattttc tacttttctt aatttgagtg 2040
gatttcaaat aaccacagac cttaaaaaaa aaagacagcc aagctcaagg ccagatgggt 2100
aaaacctcta ggtgaaagaa actataatga aattcatata aagatatcca acagtcataa 2160
aaactgtatg tgggatttta gggcaaggat tttcaacagt caacagtact ggaagctgag 2220
gcttcagaac ccaggtatgg aaggcaggga gtttgaacta tgctccttgc acagaatggg 2280
aagccaggaa aatgcaaatg tcaaactatc ctacagggaa gtctctataa acctccacag 2340
aactcccaca aaagacacac ttagggaaaa ggtatgcagc ccaaaatata caagtctgtt 2400
caacttgctc cctaaaataa gggagaatgc cgacaccgca ggaaaaagga gctaatggaa 2460
ctaacaagaa ctttaaagaa acaccaataa accaagaaca cgcgaaaatg acaaaatacc 2520
aaataaaaat ccaaaataga aacaaatcca aaagaaaaca aaagttgatg aaataaaatc 2580
tcagtaggag gattaagtaa aagaattagc aaattgaaag atttttaaga gacgaagaca 2640
gaataaaaag ctccctatgt ttaaaaggag tttttagaag aaaatagaaa caatggggga 2700
agatggttaa aaattaataa taactttcca gacttgaaga aaaaaaactg aatcttcaca 2760
ttacagaagc acactatgtc tagggcagga taaataacaa atctacacta ggacacatcc 2820
tgatctgcaa cacactgaag ataaagagag aacagtaaaa atatagatta .ctacctgtaa 2880
gattactacc tacaaactaa gagggctcag actaacagca gattttttca ttagttaaca 2940
ctgaggcaag gagacaatag aacagtatct tcaaggcaca gcagacagta ctaaacaact 3000
caactcggtc aaacctaact ttctggccag cacttgtgaa atcaaaggct ccccagtaat 3060
ttgattagca ctttcatcat tttgtaatct tataaacacc ttctccagtg gggaagaaat 3120
agcccaaatg ggaattttag gtacctaaga cttcggctgc caactgtgcc taatatccta 3180
gtaatgttaa cctttccagt acccagtata gaatacccct acaactgggc attttaaaca 3240
ggcaaacaag tattacacac acttaatttt gttcattcca gccacatgaa gtcaaaggat 3300
gtttctctat aagaaactac aatagatctt tgaaactttg catgaagttg ttttaggggc 3360
catacttcaa gtgacaggaa ataacaaata gcaatacaca cacatttcat taagtgggga 3420
tcttataaaa tctctagaac cctgagaagt tccttgctac ttataaagcc ttttcttgac 3480
ctgtcagacc taatgtttga tgatgtataa gaaaactatc gtcgaattta tgttatgcat 3540
aaattttata gtatatttaa agtgaaatac acaatttttt tctatgcaca tactcttact 3600
ggaaaaaatt tgaatgctga caataaaatg gctaagttat ggtacatgca tgtaacagaa 3660
tactatagag cagactgagc aaactatggc cacaggccaa atccagccca tggtaagtat 3720
ttgtaaatag ttttactgga acacaattat actcatttat ttacatatta tctattgatg 3780
ctttcacact accgtggtag tgctgagtag ccatgacaga gacctaatgg tctgcaaaac 3840
ctaaaatatt tactaactaa ccctttatag aaagaacttt gctgaaccct ggtatggaga 3900
aataaaaacg aatgaaatac agctgaatga gtcaacttca atcaatctca aaagcaatgc 3960
tgagagaatc aaatcacaaa aaatacatgc agtataattc ccattacaaa aaatccacaa 4020
atatgcaaaa caaacctgat actgttcaca aatgcacata aaaccatttt tttttttaag 4080
gtaatgaagt tgatcaacac caagtgatct ggggcagagg ggtacgtaga agacatttaa 4140
ctgtgcaggg tacattaaca gtatatgtgc tgatgatatt ctatatccga acctggggtt 4200
ggttaaatgg aggttcagtt tataattacc ttttaaacta cataaatgtt tttttataca 4260
ttcagtatat gtattttcat gtcatttaaa agttcaaaaa agaccaaaaa ggcacatatc 4320
aaaacattaa cagcaggtga cagaatattt gccaacctgt tagcaggttt taaaaccttc 4380
tacaatgaac ttttaatggg cacacaaata agaacacaag cataaaatac tttttaaaat 4440


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
21
taaagtaaaa tcttcccaac tacgctaaaa gctctagcct gaatatttta tatacgagca 4500
aaagtactaa ttaaaagcac tagcatctta gaagaatttc cttaaatcca agattttaaa 4560
attcccactc tggctagctc taatgaagct caaaacaaaa tacaaagg 4608
<210> 21
<211> 1627
<212> ADN
<213> Homo sapiens
<400> 21
gaatgctgtt acctgaaccc cttacttcga aggatcataa gattcacagg ggtgtttgca 60
tttggacttt ttgctactga catttttgta aacgccggac aagtggtcac tgggcactta 120
acgccatact tcctgactgt gtgcaagcca aactacacca gtgcagactg ccaagcgcac 180
caccagttta taaacaatgg gaacatttgt actggggacc tggaagtgat agaaaaggct 240
cggagatcct ttccctccaa acacgctgct ctgagcattt actccgcctt atatgccacg 300
atgtatatta caagcacaat caagacgaag agcagtcgac tggccaagcc ggtgctgtgc 360
ctcggaactc tctgcacagc cttcctgaca ggcctcaacc gggtctctga gtatcggaac 420
cactgctcgg acgtgattgc tggtttcatc ctgggcactg cagtggccct gtttctggga 480
atgtgtgtgg ttcataactt taaaggaacg caaggatctc cttccaaacc caagcctgag 540
gatccccgtg gagtacccct aatggctttc ccaaggatag aaagccctct ggaaacctta 600
agtgcacaga atcactctgc gtccatgacc gaagttacct gagacgactg atgtgtcaca 660
agctgttttt taaaatcatc.ttccaattct atacttcaaa acacacagtt gctcaatgtc 720
aaactgtgat gacaaatatt acgtttatct agttagaagc taatgttttg tacatttttt 780
gtatgaggaa gtgatgtagc ttgccctgat tttttttttt tttttggtca gctttaatat 840
atttatgcca gaattttaaa accaacaaaa ttttcttgtt caagcgtgca ttgaagaacc 900
acatttattc aatggttgac gttgttttgt gatatttgta cacaaatttt cttttctcag 960
ttttataaac acagaatata acaattcact ttaaactttt attaccacag ttgctgcctc 1020
ctccagaatt tttgaatttt aataaaaggc aaacttttga gctgcaggaa ggacaatgtt 1080
ggttaataat aaatctcaaa gtcaattgta gaaaaaaaat tgtcttcaaa aagaatgttg 1140
cactctgatc tcttaacaaa ttgttacgtt caaagtttaa agtgatatat taacaaagtc 1200
acctagttat acaaacaatt gtcagagaat tctggatttg gagggtattg gggttatatg 1260
attctttctt agataatggc ctctactaaa taactcaaga tctttctgga atgtcttctg 1320
gcaggcaggt gccactgtca gcttttctcc aaaaagcagc caacatcagc ctcccctgtc 1380
aactcaacag ttttgtatct catattatat ggactttata tgaaaatgaa tattttacag 1440
tttgcacagt attattttac agaaaaggaa tcagagaatc tacaacatag ggccccagaa 1500
caacagtttc actttgtggc ttttaattat tctagaattt taactgcatc tcatttttct 1560
agcatggtga gaactaatat gtaactcctt tgattgaagg agctcttttg tccgtaccta 1620
tcagaat 1627
<210> 22
<211> 2333
<212> ADN
<213> Homo sapiens
<400> 22
attcaagaga gcaaggacaa ataatggtca aggaaggaag tcagggattg gtggctctgt 60


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
actaagtgtc agcttcaaag ggagagacca gagcataaac agacaattct ctaggttgca 120
aattgggagg attaggaaca agtaagagag ttccatgcag gatggacaag aaaaaaaagt 180
tttataccaa aaattgtatt tcatggcatt agggcagtct actggggtaa ggcactatgc 240
agtactaggc aattagaatt ctattcacta gctatgtgca caagcggctc ctgacctggt 300
cattttggct gtaaaactat tcatgcctgg acagtttttg acggtgcagt cttgctatat 360
ggtgtgagaa atggctgtag gaaacaacac tcaacgaagt tattccatca tcccgtgttt 420
tatatttgtt gagcttgtca tcatggctgg gacagtgctg cttgcctact acttcgaatg 480
cactgacact tttcaggtgc atatccaagg attcttctgt caggacggag acttaatgaa 540
gccttaccca gggacagagg aagaaagctt catcacccct ctggtgctct attgtgtgct 600
ggctgccacc ccaactgcta ttatttttat tggtgagata tccatgtatt tcataaaatc 660
aacaagagaa tccctgattg ctcaggagaa aacaattctg accggagaat gctgttacct 720
gaacccctta cttcgaagga tcataagatt cacaggggtg tttgcatttg gactttttgc 780
tactgacatt tttgtaaacg ccggacaagt ggtcactggg cacttaacgc catacttcct 840
gactgtgtgc aagccaaact acaccagtgc agactgccaa gcgcaccacc agtttataaa 900
caatgggaac atttgtactg gggacctgga agtgatagaa aaggctcgga gatcctttcc 960
ctccaaacac gctgctctga gcatttactc cgccttatat gccacgatgt atattacaag 1020
cacaatcaag acgaagagca gtcgactggc caagccggtg ctgtgcctcg gaactctctg 1080
cacagccttc ctgacaggcc tcaaccgggt ctctgagtat cggaaccact gctcggacgt 1140
gattgctggt ttcatcctgg gcactgcagt ggccctgttt ctgggaatgt gtgtggttca 1200
taactttaaa ggaacgcaag gatctccttc caaacccaag cctgaggatc cccgtggagt 1260
acccctaatg gctttcccaa ggatagaaag ccctctggaa accttaagtg cacagaatca 1320
ctctgcgtcc atgaccgaag ttacctgaga cgactgatgt gtcacaagct gttttttaaa 1380
atcatcttcc aattctatac ttcaaaacac acagttgctc aatgtcaaac tgtgatgaca 1440
aatattacgt ttatctagtt agaagctaat gttttgtaca ttttttgtat gaggaagtga 1500
tgtagcttgc cctgattttt tttttttttt tggtcagctt taatatattt atgccagaat 1560
tttaaaacca acaaaatttt cttgttcaag cgtgcattga agaaccacat ttattcaatg 1620
gttgacgttg ttttgtgata tttgtacaca aattttcttt tctcagtttt ataaacacag 1680
aatataacaa ttcactttaa acttttatta ccacagttgc tgcctcctcc agaatttttg 1740
aattttaata aaaggcaaac ttttgagctg caggaaggac aatgttggtt aataataaat 1800
ctcaaagtca attgtagaaa aaaaattgtc ttcaaaaaga atgttgcact ctgatctctt 1860
aacaaattgt tacgttcaaa gtttaaagtg atatattaac aaagtcacct agttatacaa 1920
acaattgtca gagaattctg gatttggagg gtattggggt tatatgattc tttcttagat 1980
aatggcctct actaaataac tcaagatctt tctggaatgt cttctggcag gcaggtgcca 2040
ctgtcagctt ttctccaaaa agcagccaac atcagcctcc cctgtcaact caacagtttt 2100
gtatctcata ttatatggac tttatatgaa aatgaatatt ttacagtttg cacagtatta 2160
ttttacagaa aaggaatcag agaatctaca acatagggcc ccagaacaac agtttcactt 2220
tgtggctttt aattattcta gaattttaac tgcatctcat ttttctagca tggtgagaac 2280
taatatgtaa ctcctttgat tgaaggagct cttttgtccg tacctatcag aat 2333
<210> 23
<211> 2764'
<212> ADN
<213> Homo sapiens
<400> 23
cagtttttat cacaggtgca agccgtggca ttggcaaagc tattgcattg aaagcagcaa 60
aggatggagc aaatattgtt attgctgcaa agaccgccca gccacatcca aaacttctag 120


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
23
gcacaatcta tactgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 180
ttgttgatgt gagagatgaa cagcagatca gtgctgcagt ggagaaagcc atcaagaaat 240
ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300
acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360
catctaaagc atgtattcct tatttgaaaa agagcaaagt tgctcatatc ctcaatatca 420
gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgcta 480
agtatggtat gtctatgtat gtgcttggaa tggcagaaga atttaaaggt gaaattgcag 540
tcaatgcatt atggcctaaa acagccatac acactgctgc tatggatatg ctgggaggac 600
ctggtatcga aagccagtgt agaaaagttg atatcattgc agatgcagca tattccattt 660
tccaaaagcc aaaaagtttt actggcaact ttgtcattga tgaaaatatc ttaaaagaag 720
aaggaataga aaattttgac gtttatgcaa ttaaaccagg tcatcctttg caaccagatt 780
tcttcttaga tgaataccca gaagcagtta gcaagaaagt ggaatcâact ggtgctgttc 840
cagaattcaa agaagagaaa ctgcagctgc aaccaaaacc acgttctgga gctgtggaag 900
aaacatttag aattgttaag gactctctca gtgatgatgt tgttaaagcc actcaagcaa 960
tctatctgtt tgaactctcc ggtgaagatg gtggcacgtg gtttcttgat ctgaaaagca 1020
agggtgggaa tgtcggatat ggagagcctt ctgatcaggc agatgtggtg atgagtatga 1080
ctactgatga ctttgtaaaa atgttttcag ggaaactaaa accaacaatg gcattcatgt 1140
cagggaaatt gaagattaaa ggtaacatgg ccctagcaat caaattggag aagctaatga 1200
atcagatgaa tgccagactg tgaaggaaaa tataaaaaaa aagtcgactg ctatgctcaa 1260
aaagtaaaaa aagctcaaca gttaaaatct aatgtttgtt ttctttcctg ttatattata 1320
aggatatgca cgtttgttct ggaaaagata gaatttgtct ctaaaagact tgaaattgta 1380
attaaaatgg caagctaatc aaacataagc ttcattaagt gggattctaa gacagtctgt 1440
gtttttatat ttcaagggtt taaccctttg agccttacat ctcattcact gtctttctcc 1500
aagaaaagta ttttgggcgg acagtcagat caagcagtaa aattagctct ttcaaatctt 1560
cttgtcatgt aaaatgaagc tagtctgttt taaaattttt agttttggat tgtatactaa 1620
tgaaaatctt aatgatgttt ttgattttta tatacttatt ttaaagaaaa tcttatatag 1680
tacattttac aaaaattata aaaaatgaat tagtactggc gaggactaaa tgaaacaata 1740
atttttcatt ttgataacta gctttccagg tggacttagc cataggaaaa tattactaat 1800
gtaatttaac aaattgctgc atgtattcca tttaaaaata tgtttaaatt gtcctaaaac 1860
aaaataattt tctccctagg agtatgcatt tggctacagt gttttgaaac agaaacctta 1920
gaataggtca ttggtatggg ctgaactgtg tatcccccaa ttcatttgtt gaggtcctaa 1980
ctcccatttc ttttgaatgt gactgttcgg agatgaggcc tttaaagagg tgacttaagt 2040
tcaaaggagg ctgttagtct aatccaacat ggtgtccttt ggacataaga gataccagca 2100
atgtgtgcac agaacaaaga ccaggagagg acacagtgag aaggcagtta tctgcaagca 2160
aagagagagg cttcagaaga aacaaaatca ccagcacctt gatctttgac ttctaatctc 2220
cagaatagtg agaaataaat ttctgttgt,t aagccgtcca ctgtgggagg ccgacgcagg 2280
aggattgctt gaggccagga gttcaaggcc agcctggaca acatagtaag accctatctc 2340
taccccccta ataaattaat ttaaaaagcc ccccaatctg tggtatttta ttatggcagc 2400
cctagcaagc taatacagtg gtttgagagg ctgggagggt tgaggggaag ataaactttt 2460
aaaaagctct tatctttcat ttcaatcagt taaaaatact tgctcagtgt aacaattttg 2520
cttctcagct tccactctaa tattgttgtg ccattaagca atttagctaa tcctgacatt 2580
tcttagattc ataatgttag gagcatttaa tctgtatttt acaagttagg aagcagagga 2640
tcagagatgg gaaaggacta gcccaaggcc aacattaaca agccctctaa caaaaacttt 2700
acaatacatt tatgttgaat ggaactccaa gatctcacct ctccatccag gaatggagtc 2760
catg 2764
<210> 24
tttataccaa aaattgtatt tcatggcatt agggcagtct actg


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
34
<211> 3228
<212> ADN
<213> Homo sapiens
<400> 24
gctcgccgcc gccgctgtcg ccgccacctc ctctgatcta cgaaagtcat gttacccaac 60 -
accgggaggc tggcaggatg tacagttttt atcacaggtg caagccgtgg cattggcaaa 120
gctattgcat tgaaagcagc aaaggatgga gcaaatattg ttattgctgc aaagaccgcc 180
cagccacatc caaaacttct aggcacaatc tatactgctg ctgaagaaat tgaagcagtt 240
ggaggaaagg ccttgccatg tattgttgat gtgagagatg aacagcagat cagtgctgca 300
gtggagaaag ccatcaagaa atttggagga attgatattc tggtaaataa tgccagtgcc 360
attagtttga ccaatacatt ggacacacct accaagagat tggatctgat gatgaacgtg 420
aacaccagag gcacctacct tgcatctaaa gcatgtattc cttatttgaa aaagagcaaa 480
gttgctcata tcctcaatat cagtccacca ctgaacctaa atccagtttg gttcaaacag 540
cactgtgctt ataccattgc taagtatggt atgtctatgt atgtgcttgg aatggcagaa 600
gaatttaaag gtgaaattgc agtcaatgca ttatggccta aaacagccat acacactgct 660
gctatggata tgctgggagg acctggtatc gaaagccagt gtagaaaagt tgatatcatt 720
gcagatgcag catattccat tttccaaaag ccaaaaagtt ttactggcaa ctttgtcatt 780
gatgaaaata tcttaaaaga agaaggaata gaaaattttg acgtttatgc aattaaacca 840
ggtcatcctt tgcaaccaga tttcttctta gatgaatacc cagaagcagt tagcaagaaa 900
gtggaatcaa ctggtgctgt tccagaattc aaagaagaga aactgcagct gcaaccaaaa 960
ccacgttctg gagctgtgga agaaacattt agaattgtta aggactctct cagtgatgat 1020
gttgttaaag ccactcaagc aatctatctg tttgaactct ccggtgaaga tggtggcacg 1080
tggtttcttg atctgaaaag caagggtggg aatgtcggat atggagagcc ttctgatcag 1140
gcagatgtgg tgatgagtat gactactgat gactttgtaa aaatgttttc agggaaacta 1200
aaaccaacaa tggcattcat gtcagggaaa ttgaagatta aaggtaacat ggccctagca 1260
atcaaattgg agaagctaat gaatcagatg aatgccagac tgtgaaggaa aatataaaaa 1320
aaaagtcgac tgctatgctc aaaaagtaaa aaaagctcaa cagttaaaat ctaatgtttg 1380
ttttctttcc tgttatatta taaggatatg cacgtttgtt ctggaaaaga tagaatttgt 1440
ctctaaaaga cttgaaattg taattaaaat ggcaagctaa tcaaacataa gcttcattaa 1500
gtgggattct aagacagtct gtgtttttat atttcaaggg tttaaccctt tgagccttac 1560
atctcattca ctgtctttct ccaagaaaag tattttgggc ggacagtcag atcaag.cagt 1620
aaaattagct ctttcaaatc ttcttgtcat gtaaaatgaa gctagtctgt tttaaaattt 1680
ttagttttgg attgtatact aatgaaaatc ttaatgatgt ttttgatttt tatatactta 1740
ttttaaagaa aatcttatat agtacatttt acaaaaatta taaaaaatga attagtactg 1800
gcgaggacta aatgaaacaa taatttttca ttttgataac tagctttcca ggtggactta 1860
gccataggaa aatattacta atgtaattta acaaattgct gcatgtattc catttaaaaa 1920
tatgtttaaa ttgtcctaaa acaaaataat tttctcccta ggagtatgca tttggctaca 1980
gtgttttgaa acagaaacct tagaataggt cattggtatg ggctgaactg tgtatccccc 2040
aattcatttg ttgaggtcct aactcccatt tcttttgaat gtgactgttc ggagatgagg 2100
cctttaaaga ggtgacttaa gttcaaagga ggctgttagt ctaatccaac atggtgtcct 2160
ttggacataa gagataccag caatgtgtgc acagaacaaa gaccaggaga ggacacagtg 2220
agaaggcagt tatctgcaag caaagagaga ggcttcagaa gaaacaaaat caccagcacc 2280
ttgatctttg acttctaatc tccagaatag tgagaaataa atttctgttg ttaagccgtc 2340
cactgtggga ggccgacgca ggaggattgc ttgaggccag gagttcaagg ccagcctgga 2400
caacatagta agaccctatc tctacccccc taataaatta atttaaaaag ccccccaatc 2460
tgtggtattt tattatggca gccctagcaa gctaatacag tggtttgaga ggctgggagg 2520
gttgagggga agataaactt ttaaaaagct cttatctttc atttcaatca gttaaaaata 2580


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
cttgctcagt gtaacaattt tgcttctcag cttccactct aatattgttg tgccattaag 2640
caatttagct aatcctgaca tttcttagat tcataatgtt aggagcattt aatctgtatt 2700
ttacaagtta ggaagcagag gatcagagat gggaaaggac tagcccaagg ccaacattaa 2760
caagccctct aacaaaaact ttacaataca tttatgttga atggaactcc aagatctcac 2820
ctctccatcc aggaatggag tccatgtaat caaagtgaac ttaaaaatag gacagtttca 2880
acaagtcagg agattcacag caactgatca aagggagtcc agtcaacgtg agcaagcgtg 2940
attatgatga ggaagccccc tctgctttaa tccacacaag gaacgtaacc tgaagtaacc 3000
tgatgttaac caatctgctg tgtctactat gctgtttcct tgttcctgct agtgctgctt 3060
tacaaatgca gaccattcta tcatacctgg cggggcttct gttttatttt gtaggctgga 3120
tgctacccag ttcatgaatc gctaataaaa gccaattaga tctttaaaaa aaaaaaaaaa 3180
aaaaaaaaaa aaaaaaaaaa anaanaagan naannaaaan anagaaga 3228
<210> 25
<211> 3106
<212> ADN
<213> Homo sapiens
<400> 25
accgaagtga gcgtggacct gccgaaacat gccaaaggcc aggatttgtt tgatcagatt 60
gtgtaccact tggaccttgt ggaaacagat tactttggcc tccagttcct cgactctgcc 120
caggttgcgc actggctgga tcatgccaaa cccataaaaa agcagatgaa aattggacct 180
gcttatgctt tacactttcg agttaaatac tattcttcag aaccaaacaa ccttcgtgag 240
gagtttacaa ggtacctgtt tgttttacaa ctcaggcatg acattctttc tggaaaattg 300
aaatgccctt atgaaacagc tgtggaatta gctgctctct gtctacaagc ggagcttggg 360
gagtgcgagc ttccagaaca cacaccagag cttgtgtctg agtttcggtt cattccaaat 420
cagacagaag caatggaatt tgatatcttc cagagatgga aagagtgcag gggaaagagc 480
cctgcccagg cggaactctc ctatctgaat aaagcgaagt ggctggaaat gtatggggta 540
gacatgcacg ttgtcagggg aagagatggc tgtgaatatt ctcttggact gaccccgaca 600
ggcatattaa tctttgaagg agctaacaaa ataggcttat tcttttggcc taaaattacc 660
aaaatggatt ttaaaaagag caaattgaca ctcgtggtgg tcgaggatga tgatcaggga 720
cgtgagcaag agcacacgtt tgtgttccgg ttagacagtg ccaggacctg caaacacctt 780
tggaagtgtg cagttgagca ccacgcattc ttccgactgc ggacgccagg aaacagcaaa 840
tccaatagat ccgactttat caggctgggc tctcgcttca gattcagtgg gcggacagaa 900
tatcaagcta cacatggctc caggttacga agaaccagca cctttgagag gaagcctagt 960
aaacgttatc catcccggag acattcaacg ttcaaagcaa gcaacccagt gatagcagcc 1020
cagctctgct ctaaaacaaa tccagaagtc cataattacc agcctcaata tcatcctaat 1080
atccatccca gccagccccg gtggcatcct cactctccaa atgtcaggcc atcctttcag 1140
gatgacaggt cgcattggaa agcatcggcc agtggagatg acagccattt tgattatgtc 1200
cacgaccaga accagaagaa cttaggaggg atgcaaagta tgatgtatcg agataaactc 1260
atgactgcac tttgagagac tgaagcatct ctcttccatt caccttcata gtttcattgc 1320
attccatgaa aagtgtcttg gcctcagatg gatggatgtg tttggacgag tgtctttaag 1380
gagtagtcct gaaaggtgtt tttggtgtcc atgtaaatat ttgaagataa aaccactata 1440
gcttgtcata atttactgtt gactgcattc tcattaaaat gaaggtaaag gctcaggaat 1500
catattgatg ttctgatttt aaaattggag tcaaagtcta tgtttatcat tttactatgt 1560
tcctgatgtt ctttgttatt taattaatgg gagcaaataa aaccagaaga gcttgggaag 1620
attgctcagc atatattcct gtcgtagaag ttgagattgc tagggtccag tttccctagt 1680
gtggcctgga cgagtcattt ccccttcatt gacctcattt tccccatctg aaaagagagg 1740


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
2G
gttggactaa gtgatctcca aggtcctttc caactctaaa attctgcaat ttgttaacat 1800
ttcattttgt ttaggttgag gacatacatt caaactaatt ttatcacaag gaaaactgca 1860
atacccactt ccttgacaga gttactcctt tcagaagcta aataaagtat ataacttatt 1920
agatgttata tagatacagg gggactttga atttcacatc ttaaagcagt tgagctactt 1980
tgaatttaag cagtcgtact aatcttaaat tgcatagcat ttgttttgat cgaatttgct 2040
gctcaagtat gggaataatt tttaatgtct taatgattgg tgctgctaac ttgcgtgatt 2100
tcagaagaca taattgtgaa tacacactgt cagaattggg ggattggttt ttaccctaga 2160
cttcactctt aaaaagcaac gtgcaatcaa gatcatttat ggctcaaatg aaagcatata 2220
aggttttctt gaagttgtgc caaagcattc tgtagagtag gatgagatgg ttgttgccct 2280
agtctgttgg tagaaccaga aatcaatatg ttgtctttta ggttaaagct tgtaccaaaa 2340
tatttatttc ccccatttca agccctgagt caaacatttt tttctcttaa taatagacct 2400
gaaatgtttt attagtattt ctgtgaaatc agttgattct tgtgccattt ttgtatatgt 2460
aattgtaatt ttgcccatgt taggccctct aaaaaatgtt tgacatcctt tgagatattt 2520
tattactaaa atctgatctt ttttggctac tgcaaaaatc tattcagcaa gaaggtatca 2580
gctgcatacc ttgcacagtg gagctgacta cctataaact ctccctaagg catttgttta 2640
caggtgtatt ccattttagc agacgttctg atgctcagtg tatgtgctgc atacaaataa 2700
atgtgttctg aatcttttca tcttattgat agcattttta caaatgtgtt tccaaggaat 2760
aaagattatt cttgcttttt ttttgactcc atcttcattt tttttaaatt gattcttgtt 2820
gctatgcaga agtctcattt gtgaatgacc ttggtaacag aacagttggc ttttggaagt 2880
ctgaaggtga gcattcagtt aggtgggtgg agcaagatca tcctagaatg aggctgctct 2940
tggcaagagt ggatcttata ggcacagcag ctgatgcctt tcttcatctg gggcaactct 3000
ggtgaaggtt gtcctgcctg tcacaggtgc tgagtagaga gaagtggtgg cagtgggatt 3060
tcctcagtaa tagtcctgta aaggtacgtg tttgtcctgg ctactt 3106
<210> 26
<211> 3313
<212> ADN
<213> Homo sapiens
<400> 26
gcgggcccct gctcaccggc ggcgcggccg tgcacatctc cgccgccggc gccgccaagg 60
ccaccctcta ctgccgcgtc ttcctgctcg acgggaccga agtgagcgtg gacctgccga 120
aacatgccaa aggccaggat ttgtttgatc agattgtgta ccacttggac cttgtggaaa 180
cagattactt tggcctccag ttcctcgact ctgcccaggt tgcgcactgg ctggatcatg 240
ccaaacccat aaaaaagcag atgaaaattg gacctgctta tgctttacac tttcgagtta 300
aatactattc ttcagaacca aacaaccttc gtgaggagtt tacaaggtac ctgtttgttt 360
tacaactcag gcatgacatt ctttctggaa aattgaaatg cccttatgaa acagctgtgg 420
aattagctgc tctctgtcta caagcggagc ttggggagtg cgagcttcca gaacacacac 480
cagagcttgt gtctgagttt cggttcattc caaatcagac agaagcaatg gaatttgata 540
tcttccagag atggaaagag tgcaggggaa agagccctgc ccaggcggaa ctctcctatc 600
tgaataaagc gaagtggctg gaaatgtatg gggtagacat gcacgttgtc aggggaagag 660
atggctgtga atattctctt ggactgaccc cgacaggcat attaatcttt gaaggagcta 720
acaaaatagg cttattcttt tggcctaaaa ttaccaaaat ggattttaaa aagagcaaat 780
tgacactcgt ggtggtcgag gatgatgatc agggacgtga gcaagagcac acgtttgtgt 840
tccggttaga cagtgccagg acctgcaaac acctttggaa gtgtgcagtt gagcaccacg 900
cattcttccg actgcggacg ccaggaaaca gcaaatccaa tagatccgac tttatcaggc 960
tgggctctcg cttcagattc agtgggcgga cagaatatca agctacacat ggctccaggt 1020


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
tacgaagaac cagcaccttt gagaggaagc ctagtaaacg ttatccatcc cggagacatt 1080
caacgttcaa agcaagcaac ccagtgatag cagcccagct ctgctctaaa acaaatccag 1140
aagtccataa ttaccagcct caatatcatc ctaatatcca tcccagccag ccccggtggc 1200
atcctcactc tccaaatgtc aggccatcct ttcaggatga caggtcgcat tggaaagcat 1260
cggccagtgg agatgacagc cattttgatt atgtccacga ccagaaccag aagaacttag 1320
gagggatgca aagtàtgatg tatcgagata aactcatgac tgcactttga gagactgaag 1380
catctctctt ccattcacct tcatagtttc attgcattcc atgaaaagtg tcttggcctc 1440
agatggatgg atgtgtttgg acgagtgtct ttaaggagta gtcctgaaag gtgtttttgg 1500
tgtccatgta aatatttgaa gataaaacca ctatagcttg tcataattta ctgttgactg 1560
cattctcatt aaaatgaagg taaaggctca ggaatcatat tgatgttctg attttaaaat 1620
tggagtcaaa gtctatgttt atcattttac tatgttcctg atgttctttg ttatttaatt 1680
aatgggagca aataaaacca gaagagcttg ggaagattgc tcagcatata ttcctgtcgt 1740
agaagttgag attgctaggg tccagtttcc ctagtgtggc ctggacgagt catttcccct 1800
tcattgacct cattttcccc atctgaaaag agagggttgg actaagtgat ctccaaggtc 1860
ctttccaact ctaaaattct gcaatttgtt aacatttcat tttgtttagg ttgaggacat 1920
acattcaaac taattttatc acaaggaaaa ctgcaatacc cacttccttg acagagttac 1980
tcctttcaga agctaaataa agtatataac ttattagatg ttatatagat acagggggac 2040
tttgaatttc acatcttaaa gcagttgagc tactttgaat ttaagcagtc gtactaatct 2100
taaattgcat agcatttgtt ttgatcgaat ttgctgctca agtatgggaa taatttttaa 2160
tgtcttaatg attggtgctg ctaacttgcg tgatttcaga agacataatt gtgaatacac 2220
actgtcagaa ttgggggatt ggtttttacc ctagacttca ctcttaaaaa gcaacgtgca 2280
atcaagatca tttatggctc aaatgaaagc atataaggtt ttcttgaagt tgtgccaaag 2340
cattctgtag agtaggatga gatggttgtt gccctagtct gttggtagaa ccagaaatca 2400
atatgttgtc ttttaggtta aagcttgtac caaaatattt atttccccca tttcaagccc 2460
tgagtcaaac atttttttct cttaataata gacctgaaat gttttattag tatttctgtg 2520
aaatcagttg attcttgtgc catttttgta tatgtaattg taattttgcc catgttaggc 2580
cctctaaaaa atgtttgaca tcctttgaga tattttatta ctaaaatctg atcttttttg 2640
gctactgcaa aaatctattc agcaagaagg tatcagctgc ataccttgca cagtggagct 2700
gactacctat aaactctccc taaggcattt gtttacaggt gtattccatt ttagcagacg 2760
ttctgatgct cagtgtatgt gctgcataca aataaatgtg ttctgaatct tttcatctta 2820
ttgatagcat ttttacaaat gtgtttccaa ggaataaaga ttattcttgc tttttntttt 2880
gactccatct tcattttttt taaattgatt cttgttgcta tgcagaagtc tcatttgtga 2940
atgaccttgg taacagaaca gttggctttt ggaagtctga aggtgagcat tcagttaggt 3000
gggtggagca agatcatcct agaatgaggc tgctcttggc aagagtggat cttataggca 3060
cagcagctga tgcctttctt catctggggc aactctggtg aaggttgtcc tgcctgtcac 3120
aggtgctgag tagagagaag tggtggcagt gggatttcct cagtaatagt cctgtaaagg 3180
tacgtgtttg tcctggctac ttgtgctctt cctggcagga aggcatccaa acccttatct 3240
gtgggctcct ggaaattgtg tatgccatat aataccctct aataaatacc tctctgctta 3300
aaaaaaaaaa aaa 3313
<210> 27
<211> 1539
<212> ADN
<213> Homo sapiens
<400> 27
ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
~s
atgtctattg cctggagtca tccctgcaga cctacaaccc agactacgtc ctgatggtag 120
aagacgatgc tgtaccagaa gagcagatct tcccagtctt ggagcacctt ctgcgggctc 180
gcttctctga gccacatctc agagatgccc tttatctcaa gctgtatcac cccgagaggc 240
tccagcacta catcaatcca gagcccatgc ggatcctgga atgggttggt gtaggcatgt 300
tgctggggcc cttactaacc tggatataca tgaggtttgc cagccgccca gggtttagct 360
ggcctgtaat gctcttcttc tccctgtata gcatgggtct ggtggagctg gtgggtcggc 420
actatttcct ggaactgcgg cggctgagtc cttccctgta cagtgtggtt cctgcctctc 480
agtgttgcac cccagccatg ctcttcccgg cacctgcggc ccgccggacc ctcacctacc 540
tgtcccaagt gtactgccac aagggctttg gcaaggacat ggcactgtac tcgctgttga 600
gggccaaggg agagagggcc tatgtagtgg agccgaacct cgtgaaacac atcgggctct 660
tctccagtct ccggtacaac tttcatccca gtctcctcta gggtgccaag agatgccttt 720
ctgaagttgg ccacttcttg aagattcaaa tatttatctc tttatttaga catggttgcc 78D
tgcaggtatt tcactgttta ctgttgttag agatataggc actggggcag ctgaggaacc 840
tcaatatgtt aagagccttg gctttggtag cctcctggca ggagcagcag tttgccacag 900
gtccggacct ctccctccac acagccacac tgcctcatgc agtctgaccc acccagtgag 960
ggtgcatttg aacactgatt atattctcca tttgttttta agctctgctt tgtgttagag 1020
cttgtgactg ccaaaaattt tgtgcacagt gatatgactg ttttaggatc ttaagggtag 1080
aattttgtga aaggtgagat cctttggaat tgagttcttt ctcattgggt atgaaaatgg 1140
atgtatgttt agaatatatg cccaacgagg caggaccatg tggatagatt ccatttgttt 1200
ccttgacctg atgtaataaa aactgataaa agccgtgcag tgcccggcat cttggaggca 1260
ggtgatctgg cttttctgtt acctgggatt ttcttttcct atatatctgt agtgcactga 1320
taattgatat tgttagtgag aactttaagg cacgacaaga tctggaagag cttgtgaacc 1380
atcaaagtca gattgcttat gttgagtagt gatttaacat tgaacatttc tgtactactc 1440
tgactctttg aaaattggac atttcagaat gatacaatat aggggagctc tttacaagta 1500
gcatatcatt tttcctgact ttcctggctg actgcttac 1539
<210> 28
<211> 3404
<212> ADN
<213> Homo sapiens
<400> 28
ctcttcctgt gcaacgtgga gcgtagtgtg agccattttg atgccaagtt gctctccaag 60
tatgtccctg tggccaatcg ctatgagggc actgaggatg attatggtga tgacccttcg 120
accaactcgt ttgagaaaga gaagcaggac tatgtctatt gcctggagtc atccctgcag 180
acctacaacc cagactacgt cctgatggta gaagacgatg ctgtaccaga agagcagatc 240
ttcccagtct tggagcacct tctgcgggct cgcttctctg agccacatct cagagatgcc 300
ctttatctca agctgtatca ccccgagagg ctccagcact acatcaatcc agagcccatg 360
cggatcctgg aatgggttgg tgtaggcatg ttgctggggc ccttactaac ctggatatac 420
atgaggtttg ccagccgccc agggtttagc tggcctgtaa tgctcttctt ctccctgtat 48D
agcatgggtc tggtggagct ggtgggtcgg cactatttcc tggaactgcg gcggctgagt 540
ccttccctgt acagtgtggt tcctgcctct cagtgttgca ccccagccat gctcttcccg 600
gcacctgcgg cccgccggac cctcacctac ctgtcccaag tgtactgcca caagggcttt 660
ggcaaggaca tggcactgta ctcgctgttg agggccaagg gagagagggc ctatgtagtg 72D
gagccgaacc tcgtgaaaca catcgggctc ttctccagtc tccggtacaa ctttcatccc 780
agtctcctct agggtgccaa gagatgcctt tctgaagttg gccacttctt gaagattcaa 840
atatttatct ctttatttag acatggttgc ctgcaggtat ttcactgttt actgttgtta 900


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
?9
gagatatagg cactggggca gctgaggaac ctcaatatgt taagagcctt ggctttggta 960
gcctcctggc aggagcagca gtttgccaca ggtccggacc tctccctcca cacagccaca 1020
ctgcctcatg cagtctgacc cacccagtga gggtgcattt gaacactgat tatattctcc 1080
atttgttttt aagctctgct ttgtgttaga gcttgtgact gccaaaaatt ttgtgcacag 1140
tgatatgact gttttaggat cttaagggta gaattttgtg aaaggtgaga tcctttggaa 1200
ttgagttctt tctcattggg tatgaaaatg gatgtatgtt tagaatatat gcccaacgag 1260
gcaggaccat gtggatagat tccatttgtt tccttgacct gatgtaataa aaactgataa 1320
aagccgtgca gtgcccggca tcttggaggc aggtgatctg gcttttctgt tacctgggat 1380
tttcttttcc tatatatctg tagtgcactg ataattgata ttgttagtga gaactttaag 1440
gcacgacaag atctggaaga gcttgtgaac catcaaagtc agattgctta tgttgagtag 1500
tgatttaaca ttgaacattt ctgtactact ctgactcttt gaaaattgga catttcagaa 1560
tgatacaata taggggagct ctttacaagt agcatatcat ttttcctgac tttcctggct 1620
gactgcttac gaaaaaaaaa aaaaaaaagc atggactgaa gtcagaagac ctgacctttt 1680
atttcagatc tctgccatgg cctaacgacg tgaccacctt gggcaggnca tatantcact 1740
ctgggnntca atttcttçga accngtaaaa tgaggacagt aatacttaca tgttaaagtt 1800
gccttgagga ttaaatngca gaatatatgt aaaacaccta gcaagngctt agtccatagn 1860
agacacttgg caaacttttc tctcctataa taaacatata caactcaagc ttnnngcgga 1920
aaaagatatt ggtgatgttg tttaaagtat gagatagggc atggagctgc cacctatgta 1980
ccagctattc cagatgacca agccctgcta gaataaagac tgacttttca ttgtgacctc 2040
tgaaggatgt gcagctcagc tttcacctat ccccacgttc acccaagcca aaaagaagaa 2100
ttgttcattc aaactggaaa tgatctccag cttggaaatg agacttctca tgagcttatt 2160
ctaagatcag agtctgaaaa ttattttctc aaaagttaca aataaatgtc ttttaacagt 2220
actgtcagac tagtgaccaa caagttactt tatgaggatg gatgatgata ttagagttca 2280
agcaattgtc cagtttgttt cgatgccaca gtttgctttt aaattcccat agtgagcttc 2340
catcttgaga cccactcaac acagaaggat tacataaagg ttgatcaccc acgctctaca 2400
gatgaacaaa ttgagaccca gagatgctaa actgctctgc aggtcacaaa cctgaacagc 2460
agcatagcca aaatgggaac ggagctcttc tgacttcaag cccctgcact tttttcttaa 2520
ccacattaat tttatgaata tctatgtggt caaagtctct tttgtaaaat ctgagtataa 2580
gctgaactag atcatgtctc tgtaagctaa gatggcagaa acacattgtc atgttagttt 2640
ggaggagcaa acagatataa gtatgtgttg taatgttata gtgagctgtt atgtatcccc 2700
cagcaatgtc caaagtgatc agagctacta gatgacttat tacaatgttc agatcccact 2760
ccttcattcc tcctctctca gtgacctgtc tacccccaag ctttagaact gagctctctc 2820
caacttagaa ctcattagag tttgttgcat tagtgattgg atctcctcat gaaagttttt 2880
tgaccaatga cagtagagcc cctttaagct agccaggccc aagataggga agcactgctg 2940
gtttacattt ctgctctttc taattcagtt gtctattgca tgcagacatc ccctgcccga 3000
cttctccatt atggaaggct aaggccatcc ttccttgtcc agtttctcta cctacacact 3060
aacatgcctt ttccccatgg agtgaactct gccagttgtc tttggacatt ttctgcagat 3120
gcaggctcag ttctgctctt ttgttcccac ccacttctag atcttcctcc atttaatccc 3180
ttattcttat aaggagtcta atttttgtgt attgtccttg attagggcag ctgacagctt 3240
tacaccaaag ctgaagtctc tcacttaatc ctaagcaagg ggctagggag aactaagata 3300
tccttcccat atcaagggat ataggttact agaagggtgg aggtctctta acaggctcac 3360
tcacctttca gagtttaaat tatggtcagg cttaagaagc tctc 3404
<210> 29
<211> 792
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
<400> 29
ttgtacagca agttagctct tcagggagtt agctctgtct atcctgcccc tgtctgccta 60
gccactcctt ttctaggtag agtggacctt gctgttcacg tcatagatgg ccattccgtg 120
tacctagact cctttttatt cctttgccaa caagtaattg gaatgtttgg atttaagaac 180
atgtctgtgc tttgcaattt catgtgacca tggtgaaatt atgcacacat tctatcattg 240
tgattcaaca agtatttttt gaatgctgct gtgcatgagg catggtgtta gatggcagat 300
tgacagaaat gactaataca ggtatctggc ctcaaggagt ttacagtttc ataggagaaa 360
gaaaaacaaa actagcaatt ctggtaagca gtatgtgttt tggagagcac ttaacttcat 420
cagagagcat ggttgaaggt gtatctgtgt gtatgagaag gtgttggtga taattagaag 480
gcttccctaa agaggtcact cctggggttg agccataaag atcaagtaga tacaagtggg 540
catgaagcta gtattttgct gccagtcatt tctgtagtta ggttgcctat gtggttggag 600
catgtatgta ttgttacagg tgtagtctgc ttggcttccc taagagaatg ccccagtcct 660
ggccagaata tacatgtctt ttttagggtt tgcaccaagg ggaatagaga gtgtctggct 720
cagtacaaat ctgtttccgt tactccatta tccagaaagc cactgaaatg gcattagcct 780
acacttaatg gg 792
<210> 30
<211> 2733
<212> ADN
<213> Homo sapiens
<400> 30
ccacttgcca tgaacatgcc acatgccagc aaagagaagg gaagaagatc tgtatttgca 60
actatggatt tgtagggaac gggaggactc agtgtgttga taaaaatgag tgccagtttg 120
gagccactct tgtctgtggg aaccacacat cttgccacaa cacccccggg ggcttctatt 180
gcatttgcct ggaaggatat cgagccacaa acaacaacaa gacattcatt cccaacgatg 240
gcaccttttg tacagacata gatgagtgtg aagtttctgg cctgtgcagg catggagggc 300
gatgcgtgaa cactcatggg agctttgaat gctactgtat ggatggatac ttgccaagga 360
atggacctga acctttccac ccgaccaccg atgccacatc atgcacagaa atagactgtg 420
gtacccctcc tgaggttcca gatggctata tcataggaaa ttatacgtct agtctgggca 480
gccaggttcg ttatgcttgc agagaaggat tcttcagtgt tccagaagat acagtttcaa 540
gctgcacagg cctgggcaca tgggagtccc caaaattaca ttgccaagag atcaactgtg 600
gcaaccctcc agaaatgcgg cacgccatct tggtaggaaa tcacagctcc aggctgggcg 660
gtgtggctcg ctatgtctgt caagagggct ttgagagccc tggaggaaag atcacttctg 720
tttgcacaga gaaaggcacc tggagagaaa gtactttaac atgcacagaa attctgacaa 780
agattaatga tgtatcactg tttaatgata cctgtgtgag atggcaaata aactcaagaa 840
gaataaaccc caagatctca tatgtgatat ccataaaagg acaacggttg gaccctatgg 900
aatcagttcg tgaggagaca gtcaacttga ccacagacag caggacccca gaagtgtgcc 960
tagccctgta cccaggcacc aactacaccg tgaacatctc cacagcacct cccaggcgct 1020
cgatgccagc cgtcatcggt ttccagacag ctggtagcag aaactcccac gggagaaata 1080
cacatataaa agaagttgat ctcttagaag atgatggaag tttcaatatt tcaatattta 1140
atgaaacttg tttgaaattg aacaggcgtt ctaggaaagt tggatcagaa cacatgtacc 1200
aatttaccgt tctgggtcag aggtggtatc tggctaactt ttctcatgca acatcgttta 1260
acttcacaac gagggaacaa gtgcctgtag tgtgtttgga tctgtaccct acgactgatt 1320
atacggtgaa tgtgaccctg ctgagatctc ctaagcggca ctcagtgcaa ataacaatag 1380
caactccccc agcagtaaaa cagaccatca gtaacatttc aggatttaat gaaacctgct 1440


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
31
tgagatggag aagcatcaag acagctgata tggaggagat gtatttattc cacatttggg 1500
gccagagatg gtatcagaag gaatttgccc aggaaatgac ctttaatatc agtagcagca 1560
gccgagatcc cgaggtgtgc ttggacctac gtccgggtac caactacaat gtcagtctcc 1620
gggctctgtc ttcggaactt cctgtggtca tctccctgac aacccagata acagagcctc 1680
ccctcccgga agtagaattt tttacggtgc acagaggacc tctaccacgc ctcagactga 1740
ggaaagccaa ggagaaaaat ggaccaatca gttcatatca ggtgttagtg cttcccctgg 1800
ccctccaaag cacattttct tgtgattctg aaggcgcttc ctccttcttt agcaacgcct 1860
ctgatgctga tggatacgtg gctgcagaac tactggccaa agatgttcca gatgatgcca 1920
tggagatacc tataggagac aggctgtact atggggaata ttataatgca cccttgaaaa 1980
gagggagtga ttactgcatt atattacgaa tcacaagtga atggaataag gtgagaagac 2040
actcctgtgc agtttgggct caggtgaaag attcgtcact catgctgctg cagatggcgg 2100
gtgttggact gggttccctg gctgttgtga tcattctcac attcctctcc ttctcagcgg 2.160
tgtgatggca gatggacact gagtggggag gatgcactgc tgctgggcag gtgttctggc 2220
agcttctcag gtgcccgcac agaggctccg tgtgacttcc gtccagggag catgtgggcc 2280
tgcaactttc tccattccca gctgggcccc attcctggat ttaagatggt ggctatccct 2340
gaggagtcac cataaggaga aaactcagga attctgagtc ttccctgcta caggaccagt 2400
tctgtgcaat gaacttgaga ctcctgatgt acactgtgat attgaccgaa ggctacatac 2460
agatctgtga atcttggctg ggacttcctc tgagtgatgc ctgagggtca gctcctctag 2520
acattgactg caagagaatc tctgcaacct cctatataaa agcatttctg ttaattcatt 2580
cagaatccat tctttacaat atgcagtgag atgggcttaa gtttgggcta gagtttgact 2640
ttatgaagga ggtcattgaa aaagagaaca gtgacgtagg caaatgtttc aagcacttta 2700
gaaacagtac ttttcctata attagttgat ata 2733
<210> 31
<211> 2694
<212> ADN
<213> Homo sapiens
<400> 31
ccacttgcca tgaacatgcc acatgccagc aaagagaagg gaagaagatc tgtatttgca 60
actatggatt tgtagggaac gggaggactc agtgtgttga taaaaatgag tgccagtttg 120
gagccactct tgtctgtggg aaccacacat cttgccacaa cacccccggg ggcttctatt 180
gcatttgcct ggaaggatat cgagccacaa acaacaacaa gacattcatt cccaacgatg 240
gcaccttttg tacagacata gatgagtgtg aagtttctgg cctgtgcagg catggagggc 300
gatgcgtgaa cactcatggg agctttgaat gctactgtat ggatggatac ttgccaagga 360
atggacctga acctttccac ccgaccaccg atgccacatc atgcacagaa atagactgtg 420
gtacccctcc tgaggttcca gatggctata tcataggaaa ttatacgtct agtctgggca 480
gccaggttcg ttatgcttgc agagaaggat tcttcagtgt tccagaagat acagtttcaa 540
gctgcacagg cctgggcaca tgggagtccc caaaattaca ttgccaagag atcaactgtg 600
gcaaccctcc agaaatgcgg cacgccatct tggtaggaaa tcacagctcc aggctgggcg 660
gtgtggctcg ctatgtctgt caagagggct ttgagagccc tggaggaaag atcacttctg 720
tttgcacaga gaaaggcacc tggagagaaa gtactttaac atgcacagaa attctgacaa 780
agattaatga tgtatcactg tttaatgata cctgtgtgag atggcaaata aactcaagaa 840
gaataaaccc caagatctca tatgtgatat ccataaaagg acaacggttg gaccctatgg 900
aatcagttcg tgaggagaca gtcaacttga ccacagacag caggacccca gaagtgtgcc 960
tagccctgta cccaggcacc aactacaccg tgaacatctc cacagcacct cccaggcgct 1020
cgatgccagc cgtcatcggt ttccagacag ctgaagttga tctcttagaa gatgatggaa 1080


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
32
gtttcaatat ttcaatattt aatgaaactt gtttgaaatt gaacaggcgt tctaggaaag 1140
ttggatcaga acacatgtac caatttaccg ttctgggtca gaggtggtat ctggctaact 1200
tttctcatgc aacatcgttt aacttcacaa cgagggaaca agtgcctgta gtgtgtttgg 1260
atctgtaccc tacgactgat tatacggtga atgtgaccct gctgagatct cctaagcggc 1320
actcagtgca aataacaata gcaactcccc cagcagtaaa acagaccatc agtaacattt 1380
caggatttaa tgaaacctgc ttgagatgga gaagcatcaa gacagctgat atggaggaga 1440
tgtatttatt ccacatttgg ggccagagat ggtatcagaa ggaatttgcc caggaaatga 1500
cctttaatat cagtagcagc agccgagatc ccgaggtgtg cttggaccta cgtccgggta 1560
ccaactacaa tgtcagtctc cgggctctgt cttcggaact tcctgtggtc atctccctga 1620
caacccagat aacagagcct cccctcccgg aagtagaatt ttttacggtg cacagaggac 1680
ctctaccacg cctcagactg aggaaagcca aggagaaaaa tggaccaatc agttcatatc 1740
aggtgttagt gcttcccctg gccctccaaa gcacattttc ttgtgattct gaaggcgctt 1800
cctccttctt tagcaacgcc tctgatgctg atggatacgt ggctgcagaa ctactggcca 1860
aagatgttcc agatgatgcc atggagatac ctataggaga caggctgtac tatggggaat 1920
attataatgc acccttgaaa agagggagtg attactgcat tatattacga atcacaagtg 1980
aatggaataa ggtgagaaga cactcctgtg cagtttgggc tcaggtgaaa gattcgtcac 2040
tcatgctgct gcagatggcg ggtgttggac tgggttccct ggctgttgtg atcattctca 2100
cattcctctc cttctcagcg gtgtgatggc agatggacac tgagtgggga ggatgcactg 2160
ctgctgggca ggtgttctgg cagcttctca ggtgcccgca cagaggctcc gtgtgacttc 2220
cgtccaggga gcatgtgggc ctgcaacttt ctccattccc agctgggccc cattcctgga 2280
tttaagatgg tggctatccc tgaggagtca ccataaggag aaaactcagg aattctgagt 2340
cttccctgct acaggaccag ttctgtgcaa tgaacttgag actcctgatg .tacactgtga 2400
tattgaccga aggctacata cagatctgtg aatcttggct gggacttcct ctgagtgatg 2460
cctgagggtc agctcctcta gacattgact gcaagagaat ctctgcaacc tcctatataa 2520
aagcatttct gttaattcat tcagaatcca ttctttacaa tatgcagtga gatgggctta 2580
agtttgggct agagtttgac tttatgaagg aggtcattga aaaagagaac agtgacgtag 2640
gcaaatgttt caagcacttt agaaacagta cttttcctat aattagttga tata 2694
<210> 32
<211> 2765
<212> ADN
<213> Homo sapiens
<400> 32
cacagcagca cattcactat tcagggtgag ccacaggagg aaagaagaga aatagagttt 60
agacgtctgt gccacttgcc atgaacatgc cacatgccag caaagagaag ggaagaagat 120
ctgtatttgc aactatggat ttgtagggaa cgggaggact cagtgtgttg ataaaaatga 180
gtgccagttt ggagccactc ttgtctgtgg gaaccacaca tcttgccaca acacccccgg 240
gggcttctat tgcatttgcc tggaaggata tcgagccaca aacaacaaca agacattcat 300
tcccaacgat ggcacctttt gtacagacat agatgagtgt gaagtttctg gcctgtgcag 360
gcatggaggg cgatgcgtga acactcatgg gagctttgaa tgctactgta tggatggata 420
cttgccaagg aatggacctg aacctttcca cccgaccacc gatgcc~cat catgcacaga 480
aatagactgt ggtacccctc ctgaggttcc agatggctat atcataggaa attatacgtc 540
tagtctgggc agccaggttc gttatgcttg cagagaagga ttcttcagtg ttccagaaga 600
tacagtttca agctgcacag gcctgggcac atgggagtcc ccaaaattac attgccaaga 660
gatcaactgt ggcaaccctc cagaaatgcg gcacgccatc ttggtaggaa atcacagctc 720
caggctgggc ggtgtggctc gctatgtctg tcaagagggc tttgagagcc ctggaggaaa 780


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
gatcacttct gtttgcacag agaaaggcac ctggagagaa agtactttaa catgcacaga 840
aattctgaca a.agattaatg atgtatcact gtttaatgat acctgtgtga gatggcaaat 900
aaactcaaga agaataaacc ccaagatctc atatgtgata tccataaaag gacaacggtt 960
ggaccctatg gaatcagttc gtgaggagac agtcaacttg accacagaca gcaggacccc 1020
agaagtgtgc ctagccctgt acccaggcac caactacacc gtgaacatct ccacagcacc 108D
tcccaggcgc tcgatgccag ccgtcatcgg tttccagaca gctgaagttg atctcttaga 1140
agatgatgga agtttcaata tttcaatatt taatgaaact tgtttgaaat tgaacaggcg 1200
ttctaggaaa gttggatcag aacacatgta ccaatttacc gttctgggtc agaggtggta 1260
tctggctaac ttttctcatg caacatcgtt taacttcaca acgagggaac aagtgcctgt 1320
agtgtgtttg gatctgtacc ctacgactga ttatacggtg aatgtgaccc tgctgagatc 1380
tcctaagcgg cactcagtgc aaataacaat agcaactccc ccagcagtaa aacagaccat 1440
cagtaacatt tcaggattta atgaaacctg cttgagatgg agaagcatca agacagctga 1500
tatggaggag atgtatttat tccacatttg gggccagaga tggtatcaga aggaatttgc 1560
ccaggaaatg acctttaata tcagtagcag cagccgagat cccgaggtgt gcttggacct 1620
acgtccgggt accaactaca atgtcagtct ccgggctctg tcttcggaac ttcctgtggt 1680
catctccctg acaacccaga taacagagcc tcccctcccg gaagtagaat tttttacggt 1740
gcacagagga cctctaccac gcctcagact gaggaaagcc aaggagaaaa atggaccaat 1800
cagttcatat caggtgttag tgcttcccct ggccctccaa agcacatttt cttgtgattc 1860
tgaaggcgct tcctccttct ttagcaacgc ctctgatgct gatggatacg tggctgcaga 1920
actactggcc aaagatgttc cagatgatgc catggagata cctataggag acaggctgta 1980
ctatggggaa tattataatg cacccttgaa aagagggagt gattactgca ttatattacg 2040
aatcacaagt gaatggaata aggtgagaag acactcctgt gcagtttggg ctcaggtgaa 2100
agattcgtca ctcatgctgc tgcagatggc gggtgttgga ctgggttccc tggctgttgt 2160
gatcattctc acattcctct ccttctcagc ggtgtgatgg cagatggaca ctgagtgggg 2220
aggatgcact gctgctgggc aggtgttctg gcagcttctc aggtgcccgc acagaggctc 2280
cgtgtgactt ccgtccaggg agcatgtggg cctgcaactt tctccattcc cagctgggcc 2340
ccattcctgg atttaagatg gtggctatcc ctgaggagtc accataagga gaaaactcag 2400
gaattctgag tcttccctgc tacaggacca gttctgtgca atgaacttga gactcctgat 246D
gtacactgtg atattgaccg aaggctacat acagatctgt gaatcttggc tgggacttcc 2520
tctgagtgat gcctgagggt cagctcctct agacattgac tgcaagagaa tctctgcaac 2580
ctcctatata aaagcatttc tgttaattca ttcagaatcc attctttaca atatgcagtg 2640
agatgggctt aagtttgggc tagagtttga ctttatgaag gaggtcattg aaaaagagaa 2700
cagtgacgta ggcaaatgtt tcaagcactt tagaaacagt acttttccta taattagttg 2760
atata 2765
<210> 33
<211> 4745
<212> ADN
<213> Homo sapiens
<400> 33
gaccagatcc atgactgttg gtggagcatt tcatactact gaagctgaag ctagttctca 60
gagtttgact cagatatatg ccttacctga aattcctcaa gatcaaaatg ctgcagaatc 120
gtgggaaacc t~tagaagcgg acttaattga acttagccaa ctggtcactg acttctctct 180
cctagtgaat tctcagcagg agaagattga cagcattgca gaccatgtca acagtgctgc 240
tgtgaatgtt gaagagggaa ccaaaaactt agggaaggct gcaaaataca agctggcagc 300
tctgcctgtg gcaggtgcac tcatcggggg aatggtaggg ggtcctattg gcctccttgc 360


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
34
aggcttcaaa gtggcaggaa ttgcagctgc acttggtggt ggggtgttgg gcttcacagg 420
tggaaaattg atacaaagaa agaaacagaa aatgatggag aagctcactt ccagctgtcc 480
agatcttccc agccaaactg acaagaaatg cagttaaaaa ccaaatttca gtattattgg 540
tgccaacatg tctatcctga ggacctttgc tgctgttgga cactccgtca ccttttggaa 600
cacaagtata tcaagatagt ggctactgat gttcaagtgg gattgaagtg tgataaatgg 660
atatattttg ttgtttgctg gggtgttcat ggagatgtta agagattgag gccctgggct 720
gagggtatat aatgtatgtc aggtaaagtt tgaagactgc caaggagcag attttctccc 780
tggaaatgtg aaaactgaac ctataactct gataaggact tgagatgtgt agaaacgttg 840
ggttatggaa gactagtttc ttccataacc ctgaattgga gaccttaatg ctaagtgtag 900
attattgagg tttgttagtg aggaaaagaa taagagttca gaagcctttg ttatcagata 960
gcgaaatcag ggcctagtga ggagcacagg tcgactacat aatggagtcc attggcgaac 1020
cctattgcaa tttggtccaa ctatatcttc tggtgaagga aattaatgat gtaagaaaat 1080
gcaagaggct caacttctct tccaaaaatc ttctggcttc tgaactçttc ctctgcctct 1140
ctttaaataa ataacacaga atttcaagtg gtaggagact tattaagcca gtcaccaagc 1200
ttggtctgtc agcctgtctt ctaacacctc aaagatcttg tgccctgtgc tgtccctccc 1260
ttgtaattat gaaaagttct ttggtttctg gggtgaattc tacccatgta taatgaggaa 1320
ttctctcata accttttttg tcttgtctgt catctctgtt catcccttcc tataacctct 1380
aggtaaaaag aaaagaaaaa aagaaatttc gagatatttt caacattgtt agagtttggg 1440
ctaaaatgag caaggagaaa aaaaccacca agaacatttc ctggggcatg ttccagtttt 1500
gaggggtgat atatctgcca gatagggggt atctgaccca gtcttctttt cagctggtct 1560
ctggggggag ctgagaactc gcttgctacc tcacatcctt ttccccagac tttttatctc 1620
ctatgcatcc ctttgctttc tatagctggt gtttcttccc caaaatggcg ttcccatgct 1680
tacctttctc acattctaga caatgatgga caaagacgca tgcaagactc agacccgggg 1740
aatggtgtgg tgctaatctc aacacctgac attcacagca agcatggccc agcccaaccg 1800
catgtctatc tcaaaccgca gaaaggcttt aatactggaa aaaaagaatt caagactaca 1860
ggcagctccc ctctgtaccc caactcattt aaaataggag gaatcacttt ttgccttact 1920
taacgctttt ttctgagcac agggatgggc acctgcaccc cagaaggtgt gagctgtctc 1980
tctgccagga gctaaggttc attaggggat tggatggttt atcacttctt tctttctgag 2040
tttactttta gtaactttta ttgatggcta cctttcatgt ccctgtctaa agagactttc 2100
tctttcatac gtcttaaatc tcatcaatga aatccagtga aacagcacca tttcttagta 2160
tcattaaata actagaaagt atcaagtatt gctctctgct gctttatatc attaacatat 2220
taataatacc aagaaggaaa tactttgaat aagtgtcaga ttctgatcca gtattggaca 2280
cctgtgatat tggacacctg tgaggctggg ataattactt ttgaattaca cctcttctct 2340
agtttctgga ccttgctctg tcactttaac acagggtgat caaacctgaa tgaggatcag 2400
aactcaccca ggcacatact aaagcaagat tcctaaacct cagttccagg ggtaattctg 2460
acatcacccg tccagcatag tcagctgaaa ttataaatct aagaaacagt tacatcaaga 2520
ttctgctgtg tcatttaatt ctgaaactcc cagtattcta cccttcttca tcactgcata 2580
ttaccccact cttccatccc aaattggcta tcctttcagc ccaccaactt agcggcagca 2640
ctagggattc attataaggt aaatctggtt tacataaaga cctgaaggag gcctgtattt 2700
gaagctcaca cttggtattg gtatctctca tttttactga gccagtgtgg aataccactg 2760
tatgtactca tataagccct tgacttttac tgctcatcag gattggaata ttactctagc 2820
agtcttcaca cataggcaag ttacagtcct tttaaaaagn atctcatttc cctataatgg 2880
aacctaatag ccaacttttt catagaaatt gctagaagag tttgatcaac tataaatgat 2940
aaagtgttta taagcatagt cagtgtgaca cagaaaccaa tcttaaaatt gaatttaatg 3000
ttttatcata tcagattaaa tattttctcc atgtcttatt tttactgcaa caagttagaa 3060
agtgggaaca ctttgattaa tgtcttaaaa tttgtgggcc ctcatttgga taaaggcagc 3120
aatcctaagg actttttttt tttttaacat aatctgagaa tttctctgta gagcagagac 3180
tttcaaacct tttggctgta acccacagta aaaaacgcat ttatatcaaa ccttagaata 3240


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
tgtttaatga acaatactta ccattctgat gctttttatt gtttcagttt ttaaaatatg 3300
ccagttgcaa çccactaaat tgatatctac caatgggttg caacccttag cttgaaaaaa 3360
acaccctcac agaggaactg gtatttcttg aataccttct gtttgccagg cacttcacca 3420
ggcattttac aagtaaggaa actgggcttc agagaaaata atttgcagag gtttactcaa 3480
ctacaaaggg gtgaagccag gaatgttaac taggtctgtt gagctacaaa aacttttatg 3540
tctctcagac tatacagcct ctatacaaaa ttgagatggg ggttgggggc aggggctcat 3600
gcctgcaatc ccagcactta gggaggcaga ggccagagga tcacttgagc ccaggagttt 3660
gagaccagcc tgggcaacat agtgagactc tgtctgtatg aaaaaaatta agaattagct 3720
gggtgtggca tagcacacac ctgtggtccc agctacatgg gaagctgaag tgggaggatc 3780
acttgaactc aggagcagcc ttggtgacag aacaagaccc tctctcaaaa aaatatttaa 3840
aaaaaggtgg gtcatccatt ctcctttacc aaacaggctt tgaaatgaca cattccattc 3900
atttgcatct ttttaaaaaa cttctgattc cttactgagt gtccagcagc ctcaaagttt 3960
ttaatggtag ctgatgcaga cataaacagt gctcaatttg gcccttaaac tataaaatca 4020
agaaagtgta tttcaatccc atccacctgc ctgcaagatt tcttaatgtt cactagttat 4080
aaccattgtt taaacagtgc tttttgtgta atttaaaaat aaactttaat gctttttaaa 4140
acaaatttat cataattcat agatcaaatg attatccttt aaaatgatac ccttgggaaa 4200
tcatgtactt actgtagtga tgctagtatt aatattactt agaccaattt tgaagctgct 4260
ctttcagaat tgcctccaaa gacattttgc agatcatccc agaaaagggg gtatgatggt 4320
gctgtgtaga actgaccaga gttcctggag gattttgagg ttatactgaa actgagtgct 4380
gtacagggag aattgcatga gtccagaaac ttccttctgt gggctgcctg ccttcctgcc 4440
ctcccttaag tgctctaaga tttttgtaca ggagtaagaa tcaaatactg gtaacatcaa 4500
tcacaagaag ttgaggaaac ctgtaatata gctagataat atacaacgtt tgtcttccat 4560
cagagtgcag aaaccaaacc atgctttgtg ttaaccttaa atatgaaagg tgtttctcag 4620
ggtccccttt gtccttcgtt gctgccatat gaaatcttac aaggaaggat gaggaaaagc 4680
ctggggggag gttctcctcg gaaatgaggt ggtttttttt gttattaagt agaaccgtgg 4740
ctgtg 4745
<210> 34
<211> 5241
<212> ADN
c213> Homo sapiens
<400> 34
tgcgccgtgc ccaccgcccg gcctcgagcg ccccggcggg aggtttttct atatgagtgg 60
agaagacagc tgttaccagg gaggtcatac aacatttttt taggatgtct gaagatgaag 120
aaaaagtgaa attacgccgt cttgaaccag ctatccagaa attcattaag atagtaatcc 1B0
caacagacct ggaaaggtta agaaagcacc agataaatat tgagaagtat caaaggtgca 240
gaatctggga caagttgcat gaagagcata tcaatgcagg acgtacagtt cagcaactcc 300
gatccaatat ccgagaaatt gagaaacttt gtttgaaagt ccgaaaggat gacctagtac 360
ttctgaagag aatgatagat cctgttaaag aagaagcatc agcagcaaca gcagaatttc 420
tccaactcca tttggaatct gtagaagaac ttaagaagca atttaatgat gaagaaactt 480
tgctacagcc tcctttgacc agatccatga ctgttggtgg agcatttcat actactgaag 540
ctgaagctag ttctcagagt ttgactcaga tatatgcctt acctgaaatt cctcaagatc 600
aaaatgctgc agaatcgtgg gaaaccttag aagcggactt aattgaactt agccaactgg 660
tcactgactt ctctctccta gtgaattctc agcaggagaa gattgacagc attgcagacc 720
atgtcaacag tgctgctgtg aatgttgaag agggaaccaa aaacttaggg aaggctgcaa 780
aatacaagct ggcagctctg cctgtggcag gtgcactcat cgggggaatg gtagggggtc 840


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
3G
ctattggcct ccttgcaggc ttcaaagtgg caggaattgc agctgcactt ggtggtgggg 900
tgttgggctt cacaggtgga aaattgatac aaagaaagaa acagaaaatg atggagaagc 960
tcacttccag ctgtccagat cttcccagcc aaactgacaa gaaatgcagt taaaaaccaa 1020
atttcagtat tattggtgcc aacatgtcta tcctgaggac ctttgctgct gttggacact 1080
ccgtcacctt ttggaacaca agtatatcaa gatagtggct actgatgttc aagtgggatt 1140
gaagtgtgat aaatggatat attttgttgt ttgctggggt gttcatggag atgttaagag 1200
attgaggccc tgggctgagg gtatataatg tatgtcaggt aaagtttgaa gactgccaag 1260
gagcagattt tctccctgga aatgtgaaaa ctgaacctat aactctgata aggacttgag 1320
atgtgtagaa acgttgggtt atggaagact agtttcttcc ataaccctga attggagacc 1380
ttaatgctaa gtgtagatta ttgaggtttg ttagtgagga aaagaataag agttcagaag 1440
cctttgttat cagatagcga aatcagggcc tagtgaggag cacaggtcga ctacataatg 1500
gagtccattg gcgaacccta ttgcaatttg gtccaactat atcttctggt gaaggaaatt 1560
aatgatgtaa gaaaatgcaa gaggctcaac ttctcttcca aaaatcttct ggcttctgaa 1620
ctcttcctct gcctctcttt aaataaataa cacagaattt caagtggtag gagacttatt 1680
aagccagtca ccaagcttgg tctgtcagcc tgtcttctaa cacctcaaag atcttgtgcc 1740
ctgtgctgtc cctcccttgt aattatgaaa agttctttgg tttctggggt gaattctacc 1800
catgtataat gaggaattct ctcataacct tttttgtctt gtctgtcatc tctgttcatc 1860
ccttcctata acctctaggt aaaaagaaaa gaaaaaaaga aatttcgaga tattttcaac 1920
attgttagag tttgggctaa aatgagcaag gagaaaaaaa ccaccaagaa catttcctgg 1980
ggcatgttcc agttttgagg ggtgatatat ctgccagata gggggtatct gacccagtct 2040
tcttttcagc tggtctctgg ggggagctga gaactcgctt gctacctcac atccttttcc 2100
ccagactttt tatctcctat gcatcccttt gctttctata gctggtgttt cttccccaaa 2160
atggcgttcc catgcttacc tttctcacat tctagacaat gatggacaaa gacgcatgca 222D
agactcagac ccggggaatg gtgtggtgct aatctcaaca cctgacattc acagcaagca 228D
tggcccagcc caaccgcatg tctatctcaa accgcagaaa ggctttaata ctggaaaaaa 2340
agaattcaag actacaggca gctcccctct gtaccccaac tcatttaaaa taggaggaat 2400
cactttttgc cttacttaac gcttttttct gagcacaggg atgggcacct gcaccccaga 2460
aggtgtgagc tgtctctctg ccaggagcta aggttcatta ggggattgga tggtttatca 2520
cttctttctt tctgagttta cttttagtaa cttttattga tggctacctt tcatgtccct 2580
gtctaaagag actttctctt tcatacgtct taaatctcat caatgaaatc cagtgaaaca 2640
gcaccatttc ttagtatcat taaataacta gaaagtatca agtattgctc tctgctgctt 2700
tatatcatta acatattaat aataccaaga aggaaatact ttgaataagt gtcagattct 2760
gatccagtat tggacacctg tgatattgga cacctgtgag gctgggataa ttacttttga 2820
attacacctc ttctctagtt tctggacctt gctctgtcac tttaacacag ggtgatcaaa 2880
cctgaatgag gatcagaact cacccaggca catactaaag caagattcct aaacctcagt 2940
tccaggggta attctgacat cacccgtcca gcatagtcag ctgaaattat aaatctaaga 3000
aacagttaca tcaagattct gctgtgtcat ttaattctga aactcccagt attctaccct 3060
tcttcatcac tgcatattac cccactcttc catcccaaat tggctatcct ttcagcccac 3120
caacttagcg gcagcactag ggattcatta taaggtaaat ctggtttaca taaagacctg 3180
aaggaggcct gtatttgaag ctcacacttg gtattggtat ctctcatttt tactgagcca 3240
gtgtggaata ccactgtatg tactcatata agcccttgac ttttactgct catcaggatt 3300
ggaatattac tctagcagtc ttcacacata ggcaagttac agtcctttta aaaagnatct 3360
catttcccta taatggaacc taatagccaa ctttttcata gaaattgcta gaagagtttg 3420
atcaactata aatgataaag tgtttataag catagtcagt gtgacacaga aaccaatctt 3480
aaaattgaat ttaatgtttt atcatatcag attaaatatt ttctccatgt cttattttta 3540
ctgcaacaag ttagaaagtg ggaacacttt gattaatgtc ttaaaatttg tgggccctca 3600
tttggataaa ggcagcaatc ctaaggactt tttttttttt taacataatc tgagaatttc 3660
tctgtagagc agagactttc aaaccttttg gctgtaaccc acagtaaaaa acgcatttat 3720


CA 02371500 2001-10-24
WO 00/71710 ~7 PCTlFR0010142G
atcaaacctt agaatatgtt taatgaacaa tacttaccat tctgatgctt tttattgttt 3780
cagtttttaa aatatgccag ttgcaaccca ctaaattgat atctaccaat gggttgcaac 3840
ccttagcttg aaaaaaacac cctcacagag gaactggtat ttcttgaata ccttctgttt 3900
gccaggcact tcaccaggca ttttacaagt aaggaaactg ggcttcagag aaaataattt 3960
gcagaggttt actcaactac aaaggggtga agccaggaat gttaactagg tctgttgagc 4020
tacaaaaact tttaCgtctc tcagactata cagcctctat acaaaattga gatgggggtt 4080
gggggcaggg gctcatgcct gcaatcccag cacttaggga ggcagaggcc agaggatcac 4140
ttgagcccag gagtttgaga ccagcctggg caacatagtg agactctgtc tgtatgaaaa 4200
aaattaagaa ttagctgggt gtggcatagc acacacctgt ggtcccagct acatgggaag 4260
ctgaagtggg aggatcactt gaactcagga gcagccttgg tgacagaaca agaccctctc 4320
tcaaaaaaat atttaaaaaa aggtgggtca tccattctcc tttaccâaac aggctttgaa 4380
atgacacatt ccattcattt gcatcttttt aaaaaacttc tgattcctta ctgagtgtcc 4440
agcagcctca aagtttttaa tggtagctga tgcagacata aacagtgctc aatttggccc 4500
ttaaactata aaatcaagaa agtgtatttc aatcccatcc acctgcctgc aagatttctt 4560
aatgttcact agttataacc attgtttaaa cagtgctttt tgtgtaattt aaaaataaac 4620
tttaatgctt tttaaaacaa atttatcata attcatagat caaatgatta tcctttaaaa 4680
tgataccctt gggaaatcat gtacttactg tagtgatgct agtattaata ttacttagac 4740
caattttgaa gctgctcttt cagaattgcc tccaaagaca ttttgcagat catcccagaa 4800
aagggggtat gatggtgctg tgtagaactg accagagttc ctggaggatt ttgaggttat 4860
actgaaactg agtgctgtac agggagaatt gcatgagtcc agaaacttcc ttctgtgggc 4920
tgcctgcctt cctgccctcc cttaagtgct ctaagatttt tgtacaggag taagaatcaa 4980
atactggtaa catcaatcac aagaagttga ggaaacctgt aatatagcta gataatatac 5040
aacgtttgtc ttccatcaga gtgcagaaac caaaccatgc tttgtgttaa ccttaaatat 5100
gaaaggtgtt tctcagggtc ccctttgtcc ttcgttgctg ccatatgaaa tcttacaagg 5160
aaggatgagg aaaagcctgg ggggaggttc tcctcggaaa tgaggtggtt ttttttgtta 5220
ttaagtagaa ccgtggctgt g 5241
<210> 35
<211> 3014
<212> ADN
<213> Homo sapiens
<400> 35
cccactctcg ctgttctcct ccactctctc tccccatgaa ggaagagacc actggagttt 60
gcatgtaccc tccaatcaaa acgaggctga taaaaacatt cccggttgat acaatgaccc 120
cgtttcctga tactttcacc acagggccac agtttactgc agacttcaga gacagtaaat 180
tacaatgctg tcctggcccg acttccccgc tgatcccagc agcgaccctg aggcctttga 240
cagagaccgt ctccacagtg cagaccattt acaccacccg gaaacctgtt tctctggcag 300
ccagtgcaga gacactccgg caggaactgg agagagagaa gatgatgaaa agactgttga 360
tgaccgaact gtgaaattct ccccttgtca cctggaagat ggcatggtgc cttctgtccg 420
tcttctttct tcgggctttg tgtgctcact ctagcacagc atacaagtgt gtgctttgtt 480
cgcccaggtc tccatggtta gttgaagcca atttctggct tgacttttgt gggaaaagtt 540
attttatgtc tcctaagcat tagagttttt ctattactct atgtagttga gacaggattt 600
gataagtcta ggaaaagaaa gatgggaaaa cgggattcct tttcagaagt acctgtgtgt 660
atctgttaat aaccacaggg gttaatatga,tgtaggatct tttactatca atttcaacca 720
tttgattttg tatgattgaa acttgcaccg agctttgact gtttgttaaa gagtcatttt 780
taatgaaaga ataattcttt attgctggtt tttcatttac actgataaat acacagatct 840


CA 02371500 2001-10-24
WO 00/71710 3s PCTlFR0010142G
tataaagtct ttaacattca tttgtattca gatgtgagta gaagaactaa aaaaagaaag 900
ttacatatca ctatgactga aggtacttca gcttaatctg aaatataatt taacttgtga 960
actccttgga tatgatatta tttggaataa acagaattta tcattgaacc caaagtagga 1020
aatgatagct tacattgtct aaaaatcctt acaaggttaa gatgattcaa tatcaagaat 1080
attcagaaaa ttatttctaa agttgatcga ttcatgtcgt attgatagaa tcttgaccag 1140
aagaaatttt gctcttttta tatagtttca agaaatgtgt ttttaaattt ttattaatgc 1200
acttgaacaa ctttgcagga ataaagcaac cccctaacca caaaatatcc ctctaaatta 1260
gttccctagc tttctcaatg aatacacaca tatttttaca tagctatgat cgttgtgtac 1320
attctccttt gttttacttc tcggcctaac acttgtctcc tcttgtcaac acagattcta 1380
ctctcaccaa tttaaatgtc tttatatcca tgtaacatgg gtaacctcac ttcaccccat 1440
tattagatat ttgagttata tctaattttt cactcttata aatagtgctg ctatgaatgt 1500
ctgtaaaaaa aaaaaaactg ctccttcttt tggattattc ccttaggaat atctccaaag 1560
agggattaca aggtcaaaga gcatgaagta ttttatagct cttgttttat attgccagat 1620
tgctttctag aaagatccaa tctttgggtt ggaaggacct taaaggtcat ctagtttagc 1680
ctccccaccc cctctgaatg cttgaatccc ctcgacaatt tatgatgcca ccagcaatgt 1740
ataagcattt ctgtttacca atagctctgc cagtattggg ttttgccatt tttatttatt 1800
tttgctagtt taataggtat gtatagttgt tcttgaagag ttgttttatt tcattaattg 1860
ctagcaaggc tgagcacttt tccatgtgat gatttactag ttgtatttcc ttgtgtgtaa 1920
aatgttcatt catttcttat gaccacttgt taagaggaac tgatctcata tatttgtatc 1980
agaactgtat ttttatgtta tattgtatag tttgctctcc tgcccctctc cttaaaactg 2040
aatggtgcca ataatttgat actaatgact acaaaaaaag gtaatgcctc atttactagt 2100
attgttgtaa aatgaggaat gtatgtgaat attcagataa ccgaggatta.accctttaag 2160
tgctgaatct ttaaaatttt aatatatttt tttttgaggg aaatctttct aaaatgtatt 2220
acgcacttcc ctgccttagt aaacagagta tactggagag tatttaacct tttcttgatg 2280
agtcatggtc atgattataa acatcagccc cttttatacc ttggtacggt gcagtgatat 2340
cattaagagc tatcaatatg tgtagggctt ggcttggcct tttataggat attatgctgt 2400
tctcactgat ggttttttac tgctctctgc tctgtcagtg gagctatccg gggcaattgt 2460
agcgtttggg tccttttacc cctatgtccc ccggctatac ttttaaaaca gctttagctg 2520
ttctttatct tgtgcacatg atacaaaata tgttcccgta caatatgggg ctgtcacttc 2580
ttgccaaccc agcaccctct tcctcttcta acctgctttc tgaggcttct gctcttcacc 2640
tcctgctcgc tgatggaaac ctccagggca aagctgaagg tttcttgggg aagccaggaa 2700
agccagtatt tcctatgtgt cagatctgct tggcttccaa gaagggatgc atgggctttt 2760
tggccagtgt ttccaggagg ctctgggctt cctgcttctt ccccgcttcc cccagagttc 2820
acagatgttg aagtttctga aggttgacgt cactggaagt ctgaccacaa acaagttggc 2880
tgttactgta tttgaaaccc agtacctttg gcagctcacc tctaaccagt aaaataagag 2940
gattccatgg tttcagcagt tgtcctggtt atttgcctat ttaagtgaat gatgggtgct 3000
tggcattgtg actg 3014
<210> 36
<211> 1575
<212> ADN
<213> Homo sapiens
<400> 36
tccaggggag atccagaatg catgtgtctc ttcccacgca tttatgtcat gttggtagct 60
ttagatcagc catggtgaga aaagaacaaa agcttttagt tgtttttgtt ttgttttgga 120
gaatttgttt accagtaaat acatcactgc ctgtacccca aatgttacca gctccctgag 180


CA 02371500 2001-10-24
WO 00/71710 39 PCTlFR0010142G
gtgtcccaca tactattgtg agttctcaga gcatgaactg tcctcagaag agcagggcta 240
ggacttgtcc cagcatctgt gcctccatac caatcctctt tctcacagag aaccacttcc 300
catataagat gcttaaggct ctcaaaacag cagaacaatg aaacatàctc tccctacact 360
tgcttagcca agagatacca ctcaggtaac ttttttcagg acatggaaga tctgtttcaa 420
ggagatttac tgctatttta tttggaagaa gctggcaact ggtcttgacc aaaatagaaa 480
aaaaaaaaaa agtccacaaa tttaatcact tgtagggaac ccatctatca aggtacccta 540
ccatatactt ttgtatttaa tagattactt agaaaccaca aaaataggaa tccttacccc 600
ttcaattcct gttcaaccct aaaaactgtg ataaacgctc ccaaccctgt ggtgatcagg 660
gttatgtaat gttcaaagat tcagacacac ctgggtttgg attcagttgc aactgggttg 720
ttatcacact cacttctttt tagctgtgtg agcatgaata atttacttag cctctctgtg 780
tctttccacc taattaaaga ggatcyaccc cagggttatt ttgaggattc aaaaaggcat 840
gcaacacacc tggagcacaa ttccactttc attcaactaa ttcccttccc ttcccccttc 900
ttccccttct acaagatcaa tatgtaaagg agacatgagg cttactggtt gcttttgaac 960
acttacttag ttcttagcta cacccactct aaaattaact ggacattagt gtacagccca 1020
tgtccaagcc cagagagaaa acaatgggaa caatttcaag gtcctcacca ctccttcatt 1080
tgcagagggg acaacagact ttctgacctg agaactggag aatttttaaa acaaaatctc 1140
tcattccagc ccaacctatt taactttttg tggaggaatt ttacatggag gaagtgagca 1200
catgtcatgc tagccaagag gacattattg tcattaaaga gaggcattat ttatacaccc 1260
tgcaatgtgc acattaaaat atggaaattt taaaattatg accaagggct tgaaacatat 1320
tggattacat gctcacattt aacaaagaga ggaaatgtgt ttcagtttct ggagtggctg 1380
gaatttacaa gctaattgtt caataaatct actcaagata gttacctaag gctttgtggc 1440
aatgaccttg aactgagagc ctgtatctgg atttagcact tgaaagatct aactggatat 1500
ttgggttaaa agaatcacat ttattcccaa atcggaatgc tttgtttttc ctgtcagtta 1560
attgccagtt gccaa 1575
<210> 37
<211> 1607
<212> ADN
<213> Homo sapiens
<400> 37
gcgaatcacg acgggcggtg gccgttgggt cccggcggga ggcggggttt ccgctccctg 60
gggcgcacgt cagtcaggag gcggaagcgc agcgggggcg ggaaggttgt agtgccgcga 120
gttgagctcc tcttgcctaa gtggtcgcgc cccctttaag agcagcgatt gtaaggagag 180
gcggtcccgg tgtcctcggg tcccaggtga ttgtgaagtg ctgaccaatt gccactggac 240
atacttgaaa caaaatagga aaatggcagc aaactcttca ggacaaggtt ttcaaaacaa 300
aaatagagtt gcaatcttgg cagaactgga caaagagaaa agaaaactac ttatgcagaa 360
ccagtcttca acaaatcatc ctggagctag cattgcactc tcgagaccct ctcttaataa 420
ggacttccgg gatcacgctg agcagcagca tattgcagcc caacagaagg cagntttnca 480
gcatgctcat gcacattcat ctggatactt catcactcaa gactctgcat ttgggaacct 540
tattcttcct gttttacctc gccttgaccc agaatgaaga aaacatttgc gatggaaaag 600
tgactttgta atatcaaatg ccaaagctac tatcattcag tgctacatga actgtgactt 660
taagaatttt ggtgaacttt gatatttttt gtttgtctga aagaaaggaa tgtgtaagtg 720
aaagctgaaa gaagaataac caggatgatg agagctgtgg aagctgtatc gtccaaggaa 780
ttgattatgt accgtgactg taactttttt gtaatgctgt ttaactctca atcagactgt 840
gaactggatg gtcacgaagt cattccccaa ctcctagcaa gtttgactga atatatcatg 900
tccacagtag attttcaaga atcatttata gtacttaact ttaaagaaac aaggctgctt 960


CA 02371500 2001-10-24
WO 00/71710 40 PCTlFR0010142G
ttaaaaaatg aactaatagg cttaaatcaa ttgcatccat atttgctgtt tataggattg 1020
ctatcagtat accttttgcg tttatagtca acatgtatca tcctgaaata ttctttctgg 1080
acttataact acttccccct ttttcacttt aaaacaaacc tcaagaataa attactaacc 1140
agtcttaacc atcttttata aacatatgct cttataaatg ttgtgactag atgcaattaa 1200
aaataatagg gaatgtggta ggtttttaat ttgtacatcc tcttatttag tgttaccaca 1260
taaatgatga gtttgtgtgg ttctgttttc catttttgtt ctaactgaaa actttttggc 1320
tgggcacggt gcctcatgcc tgtaatccca gcactttggg aggccaaggc gggcagatca 1380
cttgagatca ggagtttgag accagcctgg ccaacatggt gaaaccçtgt ctctactaaa 1440
agtataaaaa attagccatg tgtggtggca cacgcctgta ntcccagcta ctcnggaggc 1500
tgaggcagga gaatcgcttg aacctgggag gcaggggttg cagtgagctg agacggtgtc 1560
actgcactcc agcctgggtg acagtgagtc tttgtctcaa agaaaaa 1607
<210> 38
<211> 1161
<212> ADN
<213> Homo sapiens
<400> 38
agctcctctt gcctaagtgg tcgcgccccc tttaagagca gcgattgtaa ggagaggcgg 60
tcccggtgtc ctcgggtccc aggtgattgt gaagtgctga ccaattgcca ctggacatac 120
ttgaaacaaa ataggaaaat ggcagcaaac tcttcaggac aaggttttca.aaacaaaaat 180
agagttgcaa tcttggcaga actggacaaa gagaaaagaa aactacttat gcagaaccag 240
tcttcaacaa atcatcctgg agctagcatt gcactctcga gaccctctct taataaggac 300
ttccgggatc acgctgagca gcagcatatt gcagcccaac agaaggcagc tttgcagcat 360
gctcatgcac attcatctgg atacttcatc actcaagact ctgcatttgg gaaccttatt.420
cttcctgttt tacctcgcct tgacccagaa tgaagaaaac atttgcgatg gaaaagtgac 480
tttgtaatat caaatgccaa agctactatc attcagtgct acatgaactg tgactttaag 540
aattttggtg aactttgata ttttttgttt gtctgaaaga aaggaatgtg taagtgaaag 600
ctgaaagaag aataaccagg atgatgagag ctgtggaagc tgtatcgtcc aaggaattga 660
ttatgtaccg tgactgtaac ttttttgtaa tgctgtttaa ctctcaatca gactgtgaac 720
tggatggtca cgaagtcatt ccccaactcc tagcaagttt gactgaatat atcatgtcca 780
cagtagattt tcaagaatca tttatagtac ttaactttaa agaaacaagg ctgcttttaa 840
aaaatgaact aataggctta aatcaattgc atccatattt gctgtttata ggattgctat 900
cagtatacct tttgcgttta tagtcaacat gtatcatcct gaaatattct ttctggactt 960
ataactactt cccccttttt cactttaaaa caaacctcaa gaataaatta ctaaccagtc 1020
ttaaccatct tttataaaca tatgctctta taaatgttgt gactagatgc aattaaaaat 1080
aatagggaat gtggtaggtt tttaatttgt acatcctctt atttagtgtt accacataaa 1140
atgatgagtt tgtgtggttc t 1161
<210> 39
<211> 1332
<212> ADN
<213> Homo sapiens
<400> 39
gattaccggt gtganccacc angcccggcc aagaactgat tttaaaataa attccatctc 60


CA 02371500 2001-10-24
WO 00/71710 4 ~ PCTlFR0010142G
agcaataaca atgaaaaata aatgnatana caaatanatt tggtctcaag cattnagaaa 120
gaggtaattg taatgccctt gggtcganga atgtgnantc tatgtnaata gnttaattgg 180
cctttttgtt tggaatcttt cgcagcatag ctcatgcaca ttcatctgga tacttcatca 240
ctcaagactc tgcatttggg aaccttattc ttcctgtttt acctcgcctt gacccagaat 300
gaagaaaaca tttgcgatgg aaaagtgact ttgtaatatc aaatgccaaa gctactatca 360
ttcagtgcta catgaâctgt gactttaaga attttggtga actttgatat tttttgtttg 420'
tctga.aagaa aggaatgtgt aagtgaaagc tgaaagaaga ataaccagga tgatgagagc 480
tgtggaagct gtatcgtcca aggaattgat tatgtaccgt gactgtaact tttttgtaat 540
gctgtttaac tctcaatcag actgtgaact ggatggtcac gaagtcattc cccaactcct 600
agcaagtttg actgaatata tcatgtccac agtagatttt caagaatcat ttatagtact 660
taactttaaa gaaacaaggc tgcttttaaa aaatgaacta ataggcttaa atcaattgca 720
tccatatttg ctgtttatag gattgctatc agtatacctt ttgcgtttat agtcaacatg 780
tatcatcctg aaatattctt tctggactta taactacttc cccctttttc actttaaaac 840
aaacctcaag aataaattac taaccagtct taaccatctt ttataaacat atgctcttat 900
aaatgttgtg actagatgca attaaaaata atagggaatg tggtaggttt ttaatttgta 960
catcctctta tttagtgtta ccacataaat gatgagtttg tgtggttctg ttttccattt 1020
ttgttctaac tgaaaacttt ttggctgggc acggtgcctc atgcctgtaa tcccagcact 1080
ttgggaggcc aaggcgggca gatcacttga gatcaggagt ttgagaccag cctggccaac 114D
atggtgaaac cctgtctcta ctaaaagtat aaaaaattag ccatgtgtgg tggcacacgc 1200
ctgtantccc agctactcng gaggctgagg caggagaatc gcttgaacct gggaggcagg 1260
ggttgcagtg agctgagacg gtgtcactgc actccagcct gggtgacagt gagtctttgt 1320
ctcaaagaaa aa 1332
<210> 40
<211> 10419
<212> ADN
<213> Homo sapiens
<400> 40
accgcntccg ggctccttcg gccncgccat gggctgctgc agctccgcct cctccgccgc 60
gcagagctcc aaacgagaat ggaagccgct ggaggaccgt agctgcacag acataccatg 120
gctgctgctc ttcatcctct tctgcattgg gatgggattt atttgtggct tttcaatagc 180
aacaggtgca gcagcaagac tagtgtcagg atacgacagc tatggaaata tctgtgggca 240
gaaaaataca aagttggaag caataccaaa cagtggcatg gaccacaccc agcggaagta 300
tgtattcttt ttggatccat gcaacctgga cttgataaac cggaagatta agtctgtagc 360
actgtgtgta gcagcgtgtc caaggcaaga actgaaaact ctgagtgatg ttcagaagtt 420
tgcagagata aatggttcag ccctatgtag ctacanccta aagccttctg aatacactac 480
atctccaaaa tcttctgttc tctgccccaa actaccagtt ccagcgagtg cacctattcc 540
attcttccat cgctgtgctc ctgtgaacât ttcctgctat gccaagtttg cagaggccct 600
gatcaccttt gtcagtgaca atagtgtctt acacaggctg attagtggag taatgaccag 660
caaagaaatt atattgggac tttgcttgtt atcactagtt ctatccatga ttttgatggt 720
gataatcagg tatatatcaa gagtacttgt gtggatctta acgattctgg tcatactcgg 780
ttcacttgga ggcacaggtg tactatggtg gctgtatgca aagcaaagaa ggtctcccaa 840
agaaactgtt actcctgagc agcttcagat agctgaagac aatcttcggg ccctcctcat 900
ttatgccatt tcagctacag tgttcacagt gatcttattc ctgataatgt tggttatgcg 960
caaacgtgtt gctcttacca tcgccttgtt ccacgtagct ggcaaggtct tcattcactt 1020
gccactgcta gtcttccaac ccttctggac tttctttgct cttgtcttgt tttgggtgta 1080


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
42
ctggatcatg acacttcttt ttcttggcac taccggcagt cctgttcaga atgagcaagg 1140
ctttgtggag ttcaaaattt ctgggcctct gcagtacatg tggtggtacc atgtggtggg 1200
cctgatttgg atcagtgaat ttattctagc atgtcagcag atgacagtgg caggagctgt 1260
ggtaacatac tattttacta gggataaaag gaatttgcca tttacaccta ttttggcatc 1320
agtaaatcgc cttattcgtt accacctagg tacggtggca aaaggatctt tcattatcac 1380
attagtcaaa attccgcgaa tgatccttat gtatattcac agtcagctca aaggaaagga 1440
aaatgcttgt gcacgatgtg tgctgaaatc ttgcatttgt tgcctttggt gtcttgaaaa 1500
gtgcctaaat tatttaaatc agaatgcata cacagccaca gctatcaaca gcaccaactt 1560
ctgcacctca gcaaaggatg cctttgtcat tctggtggag aatgctttgc gagtggctac 1620
catcaacaca gtaggagatt ttatgttatt ccttggcaag gtgctgatag tctgcagcac 1680
aggtttagct gggattatgc tgctcaacta ccagcaggac tacacagtat gggtgctgcc 1740
tctgatcatc gtctgcctct ttgctttcct agtcgctcat tgcttcctgt ctatttatga 1800
aatggtagtg gatgtattat tcttgtgttt tgccattgat acaaaataca atgatgggag 1860
ccctggcaga gaattctata tggataaagt gctgatggag tttgtggaaa acagtaggaa 1920
agcaatgaaa gaagctggta agggaggccg tcgctgattc cagagagcta aagccgatgg 1980
cttcgggagc aagttctgct tgaacctagc cgacggttat ggaaacccat tgacattcca 2040
aaacaatata tacacataac tatgtatttg tgtgtgtggg tgtgtgtata tatgtatatg 2100
tatgtgtgta tatatgtata tgtatataca cacacacaca taaatcagcc aaaatcagag 2160
aaaaggaaca gggatttaat acctttttta tgcttatttt tgtcaaacat gtactccttt 2220
catacgggtg gcttttacaa ggcaacttcc gtcatttaat gttttcaact gtaattgtct 2280
taatggaaat gttaaaattc atatctgatt aacattttta ataacttaga ggagatttta 2340
actttattta aaaataggta aaattattgt acctaattat gtctaaagtt tattcagggg 2400
taatttccct gatgtctgta taaaatcaag atcttatttt actgatgcat aagtcctagt 2460
gggtcaagac taggcatatg ctttcagata aataaggaat tactccaatc agttttcccc 2520
aatcaaagaa gccatgtcat tttactttta gaaacataca attgggccca atatgggaat 2580
tttcataata gttcatacat ttgtcagcca acattaaaag gtaaccaact cctcaggtat 2640
ttgtagttta ccctaacgct tctttaaaag aaagtaggta aaaaaagaaa agggtagata 2700
atctttcgta tgcaaacttt tcccttatat tttgtctttc tttccttttt gactttagta 2760
gcatcctcca cacatttgtg tgcctgattt gaaaggaagc tggggcaccc agcgagttta 2820
gcctttaagt ttctgtgtat tgatttgcag attaagtaat gctgggagga ataaagaagg 2880
gacagaaaca tggaacataa agcattgaaa attccggtgc ttgggcttcg gcttcagagt 2940
aacgtcagtg gcttagggtt aaacggccat tttattcaaa tgcttgctat acaatctgaa 3000
aacacactgg caggtgctcc tctccttggc aattcattga gtatccagag ttctacgatg 3060
tttaactgaa gaattggcta atgttttgat cctccagtgt gactgttgtt tttgtttggg 3120
ggtgggttgg ggttttttgc tttttattcc tgaagcttac cagatatgaa tggctaatac 3180
tcçattgttc tgcttgttgt aatggtgaat gctttaagaa aaaaaagtgt aatttgctaa 3240
gaataattca tgatctgttt atgcgataac tcctttttgt tacaattttt ttaaaaaaag 3300
ctatttttgt taatgtaaag taaatatttc agagcaaatt ttttaaactt attgcactaa 3360
atacaggctc tgtacaaaaa aaaaaaaaaa aaaaaaaagc ctcagcattt tatcattcca 3420
tggaaggaga atcttttgaa agaaagcatt gcctcctacc agaactagac agtgaattag 3480
atcggtatta tggaaatgca tacaagtaat gtcactaggg cttaataagc agccgtttgc 3540
taatgtgctt cctttcaaag ggttggacct ttaaattgct gcaaaaggta aattgtattt 3600
ttttttaagt attggtgttc tttactctag ctaggctaaa atttgctaaa tgccttggtt 3660
tcttttaaaa gttcatgtaa tatttctgat ttttcagaat atttgcaata agagtctgga 3720
ttttaaaaaa cacatgcata cacacaatta agagctcatg tcttagcaag atctgggaaa 3780
ccaacattgc gagagtagct attttgaaag aataattctc cagaagttaa catctaatat 3840
ctagtatcac caaacagtat cgctgttctc ttttattcat ttgaaatgaa tataattata 3900
taactaacaa ttgtccaaat agatgagaga gcaaatcatg tgagaaaatt cagaatacca 3960


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
43
tctgtttcat agccgcacag attttggact ttcacaaaca ttgggaacta aatttagaat 4020
tggcaaaagt ctagaagatg ggtatcaaaa cagaagacat tccaggagct agcaatttta 4080
agaggtgtcc ctccaaagtg acctgatgga agtcctgaac ttggaaatta ggttctactc 4140
acttggacat ccctgcatca tggactgttg ctgctccctg ttccatatgc tcgcaatctc 4200
agctatttgg aagctaccag gaatgctttc taattatcat ttgcaactag aactgtaatc 4260
agaaagaaat tttgtatttt tgtataactt gattgtgtgc cattttâtat aacaggtcct 4320
gttttacaaa taaattttgt tttactaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaggg 4380
tggggggaaa agagttgcaa attaattgcc aggctgtttt ccttaagtaa attcatgtgc 4440
cgtgtagaaa tatgcagata tgcattacac aggcacacac agagagatat ttaatatgtg 4500
gaatatcact ctttcatgag ctttattcct tgattaattt gataaagcct cacagaggat 4560
tttaagcaat atttaaatgt gttgaggtta tgtttggata ttcctgctgc ctcttttcat 4620
tcatttcaag tcattcttca gctagctatg ggctgcctta ttgctattcg ctcactgctt 4680
ccatcttctg cccaagtgag aagaatagat gaagaacaga aatttctctg tgaaatgtgg 4740
atacccgaat aatttcataa atcattgatt ctatgtggtg gtttttgtct tcttctgtgg 4800
tgaatcttca aaactgtatt caggactcat atttctagag ttttaattgg ggtcctctat 4860
tgtcaattgt agtagtgacc agagtatcgt ggtttttgcc atcagataat taaggctctg 4920
gtgcataatt tagactttct aagctcctgc ctgaagaata aggtcttcca taatatggaa 4980
gagaaaagtt atatttcagt gtaaatccaa gagacccatc ttctatgaga ggcttaccag 5040
tgcattagta ataaaacatt agcaatttag ctagagcact gagattgtat aatccttgca 5100
tggatgagca gagctcaaag ccagttgttc ctttaaagca tttaatgcaa tggctaatgt 5160
ttaggattaa agtttttatt ttatcctata agataattaa gtcctaagtc actacaactt 5220
aagtagctta actgtatgtt ggtacccaaa ctttttctat aatggttaag gaggaggcac 5280
ttactgagtt tattttaaag ttatgctaga aatgtttttc ttttgtagag atgctctctc 5340
tctctctctc tttttttttt tttttttttt ttccgtgagg gcattaggct gctgattgta 5400
agttatttcc aataccactg atcttggtat ctgccaaggg cttccttgcc ttccctgggc 5460
agttttagga tttcacccta gtagggggta tgaggcactg acccctttat tctggaccca 5520
aactgcttta gagcagagtt aatacctctc cctccctctt caaaacagct acaggaactg 5580
caggcaccac atatgtgtga ggccacatca ctgcccctga ggcttcaact atttccacca 5640
tgcactatta ctagctacta acagccattt taagagatct cctagcctgc aaggtagaat 5700
tctgggatca gttccaaaac cagaactgcc agtaatggtg acttgaatat tttatttgat 5760
ttttggtcag taaccttgtc atttaaattg gactttccaa tagccttaac atggcctctg 5820
agaagtttcc tccagaaagg tctttaagct ttcgcttttc aataagtaag ttctttactg 5880
cttttctact gctactttaa aaaaaaacac acacacaacc accaataaaa ctctcagagt 5940
ctggaggctt atcagtgcac ctgccacagt taatttctgt attcttttca tacattccat 6000
ctgacacata agagtgcact ataatggctt gcctagaact ggtaagaagt ggtctgtgaa 6060
tgtatattga aaaaatgtgg gttcataagt aaaagcgtaa cgcagatatt tgtgtattct 6120
gtattcacag cgtaggctgc cttttgcttt aaatgcatat tcatgtatct ttgtgtgcta 6180
agaatgcatg ttagcccttt tgaaaagtag gcactattca tacacagtag cttcttggaa 6240
ttaactcatc tttgttaact tagtggcaca tagtccaaat ttttaaaaag caagaccctt 6300
gaatatgcca agagaaaatc taaagctagc aaacttaaaa aacaaaataa aaattacacg 6360
tcgtgtacag ttatgaattt agaatagcac actttttcca ttcagatttc atacatttga 6420
gccaaattct tatactccat gttttaattt taaaaggata attttaatcc aagatttaaa 6480
tctttgaaaa tatctttctt atagaaaact ttaatgcagt ttttaaactt actgatttct 6540
gtggaaaacc tttcttttct atagaaatac tgtagtgccc tttcttccca tcttgatttt 6600
gtacatgtaa agacaaatga tgattcagtt tcaatattgc atgaacaatt gccactttgt 6660
aaattatatg gacagaatgt~gttctaagga aattcgttag taaatttgtg aaaaacatgt 6720
gagattgttc gagacctatt aggctattct tcagttttga tgctcagttt tacaacttaa 6780
atgattttct ccaggacacg gagctcagaa taataaagct tttattaatg gtctagtgaa 6840


CA 02371500 2001-10-24
WO 00/71710 4~ PCTlFR0010142G
gatctagttg aacatggaaa cattgtaatt tacaaatgtc tcagaaattt ctcactttta 6900
tttgctaaga cctgaattta atatttgata ttcaaaaaca agttattttg aagagacaat 6960
gggtctcttt gagcttaaga aagctatgga ctatctttcc ttcaaatgca catcacatgt 7020
ctgtgaacac tcaaaatgct catagaattt cagggccctc agacggccag cttccacccc 7080
tgtaccccct caggggctaa tgaacccaag tcaaaaggct gctctaaagt tgttctgata 7140
atgtgttttg aaatgaggaa gtgattaggc ctccactaga gatacttttg agatgatgct 7200
taccaccttc tgacctggaa tcatttttat aacttaaaga ctttatgtaa tttagtagca 7260
ggttagggaa tagaaaccac actaatctga aggaataaca agatgatcaa cactgaatct 7320
tcatgacagt aagattttct ttccttggag gtatgagggt gtgtgtgtgt gtgtgtgtgt 7380
gtgtgtgtgt ttgtgtgtgt gtgtgtgtgt gtcctggcgg ttatttgggg gcaaggtacc 7440
agattatttg cagtgagcca aaaaaaaaaa atatccaaga agaaataaat agggaatcct 7500
tgtaattaat ccatctacca aaacacttga ttctttttat tgtagctcag ctatgacatt 7560
atgacattat gtggcttagt gttatcagta tactactgtc ttaaaatata tttgtcaaca 7620
tgtccagttc caacaacagt tgaagatgat gataaattag caaactcaag ggtagtccat 7680
agttggcaaa aaataaattt ggtagaaagt tggaggagca gatgctgaag gtagaaatgc 7740
aaaagatgtt ttttcttcct gcataaatca cggaggtgtg ttctgtttta gtgttttcca 7800
gtcacccact agagcagctt cagattcctc tgccaataga actccacccc cagtccctta 7860
cctactctat cttctttagg gaagcatgtg gatttcttca catctgcacc ttactattag 7920
gtaagggtgc tgcatctaca tggaaggctc cctgggccct tgaaaaagca ggcagaaact 7980
catcaagggg tttgaagttc ttgtgaaatt tgatcccagt ggctcatgac ttatagtcag 8040
gcatcaaacc atttcctact ttttcaggct gaagaaagtg gaaatataac tggctggtga 8100
agaaaggaga aaagtcagcc ccctaccccg ccccacactc ctagaaaagt.ttgggggttt 8160
tttttgtttg tttttggtgt ttttttgaga cggagtctcg ctctatcgcc agcttagagt 8220
gcagtggctc aatcttagct cactgcaacc tccacctccc aggttcaagt gattctcctg 8280
catcagcctc ctgagtagct gggaccacag gcatgtgcca ccacacccag ctaatttttg 8340
tatttttagt agagacgggg tttcaccacg ttggccaggc caatctcgaa ctcctgacct 8400
caggtgatcc acccgcctca gcctcccaaa gtgctgggat tacaggcatg agccaccgcg 8460
cccggcctag aagagtttta atgaaccttc cacagtagta aatgcagaga ccactggtgg 8520
aaattcccat gttggataga aaagggcgta agtccagtct aagtatctaa atgtgatatg 8580
cccttttgtc acagaagtgt aagacttaaa gggaatattc tgaccttcgt gtatgaatct 8640
gatccaccca tcctgtcagc taggattata atttgaactg tcgtttcagg agcatgtgtt 8700
aaatcatatg agtaaaaaaa aagtagacat tgaaaagaag acttgggaat aattgggcag 8760
atagaatggg ttccatggat cattctagtt gccactagaa aatgtgagct ccttcttcat 8820
ttaccatgtt gataatccgg tggtgacttt tttttttttt ttgtaaattg tattagatac 8880
cccacaggaa tgtgacaata ataggatagc tttgggggct ggtgatttga aacagggact 8940
attaagtaga ttttccccca tcctctaggt tcctgtagtc tgtgctcaga acttggtttt 9000
tggcccctat tgtttttgcc tattttgatt ttcagagatg atcacatggg gacagttaac 9060
ttttcttctg ctgtgttgcc ttaatgctac tagattgtgt tgtgttgttg gagttttctg 9120
acttcttccc tataaaaaga tactgagagc tccataatga aagaagttgt tatactttct 9180
cagaatattc tggaccactg aatgcacttc taatagagct ttaatctaaa gaagttagtt 9240
cagtggttat taactgattt tattacagga gaaaaaaact ttaacaaaaa ggcagggaga 9300
aaagtgtgaa gggcatcaag caaaatgaca ggggcttcaa aaaacaacca aagacaaaac 9360
cctatcttct gaagaccaaa ggtccaactt tacttactgg ctggcacagc ctttctgaac 9420
tccttgagtt tagaatagag ctcctagaat aataaggcgg ccaaatttta aagatcagtc 9480
aatacagtag ggacctgcta ttgatctctc aggcactgag ttcttcacat ccagtgtcaa 9540
gcccagccca gcatatgggg tgatatgagc agaaaacaca catcggtgtg tcttgatttc 9600
tcgcagctgt gtaatgtggc atgagaagta tgttttggtg ccacatattt ctcaatctga 9660
tgcctttttg tctttttttt tttttgccat ttgcatccta tttcatagtg ccaaaatgaa 9720


CA 02371500 2001-10-24
WO 00/71710 45 PCTlFR0010142G
tttttgtatc ttgtcttgtc tttgtccatt ataaactgga ggatcacagt taagccttcc 9780
atgaattcat agtttggaat catttacctt accattattt tggatttttt tcttattaca 9840
gtgtcactac actgtattca tgtgggggaa caaacatgta ggtgcttgaa catgccccac 9900
agacacagtt gtagccctag tatttgtgac ggtcattatt gacacagtgc agactttnca 9960
gatggagcat tatgctctca gaggacttta aaaatatgta tattaagcaa ttaactttct 10020
ggagttggag ttatcaaatc ttgctgggaa attaacttcc aagagctctg aattggatgg 10080
aattccatct ggcttcagag aacaatcagc ctatatgaaa cggagctttg aaatgttttt 10140
cttgtgcaga aatacgaact agaaagaaaa gtgctgatct aatgctaagt tttctctgtg 10200
tactgactca gttgccagaa ttataatgaa aactgtattt tagtctaaca aatgtataga 10260
attttttatg taataaataa aattttatag gaaagadaaa aaaaaaaaac tgtgttgtaa 10320
cacttcccat gcccagggtg gtgacgataa aatcatgggc aacatcttcg tttcaaatta 10380
ggtcagtatg ctgcaagggt gccccagaat tcccagctg 10419
<210> 41
<211> 1813
<212> ADN
<213> Homo sapiens
<400> 41
tgtgtgtagc agcgtgtcca aggcaagaac tgaaaactct gagtgatgtt cagaagtttg 60
cagagataaa tggttcagcc ctatgtagct acaacctaaa gccttctgaa .tacactacat 120
ctccaaaatc ttctgttctc tgccccaaac taccagttcc agcgagtgca cctattccat 180
tcttccatcg ctgtgctcct gtgaacattt cctgctatgc caagtttgca gaggccctga 240
tcacctttgt cagtgacaat agtgtcttac acaggctgat tagtggagta atgaccagca 300
aagaaattat attgggactt tgcttgttat cactagttct atccatgatt ttgatggtga 360
taatcaggta tatatcaaga gtacttgtgt ggatcttaac gattctggtc atactcggtt 420
cacttggagg cacaggtgta ctatggtggc tgtatgcaaa gcaaagaagg tctcccaaag 480
aaactgttac tcctgagcag cttcagatag ctgaagacaa tcttcgggcc ctcctcattt 540
atgccatttc agctacagtg ttcacagtga tcttattcct gataatgttg gttatgcgca 600
aacgtgttgc tcttaccatc gccttgttcc acgtagctgg caaggtcttc attcacttgc 660
cactgctagt cttccaaccc ttctggactt tctttgctct tgtcttgttt tgggtgtact 720
ggatcatgac acttcttttt cttggcacta ccggcagtcc tgttcagaat gagcaaggct 780
ttgtggagtt caaaatttct gggcctctgc agtacatgtg gtggtaccat gtggtgggcc 840
tgatttggat cagtgaattt attctagcat gtcagcagat gacagtggca ggagctgtgg 900
taacatacta ttttactagg gataaaagga atttgccatt tacacctatt ttggcatcag 960
taaatcgcct tattcgttac cacctaggta cggtggcaaa aggatctttc attatcacat 1020
tagtcaaaat tccgcgaatg atccttatgt atattcacag tcagctcaaa ggaaaggaaa 1080
atgcttgtgc acgatgtgtg ctgaaatctt gcatttgttg cctttggtgt cttgaaaagt 1140
gcctaaatta tttaaatcag aatgcataca cagccacagc tatcaacagc accaacttct 1200
gcacctcagc aaaggatgcc tttgtcattc tggtggagaa tgctttgcga gtggctacca 1260
tcaacacagt aggagatttt atgttattcc ttggcaaggt gctgatagtc tgcagcacag 1320
gtttagctgg gattatgctg ctcaactacc agcaggacta cacagtatgg gtgctgcctc 1380
tgatcatcgt ctgcctcttt gctttcctag tcgctcattg cttcctgtct atttatgaaa 1440
tggtagtgga tgtattattc ttgtgttttg ccattgatac aaaatacaat gatgggagcc 1500
ctggcagaga attctatatg gataaagtgc tgatggagtt tgtggaaaac agtaggaaag 1560
caatgaaaga agctggtaag ggaggcgtcg ctgattccag agagctaaag ccgatgctga 1620
agaaaaggtg actggtctca tgagccctga agaatgaact cagaggaggt tgtttacatg 1680


CA 02371500 2001-10-24
WO 00/71710 a6 PCTlFR0010142G
aggttctccc actcaccagc tgttgagagt ctgcgattat gaagagcagg atcttattac 1740
ttcaatgaaa gcàtgtaaca agtttctcaa accaccaaca gccaagtgga tttggtacag 1800
tgcggctgtc taa 1813
<210> 42
<211> 1377
<212> ADN
<213> Homo sapiens
<400> 42
ggggcccccc ccncccncca taataggntt tttgggannc ctggtcccta aacctcnaaa 60
gntngcccng gggnatattt ttgaggcaan aaagnccgac attgatggaa ggtcccaata 120
tgttactccc tncacccctc ccttaccatt tgggaagcag tgnctaaacc ctgggaaaat 180
acaaagnagt ctcctgccta cacattcatc aaactttctg tatggtacca tggtttcata 240
cacctgtaac ccaggatatg aacttctggg gaaccctgtg ctgatctccc aggaagatgg 300
aacttggaat ggcagtgcac catcctgcat ttcaattgaa tgtgacttgc ctactgctcc 360
tgaaaatggc tttttgcgtt ttacagagac tagcatggga agtgctgtgc agtatagctg 420
taaacctgga cacattctag cgggctctga cttaaggctt tgtctagaga atagaaagtg 480
gagtggtgcc tccccacgct gtgaagccat ttcatgcaaa aagccaaatc cagtcatgaa 540
tggatccatc aaaggaagca actacacata cctgagcacg ttgtactatg agtgtgaccc 600
cggatatgtg ctgaatggca ctgagaggag aacatgccag gatgacaaaa.actgggatga 660
ggatgagccc atttgcattc ctgtggactg cagttcaccc ccagtctcag ccaatggcca 720
ggtgagagga gacgagtaca cattccaaaa agagattgaa tacacttgca atgaagggtt 780
cttgcttgag ggagccagga gtcgggtttg tcttgccaat ggaagttgga gtggagccac 840
tcccgactgt gtgcctgtca gatgtgccac cccgccacaa ctggccaatg gggtgacgga 900
aggcctggac tatggcttca tgaaggaagt aacattccac tgtcangagg gctacatctt 960
gcacggtgct ccaaaactca cctgtcagtc agatggcaac tgggatgcag agattcctct 1020
ctgtaaacca gtcaactgtg gacctcctga agatcttgcc catggtttcc ctaatggttt 1080
ttcctttatt catgggggcc atatacagta tcagtgcttt cctggttata agctccatgg 1140
aaattcatca agaaggtgcc tctccaatgg ctcctggagt ggcagctcac cttcctgcct 1200
gccttgcaga tgttccacac cagtaattga atatggaact gtcaatggga cagattttga 1260
ctgtggaaag gcagcccgga ttcagtgctt caaaggcttc aagctcctag gactttctga 1320
aatcacctgt gaagcngatg gcnngtnnag ntntgggttc ccccactgtg aacacac 1377
<210> 43
<211> 452
<212> ADN
<213> Homo sapiens
<400> 43
acaatcttga gcttcaagtc agtggaaaga aatgtacaat ctaattgaac acaaaaaaat 60
ttatatttca aaacattcaa agtgtcagat tggttgcata aattaaaaga gattagagaa 120
gaggaaaatc agtggacttg gagtgatcag caaaggcttc aataagtagg tagaacttaa 180
tctgggactt aaatgtgaaa attgaccagc ttgggaaggg aaaaagggag gtggtaccac 240
attaaggatg tggaagtcaa gcaggaacag caggaaatgg gataatgcta acggtatttt 300
gaaggcccag cagtggctgc ttgcagggaa gttggagtcc aatcnttttc cntacgtgcc 360


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
47
ntttttgggg tatccttccn gatttgctta agtttttntt ttnattaatt gctngggttt 420
tttttttccc gcngttttgc ccgtntcccc cg 452
<210> 44
<211> 562
<212> ADN
<213> Homo sapiens
<400> 44
gtgcacatct tcagaaaact gatcctaagc aaatatcata atgaaaaacc atagattgtt 60
aatggactaa gagaccttta ggttcattag ctccaaaccc ctcattttac agaagagaga 120
attgtaagat agatagaaaa ctagtggcag aatcaagagt aaaactcagg tctgatgctt 180
ctcagatctt tccataagtt agcacttgtt tcccatgcct cttagttatc tcaaagaatg 240
acccccatcc gtataaacat cacagataat gcccaggtat ctgggacttt caatcctgtt 300
ttcatcaact cctaaagaga tgttagctct tcagttcaat tttttctttt gaatctattt 360
ggttgctttt tttttttttt ccagggaaaa ggaggactgg gttttaacca ctgcacgacc 420
atctgggctc tcccaaaagg cagggatcca tctctcctcg gtagtggcct ggggcatcct 480
ggggaactta tggcaaagga aagtcccaac atgggtgctg gggtcttgtt tagtnaaact 540
tgttnacttg ggggttactt tt 562
<210> 45
<211> 1766
<212> ADN
<213> Homo sapiens
<400> 45
anggaaaggg ttaattcccc nnttgggaat tnccnggatt ttcccagant tncaatttcc 60
accnttggtc aanaaaaann ttggggnncc nctnnnttcn ccngtcânaa agannnnncn 120
cccttgaaag gnnccntnag agaatctcct gcagtccnaa aaaatgtcct ctcccggaaa 18D
acataacaca tatacttgtt catggggacg atttcagtgt gaataggcaa gtttctgtgt 240
catgtgcaga agggtatacc tttgagggag ttaacatatc agtatgtcag cttgatggaa 300
cctgggagcc accattctcc gatgaatctt gcagtccagt ttcttgtggg aaacctgaaa 360
gtccagaaca tggatttgtg gttggcagta aatacacctt tgaaagcaca attatttatc 420
agtgtgagcc tggctatgaa ctagagggga acagggaacg tgtctgccag gagaacagac 480
agtggagtgg aggggtggca atatgcaaag agaccaggtg tgaaactcca cttgaatttc 540
tcaatgggaa agctgacatt gaaaacagga cgactggacc caacgtggta tattcctgca 600
acagaggcta cagtcttgaa gggccatctg aggcacactg cacagaaaat ggaacctgga 660
gccacccagt ccctctctgc aaaccaaatc catgccctgt tccttttgtg attcccgaga 720
atgctctgct gtctgaaaag gagttttatg ttgatcagaa tgtgtccatc aaatgtaggg 780
aaggttttct gctgcagggc cacggcatca ttacctgcaa ccccgacgag acgtggacac 840
agacaagcgc caaatgtgaa aaaatctcat gtggtccacc agctcacgta gaaaatgcaa 900
ttgctcgagg cgtacattat caatatggag acatgatcac ctactcatgt tacagtggat 960
acatgttgga gggtttcctg aggagtgttt gtttagaaaa tggaacatgg acatcacctc 1020
ctatttgcag agctgtctgt cgatttccat gtcagaatgg gggcatctgc caacgcccaa 1080
atgcttgttc ctgtccagag ggctggatgg ggcgcctctg tgaagaacca atctgcattc 1140
ttccctgtct gaacggaggt cgctgtgtgg ccccttacca gtgtgactgc ccgccttggc 1200


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
48
tggacggggt ctcgctgtca tacagctgtt tgccagtctc cctgcttaaa tggtggaaaa 1260
tgtgtaagac caaaccgatg tcactgtctt tcttcttgga cgggacataa ctgttccagg 1320
aaaaggagga ctgggtttta accactgcac gaccatctgg ctctcccaaa agcaggatca 1380
tctctcctcg gtagtgcctg ggcatcctgg aacttatgca aagaaagtcc aacatggtgc 1440
tgggtcttgt ttagtaaact tgttacttgg ggttactttt tttattttgt gatatatttt 1500
gttattcctt gtgacatact ttcttacatg tttccatttt taaatatgcc tgtattttct 156
atataaaaat tatattaaat agatgctgct ctaccctcac aaaatgtaca tattctgctg 1620
tctattggga aagttcctgg tacacatttt tattcagtta cttaaaatga tttttccatt 1680
aaagtatatt ttgctactaa ataatattnn gctggatagn accattttat gaggngccaa 1740
gggatcatag agaggctcat ganttc 1766
<210> 46
<211> 601
<212> ADN
<213> Homo sapiens
<400> 46
cagtggaaag aaatgtacaa tctaattgaa cacaaaaaaa tttatagttc aaaacattca 60
aagtgtcaga ttggttgcat aaattaaaag agattagaga agaggaaaat cagtggactt 120
ggagtgatca gcaaaggctt caataagtag gtagaactta atctgggact taaatgtgaa 180
aattgaccag cttggaagga aaaagggagg tggtaccaca taaggatgtg aagtcaagca 240
gaacagcaga aatggataat gctaacggta tatgaagacc agcagtggct gctgcaggaa 300
gtagagtcaa atcttatcct acgtgccttt atggatatca tcagaattgc taagtattaa 360
ttaaataaat gcatgggttt tttattccag ctgtttgcca gtctccctgc ttaaatggtg 420
gaaaatgtgt aagaccaaac cgatgtcact gtctttcttc ttggacggga cataactgtt 480
ccaggaaaag gaggactggg ttttaaccac tgcacgacca tctggctctc ccaaaagcag 540
gatcatctct cctcggtagt gcctgggcat cctggaactt atgcaaagaa agtccaacat 600
601
<210> 47
<211> 3706
<212> ADN
<213> Homo sapiens
<400> 47
gaatggcaaa ttctcttaca cggacctaca ctatggacag accgttacct actcttgcaa 60
ccgaggcttt cggcncgaag gtcccagtgc cttgacctgt ttagagacag gtgattggga 120
tgtagatgcc ccatcttgca atgccatcca ctgtgattcc ccacaaccca ttgaaaatgg 180
ttttgtagaa ggtgcagatt acagctatgg tgccataatc atctacagtt gcttccctgg 240
gtttcaggtg gctggtcatg ccatgcagâc ctgtgaagag tcaggatggt caagttccat 300
cccaacatgt atgccaatag actgtggcct ccctcctcat atagattttg gagactgtac 360
taaactcaaa gatgaccagg gatattttga gcaagaagac gacatgatgg aagttccata 420
tgtgactcct caccctcctt atcatttggg agcagtggct aaaacctggg aaaatacaaa 480
ggagtctcct gctacacatt catcaaactt tctgtatggt accatggttt catacacctg 540
taanccagga tatgaacttc tggggaaccc tgtgctgatc tnccaggaag atggaacttg 600
gaatggcagt gcaccatcct gcatttcaat tgaatgtgac ttgcctactg ctcctgaaaa 660


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
~19
tggctttttg cgttttacag agactagcat gggaagtgct gtgcagtata gctgtaaacc 720
tggacacatt ctagcgggct ctgacttaag gctttgtcta gagaatagaa agtggagtgg 780
tgcctcccca cgctgtgaag ccatttcatg caaaaagcca aatccagtca tgaatggatc 840
catcaaagga agcaactaca catacctgag cacgttgtac tatgagtgtg accccggata 900
tgtgctgaat ggcactgaga ggagaacatg ccaggatgac aaaaactggg atgaggatga 960
gcccatttgc attcctgtgg actgcagttc acccccagtc tcagccaatg gccaggtgag 1020
aggagacgag tacacattcc aaaaagagat tgaatacact tgcaatgaag ggttcttgct 1080
tgagggagcc aggagtcggg tttgtcttgc caatggaagt tggagtggag ccactcccga 114D
ctgtgtgcct gtcagatgtg ccaccccgcc acaactggcc aatggggtga cggaaggcct 1200
ggactatggc ttcatgaagg aagtaacatt ccactgtcat gagggctaca tcttgcacgg 1260
tgctccaaaa ctcacctgtc agtcagatgg caactgggat gcagagattc ctctctgtaa 1320
accagtcaac tgtggacctc ctgaagatct tgcccatggt ttccctaatg gtttttcctt 1380
tattcatggg ggccatatac agtatcagtg ctttcctggt tataagctcc atggaaattc 1440
atcaagaagg tgcctctcca atggctcctg gagtggcagc tcaccttcct gcctgccttg 1500
cagatgttcc acaccagtaa ttgaatatgg aactgtcaat gggacagatt ttgactgtgg 1560
aaaggcagcc cggattcagt gcttcaaagg cttcaagctc ctaggacttt ctgaaatcac 1620
ctgtgaagcc gatggccagt ggagctctgg gttcccccac tgtgaacaca cttcttgtgg 1680
ttctcttcca atgataccaa atgcgttcat cagtgagacc agctcttgga aggaaaatgt 1740
gataacttac agctgcaggt ctggatatgt catacaaggc agttcagatc tgatttgtac 1800
agagaaaggg gtatggagcc agccttatcc agtctgtgag cccttgtcct gtgggtcccc 1860
accgtctgtc gccaatgcag tggcaactgg agaggcacac acctatgaaa gtgaagtgaa 1920
actcagatgt ctggaaggtt atacgatgga tacagataca gatacattca cctgtcagaa 1980
agatggtcgc tggttccctg agagaatctc ctgcagtcct aaaaaatgtc ctctcccgga 2040
aaacataâca catatacttg tncatgggga cgatttcagt gtgaataggc aagtttctgt 210D
gtcatgtgca gaagggtata cctttgaggg agttaacata tcagtatgtc agcttgatgg 2160
aacctgggag ccaccattct ccgatgaatc ttgcagtcca gtttcttgtg ggaaacctga 2220
aagtccagaa catggatttg tggttggcag taaatacacc tttgaaagca caattattta 2280
tcagtgtgag cctggctatg aactagaggg gaacagggaa cgtgtctgcc aggagaacag 2340
acagtggagt ggaggggtgg caatatgcaa agagaccagg tgtgaaactc cacttgaatt 2400
tctcaatggg aaagctgaca ttgaaaacag gacgactgga cccaacgtgg tatattcctg 2460
caacagaggc tacagtcttg aagggccatc tgaggcacac tgcacagaaa atggaacctg 2520
gagccaccca gtccctctct gcaaaccaaa tccatgccct gttccttttg tgattcccga 2580
gaatgctctg ctgtctgaaa aggagtttta tgttgatcag aatgtgtcca tcaaatgtag 2640
ggaaggtttt ctgctgcagg gccacggcat cattacctgc aaccccgacg agacgtggac 2700
acagacaagc gccaaatgtg aaaaaatctc atgtggtcca ccagctcacg tagaaaatgc 2760
aattgctcga ggcgtacatt atcaatatgg agacatgatc acctactcat gttacagtgg 2820
atacatgttg gagggtttcc tgaggagtgt ttgtttagaa aatggaacat ggacatcacc 2880
tcctatttgc agagctgtct gtcgatttcc atgtcagaat gggggcatct gccaacgccc 2940
aaatgcttgt tcctgtccag agggctggat ggggcgcctc tgtgaagaac caatctgcat 3000
tcttccctgt ctgaacggag gtcgctgtgt ggccccttac cagtgtgact gcccgcctgg 3060
ctggacgggg tctcgctgtc atacagctgt ttgccagtct ccctgcttaa atggtggaaa 3120
atgtgtaaga ccaaaccgat gtcactgtct ttcttcttgg acgggacata actgttccag 3180
gaaaaggagg actgggtttt aaccactgca cgaccatctg gctctcccaa aagcaggatc 3240
atctctcctc ggtagtgcct gggcatcctg gaacttatgc aaagaaagtc caacatggtg 3300
ctgggtcttg tttagtaaac ttgttacttg gggttacttt ttttattttg tgatatattt 3360
tgttattcct tgtgacatac tttcttacat gtttccattt ttaaatatgc ctgtattttc 3420
tatataaaaa ttatattaaa tagatgctgc tctaccctca caaaatgtac atattctgct 3480
gtctattggg aaagttcctg gtacacattt ttattcagtt acttaaaatg atttttccat 3540


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
SO
taaagtatat tttgctacta aataanannn tgctggatag taccatttta tgaggtggcc 3600
aagggattca tagagaggac tcatgatctt tcatctgtgc cactggcacc acataggaga 3660
ccccttacaa taaaggagac ccctttgttc tggttccatc ttctat 3706
<210> 48
<211> 373
<212> ADN
<213> Homo sapiens
<400> 48
tgagacattt ccactctggc attctagagt tctctggctt gcccttgttg ctttaaagct 60
ggttccaact tcgtgggctt tatgattgag caacactggt gattgtgatt tctaatacca 120
ccctccagat tcatgtcaca ggtgaaagtc tgcctgtggg gagagctttc acattctcct 180
ggagttgaac caaaataagg aaaacatcaa caaacacagt taccaaaagc ttccaaggag 240
ggatggagga gaaattctgt tcattgcaga tggggagaaa ttaaatgaca tcaagtgcat 300
aatggaactg ggtaggattc aaactcaagt cccctggttc aagtccttga ctccactctg 360
ggcatggctt aag 373
<210> 49
<211> 459
<212> ADN
<213> Homo sapiens
<400> 49
agtcaaaagg tgaatatata aacatgattt cagatagaat gcagaagctg tatttaatta 60
agttggcttt tgtcattaaa gaaatcagaa agtttggaca actcaggaat ggatttccat 120
cctagatggt atttactact atttctggaa ttaagtttac tgtctatatt caggattttg 180
tgcataagag acgtgaccac tgaggttgtg tgtcattctt atctctactc caggggtcag 240
caaactttct ctgttaaggg tcagatagta gttttttggc ttttcagtct ctgtttggct 300
ctgctataaa caatacataa atgaatgagc atggctatgt tccaataaaa cttaattgac 360
actgaacttt gaatttcatg tacttttcaa atgtcacaaa tgttttcctt ttgatttttt 420
tcagaaagcc attaaaaaaa tccaaagacc attcttagc 45g
<210> 50
<211> 2575
<212> ADN
<213> Homo sapiens
<400> 50
tctggcattc tagagttctc tggcttgccc ttgttgcttt aaagctggtt ccaacttcgt 60
gggctttatg attgagcaac actggtgatt gtgatttcta ataccaccct ccagattcat 120
gtcacaggtg aaagtctgcc tgtggggaga gctttcacat tctcctggag ttgaaccaaa 180
ataaggaaaa catcaacaaa cacagttacc aaaagcttcc aaggagggat ggaggagaaa 240
ttctgttcat tgcagatggg gagaaattaa atgacatcaa gtgcataatg gaactgggta 300
ggattcaaac tcaagtcccc tggttcaagt ccttgactcc actctgggca tggctaagtc 360


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
51
tggcctgtgt ctcatcttct cagctctagt ggctgtttag tagtgaagat actgatatgc 420
aggcagccat gttgtaaata agaagcaaat atttttatat ttctctctct tatgtgtata 480
atatttgagc tacaaacagg ttaaaacaaa agagagactt cagcttagta gcaggcaggg 540
aaggaagaag tgaatgcagc ttccttccgc ttacatttct aatcaagcta attatttcac 600
tagtgatttc tcatttgatt accgattttg cttatttatg cttagaactt tcaatgactt 660
ctcagtgcca ttaaggtaaa atgcaagcca tttctgtgac ctgcaatatc atcttttgcc 720
actcctcctc acttgctatg tcttagcaag actgagaggc tctcagttct tcagacctgc 780
tctatctcac ctctcatttt gttcatattc tccacctctt gtgcttgatg aactcctatt 840
cacctatcag gtcacaactt aaatattttt tcctccaaat ctctggacta cataggtcca 900
ggcccccatc aaatgctccc atagcacatt gggcttcctc atcaacatgc tcgttatact 960
tttctagaat tgctggcttg tcctccttgt tatctcccta atgcagagac cattactcat 102b
cattgtagca gatatttatc catatcaggt actcagcaaa catttgtgga atgaatctat 1080
atgtgaaact atacttctat ggcaagtttg tttggttcag aaggcttgca tttcatgtat 1140
attgggagac tggccaacat ttttatattc ttcctcctat gctcaaacca taaataatta 1200
tgttagcaaa cactgaactt tgtcntttga aacataaata gaaacatcct tagtaacagt 1260
actaacagta atcatttttc agaaataaga attcacacca gtgatacaga atggcctttg 1320
accattatct cagagaacta gcagtcgata gacatgctga agtgataatt ccaaaaactt 1380
cagtttcatt catccctact taaatataag agaatcaact tctattttat gtctgtattc 1440
ccattttcta atatactact tgtcacagag gagatgccca accagtgttt ttcgtaaagt 1500
acctgaatag attaataata atgctagtga aatatattta gtgctgttct aagcacttta 1560
catgaattaa ctcatttaat cctcaccgca accataggaa gtagattcta ttatttatcc 1620
aattttacag atgaaaaaac tgaggctggt cacttgacat aaattaccag tgctggccag 1680
gactttagag accatttaat ccaatgctct tattttacag gggtgcagct gaagcctaag 1740
gaggtgatat gatttcctac acattcatgc accttcgtgc acatccatta aaacttttat 1800
taaatggaac ccactatcca tactccaatt agctaggtgc cttttttccc ccatttagta 1860
atttacaatt aattggagga ctttttatag ttatatttag aggaaaggag catgttttac 1920
tctatatcaa ctttcttttc tgcttaaaag cattttgatt ctttatttta ccagtcattt 1980
tagttctttt aataggttta atacacagat caaacaagac ttaaatacat ttttaacaat 2040
gtaacaattt aaaagaaatt gcctaaancc taggtcttct aacttggagc ccagtgcttt 2100
ttttattgct ccgctgagtc aaaaggtgaa tatataaaca tgatttcaga tagaatgcag 2160
aagctgtatt taattaagtt ggcttttgtc attaaagaaa tcagaaagtt tggacaactc 2220
aggaatggat ttccatccta gatggtattt actactattt ctggaattaa gtttactgtc 2280
tatattcagg attttgtgca taagagacgt gaccactgag gttgtgtgtc attcttatct 2340
ctactccagg ggtcagcaaa ctttctctgt taagggtcag atagtagttt tttggctttt 2400
cagtctctgt ttggctctgc tataaacaat acataaatga atgagcatgg ctatgttcca 2460
ataaaactta attgacactg aactttgaat ttcatgtact tttcaaatgt cacaaatgtt 2520
ttccttttga tttttttcag aaagccatta aaaaaatcca aagaccattc ttagc 2575
<210> 51
<211> 231
c212> ADN
<213> Homo sapiens
<400> 51
tgattatttt cttttcccta tgtttagtta ctgtagtaga aggctatatg aacctttggg 60
aaaagttaga aggaaaatta acagtgtcag gcctcagtaa catatattaa gtttgtttct 120
caaggagatc tgtcctcgct ttccttaaac atgttctgga tctgtaaaat aggggattct 180


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
52
tccatgaagg caaaagggtt gatttagaga gaaaagttta agcgtgggaa t 231
<210> 52
<211> 344
<212> ADN
<213> Homo sapiens
<400> 52
aatcccagaa ggaccttata ggtgagatac aaagtgttac ctgtgaggaa gtgtattcca 60
ctcccccacc aaaaaaaatc tttggaatat atacaagcag aaatcgggcg aatatgtgtg 120
ggaatgccta ttaagggtat aggataatgg tggaaggaac ataaagattg aacaggccaa 180
attattgata tattggccca ctaaacagga attatttttt attgttgctg ctcatggagt 240
tagaaaggtc tctagcagta tggttagttt gctgaaacat acatcaaaat ggtccaccat 300
gagtgaattg gagatgttga acctctcttg gtttcatgca gagg 344
<210> 53
<211> 402
<212> ADN
<213> Homo sapiens
<400> 53
ttgttgattc tccccccacc agcccctttg tttccagacc tataagtaga caagaatccc 60
agaaggacct tataggtgag atacaaagtg ttacctgtga ggaagtgtat tccactcccc 120
caccaaaaaa aatctttgga atatatacaa gcagaaatcg ggcgaatatg tgtgggaatg 180
cctattaagg gtataggata atggtggaag gaacataaag attgaacagg ccaaattatt 240
gatatattgg cccactaaac aggaattatt ttttattgtt gctgctcatg gagttagaaa 300
ggtctctagc agtatggtta gtttgctgaa acatacatca aaatggtcca ccatgagtga 360
attggagatg ttgaacctct cttggtttca tgcagaggaa gg 402
<210> 54
<211> 228
<212> ADN
<213> Homo sapiens
<400> 54
attttcttcc ctagtccatt tctttttgtc cagtattcct tttgttcata ggcagttcca 60
ctgtgagtcc tgtactcttt ctcattcatt catggctcac tgtgtgtcat gttctattct 120
aggtgttggg gatatagcag tgaacgaaac agaagacccc tgacactgag gagctcatgt 180
tctatgggga aggtgaagtg gaaaaaaact caaaagaata aataaggg 228
<210> 55
<211> 270
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
i3
<400> 55
tgccnttaca atttcancgt tttttacccc caaatggtta atgtaggtgt tttttttttt 60
ttttggaatc attttattct ttcgtatttc tgtgtcagtc gctaggagaa agaccaggaa 120
aatctgttaa actctaaacc aaaaattccc attcactgca gagtgatgat tcgcaacact 180
gctgcaattc aggtagtggg gtgtcctgaa gtgacaacac atcaccactg cagtcctaat 240
aaattaagtc tttttgtttt gaaaaaaaaa 270
<210> 56
<211> 1130
<212> ADN
<213> Homo sapiens
<400> 56
accaattctc agtccctaga ccccattctt tgttcctctt cttcctgatt ttcttcccta 60
gtccatttct ttttgtccag tattcctttt gttcataggc agttccactg tgagtcctgt 120
actctttctc attcattcat ggctcactgt gtgtcatgtt ctattctagg tgttggggat 180
atagcagtga acgaaacaga agacccctga cactgaggag ctcatgttct atggggaagg 240
tgaagtggaa aaaaactcaa aagaataaat aagggaattt caagaggttt gaaggaaatc 300
taactaggta atgtgattgc gggacctagg gatagggaag ggcatagact gctttagata 360
ggatgggaaa tctcttaggg gagattaaaa ttgaactaag acctgaatta .catggaaaaa 420
tttagtcaaa ggaaaagcat tccagagaga gagcatggca gtgcaaagcc ttgcagaaag 480
aaccagtgta gaaagtccaa ggatgaaaga aagccagtgt agctagagcc tgaagaatga 540
ggatgggagt ggaagatgtg aaggtaagtt tgcaggggcc agatcatatc aggcctggaa 600
gatgatatag ctgtttaaag tttattctaa atgcaatgag a.agccagctc ctagcaagat 660
aataaattgc ttttccagaa cgttaactgt ccattattta gttcctttgc attctccata 720
ggctggtctt ataaaggttc tgtgacagta gggaatccat taaagatcta ttacataagg 780
gaatgtggga catgcaaaag cagaagacaa atgtagaaac cctctgcttc acttggcatt 840
tctgtccttc atctttctga tattttaaag ctactgtgtt cctacataca tatgctatct 900
gttccttcat tctttttgat aaattcatca tttgccttta catttttgtc gttttttacc 960
cccaaatggt taatgtaggt gttttttttt tttttggaat cattttattc tttcgtattt 1020
ctgtgtcagt cgctaggaga aagaccagga aaatctgtta aactctaaac caaaaattcc 1080
cattcactgc agagtgatga ttcgcaacac tgctgcaatt caggtagtgg 1130
<210> 57
<211> 463
<212> ADN
<213> Homo sapiens
<400> 57
cctaatgagt ggctctgtat tcccatttcc tcatgtggac taatgcggtg tgtggtgttt 60
ttcttttcct tttcagaagc agtggacagg ggagaatccg ctccaacgtt gtccacctcc 120
ccttcaccct cctccccttc acccacttcc ccttcaccta ctctgggcag acgaaggcct 180
gnaaatagga acgtttctta gaaagaagaa aactagtgac atctactttg tgtctctagt 240
ttgggccatt gtcgtcatgc agatctggtt gaacctgtgg attgtgcagt ttgctgccag 300
tgccgattgc aggtcgttat ctggttnaag tacgatctcg tcttgtcttt ggaagattga 360


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
54
tttttttttt tttttttttt tnggatttta atntttgagn gacattttac cgtntttgca 420
aagtaaaaca ttttgatggt ttggnatttt aaatagttna ctt 463
<210> 58
<211> 289
<212> ADN
<213> Homo sapiens
<400> 58
gactacagtg gagagcagct tccaaaaatc agattacgtt ttaatciata gtgaaaaacc 60
ttgacatagg aaatgaggag taatcaaatg tagaaggtac tcagaaggca aaatccacag 120
cagccactaa ggacttaata aatttgggca caaaatatgg gctgccataa ggaagagagc 180
ccaaataatc aggaaâatat tagggtaaaa gatgtttcta caatgcacct gtcaggggaa 240
aactctccct tgctctttct agtcttaggg nggaaggaca gttttaggg 289
<210> 59
<211> 1542
<212> ADN
<213> Homo sapiens
<400> 59
tgggccattg tcgtcatgca gatctggttg aacctgtgga ttgtgcagtt gctgccagtg 6D
ccgattgcag gtcgttatct ggttaagtac gatctcgtct tgtctttgaa gattgatttt 120
tttctttttt tacttttgga ttttaatatt tgagatacat ttaccgtctt gcaaagtaaa 180
acaatcttat gtttgcattt aaatagtaaa caaacaccat ttggttaatt tattactttg 240
atacatcttt aatatttcac tttttttttt ttttttgaga cggagtcttg cccaggctgg 300
aagtgcagtg gcaccatttc agctcactgc aagctccacc tcccaggttc atgccatttt 360
cctgcctcag cctcccgagt agctgggact ataggtgccc accaccacac ccggctaatt 420
ttttttttat ttttagtaga gacagcgttt caccatgtta gccaggatag tctcgatctc 480
ctgacctcgt gatctgccca tctcggcctc ccaaagtgct gggattatag gtgtgagcca 540
ccgcgcccgg ccagtatttc acttttaagc tcaaaaaatg tgtttagctt cttacaattt 600
catgtagtat ttgagattaa tagctccata gagagatttg attgtttagc catccatgat 660
tctgtgaagg agaatgttaa caatatctgt gttttggaat ttgaagatcg aatgattttt 720
tgtttttttt tgagacggag tctcgctctg tcacccaggc tggattgcag tggcgcgatc 780
tcagctcact gcagcctttg ccccctgggt tcaagcaatt ctcccacctc agcctcctga 840
gttgctggga ctacaggcat gcgccaccac ccctggctaa ttttttgtat ttttagtaga 900
gacggagttt caccatgttg gccaggctgg tctcgaatcc ttaccttaag tcatccgctc 960
acctccgcct cccaaagtgc tggcattaca ggagtgagcc actgcgccta gctgagattg 1020
aatgattttt gagcgctact cttagggaag cacgttttac cttgcctttt taattcaaag 1080
gaaatgtagg ctttgagaaa tacatgtatg caaagtcttg tgatttggca gaaaaattaa 1140
attacatgta tatctatatt atatgtatta catcaaaatg gaatcatagt tttccataat 1200
ccattaaatc aggtctttgt atcttaatgc tgtggtaatt taaggcccac ctctattgtt 1260
ttgattctct ctaaaactgt ctttctccta agactagaaa gagcaaggga gagttttctc 1320
tgacaggtgc attgtagaaa catcttttac ctaatatttt cctgattatt tgggctctct 1380
tcttatggca gccatatttt gtgccaaatt tattaagtcc ttagtggctg ctgtggattt 1440
tgccttctga gtaccttcta catttgatta ctcctcattt cctatgtcaa ggtttttcac 1500


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
tattgattaa aacgtaatct gatttttgga agctgctctc ca 1542
<210> 60
<211> 1417
<212> ADN
c213> Homo sapiens
c400> 60
gacacggctg gctgcttttc tcagcgccga agccgcgcca tgctcgtcct cagaagcgcc 60
ctgactcggg cgctggcctc acggacgctg gcgccteaga tgtgctcatc ttttgctacg 120
ggacccagac aatacgatgg aatattctat gaatttcgtt cttattacct taagccctca 180
aagatgaatg agttcctgga aaattttgag aaaaacgctc atcttcggac agctcactct 240
gaattggttg gatactggag tgtagaattt ggaggcagaa tgaatacagt gtttcatatt 300
tggaagtatg ataattttgc tcatcgaact gaagttcgga aagccttggc caaagataag 360
gaatggcaag aacaattcct cattccaaat ttggctctca ttgataaaca agagagtgag 420
attacttatc tggtaccatg gtgcaaatta gaaaaacctc caaaagaagg agtctatgaa 480
ctggccactt ttcagatgaa acctggtggg ccagctctgt ggggtgatgc atttaaaagg 540
gcagttcatg ctcatgtcaa tctaggctac acaaaactag ttggagtgtt ccacacagag 600
tacggagcac tcaacagagt tcatgttctt tggtggaatg agagtgcaga tagtcgtgca 660
gctgggagac ataagtccca tgaggatccc agagttgtgg cagctgttcg ggaaagtgtc 720
aactacctag tatctcagca gaatatgctt ctgattccta catcgttttc accactgaaa 780
tagttttcta ctgaaataca aaacatttca ttaactgcta taggatctgt ctgctaatgg 840
tgcttaaatt ctcccaagag gttctcactt ttatttgaag gaggtggtaa gttaatttgc 900
tatgtttctt gcattatgaa ggctacatct gtgctttgta agtaccactt caaaaaatag 960
ttctgtttac tttctgcatg gtatttcagt gtctgtcata cattaaaaat acttgtcact 1020
gttttaagat cttgactctt catttgtttc agaatagctc ttctactgta ttctgacaac 1080
tctttgcttt atagcatttt gttgtattca aatgataatg gtagcatttc catgcttgtg 1140
acagcatttt taagttatta atatatttta tcaacctttc catcatgtct gttttcctgg 1200
ttttttttgg ttgttttttg accagtaaaa tttattttgt aataccaaat aggatttaag 1260
aaaattaacg tatttcttta ctatggaaaa ccacattgtc atttgtgaca tcatctatat 1320
taaatatggt tttcacatta gttatttgtc acttacttgg aaaatgatgc tgttaggtcc 1380
tggtattaaa aatctagaaa agacttgttg gtttatg 1417
<210> 61
<211> 696
<212> ADN
c213> Homo sapiens
<400> 61
ctctaagcga tctgcagttt atctgggcta ttatgcaatg tgagatatta tttatgagag 60
gcaggcagtg gcagcttaaa cagacatacc tcctcagcat tcttttccat gcagagttca 120
aagaggccta agacatctca catttatgtg aaatagttga ggcacaagta tgtggttaac 180
tacacataaa ttaccaataa aattaaaagt taactaaaat actacagaag acatttaata 240
ttttgcttca gactgttata gtaccttagg gttatgaaca tcaattacct ttgagcctta 300
ctatatttaa agggaagggg aagctgacat ttttatcttt tttaatgggt acactctacg 360
ttaccttaaa ggcttccccg gtttaagcaa aaatagaatt atgtggttta aatcatatac 420


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
SG
cttattcttc atacttagct ccaagtagat tatgactttt cctaaaactt aacatgacag 480
agatttgcct tccagggggt ctaatttgaa gaggaaagta atttaaatgt ataggtttat 540
ataatagcat tgtatttttc tctattttat tcattctttc attctcttcg atgactccca 600
gcacctgcgc gtccatcttc attcttagcc aatgaccttt ccttttactt aacagagaaa 660
ataacaatca gaagagtctt cataagttcc cacccc 696
<210> 62
<211> 2702
<212> ADN
<213> Homo sapiens
<400> 62
ctcagaaagg acacggctgg ctgcttttct cagcgccgaa gccgcgccat gctcgtcctc 60
agaagcgccc tgactcgggc gctggcctca cggacgctgg cgcctcagat gtgctcat-ct 120
tttgctacgg gacccagaca atacgatgga atattctatg aatttcgttc ttattacctt 180
aagccctcaa agatgaatga gttcctggaa aattttgaga aaaacgctca tcttcggaca 240
gctcactctg aattggttgg atactggagt gtagaatttg gaggcagaat gaatacagtg 300
tttcatattt ggaagtatga taattttgct catcgaactg aagttcggaa agccttggcc 360
aaagataagg aatggcaaga acaattcctc attccaaatt tggctctcat tgataaacaa 420
gagagtgaga ttacttatct ggtaccatgg tgcaaattag aaaaacctcc aaaagaagga 480
gtctatgaac tggccacttt tcagatgaaa cctggtgggc cagctctgtg .gggtgatgca 540
tttaaaaggg cagttcatgc tcatgtcaat ctaggctaca caaaactagt tggngttttc 600
cacacagaat atggagaact caacagagtt catgttcttt ggtggaatga gagtgcagat 660
agtcgtgcag ctgggagaca taagtcccat gaggatccca gagttgtggc ggctgttcgg 720
gaaagtgtca actacctagt ttctcagcag aatatgcttc tgattcctgc atcattttca 780
ccattgaaat agttttctac tgaaatacaa aacatttcat taactgctct aagatgtgtc 840
tgctaatggt gcttaaattc tcccaagagg ttctcgcttt tatttgaagg aggtggtaag 900
ttaattagtt atgtttcttg cattatgaag gctacatctg tgctttgtaa gtaccacttc 960
aaaaaatagt tctgtttact ttctgcatgg tatttcagtg tctgtcatac attaaaaata 1020
cttgtcactg ttttaagatc ttgactcttc atttgtttca gaatagctct tctactgtat 1080
tctgacaact ctttgcttta tagcattttg ttgtattcaa atgataatgg tagcatttcc 1140
atgcttgtga cagcattttt aagttattaa tatattttat caacctttcc atcatgtctg 1200
ttttcctggt tttttttggt tgttttttga ccagtaaaat ttattttgta ataccaaata 1260
ggatttaaga aaattaacgt atttctttac tatggaaaac cacattgtca tttgtgacat 1320
catctatatt aaatatggtt ttcacattag ttatttgtca cttacttgga aaatgatgct 1380
gttaggtcct ggtattaaaa atctagaaaa gacttgttgg tttatgtgct gaaatgtntt 1440
tntttataat taattttact aatttctact tagtttggat cactaacaga gatcttggga 1500
catttatttg ttttaaagaa atatttatgg ttatggaaac gcttgcccta ataaaaatcc 1560
tgcatattca ttgttttttt aaattcacat tttatactta tatgatctct aaagctcttg 1620
ctatgttgct ataagacagt aatatagtga taatttacca actttattga aaatgttgtt 1680
acatcaataa aatagcatgc tgggaacctg agaaggaagg tttctttagt actgccacag 1740
atgtcctgga gttttccttg aaacatcttt catttccatt ttacttgatg cctctaccta 1800
ctaaaactag atttggtact tccgatagtg tatatttaca gctatattat atttacattt 1860
ttacagacta tcttctgata atctgtattt acagctatgt tattttatat ttttaaaatc 1920
ttacagctat aaaatagtaa attgtgaatt agctgtccaa gggcaatttg gaaaacaaac 1980
tgtacagttt cctctcattt atcaggctct aagcgatctg cagtttatct gggctattat 2040
gcaatgtgag atattattta tgagaggcag gcagtggcag cttaaacaga catacctcct 2100


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
cagcattctt ttccatgcag agttcaaaga ggcctaagac atctcacatt tatgtgaaat 2160
agttgaggca caagtatgtg gttaactaca cataaattac caataaaatt aaaagttaac 2220
taaaatacta cagaagacat ttaatatttt gcttcagact gttatagtac cttagggtta 2280
tgaacatcaa ttacctttga gccttactat atttaaaggg aaggggaagc tgacattttt 2340
atctttttta atgggtacac tctacgttac cttaaaggct tccccggttt aagcaaaaat 2400
agaattatgt ggtttaaatc atatacctta ttcttcatac ttagctccaa gtagattatg 2460
acttttccta aaacttaaca tgacagagat ttgccttcca gggggtctaa tttgaagagg 2520
aaagtaattt aaatgtatag gtttatataa tagcattgta tttttctcta ttttattcat 2580
tctttcattc tcttcgatga ctcccagcac ctgcgcgtcc atcttcattc ttagccaatg 2640
acctttcctt ttacttaaca gagaaaataa caatcagaag agtcttcata agttcccacc 2700
cc 2702
<210> 63
<211> 335
<212> ADN
<213> Homo sapiens
<400> 63
taccttacca ttgtgcctgt tatgttcaaa aatacatttt gaaaagttct taaaataatt 60
gctctaaatt gaaatgtcaa aacctgaata ttctacatgt gtcttgggtg atgtccttta 120
agctaatcct atantacact aaggtacatt taattgtgga aatgtcattt cacaaggcta 1B0
tgtaaggcat ccctcgaggc ctgcatttta atgtctagtt ttcaatttta tggcacctaa 240
aatatcccna tggtggagga tattagggat ggggntatta tcccngggat ntctcacngg 300
cccggttggg gccccgggga tcttagggtt ttcca 335
<210> 64
<211> 447
<212> ADN
<213> Homo sapiens
<400> 64
tccttactgg attgagcctt ggttacttgc cacccagagg gtgattgagt tgcagtattc 60
tgttgcacct ttgatgtcaa cttatttttg gcttaaattt tttaaataac ataaggttaa 120
agaaaggatc acatctctat cttttcctca ttgacctccc tagttctaga caaattctat 180
acttttttcc tttctttttc tctgtggtcg attatgtcat tattccctcc ccctcaaaac 240
ctaccttctc ccttggtctc cgggaatact gcactctagt gattttcctc ctactacgga 300
aaatgatttc attacctctc tgggctgggt atttccttgg tctttagggc cctttatgga 360
aaacacaacc tttggcctan tttctctnca atttgccctt tttaagaatg gtcctggtac 420
tccttttata attaatctgg gtgnggc 447
<210> 65
<211> 2324
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 ~S PCTlFR0010142G
<400> 65
actacaagcc agtgaagtgg gtgataagcc tgactccact atctcagcca ggtccttctt 60
ctaatattat tggccagtct gtggaagaag ctatcagagg ggtgtttgat gcttccctca 120
aaatggctgg cttctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 180
ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 240
actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 300
ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 360
ctgacatatc aggaggtggc catccttacc tgacaggctt ggcagtggcc ggtggagcat 420
actacctagg cctggaagga gcaatcatcg gtcctattct tctctgcata cttgtggttg 480
cttccaatat ctatagtgcc atgctagtga gtcccacgaa ttcagttccc acgccaaacc 540
agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 600
cttcagtagg ttgatgtggt ttcctctgca gtgatttttc taggaagttc aaatttgaca 660
gcgagttcag ctcagctgtg gccctctgcc cttccagctg tgcctagcaa gcaaaaccca 720
ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc ?80
tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcac 840
ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 900
atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 960
ctctaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 1020
tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1080
tgtagttgag tgagcaggaa aaatgaatct tctacccttc tcccacaatg tattatacgc 1140
tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttt 1200
tatattataa ccctgggaga tacaaagact gaagctcttc ctcctcttcc ttttctcttc 1260
acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaatac 1320
ttattaagct gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1380
ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 1440
atccgtttca ttatttggaa ctctgccaat aagttagttt tcagcagaat tttgtattta 1500
tgtagtattt tcccatctct tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1560
tgaattgaat tgcaacttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1620
cattttacaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1680
agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1740
accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1800
gcagattctg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttacg 1860
agattggtgt tgctatccat ttgttgtgaa tgaagacttg tcctatagta catgacaggg 1920
ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1980
ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 2040
gtggctcaca tctgtaatcc cagcactttg gaaggctgag gtgggtggat tgcttgagcc 2100
cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2160
aaaaaaaaaa aaattagctg ngnacggtgg tgtggctata gtctgagcta ctcaggaggc 2220
tgatgtatga ggatcacctg agtccaggag gtcgaggctg cagtgagcca agatggcgcc 2280
actgcactcc agcctgggtg agagagtgag acactgtccc aagg 2324
<210> 66
<211> 447
<212> ADN
<213> Homo sapiens
<400> 66


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
tgttggacct ggtactctcc accacataat tatgtcctgg tacttagggt agcctggcta 60
attcttttca caacatttga aaagccgtac gtttaacttc atggatgtgg agaaacagca 120
taatgacctt ggttcacaat gaaagtgcta gccttctttc tcgtggctgg aataagaaat 180
gcaagaactg gaagattaac agagagctga tacccggact ggtaatccca caactcacta 240
ttttgggagg aaggggaaga cagggaaaga gaaggaaaaa gggcaaatgg ggaaacattt 300
ccccagagct gtgntcctgg gtcttcacct gcaaaaaaga tttgcagcca cctaaggaga 360'
aagntgagct tgcccntcag ttcctcantg ttcacctacc ttttttcaca acatttgtta 420
cccaggttga ggttttttcc agatttt
447
<210> 67
<211> 564
<212> ADN
<213> Homo sapiens
<400> 67
attgggcctc gggnccaaaa aacgggcacg angcggactg ggtaanccca naactcacta 60
ntttgggagg gaaggggaag acaggggaaa gaganggaaa aaggcaaang ggaaacatnc 120
cccagagctg tgcncctggt ctcacctgca aaaaagaatt gcagcccacc ctaagagaaa 180
gctgagctgc ccccctcagt cctcactgtc accctacctc tatcacaaca attgtaccca 240
agatgaagac ttctcccaga cttcagaaaa taaagtcaaa ccctagattt tgttttaaaa 300
taggaaactc agaatcaact tgcctccatc ctctgggaaa actgctccca cacaggcctt 360
ggagtgtgtt gtagcactgt ggaggaatgc agaaaggatg aaagagatct tgattctcct 420
agtggttctc ttcactaccg taggcatccc tcagccattg actcctcctt ctttctcttg 480
acattcactt tcttggccag tcttacatgc ttatgagtct actttccaat aaatttactc 540
atagtccnat taacttccna aant 564
<210> 68
<211> 604
<212> ADN
<213> Homo sapiens
<400> 68
cacataatta tgtcctggta cttagggtag cctggctaat tcntttcaca acatttgaaa 60
agccgtaggc attaacttca tggatgtgga gaaacagcat aatgaccttg gttcacaatg 120
aaagtgctag ccttctttct cgtggctgga ataagaaatg caagaactgg aagattaaca 180
aagagctgat acccggactg gtaatcccac aactcactat tttgggagga aggggaagac 240
agggaaagag aaggaaaaag gcaaatggga aacattcccc agagctgtgc tcctggtctc 300
acctgcaaaa aagaattgca gccacctaag agaaagctga gctgcccctc agtcctcact 360
gtcacctacc tctatcacaa caattgtacc aagatgaagc cttccccaga cttcagaaaa 420
taaagtcaaa ccctagattt tgttttaaaa taggaaactc agaatcaact tgcctccatc 480
ctctgggaaa actgctccca cacaggcctt ggagtgtgtt gtagcactgt ggaggaatgc 540
agaaaggatg aaagagatct tgattctcct agtggttctc ttcactaccg taggcatccc 600
tcag 604
<210> 69


CA 02371500 2001-10-24
WO 00/71710 ~0 PCTlFR0010142G
<211> 482
<212> ADN
<213> Homo sapiens
<400> 69
aaaaagctct gccâgctgag cgnacttaaa ttgaggaaga gttcccttct ctattaactc 60
attttgggca gtaacaacat accctgcctg atattttcct tctgagactt tggcatagga 120'
cccacgaaca aaaagtatca actcaggatt atccaatgga gcatctcata aatcaacaca 180
aggggctact agtttggata ctacacctac acaattgtga tctttaccac agtcagtcag 240
aggtaatgga gtagcagggt taagtaggtt ttaggatggg agtaggcatt ttaggatggg 300
aggtcagaag ggaggncagg gaggaaaatt tncattaagg ttcataaggt gttagttttc 360
tttggctgga aaantgctgg agcttgggtt gggattttag gtaggacttt tccacagcct 420
gtgggaattt tggcaantta agtttcnttc ccttaaaacc cgttccggtg gaaanttgtt 480
gg 482
<210> 70
<211> 402
<212> ADN
<213> Homo sapiens
<400> 70
ttccagntat ggatatgtta cagacatgac tgaattggtg gccttagctg aacattttga 60
gaggactctg gagcaagaaa aaacccaaaa gactaccaag cttatgtctc accaattaca 120
acagttacag gggctgagac caaaggaacc ttctttttta ttttaaatca caaccaagag 180
atagatccta ggaacaagaa attcttttcc ccgaggatgt ctgccttcct tggcaaataa 240
ggcagggaca ctgggaaaag agttgtctgc ttctctgtta ggtctaccaa taaggcctcc 300
tcccattagg gccacactgt ttcaccacta aagggaaggc ctaaggacag atcctgtgtc 360
tttaaaaaaa aaaaaaattg gaggcggcgg caggccacca ng 402
<210> 71
<211> 758
<212> ADN
<213> Homo sapiens
<400> 71
agtaacaaca taccctgcct gatattttcc ttctgagact ttggcatagg acccacgaac 60
aaaaagtatc aactcaggat tatccaatgg agcatctcat aaatcaacac aaggggctac 120
tagtttggat actacaccta cacaattgtg atctttacca cagtcagtca gaggtaatgg 180
agtagcaggg ttaagtaggt tttagatgga gtagcatttt agatggaggt cagaaggagg 240
caggagaaaa tttcataaga tcataagatg ttagttttct tgctgaaaaa tgctgagctt 300
ggttggaatt tagtagactt tccacagcat gtggaatttg caaattaagt tcattcccta 360
aaaccagctc agatgaaact tgtagcaact tggtggctgc tgctgcttct attttttttt 420
ttttttttaa gacacaggat ctgtcttagg cttcctttag tggtgaaaca gtgtggccta 480
atgggaggag gcttattggt agactaacag agaagcagac aactcttttc cagtgtcctg 540
cttatttgca aggaaggcag acatctcggg gaaaagaatt tcttgttcta ggatctatct 600
cttggttgtg atttaaaata aaaaagaagg ttcctttggt ctcagcccct gtaactgttg 660


CA 02371500 2001-10-24
WO 00/71710 ~ ~ PCTlFR0010142G
taattggtga gacataagct tggtagtctt ttgggttttt tcttgctcca gagtcctctc 720
aaaatgttca gctaaggcca ccaattcagt catgtctg 75g
<210> 72
<211> 673
<212> ADN
<213> Homo sapiens
<400> 72
caggttgagc ccttgaaaaa cacaaaaagg acaagttcct gtgttgaaac acccccatcc 60
cctcacgttc tcacccccag gcccagaagt aggttgcaac tgcctttgga agattttgcc 120
ccttagccat ccccacccac ttgtaccagc taagaatgct ggagactctg ccaccatgct 180
ctgcgtgccc ctgaacctct gtgcagcccg gaaggctgat gtacaggtgt acctcaatcc 240
acattacagc catgctccta atgtacatgg acatttttgt aactcagctc atattctgac 300
tgtatttgag aagctggctg tttaagggaa cccagaagtg aattcttttg taaagtaaag 360
cacccttttg taatgcaatt aattatccct taatgtatct gttttgtaag tctgcatttt 420
tgtatatcgg atttacctta agcttctcta gtgaggcatt ctgagcagtg gtgatcacat 480
gccagatccg gccctgccna tccacaaaag tagatganca atgcacgctc ctcaaacatc 540
tttggaggaa ctacctgggc canancactg gccagggtgg cagcaagcag cagcaggggc 600
tgacagcagg gtttactgnc attcaacatt gcttganatt gcctctaatg ttctgnatta 660
aangaaaaac cat 673
<210> 73
<211> 554
<212> ADN
<213> Homo sapiens
<400> 73
aaagggggaa aggaaactac tttaagagcc ccctttttcn tcccnaactc caaatttttg 60
aaaggggaaa aaacnggaaa accccacccc agttccttcc agaaaaatgc cttttcctag 120
gncattaaat acctaccttt acctatccta anactgntta agntaaatcc ctttccttta 180
ccccacccta aactanccca ttctaanccc ggantccctc actctttttt tttagttact 240
aatcatttta tgaaaataat gtatttataa gtattttcct taaggtttgt gaagagtatt 300
tgcantgtgt ccttcatttt natgtgtttg cnannnctcc gctccaggaa gaacggaaat 360
gctgtcttgt gagcatgaag tgaacgggct gttttgctcc agccactttt cttgtacaac 420
cacatggatg gattagatgt cctcaggtct tttccatctt cagtttctat gactgtggaa 480
taaatgttca gatagaaact tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtacctcggc 540
cgcgaccacg ctaa 554
<210> 74
<211> 1794
<212> ADN
<213> Homo sapiens
<400> 74


CA 02371500 2001-10-24
WO 00/71710 G~ PCTlFR0010142G
gttctcaccc caggcccaga agtaggttgc aactgccttt ggaagatttt gccccttagc 60
catccccacc cacttgtacc agctaagaat gctggagact ctgccaccat gctctgcgtg 120
cccctgaacc tctgtgcagc ccggaaggct gatgtacagg tgtacctcaa tccacattac 180
agccatgctc ctaatgtaca tggacatttt tgtaactcag ctcatattct gactgtattt 240
gagaagctgg ctgtttaagg gaacccagaa gtgaattctt ttgtaaagta aagcaccctt 300
ttgtaatgca attaâttatc ccttaatgta tctgttttgt aagtctgcat ttttgtatat 360
cgggtttacc ttaagcttct ctagtgaggc attctgagca gtggtgatca catgccagat 420
cgccctgcct atccacaaag tagatgacca atgcacgctc ctcaaacatc tttggaggaa 480
ctacctggcc aaaacactgg ccaggatgca gcaagcagca gcaggggctg acagcaggct 540
tactgccatc aacattgctt gaaatgcctc tatgttctga ataaagaaaa accataattg 600
cttgtggtga aacgaagcag tcttcatgtt aagtagcaat ggttattttt attggtagta 660
actgaacagt gttttgcaat ttgtgaaaca gtgtattgtg ttttgtaaaa tgatgtcatg 720
aaatggtggg tccttggaaa cctcctttcc gttcagctct gcctctgttc tttcaactcc 780
tttgaggctc aaaaaaaaca caaagatcag aagccttcag atagagggtg gtattctggt 840
aaagaagaaa gagataaggg acgctacctt gcttttctgg cacaggaagc acatgataaa 900
gcatgctcag atgagctgga acagatatag ctacctggtt cgtgtaaata agaataatca 960
aggccccaga gtgtgtatgc ttccaggtgg aggagaaagg ggaatctccc aaaatttaaa 1020
aacaaattgg aagaataacc aggacagcca agtgaagcag ccacagggac ccaagcagtc 1080
gaggtcttta atgtgcctgg agatgactct ctgctattca tgaatcttgc tattgcacaa 1140
accctatcaa gagctgctgc ttcccttcca gccagaaaag tggtaagcgg agcaagtgcc 1200
aagcagaaca gaccttatca tctgggtaac agacttctca gtgttggtgc tgtgtctgtt 1260
agagccttag agcaagttaa gcacttcctt ggtgtgggta aagaataaag.gggaaagaaa 1320
ctactttaga gcctcttttt ctcccaactc atatttttga taggaaaaac agaaaaccca 1380
tccagttctt cagaaattgc tttctaggca ttaatactac tttactatct atactgttta 1440
gttattcctt tctttaccca cctaaactat ccatctaatc caggattccc tcactctttt 1500
tttttagtta ctaatcattt tatgaaaata atgtatttat aagtattttc ttaaggtttg 1560
tgaagagtat ttgcattgtg tcttcatttt aatgtgtttg caatcgctcc gctccaggaa 1620
gaacggaaat gctgtcttgt gagcatgaag tgaacgggct gttttgcaat ccagccactt 1680
ttcttgtaca accacatgga tggattagat gtcctcaggt cttttccatc ttcagtttct 1740
atgactgtgg aataaatgtt cagatagaaa cttcaaaaaa aaaaaaaaaa aaaa 1794
<210> 7s
<211> 507
<212> ADN
<213> Homo sapiens
<400> 75
aagaaatgat tgaaatgttt caaggggaca tggagctgaa aggtggaatg agagacttcc 60
gtttgggcta taagcttgtg gttttatttg accttttaaa ctcagcactt acactacttt 120
atttctaaat gttctatgaa ggaataagag tttgtagaac aaaagagaag ggctaaaaga 180
gagaccagtt agaaagaggt ggagagtcag aactggagtg caaaagcaca aagattccag 240
ggcatacaag gatgataaat cacttccaca aatgagcgca aagggatatt gtgtacaatg 300
cttccatgaa ggaaagaggg gcactggatt aggtacccac ctgggtttga attgaacaac 360
tactgttttt cccaagcttt tgtgtttgac agtttttaac cctttggcat gttccatttt 420
cccgggggng ttgaggaccn tttaggagct tgggatgcct taagtcccgt taacnttaag 480
ttttctttcc ccccaaaggn gggttna 507


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
<210>76


<211>415


<212>ADN


<213>Homo sapiens


<400> 76
ttttttttaa tatttcgatg acatgttgaa tgcatataag aggttagagt gaacaaggaa 60
gttaagggct ttcttttttc aaaatcatat ttgcatttaa cttgaaattc tttccagtca 120
tacgattttt gcataaatat ttatgggatc ttgatggcta attagattat aagtctttta 180
tccaggaatt tgtctaattt tatgctctcc atcaaacctg agctctgtgc tgatcttcag 240
tccatgttaa acaaaattat tttaacaccc tttaaggctg catttcaaat tctctcattt 300
gttactcata ctatgtcatg ggaatatata gtctttattt ttgggatgaa agtttgaaga 360
cccaaatccc ccaaaaattg gatttcccnt gtggaaagct ctcattttgg atcca 415
<210> 77
<211> 1318
<212> ADN
<213> Homo sapiens
<400> 77
ggagctgaaa ggtggaatga gagacttccg tttgggctat aagccttgtg gttttatttg 60
accttttaaa ctcagcactt acactacttt atttctaaat gttctatgaa ggaataagag 120
tttgtagaac aaaagagaag ggctaaaaga gagaccagtt agaaagaggt ggagagtcag 180
aactggagtg caaaagcaca aagattccag gcatacaagg atgataaatc acttccacaa 240
atgagcgcaa agggatattg tgtacaatgc ttccatgaag aaagagggca ctgataggta 300
cccacctggt tgaaatgaac aactactgta ttccaagctt tgtgttgaca gttttaacct 360
ttgcatgtca ttttccaggg agtgagacct ttagagctgg atgcttaagt ctgtaactta 420
agtttcttcc acaaagagga tttattttgc tttttgtgac atgatggtgc tagaacaaaa 480
tgtactaaga aaaatttgat ggcagtgata gcattatctt gagggataaa gaagtggagt 540
gagaatgcta agtgtagatg aaaaggcctc ttcaaaaccc atttggattt gtaaagtgca 600
tgcctggaga cagcttgagc ctctagaaat gagaagaaca atgggagaat ggttttattc 660
ccatctgaat aattgcaagt tgaccttcct ccaactagaa aagtggggtt gtgtctgagg 720
acttggttgg agaataattt ttccttagtt gcttcatgat actgaacagg tcacttagcc 780
tttctcctcc ttactttctt tcacagtaaa atgagatggt aatctccact tctaagggtt 840
gttgtggaga ccacatgaag acattgatgt aactctgcct ggcagatgat gtaaagtgcc 900
catttgtgcc ttttgctttc tttgcttttg aggcatttgg cacttttatt attctttgat 960
caaaatgaga gctttcacat gggaaatcaa tttttggggg atttgggtct tcaaactttc 1020
atccaaaaat aaagactata tattccgtga catagtatga gtaacaaatg agagaatttg 1080
aaatgcagcc ttaaagggtg ttaaaataat tttgtttaac atggactgaa gatcagcaca 1140
gagctcaggt ttgatggaga gcataaaatt agacaaattc ctggataaaa gacttataat 1200
ctaattagcc atcaagatcc cataaatatt tatgcaaaaa tcgtatgact ggaaagaatt 1260
tcaagttaaa tgcaaatatg attttgaaaa aagaaagccc ttaacttcct tgttcact 1318
<210> 78
<211> 530


CA 02371500 2001-10-24
WO 00/71710 6~ PCTlFR0010142G
<212> ADN
<213> Homo sapiens
<400> 78
tagtctctac aatattgtca gactgatctc tgcaaaactc aaaagtcaaa ttactcttct 60
actttaaact tccagtagct cccggattca tttaagggta gaatctaaat cctttggcat 120
agcacttaag accatttcca agggagtggc tctaccatgg agccctagag actctacatg 180
tgtctacatg ggatgcacag gcaaagcttg gactgccata tgacctaaat ctgggtggaa 240
tgccctgtga tcctcctagg aacatgggca agggaggaaa tcttcagaga aggcttcgcg 300
aggttgtttt ctcatctgcc tctatcttgt ggggatgctg ccatgaggcg gttttctgga 360
tattaactcc caggtttcca gaggaacatg gaggatttcc aacttaaccc natggtttcc 420
gtagggtcag gaactgcagn tctattaggc ctttagrngg cagtctggga tttgacntgg 480
ccagcattag gggtgtattc acaantttgc tgnaggcctt ttgaccctat 530
<210> 79
<211> 495
<212> ADN
<213> Homo sapiens
<400> 79
ctgtatttgt atagagcaga aaatggatag tcagataaag aagcagactt,tcacaatatc 60
atatgttaat tttgtaatga gatagttgtt tagactagta aatagatcag ggttaaaggc 120
tttgattgaa tcagattatg aaaggtgcca aacacaaagg accgtccaag tctaacactt 180
acagattcag ctggtaaaga aataatgaac taattttaga ttcagccaga ttattactta 240
tatacatagg tgaaggaaaa gagaagctaa aggtgtcagc cctatgagtc cttatcccac 300
acaccaaaag ggtgggcact ggaaacaaan ggggtcagnt gggcttcagc nangngttgt 360
ggatacaccc tnttgctggc cngtcnattc cagactggca gctaantggc tatagagctg 420
cagttctgcc ctacgggngc ctaggggtta agttgggagt ctcntgttcc cctgggccng 480
gggtttatat cngtt 495
<210> 80
<211> 594
<212> ADN
<213> Homo sapiens
<400> 80
catttaaggg tagaatctaa atcctttggc atagcactta agaccatttc caagggagtg 60
gctctaccat ggagccctag agactctaca tgtgtctaca tgggatgcac aggcaaagct 120
tggactgcca tatgacctaa atctgggtgg aatgccctgt gatcctccta ggaacatggc 180
aagggaggaa atcttcagag aaggcttcgc gaggttgttt tctcatctgc ctctatcttg 240
tgggatgctg ccatgaggcg gttttctgat ataactccca ggttccagag gaacatgaga 300
cttccaactt aacccctatg cttccgtagg gcagaactgc agctctatag ccatttagct 360
gcagtctgga attgactggc cagcaatagg gtgtatcaca actcttgctg aagccatctg 420
accccttttg tttcagtgcc atccttttgg tgtgtgggat aaggactcat agggctgaca 480
tctttagctt ctcttttctt cactatgtat ataagtaata atctggctga atctaaaatt 540
agttcattat ttctttacca gctgaatctg taagtgttag acttggacgg tcct 594


CA 02371500 2001-10-24
WO 00/71710 65 PCTlFR0010142G
<210> 81
<211> 582
<212> ADN
<213> Homo sapiens
<400> 81
gttttctgga agtagggaga aaatcagagg ctaaagagtt tgaaaatgtg cacagaacag 60
tttgagctca aaatgccact cctaccttat tttgccaggt gattatcaat tcaccacaat 120
tcccacagga aatgagaggc attatctttt gccaaataga acttgatagg ctattaactt 180
gggtaccctg ggcctggagg aggatggaaa taagatagaa gactaaaaac aggatactaa 240
gtggaagtct gaataaaagg ggatgaactc caactcctat cccaccatgt ggcgtgcctc 300
tgcctgctcg ccagtaatgg tagccaggct tatatccccc atgctgacta gaacatcctt 360
ctctggggaa attaaagagc agacctctgg agaaattaca cttctcaaag aaaaattaac 420
aggcactgac atttagggtc ccaaaggcaa aaagtaggtc acactcaaag catctaactc 480
aaagaccctg gacttcagtt gtagaccctg agcagattag actttggatt gtctcccttg 540
ggtaaaatac agtggtctcc ccttattcaa agtttcactt tc 582
<210> 82
<211> 321
<212> ADN
<213> Homo sapiens
<400> 82
agtaaggctt ggcagttgac cttgtttgtt ggagagaagg gataagattt taaagctaca 60
tgtctgaaag aatgatgctg ctgattgaaa taaaggaaga aaggatgcat ttcgggctcc 120
aacctgtcct aggaaggcct agacctcaaa caccaacacc tccatgcatt tcctctttgg 180
ctactatgtc ttttccctga cttctgcctc tccagctctc tgggctgctg cttccacctg 240
ttcatctgac ttagaccctc cctgctgggt ccttgttcac ctactcattt ggtgcttcgt 300
ctgccatcag tacctccatt g 321
<210> 83
<211> 545
<212> ADN
<213> Homo sapiens
<400> 83
gtcaattaca tcagcacttg gactggacca gggaaaggaa tgattctgct tcctgggaat 60
gtcagaagga cctgatgatt atatttggca aagccaggag gagtggcttt gaatgtcatt 120
gctaagaatt acactttgag tagcatttct ggatgtctga gcttttcaaa tgatacttct 180
tttctgctgt ggctttcctt tctgttggac tggttcccag agggtcctct tgtttgtcct 240
tgccctcgct tttatatcag ttcatgtttt ctcttctgtc atcttccttc ccagcgctgt 300
ttctccaccc cctcctgctg cactcacaac agcttcccct ctcctgttta gaggtggaag 360
catgtaagaa tgcgtttgag ggggatgctt gccaaaggac agcatattca acatctggta 420
tcaacaaggt aatgtttaac cttagactag ccaaactagt gatgacçtgc ttccatgctg 480


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
catctgctgc tttttgtgtt gatgggactc agaaatcatg agaaaggtct tcagtgatcc 540
atgac 545
<210> 84
<211> 183
<212> ADN
<213> Homo sapiens
<400> 84
caccaaagct gaagtctctc acttaatcct aagcaagggg ctagggagaa ctaagatatc 60
cttcccatat caagggatat aggttactag aagggtggag gtctcttaac aggctcactc 120
acctttcaga gtttaaatta tggtcaggct taagaagctc tctcttgtga ctgagtgtat 180
tgc 183
<210> 85
<211> 843
<212> ADN
<213> Homo sapiens
<400> 85
ggaatggaca tgaagaggat ttcacagtat gtagagcaga aggcacgtga atgtgtttgc 60
tttggcttgg agcttattaa gttttgacta cggttaaaat aagtcaaata gtaagtggta 120
aaacacattt ttgttagtat tggaactttc tggagaacat aagggctatg agaatgcata 180
tatatatttt ttaacatttc ctatatatct aaggtaccaa agcactgagt ctaatttacc 240
tattaaggga gactctttaa aatcaacttt ataactaatt catactataa gacagataat 300
agctaaagtt ttggaataat ttatattaaa agccgcaagt cttaaaaatc cctggatatg 360
acataaaaag gattttggct tcttttttga agtatttaaa attaatcacc ttagctctac 420
catatactag atctgtgacc gctacacaaa ttgtttatca tctttgggtc tctattgcct 480
tctttataaa ataagtgtaa gttgttcagc ctgcctcaca gggctgttgt gaggaaataa 540
aatgaaatgg agtatgtgaa attgcttcag caacagcaaa gtgctacgta aatgtaaagt 600
gttgttttta gctaataatg gatttaagtg tttggataat tgtagatgca tttactttga 660
taaagcgtgt gcttaaagtg gtatcaccag tgatttctaa catgatttta aaaaaataaa 720
accccaatta aaatgttctt taatattcat ttaatttgtg catgacttgt ggcctttttg 780
tattttctca agcctattac tctagagctg taaaagctct tgcacagcat tgttgtgtca 840
gtg 843
<210> 86
<211> 613
<212> ADN
<213> Homo sapiens
<400> 86
aggttatcca cttttgctga agatattttt tattgaatca aagattgagt tacaattata 60
cttttcttac ctaagtggat aaaatgtact tttgatgaat cagggaattt ttttaaagtt 120
ggagtttagt tctaaattga ctttacgtat tactgcagtt aattcctttt ttggctaggg 180


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
atggtttgat aaaccacaat tggctgatat tgaaaatgaa agaaacttaa aaggtgggât 240
ggatcatgat tactgtcgat aactgcagat aaatttgatt agagtaataa ttttgtcatt 300
taaaaacaca gttgtttata ctgcccatcc taggatgctc accttccaag attcaacgtg 360
gctaaaacat cttctggtaa attgtgcgtc catattcatt ttgtcagtag ccaggagaaa 420
tggggatggg ggaaatacga cttagtgagg catagacatc cctggtccat cctttctgtc 480
tccagctgtt tcttggaacc tgctctcctg cttgctggtc cctgacgcag agaccgttgc 540'
ctcccccaca gccgtttgac tgaaggctgc tctggagacc tagagtaaaa cggctgatgg 600
aagttgtggg acc 613
<210> 87
<211> 705
<212> ADN
<213> Homo sapiens
<400> 87
gctaatgttt cttgctgggt aattattagc ataaatatca ggttcttaga ggtctttaag 60
agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct gaaataccag 120
gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc tgccccattg 180
ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt ggaaccctcc 240
gagccagaaa gaagcattcc agcatgattc ctcagatgca atgaggaagg tttacagaat 300
tttcacaggg caacagagat caagtggtat gaaaaggtag gagttttaag ctcaagtctc 360
aaagataacc tacctttaca ttctcagtca gaatttgacc cagaaagagg aagtttcttc 420
aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga gtacagaact 480
tggtcataat atcttgcatt ttatagattt attaaagatt agtttcaagt tcacattcgc 540
tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc acacaggtat 600
gctcctctct tttctgagag agaaggcatg ggattttcag cataaattcc atgttatgtg 660
agtgctgttt gagttctgaa gttcctatca atatctgttc ctgca 705
<210> 88
<211> 459
<212> ADN
<213> Homo sapiens
<400> 88
ctcgttgctc agtttagggc actactctta aaaaaggaaa gttaacaaac tggaatagag 60
tcagagataa ctttgagaaa accgatgtca ttaaactggt gtctctggac ctgaggtttg 120
cactcacatt tccatctggc ggccccataa gcaatctgtc ctacagataa ctcgtcctac 180
acaaaactta gtctcttttc agctcagctc tctcactctc aattatatct ccttacttcc 240
atatggcact gttgtacact catttactca gagccagaaa cgtcagcgtc atcttggatt 300
tttcttatgc tctttctctc tctagtcata tgccagactt taaactctgc ttgaaagctt 360
tctcataagc tctttccttt tccctttcta ctgctttgca tttgctactt aacccttttc 420
ttcaggctgt ttgctttcca gtccatcgtt cgctctgct 459
<210> 89
<211> 775
tgccctcgct tttatatcag ttcatgtttt ctc


CA 02371500 2001-10-24
WO 00/71710 ~s PCTlFR0010142G
<212> ADN
<213> Homo sapiens
<400> 89
tctatccgtc cgcgtcagcg ccttgccacc ctcatctcca atatgcctgg tccgaccccc 60
agtggcacta acgtgggatc ctcagggcgc tctcccagca aagcagtggc cgcccgggcg 120
gcgggatcca ctgtccggca gaggtaagga accctgcagt tcgttcgctt ccagactcgg 180
agataggacc cagaacctcg ctgattctgg ggtggagacc ctagcatgtg aagattgaca 24D
aaggcaaaat gagcttctag tgacgtggcc gtgggagtag ttaaaggcct tttgggagga 300
aggcgacatt ttttttctcg ttgctcagtt tagggcacta ctcttaaaaa aggaaagtta 360
acaaactgga atagagtcag agataacttt gagaaaaccg atgtcattaa actggtgtct 420
ctggacctga ggtttgcact cacatttcca tctggcggcc ccataagcaa tctgtcctac 480
agataactcg tcctacacaa aacttagtct cttttcagct cagctctctc actctcaatt 540
atatctcctt acttccatat ggcactgttg tacactcatt tactcagagc cagaaacgtc 600
agcgtcatct tggatttttc ttatgctctt tctctctcta gtcatatgcc agactttaaa 660
ctctgcttga aagctttctc ataagctctt tccttttccc tttctactgc tttgcatttg 720
ctacttaacc cttttcttca ggctgtttgc tttccagtcc atcgttcgct ctgct 775
c210> 90
<211> 727
<212> ADN
<213> Homo sapiens
<400> 90
gaatgctgtt acctgaaccc cttacttcga aggatcataa gattcacagg ggtgtttgca 60
tttggacttt ttgctactga catttttgta aacgccggac aagtggtcac tgggcactta 120
acgccatact tcctgactgt gtgcaagcca aactacacca gtgcagactg ccaagcgcac 180
caccagttta taaacaatgg gaacatttgt actggggacc tggaagtgat agaaaaggct 240
cggagatcct ttccctccaa acacgctgct ctgagcattt actccgcctt atatgccacg 300
atgtatatta caagcacaat caagacgaag agcagtcgac tggccaagcc ggtgctgtgc 360
ctcggaactc tctgcacagc cttcctgaca ggcctcaacc gggtctctga gtatcggaac 420
cactgctcgg acgtgattgc tggtttcatc ctgggcactg cagtggccct gtttctggga 480
atgtgtgtgg ttcataactt taaaggaacg caaggatctc cttccaaacc caagcctgag 540
gatccccgtg gagtacccct aatggctttc ccaaggatag aaagccctct ggaaacctta 600
agtgcacaga atcactctgc gtccatgacc gaagttacct gagacgactg atgtgtcaca 660
agctgttttt taaaatcatc ttccaattct atacttcaaa acacacagtt gctcaatgtc 720
aaactgt 727
<210> 91
<211> 478
<212> ADN
<213> Homo sapiens
<400> 91
cagtttttat cacaggtgca agccgtggca ttggcaaagc tattgcattg aaagcagcaa 60
aggatggagc aaatattgtt attgctgcaa agaccgccca gccacatcca aaacttctag 120


CA 02371500 2001-10-24
WO 00/71710 6~ PCTlFR0010142G
gcacaatcta tactgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 180
ttgttgatgt gagagatgaa cagcagatca gtgctgcagt ggagaaagcc atcaagaaat 240
ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300
acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360
catctaaagc atgtattcct tatttgaaaa agagcaaagt tgctcatatc ctcaatatca 420
gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgc 478
<210> 92
<211> 679
<212> ADN
<213> Homo sapiens
<400> 92
gccaggaaac agcaaatcca atagatccga ctttatcagg ctgggctctc gcttcagatt 60
cagtgggcgg acagaatatc aagctacaca tggctccagg ttacgaagaa ccagcacctt 120
tgagaggaag cctagtaaac gttatccatc ccggagacat tcaacgttca aagcaagcaa 180
cccagtgata gcagcccagc tctgctctaa aacaaatcca gaagtccata attaccagcc 240
tcaatatcat cctaatatcc atcccagcca gccccggtgg catcctcact ctccaaatgt 300
caggccatcc tttcaggatg acaggtcgca ttggaaagca tcggccagtg gagatgacag 360
ccattttgat tatgtccacg accagaacca gaagaactta ggagggatgc aaagtatgat 420
gtatcgagat aaactcatga ctgcactttg agagactgaa gcatctctct tccattcacc 480
ttcatagttt cattgcattc catgaaaagt gtcttggcct cagatggatg gatgtgtttg 540
gacgagtgtc tttaaggagt agtcctgaaa ggtgtttttg gtgtccatgt aaatatttga 600
agataaaacc actatagctt gtcataattt actgttgact gcattctcat taaaatgaag 660
gtaaaggctc aggaatcat
<210> 93
<211> 691
<212> ADN
<213> Homo sapiens
<400> 93
ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60
atgtctattg cctggagtca tccctgcaga cctacaaccc agactacgtc ctgatggtag 120
aagacgatgc tgtaccagaa gagcagatct tcccagtctt ggagcacctt ctgcgggctc 180
gcttctctga gccacatctc agagatgccc tttatctcaa gctgtatcac cccgagaggc 240
tccagcacta catcaatcca gagcccatgc ggatcctgga atgggttggt gtaggcatgt 300
tgctggggcc cttactaacc tggatataca tgaggtttgc cagccgccca gggtttagct 360
ggcctgtaat gctcttcttc tccctgtata gcatgggtct ggtggagctg gtgggtcggc 420
actatttcct ggaactgcgg cggctgagtc cttccctgta cagtgtggtt cctgcctctc 480
agtgttgcac cccagccatg ctcttcccgg cacctgcggc ccgccggacc ctcacctacc 540
tgtcccaagt gtactgccac aagggctttg gcaaggacat ggcactgtac tcgctgttga 600
gggccaaggg agagagggcc tatgtagtgg agccgaacct cgtgaaacac atcgggctct 660
tctccagtct ccggtacaac tttcatccca g 691


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
<210> 94
<211> 451
<212> ADN
<213> Homo sapiens
<400> 94
caactttctc cattcccagc tgggccccat tcctggattt aagatggtgg ctatccctga 60
ggagtcacca taaggagaaa actcaggaat tctgagtctt ccctgctaca ggaccagttc 120
tgtgcaatga acttgagact cctgatgtac actgtgatat tgaccgaagg ctacatacag 18~
atctgtgaat cttggctggg acttcctctg agtgatgcct gagggtcagc tcctctagac 240
attgactgca agagaatctc tgcaacctcc tatataaaag catttctgtt aattcattca 300
gaatccattc tttacaatat gcagtgagat gggcttaagt ttgggctaga gtttgacttt 360
atgaaggagg tcattgaaaa agagaacagt gacgtaggca aatgtttcaa gcactttaga 420
aacagtactt ttcctataat tagttgatat a 451
<210> 95
<211> 662
<212> ADN
<213> Homo sapiens
<400> 95
ggacctttgc tgctgttgga cactccgtca ccttttggaa cacaagtata tcaagatagt 60
ggctactgat gttcaagtgg gattgaagtg tgataaatgg atatattttg ttgtttgctg 120
gggtgttcat ggagatgtta agagattgag gccctgggct gagggtatat aatgtatgtc 180
aggtaaagtt tgaagactgc caaggagcag attttctccc tggaaatgtg aaaactgaac 240
ctataactct gataaggact tgagatgtgt agaaacgttg ggttatggaa gactagtttc 300
ttccataacc ctgaattgga gaccttaatg ctaagtgtag attattgagg tttgttagtg 360
aggaaaagaa taagagttca gaagcctttg ttatcagata gcgaaatcag ggcctagtga 420
ggagcacagg tcgactacat aatggagtcc attggcgaac cctattgcaa tttggtccaa 480
ctatatcttc tggtgaagga aattaatgat gtaagaaaat gcaagaggct caacttctct 540
tccaaaaatc ttctggcttc tgaactcttc ctctgcctct ctttaaataa ataacacaga 600
atttcaagtg gtaggagact tattaagcca gtcaccaagc ttggtctgtc agcctgtctt 660
ct 662
<210> 96
<211> 766
<212> ADN
<213> Homo sapiens
<400> 96
ctatcctttc agcccaccaa cttagcggca gcactaggga ttcattataa ggtaaatctg 60
gtttacataa agacctgaag gaggcctgta tttgaagctc acacttggta ttggtatctc 120
tcatttttac tgagccagtg tggaatacca ctgtatgtac tcatataagc ccttgacttt 180
tactgctcat caggattgga atattactct agcagtcttc acacataggc aagttacagt 240
ccttttaaaa agnatctcat ttccctataa tggaacctaa tagccaactt tttcatagaa 300
attgctagaa gagtttgatc aactataaat gataaagtgt ttataagcat agtcagtgtg 360


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
71
acacagaaac caatcttaaa attgaattta atgttttatc atatcagatt aaatattttc 420
tccatgtctt atttttactg caacaagtta gaaagtggga acactttgat taatgtctta 480
aaatttgtgg gccctcattt ggataaaggc agcaatccta aggacttttt ttttttttaa 540
cataatctga gaatttctct gtagagcaga gactttcaaa ccttttggct gtaacccaca 600
gtaaaaaacg catttatatc aaaccttaga atatgtttaa tgaacaatac ttaccattct 660
gatgcttttt attgtttcag tttttaaaat atgccagttg caacccacta aattgatatc 720'
taccaatggg ttgcaaccct tagcttgaaa aaaacaccct cacaga 766
<210> 97
<211> 5B4
<212> ADN
<213> Homo sapiens
<400> 97
agttgatcga ttcatgtcgt attgatagaa tcttgaccag aagaaatttt gctcttttta 60
tatagtttca agaaatgtgt ttttaaattt ttattaatgc acttgaacaa ctttgcagga 120
ataaagcaac cccctaacca caaaatatcc ctctaae_tta gttccctagc tttctcaatg 180
aatacacaca tatttttaca tagctatgat cgttgtgtac attctccttt gttttacttc 240
tcggcctaac acttgtctcc tcttgtcaac acagattcta ctctcaccaa tttaaatgtc 300
tttatatcca tgtaacatgg gtaacctcac ttcaccccat tattagatat ttgagttata 360
tctaattttt cactcttata aatagtgctg ctatgaatgt ctgtaaaaaa aaaaaaactg 420
ctccttcttt tggattattc ccttaggaat atctccaaag agggattaca aggtcaaaga 480
gcatgaagta ttttatagct cttgttttat attgccagat tgctttctag aaagatccaa 540
tctttgggtt ggaaggacct taaaggtcat ctagtttagc ctcc 584
<210> 98
<211> 1251
<212> ADN
<213> Homo sapiens
<400> 98
gtgtgtagca gcgtgtccaa ggcaagaact gaaaactctg agtgatgttc agaagtttgc 60
agagataaat ggttcagccc tatgtagcta cancctaaag ccttctgaat acactacatc 120
tccaaaatct tctgttctct gccccaaact accagttcca gcgagtgcac ctattccatt 180
cttccatcgc tgtgctcctg tgaacatttc ctgctatgcc aagtttgcag aggccctgat 240
cacctttgtc agtgacaata gtgtcttaca caggctgatt agtggagtaa tgaccagcaa 300
agaaattata ttgggacttt gcttgttatc actagttcta tccatgattt tgatggtgat 360
aatcaggtat atatcaagag tacttgtgtg gatcttaacg attctggtca tactcggttc 420
acttggaggc acaggtgtac tatggtggct gtatgcaaag caaaga~ggt ctcccaaaga 480
aactgttact cctgagcagc ttcagatagc tgaagacaat cttcgggccc tcctcattta 540
tgccatttca gctacagtgt tcacagtgat cttattcctg ataatgttgg ttatgcgcaa 600
acgtgttgct cttaccatcg ccttgttcca cgtagctggc aaggtcttca ttcacttgcc 660
actgctagtc ttccaaccct tctggacttt ctttgctctt gtcttgtttt gggtgtactg 720
gatcatgaca cttctttttc ttggcactac cggcagtcct gttcagaatg agcaaggctt 780
tgtggagttc aaaatttctg ggcctctgca gtacatgtgg tggtaccatg tggtgggcct 840
gatttggatc agtgaattta ttctagcatg tcagcagatg acagtggcag gagctgtggt 900


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
72
aacatactat tttactaggg ataaaaggaa tttgccattt acacctattt tggcatcagt 960
aaatcgcctt attcgttacc acctaggtac ggtggcaaaa ggatctttca ttatcacatt 1020
agtcaaaatt ccgcgaatga tccttatgta tattcacagt cagctcaaag gaaaggaaaa 1080
tgcttgtgca cgatgtgtgc tgaaatcttg catttgttgc ctttggtgtc ttgaaaagtg 1140
cctaaattat ttaaatcaga atgcatacac agccacagct atcaacagca ccaacttctg 1200
cacctcagca aaggatgcct ttgtcattct ggtggagaat gctttgçgag t 1251
<210> 99
<211> 710
<212> ADN
<213> Homo sapiens
<400> 99
tttgatcctc cagtgtgact gttgtttttg tttgggggtg ggttggggtt ttttgctttt 60
tattcctgaa gcttaccaga tatgaatggc taatactcca ttgttctgct tgttgtaatg 120
gtgaatgctt taagaaaaaa aagtgtaatt tgctaagaat aattcatgat ctgtttatgc 180
gataactcct ttttgttaca atttttttaa aaaaagctat ttttgttaat gtaaagtaaa 240
tatttcagag caaatttttt aaacttattg cactaaatac aggctctgta caaaaaaaaa 300
aaaaaaaaaa aaaagcctca gcattttatc attccatgga aggagaatct tttgaaagaa 360
agcattgcct cctaccagaa ctagacagtg aattagatcg gtattatgga aatgcataca 420
agtaatgtca ctagggctta ataagcagcc gtttgctaat gtgcttcctt.tcaaagggtt 480
ggacctttaa attgctgcaa aaggtaaatt gtattttttt ttaagtattg gtgttcttta 540
ctctagctag gctaaaattt gctaaatgcc ttggtttctt ttaaaagttc atgtaatatt.600
tctgattttt cagaatattt gcaataagag tctggatttt aaaaaacaca tgcatacaca 660
caattaagag ctcatgtctt agcaagatct gggaaaccaa cattgcgaga 710
<210> 100
<211> 580
<212> ADN
<213> Homo sapiens
<400> 100
aggttcctgt agtctgtgct cagaacttgg tttttggccc ctattgtttt tgcctatttt 60
gattttcaga gatgatcaca tggggacagt taacttttct tctgctgtgt tgccttaatg 120
ctactagatt gtgttgtgtt gttggagttt tctgacttct tccctataaa aagatactga 180
gagctccata atgaaagaag ttgttatact ttctcagaat attctggacc actgaatgca 240
cttctaatag agctttaatc taaagaagtt agttcagtgg ttattaactg attttattac 300
aggagaaaaa aactttaaca aaaaggcagg gagaaaagtg tgaagggcat caagcaaaat 360
gacaggggct tcaaaaaaca accaaagaca aaaccctatc ttctgaagac caaaggtcca 420
actttactta ctggctggca cagcctttct gaactccttg agtttagaat agagctccta 480
gaataataag gcggccaaat tttaaagatc agtcaataca gtagggacct gctattgatc 540
tctcaggcac tgagttcttc acatccagtg tcaagcccag 580
<210> 101
<211> 223


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
73
<212> ADN
<213> Homo sapiens
<400> 101
atgacagaga tttgccttcc agggggtcta atttgaagag gaaagtaatt taaatgtata 60
ggtttatata atagcattgt atttttctct attttattca ttctttcatt ctcttcgatg 120-
actcccagca cctgcgcgtc catcttcatt cttagccaat gacctttcct tttacttaac 180
agagaaaata acaatcagaa gagtcttcat aagttcccac ccc 223
<210> 102
<211> 19
<212> ADN
<213> Homo sapiens
<400> 102
ctcctttccc accagacac 19
<210> 103
<211> 20
<212> ADN
<213> Homo sapiens
<400> 103
cattccaagg ttcccttttt 20
<210> 104
<211> 22
<212> ADN
<213> Homo sapiens
<400> 104
agctcctctt gcctaagtgg tc 22
<210> 105
<211> 22
<212> ADN
<213> Homo sapiens
<400> 105
gtttgtgtgg ttctgttttc ca 22
<210> 106
<211> 19


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
74
<212> ADN
<213> Homo sapiens
<400> 106
aaccctgtgc tgatctccc 19
<210> 107
<211> 18
<212> ADN
<213> Homo sapiens
<400> 107
gtgcttcaaa ggcttcaa 18
<210> 108
<211> 17
<212> ADN
<213> Homo sapiens
<400> 108
tcagtggaaa gaaatgt 17
<210> 109
<211> 18
<212> ADN
<213> Homo sapiens
<400> 109
atggggacga tttcagtg 1g
<210> 110
<211> 21
<212> ADN
<213> Homo sapiens
<400> 110
ctgctgtcta ttgggaaagt t 21
<210> 111
<211> 20
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
<4D0> 111
agaagcagtg gacaggggag 20
<210> 112
<211> 22
<212> ADN
<213> Homo sapiens
<400> 112
ctggttgaac ctgtggattg tg 22
<210> 113
<211> 22
<212> ADN
<213> Homo sapiens
<400> 113
tggagagcag cttccaaaaa tc 22
<210> 114
<211> 1B
<212> ADN
<213> Homo sapiens
<400> 114
caatgcacct gtcagggg 18
<210> 115
<211> 22
<212> ADN
<213> Homo sapiens
<400> 115
tgttggacct ggtactctcc ac 22
<210> 116
<211> 18
<212> ADN
<213> Homo sapiens
<400> 116
gggcaaatgg ggaaacat 1g


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
7G
<210> 117
<211> 19
<212> ADN
<213> Homo sapiens
<400> 117
gggaagacag gggaaagag
19
<210> 118
<211> 22
<212> ADN
<213> Homo sapiens
<400> 118
ccattgactc ctccttcttt ct 22
<210> 119
<211> 19
<212> ADN
<213> Homo sapiens
<400> 119
agtaacaaca taccctgcc 19
<210> 120
<211> 21
<212> ADN
<213> Homo sapiens
<400> 120
cagacatgac tgaattggtg g 21
<210> 121
<211> 20
<212> ADN
<213> Homo sapiens
<400> 121
aaacaccccc atcccctcac 20
<210> 122
<211> 19


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
77
<212> ADN
<213> Homo sapiens
<400> 122
ggggctgaca gcagggttt
19
<210> 123
<211> 20
<212> ADN
<213> Homo sapiens
<400> 123
aaaccccacc ccagttcctt 20
<210> 124
<211> 21
<212> ADN
<213> Homo sapiens
<400> 124
gaagtgaacg ggctgttttg c 21
<210> 125
<211> 19
<212> ADN
<213> Homo sapiens
<400> 125
ggagctgaaa ggtggaatg 1g
<210> 126
<211> 22
<212> ADN
<213> Homo sapiens
<400> 126
agtgaacaag gaagttaagg gc 22
<210> 127
<211> 21
<212> ADN
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
78
<400> 127
cccggattca Gttaagggta g 21
<210> 128
<211> 18
<212> ADN
<213> Homo sapiens
<400> 128
cacaaaggac cgtccaag 18
<210> 129
<211> 461
<212> PRT
<213> Homo sapiens
<400> 129
Met Asp Ser Gln Lys Tyr Cys Phe Lys Glu Asn Glu Asn Val Thr Val
1 5 10 15
Asp Lys Ala Cys Phe Leu Ile Ser Asn Ile Thr Ile Gly Pro Glu Ser
20 25 30
Ile Asn Leu Gln Gln Glu Ala Leu Gln Arg Ile Ile Ser Thr Leu Ala
35 40 45
Asn Lys Asn Asp Glu Ile Gln Asn Phe Ile Asp Thr Leu His His Thr
50 55 60
Leu Lys Gly Val Gln Glu Asn Ser Ser Asn Ile Leu Ser Glu Leu Asp
65 70 75 80
Glu Glu Phe Asp Ser Leu Tyr Ser Ile Leu Asp Glu Val Lys Glu Ser
85 90 95
Met Ile Asn Cys Ile Lys Gln Glu Gln Ala Arg Lys Ser Gln Glu Leu
100 105 110
Gln Ser Gln Ile Ser Gln Cys Asn Asn Ala Leu Glu Asn Ser Glu Glu
115 120 125
Leu Leu Glu Phe Ala Thr Arg Ser Leu Asp Ile Lys Glu Pro Glu Glu
130 135 140
Phe Ser Lys Ala Ala Arg Gln Ile Lys Asp Arg Val Thr Met Ala Ser
145 150 155 160


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
79
Ala Phe Arg.Leu Ser Leu Lys Pro Lys Val Ser Asp Asn Met Thr His
165 170 175
Leu Met Val Asp Phe Ser Gln Glu Arg Gln Met Leu Gln Thr Leu Lys
180 185 190
Phe Leu Pro Val Pro Lys Ala Pro Glu Ile Asp Pro Val Glu Cys Leu
195 200 205
Val Ala Asp Asn Ser Val Thr Val Ala Trp Arg Met Pro Glu Glu Asp
210 215 220
Asn Lys Ile Asp His Phe Ile Leu Glu His Arg Lys Thr Asn Phe Asp
225 230 235 240
Gly Leu Pro Arg Val Lys Asp Glu Arg Cys Trp Glu Ile Ile Asp Asn
245 250 255
Ile Lys Gly Thr Glu Tyr Thr Leu Ser Gly Leu Lys Phe Asp Ser Lys
260 265 270
Tyr Met Asn Phe Arg Val Arg Ala Cys Asn Lys Ala Val Ala Gly Glu
275 280 285
Tyr Ser Asp Pro Val Thr Leu Glu Thr Lys Ala Leu Asn Phe Asn Leu
290 295 . 300
Asp Asn Ser Ser Ser His Leu Asn Leu Lys Val Glu Asp Thr Cys Val
305 310 315 320
Glu Trp Asp Pro Thr Gly Gly Lys Gly Gln Glu Ser Lys Ile Lys Gly
325 330 335
Lys Glu Asn Lys Gly Ser Val His Val Thr Ser Leu Lys Lys His Thr
340 345 350
Arg Ser Gly Thr Pro Ser Pro Lys Arg Thr Ser Val Gly Ser Arg Pro
355 360 365
Pro Ala Val Arg Gly Ser Arg Asp Arg Phe Thr Gly Glu Ser Tyr Thr
370 375 380
Val Leu Gly Asp Thr Ala Ile Glu Ser Gly Gln His Tyr Trp Glu Val
385 390 395 400
Lys Ala Gln Lys Asp Cys Lys Ser Tyr Ser Val Gly Val Ala Tyr Lys
405 410 ~ 415


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
Thr Leu Gly Lys Phe Asp Gln Leu Gly Lys Thr Asn Thr Ser Trp Cys
420 425 430
Ile His Val Asn Asn Trp Leu Gln Asn Thr Phe Ala Ala Lys His Asn
435 440 445
Asn Lys Val Lys Ala Leu Asp Val Thr Val Leu Lys Lys
450 455 460
<210> 130
<211> 32
<212> PRT
<213> Homo sapiens
<400> 130
Ile Lys Asn Ile Ile Leu Ser Val Ser Leu Trp Ser Lys Met Phe Met
1 5 10 15
Val Glu Thr Gly Asp Leu Ala Ala Ser Leu Thr Thr Phe Ser,Lys Cys
20 25 30
<210> 131
c211> 183
<212> PRT
c213> Homo sapiens
<400> 131
Asn Ile Ile Gly Gln Ser Val Glu Glu Ala Ile Arg Gly Val Phe Asp
1 5 10 15
Ala Ser Leu Lys Met Ala Gly Phe Tyr Gly Leu Tyr Thr Trp Leu Thr
20 25 30
His Thr Met Phe Gly Ile Asn Ile Val Phe Ile Pro Ser Ala Leu Ala
35 40 45
Ala Ile Leu Gly Ala Val Pro Phe Leu Gly Thr Tyr Trp Ala Ala Val
50 55 60
Pro Ala Val Leu Asp Leu Trp Leu Thr Gln Gly Leu Gly Cys Lys Ala


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
81
65 70 75 g0
Ile Leu Leu Leü Ile Phe His Leu Leu Pro Thr Tyr Phe Val Asp Thr
85 90 95
Ala Ile Tyr Ser Asp Ile Ser Gly Gly Gly His Pro Tyr Leu Thr Gly
100 105 110
Leu Ala Val Ala Gly Gly Ala Tyr Tyr Leu Gly Leu Glu Gly Ala Ile
115 120 125
Ile Gly Pro Ile Leu Leu Cys Ile Leu Val Val Ala Ser Asn Ile Tyr
130 135 140
Ser Ala Met Leu Val Ser Pro Thr Asn Ser Val Pro Thr Pro Asn Gln
145 150 155 160
Thr Pro Trp Pro Ala Gln Pro Gln Arg Thr Phe Arg Asp Ile Ser Glu
165 170 175
Asp Leu Lys Ser Ser Val Gly
180
<210> 132
<211> 291
<212> PRT
<213> Homo sapiens
<400> 132
Met Asp Ser Pro Trp Asp Glu Leu Ala Leu Ala Phe Ser Arg Thr Ser
1 5 10 15
Met Phe Pro Phe Phe Asp Ile Ala His Tyr Leu Val Ser Val Met Ala
20 25 30
Val Lys Arg Gln Pro Gly Ala Ala Ala Leu Ala Trp Lys Asn Pro Ile
35 40 45
Ser Ser Trp Phe Thr Ala Met Leu His Cys Phe Gly Gly Gly Ile Leu
50 55 60
Ser Cys Leu Leu Leu Ala Glu Pro Pro Leu Lys Phe Leu Ala Asn His
65 70 75 80
Thr Asn Ile Leu Leu Ala Ser Ser Ile Trp Tyr Ile Thr Phe Phe Cys
85 90 95


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
82
Pro His Asp Leu Val Ser Gln Gly Tyr Ser Tyr Leu Pro Val Gln Leu
100 105 110
Leu Ala Ser Gly_Met Lys Glu Val Thr Arg Thr Trp Lys Ile Val Gly
115 120 125
Gly Val Thr His Ala Asn Ser Tyr Tyr Lys Asn Gly Trp Ile Val Met
130 135 140
Ile Ala Ile Gly Trp Ala Arg Gly Ala Gly Gly Thr Ile Ile Thr Asn
145 150 155 160
Phe Glu Arg Leu Val Lys Gly Asp Trp Lys Pro Glu Gly Asp Glu Trp
165 170 175
Leu Lys Met Ser Tyr Pro Ala Lys Val Thr Leu Leu Gly Ser Val Ile
180 185 190
Phe Thr Phe Gln His Thr Gln His Leu Ala Ile Ser Lys His Asn Leu
195 200 205
Met Phe Leu Tyr Thr Ile Phe_ Ile Val Ala Thr Lys Ile Thr Met Met
210 215 220
Thr Thr Gln Thr Ser Thr Met Thr Phe Ala Pro Phe Glu Asp Thr Leu
225 230 235 240
Ser Trp Met Leu Phe Gly Trp Gln Gln Pro Phe Ser Ser Cys Glu Lys
245 250 255
Lys Ser Glu Ala Lys Ser Pro Ser Asn Gly Val Gly Ser Leu Ala Ser
260 265 270
Lys Pro Val Asp Val Ala Ser Asp Asn Val Lys Lys Lys His Thr Lys
275 280 285
Lys Asn Glu
290
<210> 133
<211> 48
<212> PRT
<213> Homo sapiens
<400> 133


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
s3
Ser Ile Arg Pro Arg Gln Arg Leu Ala Thr Leu Ile Ser Asn Met Pro
1 ~ 5 10 15
Gly Pro Thr Pro Ser Gly Thr Asn Val Gly Ser Ser Gly Arg Ser Pro
20 25 30
Ser Lys Ala Val Ala Ala Arg Ala Ala Gly Ser Thr Val Arg Gln Arg
35 40 45
<21D> 134
<211> 22
<212> PRT
<213> Homo sapiens
<400> 134
Asn Lys Thr Gln Arg Pro Cys Ala Gln Gln His Ser Arg Met Pro Pro
1 5 10 15
Ile Pro Arg Phe Pro Phe
<210> 135
<211> 95
<212> PRT
<213> Homo sapiens
<400> 135
Met Trp Asp Phe Arg Ala Arg Ile Phe Asn Ser Gln Gln Tyr Trp Lys
1 5 10 15
Leu Arg Leu Gln Asn Pro Gly Met Glu Gly Arg Glu Phe Glu Leu Cys
20 25 30
Ser Leu His Arg Met Gly Ser Gln Glu Asn Ala Asn Val Lys Leu Ser
35 40 45
Tyr Arg Glu Val Ser Ile Asn Leu His Arg Thr Pro Thr Lys Asp Thr
50 55 60
Leu Arg Glu Lys Val Cys Ser Pro Lys Tyr Thr Ser Leu Phe Asn Leu
65 70 75 80


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
s~
Leu Pro Lys.Ile Arg Glu Asn Ala Asp Thr Ala Gly Lys Arg Ser
85 90 95
<210> 136
<211> 108
<212> PRT
<213> Homo sapiens
<400> 136
Leu Lys Thr His Phe Pro Pro Cys Pro Arg His Lys Phe Ile Leu Met
1 5 10 15
Leu Ile Leu Gln Ser Leu Arg Tyr His Ala Ser Tyr Arg Asp Ile Leu
20 25 30
Asp Asp Leu Leu His Gln Asp Arg Ile Gly Gln His Met Ser Pro Glu
35 40 45
Gly Cys Met Leu Lys Gln Gln Ser Lys Gln Leu Ala His Asn Arg Gln
50 55 60
Leu Leu Arg Pro Asn Ser Val His Pro Gln Ala Leu Gln His Gln Pro
65 70 75 80
Glu Asp Ser Arg Gln Glu Ser Gln Asp Gly Asp Thr Asp Pro Pro Gln
85 90 95
Leu Val Pro Thr Ile Thr Glu Thr Glu Met Ser Gln
100 105
<210> 137
<211> 213
<212> PRT
<213> Homo sapiens
<400> 137
Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg Ile Ile Arg Phe Thr
1 5 10 15
Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp Ile Phe Val Asn Ala
20 25 30
Gly Gln Val Val Thr Gly His Leu Thr Pro Tyr Phe Leu Thr Val Cys


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
ss
35 40 45
Lys Pro Asn Tyr Thr Ser Ala Asp Cys Gln Ala His His Gln Phe Ile
SO 55 60
Asn Asn Gly Asn Ile Cys Thr Gly Asp Leu Glu Val Ile Glu Lys Ala
65 70 75 80
Arg Arg Ser Phe Pro Ser Lys His Ala Ala Leu Ser Ile Tyr Ser Ala
85 90 95
Leu Tyr Ala Thr Met Tyr Ile Thr Ser Thr Ile Lys Thr Lys Ser Ser
100 105 110
Arg Leu Ala Lys Pro Val Leu Cys Leu Gly Thr Leu Cys Thr Ala Phe
115 120 125
Leu Thr Gly Leu Asn Arg Val Ser Glu Tyr Arg Asn His Cys Ser Asp
130 135 140
Val Ile Ala Gly Phe Ile Leu Gly Thr Ala Val Ala Leu Phe Leu Gly
145 150 155 160
Met Cys Val Val His Asn Phe Lys Gly Thr Gln Gly Ser Pro Ser Lys
165 170 175
Pro Lys Pro Glu Asp Pro Arg Gly Val Pro Leu Met Ala Phe Pro Arg
180 185 190
Ile Glu Ser Pro Leu Glu Thr Leu Ser Ala Gln Asn His Ser Ala Ser
195 200 205
Met Thr Glu Val Thr
210
c210> 138
<211> 325
<212> PRT
<213> Homo sapiens
c400> 138
Met Ala Val Gly Asn Asn Thr Gln Arg Ser Tyr Ser Ile Ile Pro Cys
1 5 10 15
Phe Ile Phe Val Glu Leu Val Ile Met Ala Gly Thr Val Leu Leu Ala
20 25 30


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
56
Tyr Tyr Phe Glu Cys Thr Asp Thr Phe Gln Val His Ile Gln Gly Phe
35 4D 45
Phe Cys Gln Asp Gly Asp Leu Met Lys Pro Tyr Pro Gly Thr Glu Glu
50 55 60
Glu Ser Phe Ile Thr Pro Leu Val Leu Tyr Cys Val Leu Ala Ala Thr
65 70 75 80
Pro Thr Ala Ile Ile Phe Ile Gly Glu Ile Ser Met Tyr Phe Ile Lys
85 90 95
Ser Thr Arg Glu Ser Leu Ile Ala Gln Glu Lys Thr Ile Leu Thr Gly
100 105 110
Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg Ile Ile Arg Phe Thr
115 120 125
Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp Ile Phe Val Asn Ala
130 135 140
Gly Gln Val Val Thr Gly His Leu Thr Pro Tyr Phe Leu Thr Val Cys
145 150 155 160
Lys Pro Asn Tyr Thr Ser Ala Asp Cys Gln Ala His His Gln Phe Ile
165 170 ~ 175
Asn Asn Gly Asn Ile Cys Thr Gly Asp Leu Glu Val Ile Glu Lys Ala
180 185 190
Arg Arg Ser Phe Pro Ser Lys His Ala Ala Leu Ser Ile Tyr Ser Ala
195 200 205
Leu Tyr Ala Thr Met Tyr Ile Thr Ser Thr Ile Lys Thr Lys Ser Ser
210 215 220
Arg Leu Ala Lys Pro Val Leu Cys Leu Gly Thr Leu Cys Thr Ala Phe
225 230 235 240
Leu Thr Gly Leu Asn Arg Val Ser Glu Tyr Arg Asn His Cys Ser Asp
245 250 255
Val Ile Ala Gly Phe Ile Leu Gly Thr Ala Val Ala Leu Phe Leu Gly
260 265 270
Met Cys Val Val His Asn Phe Lys Gly Thr Gln Gly Ser Pro Ser Lys
275 280 285


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
87
Pro Lys Pro.Glu Asp Pro Arg Gly val Pro Leu Met Ala Phe Pro Arg
290 295 300
Ile Glu Ser Pro Leu Glu Thr Leu Ser Ala Gln Asn His Ser Ala Ser
305 310 315 320
Met Thr Glu Val Thr
325
<210> 139


<211> 406


<212> PRT


<213> Homosapiens


<400> 139


Val Phe ThrGlyAla SerArgGly IleGlyLys AlaIleAlaLeu
Ile


1 5 10 15


Lys Ala LysAspGly AlaAsnIle ValIleAla AlaLys_ThrAla
Ala


20 25 30


Gln Pro ProLysLeu LeuGlyThr IleTyrThr AlaAlaGluGlu
His


35 40 45


Ile Glu ValGlyGly LysAlaLeu ProCysIle ValAspValArg
Ala


50 55 60


Asp Glu GlnIleSer AlaAlaVal GluLysAla IleLysLysPhe
Gln


65 70 75 80


Gly Gly AspIleLeu ValAsnAsn AlaSerAla IleSerLeuThr
Ile


85 90 95


Asn Thr AspThrPro ThrLysArg LeuAspLeu MetMetAsnVal
Leu


100 105 110


Asn Thr GlyThrTyr LeuAlaSer LysAlaCys IleProTyrLeu
Arg


115 120 125


Lys Lys LysValAla HisIleLeu AsnIleSer ProProLeuAsn
Ser


130 135 140


Leu Asn ValTrpPhe LysGlnHis CysAlaTyr ThrIleAlaLys
Pro


145 150 155 160




CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
ss
Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly
165 170 175
Glu Ile Ala Val Asn Ala Leu Trp Pro Lys Thr Ala Ile His Thr Ala
1B0 185 190
Ala Met Asp Met Leu Gly Gly Pro Gly Ile Glu Ser Gln Cys Arg Lys
195 200 205
Val Asp Ile Ile Ala Asp Ala Ala Tyr Ser Ile Phe Gln Lys Pro Lys
210 215 220
Ser Phe Thr Gly Asn Phe Val Ile Asp Glu Asn Ile Leu Lys Glu Glu
225 230 235 240
Gly Ile Glu Asn Phe Asp Val Tyr Ala Ile Lys Pro Gly His Pro Leu
245 250 255
Gln Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val Ser Lys Lys
260 265 270
Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gln
275 280 285
Leu Gln Pro Lys Pro Arg Ser Gly Ala Val Glu Glu Thr Phe Arg Ile
290 295 300
Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gln Ala Ile
305 310 315 320
Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp
325 330 335
Leu Lys Ser Lys G1~ Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gln
340 345 350
Ala Asp Val Val Met Ser Met Thr Thr Asp Asp Phe Val Lys Met Phe
355 360 365
Ser Gly Lys Leu Lys Pro Thr Met Ala Phe Met Ser Gly Lys Leu Lys
370 375 380
Ile Lys Gly Asn Met Ala Leu Ala Ile Lys Leu Glu Lys Leu Met Asn
385 390 395 400
Gln Met Asn Ala Arg Leu
405


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
89
<210> 140
<211> 422 .
<212> PRT
<213> Homo sapiens
<400> 140
Ser Thr Lys Val Met Leu Pro Asn Thr Gly Arg Leu Ala Gly Cys Thr
1 5 10 15
Val Plie Ile Thr Gly Ala Ser Arg Gly Ile Gly Lys A1a Ile Ala Leu
20 25 30
Lys Ala Ala Lys Asp Gly Ala Asn Ile Val Ile Ala Ala Lys Thr Ala
35 40 45
Gln Pro His Pro Lys Leu Leu Gly Thr Ile Tyr Thr Ala Ala Glu Glu
50 55 60
Ile Glu Ala Val Gly Gly Lys Ala Leu Pro Cys Ile Val Asp Val Arg
65 70 75 80
Asp Glu Gln Gln Ile Ser Ala Ala Val Glu Lys Ala Ile Lys Lys Phe
85 90 95
Gly Gly Ile Asp Ile Leu Val Asn Asn Ala Ser Ala Ile Ser Leu Thr
lOD 105 110
Asn Thr Leu Asp Thr Pro Thr Lys Arg Leu Asp Leu Met Met Asn Val
115 120 125
Asn Thr Arg Gly Thr Tyr Leu Ala Ser Lys Ala Cys Ile Pro Tyr Leu
130 135 140
Lys Lys Ser Lys Val Ala His Ile Leu Asn Ile Ser Pro Pro Leu Asn
145 150 155 160
Leu Asn Pro Val Trp Phe Lys Gln His Cys Ala Tyr Thr Ile Ala Lys
165 170 175
Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly
180 185 190
Glu Ile Ala Val Asn Ala Leu Trp Pro Lys Thr Ala Ilé His Thr Ala
195 200 205
Ala Met Asp Met Leu Gly Gly Pro Gly Ile Glu Ser Gln Cys Arg Lys


CA 02371500 2001-10-24
WO 00/71710 ~p PCTlFR0010142G
210 215 220
Val Asp Ile Ile Ala Asp Ala Ala Tyr Ser Ile Phe Gln Lys Pro Lys
225 230 235 240
Ser Phe Thr Gly-Asn Phe Val Ile Asp Glu Asn Tle Leu Lys Glu Glu
245 250 255
Gly Ile Glu Asn Phe Asp Val Tyr Ala Ile Lys Pro Gly His Pro Leu
260 265 270
Gln Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val 5er Lys Lys
275 280 285
Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gln
290 295 300
Leu Gln Pro Lys Pro Arg Ser Gly Ala Val Glu Glu Thr Phe Arg Ile
305 310 315 320
Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gln Ala Ile
325 330 335
Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp
340 345 350
Leu Lys Ser Lys Gly Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gln
355 360 365
Ala Asp Val Val Met Ser Met Thr Thr Asp Asp Phe Val Lys Met Phe
370 375 380
Ser Gly Lys Leu Lys Pro Thr Met Ala Phe Met Ser Gly Lys Leu Lys
385 390 395 400
Ile Lys Gly Asn Met Ala Leu Ala Ile Lys Leu Glu Lys Leu Met Asn
405 410 415
Gln Met Asn Ala Arg Leu
420
<210> 141
<211> 424
<212> PRT
<213> Homo sapiens


CA 02371500 2001-10-24
WO 00/71710 ~ ~ PCTlFR0010142G
<400> 141
Thr Glu Val.Ser Val Asp Leu Pro Lys His Ala Lys Gly Gln Asp Leu
1 . 5 10 15
Phe Asp Gln Ile Val Tyr His Leu Asp Leu Val Glu Thr Asp Tyr Phe
20 - 25 30
Gly Leu Gln Phe Leu Asp Ser Ala Gln Val Ala His Trp Leu Asp His
35 40 45
Ala Lys Pro Ile Lys Lys Gln Met Lys Ile Gly Pro Ala Tyr Ala Leu
50 55 60
His Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu
65 70 75 80
Glu Phe Thr Arg Tyr Leu Phe Val Leu Gln Leu Arg His Asp Ile Leu
85 90 95
Ser Gly Lys Leu Lys Cys Pro Tyr Glu Thr Ala.Val Glu Leu Ala Ala
100 105 110
Leu Cys Leu Gln Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His Thr
115 120 125
Pro Glu Leu Val Ser Glu Phe Arg Phe Ile Pro Asn Gln Thr Glu Ala
130 135 140
Met Glu Phe Asp Ile Phe Gln Arg Trp Lys Glu Cys Arg Gly Lys Ser
145 150 155 160
Pro Ala Gln Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu
165 170 175
Met Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu
180 185 190
Tyr Ser Leu Gly Leu Thr Pro Thr Gly Ile Leu Ile Phe Glu Gly Ala
195 200 205
Asn Lys Ile Gly Leu Phe Phe Trp Pro Lys Ile Thr Lys Met Asp Phe
210 215 220
Lys Lys Ser Lys Leu Thr Leu Val Val Val Glu Asp Asp Asp Gln Gly
225 230 235 240
Arg Glu Gln Glu His Thr Phe Val Phe Arg Leu Asp Ser Ala Arg Thr
245 250 255


CA 02371500 2001-10-24
WO 00/71710 ~~ PCTlFR0010142G
Cys Lys His.Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg
260 265 270
Leu Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe Ile Arg
275 - 280 285
Leu Gly Ser Arg Phe Arg Phe Sèr Gly Arg Thr Glu Tyr Gln Ala Thr
290 295 300
His Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser
305 310 315 320
Lys Arg Tyr Pro Ser Arg Arg His Ser Thr Phe Lys Ala Ser Asn Pro
325 330 335
Val Ile Ala Ala Gln Leu Cys Ser Lys Thr Asn Pro Glu Val His Asn
340 345 350
Tyr Gln Pro Gln Tyr His Pro Asn Ile His Pro Ser Gln Pro Arg Trp
355 360 365
His Pro His Ser Pro Asn Val Arg Pro Ser Phe Gln Asp Asp Arg Ser
370 375 380
His Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val
385 390 395 400
His Asp Gln Asn Gln Lys Asn Leu Gly Gly Met Gln Ser Met Met Tyr
405 410 415
Arg Asp Lys Leu Met Thr Ala Leu
420
<210> 142
<211> 455
<212> PRT
<213> Homo sàpiens
<400> 142
Gly Pro Leu Leu Thr Gly Gly Ala Ala Val His Ile Ser Ala Ala Gly
1 5 10 15
Ala Ala Lys Ala Thr Leu Tyr Cys Arg Val Phe Leu Leu Asp Gly Thr
20 25 30


CA 02371500 2001-10-24
WO 00/71710 9~ PCTlFR0010142G
Glu Val Ser Val Asp Leu Pro Lys His Ala Lys Gly Gln Asp Leu Phe
35~ 40 45
Asp Gln Ile Val Tyr His Leu Asp Leu Val Glu Thr Asp Tyr Phe Gly
50 55 ~ 60
Leu Gln Phe Leu Asp Ser Ala Gln Val Ala His Trp Leia Asp His Ala
65 70 75 80
Lys Pro Ile Lys Lys Gln Met Lys Ile Gly Pro Ala Tyr Ala Leu His
85 90 95
Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu Glu
100 105 110
Phe Thr Arg Tyr Leu Phe Val Leu Gln Leu Arg His Asp Ile Leu Ser
115 120 125
Gly Lys Leu Lys Cys Pro Tyr Glu Thr Ala Val Glu Leu Ala Ala Leu
130 135 140
Cys Leu Gln Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His Thr Pro
145 150 155 160
Glu Leu Val Ser Glu Phe Arg Phe Ile Pro Asn Gln Thr Glu Ala Met
165 170 175
Glu Phe Asp Ile Phe Gln Arg Trp Lys Glu Cys Arg Gly Lys Ser Pro
180 185 190
Ala Gln Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu Met
195 200 205
Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu Tyr
210 215 220
Ser Leu Gly Leu Thr Pro Thr Gly Ile Leu Ile Phe Glu Gly Ala Asn
225 230 235 240
Lys Ile Gly Leu Phe Phe Trp Pro Lys Ile Thr Lys Met Asp Phe Lys
245 250 255
Lys Ser Lys Leu Thr Leu Val Val Val Glu Asp Asp Asp Gln Gly Arg
260 265 270
Glu Gln Glu His Thr Phe Val Phe Arg Leu Asp Ser Ala Arg Thr Cys
275 280 285


CA 02371500 2001-10-24
WO 00/71710 ~4 PCTlFR0010142G
Lys His Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg Leu
290 295 300
Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe Ile Arg Leu
305 310 315 320
Gly Ser Arg Phe Arg Phe Ser Gly Arg Thr Glu Tyr Gln Ala Thr His
325 330 335
Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser Lys
340 345 350
Arg Tyr Pro Ser Arg Arg His Ser Thr Phe Lys Ala Ser Asn Pro Val
355 360 365
Ile Ala Ala Gln Leu Cys Ser Lys Thr Asn Pro Glu Val His Asn Tyr
370 375 380
Gln Pro Gln Tyr His Pro Asn Ile His Pro Ser Gln Pro Arg Trp His
385 390 395 400
Pro His Ser Pro Asn Val Arg Pro Ser Phe Gln Asp Asp Arg Ser His
405 410 415
Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val His
420 425 430
Asp Gln Asn Gln Lys Asn Leu Gly Gly Met Gln Ser Met Met Tyr Arg
435 440 445
Asp Lys Leu Met Thr Ala Leu
450 455
<210> 143
<211> 232
<212> PRT
<213> Homo sapiens
<400> 143
Glu Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu
1 5 10 15
Lys Gln Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gln Thr Tyr Asn
20 25 30
Pro Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gln


CA 02371500 2001-10-24
WO 00/71710 ~5 PCTlFR0010142G
35 40 45
Ile Phe .Pro Val Leu Glu His Leu Leu Arg Ala Arg Phe Ser Glu Pro
50 55 60
His Leu Arg Asp Ala Leu Tyr Leu Lys Leu Tyr His Pro Glu Arg Leu
65 70 75 80
Gln His Tyr Ile Asn Pro Glu Pro Met Arg Ile Leu Glu Trp Val Gly
85 90 95
Val Gly Met Leu Leu Gly Pro Leu Leu Thr Trp Ile Tyr Met Arg Phe
100 105 110
Ala Ser Arg Pro Gly Phe Ser Trp Pro Val Met Leu Phe Phe Ser Leu
115 120 125
Tyr Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu
130 135 140
Leu Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gln
145 150 155 160
Cys Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr
165 170 175
Leu Thr Tyr Leu Ser Gln Val Tyr Cys His Lys Gly Phe Gly Lys Asp
180 185 190
Met Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val
195 200 205
Val Glu Pro Asn Leu Val Lys His Ile Gly Leu Phe Ser Ser Leu Arg
210 215 220
Tyr Asn Phe His Pro Ser Leu Leu
225 230
<210> 144
<211> 263
<212> PRT
<213> Homo sapiens
<400> 144
Leu Phe Leu Cys Asn Val Glu Arg Ser Val Ser His Phe Asp Ala Lys
1 5 10 15


CA 02371500 2001-10-24
WO 00/71710 96 PCTlFR0010142G
Leu Leu Ser.Lys Tyr Val Pro Val Ala Asn Arg Tyr Glu Gly Thr Glu
20 25 30
Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu Lys
35 " 40 45
Gln Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gln Thr Tyr Asn Pro
50 55 60
Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gln Ile
65 70 75 BO
Phe Pro Val Leu Glu His Leu Leu Arg Ala Arg Phe Ser Glu Pro-His
85 90 95
Leu Arg Asp Ala Leu Tyr Leu Lys Leu Tyr His Pro Glu Arg Leu Gln
100 105 110
His Tyr Ile Asn Pro Glu Pro Met Arg Ile Leu Glu Trp Val Gly Val
115 120 125
Gly Met Leu Leu Gly Pro Leu Leu Thr Trp Ile Tyr Met Arg Phe Ala
130 135 140
Ser Arg Pro Gly Phe Ser Trp Pro Val Met Leu Phe Phe Ser Leu Tyr
145 150 155 160
Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu Leu
165 170 175
Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gln Cys
180 185 190
Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr Leu
195 200 205
Thr Tyr Leu Ser Gln Val Tyr Cys His Lys Gly Phe Gly Lys Asp Met
210 215 220
Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val Val
225 230 235 240
Glu Pro Asn Leu Val Lys His Ile Gly Leu Phe Ser Ser Leu Arg Tyr
245 250 255
Asn Phe His Pro Ser Leu Leu
260


CA 02371500 2001-10-24
WO 00/71710 ~7 PCTlFR0010142G
<210>
145


<211>
68


<212> -
PRT


<213> sapiens
Homo


<400>
145


Leu Tyr Lys Ala Leu GlyVal Ser Tyr Pro
Ser Leu Gln Ser Val Ala


1 5 10 15


Pro Val Leu Thr Pro LeuGly Val Leu Ala
Cys Ala Phe Arg Asp Val


20 25 30


His Val Asp His Ser TyrLeu Ser Leu Phe
Ile Gly Val Asp Phe Leu


35 . 40 45


Cys Gln Gln Val Ile Gly Met Phe Gly Phe Lys Asn Met Ser Val Leu
50 55 60
Cys Asn Phe Met
<210> 146
<211> 720
<212> PRT
<213> Homo sapiens
<400> 146
Thr Cys His Glu His Ala Thr Cys Gln Gln Arg Glu Gly Lys Lys Ile
1 5 10 15
Cys Ile Cys Asn Tyr Gly Phe Val Gly Asn Gly Arg Thr Gln Cys Val
20 25 30
Asp Lys Asn Glu Cys Gln Phe Gly Ala Thr Leu Val Cys Gly Asn His
35 40 45
Thr Ser Cys His Asn Thr Pro Gly Gly Phe Tyr Cys Ile Cys Leu Glu
50 55 60
Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr Phe Ile Pro Asn Asp Gly
65 70 75 80
Thr Phe Cys Thr Asp Ile Asp Glu Cys Glu Val Ser Gly Leu Cys Arg


CA 02371500 2001-10-24
WO 00/71710 ~s PCTlFR0010142G
85 90 95
His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu Cys Tyr Cys
100 105 110
Met Asp Gly Tyr'Leu Pro Arg Asn Gly Pro Glu Pro Phe His Pro Thr
115 120 125
Thr Asp Ala Thr Ser Cys Thr Glu Ile Asp Cys Gly Thr Pro Pro Glu
130 135 140
Val Pro Asp Gly Tyr Ile Ile Gly Asn Tyr Thr Ser Ser Leu Gly Ser
145 150 155 160
Gln Val Arg Tyr Ala Cys Arg Glu Gly Phe Phe Ser Val Pro Glu Asp
165 170 175
Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser Pro Lys Leu
180 185 190
His Cys Gln Glu Ile Asn Cys Gly Asn Pro Pro Glu Met Arg His Ala
195 200 205
Ile Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val Ala Arg Tyr
210 215 220
Val Cys Gln Glu Gly Phe Glu Ser Pro Gly Gly Lys Ile Thr Ser Val
225 230 235 240
Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr Cys Thr Glu
245 250 255
Ile Leu Thr Lys Ile Asn Asp Val Ser Leu Phe Asn Asp Thr Cys Val
260 265 270
Arg Trp Gln Ile Asn Ser Arg Arg Ile Asn Pro Lys Ile Ser Tyr Val
275 280 285
Ile Ser Ile Lys Gly Gln Arg Leu Asp Pro Met Glu Ser Val Arg Glu
290 295 300
Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu Val Cys Leu
305 310 315 320
Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn Ile Ser Thr Ala Pro
325 330 335
Pro Arg Arg Ser Met Pro Ala Val Ile Gly Phe Gln Thr Ala Gly Ser


CA 02371500 2001-10-24
WO 00/71710 ~9 PCTlFR0010142G
340 345 350
Arg Asn Ser His Gly Arg Asn Thr His Ile Lys Glu Val Asp Leu Leu
355 360 365
Glu Asp Asp Gly Ser Phe Asn Ile Ser Ile Phe Asn Glu Thr Cys Leu
370 375 380
Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His Met Tyr Gln
385 390 395 400
Phe Thr Val Leu Gly Gln Arg Trp Tyr Leu Ala Asn Phe Ser His Ala
405 410 415
Thr Ser Phe Asn Phe Thr Thr Arg Glu Gln Val Pro Val Val Cys Leu
420 425 430
Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr Leu Leu Arg
435 440 445
Ser Pro Lys Arg His Ser Val Gln Ile Thr Ile Ala Thr Pro Pro Ala
450 455 460
Val Lys Gln Thr Ile Ser Asn Ile Ser Gly Phe Asn Glu Thr Cys Leu
465 470 475 480
Arg Trp Arg Ser Ile Lys Thr Ala Asp Met Glu Glu Met Tyr Leu Phe
485 490 495
His Ile Trp Gly Gln Arg Trp Tyr Gln Lys Glu Phe Ala Gln Glu Met
500 505 510
Thr Phe Asn Ile Ser Ser Ser Ser Arg Asp Pro Glu Val Cys Leu Asp
515 520 525
Leu Arg Pro Gly Thr Asn Tyr Asn Val Ser Leu Arg Ala Leu Ser Ser
530 535 540
Glu Leu Pro Val Val Ile Ser Leu Thr Thr Gln Ile Thr Glu Pro Pro
545 550 555 560
Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Pro Leu Pro Arg
565 570 575
Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro Ile Ser Ser Tyr
580 585 590
Gln Val Leu Val Leu Pro Leu Ala Leu Gln Ser Thr Phe Ser Cys Asp


CA 02371500 2001-10-24
WO 00/71710 ~ 00 PCTlFR0010142G
595 600 605
Ser Glu Gly Ala Ser Ser Phe Phe Ser Asn Ala Ser Asp Ala Asp Gly
610 615 620
Tyr Val Ala Ala Glu Leu Leu Ala Lys Asp Val Pro Asp Asp Ala Met
625 630 635 ~ 640
Glu Ile Pro Ile Gly Asp Arg Leu Tyr Tyr Gly Glu Tyr Tyr Asn Ala
645 650 655
Pro Leu Lys Arg Gly Ser Asp Tyr Cys Ile Ile Leu Arg Ile Thr Ser
660 665 670
Glu Trp Asn Lys Val Arg Arg His Ser Cys Ala Val Trp Ala Gln Val
675 680 685
Lys Asp Ser Ser Leu Met Leu Leu Gln Met Ala Gly Val Gly Leu Gly
690 695 700
Ser Leu Ala Val Val Ile Ile Leu Thr Phe Leu Ser Phe Ser Ala Val
705 710 715 720
<210> 147
<211> 707
<212> PRT
<213> Homo sapiens
<400> 147
Thr Cys His Glu His Ala Thr Cys Gln Gln Arg Glu Gly Lys Lys Ile
1 5 10 15
Cys Ile Cys Asn Tyr Gly Phe Val Gly Asn Gly Arg Thr Gln Cys Val
20 25 30
Asp Lys Asn Glu Cys Gln Phe Gly Ala Thr Leu Val Cys Gly Asn His
35 40 45
Thr Ser Cys His Asn Thr Pro Gly Gly Phe Tyr Cys Ile Cys Leu Glu
50 55 60
Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr Phe Ile Pro Asn Asp Gly
65 70 75 BO


CA 02371500 2001-10-24
WO 00/71710 ~ 0 ~ PCTlFR0010142G
Thr Phe Cys.Thr Asp Ile Asp Glu Cys Glu Val Ser Gly Leu Cys Arg
85 90 95
His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu Cys Tyr Cys
100 105 110
Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro Glu Pro Phe His Pro Thr
115 120 125
Thr Asp Ala Thr Ser Cys Thr Glu Ile Asp Cys Gly Thr Pro Pro Glu
130 135 140
Val Pro Asp Gly Tyr Ile Ile Gly Asn Tyr Thr Ser Ser Leu Gly Ser
145 150 155 160
Gln Val Arg Tyr Ala Cys Arg Glu Gly Phe Phe Ser Val Pro Glu Asp
165 170 175
Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser Pro Lys Leu
180 185 190
His Cys Gln Glu Ile Asn Cys Gly Asn Pro Pro Glu Met Arg His Ala
195 200 205
Ile Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val Ala Arg Tyr
210 215 220
Val Cys Gln Glu Gly Phe Glu Ser Pro Gly Gly Lys Ile Thr Ser Val
225 230 235 240
Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr Cys Thr Glu
245 250 255
Ile Leu Thr Lys Ile Asn Asp Val Ser Leu Phe Asn Asp Thr Cys Val
260 265 270
Arg Trp Gln Ile Asn Ser Arg Arg Ile Asn Pro Lys Ile Ser Tyr Val
275 280 285
Ile Ser Ile Lys Gly Gln Arg Leu Asp Pro Met Glu Ser Val Arg Glu
290 295 300
Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu Val Cys Leu
305 310 315 320
Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn Ile Ser Thr Ala Pro
325 330 335


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
102
Pro Arg Arg.Ser Met Pro Ala Val Ile Gly Phe Gln Thr Ala Glu Val
340 345 350
Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn Ile Ser Ile Phe Asn Glu
355 360 365
Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His
370 375 380
Met Tyr Gln Phe Thr Val Leu Gly Gln Arg Trp Tyr Leu Ala Asn Phe
385 390 395 400
Ser His Ala Thr Ser Phe Asn Phe Thr Thr Arg Glu Gln Val Pro Val
405 410 415
Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr
420 425 430
Leu Leu Arg Ser Pro Lys Arg His Ser Val Gln Ile Thr Ile Ala Thr
435 440 445
Pro Pro Ala Val Lys Gln Thr Ile Ser Asn Ile Ser Gly Phe Asn Glu
450 455 460
Thr Cys Leu Arg Trp Arg Ser Ile Lys Thr Ala Asp Met Glu Glu Met
465 470 475 480
Tyr Leu Phe His Ile Trp Gly Gln Arg Trp Tyr Gln Lys Glu Phe Ala
485 490 495
Gln Glu Met Thr Phe Asn Ile Ser Ser Ser Ser Arg Asp Pro Glu Val
500 505 510
Cys Leu Asp Leu Arg Pro Gly Thr Asn Tyr Asn Val Ser Leu Arg Ala
515 520 525
Leu Ser Ser Glu Leu Pro Val Val Ile Ser Leu Thr Thr Gln Ile Thr
530 535 540
Glu Pro Pro Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Pro
545 550 555 560
Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro Ile
565 570 575
Ser Ser Tyr Gln Val Leu Val Leu Pro Leu Ala Leu Gln Ser Thr Phe
580 585 590


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
103
Ser Cys Asp.Ser Glu Gly Ala Ser Ser Phe Phe Ser Asn Ala Ser Asp
595 600 605
Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu Ala Lys Asp Val Pro Asp
610 615 620
Asp Ala Met Glu Ile Pro Ile Gly Asp Arg Leu Tyr Tyr Gly Glu Tyr
625 630 635 640
Tyr Asn Ala Pro Leu Lys Arg Gly Ser Asp Tyr Cys Ile Ile Leu Arg
645 650 655
Ile Thr Ser Glu Trp Asn Lys Val Arg Arg His Ser Cys Ala Val Trp
660 665 670
Ala Gln Val Lys Asp Ser Ser Leu Met Leu Leu Gln Met Ala Gly Val
675 680 685
Gly Leu Gly Ser Leu Ala Val Val Ile Ile Leu Thr Phe Leu Ser Phe
690 695 700
Ser Ala Val
705
<210>
148


<211>
713


<212>
PRT


<213> sapiens
Homo


<400>
148


Ser Leu Val Ala Thr HisGlu His Ala Cys Gln
Asp Cys Cys Thr Gln


1 5 10 15


Arg Glu Lys Ile Cys CysAsn Tyr Gly Val Gly
Gly Lys Ile Phe Asn


20 25 30


Gly Arg Gln Val Asp AsnGlu Cys Gln Gly Ala
Thr Cys Lys Phe Thr


35 40 45


Leu Val Cys Gly Asn His Thr Ser Cys His Asn Thr Pro Gly Gly Phe
50 55 60
Tyr Cys Ile Cys Leu Glu Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr
65 70 75 80


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
104
Phe Ile Pro Asn Asp Gly Thr Phe Cys Thr Asp Ile Asp Glu Cys Glu
85 90 95
Val 5er Gly Leu Cys Arg His Gly Gly Arg Cys Val Asn Thr His Gly
100 105 110
Ser Phe Glu Cys Tyr Cys Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro
115 120 125
Glu Pro Phe His Pro Thr Thr Asp Ala Thr Ser Cys Thr Glu Ile Asp
130 135 140
Cys Gly Thr Pro Pro Glu Val Pro Asp Gly Tyr Ile Ile Gly Asn Tyr
145 150 155 160
Thr Ser Ser Leu Gly Ser Gln Val Arg Tyr Ala Cys Arg Glu Gly Phe
165 170 175
Phe Ser Val Pro Glu Asp Thr Val Ser Ser Cys Thr Gly Leu Gly Thr
180 185 190
Trp Glu Ser Pro Lys Leu His Cys Gln Glu Ile Asn Cys Gly Asn Pro
195 200 205
Pro Glu Met Arg His Ala Ile Leu Val Gly Asn His Ser Ser Arg Leu
210 215 220
Gly Gly Val Ala Arg Tyr Val Cys Gln Glu Gly Phe Glu Ser Pro Gly
225 230 235 240
Gly Lys Ile Thr Ser Val Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser
245 250 255
Thr Leu Thr Cys Thr Glu Ile Leu Thr Lys Ile Asn Asp Val Ser Leu
260 265 270
Phe Asn Asp Thr Cys Val Arg Trp Gln Ile Asn Ser Arg Arg Ile Asn
275 280 285
Pro Lys Ile Ser Tyr Val Ile Ser Ile Lys Gly Gln Arg Leu Asp Pro
290 295 300
Met Glu Ser Val Arg Glu Glu Thr Val Asn Leu Thr Thr Asp Ser Arg
305 310 315 320
Thr Pro Glu Val Cys Leu Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val
325 330 335


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
IOJ
Asn Ile Ser Thr Ala Pro Pro Arg Arg Ser Met Pro Ala Val Ile Gly
340 345 350
Phe Gln Thr Ala Glu Val Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn
355 360 365
Ile Ser Ile Phe Asn Glu Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg
370 375 380
Lys Val Gly Ser Glu His Met Tyr Gln Phe Thr Val Leu Gly Gln Arg
385 390 395 400
Trp Tyr Leu Ala Asn Phe Ser His Ala Thr Ser Phe Asn Phe Thr Thr
405 410 415
Arg Glu Gln Val Pro Val Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp
420 425 430
Tyr Thr Val Asn Val Thr Leu Leu Arg Ser Pro Lys Arg His Ser Val
435 440 445
Gln Ile Thr Ile Ala Thr Pro Pro Ala Val Lys Gln Thr Ile. Ser Asn
450 455 460
Ile Ser Gly Phe Asn Glu Thr Cys Leu Arg Trp Arg Ser Ile Lys Thr
465 470 475 480
Ala Asp Met Glu Glu Met Tyr Leu Phe His Ile Trp Gly Gln Arg Trp
485 490 495
Tyr Gln Lys Glu Phe Ala Gln Glu Met Thr Phe Asn Ile Ser Ser Ser
500 505 510
Ser Arg Asp Pro Glu Val Cys Leu Asp Leu Arg Pro Gly Thr Asn Tyr
515 520 525
Asn Val Ser Leu Arg Ala Leu Ser Ser Glu Leu Pro Val Val Ile Ser
530 535 540
Leu Thr Thr Gln Ile Thr Glu Pro Pro Leu Pro Glu Val Glu Phe Phe
545 550 555 560
Thr Val His Arg Gly Pro Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys
565 570 575
Glu Lys Asn Gly Pro Ile Ser Ser Tyr Gln Val Leu Val Leu Pro Leu
580 585 590


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
106
Ala Leu Gln Ser Thr Phe Ser Cys Asp Ser Glu Gly Ala Ser Ser Phe
595 600 605
Phe Ser Asn Ala Ser Asp Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu
610 615 Fi20
Ala Lys Asp Val Pro Asp Asp Ala Met Glu Ile Pro Ile Gly Asp Arg
625 630 635 640
Leu Tyr Tyr Gly Glu Tyr Tyr Asn Ala Pro Leu Lys Arg Gly Ser Asp
645 650 655
Tyr Cys Ile Ile Leu Arg Ile Thr Ser Glu Trp Asn Lys Val Arg Arg
660 665 670
His Ser Cys Ala Val Trp Ala Gln Val Lys Asp Ser Ser Leu Met Leu
675 680 685
Leu Gln Met Ala Gly Val Gly Leu Gly Ser Leu Ala Val Val Ile Ile
690 695 700
Leu Thr Phe Leu Ser Phe Ser Ala Val
705 710
<210> 149
<211> 170
<212> PRT
<213> Homo sapiens
<400> 149
Arg Ser Met Thr Val Gly Gly Ala Phe His Thr Thr Glu Ala Glu Ala
1 5 10 15
Ser Ser Gln Ser Leu Thr Gln Ile Tyr Ala Leu Pro Glu Ile Pro Gln
20 25 30
Asp Gln Asn Ala Ala Glu Ser Trp Glu Thr Leu Glu Ala Asp Leu Ile
35 40 45
Glu Leu Ser Gln Leu Val Thr Asp Phe Ser Leu Leu Val Asn Ser Gln
50 55 60
Gln Glu Lys Ile Asp Ser Ile Ala Asp His Va1 Asn Ser Ala Ala Val
65 70 75 80
Asn Val Glu Glu Gly Thr Lys Asn Leu Gly Lys Ala Ala Lys Tyr Lys


CA 02371500 2001-10-24
WO 00/71710 PCTlFR0010142G
107
85 90 95
Leu Ala Ala Leu Pro Val Ala Gly Ala Leu Ile Gly Gly Met Val Gly
100 105 110
Gly Pro Ile Gly Leu Leu Ala Gly Phe Lys Val Ala Gly Ile Ala Ala
115 120 125
Ala Leu Gly Gly Gly Val Leu Gly Phe Thr Gly Gly Lys Leu Ile Gln
130 _ 135 140
Arg Lys Lys Gln Lys Met Met Glu Lys Leu Thr Ser Ser Cys Pro Asp
145 150 155 160
Leu Pro Ser Gln Thr Asp Lys Lys Cys Ser
165 170
<210> 150
<211> 31B
<212> PRT
<213> Homo sapiens
<400> 150
Val Glu Lys Thr Ala Val Thr Arg Glu Val Ile Gln His Phe Phe Arg
1 5 10 15
Met Ser Glu Asp Glu Glu Lys Val Lys Leu Arg Arg Leu Glu Pro Ala
20 25 30
Ile Gln Lys Phe Ile Lys Ile Val Ile Pro Thr Asp Leu Glu Arg Leu
35 40 45
Arg Lys His Gln Ile Asn Ile Glu Lys Tyr Gln Arg Cys Arg Ile Trp
50 55 60
Asp Lys Leu His Glu Glu His Ile Asn Ala Gly Arg Thr Val Gln Gln
65 70 75 BO
Leu Arg Ser Asn Ile Arg Glu Ile Glu Lys Leu Cys Leu Lys Val Arg
85 90 95
Lys Asp Asp Leu Val Leu Leu Lys Arg Met Ile Asp Pro Val Lys Glu
100 105 110
Glu Ala Ser Ala Ala Thr Ala Glu Phe Leu Gln Leu His Leu Glu Ser
115 120 125




DEMANDES OU BREVETS VOLUMINEUX
LA PRÉSENTE PARTIE DE CETTE DEMANDE OU CE BREVETS
COMPRI~:ND PLUS D'UN TOME.
CECI EST L,E TOME 1 DE 2
NOTE: Pour les tomes additionels, veillez contacter le Bureau Canadien des
Brevets.
JUMBO APPLICATIONS / PATENTS
TRIS SECTION OF THE APPLICATION / PATENT CONTAINS MORE
THAN ONE VOLUME.
THIS IS VOLUME 1 OF 2
NOTE: For additional valumes please contact the Canadian Patent Office.

Representative Drawing

Sorry, the representative drawing for patent document number 2371500 was not found.

Administrative Status

For a clearer understanding of the status of the application/patent presented on this page, the site Disclaimer , as well as the definitions for Patent , Administrative Status , Maintenance Fee  and Payment History  should be consulted.

Administrative Status

Title Date
Forecasted Issue Date Unavailable
(86) PCT Filing Date 2000-05-25
(87) PCT Publication Date 2000-11-30
(85) National Entry 2001-10-24
Dead Application 2005-05-25

Abandonment History

Abandonment Date Reason Reinstatement Date
2004-05-25 FAILURE TO PAY APPLICATION MAINTENANCE FEE

Payment History

Fee Type Anniversary Year Due Date Amount Paid Paid Date
Application Fee $300.00 2001-10-24
Maintenance Fee - Application - New Act 2 2002-05-27 $100.00 2002-04-22
Registration of a document - section 124 $100.00 2002-05-06
Maintenance Fee - Application - New Act 3 2003-05-26 $100.00 2003-05-02
Owners on Record

Note: Records showing the ownership history in alphabetical order.

Current Owners on Record
AVENTIS PHARMA S.A.
Past Owners on Record
ARNOULD-REGUIGNE, ISABELLE
CLEPET, CHRISTIAN
DENEFLE, PATRICE
PRADES, CATHERINE
ROSIER-MONTUS, MARIE-FRANCOISE
Past Owners that do not appear in the "Owners on Record" listing will appear in other documentation within the application.
Documents

To view selected files, please enter reCAPTCHA code :



To view images, click a link in the Document Description column. To download the documents, select one or more checkboxes in the first column and then click the "Download Selected in PDF format (Zip Archive)" or the "Download Selected as Single PDF" button.

List of published and non-published patent-specific documents on the CPD .

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.


Document
Description 
Date
(yyyy-mm-dd) 
Number of pages   Size of Image (KB) 
Description 2002-05-13 231 10,290
Description 2001-10-24 261 9,949
Abstract 2001-10-24 1 80
Claims 2001-10-24 6 166
Cover Page 2002-04-16 1 38
PCT 2001-10-24 1 36
Assignment 2001-10-24 5 156
Correspondence 2002-04-15 1 37
Prosecution-Amendment 2002-05-13 92 5,629
PCT 2001-10-25 8 417
PCT 2001-10-25 8 418
Assignment 2002-05-06 2 83

Biological Sequence Listings

Choose a BSL submission then click the "Download BSL" button to download the file.

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.

Please note that files with extensions .pep and .seq that were created by CIPO as working files might be incomplete and are not to be considered official communication.

BSL Files

To view selected files, please enter reCAPTCHA code :