Language selection

Search

Patent 2348657 Summary

Third-party information liability

Some of the information on this Web page has been provided by external sources. The Government of Canada is not responsible for the accuracy, reliability or currency of the information supplied by external sources. Users wishing to rely upon this information should consult directly with the source of the information. Content provided by external sources is not subject to official languages, privacy and accessibility requirements.

Claims and Abstract availability

Any discrepancies in the text and image of the Claims and Abstract are due to differing posting times. Text of the Claims and Abstract are posted:

  • At the time the application is open to public inspection;
  • At the time of issue of the patent (grant).
(12) Patent: (11) CA 2348657
(54) English Title: CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE SPASTIQUE AUTOSOMIQUE DOMINANTE
(54) French Title: CLONING, EXPRESSION AND CHARACTERISATION OF THE SPG4 GENE RESPONSIBLE FOR THE MOST FREQUENT FORM OF AUTOSOMAL SPASTIC PARAPLEGIA
Status: Term Expired - Post Grant Beyond Limit
Bibliographic Data
(51) International Patent Classification (IPC):
  • C12N 15/12 (2006.01)
  • C07K 14/47 (2006.01)
  • C07K 16/18 (2006.01)
  • C12N 05/10 (2006.01)
  • G01N 33/50 (2006.01)
(72) Inventors :
  • WEISSENBACH, JEAN (France)
  • HAZAN, JAMILE (France)
(73) Owners :
  • CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS)
(71) Applicants :
  • CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS) (France)
(74) Agent: NORTON ROSE FULBRIGHT CANADA LLP/S.E.N.C.R.L., S.R.L.
(74) Associate agent:
(45) Issued: 2014-07-08
(86) PCT Filing Date: 2000-09-04
(87) Open to Public Inspection: 2001-03-15
Examination requested: 2005-09-02
Availability of licence: N/A
Dedicated to the Public: N/A
(25) Language of filing: French

Patent Cooperation Treaty (PCT): Yes
(86) PCT Filing Number: PCT/FR2000/002433
(87) International Publication Number: FR2000002433
(85) National Entry: 2001-05-02

(30) Application Priority Data:
Application No. Country/Territory Date
99/11097 (France) 1999-09-03

Abstracts

English Abstract

The invention concerns the identification and characterisation of the SPG4 gene coding for spastin, and some mutations thereof responsible for the most frequent form of autosomal dominant familial spastic paraplegia, the cloning and the characterisation of its cDNA and the corresponding polypeptides. The invention also concerns vectors, transformed cells and transgenic animals as well as diagnostic methods and kits, and methods for selecting a chemical or biological compound capable of directly or indirectly interacting with said polypeptide.


French Abstract


L'invention concerne l'identification et la caractérisation du gène SPG4
codant pour la spastin, et certaines de ses mutations responsables de la forme
la plus fréquente de paraplégie spastique familiale (PSF) autosomique
dominante, le clonage et la caractérisation de son ADNc ainsi que les
polypeptides correspondants. L'invention concerne également des vecteurs, des
cellules transformées et des animaux treansgéniques ainsi que des méthodes et
trousses de diagnostic, et des méthodes de sélection d'un composé chimique ou
biochimique capable d'interagir directement ou indirectement avec un
polypeptide selon l'invention.

Claims

Note: Claims are shown in the official language in which they were submitted.


45
REVENDICATIONS
1. Acide nucléique purifié ou isolé du gène SPG4 caractérisé en ce qu'il
comprend une séquence choisie parmi le groupe consistant en:
a) la séquence SEQ ID NO :1, ou la séquence SEQ ID NO :2, et
b) la séquence ADN complémentaire ou la séquence ARN transcrit à partir des
séquences telles que définies en a).
2. L'acide nucléique purifié ou isolé selon la revendication 1, caractérisé en
ce
qu'il comprend au moins une séquence d'au moins 15 nucléotides (nt)
consécutifs, du
fragment nt 714-809, extrémités incluses, de la séquence SEQ ID NO :2, de sa
séquence complémentaire ou de la séquence de son ARN correspondant.
3. L'acide nucléique purifié ou isolé selon la revendication 1 ou 2,
caractérisé
en ce qu'il comprend une mutation listée dans le tableau 5.
4. Sonde ou amorce caractérisée en ce que sa séquence est choisie parmi les
séquences SEQ ID NO :4 à SEQ ID NO :71.
5. Site accepteur ou donneur d'épissage, caractérisé en ce qu'il comprend une
séquence d'un acide nucléique selon la revendication 1 choisie parmi les
séquences
SEQ ID NO :74 à SEQ ID NO :105.
6. Polypeptide codé par un acide nucléique comprenant SEQ ID NO :1 ou
SEQ ID NO :2.
7. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend une
séquence d'acides aminés comprenant la séquence SEQ ID NO :3.
8. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend la
séquence d'au moins 8 acides aminés (aa) consécutifs de la séquence du
fragment aa
197- 228, extrémités incluses, de la séquence SEQ ID NO :3.

46
9. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend une
séquence d'acides aminés comprenant la séquence SEQ ID NO :3, laquelle
séquence
contient au moins une des mutations listée dans le tableau 5.
10. Vecteur de clonage ou d'expression contenant une séquence d'acide
nucléique selon la revendication 1.
11. Vecteur selon la revendication 10, caractérisé en ce qu'il comporte les
éléments nécessaires à son expression dans une cellule hôte.
12. Cellule hôte transformée par un vecteur selon la revendication 10 ou 11.
13. Méthode de production d'un polypeptide recombinant, caractérisée en ce
que l'on cultive une cellule transformée selon la revendication 12 dans des
conditions
permettant l'expression dudit polypeptide recombinant et que l'on récupère
ledit
polypeptide recombinant.
14. Polypeptide, caractérisé en ce qu'il est obtenu par une méthode selon la
revendication 13.
15. Méthode pour la détection d'un polypeptide selon l'une quelconque des
revendications 6 à 9 et 14, comprenant les étapes :
1) obtention d'anticorps mono- ou polyclonaux ou leurs fragments, anticorps
chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de
reconnaître spécifiquement un polypeptide comprenant tout ou partie de SEQ ID
NO :3, et
2) analyse par immunohistochimie ou immunocytochimie de l'expression
dudit polypeptide au moyen desdits anticorps.
16. Méthode de diagnostic génotypique de la paraplégie spastique familiale
transmise selon le mode autosomique dominant (PSF-AD) à partir d'un
prélèvement
biologique d'un patient, caractérisée en ce qu'elle comporte les étapes
suivantes:
a) isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique;

47
b) amplification spécifique de ladite séquence d'ADN du gène SPG4
susceptible de contenir une mutation à l'aide d'amorces selon la revendication
4; et
c) analyse des produits d'amplification obtenus et comparaison de leur
séquence avec la séquence normale correspondante du gène SPG4,
dans laquelle la présence d'au moins une mutation dans la séquence d'acide
nucléique comprenant SEQ ID NO :1 ou SEQ ID NO :2 signifie que ledit patient
souffre de PSF-AD, ladite mutation correspondant à une troncation, une
délétion, une
substitution ou une insertion de un ou plus acide(s) aminé(s) dans la protéine
de
spastine encodée.
17. Méthode de diagnostic de la paraplésie spastique familiale transmise selon
le mode autosomique dominant (PSF-AD), caractérisée en ce que l'on met en
contact
un matériel biologique avec un ou des anticorps mono- ou polyclonaux ou leurs
fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils
sont
capables de reconnaitre spécifiquement un polypeptide comprenant tout ou
partie de
SEQ ID NO :3, dans des conditions permettant la formation éventuelle de
complexes
immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps,
et en ce
que l'on détecte ou quantifie les complexes immunologiques éventuellement
formés,
dans laquelle une expression anormale d'un polypeptide codé par le gène SPG4
qui a
pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 signifie que
ledit
patient souffre de PSF-AD.
18. Méthode pour la détection d'un ou plusieurs polymorphismes dans le gène
SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 dans un
matériel
biologique humain, la méthode comprenant les étapes suivantes:
a) isolement de l'ADN dudit matériel biologique ou obtention d'un ADNc à
partir de l'ARNm dudit matériel biologique;
b) amplification dudit ADN ou ADNc pour obtenir un produit d'amplification;
c) séquençage du produit d'amplification, obtenant une séquence d'ADN du
produit d' amplification; et

48
d) comparaison de la séquence d'ADN du produit d'amplification avec la
séquence d'ADN du gène SPG4 sauvage,
caractérisée en ce que si la séquence d'ADN du produit d'amplification est
différente de la séquence d'ADN du gène SPG4 sauvage, il y a présence d'un ou
de
plusieurs polymorphismes dans le gène SPG4 dans le matériel biologique humain.
19. La méthode selon la revendication 18, caractérisée en ce que le matériel
biologique est un matériel biologique humain anténatal.
20. La méthode selon l'une quelconque des revendications 18 à 19,
caractérisée en ce que le matériel biologique comprend des lymphoblastes.
21. La méthode selon l'une quelconque des revendications 18 à 20,
caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide
d'une
méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de
brin, la technique TAS (Transcription-based Amplification System), la
technique 35R
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid
Sequence
Based Amplification), la technique TMA (Transcription Mediated Amplification),
la
technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain
Reaction) et la technique CPR (Cycling Probe Reaction).
22. La méthode selon la revendication 18, caractérisée en ce que
l'amplification de l'ADN du matériel biologique est effectuée avec au moins
une
amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
23. Méthode pour la détection d'un ou plusieurs polymorphismes dans le gène
SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 dans un
matériel
biologique humain, la méthode comprenant les étapes suivantes:
a) isolement de l'ADN dudit matériel biologique, ou obtention d'un ADNc à
partir de l'ARNm dudit matériel biologique,
b) amplification dudit ADN ou ADNc pour obtenir un produit d'amplification;

49
c) hybridation du produit d'amplification avec une amorce qui hybride
spécifiquement avec l'ADN du gène SPG4 sauvage, produisant un produit
d'hybridation; et
d) détection d'un ou plusieurs mésappariements dans le produit d'hybridation,
caractérisée en ce que la présence d'un ou de plusieurs mésappariements dans
le produit d'hybridation est indicatif de la présence d'un ou plusieurs
polymorphismes
dans le gène SPG4 dans le matériel biologique humain.
24. La méthode selon la revendication 23, caractérisée en ce que le matériel
biologique est un matériel biologique humain anténatal.
25. La méthode selon l'une quelconque des revendications 23 à 24,
caractérisée en ce que le matériel biologique comprend des lymphoblastes.
26. La méthode selon l'une quelconque des revendications 23 à 25,
caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide
d'une
méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de
brin, la technique TAS (Transcription-based Amplification System), la
technique 3SR
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid
Sequence
Based Amplification), la technique TMA (Transcription Mediated Amplification),
la
technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain
Reaction) et la technique CPR (Cycling Probe Reaction).
27. La méthode selon la revendication 25, caractérisée en ce que
l' amplification de l'ADN du matériel biologique est effectuée avec au moins
une
amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
28. Méthode de diagnostic de la présence ou l'absence de la paraplégie
spastique familiale autosomique dominante chez un patient, la paraplégie
spastique
familiale autosomique dominante étant associée à la présence d'une mutation
dans le
gène SPG4 a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence
d'ADN complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2, la méthode

50
comprenant l'étape de détection de la présence ou l'absence d'une ou de
plusieurs
mutations dans le gène SPG4 dans un matériel biologique du patient, la
présence
d'une mutation est indicative que le patient est atteint de la paraplégie
spastique
familiale autosomique dominante, ladite mutation correspondant à une
troncation, une
délétion, une substitution ou une insertion de un ou plus acide(s) aminé(s)
dans la
protéine de spastine encodée.
29. La méthode selon la revendication 28, caractérisée en ce que l'étape de
détection de la présence ou l'absence d'une ou de plusieurs mutations dans le
gène
SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 comprend les
étapes suivantes :
a) isolement de l'ADN à partir dudit matériel biologique, ou obtention d'un
ADNc à partir d'un ARNm à partir de l'ARNm dudit matériel biologique,
b) amplification spécifique dudit ADN ou ADNc pour obtenir un produit
d' amplification;
c) séquençage du produit d'amplification, obtenant une séquence d'ADN du
produit d'amplification; et
d) comparaison de la séquence d'ADN du produit d'amplification avec la
séquence d'ADN du gène SPG4 sauvage,
caractérisée en ce que si la séquence d'ADN du produit d'amplification est
différente de la séquence d'ADN du gène SPG4 sauvage, il y a présence d'une ou
de
plusieurs mutations dans le gène SPG4 dans le matériel biologique du patient.
30. La méthode selon l'une quelconque des revendications 28 à 29,
caractérisée en ce que le matériel biologique est un matériel biologique
humain
anténatal.
31. La méthode selon l'une quelconque des revendications 28 à 30,
caractérisée en ce que le matériel biologique comprend des lymphoblastes.
32. La méthode selon l'une quelconque des revendications 28 à 31,
caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide
d'une

51
méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de
brin, la technique TAS (Transcription-based Amplification System), la
technique 3SR
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid
Sequence
Based Amplification), la technique TMA (Transcription Mediated Amplification),
la
technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain
Reaction) et la technique CPR (Cycling Probe Reaction).
33. La méthode selon la revendication 28, caractérisée en ce que
l'amplification de l'ADN du matériel biologique est effectuée avec au moins
une
amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
34. La méthode selon la revendication 28, caractérisée en ce que l'étape de
détection de la présence ou l'absence d'une ou de plusieurs mutations dans le
gène
SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 comprend les
étapes suivantes :
a) amplification de l'ADN du matériel biologique pour obtenir un produit
d' amplification;
b) hybridation du produit d'amplification avec une amorce qui hybride
spécifiquement avec l'ADN du gène SPG4 sauvage, produisant un produit
d'hybridation; et
c) détection d'un ou plusieurs mésappariements dans le produit d'hybridation,
caractérisée en ce que la présence d'un ou de plusieurs mésappariements dans
le produit d'hybridation est indicatif de la présence d'une ou plusieurs
mutations dans
le gène SPG4 dans le matériel biologique du patient.
35. La méthode de détection selon la revendication 15, comprenant en outre
l'étape de purifier ledit polypeptide desdits anticorps.
36. La méthode de diagnostic selon l'une quelconque des revendications 16 et
28, dans laquelle ladite mutation est choisie parmi :

52
Famille Localisation Mutation
624 exon 7 1210 C.fwdarw.G;
6958 exon 8 1233 G.fwdarw.A;
214 exon 8 1267 T.fwdarw.G;
1002 exon 8 1283 T.fwdarw.G;
027 exon 8 1288 A.fwdarw.G;
019 exon 10 1401 C.fwdarw.G;
4014 exon 11 1468 G.fwdarw.A;
148 exon 11 1504 G.fwdarw.T;
618 exon 13 1620 C.fwdarw.T;
636 exon 15 1788 G.fwdarw.A;
627 exon 15 1792 C.fwdarw.T;
2971 exon 3 702 C.fwdarw.T;
3655 exon 5 873 A.fwdarw.T;
1010 exon 5 907 C.fwdarw.A;
3938 exon 5 932 C.fwdarw.G;
6922 exon 10 1416 C.fwdarw.T;
616 exon 10 1416 C.fwdarw.T;
605 exon 15 1809 C.fwdarw.T;
030 exon 2 578-579insA;
615 exon 5 852del11;
042 exon 5 882-883insA;
032 exon 5 906delT;
189 exon 9 1299delG;
3686 exon 9 1340del5;
625 exon 9 1340del5;
A exon 11 1520delT;
115 exon 12 1574deIGG;
3266 exon 13 1634del22;
149 exon 14 1684-1685insTT;
645 exon 14 1685del4;
029 intron 4 808-2 a.fwdarw.g;
162 intron 6 1129+2 t.fwdarw.g;

53
125 intron 7 1223+1 g.fwdarw.t;
143 intron 8 1299+1 g.fwdarw.a;
1620 intron 11 1538+5 g.fwdarw.a;
1006 intron 11 1538+3 del4;
1605 intron 13 1661+1 g.fwdarw.t;
1012 intron 13 1662-2 a.fwdarw.t;
1626 intron 15 1812+1 g.fwdarw.a;
2992 intron 15 1813-2 a.fwdarw.g;
5226 intron 15 1813-2 a.fwdarw.g;
5330 intron 15 1813-2a.fwdarw.g; et
1611 intron 16 1853+1 g.fwdarw.a,
les positions en nucléotide étant en référence à la séquence de l'ADNc SPG4
qui a
pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2.

Description

Note: Descriptions are shown in the official language in which they were submitted.


CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
1
CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4
RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4
codant
pour la spastin, responsable de la forme la plus fréquente de paraplégie
spastique
familiale (PSF) autosomique dominante, le clonage et la caractérisation de son
ADNc
ainsi que les polypeptides correspondants. L'invention concerne également des
vecteurs, des cellules transformées et des animaux transgéniques ainsi que des
méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé
chimique ou biochimique capable d'interagir directement ou indirectement avec
un
polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives
du système nerveux central caractérisées par une spasticité bilatérale et
progressive
des membres inférieurs. Elles se manifestent cliniquement par des difficultés
de la
marche pouvant évoluer en une paralysie totale des deux jambes. La
physiopathologie
de cet ensemble de "maladies est à ce jour peu documentée ; toutefois, les
données
anatomopathologiques permettent de conclure que l'atteinte est limitée aux
faisceaux
pyramidaux responsables de la motricité volontaire dans la moelle épinière
(Reid,
1997). Il existe différentes formes cliniques et génétiques de PSF. On
distingue
cliniquement les PSF dites pures correspondant à une spasticité isolée des
membres inférieurs, des PSF complexes pour lesquelles la spasticité des
jambes
est associée à d'autres manifestations cliniques de type neurologique ou non
(Bruyn et
al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon
le
mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au
chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent
transmise
selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des
PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison
des rares
études épidémiologiques et de l'importante variabilité clinique varie de 0,9:
100 000 au
Danemark, 3 à 9,6: 100 000 dans certaines régions d'Espagne (Polo et al.,1991)
ou
14: 100 000 en Norvège (Skre, 1974) (environ 3: 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement
entre les différentes familles mais aussi entre différents membres atteints
d'une même
famille, les PSF se caractérisent également par une importante hétérogénéité
génétique. Dans le cas des PSF-AD, quatre loci ont été identifiés à ce jour
sur les

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
2
chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et
al.,
1994 ; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) et 8 (locus
SPG8)
(Hedera et al., 1999). L'étude d'un grand nombre de familles présentant une
PSF-AD a
montré que le gène porté par le chromosome 2 est un locus majoritaire de cette
forme
de la maladie, retrouvé dans 40 à 50 h des familles analysées (The Hereditary
Spastic
Paraplegia Working Group, 1996 ; Durr et al., 1996). Un phénomène
d'anticipation a
été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a
par
la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence
dans 6
familles danoises (Nielsen et al., 1997) par la technique de RED (pour Rapid
Expansion Detection). Cette expansion n'a cependant jamais pu être confirmée
dans
aucune des familles testées par cette même méthode ni par la recherche
systématique
de séquences de type (CAG)n dans les cartes physiques composées de clones YAC
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial
Chromosome)
(Hazan et al., Genomics, 60 (3), 309-19, 1999).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme
de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une
molécule
d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion
Molecule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF
(Jouet et al., 1994) dans laquelle la spasticité est associée à un retard
mental, alors
que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21
(locus
SPG2), codant pour une molécule constitutive de la couche de myéline, sont à
l'origine
de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus
récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui
code
pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA
(pour
ATPases Associated with diverse cellular Activities ) (Confalonieri et al.,
1995) ont
été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).
Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le
gène
responsable de la forme la plus fréquente de PSF-AD. L'identification de ce
gène
devrait en particulier permettre, outre la possibilité d'un test de dépistage
anténatal
chez les familles concernées, de mieux comprendre certains des mécanismes
moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux
de la
moelle épinière, voire d'apporter des éléments de réponse quant à un
traitement
thérapeutique des malades.
Ceci est justement l'objet de la présente invention.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
3
Après avoir délimité l'intervalle de localisation entre les marqueurs
génétiques
D2S352 et D2S2347 par l'étude des évènements de recombinaison dans les
familles
de PSF liées au locus SPG4, les inventeurs ont établi un contig de E3ACs
recouvrant
une distance physique évaluée à environ 1,5 Mb et entrepris une stratégie de
clonage
positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de
façon
exhaustive tous les gènes localisés dans la région candidate. L'analyse de la
séquence
des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène
composé
de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une
homologie avec les gènes codant pour des protéines de la famille des AAA. La
comparaison de la séquence de ce gène entre les individus sains et atteints
des
familles de PSF-AD a permis de mettre en évidence différentes mutations chez
les
patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène
SPG4
(ou SPAST) codant pour un nouveau membre nucléaire de la famille des AAA,
responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique
purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15
nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou
200
nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant :
- la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de
séquence
SEQ ID No. 1;
- leur séquence complémentaire ; et
- la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN
qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les
ADNs
double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide,
oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes
qui
seront employés indifféremment dans la présente description, on entendra
désigner
aussi bien un ADN double brin, un ADN simple brin que des produits de
transcription
desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou
de
synthèse, comportant ou non des nucléotides non naturels, désignant un
enchaînement précis de nucléotides, modifiés ou non, permettant de définir un
fragment ou une région d'un acide nucléique. On entend par fragment d'ADN
et/ou

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
4
d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non
naturels,
un enchaînement précis de nucléotides, modifiés ou non, permettant de définir
un
fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences
nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-
à-
dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou
purifiées, c'est-à-
dire qu'elles ont été prélevées directement ou indirectement, par exemple par
copie,
leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences
nucléiques présentant, par rapport à la séquence nucléique de référence
certaines
modifications comme en particulier une délétion, une troncation, un
allongement, une
fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la
séquence
nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après
alignement avec la séquence nucléique de référence.
Par pourcentage d'identité entre deux séquences d'acide nucléique ou
d'acides aminés au sens de la présente invention, on entend désigner un
pourcentage
de nucléotides ou de résidus d'acides aminés identiques entre les deux
séquences à
comparer, obtenu après le meilleur alignement, ce pourcentage étant purement
statistique et les différences entre les deux séquences étant réparties au
hasard et sur
toute leur longueur. Les comparaisons de séquences entre deux séquences
d'acide
nucléique ou d'acides aminés sont traditionnellement réalisées en comparant
ces
séquences après les avoir alignées de manière optimale, ladite comparaison
étant
réalisée par segment ou par fenêtre de comparaison pour identifier et
comparer les
régions locales de similarité de séquence. L'alignement optimal des séquences
pour la
comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme
d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au
moyen de
l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol.
48:443],
au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988)
[Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques
utilisant ces
algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software
Package, Genetics Computer Group, 575 Science Dr., Madison, WI, ou encore par
les
logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides
aminés est déterminé en comparant ces deux séquences alignées de manière
optimale par fenêtre de comparaison dans laquelle la région de la séquence
d'acide

CA 02348657 2010-04-14
nucléique ou d'acides aminés à comparer peut comprendre des additions ou des
délétions par rapport à la séquence de référence pour un alignement optimal
entre ces
deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre
de
positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé
est
5 identique entre les deux séquences, en divisant ce nombre de positions
identiques par
le nombre total de positions dans la fenêtre de comparaison et en multipliant
le résultat
obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux
séquences.
Par exemple, on pourra utiliser le programme BLAST, BLAST 2 sequences
(Tatusova et al., "Blast 2 sequences - a new tool for comparing protein and
nudeotide
sequences", FEMS Microbiol. Lett. 174:247-250)
les paramètres utilisés étant ceux donnés par
défaut (en particulier pour les paramètres open gap penaltie : 5, et
extension gap
penaltie : 2 ; la matrice choisie étant par exemple la matrice BLOSUM 62
proposée par le programme), le pourcentage d'identité entre les deux séquences
à
comparer étant calculé directement par le programme.
H s'agit de préférence de séquences dont les séquences complémentaires sont
susceptibles de s'hybrider spécifiquement avec une des séquences de
l'invention. De
préférence, les conditions d'hybridation spécifiques ou de forte stringence
seront telles
qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après
alignement entre l'une des deux séquences et la séquence complémentaire de
l'autre.
Une hybridation dans des conditions de forte stringence signifie que les
conditions de température et de force ionique sont choisies de telle manière
qu'elles
permettent le maintien de l'hybridation entre deux fragments d'ADN
complémentaires.
A titre illustra , des conditions de forte stringence de l'étape d'hybridation
aux fins de
définir les fragments polynucléotidiques décrits ci-dessus, sont
avantageusement les
suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1)
préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5)
contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCI + 0,015 M
citrate
de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x
Denhardfs, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2)
hybridation proprement dite pendant 20 heures à une température dépendant de
la
taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides)
suivie de 2
lavages de 20 minutes à 20 C en 2 x SSC +2 % SDS, 1 lavage de 20 minutes à 20
C
en 0,1 x SSC + 0,1 % SOS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 %
SDS

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
6
pendant 30 minutes à 60 C pour une sonde de taille> 100 nucléotides. Les
conditions
d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de
taille
définie, seront adaptées par l'homme du métier pour des oligonucléotides de
taille plus
grande ou plus petite, selon l'enseignement de Sambrook et al., 1989.
Par séquence nucléique variante ou acide nucléique varianb> d'une
séquence nucléique de référence, on entendra désigner l'ensemble des séquences
nucléiques correspondant à des variants alléliques, c'est-à-dire des
variations
individuelles de la séquence nucléique de référence. Ces séquences mutées
naturelles
correspondent à des polymorphismes présents chez les mammifères, en
particulier
chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la
survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles
concernent également les séquences mutées dans la mesure où elles comportent
au
moins une mutation ponctuelle et de préférence au plus 10 % de mutations par
rapport
à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute
séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50,
100 ou
200 nucléotides consécutifs, d'une séquence polymorphique de la séquence
génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence
d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une
mutation correspondant notamment à une troncation, délétion, substitution
et/ou
addition de résidu d'acide aminé. Dans le cas présent, les séquences
nucléiques
variantes présentant au moins une mutation seront ici liées aux pathologies de
type
PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques
mutées dans lesquelles les mutations conduisent à une modification de la
séquence
d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN
ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique
génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du
gène =
SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie
parmi
le groupe comprenant :
a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No.
72,
la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25,

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
7
30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs de la séquence SEQ
ID
No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No.
1,
SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et
c) la séquence complémentaire ou la séquence de l'ARN correspondant aux
séquences telles que définies en a) et b),
de préférence à l'exception de l'acide nucléique identifié dans la banque de
données
GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données
GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un
des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le
Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-
205,
1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon
l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins
15
nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides
consécutifs du
fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa
séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon
la
présente invention, caractérisé en ce qu'il comprend une séquence choisie
parmi le
groupe suivant :
- la séquence SEQ ID No. 1;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine
;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72
représentant la séquence de l'ADNc incomplet codant pour la spastin murine
représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence
complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1,
SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
- leur séquence complémentaire ; et
- la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon
l'invention, caractérisé en ce qu'il comprend au moins une mutation
correspondant à
un polymorphisme naturel chez l'Homme, notamment dont la position et la nature
sont
identifiées dans le tableau 5.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
8
Les amorces ou sondes, caractérisées en ce qu'elles comprennent une
séquence d'un acide nucléique selon l'invention, font également partie de
l'invention.
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être
déduites des séquences nucléotidiques de l'invention et qui peuvent permettre
de
mettre en évidence lesdites séquences nucléotidiques de l'invention, en
particulier les
séquences mutées, en utilisant notamment une méthode d'amplification telle que
la
méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent
être déduites des séquences nucléotidiques de l'invention, notamment des
séquences
capables de s'hybrider avec elles, et qui peuvent permettre de mettre en
évidence
lesdites séquences nucléotidiques, en particulier de discriminer les séquences
normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de
séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique
selon l'invention comme sonde ou amorce, pour la détection, l'identification,
le dosage
ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou
comme amorce dans des procédés de détection, d'identification, de dosage ou
d'amplification de séquence nucléique, présenteront une taille minimale de 15
bases,
de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées
directement ou indirectement par un composé radioactif ou non radioactif par
des
méthodes bien connues de l'homme du métier, afin d'obtenir un signal
détectable et/ou
quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être
utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences
utilisables pour de nombreuses applications. Le marquage des amorces ou des
sondes
selon l'invention est réalisé par des éléments radioactifs ou par des
molécules non
radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S,
le 3H ou
le 1251. Les entités non radioactives sont sélectionnées parmi les ligands
tels la biotine,
l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les
agents

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
9
luminescents tels que les agents radioluminescents, chémiluminescents,
bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce
et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR
(réaction en chaîne à la polymérase) (Erlich, 1989; Innis et al., 1990, et
Rolfs et al.,
1991). Cette technique nécessite le choix de paires d'amorces
oligonucléotidiques
encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer
à la
technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments
amplifiés
peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose
ou de
polyacrylamide, ou après une technique chromatographique comme la filtration
sur gel
ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de
l'amplification peut être contrôlée en utilisant comme amorce les séquences
nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides
contenant ces séquences ou encore les produits d'amplification dérivés. Les
fragments
nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des
réactions
d'hybridation afin de mettre en évidence la présence, dans un échantillon
biologique,
d'un acide nucléique cible de séquence complémentaire à celle desdits
fragments
nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus
par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être
avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de
couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like
on
entendra désigner toutes les méthodes mettant en oeuvre des reproductions
directes
ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les
systèmes de marquage ont été amplifiés, ces techniques sont bien entendu
connues,
en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque
l'échantillon d'origine est un ARN il convient préalablement d'effectuer une
transcription
reverse. Il existe actuellement de très nombreux procédés permettant cette
amplification, comme par exemple la technique SDA (Strand Displacement
Amplification) ou technique d'amplification à déplacement de brin (Walker et
al., 1992),
la technique TAS (Transcription-based Amplification System) décrite par Kwoh
et al. en
1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par
Guatelli et
ai en 1990, la technique NASI3A (Nudeic Acid Sequence Based Amplification)
décrite
par Kievitis et al. en 1991, la technique TMA (Transcription Mediated
Amplification), la

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et
perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable,
la
technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la
technique
CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera
avantageusement, préalablement à la mise en oeuvre d'une réaction
d'amplification à
La technique d'hybridation de sondes peut être réalisée de manières diverses
(Matthews et al., 1988). La méthode la plus générale consiste à immobiliser
l'acide
nucléique extrait des cellules de différents tissus ou de cellules en culture
sur un
support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber,
dans des
conditions bien définies, l'acide nucléique cible immobilisé avec la sonde.
Après
Selon un autre mode de mise en oeuvre des sondes nucléiques selon
l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans
ce cas,
Les séquences selon la présente invention de site accepteur ou donneur
Sous un autre aspect, l'invention comprend une méthode pour le criblage de
banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique
isolé codant pour la spastin, caractérisée en ce qu'elle met en oeuvre une
séquence

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
11
Parmi ces méthodes, on peut citer notamment :
- le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et
al.,
1989; Suggs et al., 1981 ; Woo et al., 1979), à l'aide des séquences
nucléiques
selon l'invention ;
- le criblage de banques génomiques, par exemple de BACs (Chumakov et al.,
1992;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif
et
al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et
la
localisation chromosomique, puis le séquençage complet du gène SPG4 codant
pour
la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre
pour l'identification et ainsi l'obtention de la séquence génomique ou de
l'ADNc du
gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une
étape d'hybridation d'un acide nucléique selon l'invention avec un acide
nucléique
contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide
nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de
séquence
SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique
selon
l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent
aisément d'identifier à partir des séquences nucléiques génomiques selon
l'invention
les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de
l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les
séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices (
silencers ) qui
contrôlent en GIS l'expression des gènes selon l'invention ; parmi ces
séquences
régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations
portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en oeuvre
une
séquence nucléique selon l'invention, notamment de mutations responsables de
la
paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les
étapes suivantes : (i) isolement de l'ADN à partir da l'échantillon biologique
à analyser,
ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii)
amplification
spécifique de l'ADN cible susceptible de présenter une mutation à l'aide
d'amorces

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
12
selon l'invention ; (iii) analyse des produits d'amplification, notamment la
taille et/ou la
séquence des produits d'amplification, par rapport à une séquence de
référence.
Par méthodes d'identification de mutation selon l'invention, on entend
également désigner une méthode permettant d'obtenir l'acide nucléique sur
lequel a
été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou
régulatrices du gène SPG4 selon l'invention présentant des mutations
susceptibles de
modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être
obtenus
par une des méthodes précédentes selon l'invention, ou les acides nucléiques
capables de s'hybrider dans des conditions de forte stringence (homologie d'au
moins
80 % entre une des deux séquences et la séquence complémentaire de l'autre)
avec
lesdits acides nucléiques, font partie de l'invention, notamment les acides
nucléiques
variants ou homologues, en particulier les séquences nucléiques de variants
alléliques
du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID
No. 2, ainsi que les séquences génomiques des gènes homologues d'autres
mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de
souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde
ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu
partie
de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé
codé
par un acide nucléique selon l'invention, de préférence à l'exception du
peptide de 584
acides aminés dont la séquence est identifiée dans la banque de données
GenBank
sous le numéro d'accession AB029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner
également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon
l'invention,
caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le
groupe suivant :
- la séquence SEQ ID No. 3, correspondant à la spastin humaine codée par la
séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ;

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
13
- la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine
codée
par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la
séquence SEQ ID No. 73 est représentée à la figure 4A, ligne "SPAST_MOUSE" ;
- la séquence SEQ ID No. 107, correspondant à la spastin mutine codée par la
séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de
séquence
SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et
- les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides
aminés
consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide selon
l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés
choisie
parmi le groupe comprenant :
a) la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, la séquence SEQ ID No.
107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces
séquences ; et
b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID
No.
73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon
l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de
préférence
d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du
fragment aa
197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon
l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés
choisie
parmi le groupe suivant :
- la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID
No.
107, lesquelles séquences portant au moins une des mutations correspondant à
un
polymorphisme naturel chez l'Homme, notamment celles dont la nature et la
localisation sont identifiées au tableau 5 ci-après ou celles qui pourront
être
identifiées par les méthodes d'identification de mutation du gène SPG4 selon
la
présente invention ; et
- les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides
aminés
consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous
forme
naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En
effet,
l'invention concerne les peptides obtenus par purification à partir de sources
naturelles,

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
14
ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique
et
pouvant alors comporter des amino-acides non naturels. La production d'un
polypeptide recombinant, qui peut être réalisée en utilisant l'une des
séquences
nudéotidiques selon l'invention est particulièrement avantageuse car elle
permet
d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant
certaines modifications par rapport au polypeptide de référence, comme en
particulier
une ou plusieurs délétions, troncations, un allongement, une fusion
chimérique, et/ou
une ou plusieurs substitutions, et dont la séquence d'acides aminés présente
au moins
80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence
d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner
l'ensemble des polypeptides codés par les séquences nucléiques variantes
telles que
précedemment définies.
En particulier, les polypeptides variants comprendront tout polypeptide codé
par
la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la
séquence d'acides aminés présente au moins une mutation correspondant
notamment
à une troncation, délétion, substitution et/ou addition de résidus d'acides
aminés par
rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides
variants
présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide
résultant de mutation d'un site d'épissage dans la séquence nucléique
génomique
SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression
contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les
éléments permettant l'expression et/ou la sécrétion desdites séquences dans
une
cellule hôte, ou encore une séquence d'adressage cellulaire, font également
partie de
l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur
et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux
d'initiation et de terminaison de la traduction, ainsi que des régions
appropriées de
régulation de la transcription. Ils doivent pouvoir être maintenus de façon
stable dans la

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
cellule et peuvent éventuellement posséder des signaux particuliers spécifiant
la
sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte
cellulaire
utilisé. A cet effet, les séquences d'acide nucléique selon l'invention
peuvent être
5 insérées dans des vecteurs à réplication autonome au sein de l'hôte
choisi, ou des
vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en
fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les
vecteurs
viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des
10 rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques
(Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces
systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de
la cellule hôte, on pourra utiliser par exemple des systèmes de type
plasmidique ou
viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou
les AAV
15 (Carter, 1993).
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que
l'ADN
nu ou l'ARN nu selon la technique développée par la société VICAL, les
chromosomes
artificiels de levure (YAC, yeast artificiel chromosome) pour l'expression
dans la levure,
les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour
l'expression dans les cellules murines et de manière préférée les chromosomes
artificiels d'homme (HAC, human artificiel chromosome) pour l'expression dans
les
cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par
l'homme du métier, et les clones en résultant peuvent être introduits dans un
hôte
approprié par des méthodes standard, telles que par exemple la lipofection,
l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules
eucaryotes et procaryotes, transformées par les vecteurs selon l'invention
ainsi que les
animaux transgéniques, excepté l'Homme, comprenant une desdites cellules
transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les
cellules
bactériennes (Olins et Lee, 1993), mais également les cellules de levure
(Buckholz,
1993), de même que les cellules animales, en particulier les cultures de
cellules de
mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de
hamster
chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut
utiliser

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
16
des procédés mettant en oeuvre des baculovirus par exemple (Luckow, 1993). Un
hôte
cellulaire préféré pour l'expression des protéines de l'invention est
constitué par les
cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les
souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux
comprenant une cellule transformée caractérisée en ce que la séquence de l'un
au
moins des deux allèles du gène SPG4 contient une au moins des mutations
correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont
la
nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui
pourront être
identifiées par les méthodes d'identification de mutation du gène SPG4 selon
la
présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux
tels que les souris, les rats ou les lapins, caractérisés en ce que le gène
codant pour la
=
spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve
notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux
séquences
alléliques du gène SPG4, une au moins des mutations dont la position et la
nature
sont identifiées au tableau 5 ou identifiées par une méthode selon la présente
invention. Ces animaux transgéniques sont obtenus par exemple par
recombinaison
homologue sur cellules souches embryonnaires, transfert de ces cellules
souches à
des embryons, sélection des chimères affectées au niveau des lignées
reproductrices, et croissance desdites chimères ;
- les animaux (de préférence souris) transgéniques surexprimant le gène SPG4
dans
lequel pourra être introduite une desdites mutations selon l'invention. Les
souris sont
obtenues par exemple par transfection de copie de ce gène sous contrôle d'un
promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après
transcription virale ;
- les animaux (de préférence souris) transgéniques rendus déficients pour le
gène
SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE
recombinase
(Rohlmann et al., 1996) ou de tout autre système d'inactivation de
l'expression de ce
gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode
de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et
peuvent

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
17
également servir à titre de modèle d'analyse et pour le criblage de banque
d'ADN
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment
peuvent être ainsi utilisées à titre de modèles afin d'étudier les
interactions entre les
polypeptides selon l'invention, et les composés chimiques ou protéiques,
impliqués
directement ou indirectement dans les activités des polypeptides selon
l'invention, ceci
afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la Sélection de produits interagissant
avec
les polypeptides selon l'invention, notamment la spastin humaine de séquence
SEQ ID
No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou
d'inhibiteur, notamment
compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité
des
polypeptides selon l'invention. De préférence, on utilisera lesdites cellules
transformées ou animaux transgéniques à titre de modèle permettant, notamment,
la
sélection de produits permettant de lutter contre la pathologie liée au gène
SPG4
mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de
polypeptide selon l'invention pour le criblage de composé chimique ou
biochimique
pouvant interagir directement ou indirectement avec les polypeptides selon
l'invention,
et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique
selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme
recombinante est elle-même comprise dans la présente invention, et se
caractérise en
ce que l'on cultive les cellules transformées, notamment les cellules ou
mammifères de
la présente invention, dans des conditions permettant l'expression d'un
polypeptide
recombinant codé par une séquence d'acide nucléique selon l'invention, et que
l'on
récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles
d'être obtenus par ladite méthode de production, font également partie de
l'invention.
Les polypeptides recombinants obtenus comme indiqué ci-dessus, peuvent
aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent
présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide
nucléique définies ci-dessus, selon les techniques de production de
polypeptides
recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
18
nucléique utilisée est placée sous le contrôle de signaux permettant son
expression
dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de
disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes
d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus,
puis la
mise en culture desdites cellules dans des conditions permettant la
réplication et/ou
l'expression de la séquence nuc.léotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus
de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de
lysats et
extraits cellulaires, du surnageant du milieu de culture, par des méthodes
utilisées
individuellement ou en combinaison, telles que le fractionnement, les méthodes
de
chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps
monoclonaux ou
polyclonaux spécifiques, etc..
Les polypeptides selon la présente invention peuvent être obtenus par synthèse
chimique et ce en utilisant l'une des nombreuses synthèses peptidiques
connues, par
exemple les techniques mettant en oeuvre des phases solides ou des techniques
utilisant des phases solides partielles, par condensation de fragments ou par
une
synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du
métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des
acides aminés non naturels correspondants sont également compris dans
l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques
ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître
spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum
d'un animal immunisé contre les polypeptides selon l'invention, notamment
produit par
recombinaison génétique ou par synthèse peptidique, selon les modes
opératoires
usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique
certains polypeptides, variants, ou leurs fragments immunogènes, selon
l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode
classique de culture d'hybridomes décrite par Kôhler et Milstein, 1975.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
19
Les anticorps selon l'invention sont, par exemple, des anticorps chimériques,
des anticorps humanisés, des fragments Fab ou F(abl2 Ils peuvent également se
présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir
un
signal détectable et/ou quantifiable.
L'invention concerne également des méthodes pour la détection et/ou la
purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles
mettent en
oeuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce
qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides,
les
anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent
également
être utilisés pour la détection de ces polypeptides dans un échantillon
biologique.
Ils constituent ainsi un moyen d'analyse immunocytochimique ou immuno-
histochimique de l'expression des polypeptides selon l'invention, notamment le
polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes
de
tissus spécifiques, par exemple par immunofluorescence, marquage à l'or,
immuno-
conjugués enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression
anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce
qui les
rend utiles pour le suivi de l'évolution de la maladie et le diagnostic
moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement
mis en oeuvre dans toute situation où l'expression d'un polypeptide selon
l'invention,
normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une
variabilité allélique, d'une mutation, d'une délétion, d'une perte
d'hétérozygotie ou de
toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce
qu'elles
mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon
l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique
de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en
oeuvre
une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de
la maladie associée à la présence d'au moins une mutation sur une séquence du
gène
SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce
qu'il
comporte les étapes suivantes :

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
a) le cas échéant isolement de l'ADN génomique à partir de l'échantillon
biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ;
b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible
de
contenir une mutation à l'aide d'amorces selon l'invention ;
5 c) analyse des produits d'amplification obtenus et comparaison de leur
séquence avec
la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie
associée à une expression anormale d'un polypeptide codé par le gène SPG4,
notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on
met
10 en contact un ou des anticorps selon l'invention avec le matériel
biologique à tester,
dans des conditions permettant la formation éventuelle de complexes
immunologiques
spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que
l'on détecte
et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD
15 associée à la présence de mutation dans le gène SPG4 selon l'invention,
notamment
anténatal, en déterminant à partir d'un prélèvement biologique du patient la
présence
de mutations dans au moins une des séquences décrites précédemment. Les
séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN
génomique, de l'ADNc, ou de l'ARNm.
20 Des acides nucléiques ou anticorps basés sur la présente invention
pourront
également être utilisés pour permettre un diagnostic positif chez un malade ou
un
diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent
familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène
par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut
essentiellement les diviser en deux grandes catégories. Le premier type de
méthode
est celui dans lequel la présence d'une mutation est détectée par comparaison
de la
séquence mutée avec la séquence correspondante sauvage, et le second type est
celui dans lequel la présence de la mutation est détectée de façon indirecte,
par
exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente
invention décrites. Il s'agit généralement de séquences nucléiques
d'hybridation
purifiées comprenant au moins 15 nucléotides, de préférence 20, 25 ou 30
nucléotides,
caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une
séquence
nucléique selon l'invention.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
21
De préférence, les conditions d'hybridation spécifiques sont telles que celles
définies précédemment ou dans les exemples. La longueur de ces séquences
nucléiques d'hybridation peut varier de 15, 20 ou 30 à 200 nucléotides,
particulièrement de 20 à 50 nucléotides.
Parmi les méthodes de détermination d'une variabilité allélique, d'une
mutation,
d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on
préfère les
méthodes comprenant au moins une étape d'amplification dite par PCR (réaction
en
chaîne par la polymérase) ou par PCR-like de la séquence cible selon
l'invention
susceptible de présenter une anomalie à l'aide de couple d'amorces de
séquences
nucléotidiques selon l'invention. Les produits amplifiés pourront être traités
à l'aide
d'enzyme de restriction appropriée avant de procéder à la détection ou au
dosage du
produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de
différentes modifications de son produit de traduction, modifications
utilisables pour
une approche diagnostique. En effet, les modifications d'antigénicité liées à
ces
mutations peuvent permettre la mise au point d'anticorps spécifiques. La
discrimination
du produit de gène muté peut être réalisée par ces méthodes. Toutes ces
modifications
peuvent être utilisées dans une approche diagnostique grâce à plusieurs
méthodes
bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux
reconnaissant
le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par
ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le
diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence
de
mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle
comprend au
moins un composé choisi parmi le groupe de composés suivant :
a) un acide nucléique, notamment comme amorce ou sonde, selon la présente
invention ; et
b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un
composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD
associée au gène SPG4, caractérisée en ce que l'on met en uvre une séquence
d'acide nucléique selon l'invention, un polypeptide selon l'invention, un
vecteur selon
l'invention, une cellule selon l'invention, un mammifère selon l'invention ou
un anticorps
selon l'invention.

CA 02348657 2010-04-14
22
Sont également comprises dans l'invention, les méthodes de sélection de
composés chimiques ou biochimiques capables d'interagir directement ou
indirectement avec des polypeptides selon l'invention ou avec les acides
nucléiques
selon l'invention, eVou permettant de moduler l'expression ou l'activité de
ces
polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un
polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou
d'un
mammifère selon l'invention, avec un composé candidat et, la détection d'une
modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification
de
molécules capables d'interagir avec un polypeptide selon l'invention en
utilisant un
système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid
System eselon les instructions du manuel accompagnant le Matchmaker Two Hybrid
System 21batalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les
séquences promotrices eVou régulatrices du gène SPG4 selon l'invention,
peuvent être
criblés et/ou sélectionnés en utilisant un système de simple hybride tel que
celui décrit
dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech
(Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou
de
polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule
selon
l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression
ou de
l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la
suite
de la description avec les exemples et les figures dont les légendes sont
représentées
ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 18 et 1C : Carte physique de l'intervalle SPG4 et organisation
génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs
génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des
marqueurs polymorphes et autres STSs est, indiquée en caractères standards
alors
que la position des ESTs est indiquée en italique. Les clones de BAC
constituant la
carte de préséquençage sont représentés par des rectangles dont le nom figure
au-
.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
23
dessus et la taille précise du clone au-dessous si celle-ci a pu être
déterminée. Le nom
des BACs A, B, C, ... est suivi d'une parenthèse contenant le nom du clone
précédé
d'un b si le clone est issu de la banque de BACs CITB_978_SKB ou d'un B
si
celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les
BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles
noirs
avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées
au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site
accepteur
d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les
jonctions entre les différents exons. Le codon ATG initiateur est localisé en
position nt
126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des
mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en
italique (nt
1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exon 16: nt 1813-1853).
Le site de
polyadénylation est en italique et souligné. Le signal de localisation
nucléaire (NLS)
putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse
dans la
base de données ProDom sont respectivement localisés aux positions aa7-11
(NLS),
aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226).
Les
quatre motifs prédits par la comparaison de séquence dans la base de données
Prosite sont : deux motifs leucine zippers aux positions aa50-78 et aa508-
529, le
site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le
domaine
de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et
B de
Walker, GPPGNGKT et IIFIDE , ainsi que le consensus minimal des AAA sont
soulignés.
FIGURES 3A et 3B Caractérisation d'une mutation d'un site d'épissage chez les
individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A: Amplification par PCR du fragment IV de l'ADNc SPG4 à partir
d'ADNc de lymphoblastes : puits IVI, marqueur de taille VII (Boehringer) ;
puits 1,
membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ;
puits 3,
membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ;
puits 5,
patient de la famille 5226; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B: Graphe de séquence de la mutation du site accepteur d'épissage
de l'intron 15.

CA 02348657 2001-05-02
WO 01/18198 PCT/F'R00/02433
24
Séquence génomique de l'individu contrôle en haut et d'un patient de la
famille
2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A-
>C qui
touche un nucléotide non conservé du site accepteur d'épissage de l'intron 15
chez le
patient.
FIGURES 4A et 4B: Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W de huit protéines
issues de divers organismes et présentant une forte homologie de séquence avec
les
spastin humaine et murine (SEQ ID No. 73).
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure
AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5: Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de
son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de
l'ADNc
murin est souligné et en italique. Le codon STOP est localisé en position nt
1515-1517
dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 6B et 6C : Analyse par PCR de l'expression de SPG4 et de son
orthologue murin Spg4.
FIGURE 6A: Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau
;
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique
; puits 7,
rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7; puits 10, embryon
de 11 jours
El 1 ; puits 11, embryon de 15 jours El 5 ; puits 12, embryon de 17 jours El 7
; puits 13,
témoin négatif (ADN génomique de souris).
FIGURE 6G: Collection d'ADNc provenant de multiples tissus humains.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2,
coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas ; puits 7,
placenta ; puits
8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10,
témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus
humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2,
coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique
; puits 7,
rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10,
témoin négatif (pas d'ADN).

CA 02348657 2010-04-14
EXEMPLES
Exemple 1: Matériels et méthodes
1) Sous-clonage et séquençage de la région candidate
Douze BACs provenant de deux banques génomiques humaines,
= 5 CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11
(Osoegawa et
ai, 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être
séquencés
(Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de l'ADN de chaque BAC a
été
digéré partiellement par l'enzyme de restriction CviJI (CHIMERx) et séparé par
électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les
10 tailles varient autour de 3, 5 et 10 kb ont été éluées avec la 13-
agarase (Biolabs) et
liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et
déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E.
coui
DH1013 électrocompétentes (GIBCO-BRL) ont été transformées par électroporation
avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à
10
15 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40
% de
clones avec inserts à 5 kb et 40 % de clones avec inserts à 3 kb ont été
isolés. Les
extrémités des inserts de ces clones ont été séquencées sur un séquenceur
automatique LICOR 4200N. Pour chaque BAC, les séquences furent assemblées en
un
TM
squelette constitué de plusieurs contigs à l'aide des logiciels Phred et
Phraples trous
20 entre chaque contig furent séquencés avec des dideoxynudéotides marqués
sur un
TM
séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces
contigs
nt
de séquence ont été prédits par les programmes informatiques GRAIL II,
GENSCAPF,*
FGENEfret GenierLes séquences furent également comparées dans les bases de
données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes
25 BLASTN et BLASTX. La détermination des séquences promotrices fut
réalisée par les
TM
programmes informatiques TSSG et TSSW. Les résultats de toutes ces analyses de
TM
séquences furent visualisés par le programme d'annotation de séquence
Genotator.
2) Clonage de l'ADNc
L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et
3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à
l'aide du kit
d'amplification d'ADNc MarathonICIontech), selon les instructions du
fournisseur. Une
première PCR, suivie d'une PCR interne furent effectuées avec différents
couples
d'amorces dont les séquences sont indiquées sur le tableau 1 ci-après :
=

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
26
Tableau 1
Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc
Amorce Séquence (5'-3')
Position en 5' couple/ PCR Taille du produit
SPA 5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405
SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372
SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331
SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550
SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689
SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747
SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075
SPA 3RACE5 CTTCTCTGAGGCCTGAGTTGTTCAC (SEQ ID No.11) nt 1207
SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736
SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ ID No.13) nt.1787
SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037
SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No 15) nt 45 b+m 655
pb
SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700
SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543
pb
SPA Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649
SPA_Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746
pb
SPA Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233
SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No.21) nt 532
SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175
SPA Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763
pb
SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799
SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076
SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780
SPA Ca TGGAGATGACAGAGTAC'TTG (SEQ ID No.27) nt 1550 a+m 766
pb
SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316
SPA_Cb ATGAGGCTGMTCAGGCG (SEQ ID No.29) nt 1603

CA 02348657 2010-04-14
27
TM
Les produits de RACE-PCR ont été clonés avec le kit TA-cloning (Invitrogen) et
les clones correspondants ont été séquences sur un ABI 377 (PE-Applied
Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de
PCR
amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6
individus
sains.
3) Détection des mutations
Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu
atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA
PLUSI414
(bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 pg
d'ARN
avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de
TM
reverse transcriptase Superscript Il (Gibco BRL) dans des conditions
standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui
recouvrent
la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les
ADNc des
patients et contrôles. Le fragment I fut amplifié avec les amorces
SPA_Db/SPA_Dm,
25 pendant 50 sec, à l'exception du fragment 1 : 58 C pendant 50 sec) et
d'élongation
(72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C).
Les
produits de PCR sont séquencés sur un séquenceur automatique ABI 377 (PE-
Applied
Biosystems) avec les amorces SPA_Dc/SPA_Dn, SPA Ac/SPA An, SPA_Bb/SPA_Bn
et SPA_Cb/SPA_Cm pour les fragments I, Il, 1H et IV respectivement
30 Les mutations furent également recherchées ou confirmées par séquençage
des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon
fut
amplifié avec le couple correspondant d'amorces a+m (cf. tableau 2 ci-
après), à
l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui
furent co-
amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et
35 gSPAex11a/gSPAex12m.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
28
Tableau 2
Amorces de PCR pour l'amplification et le séquençage des exons
Exon Taille du produit Programme de PCR Amorce
Séquence (5'-3') (SEQ id Nos. ; 30 à 71)
1 1048 pb 0 gSPAex1c GTGAGCCGAACTGCACATTG
gSPAex1m CAAAGTCGACAGCTACAGTGC
g SPAex1d GGAACTGTAGTTGAGTGGGA
gSPAex1n AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC
gSPAex2m TGTGAATATATCATAATTTGGG
gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG
gSPAex3m ACATTTCCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC
gSPAex4m TTAGAATGACTATACCTGAC
gSPAex4n TCAGGTTAAGTAAGACTC
830 pb 4 gSPAex5a TTCCTATCTACCTAGTGAC
gSPAex5m TTTTATAGCAAGTTGCCCTG
gSPAex5b CCTATGAAGATCCTGGTAC
6 484 pb 3 gSPAex6a TGTCATGATTCTAACAAGGG
gSPAex6m TCTATTTCACTCCTGACATG
7 420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC
gSPAex7m ATCATACTACCCACTTTTCC
8 647 pb 3 gSPAex8a TGTTTGGGAAGATGCTACTG
gSPAex8m CTACTGAAGATAACGTACATG
9 1268 pb 1 gSPAex9a CATTGATTGCCATGTATTGG
gSPAex9m AGAAGGCCAGAAATACTCAG
gSPAex9b GTACTTAAATCGGTAAATATGG
10-1 1061 pb 4 gSPAex10a CTCAAGTCTTAGGAATGCAG
111 gSPAex10b GCACTTAACCAGGCTGTATG
12_I 551 pb 3 gSPAex1la CTCAGATGACTCACATAGC
gSPAex12m CTTTACTAGACTAATTCTCCTG

CA 02348657 2010-04-14
29
13 1361 pb 4 gSPAex13a CAGATTCAAGAAGACAGATC
gSPAex13m GCAATAATTCACCACACTTG
gSPAex13n GGTAGTTCTTGTT1-CTGCTC
14 985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC
gSPAexl4m GAGCTGAAAAGTATTCAGC
gSPAex14n TGCAAAGGACATAGCCAGTG
15 1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC
gSPAex15m CTAGAACAGGGGTCACAGTC
gSPAex15n TTGGACTTCTTAAACTTC
16 1404 pb 4 gSPAex16a GCAGTATGCAAGAAATTGAAC
gSPAex16m GGCCTGTAATTTTCTTCTG
gSPAex16b GTACTGAATAGATACATGTAG
17 445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG
gSPAex17m CATCTTCAAGTTTGGTGCAC
Hormis l'exon 1, amplifié à l'aide du kit Advantage CC genomic PCR kir
= (Clontech) selon les instructions du fournisseur, quatre programmes de
PCR
légèrement différents (1,2, 3 et 4) furent utilisés pour amplifier les exons
de SPG4 (voir
tableau 2). Les amplifications furent toutes effectuées dans un volume de 50
pl
contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 pM de
dNTPs, 1X de tampon Takara et 1 unité de Taq polyrnérase Takara La Taq (Shuzo
Co.). Les réactions de PCR ont été réalisées selon le procédé du hot start
: la Taq
polymérase est ajoutée à 94 C après une première étape de dénaturation de 5
min à
96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation
(94 C
pendant 40 sec), d'hybridation (prog. 1: 60 C pendant 50 sec; prog. 2, 58 C
pendant
50 sec, prog. 3 et 4 : 55 C pendant 50 sec) et d'élongation (prog. 1 et 4: 72
C pendant
1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape
d'élongation (10
min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un
séquenceur
ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les
amorces internes notées c< b et n (voir tableau 2).
4) Caractérisation de SPG4
Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus
des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium
IMAGE
et séquencés au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems).
Afin
d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les
collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que
de tissus
5 de souris (panels MTC, Clontech) ont été testées par PCR selon le
protocole du
fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le
couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de
souris. Les conditions de PCR sont celles utilisées pour l'amplification de
SPG4 à partir
d'ADNc de lignées de lymphoblastes (cf. Détection des mutations), excepté
que les
10 échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus
adultes humains
et de tissus murins, et à 28 cycles pour les ADNc issus de tissus foetaux. Les
produits
d'amplification ont migré par électrophorèse sur des gels d'agarose 2 h.
5) Analyse histologique d'une biopsie musculaire d'un patient
Les analyses histologiques et histo-enzymatiques ont été réalisées à partir
15 d'une biopsie musculaire d'un patient issu d'une famille liée au locus
SPG4 selon les
techniques standards décrites dans Casari et al., 1998.
6) Numéros d'accession dans les bases de données publiques
L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène
20 SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4
L'analyse des évènements de recombinaison a permis de réduire la région
candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et
D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de
37
25 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la
région candidate
couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants,
s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre
les clones
A et E, ont été sélectionnés pour être séquencés (Fig. 1A). Sept de ces BACs
(A, B, C,
D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont
déjà été
30 séquencés. Les séquences de ces 7 BACs ont été comparées à celles des
bases de
données nucléiques et protéiques, et analysées avec quatre programmes de
prédiction
d'exons. Ces analyses de séquences préliminaires ont permis de mettre en
évidence
14 unités de transcription potentielles, dont trois correspondant aux gènes
codant pour
la xanthine deshydrogénase, la stéroïde 5a-réductase 2 et une protéine liant
le TGFp.
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été
préalablement

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
31
identifiés dans les bases de données d'EST (pour Expressed Sequence Tag )
et
localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans
Genomics) ; les
gènes restants n'ont pu être identifiés qu'en séquençant la région candidate.
L'un de
ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec
les
5 gènes codant pour la famille protéique des AAA (Confalonieri et al.,
1995). Des
analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou
SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90
kb,
couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois
premiers
exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre
programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils
présentent une
forte homologie avec un EST de blastocyste de souris, AA560327. Les 14
derniers
exons se trouvent dans le BAC G. La séquence protéique déduite des exons 7 à
17 est
significativement homologue à une sous-classe de la famille des AAA,
comportant les
protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994)
et End 13,
ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus
fiable et le plus puissant, permettant la détection de la plupart des gènes=
de cette
région chromosomique en 2p21-p22. Cette constatation s'applique également au
gène
SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand
seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes
Genie,
GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être
confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4.
Les
jonctions introns/exons sont représentées sur le tableau 3 ci-après : la
taille des exons
varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de
140 pb
(intron 11) à 23,247 kb (intron 1).

Tableau 3
Organisation intron/exon du gène SPG4
c>
,
Exon/ Taille de l'exon Position Site accepteur d'épissage
Site donneur d'épissage Taille de l'intron ce
intron (pb) sur l'ADNc (SEQ ID No. 74 à 89)
(SEQ ID Nos. 90 à 105) (pb) cc
1 540 1
TGAGAAAG/gtaactagggggctgg 23 247
2 87 541 attttttattttaaag/CAGGACAG
AGGACAAG/gtaagattgtatttgt 1 943
3 84 628 aatttttttctttcag/GTGAACAG
ACTTCTAG/gtatcaattaatgtat 9 190
4 96 712 cttctctgttgcatag/AGAAGATG
CCAGTCAG/gtgggtttaggttaac 15 745 P
5 188 808 actttttccttgtcag/AAAGTGGA
CTCATAAG/gtattctgggacagta 876
6 134 996 ttttgtatcctttaag/GGTACTCC
GTGGACAA/gtaagttttgccatct 283 .
,
7 94 1 130
aggtcttgtttcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10 735
,
,
8 75 1 224
agtatatattttttag/TTGTTCAC CAATGCTG/gtaagggttctcttca 1 385 .
,
N)
0
9 72 1 299
cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8 083
10 76 1 371
taatgcttettag/GTGGGAGA TTTTATAG/gtaagaacatattttc 238
11 92 1 447
cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140
12 80 1 539
gatffittgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4 715
13 43 1 619
ggattattatttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1 389
'
, 14 80 1 662
ttttaatatttttcag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1 521
15 71 1 742
tccttcccttcctcag/AATGACTG TATCCGAG/gtaggtatacaagagc 2 210
mo
el
..i
16 41 1 813
cttttatgttttacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7 115
,
x
17 1 410 1 854 ctttttaaaaatctag/ATGAGAAA

.e.
c.à
r.à
Les séquences des exons et des introns sont respectivement indiquées en
majuscules et minuscules.
:

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
33
Exemple 3: Identification de l'ADNc SPG4
Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées
sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal,
afin de
caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des
produits
d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce
qui était
probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de
GC dans
les 60 pb précédant la position nt 263). Quatre produits de PCR chevauchants,
recouvrant
la totalité de la région codante, ont été amplifiés à partir des ADNc issus
des
lymphoblastes de six individus contrôles et séquencés intégralement dans le
but de
vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les
produits
de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant
une phase ouverte de lecture de 1848 pb précédée par une région 5' non
traduite (5' UTR
pour 5' UnTranslated Region ) de 125 pb et suivie par une région 3' UTR de
1290 pb
incluant un site de polyadénylation entre les positions nt 3227-3232, - 35 pb
en amont de
la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les
banques de données d'ESTs a permis de détecter une homologie significative
avec 6
ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus
étendue
(+ 180 pb) comprenant un deuxième site de polyadénylation. Le site
d'initiation de la
traduction a été identifié par la présence d'une séquence consensus de Kosak
(CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la
traduction
attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-
même précédé
d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence
transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la
région 5'
à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une
séquence promotrice de type TATA box située 43 pb en amont de la position nt 1
de
l'exon 1.
Exemple 4: Mutations dans le crène SPG4
Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant
de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1
individu atteint
par famille). Quatre fragments de PCR chevauchants I, Il, III et IV recouvrant
la phase
ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquencés chez les 14
patients
ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose
du fragment
de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles
2992,
5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une
microdélétion
ou une mutation d'un site d'épissage ; les deux bandes supplémentaires
n'étaient pas
_

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
34
présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La
séquence
génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site
accepteur
d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois
familles (Fig. 3B) ;
cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase
de lecture
dans le transcrit anormal. Aucun des membres sains incluant maris et épouses
ne porte
cette mutation du site d'épissage. L'identification de la même mutation chez
tous les
membres atteints de ces trois familles suisses démontre l'existence d'un
ancêtre
commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 14683->A et 1620C->T qui introduisent
des substitutions d'un acide aminé dans la séquence protéique (8362C, C448Y et
R499C) ont été respectivement mises en évidence par le séquençage des
fragments de
PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces
trois
substitutions impliquent toutes un résidu cystéine, induisant la perte ou
l'insertion d'une
cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée
l'apparition d'un codon STOP induisant une protéine tronquée composée de 465
acides
aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune
des cinq
mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les
individus
contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des
sept familles
analysées ici. Ces cinq mutations affectent de façon importante la séquence
protéique
dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé
de
plusieurs motifs protéiques supposés être responsables de l'activité ATPase
chez tous les
membres de la famille des AAA.

oe
Tableau 400
Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide
aminé b Conséquence
624 exon 7 1 210 Ci-> G S362C faux
sens
4 014 exon 11 1 468 Gi-> A C448Y faux
sens(71
a,
A exon 11 1 520 delT 466STOPcodon non sens
o
618 exon 13 R499C faux
sens
1 620 T
(71
2 992 intron 15 A aa564 aa576 (PTC+7 aa) perte
de l'exon 16+ décalage
1 813-2a1-> g
226 intron 15 A aa5641-> aa576 (PTC+7 aa) perte
de l'exon 16+ décalage
1 813-2a1-> g
5 330 intron 15 perte de
l'exon 16+ décalage
A aa5641-> aa576 (PTC+7 aa)
1 813-2a1-> g
a Les positions en nt font référence à la séquence de l'ADNc SPG4.
Les positions en aa font référence à la séquence de la spastin.
Les bases des exons sont indiquées en majuscules, celles des introns en
minuscules.
J-3
PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.
b.1

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
36
En addition à ces cinq mutations décrites précédemment, des recherches de
mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de
36 autres
familles ont permis de mettre en évidence 34 autres mutations altérant ou
susceptibles
d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau
5
ci-après dans lequel ont été également insérées les cinq premières mutations
précédemment citées.

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
37
Tableau 5
Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide
aminé Conséquence
,
1210 Ci--G S362C faux sens
624 exon 7
1233 G F4A G37OR faux sens
6958 exon 8 F381C faux sens
2 1267 T F--)G
14 exon 8
N386K faux sens
1002 exon 8 1283 Ti-->G K388R faux sens
027 exon 8 1288 AI-4G L426V faux sens
019 exon 10 1401 C1->G C448Y faux sens
4014 exon 11 1468 G1-9A R460L faux sens
148 exon 11 1504 G i->T R499C faux sens
618 exon 13 1620 CI-41' D555N faux sens
636 exon 15
1788 Gi->A. A556V faux sens
627 exon 15
1792 Ci->T
.
702 C F--)T -Q193 STOP non sens
2971 exon 3
3655 exon 5 873 Ai->T IC229STOP non sens '
1010 exon 5 907 Ci->A S261STOP non sens
Y269STOP non sens
3938 exon 5 932 CI-)G R431STOP non sens
6922 exon 10 1416 C1->T R431STOP non sens ,
616 exon 10 1416 Ci->T R562STOP non sens
605 exon 15
1809 Ci->T
030 exon 2 578-579insA -PTC + 2 aa décalage + non sens
_
615 exon 5 852de11 1 PTC + 18 aa décalage + non sens
042 exon 5 882-883insA PTC + 12 aa décalage + non sens
032 exon 5 906delT PTC + 17 aa décalage + non sens
189 exon 9 1299deIG PTC +3 aa décalage + non sens
3686 exon 9 1340de15 PTC + 35 aa décalage + non sens
625 exon 9 1340de15 PTC +35 aa décalage + non sens
A exon 11 1520delT PTC +7 aa décalage + non sens
115 exon 12 1574deIGG PTC + 2 aa décalage + non sens
3266 exon 13 1634de122 PTC + 18 aa décalage + non sens
149 exon 14 1684-1685insIT PTC + 9 aa décalage + non sens
645 exon 14 1685de14 PTC +7 aa , décalage + non sens
808-2 ai-4g ?
029 intron 4 ? mutation site d'épissage
1129+2 t i->g
162 intron 6 ? mutation site d'épissage
t i->
125 intron 7 1223+1 g ? mutation site d'épissage
143 intron 8 1299+1 gi-4a
(PTC + 6 aa) mutation site d'épissage
1620 intron 11 1538+5 g i->a ? perte de l'exon
11 + décalage
1006 intron 11 1538+3 del4 ? mutation site
d'épissage
1605 intron 13 1661+1 g He ? mutation site
d'épissage
1012 intron 13 1662-2 ai-->t ? mutation site
d'épissage
1626 intron 15 1812+1 gi-4a. A aa5641-4 aa576 (PTC+7 aa)
mutation site d'épissage
2992 intron 15 de l'exon 16 +
décalaRe
1813-2 a F--->g A aa564 F4 aa576 (PTC+7 aa) ` neite -
5226 intron 15 perte de l'exon 16 +
décalage
1813-2 ai-4g à W564 I-4 aa576 (Frrc+7 aa)
5330 intron 15perte de l'exon 16 + décalage
1611 intron 16 1813-2 a 1-4g ? mutation site
d'épissage
1853+1 gi->a
a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les
positions en aa font référence à la
séquence de la spastin. Les bases des exons sont indiquées en majuscules,
celles des introns en minuscules.
PTC+n aa - "premature tennination codon" à n acide aminé en aval de la
mutation.

CA 02348657 2010-04-14
38 =
Exemple 5: Analyse de la séquence protéique de la spastin
La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous
avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons
(kD). La
comparaison de cette séquence en acides aminés dans les bases de données
protéiques
à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte
homologie avec plusieurs membres de la famille des AAA à l'extrémité C-
terminale de la
spastin. Les motifs types de la famille des AAA, englobés dans la cassette
AAA, sont
localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les
comparaisons de
séquence dans les bases de données de domaines protéiques ProDom et Prositeni.
Les
trois domaines types conservés, dont les motifs A et B de Walker ainsi que le
motif
consensus minimal des protéines AAA sont respectivement situés éu sein de la
cassette
AAA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de
Walker,
GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de
fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les
membres de la
famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille
d'ATPase issues d'organismes très éloignés dans l'évolution a permis de
classifier cet
ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de
cassettes
AAA identifiés (1 ou 2) et des homologies de séquence entre ces différentes
cassettes
(Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin
présente une
plus forte homologie avec une sous-classe particulière des AAA, et plus
spécifiquement
avec les protéines suivantes dont la plupart ont été identifiées grâce au
séquençage
complet du génome de l'organisme considéré : deux protéines de Caenorhabditis
elegans
016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces
cerevisiae
Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du
protéasome
de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13
(P52917) de S. cerevisiae et la protéine murine SK01 (P46467) (Perier et ai,
1994).
L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la
Fig. 4A. Sur
les 257 acides aminés englobant la cassette AAA (positions aa342-599), la
spastin
présente une identité de séquence de 52 %, 51 % et 50 % avec la protéine de
levure
Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6
(P40328)
respectivement Des résultats similaires ont été obtenus par l'analyse de la
séquence
protéique de la spastin dans la base de données ProDom= qui a montré
l'existence de trois
domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions
aa342-
409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du
protéasome 26S

CA 02348657 2010-04-14
39
de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus
souvent
des motifs de type leucine-zipper dont deux ont pu être détectés dans la
séquence
protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la
séquence
dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu
prédire la
présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-
helix )
situé entre les positions aa478 et aa486.
La comparaison de la séquence protéique de la spastin avec celles des
métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et
YME1,
ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre
que
l'homologie entre ces cinq membres de la famille des AAA est limitée à la
région de
=
257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de
séquence
entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et
la protéine
de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence
protéique.
Cette comparaison de séquence suggère que la spastin n'appartient pas au même
sous-
groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales.
De plus,
"TM
l'analyse informatique de la séquence de la spastin avec le programme PSORT II
qui
permet de prédire la localisation sub-cellulaire des protéines semble indiquer
que le
spastin est une protéine nucléaire. Un éventuel signal de localisation
nucléaire (NLS pour
Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les
positions aa7 et
aal 1 alors qu'aucun peptide signal caractéristique d'un import dans la
mitochondrie n'a
.= pu être décelé, contrairement à ce qui avait été observé pour la
paraplegin.
Exemple 6: Profils d'expression de SPG4 et de son ortholonue murin Soo4
La comparaison de la séquence nucléique de SPG4 dans les banques de données
d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant
une forte
homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de
souris
correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du
consortium IMAGE et séquencés intégralement. L'assemblage des séquences de ces
clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb
incluant
une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre
l'ADNc SPG4
humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ
460 pb à
l'extrémité 5' dont le codon d'initiation de la traduction. La phase de
lecture ouverte de
souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un
Site de
polyadénylation situé à ¨20 pb en amont de la queue polyA (Fig. 5). La
séquence
nucléique de SPG4 et la séquence protéique de la spastin humaine présentent
respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et
de 96 %

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
(entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la
protéine
déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce
transcrit de
souris correspond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northem blots comprenant les ARNm de divers tissus humains et
5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de
résultats
probants excepté une très faible bande correspondant à un transcrit de 2,5 kb
dans le
testicule de souris après 10 jours d'exposition. En raison du faible niveau
.d'expression de
ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des
expériences de PCR sur des collections d'ADNc normalisées provenant de divers
tissus
10 adultes et foetaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé
de façon
ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade
E17 de
l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été
détectée dans le
foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de
l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été
confirmée
15 par la présence d'ESTs provenant de banques d'ADNc de blastocyste,
d'embryon E8 et
de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le
gène
humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes
(Fig. 6B)
et foetaux (Fig. 8C), avec une expression peut-être plus marquée dans le
cerveau foetal.
Exemple 7: Pas de défaut de la phosphorvlation oxvdative dans la PSF-AD liée
au locus
20 SPG4
Afin de déterminer si des mutations de la spastin induisaient un défaut de la
phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui
avait été
observé pour la paraplegin, une biopsie musculaire a été réalisée sur un
patient d'une des
familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-
25 enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre
musculaire de type
RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la
mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales
ainsi quels
prédiction d'une localisation nucléaire de la spastin semblent indiquer que la
PSF-AD liée
au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par
opposition à
30 la PSF-AR liée au locus SPG7.
Par une approche de clonage positionne' basée sur le séquençage d'une région
de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la
forme la
plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques
2p21-
35 p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit
du gène, nommé

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
41
spastin, ont pu être détectées chez les individus atteints de quarante-et-une
familles de
PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre
de la
famille des protéines AAA, dont la localisation semble être nucléaire et qui
présente une
forte homologie avec les sous-unités du protéasome 26S de levure. En dépit
d'une
grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA,
les
nombreux membres de cette famille protéique peuvent participer à des
mécanismes
cellulaires très variés comme le transport de protéines au sein de vésicules,
la régulation
du cycle cellulaire, la biogénèse dei organelles, le contrôle de la
transcription.....
Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la
fonction ou la
dégradation de complexes protéiques, ce qui suggère que les membres de la
famille des
AAA sont des protéines dites chaperons .

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
42
Références
Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Sequence analysis of the AAA protein family. Protein Sci. 6, 2043-
2058 (1997).
=
Bodansky M., Principles of peptide synthesis, (1984).
Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-
Lorrain) in
Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M.B.V.) 301-318
(Elsevier Science
Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4: 538-542, 1993.
Burg, J.L. et al. (1996), Mol. and Cell. Probes, 10, 257-271.
Carter, B.J. Curr. Op. Biotechnology 3: 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impeirment caused by mutations
in
Paraplegin, a nuclear-encoded mitochondrie! metalloprotease. Cell 93, 973-983
(1998).
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M., and Berger, R.
Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G.,
Gervy, P., Le
Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377: 175-183, 1995.
Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a
basic
function. BioEssays 17, 639-650 (1995).
Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomal spastic paraplegia linked to chromosome
2. Brain
119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4: 558-563, 1993.
Epstein, A. Médecine/Sciences 8: 902-911, 1992.
Erlich, HA., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al.
Gel! 85 : 281-
290, 1996.
Fink, J.K. et al. Autosomel dominant familial spastic paraplegia : tight
linkage to
chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomal dominant familial spastic paraplegia is genetically heterogeneous
and one
locus maps to chromosome 14q. Nature Genet. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial
spastic paraplegia
to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).

CA 02348657 2001-05-02
WO 01/18198 PCT/FRO0/02433
43
Hedera, P. et al. Novel locus for autosomal dominant hereditary spastic
paraplegia, on
chromosome 8q. Am. J. Hum. Genet. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complic,ated familial spastic paraplegia to
locus SPG4 on
chromosome 2p. J. Med. Genet. 35, 89-93 (1998).
Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic
paraplegia to
chromosome 2p markers. Hum. Mol. Genet 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia
:
advances in genetic research. Neurology ste, 1507-1514(1996).
lnnis, M.A. et al. (1990), Academic Press.
Jouet, M. et al. X-linked spastic paraplegia (SPG1), MASA syndrome and X-
linked
hydrocephalus result from mutations in the L1 gene. Nature Genet. 7, 402-407
(1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Ktihler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proc. Natl. Acad. Sci. USA, 86, 1173-1177.
Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1077-1080, 1988.
Lizardi, P.M. et al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169: 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Nielsen, J.E. et al. GAG repeat expansion in autosomal dominant pure spastic
paraplegia
linked to chromosome 2p21-24. Hum. Mol. Genet. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4: 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial
artificial
chromosome libraries. Genomics 52, 1-8 (1998).
Perier, F. et al. Identification of a novel mammalian member of the
NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS
lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Perricaudet, L. and Briand, P. La Recherche 23 :
471-473,
1992.
Polo, J.M., Calleja, J., Combarros, O. & Berciano, J. Hereditary ataxias and
paraplegias in
Cantabria, Spain. An epidemiological and clinical study. Brain 114, 855-866
(1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34, 499-503(1997).
Rohlmann, A., Gotthardt, M., VVillnow, T.E., Hammer, R.E., and Herz, J. Nature
Biotech.
14: 1562-1565, 1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.

CA 02348657 2001-05-02
WO 01/18198
PCT/F'R00/02433
44
Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory
manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher
disease
are allelic disorders at the proteolipid protein locus. Nature Genet. 6, 257-
262 (1994).
Schnall, R. et al. Identification of a set of yeast genes c,oding for a novel
family of putative
ATPases with high similarity to constituents of the 26S protease complex.
Yeast 10, 1141-
1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and reduction of the
chromosome 2p
minimal candidate region in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997).
Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet. 6, 165-
183 (1974).
Stone, B.B. et al. (1996). Mol. and Cell'. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem.
Company,
Rockford, 111, 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and ltakura K. PNAS 78 :
6613-
6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene
Transfer,
=
New York, Plenum Press, 149-187, 1986.
Walker G.T., Fraiser M.S., Schram J.L., Little M.C., Nadeau J.G., & Malinowski
D.P.
Nudeic Acids Res. 20 : 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta
Neurol. Scand. 73
(Suppl. 106) (1986).
Woo S.L.C. Methods Enzymol. 68: 389, 1979.

CA 02348657 2001-11-07
1/66
LISTE DE SÉQUENCES
<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - CNRS
<120> CLONAGE, EXPRESSION ET CARACTÉRISATION DU GENE SPG4
RESPONSABLE DE LA FORME LA PLUS FRÉQUENTE DE PARAPLÉGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE
<130> 7091-514ca CC/LM
<140> PCT/FRO0/02433
<141> 2000-09-04
<150> FR 99 11097
<151> 1999-09-03
<160> 107
<170> PatentIn Vers. 2.0
<210> 1
<211> 110000
<212> ADN
<213> Homo sapiens
<220>
<221> exon
<222> (9932)...(10471)
<220>
<221> intron
<222> (10472)¨(33718)
<220>
<221> exon
<222> (33719)...(33805)
<220>
<221> intron
<222> (33806)...(35748)
<220>
<221> exon
<222> (35749)...(35832)
<220>
<221> intron
<222> (35833)...(45022)

CA 02348657 2001-11-07
2/66
<220>
<221> exon
<222> (45023)...(45118)
<220>
<221> intron
<222> (45119)...(60863)
<220>
<221> exon
<222> (60864)...(61051)
<220>
<221> intron
<222> (61052)...(61927)
<220>
<221> exon
<222> (61928)...(62061)
<220>
<221> intron
<222> (62062)...(62344)
<220>
<221> exon
<222> (62345)...(62438)
<220>
<221> intron
<222> (62439)...(73173)
<220>
<221> exon
<222> (73174)...(73248)
<220>
<221> intron
<222> (73249)...(74633)
<220>
<221> exon
<222> (74634)...(74705)
<220>

CA 02348657 2001-11-07
3/66
<221> intron
<222> (74706)...(82788)
<220>
<221> exon
<222> (82789)...(82864)
<220>
<221> intron
<222> (82865)...(83102)
<220>
<221> exon
<222> (83103)...(83194)
<220>
<221> intron
<222> (83195)...(83334)
<220>
<221> exon
<222> (83335)...(83414)
<220>
<221> intron
<222> (83415)¨(88129)
<220>
<221> exon
<222> (88130)¨(88172)
<220>
<221> intron
<222> (88173)...(89561)
<220>
<221> exon
<222> (89562)...(89641)
<220>
<221> intron
<222> (89642)...(91162)
<220>
<221> exon

CA 0257 2001-11-07
4/66
<222> (91163)...(91233)
<220>
<221> intron
<222> (91234)...(93443)
<220>
<221> exon
<222> (93444)...(93484)
<220>
<221> intron
<222> (93485)...(100599)
<220>
<221> exon
<222> (100600)...(102009)
<400> 1
taactgactc tgctgtgttt ccttggcatt atagctaatc aaattgagca ggtcaggtaa
60
cagtttatac ttacacctac tatttcaaaa ccatgagctc attcacattt tcactgaagt
120
aacaaatcct ccataaacta gaaaatctca aactggtgac tgggagtttt ggttttgttt
180
ttttgttgtt ttattttatt ttattttatt ttctagatgg agtcttgctc tgttgcccag
240
gctggaatgc aatggcatga tctcagctca ctgcaacctc cacctttcgg gttcaagcaa
300
tcctcctgcc tcaatcttcc aagtagctgg gactacagga atgagctgcc gcacctggcc
360
tggtttgttt gtttttaaat tttgaggcca ggtgcagtgg cccatatctg tgatcccagc
420
actttgggag accaaggcag gccgattact tgaggtcagg agttcaagac cagccaggcc
480
aacatggtaa aaccatgtcg ctactaaaaa cacaaaaatt aggccgggca cggtggctca
540
cgtctataat cccagcactt tgggaggcca aggtgagtgg atcacctgag gtcaggaggt
600
caagaccagc ctggcaaaca tggtgaaacc ccgtctctat taaaaataca aaaattagcc
660
gggtgtggtg gcgggcacct gtaatcccag ctattgggga ggctgaggca ggagaatcgc
720
ttgaacctgg gaggtggagg ttgcagtgag tcgagatggt gccactgacc tccagcctgg
780
gcaataagag cgagacgcca tctcaaaaat atataaataa ataaataaaa atacaaaaag
840
tagctaggct ttgtggcagg cacctgtagt cccagctact taggaggctg aggcaggaga
900
attgcttgaa cccaggaggc ggaggttgca gtgagccaag attgtgccac tgcgttccag
960
cctgggtgac agagcaagac tccttctcaa aaataaataa ataaataaat aaataaataa 1020
ataaataaaa ttttgagctg ggcatgaaag ctgaggcagg aggatccctt gagcccagca
1080
gtttgagacc ccagtgagct ataattctga cactgcactt cagcctggct gacagaggga 1140
gaccgtgtat ctaaaaagaa taaaataaca atgatttttg agccaataac tcttagccaa 1200
tagatttcac ataaaaattt agaattctgg tttctcttga aaaattaaaa aaatctgaca 1260
atgttaagct tcacattcct gaaaggcaaa aatcagtgga agctagctgg gtgctgtggc
1320
tcacgcctat aaacccagtg ctttgggagg ctagggtaag tggattggtt gagtccagga 1380
gtttgagatc agcctggcca acacagtcaa accccatctc tacaaaacat acaaaaatta 1440
gctgggatat ggtggtgtgc acttgtggtc ccaactactc aggaggctga ggcaggagga 1500
ccacttgagc cctggaggtt gagggggcag tgagccatga ttgtgccact gcactccagc 1560
ctggacgaca gagagacatt gtctcaaaaa gaaaaaaaaa aatcagctca gtgggagctg 1620
agtaacagct gtcctgttca attacaggat gcaactcttt agcttctcat agtttccatc 1680
attcacatca tacatgcatt tttgcatgcc acacaaccca cacatggaac ccatatatgt 1740
tatatgcctg accactgttg ctattggaag ttttggccac tgcattaaac tataaactcc
1800
atcttattaa tcctgacacc ccacttattg cctgatatat tgtccgtttc ttaatatcta 1860
ttcatagaac aaatgaatga ataatatgtg ccacattgtg gactcaattc agggagatga
1920

cA 02348657 2001-11-07
5/66
ctaatcattc acaattatgt ttttccttct taatacagag attggataat aattccccaa 1980
ttgttacttc tctcatccct cccctccaac catatctttt catttgtttt tcttatttta 2040
ggttttctgc ctttttcaaa atcagccatt tcctcactgg actctacatg tgccattttt 2100
tttttttttt ttttactaat ttttttagtt gaaaagaggt ccttaatatc tgtcattggt 2160
ccacacttga aatctagaat ctctcgaatt gaaggtctga agagttcctt agaaggcaag 2220
tagggccgaa atatccaaaa aaaactattt gatggtaggc actgtggtaa ataaatatgg 2280
gttaaagtga taaagtgacc gaatgtcctg gattagttag cacagtacct agctccttct
2340
ttttgtcctt gtgaaactgt ctcagattcc attcaagatt aagtgtcctg aaagttctta 2400
caagctgaaa actgggaggc tctcacactg taggtagaat ggctagcagg gttgggatct
2460
catctaggca cattgcagaa ccagggtaac accaaggcat tatttttttt ctttctttac 2520
ttttcttctt tttttttaga gacagggtct cattatgtta cccaggctgg attccaattc
2580
ctgagctcaa gtgatcctcc tgagtagctg ggacttcagg tgtgcaccgc tgtgtctgaa 2640
ggcactgttt tttttgtttt ttttgttttt tttgacacaa atttaggaag atgttaattc 2700
acaacagtct tgagactgag atataattcc aaggagcaga agatgtgagt ttagagcact 2760
aaaaaatgag attccagtag agtcagaaat ctgaaatggc attacagata taagagacaa 2820
aaacaaaatg tattgagctc tgtcatgttg caggcatcat gatggaggtt ttagatgtac 2880
tctttcattt tgtaattttt atagaggaat taactagaat agcaacccca gtcccactaa 2940
ctctaaatcc catattttta ccatacaaaa aaagagcaaa agtgcagaaa agcacagtca 3000
atattaagta caaccagata gcagagactc agtaaatggg aggccggagg cccgaaaccc
3060
aacataatgc ccatgaatga aagcccatca cttgcgcttc aggggctaac aatatactta 3120
tttcataatt aaaatagaaa cagactatgt aaaaatatta ttcttgagat cccagatttt 3180
taccttaaat tactgaggca gtaagtgtaa ttaactaata tgtgatgttg ggcaaataac
3240
agactcttag agccccaaat tctttatttt aaaaaactga ggccagatga ggtggcttac
3300
acatgtaatc ccagcactgg ggatgccaaa gcaggcagat cacttgagct tgagcttagg
3360
agtttgagat cagcctgggc aacacggtta agacctcatc tctaaacaaa atacaaaaat 3420
tagccaaaca tggtggtgtg cacctgtgtt cctggctact caggaggctg aggtggaagg 3480
atcgcttgag cccgagaggt tgagggtgca gtgagccatg atcttgccat tgcactctac
3540
actctagtct gggtgacaga gtgagactct gtcttggggg aaaacaaaag agatgataat 3600
gcttaactga agtagcaata ttttaaaaag gcactaaaag ttcatctgct tagttcagaa
3660
tatgggttcg ataaatatta gcaagtagta gtagtcatca tcatcactgt cactgctgtt
3720
ctctccttaa acttaagcat gttttttgtt tttttgagac agtgtctcac tctgtcaccc 3780
aagctggagt tcagtggtgt gatcttggct cactccaacc tctgcctccc aggttcaagt 3840
gattctcctg tctcaccctc ccaagtagct gggaccacag acacgtacca caaccacacc 3900
cagctaattt ttcgtatttt tggtagaggt ggggtttcac catgttggcc aggctggtct 3960
tgaactcctg acctcaagtg atccacctgt ctcggcctcc caaagtgctg ggattacagg 4020
cgttagccac agcatccagc cttaagcatg ttaattaagt ttttataatt cagcaaaatg 4080
gttggaaaat gctgtcttaa atgagatgct taagctgccg tctgaacatg aggtagaagg 4140
aaattctaca cataatcatt gtgctaaatt acttgcaaag atggccacaa caattcctcc 4200
tatcctcata tatatgcccc tttgcaatgt gactttgcta cttctctatc aagatgtgga 4260
gcttattttc ccatatattg cactagagtt ggccttctga cttgctttga caatggaatg 4320
tagtacaaat gacactgtgc aactttggat tttaggtttc gagagaactt acaccttcca 4380
ctcacactct cttggaaacc agatgcaatg taaagaagtc agggctatcc tgctagagac 4440
atatgtccca gctaatagcc acaatcaacc tctgaacata tgaatgaggc tagctaggcc 4500
atacagccat tcggtcaagc catcagatga ctacatccac aggaatgatc cacaggcaag 4560
gccatcagaa gaaccatcca gctgaactta ccccaaattg ctgagtcaca aagttgtgtg 4620
taaataaatg tctgctatct taagccagtg agttttggag tggtatatta catagcatca 4680
gaaatctaac acaatcatta tgtttgaatc atttttcaaa tttctcatat ttattaaatg 4740
agtaccataa gcaaggtgtc aggctggatg caaaaagtga ggcaaaatgt ataaagtgtg 4800
accactgcct tcagtaagtt tacaatctat atcaagaggt gatgaagtgt ttaaataatc 4860
atcctgcagg gcaatatagt ataagagcca cagagtaaca caaccatatt gtcataacaa 4920
ctgaaaaaca agatcatttc tgctggaggt gataatggaa taatttatca agaatataac 4980
agagctggac gcggtggctc acacctgtaa tcccagcact ttgggaggcc aaggaaggtg 5040
gatcacaagg tcaggagttc gagaccatcc tggctaacac gatgaacccg tctctactaa 5100
aaatacaaga aattagccgg gcgtggtggc acgcgtctgt agtcgcagct actcaggagg
5160
ctgaggcagg agaaccactt gaacatggga agcagaggtt gcattgagct gagatcgtgc 5220
catggcactc cagcctgggt gacagagtga gactcagtct caaaaaaaaa aaaaaaaaaa 5280

cA 02348657 2001-11-07
6/66
aaaatataac attagaggta agtcttgaag gactttgaca gtggaagtag gaggcgaggc
5340
cattctaagt gaatgaaaaa tgacaggaga gtaattgtag tcctggaaaa gagcaaagta 5400
ggtacagacc aacagtctat attagctaga gtatagtgaa agtgcagagg aaatgtcgga 5460
gaaccattct ttattcaaaa actatcttcc tcatggccaa gcatagtggc tcatgcctgt 5520
aatcccagca ttttgggagg tcaaggtgag tggatcactt gagctcagga attcaagacc 5580
atctggggca acatagtgag acctcatctc aactaaaaaa caaaaaattc agacagatgc 5640
agtggctcac acctgtaatc ccagaacttt ggtaggctga ggcgggcgga tcacgaggtc 5700
aggagatcaa gaccctcctg gacaacatgg agaaacccca tctctattaa aaatacaaaa 5760
ttagctgggc atggtggcac atccctgtaa tcccagctac tcgggaggct gaggcaggag 5820
aatcgcttga accagggagt cggaggttgc agtgagccga gatcgcacca ctgcactcca 5880
gtctggcgac agagcgagac tccatcttaa aaaataaata aattttaaaa aaaactaccc 5940
cagcatggtg gtgcatgcct gtagtcccag ttactcagga ggctgaggca agagggtggt
6000
ttgagccagg gaggtcaagg ctgcagtgag ctctgatggc gccactgtac tccagcttgg 6060
gtgacagagt gagaccttgt ctcaaaaaca aaaacaaaaa caaaaaacca acaaatctcc 6120
ttgttagtat catggtgagt aaaaaataaa ataaaaatag aaataaactg aacatggtgg 6180
ctcatgcctg taatcctagc actttggaag gctgaagtgg gaggattgct tgagggctgg
6240
agttcaaaac tggcttgggc aacacggtga gagagacctt gtctctacaa aagaactttt
6300
aaaacaaaaa atagataatt taaaaaaatt aaaaaaaaca aaaaataaaa aaataatcaa 6360
gtatcaactt gattccaggc actgcttact actctagtgt tatactgtag atgtggaagc 6420
tgagtaactc atccaagatc accgaaagtg atggaacaca gatctaaatg caaccagtct 6480
gactccagga ccatttaacc attctactat tgggccctat cttggctaag ttagaaagta 6540
agttactttc tttagtggta aagactggag ggataacagg gaagatagtt atttaagaaa
6600
aaaaactggc atcaaactaa atatccatca atagttgaac agtaaaatag gttgtggtaa 6660
attcatataa tggaatacta tatagcagtg aaaatgtacc acagttatag aaatcaacag 6720
ggaggaattt caacacttaa ttattaagta ggtagccagg catagcggtt tatgcctgta
6780
atcccagcac tttgggagac caagacagga ggattacttg agcccagggg ttcgagatca
6840
acctgggcaa cagtgagact ccatctctat tttcttaaaa taaaataaat gaaattttaa 6900
aaattttgag gagggaaagc aaacaaggga tacttgaaat atgattacat ttccataaag 6960
tcaaagtgag gcaaaatcat acaagacatt gtttagaaat acataaatac actgcaaact
7020
aaaaatgaga cactagaatg attaatataa aattcaggat agtggcttcc tctagaggaa 7080
gagacaagac attgagatta gggaggagct cacagagtgc ttcgaggagt tggttacatt
7140
catttttctt aaatggaatg ctgcttatta tttttcttta aattgtgcat ttaagtaaca 7200
cacttcttgt ttatatgata tatgtataaa tgtaattttt ttttttgaga tggagtttcg 7260
ctcttgttgc ccaggctgga gtgcaatggc actatcttgg ctcactgcaa cctccacttc
7320
ctgggttcaa gtgattctcc tgcctcagcc tcccgagtag ctgggattac aggcatgcgc
7380
caccatgccc ggctagtttt gtatttttaa tagagaaagg gtttctccat gttggtcagg 7440
ctggtctcga actcccgacc tcaggtgatc cgcctgcctt ggcctcccaa agtgttggga 7500
ttacaggtgt gagccaccgt gccaggccct gaatcagatt taaaagaggg catttcatta 7560
aaaaaaattt tttgttgttt gcttttgaga cagagtctcg ctctgtcgcc caggctgcag 7620
tgcattggca tgatcttggc tcaccgcggc ctcagcctcc caggttcaag tgattctcct 7680
gcctcagcct cgcactagtt gagattacag gaatgcacca ccaccacagg aatgcacctg
7740
tctaactttt gtatttttag tatagaggga gttttgccat gttagccagg ctgctcttga 7800
actcctgacc tccggtgatc tgctcgcctc ggctcccaaa gttctgggat tacaggcgtg 7860
agccaccaca cccggccgaa agagggcatt tcagaatgag ggtctagcat aagcacagag 7920
aagggggagc aataagaggg aaacagggag taggtcattt ttgcaatagc ctgtgacatt
7980
tgtagggcag tactggcggg gaataattaa gtaaaattgg ctggtgctgt ggctcatgcc
8040
tgtaatccca gcactttggg aggccgaggc gggcaggttg cttgagccca ggaattcaag 8100
accaacctgg gaaacatagc aagaccctgt ctcaacaaaa aagtaaaaaa attagctggg 8160
ggcgcgatgg ggtggctcat gcctgtaatc ccaacacttt ggaaggctga ggcaggcgga 8220
ttgcttgagc ccaggagttg gagaccagcc tgggcaacat ggtgaaaccc tggctctata
8280
aagaatacaa aaattagtcg ggcccagtgg cgtgtgcctg tgatcccagc tactcgggag 8340
gctgaggtgg aaggatcacc tgagccaggg aggtggaggt tgcagtgagt catgttgttt
8400
gcgccactgc actccagcct gggcaatgga gtgaaaccct gtccaaaaaa taaaaaaata
8460
aagctgtggc agaatgtgga gattcttgga agctggaagc tctcatgggg catttggaaa 8520
cctcacattg taaataacgg agtcttttta tcagtttggc ttccttagtt ttaggaaaca 8580
agaaataatt atggctaact caagtaaaaa gagaaagaga agagaaaaaa gacgtggaga
8640

cA 02348657 2001-11-07
7/66
tagagagaga gggagagaga ggaaaagacg aaaggaagga agggggaaag gagagaggaa
8700
gagagaaaca gagaaacaga ctgattagtg tattggatag attacataac caagtgacca
8760
gtcaggaacc cagcagctct gggggagctc aatgtgatgc attgataaac ccgctcttaa 8820
gagcactcgt ttccagttac tttctattcg gtgggtctcc agccaagatt ccaggtccca
8880
ggagaatctg actgacctag tgtttgcttc cgcctttgcg gtctgggttc tgtgcttgca 8940
gctcattaga atacagggag cagagacaag caggtagttt cccaaaggaa gggatgctga 9000
gtagattaaa aaaaaagtgt agattcttca gtaaactatg ggatggtaac tatgcaaaac
9060
ctaagatttc ccttattcaa ataaattatc tttcatatta gacatctaaa tatgcactaa 9120
tttagttaaa cccctgggtt agttgatctc atcacactga gctaacattt ttgttgctgt
9180
tgtttgcagt gacctgaagt ttcttatctt cacaattgct ttcctctcaa ataattccca 9240
gattttaaat ttttatttta ttttttctgg agacggagtc tcgctctgtc gcccaggctg 9300
gagtgcagtg gcgcgatctc agctcacttg cagcctctgc ctcccgagtt caagcgattc
9360
tccggcctta gccttccaac cagctgggac tacaggcgcg cgcccccacg cccggctaat
9420
ttaattccca gattgatatc cattgcttct gagatgggcc aattatcctt cggagaagac
9480
ttaggtcgcc tggcagaaaa agatgaaaga aatctaagaa aacgacgaca ctgagagagg 9540
agcctagcga accagcagag cgaccccaag ccgcaattcc cccttccgtg gatcgattac
9600
gaaggcttcc tggcaggagc tctccagggc tgccgacgtg agccgaactg cacattggga 9660
actgtagttg agtgggaaag ccgagaggcg ggggccgcac acgcgtacag gggccccggt
9720
caacaaagac gcgccgtgcg cgcgcgcgcc ggagaaaaac acgggaagac gtgcgcgtgc 9780
gcggccgccg ctgggagcca ccaggcggcg gagaggacag cgacaggaag ggaggggccc
9840
gagccaccga ctgcaggagg agaaggggtt gtgctcctgg ccgaggaagg agaaaggggc
9900
ggggccggcg ggcagcgtgc ggcagtgcgg agctcctgag accggcgggc acacgggggt
9960
ctgtggcccc cgccgtagca gtggctgccg ccgtcgcttg gttcccgtcg gtctgcggga 10020
ggcgggttat ggcggcggcg gcagtgagag ctgtgaatga attctccggg tggacgaggg 10080
aagaagaaag gctccggcgg cgccagcaac ccggtgcctc ccaggcctcc gcccccttgc 10140
ctggcccccg cccctcccgc cgccgggccg gcccctccgc ccgagtcgcc gcataagcgg 10200
aacctgtact atttctccta cccgctgttt gtaggcttcg cgctgctgcg tttggtcgcc 10260
ttccacctgg ggctcctctt cgtgtggctc tgccagcgct tctcccgcgc cctcatggca 10320
gccaagagga gctccggggc cgcgccagca cctgcctcgg cctcggcccc ggcgccggtg 10380
ccgggcggcg aggccgagcg cgtccgagtc ttccacaaac aggccttcga gtacatctcc 10440
attgccctgc gcatcgatga ggatgagaaa ggtaactagg gggctggggg agggggcggc 10500
ggcgccggga agaaggcggt ggggtcgccg ggggagggca acacctgcgt cccttttctg 10560
cgggagggga cggtgcaccc ccggaattga tatgccccgg gagactgctt tcccgtaggt 10620
cggagcctca tcttctagta ttcttaaaac ctctcccctt tcagggcact gtagctgtcg 10680
actttgtttc agacaccagc cttcccccac acttctgcat gacccaggtc actatgagac 10740
acccagacgt gttgatgaca gtgacatttg tcctagagtg accacactga tcctttctag 10800
cactgtgaag agtgtgcagc ttcctctgaa ccaaggtttc caaaaggttt tgatattgaa 10860
gaagcagtgc cgccttactg gcttttaatg aaagcagagt attgtagtgt cagaaaaaaa 10920
gaacaaatgg tgacaatttt gaaagaaata gctgcatatg actgcagttg aatttgcatc 10980
attttaatca agataatcat tttatcagta caacgattcc tgaatacttt ttcaatgaag 11040
ttatatttag cataaaactt ttccccctgt tgctttgatt ttaattaaaa cagtattcca 11100
aagtagcctt taatttccaa gttgaaatgt ttgatgaatg gattgcgtaa acttaaacat 11160
accactttac agtaaaacct aaaacaacta tgtatgtttc tgaatgaaag caaggatact 11220
acatctttcg ggtttctttt aagctaactt tttttttttt ttgagacgga atctcgccct 11280
gtcgcccaag ctggagtgca atggtgcagt ctcggctcac tgcaacctcc gactccctgg 11340
ttccagcgat tctcctgcct cagcctcccg agtagctggg attacaggca cgcaccacca 11400
cgcctggcta atttttgtat ttttagtaga gtagggattt caccatgttg gccaggatgg 11460
tctccatctc ctgacctcgt gatcgggtcg cctcggcctc ccaaagtgct ggtaatacag 11520
gcatgagcca ccgcgcctgg ccttaagcta acatttttta ttatatgtgc caggcattgt 11580
gctattagct ttgcatgtgt tatctttttt ctttttaaaa aaaatagcaa ccatcccaga 11640
ccatgaaaag tgttatttaa tcctcacaat aactttgtga gatgaaggta ttattggtat 11700
cagcatttta gagatgaaga aaatgaggcc caaaagataa aggaggttat tccaaacctg 11760
tgctaataat gaaatttctt ttatggaaaa taagtgaaat taggagaagt ctaactttta 11820
caattctccc cttttatcct tacttccagt atgctgagat cttgcttctc cctctgccaa 11880
aaacacccac ttttctacca cacctcaatt agatactcac ttgcattgtc cattagtgaa 11940
aacagaaaca atctgcactt cattcatagt gtctgtctct actgccaact ccaaaaactg 12000

cA 02348657 2001-11-07
8/66
ttctagaatt tcaatcttgt tgaaacctgt ttcctttgtg gggcctggga gtgggaagtg 12060
ggatataagg aaagaggcag ttattcattg ttttggacag taaggaaaga gtgacggtta 12120
agagaggtca aggagggtgt taacatttaa gaatactatg tgtttgtaga aggaaatttt 12180
ttgttaactg ctccattctt tttttttttt ttttttgaga tggagtctcc ctgtgtcacc 12240
cagactggag tgcagtggcg tgatctcagc ttactgcaac ctctgcctcc cagacgcagg 12300
cgattctctt gcctcagtct cccgagtagc tggaaccaca ggtgcgccct atcacggctg 12360
gctaattttt tgtattttta gtagagatgg tgtttcacca tgttggccag actggtcacg 12420
aactcctgac ctcaggtgat tcgcctgcct cgaccttcca agtgcttgga ttacaggtgt 12480
cagccactgt gcccacccag caagctccat tctttatcac ctcttaagaa catccaggat 12540
cccttgggga gaattaaaac ggttgcaaag ttttagaata gaggaacatg tttaagcgta 12600
gatcattttt tgggccagtc atggtggctc acgcgtgtaa tcccaacact ttgggaggcc 12660
ggggcgggtg gatcatgagg tcaagagttt gagaccatcc tggccaacat ggtgaaatcc 12720
catctctact aaaaatacaa aaattagctg ggcatggtga cacatgcctg tagtcccagc 12780
tactcaggag gctgaggcaa gagaagtgct tgaacctgga aggtggaggt tgcagtgagc 12840
cgagatcgtg ccactacact ccagcctggg cggcagagca agactccgtc ttgaaaaaaa 12900
aaagtaggtc atttttggct gggcacggtg gctcatgcct gtaattccag cactttggga 12960
ggctgaggtg ggtggattgc ttgagcccag gagtttgaga ccagcctggg caacatagtg 13020
aaaccctgtc tttgtgaaaa atacaaagat tagctaggcg cagtggcaaa tgcctgtagt 13080
cccagctact tggggggctg aggtaggagg atcacttgag ctcaggttgt tcaggctgca 13140
atgagctgag atcgtgcaac tgcactccga actgggtgac aggagtaaaa ctgtctcaaa 13200
aaaaaaaaaa aaaaaaacca aaaaaaaaaa aactgtttta attgttttat ttaggaagag 13260
aaagtcagaa catgcaagga aatttttttt atttgtttat ttttgagacg gagtctcgct 13320
cagttgccca ggctggagtg caatggtatg atcttggctc actgcaacct ctgcctcccg 13380
gattcaagcg attctcctgc ctcagcctcc tgagcagctg ggattacagg tgtatgccac 13440
cacgcccagc taatttttgt gtttttagta gagatggggt tccaccatgt tggccaggct 13500
ggtttcgagc tcctgacctc aagtgaaccg ccctccttgg cctcccaaag tgctgggatt 13560
acaggtgtga gccgcggtga ccgaccacaa ggaaatttta gttaacactg ttggttgatg 13620
ggagttggga ggtaggataa aaggagaaat taaggaaaac ctaggcatga aaaataaaag 13680
accctgagct cttagatttg aagaaatagc agttccatgt gaggaataag tggaagaaat 13740
agaattcaga cctcaggtct caggctggtg acttaaatct ttcagtatca catatatgaa 13800
tatatctatt atacttaaat cctcctaaac atttttattt ttcagttgga tatattaaat 13860
atataaaaat aattatttaa tttattttag agacagtgtt tcactctctt acccaagctg 13920
gagtggaatg tgatcatagc tcactgcagc ctcaaggctc attcctaggc ttaagtgatc 13980
ctcttttttt tttttttgct agagatagga tcttgttatg ttagccaggc tggagaaatt 14040
tcaacaatat tttgaacaat aaaaaaaaaa taaattaggt tttattgtaa agtggtatgt 14100
ttaagtttac gccattctcc tgcgtaatgc atatttcata ctcttcctac tgataatgtt 14160
tctgttcaca actttttctt tatattttga tttcttttct cttttctttt tttttttttt 14220
tgagacagag cctcgctttg tcgcccaggc tagagtgcag tggcgcgatc tcggctcact 14280
gctagctccg cctcccgggt tcacgccatt ctcctgcctc agcttcccga gtagctggga 14340
ctacaggcgc ccgccaccat gcccagctaa ttttttgtat ttttagtaga gacggggttt 14400
cactgtgtta gccaggatgg tctcgatctc ctgacctcgt gatccacccg cctcggcctc 14460
ccaaagtgct gggattacag gcgtgagcca ccgcgcccgg cacatatttt gatttctaat 14520
gtggacatca gaatgggctg ttgacagctc tttttttttt ttttgaggca gagtctcgct 14580
tcttcaccca ggctggagtg caatggcgcg atctcagctc actgcaacct ccacctccca 14640
ggttcaagcg attctcctgc ctcagcctcc ccagtaactg ggattacagg catgtgccac 14700
cccacaccca gccaattttt gtatttttag tagagacagc atttcaccat gttggccagg 14760
ctgttctcga actcctggcc tcaagtgatc cactcgcctt ggcctcacaa actgctagga 14820
ttacaggtgt gagccaccgt gcccagcctt gacaggtctt tagtttgatt ttagttcaac 14880
aactgatgcc gtaatatgcc aaattaaatt agttcagact gaaacggatt acttaaagat 14940
tcattttcct ttaaaaatga agtaaaactt tagccggatg tggtggcggg tgtgtgtaat 15000
cccagctact cgggagggtg aggcaggaga atcgcttgaa cccaggaggt ggaggttgca 15060
gtgagctgag atctcaccca ttgcactcct gcctgggtga gaagagtgag actccatcaa 15120
aaaaaaaaaa aaaggctggg catggtggct caagccgggt gcagtggccc atgcctgtta 15180
tcccagcact ttgggaggca gaggcaggcg gatcacttgt agtcagaagt tcgcgaccag 15240
cctggccaac atattagtga aaccccgtct ctactaaaaa tacaaaaatt agctgggcat 15300
agtggtgcac gcctgtagtc ccgggtactt gggacgctga cgcaggacaa ttgcttgaac 15360

cA 02348657 2001-11-07
9/66
tccagaggtg gagattgcgg tgggccaaga tcacgccact gcacgccagc ctgggcaaca 15420
gagcaagact ccatctctca aaaaaaaaaa aaaaagaaaa ctgagtttat attgttatgg 15480
ttcttatcta tcttaaattt tttctttagg agattgaata tttttgtact ttagtcttaa 15540
tccagtggtt gaaagagagt gcacttttga agtctgcctc ttggctgtcc ttgacaacac 15600
aaaccttagt tccaagagaa tgtaattctt cctctttctc agtgcttcaa aatatatatg 15660
atcaaataga aacgagttga ataggcagtc tcttcaaagg tttcctaact ctgtggttaa 15720
ctatcaagga gctggtaata tcatgcactg ccattccctt ggcaacatga cttatctttt 15780
tttttttttt ttcttttttg agacagagtc ttgctctgtc acccaggctg gagtgcagtg 15840
gcgagatctc agctcgctgc aagccccgcc tcccacgttc acgccatttt cctgcctcag 15900
cctcccaagt agctgggact acaggcgcct gccatcacac ctggctaatt ttttttgtat 15960
tttttagtag agacggggtt tcaccgtgtt agccagtacg gtctcgatct cctgtcctcg 16020
tgatccgccc accttggcct cccaaagtgt tgggattaca ggtgtgagcc actgcgcctg 16080
gcctacttat cttctaattt aactgaaaac caatttattt gattcagtga aatggcatca 16140
aactgtagta gtgttaattg aaatatttgg taccttgaaa tgttaaatgc caaattaaat 16200
ctcattttaa tgaaatctcg tgtaaatgtg ttttatatgg tgactatgtt tattctgaat 16260
tttattctta tggcatacta aaaaaaaaaa aaattttttt ttttttttgt aatggagtct 16320
tgctctgtca cccacgctgg agtgcagtgg cgcaatctcg gttcactgta acctccacct 16380
cccgggttca agcgattctc ctgcctcagt ctcccgagta gctggtacta caggcgtgca 16440
ccactatgcc tggctaatat ttttgtattt ttaggagaga cagggtttca ccatgttggt 16500
caggctgatc tcgaactcct gacctgaagt gatccgcctg cctcagcctc ccaaagtgct 16560
gggattacag gtatgaccca ctgcacccaa cccatactca aatttgacac tgaattttca 16620
taaaggcctt aatttatctg aaaccaaact atttcaaaag aggaatagca cagcaaattc 16680
tgttgactta atgagaggat atgtgaagtc tatttattaa agcaaatatt aattggaggc 16740
cagttaattt gtacagctct gcattttaga tatttgagaa atatttattt cctctccagt 16800
gagatgtgtt aaaacattag ttatgtgatt aacaaatatg tgtacatacg tatatatgta 16860
catacacatt ttgagacagg gccttggtct gttgttcagg ctggagtgca atgacaccat 16920
cttagctcat tgaagcttca gcctcgcagg ctcaatcgat ccacccacct cagcctccct 16980
agtagctggg tctacagaca tataccacca tgcttggctg attttttaat tttttgtaga 17040
gatggtgatc ttgccctgtt gactaagttg gtaaatattt taattgttga actttcttgg 17100
aagactgaaa acctgtgata gccattttat ataaggagaa gctgaagttc aaagagtaga 17160
ctcatagcag aaacaaaaat agaatttaag tgaatggact caaaatattg tactttttac 17220
tttatactgc aggtttttat gttgtaatgc tggtaatgag ctccttggaa tatttggagg 17280
aaaagagaag gttgtaataa tggttctttg gatttactag aacatatcat gttctgcatg 17340
gctcctgtgg gtagacaagc cggaaatctc ctgggtaaca caatggtgga ggttctctag 17400
gtgacgtttg atttctcaag tacataggac taaacagaaa aggcctagta tgttatatga 17460
atgagagatc aagtttctca ggatattcta gggctaaagg atcaggcatc gaagacagaa 17520
attgtctaaa taaaattttt tctattcata gttttaaagg gctaaagggt caggcattga 17580
agacagaaat tgtctaagta aaatattttt ctgttcatag ttttaagctg tgtatatgtg 17640
catgtgtgta tttaaaataa cttcgtcaat gaaaagagtc aaactctgta aaatatttga 17700
agagatttat tctgagccaa atatgagtga ccagtggccc atgacacagc cccagtagat 17760
actaagaaca tctgtccaag gtggtcaggc tatagcttga ttttatacac tttagggaga 17820
cataagacgt cagttaaaca tgtaagatgt acattggttc catctggaaa ggcaggaaaa 17880
ctagaagttg gggaggcttc caggtcgtag gcagattcaa agattttctg attggcaatt 17940
ggtcaaaaga gcttatctaa agtcctggaa tccatagaag ggagtgtctg gtttaaaata 18000
ataggttgta gctaccaagg tttttattgt acagatgaag cctccaggta gcaggcttca 18060
gagagaatac attgtaaatg tttcttatga gactttaaaa ggtggcagac tcttaagtta 18120
attttctcct ggttcaggta aaagacttgg aaagggaaag gattctctac agaacgtaaa 18180
ttttccccac aagagaaagc tttgcagggc catttcagaa tatgtcaaag aaatataatt 18240
tagggtaaaa tacttcaatt tgttttattt atttatttat tttttgagac agagtctcgc 18300
tctgttgccc aggctggagt gcagtggcat gatctcggct cactgcaagc tccgcctcct 18360
gtgttcacgc cgttctcctg cctcagcctc ctgagtagct gggactacag gcgctggcca 18420
ccatgcccag ctattttttt tgtattttta gtagagacgg gatttcacca tgttggccag 18480
gatggtctcg atctcttgac ctcgtgattc acccgcctcg gcctcccaaa gtgctgggat 18540
tacaggcgtg agccactgtg cccggcctca aaatacttca atttctttca tggcctgcta 18600
tctgacgtga tgctgtacta gagtcaggct gggaatttgg cgtcttattg ctacaaaaca 18660
tcttaatatc tctgttttaa tgttaatgct gatcagttgt ccctgaattc caaagggaag 18720
_

cA 02348657 2001-11-07
10/66
agggtatatg agtcatgtcc aacccccact tctcattatg gcctgaacta gttttttagg 18780
ttaactttgg aatgcctttg gcaaggggag ggtccatgag tcagttgggg gtcttagagt 18840
tttatttttt gcttaccggt ttataaaaag ttaatgaaaa ttatcatatt tcataattct 18900
atataattca atattgtact ttatttaaaa ctcacgtata aaatagctgt ccatatctgt 18960
tttcagaaga tgaggatgga gggtagaaat cagaagtgtc agatttggta attttcttac 19020
actgctgaaa acctatacct accactttga aaggattaat ttcagacttg ctttctttgg 19080
gcctaatgat tctactttga agtttctctg attaaactaa ggaataaatc tgataaatgg 19140
acattcagat gataccatac ttttccaaaa gataacattg cttttgatta catatgcaat 19200
aaacatttca cattttttct caagattatt tactggcatc tgcaccaaag acacaaaaaa 19260
gcagccactg ttaaggactt tatcccttgt tctgttttta gctggtttgt tgttgtattt 19320
ttcctcatgt tgaatacagt taaaccctat taaactggat tccccatatt actgttagtt 19380
gtcctgatga caattaagga tagttagtaa atggatattg aatcatttta tttttttagt 19440
agtgatggcg tttcgctgtg ttggccaggt tggtctcgaa ctcctggcct caagtgatct 19500
gcctgtgttg gcccctcaaa gtgttaggat tacaggcgtg agccactgca cctggctgga 19560
tattgaatta ttgaagaagg atgttcccta acacttcctg cctcttttcc gctgtcttac 19620
tctctctgtt ccacccagta gtagttgggt ttttgatgtc tggcaaagta tagattgtct 19680
actcttctat attagttttc ttcactcttt tttttaaaaa tgtttttaaa gcaagataga 19740
gacagggtct tgccgtattg cccaggctgg tcttgaactc ctgagctcaa gcaatcctcc 19800
cacctcaccc cataaagtgc ggagattaca ggcatgagcc accatgcctg gccagttttc 19860
ttcactcttg acctataata gtcctgcaaa gccagtgaag ctgttaatat gctgacgtag 19920
cctttttttc tctcgtttgt gaattattaa caatccictga tcttacacat catatacaat 19980
aaaacatctt tgaacactgt cacatctcag cagctcattc tggttaatga ggaaagaaaa 20040
atgtcaaaat ctgtgatttt cttagaggtt attaaatgtt ttacagctat gtagatattc 20100
tgtagacttg ctgtacttac ttacataact tttctgctct tctgcagagg gagagaatta 20160
acttcataag tgggctttgt caatgccctc cagtcagcga tctccaggaa caaacttatc 20220
tatggttgag caagtggggt ttattaccca ctgtagccag ggagaacaca catatgtaat 20280
aaccatggta tgtcatagta aagggtgtta ggaagatagg atttgggctc gtttatttgg 20340
tgattttaag gagggtttaa agaagcaggg ttttgctctg atttggatgc taccaggagc 20400
tgcgaataat tctatgaata aatatcataa aacctatcta gaagaaaaga ctagagtgag 20460
gtctaaagct gtagtagtta aaaagcaaag gtcactcctt atctggaaaa ggggaatatt 20520
tggtatttca tggtttagac agtgttcagt gttcatgttt tgcctgtgtt tagacataat 20580
tgtagagtgg tcttgttcca ccgtggtcac agagtggcat tatttcatgc tgatattctg 20640
taagtgccag gtcaaatacc aaggtttagc tgatagtagt aggccagctc ctggatgtaa 20700
taagctgttt ttctctttct cagctttttt ttttgttgtt ttttttttaa aatagagtct 20760
ggctctgtca cccaggctgg agttcagtgg gggcaatctc agctcactgc agcctctgcc 20820
tcctggattc aagcgactct cctgcctcag cctcccaact agctggaatt acaggcgcaa 20880
gtcaccacac ccggctaatt tttgtatttt tagtagagac ggggtttcac catgttgagc 20940
aggctggtct cgaactccgg acctcaagca atccatctgc ctcagcctcc caaagtgctg 21000
agattacagg catgagtcac tgcacctggc ctgtttctta gatttgaggg tcaactttta 21060
cccttttcga actgtggggc ttcttatgga aattgacatt taagtcctga ccatatagga 21120
tcttgggcaa gttacttaac tatgtatgct gagatgtttt tttaaatgct tagtgcttgc 21180
acataatagg tactcagtaa atgagaacta ttattataaa atcaatagta cttttaagat 21240
tacagctaga ggttatgtta gaacattgtt aactcttcgt actagtttct gttacacttt 21300
ttaggatgca gtagcagcat aaacgagata tggggaagaa cgagaggtat ttaaacagtg 21360
atataggccg ggcgtggtgg ctcacgcttg taatcccagc actttgggag gctgaggtgg 21420
gcagattacg aggtcaggag attgagacca tcctggctaa cacggtgaaa ccccatctct 21480
actaaaaata caaaaacaaa attagccggg cgtggtagtg ggcgcctgta atcccagcta 21540
tttgggaggc tgaggcagga gagtggcgag aacccaggag acagagcttg cagtgagccg 21600
agatcgcgcc actgcacccc agcctgggcc acagagcgag actctgtctc aaaaaaaaaa 21660
aaaaaaaaaa attaaaacaa aaatatttgt gttaattgtg atgacaaaaa aaaaaaaaga 21720
gatggaagtc tctccctaac ctcactcctc atttagtgtc atggcttttt tctttttttt 21780
tttttttttt ttgagacaaa gcctcactct gtcacccagg ctggactgca gtggtgcaat 21840
ctcagctcac tgcaggctct gcctcccaga ttcaagcaat tctcctgcct cagcctcaca 21900
agtagatggg actacaggca catggcacca tgcccagcta attttttgtg tagtttttag 21960
tagagacagg gtttcactat gttggccagg ctggtctcga actcctgagc tcaagtgatc 22020
ccccctcctt ggcctcccaa agtgctggga ttacaggcgt gagccctgct cccagactcc 22080

cA 02348657 2001-11-07
11/66
tggctttttt tttttttttt aatgaaaaat tcaaaatgct cttttttttt tttttttttt 22140
tttgagacag agtctcgctc tgtcgcccag gctgaagtgc agtggtgtga tctcggctca 22200
ctgcaacctc tgcctcccag gttgaagtga ttctcctgcc tcagcctctc gaacagctga 22260
gattacaggt acgcgccacc acgcctggct aatttttgta tttttaatag agatggggtt 22320
ttgtcatgtt gtccaggcta gccttgaact cctcgcctcg tgtgatccac ctgccttggc 22380
ctcccaaagt gctaggatta taggcgtgag tcgctgcacc tggccacaga aattttttga 22440
agaagataaa taaggtgaca tttttaaggg tcaaagaaaa tgtcaaaaac tagaatgatg 22500
tctttacata gggtttaaaa ctttccaaat taacagggaa aataattctt taccttgaaa 22560
ataaatgttt gctagtgaaa gcaaatacaa tctttttact aaatgtttta ttaaattttt 22620
ttttcttgta gacacagggt cctactgtat tacccaggct ggtcttgaat gcctggcctc 22680
aagcaatcct cctacctcag tcttccaaag tgctgggact acagacatga gccatcacac 22740
tgggtctttt ttaccaaatt atagtagaaa gcactttttc tctaatggtg aactatgaga 22800
gaattaatca ggggctatta gtaattcatc cctgaattaa tcagtgatta taatgctttg 22860
tggtccatgt agtttgctgg ggattaacac accatgaaag tctaccagga gatttttttt 22920
tttctttgag aacaggggcc ataatcagta gtccttaaat gaaatggact attcccattt 22980
cattatatgt tgcctaggct ggactcgagc tccttggctt aagtgatctt cccacttcag 23040
actctcaagc agctgggact ataggtgtgt gccaccatac ctggcttaat tgagtgtttg 23100
ttttttgttt ttttttctga gacagagtct cgttgtgtcg cccaggctag agtgcagtgg 23160
cacaatctcg gctcactgca acctctgttt cccaggttca aacgattctc ctgcctcagc 23220
ctcccaagta gctgggatta caggcgcctg ccaccatgcc tggctaattt ttgtattttt 23280
agtagagatg gggtttcacc atcttggcca ggctgatctc gaactcttga cctcatgatc 23340
cacacacctt ggcctcccaa agtgctggga ttataggcgt gagccaccgc gcccggcttt 23400
aattgagatt tttagatatc tattactctg ctaattttgt cacttgcaag ttgccatcag 23460
aaaattgtag gaaaatggat atatttgttc cttggaatgg tttgtgtgag aatacttaag 23520
gattaaatag ataagtaaaa ctggtgggct ttatataaca tagatgagca aatgtcagga 23580
acatacaact gtgcacacag ttcaggagaa ggaggattta agttaatcaa caaatttact 23640
aagtataata aagatactaa aagtagtgtt tccataccac tttattactt aaagtatcat 23700
catataccct attttatatg atttttgcca caagtcagag ttaggtaaaa gaaatacttg 23760
cttttcaggt aaggagtttg acgcccagac agattaactg acttttccaa aatcatattg 23820
ctattaaatg gtggaacaag gacttaaatc tttgccttct aactcacata cttgcaaaca 23880
catatcctct cactctaccc caagctaccc atgttttgac ccttcttgtg gcaatctggg 23940
tctcactaat atttgaaaga aaacgtacag tagataattt gcaagttaat ctgttacgca 24000
tatctcttac ctctatttaa agatgaatat cagcatttct gttgtttcta cagtaacata 24060
ctaaaaaata atgcagtcca ggtgcagtgg ctcacacgtg taatcctagc acttttggaa 24120
gttgaggcag gaggatcact tgaagccagg agttcgagac tagcctgggt atgcaagacc 24180
ccatttctgt tttttttttt tgtttgtttt gttttgtttt gttttgtttt tttgagacgg 24240
agtctcgctc tgtcgcccag gctggagtgc agtggcggga tctcggctca ctgcaagctc 24300
cgcctcccgg gttcacgcca ttctcctgcc tcagcctccc aagtagctgg gactacaggc 24360
gcccgccact acgcccggct aattttttgt atttttagta gagacggggt ttcaccgttt 24420
tagccgggat ggtctcgatc tcctgacctc gtgatcccca tttctttttc actgcaacct 24480
ttgcctccca ggttcaagtg attgtcgtgc ctcagcctcc caagtagctt gggattacag 24540
gcatgtgcca ccatgcctgg ctaatttttg tattttttgg tagagatgga gtttctggcc 24600
aagctggcca ggctggtctc gaacgcctag cctcaagtga tctaccctcc ttagcctccc 24660
aaagtgctgg gattacaggt gtgagccact gtgcccggcc ccatttctac aacaattaaa 24720
aaatattagc ccagtgtagt ggtgcatgtc tctagtccca gctactcaga aggctgaagt 24780
gaaaggattg cttgagccca gaatttcaag gctacagtga gctatgataa tggcattgca 24840
ctccagcttg ggtgacagag tgagaccctg tctctaaaaa atgaagtaaa atagtgcaca 24900
agtatagaac ttgaaaatct tccttaacct taccataagg gaaatgatta ctaataagtt 24960
tcttaacttt ttgtacttac ataaacataa atattcatca gagaaaaaaa tatgcaaaac 25020
aatttgcaat ctttttcact taccatattt tggaattttt ttcatttcaa tatatttgat 25080
cttccttgtg ttttttcagt ttgtttgttt ttgtcaccca ggttggagtg aagtggtaag 25140
aacatggctt attgcagcct caatctcctg ctcccattca gcccctcaag tagctgggac 25200
tacaggtaca tgtcaccacg cccggctaat ttttattttt attttggtag agatggggtt 25260
tcaccatgtt gcccaggctg atcttgaatt cctgggctca agtgacccgc ccacctcagc 25320
ctcccgaagt gttgagagaa caggtgtgaa ccaccatgct ccacctctta gtctttacaa 25380
tctgcaaaac ctcataagtg gctaatagag gaatatagta aagcaaaggg ggatatcact 25440

cA 02348657 2001-11-07
12/66
gattagaact gtgtttttag gctgggtgcg gtggctcacg cctgtaatcg caacattttg 25500
ggaggctaag tgggagtatc acttgagccc gggagttcaa gaccagcctg ggcaatatag 25560
tgagagaccc tgtctttaga aaaaaattaa ccaggtgtgg tggtgcacac ctgtggtccc 25620
agctattcaa gaggctgagg tgggagaatc gcttaagcct aggaggcgga ggttgcagtg 25680
agatcatacc actgctctct agcatgggtg acagagcgag acccagtcta aaaaaaaaag 25740
tattttttcg tttttttcca actcatgtac acccgccacc ccacccctgc tttttttttt 25800
tctgacattg ggtcttgctc tgtcacccag gctagagtgc agtagcacaa tcaactcact 25860
gcagcctcct cttcctggac tcaagcagtc ctaccacctc agcctcccaa gtagctggga 25920
ccacaggtgt gcaccatcat gcctggctaa tttttgtact ttttgtagag atagggtttc 25980
accatgtggt tcaccatctc taactcctgg gctcagtcag tccacttttg cctcggcatg 26040
agccactgtg tgcagcccac gttttttatt aatggatatt tggattgttt ccatctattg 26100
tgaataatgt ggctatgaac attggtctaa atatctgttt aagtcccggc tttcaatact 26160
tttggatata tacctaggag tagaattact gaattatatg gtaactttct gtttaaattt 26220
ttgaactgcc aacctgtttt ccataggggc tgcaccattt tgcattccca ccagcagtgt 26280
acaagggttc cagtttctcc acatttgtta tttttcattt tttaaaataa tagtcatcct 26340
aaagggtatg aagtggtatc tcgttgtgat tttgatttgc atgtattttt ctaatgactt 26400
atgatgctca gcattttgtc atgtacttat gtaccatttg tgtatcttct ttggaaaaat 26460
gtctattaat gttcttttcc cattttttaa ttgggttgtt tttatgttta tcaattttgt 26520
aaacatttta agctctgcag cataactact caaccctgtc acatggtaag attgacccag 26580
taaaacttta tgtacaaaaa taggcagctt actagattta atcttagtcc atagtttgct 26640
aaggcatgca ttagataatg tagttacact attggctaat aatttaaact acaagtggtt 26700
gtaagtttct gccacccaaa ttctttcttg atttgatgta gtctggttgg ttgaatttga 26760
gtgttatatg gggtcataga gttaaaagag aaatgtctat gagaaactag ggactgttgg 26820
gagctaatgt taaaggattt tggaggcctt ttgtgcactg gagaccattg gaagattgga 26880
ttttctgcta taaatgtatc taaaggataa tcagtgtaag ttatgggctg tagtttgcca 26940
acccctacat taagggattg aaataatttg aatatgggtt tcagttcttg tatggtctgg 27000
ctcagttctt tttttttttt tttttttttt tttttttttg agatggagtc tcactctgtt 27060
gcccaagctg cagtgccatg gcacgatctc agctcgctgc aacctccgcc tcctggcttc 27120
aagtgattct cctgcctcag cctccagagt agctaggact acaggcacgt gccaccacat 27180
ctggctaatt tttttttttt tcaagacaga gtttcgctct tgtcacccag cctggagtgc 27240
aatggcacga tcttggctca ccgcagcctc cgcctcctgg gttcaagtga ttctcctgcc 27300
tcagcctccc aaatagctga ggcaacaggc gtgcgccacc acgcctagct aatttttctg 27360
tttttagtag agatggggtt tcaccatctt ggccaggctg gtctcgaact cctgatctca 27420
tgatccaccc gcctcagcct cccaaagtgc tgggattaca ggcgtgagcc acctcacctg 27480
gcgttttttt gtgtgtgttt tcagtagaga tggggcttca ctgtattagc cagaatggtc 27540
ttgatctcct gacctcgtga ttcacctgcc tcagcctccc aaagtgctgg aattataggc 27600
atgagccacc acgcctggct gtggctcagt tcttaactgt tcattcattc agggtcccag 27660
ccaaaatctt ttgccacagc ttctcctggg catgctctga aattcatttt ttgtctgttt 27720
agttgcatga gtccactgaa agctttgctt attttctcca ccactttcag agttcacagt 27780
cacttcaagt agacgaggtc aggagatcga gaccatcctg gccaacatgg tgaaaccccg 27840
tctctactaa aaatacaaaa cttagctggg cgtggtagcg tgtgcctgta gtcccagcta 27900
ctcaggaggc tgaggcagga aaattgcttg aacccgagag gcagaggttg cagtaagccg 27960
agatcatacc atttcactcc agcctgggcg acagagtgag acactgtcaa aaaaaaaaaa 28020
aaaaaaaaaa aggaaagaaa agtgctccaa atgctgggct catctctgct ggcttctctc 28080
ctttttatat ttcgataatt tttaaaataa taaccatcct aatgggcttg atatggtccc 28140
tcctttctaa attttggtaa ttttcattgt tttggaaact cactaatccc ttcaaacaga 28200
tgtttttaaa actttttttc tagttctctc tctttttttt tttttttttt tttttgagac 28260
agggtctctc tcagtggtgc gacctccctt actgcaacct ctccctcctg ggttcaagca 28320
gcgattctcc tgcctcagcc tcccaaatag ctgggagtac aggcacccac ccccacgccc 28380
agctaatgtt tgtattttta gtagagattg ggtttcatca tgttggccag gctggtctcg 28440
aactcctgac cccaggtgat ccgcctgcct cagccttcca aagtgctggg attacagcca 28500
tgagccaccg cacctggctc tagttctctt ctaatcttac tatagtaatc aaaattttag 28560
tgctgatgtt ataatccaag cccaaatgga tattcttata cattaaatgt tggaatatca 28620
tgtttgttaa aaatcagatc tgctgggcac ggtggctcaa tgcctgttat cccagcactt 28680
tgggaggccg aggcaggtgg atcccctgag atcaggagtt cgagaccagc ctgaccaaca 28740
tggagaaact ccgtctctac taaaaataca aaattagccg ggcgtggtgg cacgtgcctt 28800
_

cA 02348657 2001-11-07
13/66
tcatcccagc tacttgggag gctgaggcag aagaattgct tgaacctgtg aggcggaggt 28860
tccagggagc tgagatcgtg ccattgtact ccagcctggg caacaagagc gaaattccat 28920
ctcaaaaaaa aaaaatcaga tctgtcccta tggttttatc ttcactgcat gtcatatata 28980
aatggaagca tgtagtatgt agccttttgt gtctcgcttc tctccctttg cataatattt 29040
ttgagattta tcccttttcc tacatatgtc agtagtttgt ttctttttaa tgctgaatag 29100
tattccacgt gtggagatac cacaatttgt tactccattc actaaatgat ttgggttgtt 29160
tcctgttttt gttattgttg ttgttgttgt ttaattaatt aattaatttt ttttttgaga 29220
tggagtcttg ctctgttgcc caggctagag tgcagtggcg caatcacagc tcactgcaac 29280
ctctgcctcc ccggttcaag tgattctcct gcctcagcct cccaagtagc tgtgattaca 29340
ggtgcccgcc accacaacca gctaattttt gtatttttag tagagatggg atttcaccat 29400
gttggccagg ctggtcttga actcttccct ccttggtctc ccaaaatgct gggattacag 29460
gtgtgagcca ccatgcccat cctcctgttt ttaaatttta tgaataaagg tactgtaaat 29520
tcatgtacag gtcttagaag tttgcatttt tcttgggtaa atatgtagaa gaagagattg 29580
ttgactcatg tggtaaatat atgtttaatg tcataagaaa ctaccaaact gtttttccaa 29640
ctgggtgcca ttttgtttcc taccagcaaa cataatgaaa ggtccattac cctttgtctc 29700
gtaatatttt ggtattttta tgttcttttg tttttttgcc attcaaaatt gggtgcattg 29760
ttgtatcttt ggattttaat ttgtacttcc ctaacaacta atgatgtgga gcatcttttt 29820
atacgcttac ttgccaatta tgtcttaatt ctttggcaat acttatattt gactctgcct 29880
actatatata tatatatata tatttttatg ctatatatag agtatatata tttttatact 29940
atatatattt atatatacta tatatattta tatatactat atatatatat atatatatat 30000
atattttttt ttttttttga gatgaagtca tgctctgttg accaggctgg atgcagtggc 30060
atgatcttgg cttaccgcaa cctcaacctc tgcctcccag gttcaagtga ttctcctgcc 30120
tcagcttcct gagtagctgg gactacagac acatgccacc atgcccggct aatttttgta 30180
tttttagtag aggtggagtt tcgccatgtt gtccaggctg gtcttcaact cctgacctca 30240
ggtgatccac ccgcttcagc ctcccaaaag tgctgggatt acaggcatga cccaccgtgc 30300
ccagctggaa taagcaatct taaaaagcag tttgttgatt tctggtgaat agagaaaatg 30360
tgacaaacta tgactcaata gtttcatttc ttttttgttt gtttgtttgt ttttttgaga 30420
cagagtcttg ctctgtcacc caggctggcg tgcagtggct cactgcaagc tctgcttcct 30480
gggttcacgc cattctcctg cctcagcctc cggagtagct gggactacag gcgcccgcca 30540
ccatgcctgg ctaatttgtt ttttgtattt ttagtagaga cagggtttca ctgtgttagc 30600
caggatggtc tcgatctcct gacctcgtga tccacccgtc tcggcctccc aaagtgctgg 30660
gattacaggc atgagccacc gcccctggcc tacttttatt tcttaagcat atatcttaaa 30720
gaaactgcag gtatgcatta ggggacaggt agaaaaatgt tacagcattg tttgaaatgt 30780
tgaaaaactg gaaacaacct caatatctta ataatagaaa aaatggttga ggctggctgt 30840
ggtggttcat gcctgtaatc ctagcacttt tggaggctga ggcgggcgga tcacctgagg 30900
tcgggagttt gagtccagcc tggccaacat ggtgaaaccc cgtctctact aaaaatacaa 30960
aaaattaggc aggtgtggtg gtgcacacct gtaatcccag ctacttggga ggctgaggca 31020
caagaatcac ttgagcctgg gaaatggagg ttgtagtgag ccgagatcat gcctactgca 31080
ctccagcctg ggcaatagag tgagactccg tctcaaaaaa aaaaaaaaaa aaaaaaaggg 31140
aaggagcatg ggaatgggaa gaggcactaa aaaaggaact tcttttgtat ctgttacatt 31200
gtactcattt tgtttttaaa attttaagcc aaatatgaca ttgttatcac ttttgttgcc 31260
actcagaata caagtgctat tacactattt tctataattt tccctttttc aaactaaaaa 31320
acaaaaatac atgtaaacag gtgttttctt tatggaaaac aggaaggtga gcatccaaat 31380
aattttagtt aatttataac aaactcttaa taatttcttt ttcttcttct tctttttttt 31440
tttttttttt tgagtcaggg tcttgctctt ttgctcaggt tagagtgcaa tggtacaatc 31500
tggtacaatc acatcttagt gcaacttcta cctcttcagc tcaagtgacc tctctcctca 31560
gtcccccaag tagatgggac cacagatgtg tatccccaat catggttaat ttttaaattt 31620
tttggtagag ataaaatctc accatgttgc ccaagctggg cttgagctcc tgggctcaag 31680
cagtcctcct gccttggcct cccaaagtgc tgggattata ggcgtgagca aactgtgccc 31740
agtcttcata aacttttctt tacatgtcct tatcaagtac tttttgagca cctactgtca 31800
accagccgta gtatataata ctgataattc tataacataa gaaattgacc tgtttaaggg 31860
gatgaatatg gttagttatt ttcagggtga agaaacagaa gaatcgggga ggtagtacat 31920
agtcataagg agacggcatt tcttagtcac tttgtgtggt gtttataata agacttcatg 31980
tggccaggtg cggtggctcg tgagcgcctg taatcccagc actttgggag gccgaggtgg 32040
gaggatcaca acaaggtcag gagatcgaga ctatcctgaa caacatggtg aaaccccgtc 32100
tctactaaaa atacaaaaat tagctgggtg tggtggcacg tgcctgtaac cccagctact 32160

cA 02348657 2001-11-07
14/66
cgggaggctg aggcaggaga atcgcttgaa ccagggagtc ggaggttgca gtgaaccaag 32220
atcgtgccac tgcactgcag cctgggctac agagagagac tccatctaaa taaataaata 32280
aataaataaa taaatagact tcgtctgttt catcaagagt cattgtatta tattgatttt 32340
gaaatttcaa ataataataa ggaatagtat ggaaattttt gtttgattaa atggggacat 32400
gaggccaggt gtggtcactc aggcttgtaa tcccagcact tcgggagacc agggcaggag 32460
gattacttga gcctaggagt tcaagaccag cctgggcaac atggcaagac cctatctcta 32520
caaaagaaat acacaaaaat tagctaagtg tggtggcaca tgcctgtagt cttagctact 32580
cgggaggcca agggaagagg atggatcact tgagcccagg agttggaggg tgcagtgagc 32640
taggattgtg cccctgcact ctagtgtggg tgacagcaag actctgttta aaaaaaaaaa 32700
aaaatgaggc cgggcgcggt ggctcacctc tgtaatctga gcactttgag aggccaaggc 32760
gggtggatca cctgagttca agatcagcct ggccaacatg gtgaaaaccc cgtctttata 32820
cttaaattac aaagattagc tgggtgtgat ggtgcacacc tgtaacccca gctactccag 32880
aggctgagac agcagaatcg cttgaacccg ggagggggag gttgcaatga gccgagattg 32940
caccactgca ctccagccta ggtgacagag caagactctg tctcaaaaaa aaaagaaaaa 33000
aagtctaaga agttaatttt cattcagaca aatgttcaaa aataatagaa ataaaacaaa 33060
aaattaattt tcaaatatgt gatttgagta taacgatcac tttacagaag ttattctaca 33120
tactttttga ttatgctgag tttttaggtc cttttaaagc ttaacttgta tcaggaatta 33180
atgttttaaa ctagttgttg ggttcaaaga aaatagaaat gtgttattaa atgccacact 33240
tgtaatctca tacagcagtt ctcatgatgc aatcaattgt taaataaaaa cttcctctag 33300
agaggaggta cccagcaatg aacacattat atcagatttg aatatgagat taaacaatgc 33360
tttttgtttc attgttattg aaatcatatt tgtatttttc aaaagtatat atacttaaaa 33420
attcctaaat aaaatgtctt tctgtaatac agcattttag gttataagga tcaataccat 33480
gggctgataa gcaaaatagg actcacggcc ccaaaatgtt gataaacatc atgaccatat 33540
tccccataat ggagttacat atacacatta caatgataaa aatactaaga agttatatag 33600
taatgtttct cagacttgtt cacaaccctg ttttttatgt attacctctc aaaagcatga 33660
tttgcaatat ttagtgtact cttcatacga tctatacaaa taatttttta ttttaaagca 33720
ggacagaagg agcaagctgt ggaatggtat aagaaaggta ttgaagaact ggaaaaagga 33780
atagctgtta tagttacagg acaaggtaag attgtatttg tttatagcca tcccaaatta 33840
tgatatattc acatgattgt ccagatttca gatctattta tttatttatt tatttttctt 33900
tctttctttt cttttctttt cttttttttt tttttttttg agacagggtc tttcctctgt 33960
tacccaggct ggagtgcagt gatgtgatca tagctcactg caacctcaaa cttctgggct 34020
caagtgatcc tcctgcctct gcttcccatg tagctgggac cacaggcgca cactaccata 34080
cttagctaat tattattatt attattatta ttattattac tagtttttga gacagagtct 34140
cgctcttttg cccaggctgt agtgcaatgg tgcaatctcg gctcactgca atctccgcct 34200
cccggattca ggctatttat tctcctgcct gagactcctg agtagctggg attacaggtg 34260
catgccaccg tgcccagcta atttttgtat ttttagtgaa gatggggttt tgccacgttg 34320
gccaggctgg tttcgaactc ctgatctcaa gtgatctgcc cacctcagcc tcccaaagtg 34380
gtgggagtac aggcatgagc cactgtgggc cacacttagc taattaaaaa aaattttttt 34440
gtagagacag ggtctcactg tgtttctgtg actgatctta aacttctggc ctcaagtgat 34500
cctcctgcct cagctttcca aagttgtggg attacaggca tgagccactg tacccagcca 34560
gattgtattt atcttaataa atgtatttgg gccaggcaca gtggctcatg cctgtaatcc 34620
cagcactttg ggaggccgag gtgggcgaat cacctgggat caggagttcg agaccagcct 34680
gatcaacatg gagaaaccct gtctctacta aaaattcaaa attagccagg cgtggtgtcg 34740
cgcacctgta attgcagcta cttgggaggc tgaggcagga gaattgcttg gacccaggag 34800
gcggaggttg tggtaagcca agatcgcgcc attgcactcc agcctgggca acaagagtga 34860
aactctgtct cagaaagaaa gaaaagcaaa acagtatttc atttaattaa aaatgccttg 34920
tattatacca gtaagagtaa aaaacaattt aattaaagta tgatatatgc tcttttcatc 34980
acttagaatt tgaattttaa tcttattgaa gaggctgttt tagttttatt tagatatggt 35040
tataacaaca atattaatat ctgtgaccaa attggtgcat gcatgggcaa tgaaaagcta 35100
tgttgtgact gcagcatggt ggatagcatt agtaagttag cattggttgt aaaatgaatc 35160
ccaatttcaa agattttgaa acgtggggaa aaaatatttt agaccccatg aaataagacc 35220
tgaaatctat gaaataccac agtaggttgg aaatcatcat gagaaactgt aactattttt 35280
ttttataggt attatatgta ttctttgaga cagggtctca ccctgttgcc caggctggaa 35340
tgctgtgatg tggtcacctc tcactgcaac atccacttcc tggggctgaa gtgatccttg 35400
caactcaccc tcccatgctc ggctaatttt tttttttttt tttttaagta gagaccagat 35460
ctctttatgt tgcccaggct ggtcttgaac tcctgggctc aagtgattct gctttgtctg 35520

CA 02348657 2001-11-07
15/66
cccagagtgc tgggattaca gaagtgagcc acaacacctg gcctaaagat agtattttta 35580
aaatttcttc tgttttcttt cttttgggta tacattttct tctttttttt aaaaaaaaat 35640
ttctgtataa agactgtgac tccccatgaa agtagtttgg gtgataattt atcgtgaaac 35700
aatattagtt gggaaatgta gatattttaa ttaatttttt tctttcaggt gaacagtgtg 35760
aaagagctag acgccttcaa gctaaaatga tgactaattt ggttatggcc aaggaccgct 35820
tacaacttct aggtatcaat taatgtataa tttgatgtgg gatgtattgg aaatgtgtgt 35880
tcaatgaaac tttaatttgt agaaagaaat agatcagtga ttgaaaatgt ggtccaggct 35940
ttttaacata aagaaaacgt ataacatata caaaaacaga agagcataat ggacttcttt 36000
ttttttttga gatggacgct tgctctgtca cccaggctgg agtgcagtgg cgtgatcttg 36060
gctcactgca agctctacct cccaggttca cgccattctc ctgcctcagc ctcctgagta 36120
gctgggacta caggcacccg ccaccacgcc ccgctaattt ttttgtagtt ttagtagaga 36180
cagggtttca ccatgttagc cagaatggtg tccatctcct gacctcgtga tccacccgcc 36240
tcggcctccc gaagtgctgg agttacaggc gtgagccaac gcgcccagcc gagcataatg 36300
aacttctaat tattcttctc tcagctttga taattatcac ctcactatca gtcttgattt 36360
atttatacca agggctagca aactgcagct gatgggccaa cccagctcac tgcctattac 36420
tataaataag gttttattgg cacacagcca ttcctttcct ttaggtattg tctatggctt 36480
tcatgctacg gtgacagaat tgaatagttg atacagagac aacactgccc tcaaaaccta 36540
acatatttac tgtctggccc tgagaaagcc tgccatcttc acttgacatc ccacttcact 36600
gtcccccaac ttcttattat tttgaaacaa attattgact tattttccat ttataaatat 36660
ttcatattat acctctaaaa gataaggatg tcaaaataaa atcacagaaa taccattatc 36720
acacctaaaa aataactcca aatttctttt aacattatcc aaaaaaactg acccccccaa 36780
aatgcaattt ccaaatttct aattttctca aaatttaata atttttacta ttttttaata 36840
atttgtttgt atcaggatct taaaaagatc cgtatgtctc ttttaatgta caggttcatc 36900
tgtttttcat tttcttccaa tttatttgtt gatgaaacca ggtctttgtc atgtaatatt 36960
tcctacagtc tgacttttgc tgcatgcatc ttttgtggta tgttttaaca tgttcttctt 37020
tcctcccacg ttaaatgata gttggatata gagccttgat cacattgaaa gttgattttt 37080
attttttaat gattagacta cttcctaggt ggttgtgttt gtgtgttcat cattagttgt 37140
tccatcttgt gaggttagca gcagttaact atgactgatg tccagtgata ctttaattct 37200
gtcattcttt cagcattcat caactgtaat agaaactttt acttgtcttc tgtttgatgg 37260
cgtaggtttt aaatatatat taataagtta aatctaccac tcaaaaaaag tagaacaaaa 37320
cctactacat atgagtggct ctaccatacg ttggtggatg gaaatagtag atatttggta 37380
agcaggtaaa ccttatttat ttgtagccct gtgacttggg gtaagttatt ttgcatgtct 37440
gggtcttttt tatctaattt gtaatatgaa gctattatta ttattattat tattattatt 37500
attattatta ttattattat tattcgagat ggagtcttgc tttgttgccc aggctggagt 37560
gcagtggtgc aatctcggct caatgcaccc tccacctcct gggttcaaac tattctcgtg 37620
attcagtctc ccgagtagct aggattacag gggcctacca ccacacctaa tttttgtatt 37680
tttagtaggg acggggtttc accatgttgg ccaggctggt ctcaaactcc tgacatcaag 37740
tgatccatcc acctcagcct cccaaagtgc tgggataggc cgggcacggt ggctaacgcc 37800
tgtaatccca gcactttggg aggccgaggc gggtggatca cgaggtcagg agattgagac 37860
catcctggct aacacggtga aaccccgtct ctagtaaaaa aatacaaaaa actagccagg 37920
tgtggtggcg ggcacctgta gtcccagcta cttgggaggc tgaggcagga gaatggcatg 37980
aacccaggag gcggagcttg cagtgagccg agatcatgcc actgcactcc aggctgggca 38040
aaagagcgag actctgtctc aaaaaaataa aataaaataa atagataaat aataataata 38100
aagtgctggg attacaggca tgagccacca cgcccagctg aagctaatat tattagctaa 38160
taataatatc tcatattttt gaccattgaa ttattaaagg aacctaaacc atagtagtaa 38220
gtgctttaaa aatgttggtt tttatttatc tgtttacctg actgtcatca cctcctttgc 38280
ttaggtagaa agatatattc ataaacacat acatatacat tttattcatt ctttaattca 38340
tttactccta tatggtcatt gtgtttgtgg gatttttgcc cgcacatagt taaaaatgca 38400
gccgttactg ctttcagatg agtaacaagg tagtgttccc tggcttctgt ggctgacagg 38460
atttgccttc ttcctttcta aatggaggtt attactgtgt cagatataat taaatagtgt 38520
attaaagttt gttgcaataa aataattgat ggttctaatt ggtactttct acgtgtttta 38580
tctttaaagc ttttcagtgt atatataaag tatatatcat acagaataaa tttgattgtg 38640
gagcattttg taacatcttt caaaattaat aagagttggt ttttatgttt tgtttgatgt 38700
tatgatatag gacattagaa gtattaatat caattagaga ctcatctttg aatgtgactt 38760
tgtactttct tatttgtgtt agtagaggag agaacaaaaa gaagatatgt aatgtaatat 38820
gaaactaggc atttaaagat ttaacgtttt ggatatttta aagttggtgt ctgttttcac 38880

cA 02348657 2001-11-07
16/66
cctcaaaaat gctattacct atttatgaaa tatctttaaa agtgtggagt ggtagatggg 38940
aaaggtgaca tcggctgggc gcggtggctc acacctataa tcccagcact ttgggaggcc 39000
aaggtgggcg gatcacctga ggtcaggagt tcacgaccag tctggtaaca tggtgaaacc 39060
taatctctac taaaaataca aaaaattagc caggctggtg gtacgcacct gtaatcccag 39120
ctactcagga ggctgagtca ggaggatggc ttgaacccag aaaatggagg ttgcattgag 39180
ccaagatggc accactgcac tccagactgg gtgacagaga gagactccgt ctcaaaaaaa 39240
aaaaaacgcc gggcactgtg gctcacacct gtaatcctag cactttggga gactgaggcg 39300
agcagatcac ttgaggtcag gagttcgaga ccagctgggt gcctgggcaa catagtgaaa 39360
ccccgtctct actaaaaata caaaaaaatt agccgggcgt agtggcgggc gcctgtagtc 39420
ccagctactt gggaggctga ggaaggagaa tggcgtgaac ccgggaggcg gagcttgcag 39480
tgagccgaga tcccgccact gcactccagc ctgggtgaca gagcgagact ccgtctcaaa 39540
aaaaaaaaaa aaaaaaaaaa tagccgggca tggtggcggg cacctctaat ctcacctact 39600
tgggaggttg aggcatgaga attgctcgag cctgggaggc agaggttgca gtaagcagag 39660
accacaccac tgcactctag cctggatgac agagtgagac tttgtctcaa aacaaaaaca 39720
aacaaaccaa accacctctt gtccactcct aatctccctt actgtgtttc acttattttt 39780
ttcccatata tttgtcacct tctaataaac tgtgtaactt attttttatg tttattgtgt 39840
actatctgtc ttctccctgt tggaatataa actctatgga ggagggatcc ttgtctatat 39900
cccaagtgcc tacaacagtg tctagcacat gctagttacc gaataaatat ttgccaagtt 39960
aatgaagttg tttataaccc ttggcactat acctgataca gtgtagggac ttaataaatg 40020
aatgttaaat gaagctatct taaaaatata tatatatata taacagccag atacgccaat 40080
ttgccgacat caaaattaat cttttcatct attgcaggtt ttacagttaa gctttgctct 40140
aaggttcact atcactaaac caaaaataaa taatatggat ggtcttttcc catttttaac 40200
agagaggcta catcctctca aaccagtcag tattaggaat tcccaggatc attctctcca 40260
ttttccatcc taattagata cctatctggc accacatctc tgaaaagctc caatttttaa 40320
ccagcacata ataaacaaat atgttactat taatacacgt ttgtacacaa gtcattttta 40380
ttgtcttagg tatatccact cccagacctt ctgagttatt gaaagacagg aatttgtgat 40440
gtcacctctt ttttcttttt tttgagacgg agtcttgcct tatcacccag gccagagtgc 40500
aatggcgtga tctcggctca ctgcaacctc tgcctcccgg gttcaagcga ttatcctgcc 40560
tcatcctcct gagtagctgg gattacaggt ggccctagtt tgggtttttg gttttaaaca 40620
ggatggtctc ctctttgaga agttgccatg agttagccat gatgatacct gggacaataa 40680
tggtccacag agaagtaaga gccaatacaa cgccttaaga gaaagtacct ggtatgtttg 40740
tgaagcagca aagaggccaa tgtgttccag caaggagatt atagtagaga tgaagtcaga 40800
gaactcatgc ggagagggat tgtcacaaca cgcagggctg taaaggccac catgaggact 40860
tgagctttta ccgcctgtga aatggggagc agttacaaag atttttaaga aagcagccca 40920
gtgcagtggc tcatgcctat aatcccagct ctttgggagg ctgaggtggg tggatcacct 40980
gaggtcagga gttcgagacc agcctggcca acatggcgaa accttgtctt tactaaaaat 41040
agaaaaatta gctgcgtgtg gtggccatgc ttgtaatccc aaatactcgg gaggctgagg 41100
cagaagaatc acttgaaccc gggaggcgga ggttgcagtg agccgaggtt gcgccactgc 41160
cctccagcct gggcaacaaa gcgagactcc gtctcaaagc cagaaaaaaa gatttttagg 41220
aaaggaatga aatactctga cttaaatttt agaaggatca ctctggttgc tatgttgcat 41280
tatagactct aagggtagaa ccagggagag caattaggac actgttacag taatctagga 41340
gaaaagtgat agaggcttgc accagggtag tatcaggaga aatggtaaca agtggttgga 41400
ttatgattat agttgaaggt cgaacaacta gatttgctga tagattggat aaaatggtcc 41460
tctctttatg gatctcataa tacagtagga gaaacagaca cataaatagt catcactgca 41520
ggatgggtat tagaaatatt ttgcaagggt gtaaaaggtg ctaagaaagc tttcttgtgt 41580
gacaaagctg gttaaagaaa gaaaagaaag cttcctagaa gtgaaaccta aaatatacac 41640
ttagataaat gaataaaagt tatgaaagaa tgtgagggct gggcacagtg gctcatacct 41700
gtaatcctag cactttggga ggttgagtcg ggggtattgc ttgagtccag gagtttgaaa 41760
ccagcctgga cagcgtactg agaccccatg tctaaattta aaaaaaaaaa aaatagccag 41820
gagtggtgat gtgcacctgt agtcctagct acttacttgg gaggctgagg caggaggatt 41880
gcttgagctc aggaggtcga gactgcagtg agccatgagt acaccactgc actctagtct 41940
gggtgacaga gtgagaccct gtctcaaaga aaatgaaaag aaaaagaatt tgagaaaaga 42000
tatgtcagga aaatgtgatg acatgaacaa atactcaaag gcaagaaaag catggtgagt 42060
aggggagggt acaggttgag acatgaagtt gggattgccg aggcgtaaga ggtataggca 42120
gatcatggat ggcctggttt gtcataggaa ggagcttggg ctcttatctg tgggcaatgg 42180
gaagccacta aagggtttta agtagaagag tgttatatgg taaggttttc ctctccagta 42240

CA 02348657 2001-11-07
17/66
gatcactcag atgactgtgg gggttggatg tgaggaggta aagcagcaaa gttactgctt 42300
taatttaaat cattgattaa tctgtacaat cctagtcatt ccaaaaagaa acattagtcc 42360
tttaacagaa gtgaattggg tctgggcgcg gtggctcacg cctgtaatcc cagtactttg 42420
ggaggccgag gcgggcagat cacctgaggt caggagtttg agacaagtct ggccaacatg 42480
gcaaaacctt gtatctacta aaattacaaa aattagctgg gcatgggggc acccacctgt 42540
aatcccagct attcgggagg ctgaggcagg agactctctt gaacccataa ggcagaggtt 42600
gcaatgagct gaggtcgcac cactgcgctc cagcctgggc gacagagtga gactccgtct 42660
ccaaaaaaaa gaaaaaatat tggagcagtt tcacagatgc tgtttactgt tatactgtat 42720
gtgtctatga ctcctcctcc aagaaaaaaa aaatgaattg gagcaggttc acagaagcaa 42780
tgtactgtta cactgtatgt gtctgtttct acacatataa atctgaattc tgtgtacacg 42840
aaaagaaatc ctatagcttt ttattcctag ctataaaaac taagaatata atttctttct 42900
ttttattaca taatgaatgg ttctgttaac tttttgttaa aatttcattg aggggagtat 42960
taattcacat ttatgtacgg atgtctacat ttacaaatca gtgtattttt tgatttatgc 43020
ttttactgag acaaagggtt tctgtctcag catggtcatt taaagagttt atcattgaga 43080
aaaatcagat gaccaacctg ttagctcaaa aaaaaaaaaa cctccaaggt atattgtatc 43140
agccagttct aggatacaaa agccatgcag tactttgtgt tttgtgccaa aaagggtagc 43200
tgctatttga cctgtcccaa aggcatgtgt ggttgtaccg taaaccaagc atggtacctg 43260
tttgtcaaac tttagaaatg aaagtttaag agagttaata tataggtgct gcatttttta 43320
tgtattcatt gacttgctgg tacagaagaa aagaatcaat tatgattcag cacaatactc 43380
cacttgggga agagagtgca gcagtagttt agagtgtcag ggatcaaact gctaccttct 43440
tgggcttcag ttgctagact taagagaccc agatcttggg aggggttttt gttgttattt 43500
gatgtggggg taaggttgaa atactccctt ttaattgatt aatataaaaa ataggtaatg 43560
tagacgtatg tcacaaaatt ttaacaagtt tgagtgtgaa aagcatccat cccattctat 43620
gccctggcta cccatttccc ctccctagag gcggctgtta ttatcagttt ctctgggtcc 43680
tttttagagg taatcttttt gtatgcaact gtgcacatgt atgtttacac aaatggtagg 43740
gtattgtata tatatacagt tactgcagta tgcttatttg actttgcttt attgctttta 43800
ttttctgcct gacatatgtt aatgtggcca aatagggcat ttcccagaca atccttatag 43860
tttcattctg tgctacttta aatgctgttc tccttccctg aaatgtcctt tttttttttc 43920
ttttcttttt ttttttttga gacagagtct cgctctgtca cccaggctgg agtgcagtgg 43980
cacaatctca gctcactgca acctccacct ccccggttta agccattccc ctgcctcagc 44040
ttcccgagta gttgggacta caggcgcgtg ccaccacgcc cggatacttt tttgtttgtt 44100
tgttttagta gagacagggt ttcactgtgt tagccaggat cgcctcaatc tcctgacctc 44160
ctgatctgcc tgcctcagcc tcccaaagtg ctgggattac agacgtgagc cactgcgcct 44220
ggctgtcctt tcttttaatc ttttcaaatt ctagccagtt catagcccac ttgctctgta 44280
aagctttttc agtgatcttt cttttgtacc atgcagtctt ttaaaaaatc tacagtttta 44340
ttataagttg ctaattatat ttaataaata cctaaatggt agaaattgat tcatttttta 44400
atctccgtag tgccaggaac tgtggctcat gtctgtaatc cctgcacttt gggaggctaa 44460
ggcgggagga tcgcttaagg ccaggagctt gagcccagcc tgtggaacat attgagaccc 44520
cgtctctaca aaaaataaat tagctgggca tagtggtgtc tgtatgtagt gtcaactact 44580
caggagactg aggcagaagg ataacttgag ctcagggagt tgaggccaca gtgagccatg 44640
atggtgccac tgtacttcag cctgggtgac agagcaagac caagaccgat aattatctcc 44700
atggtatttg ttttggacgt attagatatt cagtaaatat tttctggtga tgatagtgat 44760
atctaactac ctcaggttac ctaacctgaa taaggcctat ttttaacata gccattcact 44820
tgttaatttc tgttattttc gtgacttcat ttttactaat tatattttaa aagataattt 44880
tatataaatg caaaaacttt ttatcatgta acaatctggt aacaccttga gtaatttgtc 44940
atttcacatg cacattttat ttgttcatta tcttttttct ttttgtttat tttttctgtt 45000
ttttaccttc tctgttgcat agagaagatg caaccagttt tgccattttc caagtcacaa 45060
acggacgtct ataatgacag tactaacttg gcatgccgca atggacatct ccagtcaggt 45120
gggtttaggt taactaacat aaaataataa agcttgcatg caaagtaaga gtcttactta 45180
acctgataat gttgatttga ttttataatg gtaggtttaa ttgttcatgt tttcacaggg 45240
ctgtgttgaa aatatagtac ctttatcatc atagtatata aacatgcaac aagtcaggta 45300
tagtcattct aaacttgctt tatttgcata ttttgcaacc tctggttttt cagattataa 45360
aatatgaagg tatacattcc cgtaagtgat taaaataatc tttttttctg ttgtggcttt 45420
tgtgttttta tatggatagc tatactgatt tttttcatga aatagtgttt tctaagacac 45480
attttaattt tttatgtatc aatttttatt gcatatcaat tttcatttat agtatatgtg 45540
aatgtcttat agtacttgat agaagaaatt tgaaacttca catagtgagg agaaacatta 45600

CA 0257 2001-11-07
18/66
cagtattatt tgctatggat taactctatc cttcataaac ttttggatat caacttctac 45660
agaagattaa atgtctttct gttttgtttt ctttgggtag gggactctcc atttcttagg 45720
ttctctgaca tctgagctag ctttttgttt aattaaaact ttttttttag ttgacagata 45780
atgtacctgt tcatggggta cacagtgatg ttttgataca tatagtatat ggtgattaga 45840
tcaaggtaat tatcatttcc atcatcccaa acatttatca ttccttgtgt tggaaacatt 45900
cagtattttc cttctagcat ttgaaatgat ataatatatt atattgttac ctataatcat 45960
cctgcagtga tgtagaacaa tggagcttac tctttctatc tagctatacc tttgtatcct 46020
ttccctaccc ttttcagcct ctagtatcct ctgttctact ttttatttct atgagattaa 46080
ctttttaaaa ataatattct gtgtgtatat ataccacatt ttctttattc attcgtctgt 46140
tcttggacac ctaggttgat tctgtatctt ggctgttgtg aatagtgctg cagtaaacat 46200
ggggtgtaga tgtctgttcg atatgatgat tttctttcct ttggataaat tcccaatagt 46260
gggattggtg ggtcatatgg tagttctgtt tgtagttttt gaggaacctc catactcttc 46320
tccatagtag ctgtactagt ttagattccc aaaagtagcg tataagagtt cactttctac 46380
acatcctcac cagcatttgg tacttttttt gtctttttga taatagccat cctaactggg 46440
gtaagatacc ttgttgtggt tttgatttgc atttccctca taattaacga tgttgagcat 46500
tttttcatat ctttgttttt gacggtccag ctagttttat tggttacttt tttttttttt 46560
ttttagcaat agtttcatgt gcagggctca aattatattt aatattactt ttttcaaatt 46620
ataccagaac aaccttaggt taggctataa aacaactgcc ttctttttct tttggcataa 46680
taattatata tatattttta attacacttt acgttctagg gtgcatgtgc acaacatgca 46740
ggtttgttac atatgtatac aagtgccatg ttggtgtgcc gcacccatta acttgtcatt 46800
tacattaggt atatctccta atgctacccc tcccctctcc cctcacccca cgacaggccc 46860
cattgtgtga tgttccccac cctgtgtcca agtgttctca ttgttcagtt cccatctgtg 46920
agtgagaaca tacggtgttt ggttttctgt ccttgcgata gtttgctcag aatgatggtt 46980
tccagcttca tccatgtccc tacaaaggac atgaactcat cctttttgat ggctgcttag 47040
tattccatgg tgtatatgtg ccatattttc ttagtccagt ctatcattga tggacatttg 47100
cattgattcc aagtctttgc tattgtgaat agtgccacag taaacataca tgtgcatgtg 47160
tctttatagc agcatgattt ataatccttt gggtatatac ccagtaatgg gatggctggg 47220
tcaaatggta tttctagttc tagatccttg aggaatcgcc acactgtctt ccacaatggt 47280
tgaactagtt tacgttccca tcaacagtgt aaaagtgttc ctgtttctcc acatcctctc 47340
cagcacctgt tgtttcctga gtttttaatg atcgccattc taactggtgt gagacggtat 47400
ctcattgtgg ttttgatttg catttctctg atggccagtg atgatgagca ttttttcatg 47460
=tgtcttttgg ctgcataaat gtcttctttt gagaagcatc tgttcatata ctttgcccac 47520
tttttgatgg ggttgtttga tttttttctt gtaaattttt ttaagttctt tgtagattct 47580
ggatatcagc cctttgtcag atgggtagat tgcaaaaatt ttctcccatt ctataggttg 47640
cctgttcact ctgatggtag tttcttttgc tgtgcagaaa ctctttagtt taattagatc 47700
ccatttgtca attttggctt ttgttgccat tgcttttggt gttttaggca tgaagtcctt 47760
gcccatgcca gtgcccatgc cagtgtcctg aatggtattg cctagatttt cttctagggt 47820
ttttatagtt ttagaactaa catttaagtc tttaatccat cttgaattaa tttttgtata 47880
aggtgtaagg aagggatcca gtttcagctt tgtacgtttg gctagccagt tttcccagca 47940
ccatttatta aataggaaat cctttcccca tttattgttt ttgtcaggtt tgtcaaagat 48000
cacatggttg tagatgtgtg gtattatttc tgagggctct gttctgttcc attggtctat 48060
atctctgttt tggtatcagt accatgctgt tttgattact gtaccttcgt agtatagttt 48120
gaagtcaggt agcacgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 48180
gcaggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 48240
agtcatttgt agcttgatgg ggatggcatt gaatctataa attaccttgg gcagtgtggc 48300
cattttcatg atattgattc ttcctatcca taagcatgga atgttcttcc atttgtctgt 48360
gtcctctttt atttcattga gcagtggttt gtagttctcc ttgaagaggt ccttcacatc 48420
ccttgtaagt tggattccta ggtattttat tctctttgaa gcaattgtga atgggagttc 48480
actcatgatt tggctgtttg tctgttattg gtgtatagga atgcttgtga tttttgcaca 48540
ttgattttgt atcctgagac tttgctgaag ttgcttatca gcttaaggag attttgggct 48600
gagatgatgg ggttttctaa atatacaatc atgtcatctc caaacaggga caatttgact 48660
ttcttttcct aattggatac cctttatttc tttctcctgc ctgattgccc tggccagaac 48720
ttccaacact atgttgaaca ggagtggtga gagagggcat ccctgtcttg tgctagcttt 48780
caaagggaat gcttccagtt tttgcccatt cagtatgata ttggctgtgg gtttgtcata 48840
aatagctctt attattttga gatacatccc atcaatacct agtttattga gagtttttag 48900
catgaagggc tgttgaattt tgtcaaaggc cttttctgca tctattgaga taatcatgtg 48960

cA 02348657 2001-11-07
19/66
gtttttgtct ttggttctgt ttatatgatg gattacgttt attgatttgc atatgttgaa 49020
ccagccttgc atcccaggga tgaagccaac ttgattgcgt tggataagct ttttgatgtg 49080
ctgctggatt cggtttgcca gtattttatt gaggattttt gcgttgatgt tcatcaggga 49140
tattggtcta aaattctctt tgttgtgtct ctgccaggct ttggtatcag gatgatgctg 49200
gcctcataaa atgagttagg gaggattccc tctttttcta ttgattggaa tcatttcaga 49260
aggaatggta ccagctcctc tttgtacctc tggtagaatt cagctgtgaa tccatctggt 49320
cctggacttt ttttggttag taggctatta attattgcct caatttcaga gcctgttatt 49380
ggtctattca gggattcagc ttcttcctgg tttagccttg ggaggctgta tgtgtccagg 49440
gatttatcca tttcttctag attttctagt ttatttgagt agaggtgttt atagtattct 49500
ctgatggtag tttgcatttc tgtggaatcg gtggtgatat cccctttatc atttcttatt 49560
gcatctattt gattcttctc tcttttcttc tttattagtc ttggtagcag tctatcagtt 49620
ttgttgatct tttcaaaaaa ccagctcctg gattcattga ttttttgaaa ggttttttgt 49680
gtctctatct ccttcatttc tgctctgatc ttagttattt cttgccttct gctagctttt 49740
gaaggtgttt gctcttgctt ctctagttct tttaatggtg atgttagggt gtcaatttta 49800
gatctttcct gttttctctt gtgggcattt agtgctataa atttccctct acacactact 49860
ttaaatgtgt cccaaagatt ctgatatgtt gtgtctttgt tctcgttggt ttcaaagaac 49920
atctttattt ctgccttcat tttcttatat acccagtagt cattcaggag caggttgttc 49980
agtttccatg tagttgtgtg gttttgcgtg agtttcttaa tcctgagttc tagtttgatt 50040
gcactgtggc ctgagagaca gtttgttgta atttctgttc ttttacattt gctgaggagt 50100
gctttagttc caactatgtg gtcaattttg gaataggtgt ggtgtggtgc tgagaagaat 50160
gtatattctg ttgatttggg gtttagagtt ctgtagatgt ctattaggtc cacttggtgc 50220
agagctgagt tcagttcctg gatctgtctt gttgatctgt ctaatattga cagtggggtg 50280
ttgaagtctc ccagtattat tgtgtgggag tctaagtctc tttgtaggtc tctagggact 50340
tgctttatga atctgggtgc tcctgtattg ggtgcatata tatttaggat agttagctct 50400
tcttgttgaa ttgatccctt tagcattata tgatggcctt ctttgtctct tttgatcttt 50460
gttggtttaa agtctgtttt atcagagagt tggattgcaa accctgcttt ttttgttttc 50520
catttgcttg gtagatcttc ctccatccct ttattttgag cctatgtgtg tctctgcacg 50580
tgagatgggt ttcctgaata cagcacactg atgggtcttg actcgttatc caatttgcca 50640
gtctgtgtct tttaattgga gcatttagcc catttccatt taaggttaat attgttatgt 50700
ttgaatttga tcctgtcatt atgatgttag ctggttattt tgctcgttag ttgatgcagt 50760
ttcttcctag cctcgatggt ctttacaatt tggcatgttt ttgcagtggc ttgtaccggt 50820
tgttcatttc catgttcagt gcttccttca ggagctcctg taagcaggcc tggtagttac 50880
aaaatctgtc agcatttgct tgtctttaaa ggattttatt tctccttcac ttatgaagct 50940
tagtttggct ggatatgaaa ctctgggttg aaaattcttt cctttaagaa tgttgaatat 51000
tggcccccac tctcttctgg tttttagagt ttctgccaag agatcagctg ttagtctgat 51060
gggcttccct ttgtgggtaa cccgaccttt ctctctggct gcccttaaca ttttttccta 51120
catttcaact ttggtgaatc tgacaattat gtgtcttgga gttgctcttc ttgagtagta 51180
tctttgtggc attctctgta tttcctgaat ttgaatgttg gcctgccttg ctaggttggg 51240
gaacttctcc tggataatat cctgcagagt gttttccaac ttggttccat tctccccgtc 51300
actttcaggt acacccgtca gacatagatt tggtcttttc acatagtcct atatttcttg 51360
gaggttctgt tcgtttcctt ttactctttt ttctctaaac ttctcttctg gcttcatttc 51420
attcatttga tcttcaatca ctgataccct ttcttccact tgatcgaatc ggctactgaa 51480
gctcatgcat gcatcacgta gttttcgtgc catggttttc agctccatca ggccatttaa 51540
ggtcttctcc atgctgttta ttctagttag ccatttgtct aatctttttt caaggttttt 51600
agcttctttg caatggtttc gaacatcctc ctttagctcg gagaactttg ttattaccca 51660
tcgtctgagg cctacttctg tcagcttgtc aaagtctttc tctgtctagc tttgttccgt 51720
tgctggtgag gagctgtgtt cctttggagg agaagaggcg ctctgaattt tagaattttc 51780
agcttttctg ctctggtttc tccccatctt tgtggcttta tctacctttg gtctttgatg 51840
atggtgacgt acagatgggg ttttggtgtg gatgtccttt ctgtttgtta attttccttc 51900
taacactcag gaccctcagc tgcaggtctg ttggagtttg ctggaggtcc actccagacc 51960
ctgtttgcct gggtatcacc agcggaggct gcagaacagc aaatgttgca gaacgacaaa 52020
tgttgctgtc tgatccttcc tctggaacct tcgtctgaca ggggtaccca ggtatatgag 52080
gcgtcagtca gcccgtatgg ggaggtgtct cccagttagg ctacttgggg atcagggacc 52140
cacttgagga ggcagtctgt ccgttcgccg atctcaaact ccatgctggg agaactacta 52200
ctctctttag agctgtcaga cagggacctt taagtctgta gaagttactg ctgccttttg 52260
ttcagctatc ccatgtcccc agaggtggag tctacagagg cagtcaggcc tccttgagct 52320

cA 02348657 2001-11-07
20/66
gtggtggact ccacccagtt caagcttcct agctgctttg tttacccact caagcctcag 52380
caatggcaga tgcccccgcc tccagcctct ttgccgcctt gcagttcgat ctcagactgc 52440
tgtgctagca gtgagcgagg ttccgttggc atgggaccct ctgagccagg catgggatat 52500
aatctcctgg tgtgccgttt gctaagacca ttggaaaagc ccagtattag ggtgggagtc 52560
tccctatttt ccaggtacca tatgtcacgg cttcccttgg ctaggagagg gaattcccca 52620
accccttgcg cttcccaggt gaggcaatac cccgcccttc agctcacact atgtgggctg 52680
cacccactgt ctgacaatcc ccagtgagat gaacccagtt cctcagttgg aaatgcagaa 52740
atcagctgtc ttctgtgtcg ctcacactgg gagctgcaga ctggagctgt tcctatttgg 52800
ccatcttgga accctgcctt cttcattcat atgtaataca aaacttctaa ggttttagtg 52860
gagaagagat agagtaaaag gatttctata gacagaagaa acagttggtc atcaactctt 52920
tcccttgtgg cttcacatct cccctaagga cttcttatgt tggtttggtc ttacagtata 52980
gtcagtggca gtttccctct tcccattcct tcctctgtct gatttaaaat gctgtttcaa 53040
gtatcgatat aagtattttg cctgtttctt ttagcgtggc tgtgaagggc tgacattttc 53100
agaaggcact tactgaaaaa aaaaaaacaa agaaatgtaa gagtccatca catataaata 53160
gttaagtttc taaaatatgt atttgagatc ccagtaattc tactaggata aatagcaaaa 53220
attctccagc cctgaagagt tggtctgtct ttcctttcct tgttatcttg attctctttt 53280
atttcatttc acatgctaga ccccatcatg ttttcctgct gcattcccca ctccaccctc 53340
caaagcaatg ttctcttcct gcaacctgtt tgaaaaaatt gaactttgtc ttatttcata 53400
tccctagtac aagttgaata tccctaatat gaaatctgaa atccaaaatg ctctaaaatt 53460
cgactctttt ttttttgaga tgaagtcttc ctctgtcact caggctggag tgcggtggcg 53520
caatcttggc tcactgcaac ctccgcagcc tcccctaacc ccatccctgt gggttcaagc 53580
gattctccca cttcatcctc ccaagtagct gggactacag gcacctgcca ccacacccaa 53640
ctaatttttt gtatttttag tagagatgag gtttcaccat gttggtcaag ctagtctgag 53700
actcctgacc ttaagtgatc cacctgccct ggcctcccaa agtgttggga ttacagtcat 53760
gagccactgt gcctagccaa atatccaaaa ctttttgagc gctgacatga tgctcaaagg 53820
aaatactgga gtattttgca ttttggattt ttgggttaag gatgctgaac cagtaagtat 53880
aatgtaaaca ttgcaaaatg caaaaaaatg taaaaaccct aagcagttct ggtcccaagc 53940
atttcgcata agggatactc aacccataat cttttctttt ctgttttctg gttggaaggg 54000
catattggct ttatagctaa tttacacagc attgatgttt aatacacagt gagtccaagt 54060
agatcactca gacctattag tagtttatta gtgtcactca cttctggaac attctgtgat 54120
gttttacttg gatgagttct ttcacctctc ttgggaaata gtcataccaa agtctgctta 54180
ttactacaat gtgttatcta ttatacattg tccaattttc tactcaaaat tactagacag 54240
gcaaagaaaa agtaaagtat aacccttact caagaaaaaa aagcaatcag tagaaactgt 54300
gagtgggccc agatattgga tttagcagac aaagacttca aagcagctat tataatatgt 54360
ttaaagaatt gaaagaaaat atggtatcag ttaaacagga aatctaagta gatgatataa 54420
actagacaat aaaaataata ttctaaagtt gaaaagtgta gttactgaaa ttaaaaattt 54480
acagacaaca gcctcaacag cagattagag atagcaaaag aaagattcag tgactttgaa 54540
tgcaggtctg tagaaattac taaattgatg actctcacgt agcaactttc acccgtagtt 54600
tggtttcata tacaatgctt taactctttt tgctattttt tctcttactt tctgtgatgg 54660
aaacattttg tgctttgatt ttaatgggtg tatcacagtt atatacatct ttacaaactc 54720
atcaaattgt atactttatt tatatattta tttttttttg agatagggtc tgactctttc 54780
tcccaggctg gagtacagct gaaattagtt gggactacag gtgggcacca ctgtgccagc 54840
taatttttgt attttttgta gagatggggt ttccccatgt tggccagtct ggtctcaaac 54900
tcctgggctc aatcatttct gccgcctcag actcccagag tgttgggatt ataggtgtga 54960
gctactgtgc ctggctggta tagctttttt tttttttttt tttttttttg tgacagagtc 55020
tcactctgtc gcccagggtg gagtgcagtg gcgcgatctg ggctcactgc aacctctgcc 55080
tcccgggttc aacccattct cctgcctcag cctcctgagt agctgggact acagatgcgt 55140
gccaccatac ccagctgatt tttgtattct tagtagaaac agagtttcac catgttggcc 55200
aggatgatct cgatctcctg acctcgatcc acctgccttg gcctcccaca gtgctggcat 55260
tacaggcctg agccaccatg cctggctgtt ggtatacttt aaatggatgt aattcattgc 55320
agattatacc tcagtaaatt tttatttagt ttttgagact gagttgctct gttgcccagg 55380
ctggagtgca gtggcacgat ttcagctcac tgcaacctct gcctcctggg tttaagcgat 55440
tttcctgtct cagcctcccc ggtagctgga attagaggtg tgtgccacca tgatcagatt 55500
atttttgtgt ttttagtaaa gatggggttt caccatgttg gccaggctgg tctcgaactc 55560
ctgacttcag gtgatccacc cgcctcggcc tctcaaagtg ctgggattac aggtgtgagc 55620
caccacgcct ggccttaatt tttaaatact gtaaggctta taaagaaaag aatattcccc 55680

cA 02348657 2001-11-07
21/66
ttctgtttct ttcctctcac gtagcaacct tcacccctag tttggtttca tatacagtgt 55740
tttaactctt tttgctattt ttttctctta ctttctacta tatttccaaa tacaatgctt 55800
ctataatgat tccttttttt tttctatcag tttttgataa tcattgactc cttatggtca 55860
aagaagactt aattcccttc tgtcactctt catatattaa tataactaat atatatattg 55920
tttagttttg atataactaa aaataactat atgtatatat aactatatat gtataagcta 55980
tctgtatata gttatatatg tatatgcaca tacatatata gttacatatg tatacacaca 56040
tacatatata gttacatatg tatatgcata tacatatata gttacatatc tatatgcata 56100
tacatatata gttacatatg tatatgcata cacatatata gttacatatg tatatgcata 56160
tacatatata gttacatatg tatatgtata tgtatataca tatatagtta tatatgtatt 56220
agttatatca aaataactat gtatatatag ctgtaaatgt atatataaac tatatgtata 56280
cagttatata tgtatttgta tatgtgtgta tacatatata gttttttttg tttttttttt 56340
ttgttttttt tgtttttttt tggagatgga gtcttgccct gtcccccagg ctggaatgca 56400
gtggtgctat cttggcttac cgcaacctct gcttcccagg ttcaagcaat tctcctgctt 56460
cagtctcccg agtacctggg attacaggca cgtggcacca cgccaggcta attttttgta 56520
tctttagtag aaatggggtt tcaccatgtt ggccaggctg ttctcaaact cctgacctcg 56580
tgatccaccc gcctcggcct cccaaagtgc tgggattaca ggcgtgagca ccgcgcctgg 56640
tccctataca tatatagtta tatataccta tagttatttt tagttatatc aaaataacta 56700
tatgtatatg taactatata tatagtatat atagtatata tatactatat agtgtgtata 56760
tatagtatat atatactata tagtgtgtat atatagtata tatatagtgt atatatcgta 56820
tatacactat atactatata gtgtatatat agtatatgta gtatatatag tatatatagg 56880
atagtatata tagtatatat agtgtatata tactgtatat ataggtgtac atagtatact 56940
atatagtata catatagtac actgtatagt atatatagta tagtatatat agtatacata 57000
gtatactata tatagtatag tatacatagt atactatata gtatatagag tatatataca 57060
gtatactata tagtatatag agtatatata cagtatacta tatcgtgtgt atagagtata 57120
tatacagtat actatatcgt gtgtatagag tatatataca gtatactata tcgtgtgtat 57180
agagtatata tacagtatac tatatcgtgt gtatagagta tatatacagt atactatatc 57240
gtgtgtatag agtatatata cagtatacta tatcgtgtgt atagagtata tatacagtat 57300
actatatcgt gtgtatagag tatatataca gtatactata tagtgtgtat agagtatata 57360
tacagtatac tatatagtgt gtatagagta tatatacagt atactatata gtgtgtatag 57420
agtatatata cagtatacta tatagtgtgt atagcgtata tatacagtat actatatagt 57480
gtgtatagcg tatatataca gtatactata tagtgtgtat agcgtatata tacagtatac 57540
tgtatagtgt gtatagcgta tatatacagt atactgtata gtgtgtatag cgtatatata 57600
gtatactgta tagcgtatag agtatatata tagtatactg tatagtgtat agagtatata 57660
tatagtatac tgtatagtat atagagtata tatagttaca tatacatata gttattttta 57720
gtaatatcaa aaaaccatag ctaagatttt tatgatttag caaaatattg tttaccccaa 57780
agccacgtat tatatattaa tgatattttt tcccttttga gtttttcttc cccacaggtt 57840
ttctgatctt tttttttgtt ctctaacttt atattatagg tatatactct tttctctgtt 57900
taatttgctt tttaactaga agacctcctt tagtagttct tttagtgaat atctgtggtt 57960
aaactcttag tctttccagt gtctgaaata ccctcatttt aatgtgacag gtcacttttc 58020
tcacctcaac attttggaca tacctcattt ccaacaaaca tttgttactt ctgatagaga 58080
gtctgctgtc attctcatac ttgttccttg tggaaatgtc tatatataaa gtctcagaac 58140
tatatatttt taatatatat acatattttt atttatttaa aaatgtataa ttaagttagt 58200
agtagtagta gtagtagtag tagtagtagt agtagtagtt tttttttttt tagatggagc 58260
ctccatctcc cgggttcaag tgattctcct gcctcagcct cctgagtagc tgggattaca 58320
ggcacacacc accatgcctg gctaattttt gtattttgag tggagatggg gtttcaccat 58380
gttggccagg ctgatcttaa actcctgacc tcagatggac cacctgcttt ggcctcccaa 58440
agcgctagga ttacaggcat gaaccactgc gtctggcctt aagttattat tgactattga 58500
tgccctgttg ctctatcaag tagtaggtct tatttattct agaacctcgt tttaaggtat 58560
cctgaatgtg gctttttttt ttttttttcc taagacggag tctcactctg ttgcccaggc 58620
tggagtgcaa tggagtgatc ttggctcacc gcaatctctg cctccttggt tcaagcaatt 58680
ctcctgcctc agcctcctga gtagctgaga ttacaggcgc acgccaccac acctggctaa 58740
tttttgtgtt tttagtagag acggggtttc accacattgg tcaggcttgt ctcaaactcc 58800
tgaccttgtg atccgcccac cttggcctcc gaaagttctg ggattacagg cgtaagccac 58860
cacgcccagc ctaatgtgga ttttgttttt ttttttaact tgaattttat ttatacttcc 58920
tgattttata atagttaact tgtagtaaaa gtaaactggt tgtctaaata aataagctga 58980
tttcctatac tagtttagag tctttagttt tcttaaaccg tattaagaga tttgattaca 59040

cA 02348657 2001-11-07
22/66
aaagtaaaat tgaggctttt gtcttttttt ttggccactc taatttgctg actgacttaa 59100
catttgtctt cacagtaaac attgtaaata aacactgatg tttgttgcgt agtatgtaaa 59160
aatattattt aggagtggtg agatttaaac atttacaaac ctgtaatata tatagtacag 59220
caacactgga caaataacct tttcaactta atcagaggtg ttctataaat gttcatttgc 59280
atatatacag cccatataat acttagcata tgtaaaagca catctttata ctctttcaat 59340
taaaattgat tattattatt attttttttt tgagacagag tccctctcag tcacccaggc 59400
tggattgcag tggtgtgatc agggctcact gcaatcgggt agctggaact acagggatgt 59460
gccaccacgc ccagctattt ttgtattttt agtggagatg gggtttcacc atgttggcca 59520
ggctggtctt gaactccata cctcaggtga tctgcccgcc tcagcctccc aaatagctgg 59580
gataacaggc gtgagctact gcacccggcc taaaattgat tagtttttaa gaccctcttg 59640
gtgggaacag aptttcatag tgtttatagt tataatagtt tggaatcaaa gtagtcgagt 59700
gctacttttt tttcctctgt acatcctatc cctaatgcct ttactatatt ttgtttctta 59760
tttgagagct ttatttgctt cataactttt tttttttttt tttttttttg agacagagtt 59820
tcactctgtc acccaggctg gagtgcagta gtgcaatctc ggcttactgc aacctccgcc 59880
tcctgagttc aagtgattct cctgcctcag cctccgaagt agctgggatt ataggccccc 59940
accaccacgt ctgactgatt ttttgtattt ttagcagaga cgaggtttca ccatgttggc 60000
cagcctggtc ttgaactact gacatcaggt gatccgtcca cctcgatctc ccaaagtgct 60060
gggattacag gtgtgagcca tcgcgcccgg cgcttcataa cctttttata ttgtctttct 60120
gttccccaaa atgaagtagt ttcttcttaa aaatactgtt ttttgttttt ttgttttttt 60180
ttttatttga gatggaatct ctctctgtcg ccaggctgga gtgcagtggc acgatctcgg 60240
ctcacttcaa cctctgactc cgtggttcaa gcaattctcc tgcctcagcc tcccaggtag 60300
ctgggattac aggcacaaat actgttttta ataagaaaat tagaataggg acaggcacaa 60360
tggctcactc ttgtaatccc agcactttgg gaggccaagg tgggaggatt gcctgagccc 60420
aggagttcga gaccagccta ggcaacatag tgagtgagac cctgtttcta taaaaaaaat 60480
ttttaattag tccggtctgg tggtgcacaa ctgatgtccc agctacttgg gagtttgagg 60540
tgggaggatg gatcacttga gcccaggaag attaaggcca caatgagctg tgatcatgcc 60600
actgcactcc agcccaggcc acaggtttca aaaaaagaga aaattagaat tatacgttag 60660
ggggaaaaaa cctaataacc atattcctat ctacctagtg accaccccta tgaagatcct 60720
ggtacatgtt ctcattgaaa tcttattttg aaatattttt gaattaaaaa aatatattat 60780
taccttggtt ttacaaatgt ttgcttgtct ttatgttcag ctacaatttt ctaatcacaa 60840
tggttttact ttttccttgt cagaaagtgg agctgttcca aaaagaaaag accccttaac 60900
acacactagt aattcactgc ctcgttcaaa aacagttatg aaaactggat ctgcaggcct 60960
ttcaggccac catagagcac ctagttacag tggtttatcc atggtttctg gagtgaaaca 61020
gggatctggt cctgctccta ccactcataa ggtattctgg gacagtaact ttaattgctg 61080
tctttttgca aatagaaaaa tttttaagat actattcctg cttaagttga tcataagtac 61140
tttataatac tttagagaat ggataagttt ccataaagtt aaattttttt tttttttttt 61200
tgagactctt gttttccagg ctggagtgca atggcgcgat ctcggctcat tgcaacctcc 61260
gcctcccagg ttcaagcgat tctcctgcct cagcctccca agtagctggg attacaggca 61320
tgcaccacca cgtcgagcta attttgtatt tttagtagag acggggtttc tccatgttgg 61380
tcaggctggt ctcaaactcc cgacctcagg tgatccgcct gcctcagcct cccaaagtac 61440
tgggattaca ggcgtgagcc accgtgccca aagttaattt ttttttaaat ccacagggca 61500
acttgctata aaactttttt tggacctcat tagacattta ataccaagtt ttgcttaccc 61560
agtctgtttt atataatgct gtatatttca ttttaaattt atttttaaaa ttatttcaat 61620
ctttgtaaat gttttatacc agtaacatac ctagagtttt gtcatgattc taacaagggt 61680
taaaatttgt ttttattttg taaaaactaa atctctggat aaaatcctct ataactgact 61740
taatgccaaa tatagttctc tagtgaatac agttttacct tcaggtaaat aaatatacaa 61800
tttatggatt tttataccct ttttcctatt tttaaagctt gaattctgtg aactttaagg 61860
ttaacttatt tatgaaaagt gtaaatgtta ggttgtattt tcatattaaa attttgtatc 61920
ctttaagggt actccgaaaa caaataggac aaataaacct tctaccccta caactgctac 61980
tcgtaagaaa aaagacttga agaattttag gaatgtggac agcaaccttg ctaaccttat 62040
aatgaatgaa attgtggaca agtaagtttt gccatctaaa tgttttattt tatagttttt 62100
atattttaat tttacttata aaacatgtca ggagtgaaat agataataaa taccttgtct 62160
ggtttacata cttaattttt atgatagttt tcaattataa atgtagaaaa ccattgcttt 62220
actgatttaa ctatagttta acagttaaca ttaaaaataa ctatatgtca tagggcttag 62280
gcttcatctt gtaataactg ggccctgttt gtatcgtaga actaactgag gtcttgtttc 62340
ttagtggaac agctgttaaa tttgatgata tagctggtca agacttggca aaacaagcat 62400

= CA 02348657 2001-11-07
23/66
tgcaagaaat tgttattctt ccttctctga ggcctgaggt aagaacttta tattatcatt 62460
tttctataat accatctgtt actgaatcca tagtagtagt agtagtaaag aaatatttga 62520
gctatactaa aataattaat tcatataagg taacaataga tttaatgttt taaaaaagat 62580
aaaacattaa caattgatgt tgagaagtta ttatagaata ggaaaatgga tatgagttcc 62640
taatttccaa tccttttata tttttaggaa aagtgggtag tatgatataa ttttgttttg 62700
ttttggagac ggagtctcac tcattgtgtc gcccaggctg gagtgcagtg gcatgatctt 62760
agctcactgc aacctctgcg tcccagaatt caagtgattc tcctgcctca gcctcccaag 62820
tagctgggat tacaggcatg tgccactatg cccagctaat ttttgtaatt ttagtagaga 62880
tggggttttg ctatattggc caggctggtc tttcatacct gatgtcaagt tatccaccca 62940
tttcggcctc ccagagtgtt aggattacaa gtgtgagtca ctacatctgg ccaaattttg 63000
atatcaaggt gagagagatt taaaattaag ataaggtaca aaaattagcc tagtgtgggg 63060
gcgcacgctt gtagtcccaa ctactgggga ggctgtggca ggagaattgc ttgaaccagg 63120
aggcagaggt tgcagtgagc caagatggca ccactgcact ccatcctggg tgacagagcg 63180
agatgtcatc tcaaaaacaa aacaggccgg gtacggtagt tcacgcctgt aatcccagca 63240
ctttgggagg ctgaggcggg cagatcacga ggtcaagaga ttgagaccat cctggctaat 63300
atggtgaaac cctgtcttta ctaaaattac aaaaattagc tgggcttggt ggtgtgtaac 63360
cccagctact cgggatgctg aggcaggaga atcgcttgaa cccgggaggc ggaggttgca 63420
gtgagccgag atcacgccac tgcactccag cctggcgaca gagcgagact ccgtctcaaa 63480
aaaataaata aaaatttaaa aagataaata cataaaaata aataaataat attaagagaa 63540
ggaaatcagg caggtagtgg cccctgacac aatgagtttt cccagaattg gattgcttgg 63600
aaatgccgct caaagagtgt ggtaaactcc atcgaaggct aaataccaac gtgacagtga 63660
taataaacaa gtactttatg ggaaagtttt ttttttaatt atttttaaaa agagagaaat 63720
tgtactggag aaaagaggaa ttcaggtaga ataattcttt tttttttttt ttttgagatg 63780
gaattttgct cctgttaccc aggctggagt gcagtggctt gatgttggct cactgcaacc 63840
tctgcctttg gggttcaagt gattctcatg cctcatcctc ctgagtagct gggtctatag 63900
gcatgcaccc caacacctgg ctaatttttg tgtttttagt agagataggg ttttaccatt 63960
ttggccaggc tggtctcaaa ctcctggctt cagatgatcc gcccaccttg gcttcccaaa 64020
gtgctgggat tacaggcaga ggccactgtg cctggcatga agaacaattt ttaaaagaat 64080
gacttttaag gatattaagt catcaaagta gatagagcca ttaaatgatg ggtagaaacc 64140
taatcttcca tcccatattt tatgacttat taaggaagat aggcaatctt gcagttgata 64200
ataaatattt ggctttccat acttagcacc gttttgaatt tttccagttc acagatggta 64260
tatttagtgc tgttccaata atattgcaaa aaataaatct gaagactcac ttctgggtca 64320
cagttatttc actattaaca ttaaaatctt acggacctac ctgcaacatg tagtggaaat 64380
aagttgtgtg gcacgttgtg gtgggtgcat tattaaataa atgtgcaaag gttttatggc 64440
tgtctcaatt tttccatagt cttgagtcat tcacatactg cctttatggt gtttatcact 64500
tgtaagtgag taccaactgt actagaactt actgaatatt tttcaagtct attttactta 64560
ttactcattc taagtacata aaatcactgg tctgatatgc aagttaggtt ttcgctaata 64620
cccagtaaaa taattagata attattaaaa tagaaagcat ttgtcattat gtgaactgga 64680
tttatgtcat gtaccacctc aggtcacact ttgggaaacg tagcttacgt attgagctaa 64740
cattttgctg gagttatata agattagtaa atgctataga ctaaatattg aaaaaaaagc 64800
ttgcttaaag aggatttaca taattgtaga cctgaaaagg atcttagcag tcttctgatc 64860
gattcattga taaagaaact agtcctaaga gctaaaatga cttgctcaag attttagtta 64920
agtggtagac ctaggaaata cctttctaag attagagctg cctggttagt gctatagctg 64980
ccacctaatt cttacattta tttattaagg gacatgcttt ttacggtaga aaaatatatc 65040
taaaattgtg aaggtaatac caaggaaata tttaggctat gcaagaaaag tcattcagct 65100
tttgctttac ccaggcctat agagaacata tctaaaataa taagtaacat gtgaatttga 65160
atttaggcat attttcatgg tagtgacata atgtgcaatt aagaagctat aataatgtaa 65220
aaatgccagt tgcaagttat ttcaaataaa gttgaataac ctgacctcag gaggggcaga 65280
aaccttagta aacttagcaa actgagacct aaggaagagc aagatctgtg gtagagccag 65340
gtctaaaggt ttatatcctg gtacaaactt gtctatacat caccacacct gccaaatgga 65400
actttttttc cttgtagttc agatttccaa gaaagggaat attattgtcc tagctcagcg 65460
tttcacaata gactcacaaa atgaatcttg ttaagcctat gaatgggtaa gacttatccc 65520
ataacacgcc tctattgtgt aaaaaaatca gctttattcc taattccctg tagtaggaag 65580
cttgcataga ccacaataga gacattgtta gattatatca agaaggtgag tggcaggcat 65640
tcttgagtat actggaattt ttatttcatt gtagaaacac agaatcataa ttagtcatct 65700
aaaactggtt ttaaggagat aatactaaag atactcactt gaggtagatt gttctcagaa 65760

= CA 02348657 2001-11-07
24/66
ttacttaaaa taagtgcttt aaatcttgct cattcatgaa gccatagccc tggaaggaga 65820
tattgaaaaa cttctccatc ttccttcaat cccataggac catgttttta attgtagttt 65880
aacattaaac ataatttttg aaagtagcca atattaatct ttgacaaaaa actcaaacta 65940
aatagcagaa aatagaacat gccctctcct ctcgcccaaa agtaagacta cattttaaag 66000
tatatcacag tgatctgtct aaatattttt ctcaaatatt ttactaagaa agcgtatatt 66060
cttctgtcct tatttcatag atctcttctg tatcctgtgc agcttgtcta tcatttcgag 66120
cttttatatt tcttattttg ttctcttgct gcttaaatgt gattctttga gatttataga 66180
agaatgtgat tgttctccag ttttaaaaag ctcttctcta tctactaaaa tttccatgaa 66240
tttctttctt tctttttttt tttttgattg agacagtctc gctgtgttct ccagcgtggc 66300
cttaggctta agtgatcctc ctgtctcagc ctcccaagta gctgagatta cagaaatttc 66360
catgaatttc caaatatgat gttatctttc atataagctt aaacataagc ctttcttctt 66420
tcaaaaatgt tagaacttac ctctttaaat aatcttataa agccatttct taatttttgt 66480
taccttttcg aatctattaa cttgcatatc atagtaaatg aacccttagc tccatcatac 66540
cacacacctt ctactcctgt cctcccactt tttctcaccc aggctggagt acagtgaata 66600
tttagtgctt ttaaatatta ttcattacca agccaagtag cgtactattt tttccttgta 66660
cagccttttt ttcccctaaa taattgtgtt attttttcat ttgcttcatt ttcatcttat 66720
cgattgataa ttcttctgtt ccatttcagt ctaatttcca catggccaaa ccaatctaaa 66780
aacctgttaa ctcaggtctt tttttttttt ttttttccca gaataccttt tcctggaacc 66840
accttcttct tttcattcga gaccaaatgc tttccatgcc tgtgtcaaag tggttgttct 66900
ctaatctgtc ttcactacca tcataatttc cttttccttt tttcctttct ttattatgta 66960
tctcctgtct tttaaattcc atattttcca ctttcatgat ttattttctc attttgatgg 67020
ctacatcttt cagtaactga gaaaaggttg tgtgagggaa tattttgaga tgctgtagtt 67080
ttgaaaatat ctttattctg ctgtcttctc attaataatt tgactggatg tcaagattta 67140
agttggaaac tattttccat gagtattttg aaggcattat ctattgtctt ctagcttcca 67200
gtgctgcttt gtattagaga cagaagatca ggaatcagga tagcattgga cttcttattt 67260
ctatttccca aagctttttg gatcttctct ttattcttat cttctgatat tttataatga 67320
tatgcttgat gcatttactt tttcttttct tcttccctct tgtacatttc tttctttttt 67380
taggtggggg caggggggaa ggagtctcac tcttctcacc caggctagag tgcagtggtg 67440
caacctcagc tcactgcaac ctccacctct ggggttcaag cgattctcct gcctcagcct 67500
cccgagtagc tgggattaca ggcatctgcc accacgccca gctaattttt gtatttttag 67560
tagagacggg gtttcaggct ggtcttgaac tcctgacctc aggtgatccg ccctcctcag 67620
cctcccaaag tgctgggatt agaggcatga gccactgcgc ccagcccctc ttggaccttt 67680
ctagatattc atccttcaat tctgagaaag gttctataat tctttaattt aaaaaaagtt 67740
tttttgtttc atctttctca cttttttttt tttttttttt ttttaagaca cagtcttgct 67800
ctgtcaccca ggctggagtg cagtggtgcg atctcagctc actgcgccct tcgcctcctg 67860
ggttcgagtg attctcctgc ctcagcctcc caagcagctg ggattacagg tgcccaccac 67920
caccatgccc ggctaattgt tgtattttta gtagagacgg agtttcacca tgttggccag 67980
gctggtttca aactcctgac ctcaggtgat ccacctgctt tggcctccca gagtgctggg 68040
attacaggca tgagccaccg tgcccagccc tattctgatt tcatagatgc agtgtctttt 68100
atgtctctga gaggttttgt caagttttct tttgtttact ttattatctg tttcttcaag 68160
attcctcctc ttttcttttt gccttaagct ttttcatatt ggaagcttct ctcaaatgtc 68220
tggttattct ggttgtccac ttatattacg tggaacaata aaaaagttga ttaggactct 68280
gtgctgtaag taagtaaatt gttgatagtg agagcccatt aatcacagga tgatcaagca 68340
gcaagcctac tgtttatttg ggtttctcca aatggctata gctgtcagtc ttttttttct 68400
ggggttattt ggcttctcta gaaaagaatt ttctagtctc ttgtttggag aatacaagct 68460
tgactattgg tgttccagaa aatgggtggg aggagacgac tttgttttct gttaggttga 68520
gccatgtgaa attactaggt tttgttttgt tttctgtttt gttttgagac agagtctcac 68580
tctgttgccc aggctggagt gccttagcat gatcttggct cactgcaacc tctgcctccc 68640
aggttcaagc aattctcatg cctcagcctc ccaagtagct gggattatag gcatgcacca 68700
ccacgcctgg ctaatttttg tatttttagt agagacgggg ttttgccatg ttgaccagtc 68760
tagtctcgaa ctcctgacct caggtgatcc acctgccttg gcctcccaaa gtgctgggat 68820
tacaggtatg agccaccaca cctgggctga aattactgtt tttataggtc aaaaacagtt 68880
gagggatagg catggtggct cccacctata atcccagcac tttcagaggc caaggcagga 68940
agattgcttg agtccaggag ttcgacacca gcctgggcaa tgtagtgaaa ccccatctat 69000
atttaaaaaa aaaaaataga tgaatatctt tgtttgcaga taacatgatt gcatatgtag 69060
aaaatcccaa agaaccaaca aaaagagctc ctagaactaa taagtgatta tgacaaggtg 69120

cA 02348657 2001-11-07
25/66
tagaatacaa agttaatata caaagtcaca ttgctttttt atctaccagc agtgaacaac 69180
tggaatttga aattaaaaca caatactgct gggtgcagtg gctcacacct gtaatcccag 69240
cactttggga ggccgaggtg ggcagatcac ctgatgtcag gggttcaaga ccagcctgac 69300
caatatggtg aaaccccatc tctactaaaa atacaaaaat tagctgggca tggtggcggg 69360
tgcctgtaat ctcagctact caggaggctg aggcaggaga atcgcttgaa cccaggaggc 69420
agaggttgca gtgagccaag atcgcgccat tgcactccag cctgggggac agagcaagac 69480
tccgtctcaa aaaaaaaaac acaatacctt tcatattaac actaataaaa tgaaatatgt 69540
gtagttctaa caaagtttgt tgtagaagat ctatatgaga agaattatag cactcatgaa 69600
agaaatcaaa gatctaagta aactgagaga tattccatgt aaatggacag ggagactaaa 69660
tattattgag atgtcagttc ttcccaagtt catatatcga ttcagtgcag tcccagtcaa 69720
accccagcca gttattttgt ggatactggc aaactaaagt ttatatgaaa aggcaaaaga 69780
cctagaacag ccaacacagt attgaagaag aaaaaagtca gaggactgaa actacccaat 69840
ttcaagactt actgtaaagc tacattaatc aagacagcat gtcattggca aaagaataga 69900
caaataaatc agtagaattg gacagagagc ctagaaatca acccacacag ataaagtcaa 69960
ctgatctttg gcaaagggac aaagacaatt cagtggagaa aagatagcct tttcaacaaa 70020
tggtatagga caactggaca tccacatgca aaaaagttaa tctagacaca gacctgacaa 70080
ctttcacaaa aataaatgga tcatagacct aaatgtaaca tgcgaactga aacttctaga 70140
ggataacata ggagaaaatc taggataaca tgagaaaaat ttttggtttg gcagtgactt 70200
cttaggtaca ataccaaaac atgatccttg aaaaaaaaaa tcagtatgtt gaactttgtt 70260
taaattataa acttctgctc tgtgtaagat gctgttagga gaatgaaaag acatgcagca 70320
gagtgggaga ctttacaaaa ttcattatct gatgaaggac cagtatccaa aatatacaaa 70380
gaacttttaa aactcaacaa taagaaaata tacaacccag ttaataaatg ggcaaaatat 70440
ctgaacagac acctcaccaa ggaagataga tagatgacaa caagcatatg aatatatgct 70500
caacatcatg tcgttaggga aattgcgcat taaaacaaca acaagatacc ctgccatccc 70560
tattagaatg gctgaaatct aaaacactga caacaccaaa ttctggcagg gatgtggagc 70620
agcagaaact ttaattcatt gctgatggaa atctaaaatg gtagaaccat tttggaaggt 70680
agttggacag ttttttacag aactaaagac agtttgacag tttcttacaa aactcttacc 70740
atatggtcca gcagtcttac tccttagtat ttacccaaat aagtttaaaa tgtacatcca 70800
ataaaaaaaa ctgcacatga atatttctag cagcattatt catagttgcc aaaacttgga 70860
agcagtcaag gcatccataa gtaggggaat ggataaacag actttggtat atcatgtaat 70920
ggagtattat tcagcaataa aaagaaatga tctatcaagc cacaaaaata tatggaggaa 70980
ccataaatgc atattgctaa atgaaagaag ccagtctgaa gaggctacac tataggattc 71040
tgactatatg atgttttgga aaaggcaaaa ctatggaaac agtaaataga tcagtggttg 71100
ccaagggaga cagggagaga tgaataggtg gagcacagtg gatttttaag gcagtgaaac 71160
tgttctttat gataatccaa tggtggatac atgtcattat acctttgtca aaacccacag 71220
aatataaaac ataagagtga accctaatgt aaaatatgga cttcagttaa taataatata 71280
tgaatatttt ttcattagtt ctaacaagtg tactacacta atacaagata ttcagagtag 71340
gggaaattgg aaaggaatga gaggttatat gggaactctg tactttctgc tcaattttct 71400
gtaaacctaa aatcactaaa aaaaaagttt atttttattt ttattttttt ttaattttta 71460
attttttgag atggagtttc actcttgttg cccaggctgg aatacaatgg cacgatctcg 71520
gctcactgaa acctccgcct ccagggttca agcgattctc atgcctcaac ctcccgagta 71580
gctgagatta caggcatgtg ccaccacgcc cagctaattt tgcagtttta gtagagacag 71640
ggtttctcca tgttggtcag gctggtcttg aactcctgat ctcaggggat ctgcccgcct 71700
cggcctccca aagtgctgtg attataggcg tgagcagctg cgcccagcag gttttttttt 71760
ttaagttgga tattagccat ttcatatgat tcaacttaaa agtacataca ccttcactgt 71820
tattaaagtg taggtgagat gttttcagtc tggagctcta cccttgattc ctgccatgcc 71880
tagtgtccct gaatctggag actctgactt atttctttag agaacgaaac tcctgccttc 71940
tgctttggtg gtgattggta cctgcttgac tgcctttggt ggggagttcc tcataccaac 72000
tttcaatcag ttcctgtgtt tgtttgtttg tttgtttttg agacggagtt ttgctctgtc 72060
gcccgggttg gagtgcagtg gcgcaatctt ggctcaatac acgctccgcc tcccgggttc 72120
acgccatttt cctgcctcag cctcctgagt agctgggacg acaggcaccc gccaccacgc 72180
ccggctaatt tttttgtatt tttagtagag acggggtttc atcgtgttag ccaggatggt 72240
ctcgatctcc tgacctcgtg atccgcccgc cttggcctcc caaagtgctg ggattacagg 72300
cgtgacgact gtaagccacc gtgcccggcc agttcctctg tttttgactg cctgccttac 72360
tactgctttc tgtggtgcct gataacatcc aattcctgaa ccttcctggg atttttgttc 72420
acgtcagcgt gcttcttgca tttaggtatc ccttcacaag taggcattta ggttttaagc 72480

cA 02348657 2001-11-07
26/66
tctgctaagt gatttaccac actttatcag ttctccattt tgtggaattc attgtgttaa 72540
tctccttttc tatttttgtt tggaagattc atatattttt tattcattta gtattttttg 72600
gtgggatttc taagtagaga aacatgccta tgttcaatat gtcttgttta agcagtctgc 72660
tttcattttt accaccgagg agttggtttt atttcttttt tttttttttt tttttttttt 72720
ttttgagaca gggtctcact ttgtcagcca ggctggagta cagtggcaca atcaaagctc 72780
actgcaccct tggcctccca agctcaagtg atcctcccac ctcagcctcc tgaatagctg 72840
ggagctcagg tgatccagca cacccagcta attttttttt tttttaattt tttgtagaag 72900
cagagttccc ctatgttgcc caagctggtc ttgaactctt gggctcatgt aatcctcctg 72960
tctttgcccc ctaaagtctg ggattacagg tgtgagccac cacacccagc tgtttttaat 73020
tattacatta atttatgatt atgtgtttcc tttaaagcta tgggcagctc tgtttgggaa 73080
gatgctactg aaaaaaggat gctttttaga tggcaaagag tacttaaaat gtctctagaa 73140
tcatagttgt aaactaaagt atatattttt tagttgttca cagggcttag agctcctgcc 73200
agagggctgt tactctttgg tccacctggg aatgggaaga caatgctggt aagggttctc 73260
ttcaaatttg agttttctgt tgagatattt gggataatat gaaaaaaaga aactttatct 73320
tgtccttgag tctattattt acgacttgct ttttgctatt gtacactttt gttttttttg 73380
tttgtttgtt ttgttttgtt ttgagtgatc tgggctcacc gcaacctccg cctcctgggt 73440
tcaagcgatt ttcatgcctc agcctcccaa gtagctggga ttacaggcac acgccaccac 73500
acctgtctag gttttttatt tttggcagag acaggatttc gccatgttgg ccaggctggt 73560
gtcgaactcc tgacctcaag cagtcctcct acctgggcct cctaaagtga tgggattaca 73620
ggcatgagcc actgcacctg gctgatacac ttttaagttt ttcagctact tttcaatgta 73680
gaagtagatg gaaaaccatg tacgttatct tcagtagtgt gtttttggtt ggttaaattt 73740
gacagtatga ttgtcattat tttttgtaaa ttaaattttt acctggaaga gcttacctta 73800
ctatattgag tatctttcta acccctgatt tttgcttcta ctatcataat aactttattt 73860
aagtaatcag tatgttatag cttttttttt tttttaagta ttcttttgcc agaagttttt 73920
atcaggctct ggatacctct ttcctctgca tagtcctcct ggatggaaga aacaaagagg 73980
gaaagagtaa cttttcctta gatgtttgtc tttctcaaag cagttatctt tgtatatcta 74040
agaagagagg agaataacac tgtctctctt tttttttaaa tctctctcta ctcattctct 74100
ctcaggagga gagtagaaag aagcacagct cttcctataa cctgtcctta ttactgagaa 74160
aggaacacat tgattgccat gtattgggga ttgtattata ccttacattt ttatttttat 74220
tttttattaa tttttttttt tagacagtct tactctatca cccaagctgg agtgcagtga 74280
tgtgatctcg gctcactacc atctcttcct tctgggttca agcaattctg ccacgtcagc 74340
ttcctgagta gctgggatta caggcatgcg ccaccacgcc tgactaattt ttgtattttt 74400
attagagatg ggatttcacc atgttggcca ggctggtctc aaactcttgg cctcaagtga 74460
tgcgcctgcc tcggcctccg aaagtgctgg gattacaggc atgagccacc acacctggcc 74520
tcatagctta catttttaga gaatcttttc tagtacttaa atcggtaaat atggttatct 74580
tttaaatgta atatattgaa ctaatttaat atttgctctt gtgattttta aaggctaaag 74640
cagtagctgc agaatcgaat gcaaccttct ttaatataag tgctgcaagt ttaacttcaa 74700
aatacgtgag tgctctgttt ccaatattgt cgtattttaa gttactgtct aaatgttact 74760
gtgttaactg taaatggtaa tatttcatga aaatattttt ctaggagctt atctattgta 74820
tctattattt acatatgatg aatatctatc ttcagagtag aaagttatgt acatttgtgt 74880
tgtcaaatac tgtattagtt tactggggcc atgtaataaa ataccgtaaa ctggctggct 74940
taaacatcag caatttattg tctcacagtt gtggaaggta gaagtctaag atcagtcaaa 75000
atgttggcag ggttgcttcc tcctgagggc tgtgagggaa aatgtatgtt gtgtgcctct 75060
ctcctggctt ctggtggctt gctggcaatc ttttgtattc cttggcttgt agatgcatcc 75120
ctcctatctc tgtctttatc tttatgtggc attctccctg tgtctgtcac catgtccaaa 75180
tttcccctgt ggattaggac ccaccctaat gatctcaatt taagtttgtc atcagcaaca 75240
attctatgtc caaataatgt cacattcata ggtactaggg ataggacttc aacacgtttt 75300
tggagaacac agttcaaccc attaacaaat actatcactt tccacttaag cttcaagtaa 75360
agtggatttt atctcaagga gccaccagat aggaacacag atctgatggc ataaactgag 75420
tatttctggc cttctgattc tgatctaaaa tatgacagaa gattttccct gttttaattt 75480
tttttttttt tttataatag agacacagtc tcgctatgtt gccaggctac tttcaaattc 75540
ctgggcttaa gcaatcctcc tgcctcggac tctcaaagtg ctggaattac aagtgtgagc 75600
accacacct ggccagtaga ttttccctgc tttcttttga ttgtttataa ttttgttttc 75660
ttttccatt caccctctgc tgaccctata gtattattca aagaagtgtt cagtctagtt 75720
ttggggtagg gcaagcataa ctacagtgct taaagagagt aatttgtctg gtgtgcagaa 75780
ctagtgtgta aatataactg gtgcattgca aaactgtgaa gtagtttctg tcaaacctta 75840

CA 02348657 2001-11-07
27/66
cactgctttg tctttctccc tctctccctt tctcttggtt gccccctccc cctcccaatg 75900
ataccttagt ctctgcttgc ctttatcaaa acctttatga ttggccgggc acagtggccc 75960
tgcctataa tcctagcatt ttgggaggct gaggcaggaa gatcacctga gcccagaagt 76020
tggagaccag cctaggcaac atggtgaaac cccatctctt ccaaaaataa aaaatagagc 76080
caggtgtggt ggcatgcacc tgtagtccca gctactcagg aagctgaggc gagaggatct 76140
cttgagcctg agaggttgag gctgcagtga actgtgatca tgccactgca ctccagcctg 76200
agtgacagtg tgagaccctg tctcaaagaa acaaaacaag ggggggcatg gtggctaact 76260
cctgtaatcc cagtactttg ggagactgag gcaggaggat tgcttgaggc caggagttca 76320
ataccaccct gggcaacata gtgagacccc catctctaca aaaaataaaa aatttagctg 76380
gacatgccag cgaatacgtg gtcccagcaa atcaggaggc tgaggtggga ggatcacttg 76440
agtcaaggag gttgaggttg cagtgagcca cgatcatgcc aatgcattcc aacctgggcg 76500
tcagagcaag accacgtctc aaaaacaaaa caaaacaaac ttttatggtt gaaagtgttt 76560
tggcaaacat acttaaactg aaatgtgaat ctctgatgaa agaacatgtt acctgtaaaa 76620
gtttgaagtg tcagcatttg ttgcaccgaa atccagaggt gaggccaggt gtggtggctc 76680
acgcctgtaa tcccagcact ttgggaagcc aaggctggca gatcacctga ggtcaggagt 76740
tcaaaaccag cctggccaac attgcaaaac cccgtctcga ctaaaaatac aaaaattagc 76800
cagacttggt ggtgtgcgcc tgtaatccca gctattcggg aggctgagac acgagaattg 76860
ctcgaaccca ggaggcagag gttgcagtga gccgagatgg caccactgca ctccagcctg 76920
ggcaactgag tgagactctg tctcaaaaaa aaaaaaaaaa aaaaatccag aggtgaatcc 76980
agaggtgatc accacatgat atccagatag cctctttcca tgagaggctc aaaggataat 77040
tttactgtct acagttttgc agcgagagaa acttgatttt atcagtacac caagagcaga 77100
tctatgtctt cggaacagac atgagatcag aattgtctag ctgctatgaa cagcatgttc 77160
tctccctgta cctatagaca tgtatgggaa acttatttgt aaggttgtat aatgagcagt 77220
gagttaaagc aaacttgaca tgttgaccat agttgttatg gcattggact aaagtagcct 77280
ccatcactat gatagagata gccttggtgt tggacccata gtttttgaag tctgtttgct 77340
aagactccct cttccttagg cagttcttca aatattatta tgctttttcc tgtcatggga 77400
ttcctcttca tggagtttcc tttctcagga acactatctt ctcctggtta atttgtactt 77460
attcttcaga taccagttga aatgttacaa ccttccctga ccctccaaac tattccccgt 77520
tattattctc ctagcaccac ttgcacctca ttttcatact cactggagtt gcaattcata 77580
ttcattgata ggattatttt aattgtatct gatatcactg tcacctccac tagaagatgg 77640
tctccatgcg ggcagagact atcaccatgt gttcttcact tcaattttca gtagttggct 77700
gtgagtaggt attgaataaa tatttgtgga gtaatcataa tgaggtatag atattattct 77760
catagctcta ttttattaat tagggaatta cagaattcag tgatctgctc aggatctcat 77820
aaccaggaag tgggaaacta ggatttgagc tccagtgagt gtggcctttc attaaaaata 77880
ttacagcaac cattctcttt tttttttttt ttttttttga gatggagtct tgctctggag 77940
tgcagtggcg tgatctcggc tcactgcagc ctctgcctcc cgggttcaag tgatccccct 78000
gccttagcct gctgagtagc tgggactaca ggcacccgcc acgacacttg gctaattttt 78060
gtattttagt agaggcgggg tttcaccatg ttggccagga tggtctcgat ctcctgacct 78120
tgtgatccgc ccgcatctac ctcccaaagt gctggattat aggcgtaagc caccacaccc 78180
ggcctacagc aaccattctc ttttatccat acttttttca agagtactgt ttcatcttca 78240
tgttttcaga aacaacatag cattcatgat cttaaccccc aattctgata ctgcctgaat 78300
atcttgaagt aagtttactt ttaagaaagt tgaggctagg tgtggtggct catgcctgta 78360
atcccagcac tttgggaggc caaggcaggt ggatcacttg agctcaggag ttcaagacca 78420
ggctgggcaa catggcgaaa ccctgtctct accagaaata caaaaaatta gtcgggcgtg 78480
gtggcgtgtg cctgtggtcc cagccacttg ggagactgaa gtgggaggat ttcttgagct 78540
tgggaggtgg agtttgctgt gagccgagag atcatgccac tgtactccag cctgggtggc 78600
agagtgagat cccatctcaa aaaaagaaaa gaaaaagaaa attgaaatgt ctagtctatc 78660
attttgtcag ttctatctaa tacaattttt tccttatgtc taactgaaat ctgctttttc 78720
taatttttac atacttgatt taacaaaact caatcttttt ttttttttat gagacagcct 78780
ttcaaatata taggaactta atgttatatc tgcttccctc cagtccccag aatagttact 78840
attttagttg tctttctatg gtctcatgcc agtttgtcag tatgcctaga taagaactga 78900
atattttacc tcagatgtga cctgactttg aagacttaaa aaggaagcat tgtgccaggc 78960
gcagtggctc acacctgtga tcccagcact ttgggaggcc gaggtgggca ggtcaggagt 79020
ttgagaccag cctgattaac atggagaaac cccatgtttc tctactaaat acaaatctct 79080
actaaatact aaatactaaa tctctactaa aaatacaaaa gatgagctgg gcattgtggc 79140
acatgcctgt aatcccagct actcgggagg ctgaggcagg agaatcactt gagcccagga 79200
_

cA 02348657 2001-11-07
28/66
ggcggaggtt gcggtgagcc gagattgcgc cattccactc cagcctgggc aacaaaagtg 79260
aaactccatc tcaaaaaaaa aaagcagcag cattgtgtaa tattatgtag atgttgtgtc 79320
tcatgatcta tcctgagaaa gcttttggga ggaactgcat catagtcatg gacaacattt 79380
gtgttattaa aatatctaga ttattttcca caaaaaatca gttacatatg tatcttaaca 79440
tgttgtatta ttgtttaacc ttgtttattg aataactaac atgtagaaaa gtatttatag 79500
cataagtata cagctgtata cagctcagtg gattaccaca aagcgaatat actttcataa 79560
tcaccaccca ggtcaagaaa taaattgtta cctgtggccc taaaatccct ccaggcactc 79620
caccatcttt atccactcac tcctctccct caaaaccact agactactaa catcatagac 79680
aaagctagca tgcctttgaa ctttatataa atctaatgat gtaggatttt gtgtgtatgt 79740
gtatttggct tctttcatca gcattgtatt tgtgagattt atccagattg ttgcaagtag 79800
ttgtagttgt gcttttttac acagatttaa tttttatatt tttcttatat gttcgaacag 79860
ttaacctgct tatctattat taaaaaaaaa aaaacgaaca ttcacatagt tcttaccagt 79920
ttacagtgtt ttttccacac cgtcttcaaa atgtaaagtt tggtcttcaa tacatcagta 79980
tgctgctaga tttaaatact agggaaaaaa aaatcagaga agttaataat attaactgtc 80040
acctccacta gaagatggtc tccatgtgga cagtaatatt tctcttgtat tatctgtgct 80100
aagtaaaatc ttctgtaagt ttctttaaat attttaataa atcatagtac ttaaaatgtt 80160
ctcaatattc taaagtagtt aaaagtaact ataaaatagt acctgttttt ctgatcacat 80220
tttacttcct atgtgaaatt ttacaagtcg ttactctatt tatttattga tttatttttt 80280
aagacagggt ctgttctgtc gcccaggctg gagtacagtg gcgtgatcat ggctcactgc 80340
agcctcagcc tcctgggctc aagtgatcct cccaccttag catcccaagt agctgggact 80400
ataggcacat gccaccatgc ccagctaatt ttaaaaaatt ctggggggcc gaatgcggtg 80460
gctcacacct gtaatcccag cactttggga ggccgaggca ggcgaatcac aaggtcagga 80520
gttcgagacc agcctggcta acatggtgaa accctgtctc tactaaaaat acaaaaaatt 80580
agcggggtgt ggtggcaggc gcctgtaatc ccacttactc aggaggctga ggcaggagag 80640
ttgcttgaac ctgggaggca gagattgcag tgagccgaga ctccatctca aaaaaaaaaa 80700
attttttttt gtagtgacaa ggtgtcactg tgttgccagg gctggtctca aacttctggg 80760
ctcaagtgat cctcccattt cggcctccca aagtgctagg atcacaggca tgagtcactg 80820
tgcctggtct tcaagttgtt attaaagcat gtttacccac attatgcaca tggtataatg 80880
gaaagtattg ttgtggaagt taggagatag ggattctagc ctagcttttt atttttttgg 80940
gacaaggtct cactttttcg ccccaggccg aagtgcagtt gtgcgatctc ggctcactgc 81000
aacctccaac tctcaggttc aagcaattct cccacgtcag cctcccgagt agctgggatt 81060
acaggcatgc gccaccacgc ccggctaatt tttgtagttt tagtagacac agggtttcac 81120
catgttggcc aggctggtct tgaactcccg acctcaggtg atccacccac cttggcctcc 81180
caaagtgctg ggattacagg catgagccac cgcacccggc ctctagcgta acttttacat 81240
cctgaactga ccttaagaaa gtataacttt aggcctgttt catctgtaaa atgttaatgt 81300
cataggagat gatcttttga gatttctttc agctctgata attttgtgtg tgtgtgtgtg 81360
tgtgtgtgtg tgtgagatgg agtcttgctc tgtcgcccgg gctggagtgc agtggtacca 81420
tctcggctca ctgcaagctc cacctcctgg gttcacgcca ttctcctgcc tcagcctccc 81480
gagtagctgg gactacaggc gcctgccacc acgcctggct aattttttgt atttttagta 81540
gagacgaggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc gtgatccgcc 81600
cgcctcagcc tcccaaagtg ctgggattac aggtctgagc cgccgcgccc ggcctagaat 81660
atttgtttcg attattctaa atctggtgac atttcttttg tttttaagtt aaatcttcag 81720
taaaaagaat aaatgccacc tagaggacag aaaaattttt acagtagatt atcacagacc 81780
tcatgactca ttactttggt gtataaaatg gcctttgtat ggtgtcagca cctgggaatg 81840
tctcaagggg tgttcattga ccttctggac tatctggaaa tattttgata tttattggct 81900
gggcgcggtg gctcatgcct gtaattccag cacctcggga ggccaagtta ggtggatcac 81960
ttgaggtcag gagtttgaga tcagcctggc caactaagtt agttgactat ttgtgaaatt 82020
tccctctcca aataggaaag ataggattgg aaacattatt cagaaggaag aagttttaaa 82080
gaagggcagg cttaaagact atctaatgaa tttaccaata tggtaaaacc ccatctttac 82140
taaaaataca aaaattagcc aggcgtggtg gtgggcgcct gtaatcccag ctacctggga 82200
tgttgaggga tgagaatcac ttgaacccag gaggcaaaag tcacagtgag ccgagattgc 82260
accactgcac tccagactgg gctatagagc aaaactctgt ctcaaaaaaa aaaaggaaaa 82320
aaaaaaaaga aattttgata tttatgtgag aatgactttt cacggtgttc ttaatagcgc 82380
aagttttgtt taggagagca cattccaact tacttgcttc tataaatata ccgtgtaatc 82440
tagggcttaa agaatatgta caatgtcttt ttctctcccc tagtcttccc cttttctcac 82500
tagttatatc cttgactgaa gagctatttc attctcaagt cttaggaatg cagggtgaag 82560

cA 02348657 2001-11-07
29/66
caaaacagat gaatttttaa agcacttaac caggctgtat gaaatcacag tctgttgtct 82620
aaaattgtaa gggacggtta gtagtactct cccctttctc aaaccaaatc tttggttgtt 82680
ttaaggaagg gaaattaaat tcctgtgtgc tagattttca acataaaatt taaaaaactg 82740
gaataatgtt gcattttatg tgtataacag tataatgctt tgttttaggt gggagaagga 82800
gagaaattgg tgagggctct ttttgctgtg gctcgagaac ttcaaccttc tataattttt 82860
ataggtaaga acatattttc caactaagtt attgactatt tgtgaaattt ccctctccaa 82920
ataggaaaga tacgattgga aacattattc agaaggaaga agttttaaag aagggcaagc 82980
ttaaagacta tctaatgaat ttagtaggac ccactatatt aataagtagt aaactagatt 83040
aatctcagat gactcacata gcttggtctt taattaaagt cttatacttg tatttcctct 83100
agatgaagtt gatagccttt tgtgtgaaag aagagaaggg gagcacgatg ctagtagacg 83160
cctaaaaact gaatttctaa tagaatttga tggtgtaagt gttgattatg atatttttaa 83220
tgtggcagca ttttagtata ttttcctatt aaatggccaa ggttaaaaat acaaatatct 83280
ttatatttgt tattactttt ctaaatgaat tgaaaaaaga ttttttgctt gtaggtacag 83340
tctgctggag atgacagagt acttgtaatg ggtgcaacta ataggccaca agagcttgat 83400
gaggctgttc tcaggtaggg agatttatat ggaaatacat gcatttatta cagacaatat 83460
ttactcatgt gtccatctta catattattt ccttactctc agttttaaga ctaaattcac 83520
tattttcttc cagtactatc tctagcctct tgttaccaac tacataagga ttttgaggtc 83580
aacagcttga tatcaggaga attagtctag taaaggttta gttacggttt taggcaaatt 83640
ggtcagttct tctgggttgc attaaattat ctttaaactt gaaaattgat tcttaccgtc 83700
ttttattggg cttcatgaga aaataatcaa atcagggttc atggaaaatg tgttttctgt 83760
tcttgtgtgt ttgagcagtt tattcccttc atactggaag gacggtttgg gtcagcataa 83820
aattcttggg catcctttcc caaggaattt acaatattgc tccattgttt ctagattggc 83880
tgtagtagtg taaaagtctg aatccaaatt gattttttca aatttgtaaa ataacttgat 83940
ttttttctct ctttactgga tgggttacgt gggtatattg cacccaggta gtgagcatag 84000
ggtgcagtag gtagtttttc aacccacacc tcactgcttt cttcccccat gtagtagtcc 84060
gcagtgtgta ttgttcccat gtttatgtcc atgtgtactc aatttttagc tccccactta 84120
tgagaacatg agctatttgg tttactgttc ccacattaat tggcgtagta ttaaggcctc 84180
cacctccatc catgttgctg caaaggacat tatttcattc ttttttatgg ctgcgtagta 84240
catagtattc catggtgtgt acgtaccaca ttttctttat ccagtccacc attgatggac 84300
acttagattg attctatgtc tgctgtcatg aatagtacag caataaacat gaaatgcatg 84360
tctttttggt ataatgatct attttccttt gggtatatac ccagtaatgg gatttcaggg 84420
tcaaaggtag atttgtttta tgttttttga gaaatcttca aactgctttc tacaatgact 84480
gaactttaca ttcctaccag cagtacatac gctccacaac ctcaccaaca tctgttattt 84540
ttttactttt tcccgccaat ctgtagacaa tatgggattt tttttgccat tttattaata 84600
gccattctga ctggtgtgag atatctcatt gtgattttga tttgcatttt tctgatggtt 84660
agtgatgatg agcatttttt catgtttgtt gtcccctcgt atgtcttttg agaagtgtct 84720
attcatttcc tttttaccca ttttttaata gggttgtgtg tttttagctt gttcaattgt 84780
ttgaattcct tatagattct ggatatcaga ccattgttag atgcagttct gtagattgtc 84840
tgtttactct gttgatggtt ctttttgctg tgcagaagct ctttagttta attaggtccc 84900
acttgtcaat ttttattttt gttgcaattg tgtttgggga cttagccaaa atttctttct 84960
gaggctgatg tcaagaagtg tatttcctag ttttcttcta gcatttttat actttgagat 85020
cttacattta aatctttaat ccaccttgag ttaatttttg tatatggtga aaagtaaggg 85080
tccagtttca tttttctaca tatggctagc cagtaatccc catgccattt attgaatagg 85140
gagtcctttt cctcattgct tgtttttgtc agtcttatca aagatcagat ggttataggt 85200
gtgtggcttt atttctcaat tttctgtcct gttcctttgg tttgtgtgtc tgtttttata 85260
ccagaattat gctgtttggg ctgctgtgta gttcggttta aagtcaggta acgtgatact 85320
tacagctttg ttctttttgc ttaggattgc tttgtctatt tggactcttt ttttgcttcc 85380
atatgaattt tagaatattt ttttctaatt ttgtgaaaaa caacattgat agtttgatag 85440
aaataccatt gaatctgtaa attgctttgg gcagtatagt cattttacga ccagataaat 85500
caggcaagag aaggaaacaa aaggcatcca aataggaaaa gaagtcatca tactctcact 85560
cttcactggc aatatgattc tatactttga aaaccctaaa aattccgtca aaaggctact 85620
agaactgata aatgatttta ccccaagatt caggatacaa aatcagtgta caaaaaatta 85680
gtaccatttc tatacgctaa taatgtccag gctaagagtc aaatcaagaa cacagtccca 85740
tttacaatag ccacaaagaa aatgaaataa tggctgggca cagtggctca tgcctgtaat 85800
cccagcactt tgggaggctg aggcaggtgg atcacctgag gtcaggagtt cgagaccagc 85860
ctgaccaaca tggtgaaacc ccgtctctac taaaaataca aaaaattagc caggcgtggt 85920

cA 02348657 2001-11-07
30/66
ggtgggcgcc tgtaatccca tctgctcggg aggctgaggc aggagaattg cttgaaccca 85980
ggaggcatag gttgcagtga gccgagatcg tgccactgca ctgcagcctg ggtgtgaaag 86040
agcaagaatc cgtttccaaa attaaaaaaa aaaaaagaaa aaaaaaaaga caatggagta 86100
cctaggaata cggctgatga aggaggtgaa agaatctgta tgaggagaag tgtaaagcac 86160
tgctaaaata aatcagaggt gacacaaata aatggaaaaa cactccatgc tcatggattg 86220
gaagaatcaa tatcgttaaa atgggaaatt tatcttaatt tttttcccta gttcattttt 86280
ctgttttctt ttgcacataa attatgtgtt atgttgcgtc cttttgtttt ccctatctgt 86340
aattttcttc ttcatccttt taaactctta ggtctttttg ttttgttctg ttttcccaag 86400
cctgttgcct ttatttctta ctgggttagt atctaatctc ctttctgcta tatcttttgt 86460
aactcttctt tccttggtgg ttttttattc attactttcc tgacatctgt tattctactt 86520
ttcatcttct gttttatttc tttgagcatc tgtatgttat ttccataagc tcttacattt 86580
cactgggctc ttgtttcata gaaaacaatt ttttggcaag gacagaccac ttgaggccag 86640
gagtttgaga ccagcctggc caacatagta caaccctgtc tctgctaaaa atacaaaaaa 86700
ttagctgggt gtggtcacac acacctgtaa tcccagctac tcaggaggct gataatcgct 86760
tgaacccagg aggcagaggt tgcagtgagc caagacggcg gcactgtact ctagcctggg 86820
ggacagagca aggctctgtc tcaaaaaaaa aaagaaaaaa ttttttggtc aggcgtcatg 86880
gtgggtcaca cctgtaatcc cagcactttg ggaggccaga tcacttgagg ccgggaattc 86940
cagaccagcc tcgccaacgt ggcaaaaccc catatctata aaaaaaactt aaggataaaa 87000
aaaattaaat ttttaaaaaa ttaaattatt ttatttcgtg gaaagatact tggtcataat 87060
tttagtttgc tctatggcaa aatcttctca tgcatgttct tcattttatc tagtttatgt 87120
ttattgtgtt ttgtttgctc ttttttgggg gcaggttttg ttgttgttgt tttttttttt 87180
ttttttttaa atgagccctg tcctggtttt tccttttttg cttattattt ttctttgaat 87240
aaaaggagtt ttcttggaaa acctagtttt ggaaggatat tgtaggggaa gggataggta 87300
tcttgagtag tccatgtata cactaaacta gcatgcagcc tccctcactt acagtgaagc 87360
cctacctaat aatgaagtat atgtgtatgt aaataagaga tagggttgat ttattcttct 87420
actaaaaaat attggtcact gcaagacatt gtcttcccgc cagactgtta gatgccttct 87480
tataaagata attcgtctta gagtttcttt gttcattctc accttccttg ccattcctat 87540
gctatcaatt agggtttata tggtctgcag agccaggctt catatgcttg tttaaatgtg 87600
gagggactgg ccttattacc ctttagggtg tgctatctct ttttgggagg aaaactgtac 87660
tctgacagtc atgtccatga tctttagcgg cagatccttt gtgtgtcttc ctttgtcagt 87720
gtaattttca ctgccctagg cagttcacct ttatgtattt tagttccata aatgttacct 87780
agtttgttga tgaagtgtat gtttctgttt ctattatcct tgctgatttt agtttttttc 87840
agattcaaga agacagatct acttatatca gatattttgt ttgttttaaa gcattactgc 87900
tattaaaaac atatacatac ataaatgatt aattctaaca ataccgaatt aaggatttta 87960
aacattaact agagttttaa aagagtaaca aaaatatttt tacattgata actaccaaaa 88020
tgcattccag tgccttgaat attatatttt aaaagctttt cctgtcattt gctgtttcag 88080
ctttaaattc aaaattatat ttctaaaagt gctggatttt tttttttagg cgtttcatca 88140
aacgggtata tgtgtcttta ccaaatgagg aggtatgtat ctgtgtttga attttttttg 88200
ttttagagca gaaacaagaa ctaccatctt gacaatatta agtcttccaa tccatggtac 88260
agctactttg gaaaacagtt tagtggtttc ttaaaaagat gtacataagc ttactgtcag 88320
agccagcaat ttcactccta agaatttacc ccagagaaac aaaaatgtat gtccacacaa 88380
agacttgtac aagaattttt atagcagcaa tattaataat agccagaact acaaatgatc 88440
taaaatgttt attttggtga ataaacaaat gtggtatatt catttaatgg atactgttat 88500
ccattataca tgctgcatac tcacttcata tattaagttt tatgaatgaa actccaaaac 88560
attataagtg aaagaagcaa gatgatatat gtcgcatatc ataggattct gtttatatgc 88620
agaaaacgca aatttatttt ttatttattt atttttttga gatggagtct tgctctgtcg 88680
ctcaggctgg agtgcagtgg cgtgatctcg gctcactgca accttcacct cctgggttca 88740
agtgattctc ctgcctcagc ctcctgagta gctgggactg caggcatgtg ccaccaggcc 88800
tggctaattt tttgtgtttt tagtagagac gggtttcact gtgttagcca ggatggtgtg 88860
atccgccctc ctcagcctcc caaagtgctg ggattacagg catgagtcac cgtgcccggc 88920
cagaaatcga aaatttctag aaacgtaaag cagatcagtg ggttgtcagg gtgagagttg 88980
ggaatgagga ttaactgcaa acaggtatga gtgaactaaa aagtgttcta aaactggatt 89040
gtggtgatga ttgcacatct ataaatgtat taaaactcat tgaattatat acttacaatg 89100
ggtgaaattc atagtagatg aattcatacc tctataaaac tggttttttg cagcaaaata 89160
tttattgcta tgtttttatt caagtgtggt gaattattgc tatgttttta tccaggtgtg 89220
gtgtctcacg cctataatcc caacactttg ggaggctgag gtgggaggat cgcttgagcc 89280

cA 02348657 2001-11-07
=
31/66
aggaattcaa gaccagcctg ggcaacatag ggagaccctg tctctacaaa aactttttta 89340
gaaattaacc aggcatggtg gcacgtgcct ttggtcccag ttactcggga ggctgagatg 89400
ggaggattgc ttgaacccag gatatcgagg ctatagtgag ctatgattgt gccctgcact 89460
ccagcctggg taacagcaca agaccctgtc tcaatataaa aaaagaaaag aatcattaat 89520
tctgaaatta gactgaatga tcatttttta atatttttca gacaagacta cttttgctta 89580
aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta 89640
ggtgagtaat ttggatttgg tttatcttac agcttttatt tattttttgt aaataattct 89700
ttttttagtt atttaaagta atcttaagta tgaaatgagt aattcattga tcagaagact 89760
ttctctcatc ctctacctcc tttgcctttt tcttacctct tgttcttata tatatatgtg 89820
gaatctaaat ttcactggct atgtcctttg caagacgtga tctaatgatg atagtatatt 89880
ctttttataa atttattaaa acctgtaagt ggtattaaag taatttaaac atttacacct 89940
taggcaacat ggtaaaaccc catctctaca aaaaataaaa tgagtcagga atggtggcac 90000
atacctgtag tcccagctac ttgggaggtt gatgtgggag gatcgcttca gcccgggagg 90060
tggaggttga gcaacagagt gagaccctgt ctcaaaaaaa attttaaaca tttcatattg 90120
cacactaaca cagatatttt tatataaact tgttcttggc atatgctgaa tacttttcag 90180
ctcttttaat aattttaatt atttgataat tttaataatt ttaatttcag ctatttgaat 90240
aatcttaaac tttatgaaca gtgtgaagta gaaactgagt ataggagatg cgctcatgaa 90300
ttttattccc tgaaaaatgt cataaagtaa tataaagtat tcaatgagta tgtgagtatt 90360
gaataatttt aacaagaact ctgagttccc agatacctat gacaaaagaa caaattactt 90420
ggaagtctct tctactccag acctttctgt ctatcccctt atttaaaaaa atgtacattg 90480
attgtccctt atcccatcaa gagagtgttc tttgccaaga taaacgctaa ttagagaagt 90540
aattgtgttt atgtgtcagt tggccaccag tagtttgtag atgttacctt tccaggtgac 90600
atgtttacaa tttaatgaag cctctggaga tagtatgcct taatctaaag gaatggttct 90660
aatgattaaa atttgaggca ttactacatt tgttttcagc aaatgggcct ttctattccc 90720
ttaaaatcaa accctcataa ctatgggttt gctgacaaag ggaaactagt ttttactctt 90780
attatatgga gattttaaat ctgcagagat gaaaataatt tgctgtttca gctgggtgcg 90840
gtggctcatg cctgtaatct cactactttg ggaggctgtg gcgggtggat cacctgaggt 90900
caggagttcg agaccagcct gaccaacatg gcgaaacgcc atctatacta aatacaaaaa 90960
aaaaattagc caggtgcggt ggcgcatgcc tataatccca gctacctgag aggctgaggt 91020
aggagaatcg ctccaggagg tggagatcac agtgagctga gatcatgcca ttgcactcca 91080
gcctgggcaa caagagcaaa actccatctc aaaaaaaagc gggaggggaa ataatttgct 91140
gtttcttcct tcccttcctc agaatgactg atggatactc aggaagtgac ctaacagctt 91200
tggcaaaaga tgcagcactg ggtcctatcc gaggtaggta tacaagagct taaaacattt 91260
agaactattt attataccac cttagaagtt taagaagtcc aaaaaaatct accaagagat 91320
tttttttttc ttttggagac agggtctcac tctgttgccc aggctgtagt gcagtggcac 91380
aatcatagtt cactgcagcc tcgaaccccc caggctcagg tgattctccc acccagcctt 91440
cccagtagct gggactacag gcatgcacca tcatgcccag ataattattt tattttattt 91500
cttgtagaga cagggtttca ccatgttgcc caagctggtc ttgaactccc gggctcaagt 91560
gagcagcctg ccttggcctc ccaaagtgct gggattacag gcatgagcca ccatgcccag 91620
ccttaaaacc attcttagct cacagatcat acaaaaacag tctatgagcc agtagactgt 91680
gacccctgtt ctaggcaaga ggtttcattt cttgatagta agtaagcagc agaaaactca 91740
aaaagaaaac tttaaacaaa aaagaataat gtaaggaaaa tgttcttatc tgttttctgg 91800
ctcttttcag tattctgaca tcatttgaaa ttaatgtgtc taaaggaaat tctataagag 91860
aagttttcac ttttttaatt atatcttttg agggattgca gcaaaatatt tattgctatg 91920
tttttattca ggttacttgg ttgattctga aataccacga ccaattcttt ttaggttagg 91980
ttaggataaa ctcacacaga tattttcagc tacatttcca cagccagcat cggtagtgga 92040
tggttgatgc tctcaggtat gcactcagat tattagctat gatgataaag taatcataat 92100
agctccatcc ctttctctca ttcaagaaag tacaattgaa tgtagttgta cgagaaagat 92160
gttatcatag tgtctactgt aatttgcatt aaaagcctac attatacaaa cctttttgtt 92220
ttactagtta aaaattacca gtaacacctc ccgtagtgaa atagggtgct gattaagaac 92280
tgctactttg caaaataaaa aatgtaatct tgagagtata ttttgaaact ctggatgaac 92340
aaattttctt gctgctggag cttaaatctt gttcagttag tggatttaga aacagtagct 92400
aatgcataaa tgagttgtat tttcttagaa cgttttggct attctaaggt agacaaaatt 92460
tgggtttaaa aaaagattcg catccattaa agtacagaaa atggccgggt gcagtggctc 92520
acacctataa tcccagcact ttgggaggcc aaggtgggag gatcgtgtgg gcctaatagt 92580
ttgagactag actgggcaac atagggagat cctgtctcta caaaaaaata taataaatta 92640

cA 02348657 2001-11-07
32/66
accaggcccg ttggcatgag cctgtaatcc cagctactcg ggagtctgaa gtaggaggat 92700
cacttgagcc tggaaggtgc aggcagcagt gagccatggt catgccactc actgcactcc 92760
agcctgggtg ggtgacatag tgaggtgctg tcttaaaaag taaataaata ggccaggcac 92820
ggtggctcac gcctgtaatc ccagcacttt gggaggccaa gatgggtgga tcatgaggtc 92880
aggagttcga gaccagcttg gccaatatgg tgaaaccgca tctctactga aaatacaaaa 92940
attagccagg cgtggttgtg cgcacctgta atcccagcta ctcaggaggc tgaggcagga 93000
gtatcgcttg aacctgggag gtgaggttgc agtaagccga gcactgcagc ctgggcaaca 93060
gagcaagact ctgtctcaaa aaaaaaaaaa aaaaaaaaaa aaaaaagtaa atacataaag 93120
tgcagagtaa aaacaaaaaa agactaatgc attttgtaaa gaacaagttg cattctttta 93180
agttcccttt caaatttgtg aactattgtt tttgggcagt atgcaagaaa ttgaacactt 93240
tccagttatt ccaaagaagg aatattctct tctcagcatt tataaattgt atttgctctc 93300
aaagttaaca tgtgtctctt ttttttaata taatgatttg tactgaatag atacatgtag 93360
atcattgtac ttggttttgc ccttcaacaa tttcaactgc aaaatgtatg tatttttaag 93420
tgcctgactt ttatgtttta cagaactaaa accagaacag gtgaagaata tgtctgccag 93480
tgaggtatag tattttacaa tgatattttc tttgtcttct atattgtaag acatatataa 93540
gacatacata tatgaatgtg tgtgtgtgtg gttttttttt tttttttttt ttttttgaga 93600
cagtctggca tgatatcggc tcactgcaac ctccacctcc tggattcaag ctattctcct 93660
gcctcagcct cccaagtagc tacaggcatg taccaccaag cccagctaat ttttgtattt 93720
ttagtagaga gggcatttca ccatgttggc cagtctggcc tcagactcct gacctcaagt 93780
gatccaccca actcggcctc ccaaagtgct gggattacag gcttgagccg ctgcatctgg 93840
ctgttttgtt tgtttgtttg tttgtttgtt tgtttgagac ggagtctcac tctgtcgccc 93900
agactggagt gcagtggtgc gatctcagct cactgcaagc tctgcctccc gggttcacgc 93960
cattctcctg cctcagcctc cctagtagct gggactacag gcgcccacca ccacgcctgg 94020
ctaatttttt gtacttttag tagagacggg gtttcaccgt gttagccagg atggtctctg 94080
tctcctgatc tcgtgatctg cctgcctcag cctcccaaag tgctgggatt acaggcgtga 94140
gccactgcgc ccggcctttt tttttttttt tttttgagac acagggtctt gctctgttct 94200
caggctggag tgcagtggtg caatcgtggc tgactgtagc cttgacctct tggtctcaag 94260
cagtcctctt gtctcaaact ttttagtagc tgggactaca ggcaagtgcc acaacgcccc 94320
actaattttt taattttctg tagagatggt gtctctccct gttgcccagg gtggtctcag 94380
actcttggcc tcaagtaatc ctcctgcctc agtctctcag agtgcttggg actaattttt 94440
tttaatggat ttttctagtt gattagaagc tagaaaaaat taactttgct tcatttcaaa 94500
atatggaaac ctatgaaata gtcaaaattt tttttggtaa tagacaaaac atatatacat 94560
aaagtcattt tctatcaaat catattacat aaataccaaa cagaagaaaa ttacaggccg 94620
ggtgcggtgg ctcacgcctg taatcccagc actttgggag gccgaggtgg gcagatcact 94680
tgaggtcagg agttcaagac cagcctggcc aacatggtga aaccctgtct ctatcaaaaa 94740
tacaaaaaaa ttaggccggg ggcggtggct cacacctgta atcccagcac tttgggaggc 94800
cgaggcgggc ggatcacgag gtcaggagat cgagaccatg ctggctaaca tggtgaaacc 94860
ctgtctccac taaaaaatac aaaaaaatta ccggggcgtg gtggcgggca cctgtagtcc 94920
cagctacttg ggaggctgag gcaggagaat ggcgtgaacc tgggaagtgg agcttgcagt 94980
gagccgagat cgtgccactg cactccagcc tgggcgacag agcaagactc catctcaaaa 95040
aaaaaaaaaa atagctgggc atggtggcac gtgcctgtgg tcctggctac ttgggaagct 95100
gaggcaggag aatcacttga acttgggagg cagaggttgc agtgagccaa gattgcccca 95160
ttgcactcta gcctgggcga cagagtgaga cccagtctca aaaaaaaaaa aattacatga 95220
aacttgtggg ggtttataca ataaaaataa cctataacta tacgttaatc ctttaataat 95280
gttctatttt gtttttcaat aacctttatt tttttaatta atttcttttt tttgagaagg 95340
actctggctc tgtcacccag gctgcagtgc agtggcacca tcttggctca ctgcagcctc 95400
cacctcccag gttcaagcga ttctcctgcc tcagcctcct gcgtagctga gattacaggc 95460
atgggccacc acgcccagct aatttttttt ttttttgtat ttttagtaga gatggggttt 95520
cactatgttg gccaggtggg tctcgaactc ctgacctcag gcgatcgcca gcctcggcct 95580
ccctaagtgc aaggattaca ggcgtgagcc accatgcctg gccaatttat taccgtttct 95640
taatatggaa gacctcctta tgagatgctg aagcatttca tttgaaaaaa gttgcatgta 95700
aaatataaaa ttgggtatgc agaatggtca taactctgtg agcaaaattt tgaaatcagg 95760
cttgaattac agtcagcctt ttctatccgt ggattctgca ttcatggatt caaccaactg 95820
cagatcaaaa atacttgggg gaaaaaagca tctgtgttga acatgtacag acttttattc 95880
ttgttattat tccctaaaca atatagtata aaaactattt acattgcatt tacattgtat 95940
taggtgttat aagtaatcta gagatgattt aaagtataca ggaggattgt gtaggttgta 96000

cA 02348657 2001-11-07
33/66
tgcaaatact gcaccatttt acataaggga ctttaagcgt ttgcggattt tgctatctat 96060
gggggaacca atttccgaga gatactgagg gacagctgta tatttgtaac ttatttttta 96120
tttccctaat tgcagcagct gttgagggga cagtgaactg ttaacacaga taacaagtgt 96180
attcaagtac attttggagt ttgtttgttt ttttttttca ggcttttatt cgcctgtcgg 96240
atgaggcacc atacttgaat tttttttttt aagaaagctt ttagttttct ttctttcttt 96300
tttttttttt gtgagatgga gtcttgctct gtttctaggc tggagtggag tgcagtggtg 96360
tgatctcagc tcactgcaac ctccgcctac tgggttcaag tgattctcct gcctcagcct 96420
cccgagtagc tgggactaca ggtgcacgcc accacgccca gctaattttt tttttttttt 96480
tttttttttg tatttgtagt agagacagag tttcaccatg ttggccagga tggtctcgat 96540
ctcctgacct tgggatccgc ccaccttggc ctcccaaagt gctagggatt acaggcatga 96600
gccaccacgc ccggctgaaa gcttttagtt ttctaactta tttaatttaa tttaatttaa 96660
tttattttta ttttattttt tgggacagtg tctcacttgg ttgcccaggc tggagtgcag 96720
tggtacaatc atggctcact gcaccctcta gctcctgggc tcaggcaatc ctcctgcctc 96780
agccttttga gttgctggga ctacgggcat gtaccaccac actcagctaa atttttaatt 96840
ttttgtagag atggggtctc actatgttgc ctaggctggt ctcagattcc tcaagcattc 96900
ctcccacttg cacctcccaa aatgctggga ttacaggtgt gacaccgtgc cagacttgaa 96960
atttttaatc ccacacctaa aaatataatt ttatccacca ttttttaaaa gtcataacat 97020
tatttattaa aaatttagat ggtaaaacta aaaattaaag cttaataaaa ctactgagtg 97080
atttacaagg aagaatatta ctggtccctt ttgtgagcat cccattaatt atatatattc 97140
aggttatatt gttacaatat ttggttctac tgtatacttt tttttttgag actgagtttc 97200
gctgttgttg cccaggctgg agtgcaatgg tgcaatctcg gctcactgca acctccgcct 97260
cctgggttca agtgattctc ctgcctcagc ctcctgagta gctgggatta caggcatgcg 97320
ccactatgcc tggctaattt tgtgtttttg tagagacggg gtttcactat gttggtcagg 97380
ctgatctgga actcccaacc tcaggagatc cgcccacctc ggcctcccaa agtgctggga 97440
ttgcaggtgt gagccaccat gcctggctct actatatact ttcattcagt tgtttctttt 97500
taatctagtg gttttggtat taataatttg ataatgacct ttagctgtta ttgcttactt 97560
atgagttaat atttataaag cacttaaagt agctggcacg tagtaaacac tatgtaaaga 97620
tccattaaat aactttaaaa aatataaaac tgatagtggc attttattat agagattaag 97680
gtaatccatt ctctcatttc catttatggg atgagacgta aacacaagta gtttgctctc 97740
taaaactgta tactagaatt ttatataccc attatttgat gcaactttaa taccaaagtg 97800
tattgtcagt taccggtgaa tatatataaa tttaggtaag gaaaacccaa cttggtcgca 97860
cacagtggct cacgcctgta atcctaccac tttgggaggc cgaggcagtt ggatcacctg 97920
aggtcttgag ttcgagacca gcctggccaa cgtggcgaaa ccccgtctcc actaaaaata 97980
caaaaattag ccgggcgtgg tggcacatgc ctgtaatccc agctgctcgg gaggctgagg 98040
aaggagaatt gcttgaacct ggggaggtgg aggttgcagt gagctgagat cgtaccactg 98100
cactccagtc tgtgcgacag gagcgagact ccatctccaa aaaaaaaaaa aagaaaaacc 98160
caacttatct tttacagttt ataatagtag aagttcaaat aattggtttg gaatttctgt 98220
atttttaagg ttagtactaa aattgttggt tataaattgg ggtacaatat actttgtttt 98280
ttaagtacct tgtgtatcta atttaacttt aagtccttta ttattttggt ttgataagac 98340
aacttttcta cttatttccc cccttaactg aaccagctac catctgcctt tttcctgttg 98400
tatacattag tctcttacgt taaaatatca tataagtttc atatatatac acatatcaaa 98460
ctatagactt aaagtacaat tacatcaaca tcttttaaaa ccttaatttc tggccaggcg 98520
tggttgttca tgcctataat cccagcactt tgggaggctc aggccattgg atcccttgag 98580
ctcaggaatt cgagaccagc ctggataaca tggtgaaatc ctcatctcta caaaaattac 98640
aaaaagttag ctgggcgtgg tggcgcacac ctatagtcct agctacttgg gaggatctct 98700
taagcctggg aggcagaggt tgcagtgagc cgagatcatg ccactgcact ccagcctggg 98760
taacagtgag accctgtctc aaaacaaaaa tattaatttc tataacaaat aaattttatt 98820
tagtaatatc atgtttaata cccatgttac attcattatt cttctacact ttggccttta 98880
ggaagaggca gtgtgtgtgt tacagttaaa taggaaacaa gtagggttca tatagtgctt 98940
atggggtttt ctttggtggg gggttgctgg gtttttgggg tttttttttt tgagacaggg 99000
tatcactctg tctcccaggc tgaaatacat tggcatgctc atggctcact gcagcctcaa 99060
cctcccagac tcaagtgatc ctcccacctc agcttcccta gtagctgaga ctacaggcgt 99120
gcgccaccat gcctagctaa attttgtaca ttttgtagag atgaggcttt gccatgttgc 99180
ccaggctggt ctctaactcc tgggctcaag tgatccactt gcttcagcct cccaaagttc 99240
tgggattaac aggtgcgagc cactgcagcc agcctatatt ttaactatat gtttttttct 99300
ttttggctaa aatttttcag attagtttac aagttacaag tgtaggtgat atctcatgga 99360

cA 02348657 2001-11-07
34/66
gatatcaaag atgatatgaa gttagattgg gtttttaaga gtagttttta aaatacggat 99420
aaataccagt tgttggagtt ttgtttaaag ttctttaact tcttattttt gggccaaaat 99480
acaggtatac gctagaaatg atttttaaca caggtcattt atgccaaact gcattttgcc 99540
ttaatttttt tttttttttt tttttttgag agggagtctc actcattgcc caagctggag 99600
tgcaatggca cgatctcggc tcacttacaa cctccacctc ccaggttcaa gcgattctcc 99660
tgcctcagcc tcctgagtag ctgggattac aggcacctgc ctggctaatt tttgtatttt 99720
tagtggagac ggggtttcac catgttggcc aggctggtct cgaactgctg acctcaggtg 99780
atccacccgc cttggcctcc caaagtgcgg ggattacagg tgtgagccac cgtgcttggc 99840
caaaattttt attaattttt ctattgcctg gactctgtga acctatccat tttgcctttt 99900
aaaaatactt aggtgtaaat atagatattc attaactcag cattgtttta atctatattt 99960
ccaaaggcaa tttaaaagat cagaaaataa gaccaaatta atataaaaat gcatacttta 100020
ggctgggcaa agtggctcac gtctgtaatc ccagcacttt gggaggccaa ggtgggcgga 100080
tcacctgagg ttaggagttc aggaccaacc tggccatcat ggcgaaaccc tgtctctact 100140
aaaaatacaa aaattagctg ggcatggagg catgtgcctg taatcccagc tactcgggag 100200
gctgagacag aagaattgct tgaaccttgg agggggaggt tgcatatctg agtggtgaaa 100260
ttgtgattct ttttttctct ttgtctgtat ttttgaactt ttctataaat gattgtgttt 100320
tgtttttata ttggaaaaat attatgcttt caaatgttaa tacctatgaa actaaacaca 100380
agtaataaat atattagtat agcatttatt aaggtttctt gtgtagcaga tcaacataga 100440
aaatatattt aaatggctga cataattttc taagaataca tacacgtata ttttttataa 100500
cattaagaaa cagcagcatc attactttaa tccatcattt cgttaaccac catatacctg 100560
ttgatcattt gtattgtcat gtgcttttta aaaatctaga tgagaaatat tcgattatct 100620
gacttcactg aatccttgaa aaaaataaaa cgcagcgtca gccctcaaac tttagaagcg 100680
tacatacgtt ggaacaagga ctttggagat accactgttt aaggaaatac ctttgtaaac 100740
ctgcagaaca ttttacttaa aagaggaaac acaagatctt caatgaacgt catcggctac 100800
agaaacagcc taagtttaca ggacttttta gagtcttaca tatttgtgca ccaaacttga 100860
agatgaacca gaaaacagac ttaaacaaaa tatacaatgc aaatgtaatt ttttgttgtt 100920
taaggccttg ccttgatggt cacagttatc ccaatggaca ctaagttaga gcacaacaaa 100980
acctgattct ggtcttcttt accaatataa tcataatgta aataataatt tgtatattgt 101040
gttgcagatg aaagtattcc aggaacagtg aatggtagaa gacacaagaa catttgtttg 101100
tttgtcttct gatgtttttt cttaaaatag taatttctcc tacttttctt ttctactgtt 101160
gtcttaacta caggtgattg gaatgccaaa cactcttaag tttattttct tttttcgttt 101220
tataaattca gtgtgccaaa tgaaactttt ttcctaagta actgtaatag gaaaaagttt 101280
attttgagag tttcttcttc ataaatctac agacattaaa caattgttgt gttcttttta 101340
ccttttattt ttctattacc ttgctaccaa acagtttaga tagcaatata atagcaaaaa 101400
agcaaatatg gtaaaataga gaaggtttga aggtttgagt tactctgtca tataacatgt 101460
agatcagtct tcatgtgacc tgcagtattt ttttttctaa tgtatttgtc agaaatctgt 101520
tgtagactgt taacttcttc ctgatggaat ttattttctg caagaattat tctgatattt 101580
aagagagcca attttaactg ctgtgaaaat gtttccagtg caagagaagg gaaatactag 101640
gaactaagac atttctaatt tattgcttat tactttctta attttacagg ataattataa 101700
gcaagtggaa ctaccatctt ttattcttaa taattattaa tcccttcaat gaaactttaa 101760
aaaaactgaa tttttataca tggcatacat ttttctagtt ccttctgctt gctttattaa 101820
ctcaaaagtt ctagttctag tctgttgatc tgccttttgt tctcccaaaa tgtacagtaa 101880
ttccatttgt ttgtataaat atgcctggat tttcattata aaaatgtcat tgtagggagt 101940
agagactcat atcatggcct tttaaatatt gtaataaagg caaatagata tttgccctta 102000
gtttactggt taaaagtttg tttacagaac ttttctctgg tgcttaaatg atgctatgta 102060
aaatgtcatg agtggaaaga atatttgtag tagtaacaag aatttttcat ttaggaaaga 102120
tttcttaggt tttgaaagaa tacattaaaa taaaaaactt gcccctacta ggtaagaact 102180
ttataatgaa gacatacatt cttcttaatt ttactcttgc tcttgttaaa gatttgtttg 102240
aatatagaag atgcatgatt tctgggtttt tttttttttt tgagacagag tttcgctctt 102300
gttgcccagg ctggagtgca atggcgcaat ctcgactcac cacaacctcc gcctcccagg 102360
ttcaagcaat tctcctgcct cagcctcccg agtagctggg attacaggca tgcgccacta 102420
ccccagctaa ttttgtattt ttagtagaga tggggtttct ccatgttggt caggctggtc 102480
ttgaactcct gacctcaggt gatccgcctg cctcggcctc ccaaagtgct gggattacag 102540
gcataagcca ctgcgcccag ccagaagatg catgatttct taggatcata tgctgtttgt 102600
agccataagg taaatcatgt ctcttccaat catgactttg gaactccctg aataataaaa 102660
atgagagttg agataaatag gggaaaaaaa atttttttca agccagagct atgcatatgt 102720
_
_

cA 02348657 2001-11-07
35/66
taggtgatgg gtagtatccc tttaaggtct caaacattac aacatcaatt atgaaatact 102780
gataacgaaa ggtagtaatg aaatatatat gatgaaaaga attgagaagt tctaaattaa 102840
gacatttcag ttaagctcat aaaatttcat tgttttcatt taaaagatta acgttattga 102900
tacttggata actggctaat catattaaag gactatgtgg ttccagctca acttttaata 102960
tattgtctcc tttaaaacta tcatggttat aattctattg ggaaagactt ttagataaca 103020
aagatttcaa atgttaaaag agataaaagt caggttaata ctatcttaaa cactgagtca 103080
gaaaatcatt actgtataga agttgctttc ctgatcaagt ctgaacttca gctagtgcta 103140
gagaactatt ttctatgact taactctaac caagttttat tttaagctgt ttctttgata 103200
gaagggccat gaaaatagag taatgatata gtaggagata agggattggt ttggtctttt 103260
tcaataaaga tagaagttgc tgaagttttc tgaattaata atgacttaga ttgtgacctt 103320
ttagattcgg tgttgagctc tgtgttgtat tacttcctaa aagataatgc ttaaacatta 103380
agcattagtg tgctcttcat gttaatatgg cagagttttg taaactaaat taaaacttac 103440
tgatatattg gactttgagc caagggaaag aatgagtact atctttccag atatcttaag 103500
ggtaaaagct tattctaaga cagtctgtcc attgagaata ttagatttct gacttgcaaa 103560
tatgtttgta ctccagaaga attagaggaa aagcagatac tagaattcta atttaattac 103620
atatacagcc gtctttgttt atagtgtaga attctttata ttttgtacaa aaactaattc 103680
ttttggtaaa atgaaccatt tacagttcgg ttttggactc tgagtcaaag gattttcctt 103740
taaatgcttg tctcaatttt agtctggtct tttgtacttt tcttcagaag aaatgaatta 103800
aagggtacag ttgcataaag tgggttttta tcctaatgta ttggaaataa atgataaact 103860
ttattttgtc tttacttttt tactttaaaa ctttttgata ttttaggggt tggagtctga 103920
taatgaagga gttgtgtgta ttggactctt agtaacaatt ataaacgctt aacaaaatat 103980
agaaagcaat gattgggtgg ctctgcagag caatcaaaac aaggtagaaa ctgcaaagtc 104040
ctataatgga agagattcag gctgggtgtg gtggctcatg cctgtttggg aggccagtat 104100
gggagaatcg cttacactca ggaattcaag accagcctgg ggaatatagg gagaccctgt 104160
ttctgccaaa aaaaaaaaaa aaaaaaaaac taaactaaaa attagccagg tttggtggcc 104220
tacacctgta gtcccggtta ctcaagaggc tgaggttaga ggatcgctta agcccgggag 104280
gaggaggttg cagtgagcca agatcacacc accacactcc agcccaggtt acagagaacc 104340
tgtctcaaaa aataaaaagt aaacgagatt caccttaacc agcttttacc catagggcaa 104400
tttccagttt gtgcagttca cttggatata gaattcaggt agaatgtgac agttttgaca 104460
ggctgaggaa tcatttggga cttctagaac acctgaaaat tagaagagaa attttgggaa 104520
ggagagtgcc tcagaaagta agctctaaaa tctgcctaca tattcctttc aaatccttgg 104580
tggattccaa aattgtgctg gtgcagtgtg attatttaaa ggaacccagg agaaagcaag 104640
ttaaagtcta aaaaactcag cagcgattgc agctgcccaa ggacagagag tttgaaattc 104700
aagttccact aagaaggact gagtaaatac ttggtgtttc ccattgaacc cccaaaatgc 104760
cacgccttaa ggaagaatga cagcatccta gaactaaagg ctgtgcttca gcactaagga 104820
caaaatggaa ataaacttac tgtaatgaag cttaaaatca aatctcacag catcaaggtt 104880
atccattagt aatttaaaac cagaacaaaa cacagcattc ttgagaagaa aacaattcag 104940
tcatcacagc atatatccaa agctcagtac ataataaaca gttactaagc atgcaaagaa 105000
aaattatgtg atccttttga ctcaacttcc ctgatggaaa aaaaaaagtg gtccatacca 105060
tactcaacag aaaatataca gaagcagatg cacaagtgac ctctatgaga gtgattttaa 105120
aatagcgtta aaatatgtta aaagaattta caagaagaga taatgggtga atagataggg 105180
agtttcagca gaaaaataag aattgaaaac ccaacagagg ccaggcaccg tgcctcacgc 105240
ccgtaatcac agcactttgg gaggccaagg caggtggatc acctaaggtc aggagttcaa 105300
gaccagcctg accaacatgg tgaaacccgg tctctactaa aaatacaaaa ctagccgggc 105360
atgggtgatg catgcccata atcctagcta cttgggaggc tgaagcagga gaattgcttg 105420
aacctgggag gtagaggttg cagtgaacca agatcatgcc attgcactcc agcctgggca 105480
agaagagcaa aactccatct caaaaaataa taataataat tggctgggcg cggtggctca 105540
cgcctgtaat cccagcactt tgggaggccg agacaggcag atcacaaggt caggagattg 105600
agaccatcct ggctaacatg gtgaaacccc gtctctacta aaaatacaaa aaattagcct 105660
ggcatggtgg cgggcacctg tagtcccagc tactcgggag gctgaagcag gagaatggca 105720
tgaccccagg aggcggaact tgcaatgagc ccagatcgcg ccactgcact ccagcctggg 105780
caaccgtctc aaaaataata ataataataa ttagaaaata ataaaaaata acccactgga 105840
aagtcttgta atgaaaacta cagtatctga aattaaaaat ttaaatggat ggacttaaca 105900
gtaaactagg cacaacagga aagactgaaa aagacaagta agtatcaaac caaagcagag 105960
agagaaagaa aaaagaaata gcagaggttt gagacctttg gaacattatc agttcctgta 106020
atttgaagta aagaaggaaa ggaagagaat ggggcaagag aaatctttga agcaatgatg 106080

cA 02348657 2001-11-07
36/66
cgtgaaattt tccccaaagt gttgaaagac atcaacgtac agatctaaga agttcactga 106140
atccccaagc agaataaata caacaaagac tacatctggg tacatcacat tgccaaaaaa 106200
aaaaaaaaaa aaaatcttaa aagcaatcaa ggtggggagt gggaaggagt agcattacat 106260
tcagataaac aagagtgatg gctaacctca tcagaaatga tggaattaag aaaatgatgg 106320
aatgacatct ttaaggtgca aagatgaaac aaaggttaac ttaaaactct gtatccagtt 106380
aaaatatcct tcaagatgtt aaggcaatgg ccaggctcag tggcttatgc ctgtaatccc 106440
aacactttgg ggggctgaga caggagaatc ccttgaggcc atgagtgacc agcctgggca 106500
acctagtgag aaccccatca aaaaataaaa ttagctgggc atgggctgtg gtcgtgctac 106560
tgcactccag cctgggggac agagtcccta tctcttgaaa aacttaagac aaaatctttt 106620
ccagatgaaa acagaatttg ttgctggcag actgacttta tacggaatgc tttaagaaat 106680
tcttcaggct gaaggaaaat ataaatctgg agtgaaaaac gtagtatctg aaattaaaat 106740
tttccttgga tggacttatc agtaaatgga tttcccaatg ggaacctgta tctccaggat 106800
ggaattaaga attttgaaat gataaacatg ttggtaaata agaaagacat ttttcttttt 106860
tatttttcta aatatcattg ctgtttaaag caaacaaaaa tagtattgca gtgtttataa 106920
tatatgtata agtaaaatat aggacagaaa tagcatgaag ggtcagagag ggcaataaat 106980
gtaattatat tgagataata ttactatatt gtacacaaag tgagatagca ttagtgtaag 107040
gtagattgtg ataagaatgc attttgtaat ctctcacccc atcactgggg tgcagtagat 107100
ctaaaaagcc attagagaag ataaaatggg tcactaagaa ttatgtgatt agtcaaatga 107160
aatcaaggaa agaaaaacag agcaaagaag tgtaagataa aacagtggga tggaagagct 107220
gaaattaata atgtcactaa attgcttacc ttcctccttc ctgaactgtt gtggattttt 107280
ttttttcag ggggttgagg ttttttttta gagacagagt ctctattgcc ccaggctgga 107340
cagcagtggc gtaatcagtc tcaaaatccc tgcagtctca aactcctggg ctcaagtgat 107400
cctcctgcct cggcctccca aaatgctggg attacaggca ggcagagcca ccacaccctg 107460
ccagaactat tgttttaaag tcattaggtg gttaagccct cgagactatg tgcaagtttg 107520
atgattcgtt aggagcactc acaggactca gcatatagtc ttattcccaa caatgattta 107580
ttagagcaaa aggatatgaa gcaaattcag caaagggaaa aaaggaatta agtgaagtcc 107640
agaggaaacc aagcaccagc ttctaagggt tctctcctaa tgaagtcaca caggatgtca 107700
ctccagcaac aagtgacagc atgtgaaagt gttaagcctc actgttagac atagtaagct 107760
tgttagggaa tagagggaat ctcccctcaa attcaagttc ccagatgcct ggcaagggcc 107820
aaccttgcca gcaggacttt ctggggatag cagtcccagg cacgtgtttg cacagtggtt 107880
cagatcaatg tgcttacatt gggtagaggg gacctatgga agtccaaatt tgggtgtcag 107940
agacctaata gggtgaagac agtgtctaca atgatggaca gctaggtatg aggtgtcagg 108000
gacagattga ggcagttatt cacatggtgg ataggggcaa cctggaatga ggaataagct 108060
caagcacaga aaggggtgtc catatggggt aagggtgtca gcagagatgg tagattggtt 108120
gcacaccaaa gacttgatgg aataaagtga atatactaac cacagagaag gtaattataa 108180
atacagaaag gggggaaact agaatgaaac ctggagttca gcttgaattg ggtttaagaa 108240
agtgaattca tggtttaaaa tctataaaaa tagatgaaat atcggctggg cacagtggct 108300
cacgcatata atcccagcac tttgggaggc cgaggcgggc agatcgcttg agatcaggag 108360
tttgagacca gcctggccaa cactgcgaaa ccccatctct agtaaaaata caaaaattag 108420
ccaggtgtgg tggtacacac ctgtagtccc agctacttgg gaggctgagg cacgagaatc 108480
acttgaacct gggaggcaga ggttgcagtg ggctgagatc gcaccactgc actccagcct 108540
gggcaacaga gcgagatcct gcctcaaata aaaatagagg acatataagc atataaatat 108600
acacgtgtgt atgtgtccaa atatgtatat tccctagtct gtccaccaag gtggccttgg 108660
agcagttatg ctccaataat aatgagcaca taaagtaccc atatcttgcc ttccaaattc 108720
ttcactgtct tagtctgctt gggctgcatt acaaaatacc atagactggg cagcttaaat 108780
aacagaaatt tatcctcaca gttctagaag cttggaagtc caagattaaa gtaccagcca 108840
gtttggtttc tagtgagggc tttcttcctg gcttgcagat ggccaccttc tcaceàtgtc 108900
cttgtatggc agacagcaca agctctctgg tgtccctttt taaaagggca ttaatcccat 108960
catgacagtc ccatcctcat tatctcatct aaccctaggt acttcccaaa ggctgaatca 109020
ccaaagacca tcacattgct ggtgaaggct tcaacatatg aatttgaggg acacgaatat 109080
tcagtccata acatcaacta aaggaaccaa gactctttga taaaatggct aaattcaggg 109140
ctggggcaga gaaaatacat gagtgtggaa cttcttgtgc cagagagaaa aagtgcccaa 109200
agattgatga ggatgaatca ttgaaatgac acacagatta aaagggttcc cactggacaa 109260
atttgagcat caaaataagt aatagtagta attaattata acccatcaga agaaataaac 109320
catgagctca tgtgaatata tgaatacaaa cataaacaaa ttacaagcat aatgaggaat 109380
gtgatattta tatggtttaa aggtacctct ccaggccggg tgcagtaact ctcacctgta 109440

cA 02348657 2001-11-07
=
37/66
atcccagcac tttgggaggc caaggcaggt agatcacctg aggtcaggca tttgagacca 109500
gcctgcacaa catggtgaaa ccctgactct actaaaaata cataacgcga gccgggcgtg 109560
gtggcacgtg tctataatct gccactgatt aggtgtgtga ttttcccaag caggggataa 109620
tagtagtacc tatgtcaaag gctgttatga ggattaaatg agctaacaca taatcgtgct 109680
tttttttttt tttttttttt ttgagacaga gtcttgcact gtcgcctggg ctggagtgca 109740
atggcacgat ctcggcccac tgcaacctct gcctcccagg ttcaagtgat tctcctgcct 109800
cagcctcctg agtagctggg attacaggct cctgccacca cacctggcta ttttcaatag 109860
agacggggtt tcactatgtt ggccaggcta gtctcaaaaa cctgacctcg tgatccaccc 109920
gctttggcct cccaaagtgc tgggattaca ggcatgagcc actgcacccg gctttttttt 109980
tttttttttg agatggaatc
110000
<210> 2
<211> 3263
<212> ADN
<213> Homo sapiens
<400> 2
gctcctgaga ccggcgggca cacgggggtc tgtggccccc gccgtagcag tggctgccgc
60
cgtcgcttgg ttcccgtcgg tctgcgggag gcgggttatg gcggcggcgg cagtgagagc
120
tgtgaatgaa ttctccgggt ggacgaggga agaagaaagg ctccggcggc gccagcaacc
180
cggtgcctcc caggcctccg cccccttgcc tggcccccgc ccctcccgcc gccgggccgg
240
cccctccgcc cgagtcgccg cataagcgga acctgtacta tttctcctac ccgctgtttg
300
taggcttcgc gctgctgcgt ttggtcgcct tccacctggg gctcctcttc gtgtggctct
360
gccagcgctt ctcccgcgcc ctcatggcag ccaagaggag ctccggggcc gcgccagcac
420
ctgcctcggc ctcggccccg gcgccggtgc cgggcqgcga ggccgagcgc gtccgagtct
480
tccacaaaca ggccttcgag tacatctcca ttgccctgcg catcgatgag gatgagaaag
540
caggacagaa ggagcaagct gtggaatggt ataagaaagg tattgaagaa ctggaaaaag
600
gaatagctgt tatagttaca ggacaaggtg aacagtgtga aagagctaga cgccttcaag
660
ctaaaatgat gactaatttg gttatggcca aggaccgctt acaacttcta gagaagatgc
720
aaccagtttt gccattttcc aagtcacaaa cggacgtcta taatgacagt actaacttgg
780
catgccgcaa tggacatctc cagtcagaaa gtggagctgt tccaaaaaga aaagacccct
840
taacacacac tagtaattca ctgcctcgtt caaaaacagt tatgaaaact ggatctgcag
900
gcctttcagg ccaccataga gcacctagtt acagtggttt atccatggtt tctggagtga
960
aacagggatc tggtcctgct cctaccactc ataagggtac tccgaaaaca aataggacaa 1020
ataaaccttc tacccctaca actgctactc gtaagaaaaa agacttgaag aattttagga 1080
atgtggacag caaccttgct aaccttataa tgaatgaaat tgtggacaat ggaacagctg 1140
ttaaatttga tgatatagct ggtcaagact tggcaaaaca agcattgcaa gaaattgtta 1200
ttcttccttc tctgaggcct gagttgttca cagggcttag agctcctgcc agagggctgt 1260
tactctttgg tccacctggg aatgggaaga caatgctggc taaagcagta gctgcagaat
1320
cgaatgcaac cttctttaat ataagtgctg caagtttaac ttcaaaatac gtgggagaag 1380
gagagaaatt ggtgagggct ctttttgctg tggctcgaga acttcaacct tctataattt
1440
ttatagatga agttgatagc cttttgtgtg aaagaagaga aggggagcac gatgctagta 1500
gacgcctaaa aactgaattt ctaatagaat ttgatggtgt acagtctgct ggagatgaca 1560
gagtacttgt aatgggtgca actaataggc cacaagagct tgatgaggct gttctcaggc 1620
gtttcatcaa acgggtatat gtgtctttac caaatgagga gacaagacta cttttgctta
1680
aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta
1740
gaatgactga tggatactca ggaagtgacc taacagcttt ggcaaaagat gcagcactgg 1800
gtcctatccg agaactaaaa ccagaacagg tgaagaatat gtctgccagt gagatgagaa 1860
atattcgatt atctgacttc actgaatcct tgaaaaaaat aaaacgcagc gtcagccctc 1920
aaactttaga agcgtacata cgttggaaca aggactttgg agataccact gtttaaggaa
1980
atacctttgt aaacctgcag aacattttac ttaaaagagg aaacacaaga tcttcaatga 2040
acgtcatcgg ctacagaaac agcctaagtt tacaggactt tttagagtct tacatatttg 2100
tgcaccaaac ttgaagatga accagaaaac agacttaaac aaaatataca atgcaaatgt 2160
aattttttgt tgtttaaggc cttgccttga tggtcacagt tatcccaatg gacactaagt 2220
tagagcacaa caaaacctga ttctggtctt ctttaccaat ataatcataa tgtaaataat 2280

cA 02348657 2001-11-07
38/66
aatttgtata ttgtgttgca gatgaaagta ttccaggaac agtgaatggt agaagacaca 2340
agaacatttg tttgtttgtc ttctgatgtt ttttcttaaa atagtaattt ctcctacttt 2400
tcttttctac tgttgtctta actacaggtg attggaatgc caaacactct taagtttatt
2460
ttcttttttc gttttataaa ttcagtgtgc caaatgaaac ttttttccta agtaactgta 2520
ataggaaaaa gtttattttg agagtttctt cttcataaat ctacagacat taaacaattg 2580
ttgtgttctt tttacctttt atttttctat taccttgcta ccaaacagtt tagatagcaa 2640
tataatagca aaaaagcaaa tatggtaaaa tagagaaggt ttgaaggttt gagttactct 2700
gtcatataac atgtagatca gtcttcatgt gacctgcagt attttttttt ctaatgtatt
2760
tgtcagaaat ctgttgtaga ctgttaactt cttcctgatg gaatttattt tctgcaagaa 2820
ttattctgat atttaagaga gccaatttta actgctgtga aaatgtttcc agtgcaagag 2880
aagggaaata ctaggaacta agacatttct aatttattgc ttattacttt cttaatttta 2940
caggataatt ataagcaagt ggaactacca tcttttattc ttaataatta ttaatccctt 3000
caatgaaact ttaaaaaaac tgaattttta tacatggcat acatttttct agttccttct 3060
gcttgcttta ttaactcaaa agttctagtt ctagtctgtt gatctgcctt ttgttctccc 3120
aaaatgtaca gtaattccat ttgtttgtat aaatatgcct ggattttcat tataaaaatg 3180
tcattgtagg gagtagagac tcatatcatg gccttttaaa tattgtaata aaggcaaata
3240
gatatttgcc cttagtttac tgg
3263
<210> 3
<211> 616
<212> PRT
<213> Homo sapiens
<400> 3
Met Asn Ser Pro Gly Gly Arg Gly Lys Lys Lys Gly Ser Gly Gly Ala
1 5 10 15
Ser Asn Pro Val Pro Pro Arg Pro Pro Pro Pro Cys Leu Ala Pro Ala
20 25 30
Pro Pro Ala Ala Gly Pro Ala Pro Pro Pro Glu Ser Pro His Lys Arg
35 40 45
Asn Leu Tyr Tyr Phe Ser Tyr Pro Leu Phe Val Gly Phe Ala Leu Leu
50 55 60
Arg Leu Val Ala Phe His Leu Gly Leu Leu Phe Val Trp Leu Cys Gln
65 70 75 80
Arg Phe Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Ala Ala
85 90 95
Pro Ala Pro Ala Ser Ala Ser Ala Pro Ala Pro Val Pro Gly Gly Glu
100 105 110
Ala Glu Arg Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser
115 120 125
Ile Ala Leu Arg Ile Asp Glu Asp Glu Lys Ala Gly Gln Lys Glu Gln
130 135 140
Ala Val Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile
145 150 155 160
Ala Val Ile Val Thr Gly Gln Gly Glu Gln Cys Glu Arg Ala Arg Arg
165 170 175

cA 02348657 2001-11-07
39/66
Leu Gin Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu
180 185 190
Gin Leu Leu Glu Lys Met Gin Pro Val Leu Pro Phe Ser Lys Ser Gin
195 200 205
Thr Asp Val Tyr Asn Asp Ser Thr Asn Leu Ala Cys Arg Asn Gly His
210 215 220
Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr
225 230 235 240
His Thr Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Met Lys Thr Gly
245 250 255
Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Tyr Ser Gly Leu
260 265 270
Ser Met Val Ser Gly Val Lys Gin Gly Ser Gly Pro Ala Pro Thr Thr
275 280 285
His Lys Gly Thr Pro Lys Thr Asn Arg Thr Asn Lys Pro Ser Thr Pro
290 295 300
Thr Thr Ala Thr Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val
305 310 315 320
Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu lie Val Asp Asn Gly
325 330 335
Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gin Asp Leu Ala Lys Gin
340 345 350
Ala Leu Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe
355 360 365
Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro
370 375 380
Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn
385 390 395 400
Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val
405 410 415
Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu
420 425 430
Leu Gin Pro Ser lie Ile Phe Ile Asp Glu Val Asp Ser Leu Leu Cys
435 440 445
Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu
450 455 460

CA 02348657 2001-11-07
,
40/66
Phe Leu Ile Glu Phe Asp Gly Val Gln Ser Ala Gly Asp Asp Arg Val
465 470 475 480
Leu Val Met Gly Ala Thr Asn Arg Pro Gln Glu Leu Asp Glu Ala Val
485 490 495
Leu Arg Arg Phe lie Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu
500 505 510
Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gln Gly Ser Pro
515 520 525
Leu Thr Gln Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr
530 535 540
Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro
545 550 555 560
Ile Arg Glu Leu Lys Pro Glu Gln Val Lys Asn Met Ser Ala Ser Glu
565 570 575
Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys lie
580 585 590
Lys Arg Ser Val Ser Pro Gln Thr Leu Glu Ala Tyr Ile Arg Trp Asn
595 600 605
Lys Asp Phe Gly Asp Thr Thr Val
610 615
<210> 4
<211> 23
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 4
cggagctcct cttggctgcc atg 23
<210> 5
<211> 26
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 5
agaagcgctg gcagagccac acgaag 26
<210> 6
<211> 27
<212> ADN
,

CA 02348657 2001-11-07
41/66
<213> Séquence artificielle
<220>
<223> Amorce
<400> 6
aaggcgacca aacgcagcag cgcgaag 27
<210> 7
<211> 26
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 7
aggagcaagc tgtggaatgg tataag 26
<210> 8
<211> 27
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 8
tggttatggc caaggaccgc ttacaac 27
<210> 9
<211> 26
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 9
caaacggacg tctataatga cagtac 26
<210> 10
<211> 25
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 10
ttaggaatgt ggacagcaac cttgc 25
<210> 11
<211> 25
<212> ADN
<213> Séquence artificielle

CA 02348657 2001-11-07
42/66
<220>
<223> Amorce
<400> 11
cttctctgag gcctgagttg ttcac 25
<210> 12
<211> 27
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 12
tgctagaatg actgatggat actcagg 27
<210> 13
<211> 24
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 13
agatgcagca ctgggtccta tccg 24
<210> 14
<211> 26
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 14
atgaacgtca tcggctacag aaacag 26
<210> 15
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 15
tagcagtggc tgccgccgt 19
<210> 16
<211> 20
<212> ADN
<213> Séquence artificielle

CA 02348657 2001-11-07
43/66
<220>
<223> Amorce
<400> 16
aagcggtcct tggccataac 20
<210> 17
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 17
ggcggcagtg agagctgtg 19
<210> 18
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 18
ctagctcttt cacactgttc 20
<210> 19
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 19
aacaggcctt cgagtacatc 20
<210> 20
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 20
ctgtgaacaa ctcaggcctc 20
<210> 21
<211> 20
<212> ADN
<213> Séquence artificielle
<220>

CA 02348657 2001-11-07
=
44/66
<223> Amorce
<400> 21
atgagaaagc aggacagaag 20
<210> 22
<211> 18
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 22
tgccaagtct tgaccagc 18
<210> 23
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 23
ctacaactgc tactcgtaag 20
<210> 24
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 24
cagtgctgca tcttttgcc 19
<210> 25
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 25
taggaatgtg gacagcaacc 20
<210> 26
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce

CA 02348657 2001-11-07
45/66
<400> 26
aaagctgtta ggtcacttcc 20
<210> 27
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 27
tggagatgac agagtacttg 20
<210> 28
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 28
ctggaatact ttcatctgc 19
<210> 29
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 29
atgaggctgt tctcaggcg 19
<210> 30
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 30
gtgagccgaa ctgcacattg 20
<210> 31
<211> 21
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
_

CA 02348657 2001-11-07
46/66
<400> 31
caaagtcgac agctacagtg c 21
<210> 32
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 32
ggaactgtag ttgagtggga 20
<210> 33
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 33
agatgaggct ccgacctac 19
<210> 34
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 34
aatgccacac ttgtaatctc 20
<210> 35
<211> 22
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 35
tgtgaatata tcataatttg gg 22
<210> 36
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 36

CA 02348657 2001-11-07
47/66
tacagcagtt ctcatgatg 19
<210> 37
<211> 21
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 37
gaccaaattg gtgcatgcat g 21
<210> 38
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 38
acatttccaa tacatcccac 20
<210> 39
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 39
atttgtcatt tcacatgcac 20
<210> 40
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 40
ttagaatgac tatacctgac 20
<210> 41
<211> 18
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 41
tcaggttaag taagactc 18

CA 02348657 2001-11-07
=
48/66
<210> 42
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 42
ttcctatcta cctagtgac 19
<210> 43
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 43
ttttatagca agttgccctg 20
<210> 44
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 44
cctatgaaga tcctggtac 19
<210> 45
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 45
tgtcatgatt ctaacaaggg 20
<210> 46
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 46
tctatttcac tcctgacatg 20
_ _

CA 02348657 2001-11-07
49/66
<210> 47
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 47
gtcatagggc ttaggcttc 19
<210> 48
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 48
atcatactac ccacttttcc 20
<210> 49
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 49
tgtttgggaa gatgctactg 20
<210> 50
<211> 21
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 50
ctactgaaga taacgtacat g 21
<210> 51
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 51
cattgattgc catgtattgg 20
<210> 52

CA 02348657 2001-11-07
50/66
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 52
agaaggccag aaatactcag 20
<210> 53
<211> 22
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 53
gtacttaaat cggtaaatat gg 22
<210> 54
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 54
ctcaagtctt aggaatgcag 20
<210> 55
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 55
gcacttaacc aggctgtatg 20
<210> 56
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 56
ctcagatgac tcacatagc 19
<210> 57
<211> 22
_ _

CA 02348657 2001-11-07
51/66
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 57
ctttactaga ctaattctcc tg
22
<210> 58
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 58
cagattcaag aagacagatc
20
<210> 59
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 59
gcaataattc accacacttg
20
<210> 60
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 60
ggtagttctt gtttctgctc
20
<210> 61
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 61
caagtgtggt gaattattgc
20
<210> 62
<211> 19
<212> ADN

CA 02348657 2001-11-07
52/66
<213> Séquence artificielle
<220>
<223> Amorce
<400> 62
gagctgaaaa gtattcagc 19
<210> 63
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 63
tgcaaaggac atagccagtg 20
<210> 64
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 64
agcctctgga gatagtatgc 20
<210> 65
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 65
ctagaacagg ggtcacagtc 20
<210> 66
<211> 18
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 66
ttggacttct taaacttc 18
<210> 67
<211> 21
<212> ADN
<213> Séquence artificielle

CA 02348657 2001-11-07
53/66
<220>
<223> Amorce
<400> 67
gcagtatgca agaaattgaa c 21
<210> 68
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 68
ggcctgtaat tttcttctg 19
<210> 69
<211> 21
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 69
gtactgaata gatacatgta g 21
<210> 70
<211> 19
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 70
gtgtagcaga tcaacatag 19
<210> 71
<211> 20
<212> ADN
<213> Séquence artificielle
<220>
<223> Amorce
<400> 71
catcttcaag tttggtgcac 20
<210> 72
<211> 1689
<212> ADN
<213> Mus musculus

cA 02348657 2001-11-07
54/66
<220>
<223> ADN Spg4 incomplet.
<400> 72
aggccgagag cgtccgcgtc ttccacaagc aggccttcga gtacatctcc attgccctgc 60
gcatcgacga ggaagagaaa gcaggacaga aggaacaagc tgtggaatgg tataagaaag 120
gtatcgaaga actggaaaaa ggaatcgctg ttatagttac gggccaaggt gaacagtatg 180
aaagagctag acgtcttcaa gccaaaatga tgactaattt agttatggcc aaggaccgtt 240
tacaacttct agagaagctg caaccagttt tgcaattttc caagtcacag acggacgtct 300
ataacgagag tactaacctg acatgccgca atggacatct ccagtcagaa agtggagcag 360
ttccgaagag gaaagacccc ttaacacatg ctagtaattc attgcctcga tcaaaaactg 420
tcctgaaaag tggctccgca gggctctccg gtcaccacag ggcgcctagt tgcagtggtt 480
tgtccatggt ttctggagca agaccgggac ctggtcctgc agctaccaca cataagggta 540
ctccaaaacc aaatagaacc aacaaacctt ctactcccac aactgcagtt cggaaaaaga 600
aagacttgaa aaattttagg aatgtggaca gcaatcttgc taaccttata atgaatgaaa 660
ttgttgacaa tgggacagct gttaagtttg atgacatagc cgggcaggag ctggcaaagc 720
aagcgctgca ggagattgtc atccttcctt ctctgcggcc tgagttgttc acagggctca 780
gagctcctgc tagaggcttg ttactcttcg gtccgccagg aaacggaaaa acaatgctgg 840
ctaaagcagt agctgcagag tctaatgcga cctttttcaa cataagtgct gccagtttaa 900
cttcaaaata tgtgggagaa ggagagaaat tggtgagagc tctctttgct gtggctcgag 960
aacttcaacc atctataatt tttatagatg aagttgacag tcttttgtgt gagagacggg 1020
aaggggagca cgacgctagc agacggctaa agacggaatt tttaatagaa tttgacgggg 1080
tgcaatctgc tggagatgac agagtacttg taatgggtgc aactaacagg ccccaagagc 1140
ttgatgaagc tgttctcagg cgtttcatta aacgggtata tgtgtcctta ccaaatgagg 1200
agacaagact ccttctgctt aaaaacctgt tgtgtaaaca aggaagtcca ctgacccaaa 1260
aagaactcgc acagcttgct agaatgaccg atggatactc tggaagtgat ctgaccgctt 1320
tggccaagga tgcagccctg ggtcctatcc gagaactgaa gccagagcag gtgaagaata 1380
tgtctgccag tgagatgaga aatattcgat tatctgactt cacagaatcc ttaaaaaaga 1440
taaaacgcag tgtgagtcct cagaccttag aagcatacat acgctggaac aaggattttg 1500
gagacaccac tgtttaaagg aatggatgcc tctgtgagcc catagaacat cgcacttcac 1560
aggaaacaag agctttggct acaggaaccc agacttcgtt tacaggacgt tttagagttt 1620
tcatttttgt gcaccaaact tgaagaggaa caagaagaca gacctaaata aaatatgcaa 1680
tatgaatgg 1689
<210> 73
<211> 504
<212> PRT
<213> Mus musculus
<220>
<223> Spastin murine incomplète.
<400> 73
Ala Glu Ser Val Arg Val Phe His Lys Gin Ala Phe Glu Tyr lie Ser
1 5 10 15
Ile Ala Leu Arg lie Asp Glu Glu Glu Lys Ala Gly Gin Lys Glu Gin
20 25 30
Ala Val Glu Trp Tyr Lys Lys Gly lie Glu Glu Leu Glu Lys Gly Ile
35 40 45
Ala Val lie Val Thr Gly Gln Gly Glu Gin Tyr Glu Arg Ala Arg Arg
50 55 60

cA 02348657 2001-11-07
55/66
Leu Gln Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu
65 70 75 80
Gln Leu Leu Glu Lys Leu Gln Pro Val Leu Gln Phe Ser Lys Ser Gln
85 90 95
Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His
100 105 110
Leu Gln Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr
115 120 125
His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly
130 135 140
Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu
145 150 155 160
Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr
165 170 175
His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro
180 185 190
Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val
195 200 205
Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu Ile Val Asp Asn Gly
210 215 220
Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gln Glu Leu Ala Lys Gln
225 230 235 240
Ala Leu Gln Glu lie Val Ile Leu Pro Ser Leu Arg Pro Glu Leu Phe
245 250 255
Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro
260 265 270
Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn
275 280 285
Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val
290 295 300
Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu
305 310 315 320
Leu Gln Pro Ser Ile Ile Phe lie Asp Glu Val Asp Ser Leu Leu Cys
325 330 335
Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu
340 345 350
_ _

CA 02348657 2001-11-07
56/66
Phe Leu Ile Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val
355 360 365
Leu Val Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val
370 375 380
Leu Arg Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu
385 390 395 400
Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro
405 410 415
Leu Thr Gin Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr
420 425 430
Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro
435 440 445
Ile Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu
450 455 460
Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile
465 470 475 480
Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr Ile Arg Trp Asn
485 490 495
Lys Asp Phe Gly Asp Thr Thr Val
500
<210> 74
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 74
attttttatt ttaaagcagg acag 24
<210> 75
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 75
aatttttttc tttcaggtga acag 24

CA 02348657 2001-11-07
57/66
<210> 76
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 76
cttctctgtt gcatagagaa gatg 24
<210> 77
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 77
actttttcct tgtcagaaag tgga 24
<210> 78
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 78
ttttgtatcc tttaagggta ctcc 24
<210> 79
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 79
aggtcttgtt tcttagtgga acag 24
<210> 80
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.

CA 02348657 2001-11-07
58/66
<400> 80
agtatatatt ttttagttgt tcac 24
<210> 81
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 81
cttgtgattt ttaaaggcta aagc 24
<210> 82
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 82
taatgctttg ttttaggtgg gaga 24
<210> 83
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 83
cttgtatttc ctctagatga agtt 24
<210> 84
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 84
gattttttgc ttgtaggtac agtc 24
<210> 85
<211> 24
<212> ADN

CA 02348657 2001-11-07
59/66
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 85
ggattttttt ttttaggcgt ttca 24
<210> 86
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 86
ttttaatatt tttcagacaa gact 24
<210> 87
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 87
tccttccctt cctcagaatg actg 24
<210> 88
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 88
cttttatgtt ttacagaact aaaa 24
<210> 89
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 89
ctttttaaaa atctagatga gaaa 24

CA 02348657 2001-11-07
60/66
<210> 90
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 90
tgagaaaggt aactaggggg ctgg 24
<210> 91
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 91
aggacaaggt aagattgtat ttgt 24
<210> 92
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 92
acttctaggt atcaattaat gtat 24
<210> 93
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 93
ccagtcaggt gggtttaggt taac 24
<210> 94
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.

CA 02348657 2001-11-07
61/66
<400> 94
ctcataaggt attctgggac agta 24
<210> 95
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 95
gtggacaagt aagttttgcc atct 24
<210> 96
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 96
ggcctgaggt aagaacttta tatt 24
<210> 97
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 97
caatgctggt aagggttctc ttca 24
<210> 98
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 98
caaaatacgt gagtgctctg tttc 24
<210> 99
<211> 24
<212> ADN

CA 02348657 2001-11-07
62/66
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 99
ttttataggt aagaacatat tttc 24
<210> 100
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 100
ttgatggtgt aagtgttgat tatg 24
<210> 101
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 101
gttctcaggt agggagattt atat 24
<210> 102
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 102
atgaggaggt atgtatctgt gttt 24
<210> 103
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 103
cttgctaggt gagtaatttg gatt 24
<210> 104

cA 02348657 2001-11-07
-
63/66
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 104
tatccgaggt aggtatacaa gagc 24
<210> 105
<211> 24
<212> ADN
<213> Homo sapiens
<220>
<223> Site donneur d'épissage du gène SPG4.
<400> 105
ccagtgaggt atagtatttt acaa 24
<210> 106
<211> 2152
<212> ADN
<213> Mus musculus
<220>
<223> ADN Spg4 complet
<400> 106
gctcccgggc tccggcgggc gcgcgagcgg ctccgtgggc ccccgccgcc gcagtggcag 60
tggccgccgc cgccgcttgg tcgccgtcgg tctgcgggaa gcgggttatg gcggcggcgg 120
cagtgggagc tgtgaatgag ttctccggcc ggacgacgga agaagaaagg ctcgggcggc 180
gcgagcccgg cgcccgccag gcctccgccc cccgccgcgg tccccgcccc tgccgccggc 240
ccggcccctg cggccggctc gccgcctaag cggaacctgt cttctttctc gtccccgctg 300
gtcgtcggct tcgccctgct gcgcctgctg gcctgccacc tggggctcct cttcgcgtgg 360
ctctgccagc gcttctcccg cgccctcatg gccgccaaga ggagctccgg gaccgcgccg 420
gcgcccgcct cgccctcgcc cccagcgccc ggaccgggtg gcgaggccga gagcgtccgc 480
gtcttccaca agcaggcctt cgagtacatc tccattgccc tgcgcatcga cgaggaagag 540
aaagcaggac agaaggaaca agctgtggaa tggtataaga aaggtatcga agaactggaa 600
aaaggaatcg ctgttatagt tacgggccaa ggtgaacagt atgaaagagc tagacgtctt 660
caagccaaaa tgatgactaa tttagttatg gccaaggacc gtttacaact tctagagaag 720
ctgcaaccag ttttgcaatt ttccaagtca cagacggacg tctataacga gagtactaac 780
ctgacatgcc gcaatggaca tctccagtca gaaagtggag cagttccgaa gaggaaagac 840
cccttaacac atgctagtaa ttcattgcct cgatcaaaaa ctgtcctgaa aagtggctcc 900
gcagggctct ccggtcacca cagggcgcct agttgcagtg gtttgtccat ggtttctgga 960
gcaagaccgg gacctggtcc tgcagctacc acacataagg gtactccaaa accaaataga 1020
accaacaaac cttctactcc cacaactgca gttcggaaaa agaaagactt gaaaaatttt 1080
aggaatgtgg acagcaatct tgctaacctt ataatgaatg aaattgttga caatgggaca 1140
gctgttaagt ttgatgacat agccgggcag gagctggcaa agcaagcgct gcaggagatt 1200
gtcatccttc cttctctgcg gcctgagttg ttcacagggc tcagagctcc tgctagaggc 1260
ttgttactct tcggtccgcc aggaaacgga aaaacaatgc tggctaaagc agtagctgca 1320
gagtctaatg cgaccttttt caacataagt gctgccagtt taacttcaaa atatgtggga 1380
gaaggagaga aattggtgag agctctcttt gctgtggctc gagaacttca accatctata 1440

cA 02348657 2001-11-07
64/66
atttttatag atgaagttga cagtcttttg tgtgagagac gggaagggga gcacgacgct 1500
agcagacggc taaagacgga atttttaata gaatttgacg gggtgcaatc tgctggagat 1560
gacagagtac ttgtaatggg tgcaactaac aggccccaag agcttgatga agctgttctc 1620
aggcgtttca ttaaacgggt atatgtgtcc ttaccaaatg aggagacaag actccttctg 1680
cttaaaaacc tgttgtgtaa acaaggaagt ccactgaccc aaaaagaact cgcacagctt 1740
gctagaatga ccgatggata ctctggaagt gatctgaccg ctttggccaa ggatgcagcc 1800
ctgggtccta tccgagaact gaagccagag caggtgaaga atatgtctgc cagtgagatg 1860
agaaatattc gattatctga cttcacagaa tccttaaaaa agataaaacg cagtgtgagt 1920
cctcagacct tagaagcata catacgctgg aacaaggatt ttggagacac cactgtttaa 1980
aggaatggat gcctctgtga gcccatagaa catcgcactt cacaggaaac aagagctttg 2040
gctacaggaa cccagacttc gtttacagga cgttttagag ttttcatttt tgtgcaccaa 2100
acttgaagag gaacaagaag acagacctaa ataaaatatg caatatgaat gg 2152
<210> 107
<211> 614
<212> PRT
<213> Mus musculus
<220>
<223> Spastin murine complète
<400> 107
Met Ser Ser Pro Ala Gly Arg Arg Lys Lys Lys Gly Ser Gly Gly Ala
1 5 10 15
Ser Pro Ala Pro Ala Arg Pro Pro Pro Pro Ala Ala Val Pro Ala Pro
20 25 30
Ala Ala Gly Pro Ala Pro Ala Ala Gly Ser Pro Pro Lys Arg Asn Leu
35 40 45
Ser Ser Phe Ser Ser Pro Leu Val Val Gly Phe Ala Leu Leu Arg Leu
50 55 60
Leu Ala Cys His Leu Gly Leu Leu Phe Ala Trp Leu Cys Gln Arg Phe
65 70 75 80
Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Thr Ala Pro Ala
85 90 95
Pro Ala Ser Pro Ser Pro Pro Ala Pro Gly Pro Gly Gly Glu Ala Glu
100 105 110
Ser Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser Ile Ala
115 120 125
Leu Arg Ile Asp Glu Glu Glu Lys Ala Gly Gln Lys Glu Gln Ala Val
130 135 140
Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile Ala Val
145 150 155 160
Ile Val Thr Gly Gln Gly Glu Gln Tyr Glu Arg Ala Arg Arg Leu Gln
165 170 175

cA 02348657 2001-11-07
65/66
Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu Gin Leu
180 185 190
Leu Glu Lys Leu Gin Pro Val Leu Gin Phe Ser Lys Ser Gin Thr Asp
195 200 205
Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His Leu Gin
210 215 220
Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr His Ala
225 230 235 240
Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly Ser Ala
245 250 255
Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu Ser Met
260 265 270
Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr His Lys
275 280 285
Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro Thr Thr
290 295 300
Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val Asp Ser
305 310 315 320
Asn Leu Ala Asn Leu Ile Met Asn Glu lie Val Asp Asn Gly Thr Ala
325 330 335
Val Lys Phe Asp Asp Ile Ala Gly Gin Glu Leu Ala Lys Gin Ala Leu
340 345 350
Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe Thr Gly
355 360 365
Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro Gly Asn
370 375 380
Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn Ala Thr
385 390 395 400
Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val Gly Glu
405 410 415
Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu Leu Gin
420 425 430
Pro Ser lie Ile Phe lie Asp Glu Val Asp Ser Leu Leu Cys Glu Arg
435 440 445
Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu Phe Leu
450 455 460
Ile Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val Leu Val
465 470 475 480

cA 02348657 2001-11-07
66/66
Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val Leu Arg
485 490 495
Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu Thr Arg
500 505 510
Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro Leu Thr
515 520 525
Gln Lys Glu Leu Ala Gin Leu Ala Arg Met Thr Asp Gly Tyr Ser Gly
530 535 540
Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro Ile Arg
545 550 555 560
Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu Met Arg
565 570 575
Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile Lys Arg
580 585 590
Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr Ile Arg Trp Asn Lys Asp
595 600 605
Phe Gly Asp Thr Thr Val
610

Representative Drawing

Sorry, the representative drawing for patent document number 2348657 was not found.

Administrative Status

2024-08-01:As part of the Next Generation Patents (NGP) transition, the Canadian Patents Database (CPD) now contains a more detailed Event History, which replicates the Event Log of our new back-office solution.

Please note that "Inactive:" events refers to events no longer in use in our new back-office solution.

For a clearer understanding of the status of the application/patent presented on this page, the site Disclaimer , as well as the definitions for Patent , Event History , Maintenance Fee  and Payment History  should be consulted.

Event History

Description Date
Inactive: IPC expired 2024-01-01
Inactive: Expired (new Act pat) 2020-09-04
Common Representative Appointed 2019-10-30
Common Representative Appointed 2019-10-30
Inactive: IPC expired 2018-01-01
Letter Sent 2016-02-23
Inactive: Correspondence - MF 2016-01-11
Inactive: Office letter 2015-10-02
Grant by Issuance 2014-07-08
Inactive: Cover page published 2014-07-07
Inactive: Acknowledgment of national entry - RFE 2014-05-05
Inactive: Applicant deleted 2014-05-05
Pre-grant 2014-04-04
Inactive: Final fee received 2014-04-04
Notice of Allowance is Issued 2013-10-07
Letter Sent 2013-10-07
Notice of Allowance is Issued 2013-10-07
Inactive: Q2 passed 2013-10-02
Inactive: Approved for allowance (AFA) 2013-10-02
Amendment Received - Voluntary Amendment 2013-08-28
Amendment Received - Voluntary Amendment 2012-12-21
Inactive: S.30(2) Rules - Examiner requisition 2012-07-10
Amendment Received - Voluntary Amendment 2011-12-06
Inactive: S.30(2) Rules - Examiner requisition 2011-06-06
Amendment Received - Voluntary Amendment 2010-04-14
Inactive: S.30(2) Rules - Examiner requisition 2009-10-14
Letter Sent 2005-09-23
Request for Examination Received 2005-09-02
Request for Examination Requirements Determined Compliant 2005-09-02
All Requirements for Examination Determined Compliant 2005-09-02
Inactive: Cover page published 2003-05-01
Letter Sent 2002-04-18
Inactive: Single transfer 2002-03-07
Amendment Received - Voluntary Amendment 2001-11-07
Inactive: Correspondence - Prosecution 2001-11-07
Inactive: Office letter 2001-10-01
Inactive: Correspondence - Prosecution 2001-09-25
Inactive: Office letter 2001-08-07
Inactive: First IPC assigned 2001-08-01
Inactive: Courtesy letter - Evidence 2001-07-24
Inactive: Correspondence - Prosecution 2001-07-18
Inactive: Notice - National entry - No RFE 2001-06-28
Application Received - PCT 2001-06-26
Amendment Received - Voluntary Amendment 2001-05-02
Application Published (Open to Public Inspection) 2001-03-15

Abandonment History

There is no abandonment history.

Maintenance Fee

The last payment was received on 2013-08-20

Note : If the full payment has not been received on or before the date indicated, a further fee may be required which may be one of the following

  • the reinstatement fee;
  • the late payment fee; or
  • additional fee to reverse deemed expiry.

Patent fees are adjusted on the 1st of January every year. The amounts above are the current amounts if received by December 31 of the current year.
Please refer to the CIPO Patent Fees web page to see all current fee amounts.

Owners on Record

Note: Records showing the ownership history in alphabetical order.

Current Owners on Record
CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE (CNRS)
Past Owners on Record
JAMILE HAZAN
JEAN WEISSENBACH
Past Owners that do not appear in the "Owners on Record" listing will appear in other documentation within the application.
Documents

To view selected files, please enter reCAPTCHA code :



To view images, click a link in the Document Description column. To download the documents, select one or more checkboxes in the first column and then click the "Download Selected in PDF format (Zip Archive)" or the "Download Selected as Single PDF" button.

List of published and non-published patent-specific documents on the CPD .

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.


Document
Description 
Date
(yyyy-mm-dd) 
Number of pages   Size of Image (KB) 
Description 2001-05-01 101 6,330
Description 2001-05-02 110 6,497
Description 2001-11-06 110 6,406
Description 2001-09-06 110 6,295
Abstract 2001-05-01 1 68
Claims 2001-05-01 4 223
Drawings 2001-05-01 7 453
Description 2010-04-13 110 6,405
Claims 2010-04-13 7 285
Claims 2011-12-05 8 313
Claims 2012-12-20 9 353
Notice of National Entry 2001-06-27 1 194
Courtesy - Certificate of registration (related document(s)) 2002-04-17 1 113
Reminder of maintenance fee due 2002-05-06 1 112
Reminder - Request for Examination 2005-05-04 1 116
Acknowledgement of Request for Examination 2005-09-22 1 177
Commissioner's Notice - Application Found Allowable 2013-10-06 1 162
Notice of National Entry 2014-05-04 1 201
Correspondence 2001-07-18 1 31
PCT 2001-05-01 8 363
Correspondence 2001-08-01 1 41
Correspondence 2001-09-06 69 3,927
Correspondence 2001-09-30 1 38
Correspondence 2014-04-03 2 78
Courtesy - Office Letter 2015-10-01 1 30
Maintenance fee correspondence 2016-01-10 2 73
Courtesy - Acknowledgment of Refund 2016-02-22 1 25

Biological Sequence Listings

Choose a BSL submission then click the "Download BSL" button to download the file.

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.

Please note that files with extensions .pep and .seq that were created by CIPO as working files might be incomplete and are not to be considered official communication.

BSL Files

To view selected files, please enter reCAPTCHA code :