Language selection

Search

Patent 2501445 Summary

Third-party information liability

Some of the information on this Web page has been provided by external sources. The Government of Canada is not responsible for the accuracy, reliability or currency of the information supplied by external sources. Users wishing to rely upon this information should consult directly with the source of the information. Content provided by external sources is not subject to official languages, privacy and accessibility requirements.

Claims and Abstract availability

Any discrepancies in the text and image of the Claims and Abstract are due to differing posting times. Text of the Claims and Abstract are posted:

  • At the time the application is open to public inspection;
  • At the time of issue of the patent (grant).
(12) Patent: (11) CA 2501445
(54) English Title: POLYPEPTIDES INVOLVED IN SPIRAMYCIN BIOSYNTHESIS, NUCLEOTIDE SEQUENCES ENCODING SAID POLYPEPTIDES AND USES THEREOF
(54) French Title: POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES NUCLEOTIDIQUES CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS.
Status: Expired
Bibliographic Data
(51) International Patent Classification (IPC):
  • C12N 15/52 (2006.01)
  • C07K 14/36 (2006.01)
  • C12N 1/21 (2006.01)
  • C12N 9/00 (2006.01)
  • C12N 15/63 (2006.01)
  • C12P 19/62 (2006.01)
(72) Inventors :
  • BLONDELET-ROUAULT, MARIE-HELENE (France)
  • DOMINGUEZ, HELENE (France)
  • DARBON-RONGERE, EMMANUELLE (France)
  • GERBAUD, CLAUDE (France)
  • GONDRAN, ANNE (France)
  • KARRAY, FATMA (France)
  • LACROIX, PATRICIA (France)
  • OESTREICHER-MERMET- BOUVIER, NATHALIE (France)
  • PERNODET, JEAN-LUC (France)
  • TUPHILE, KARINE (France)
(73) Owners :
  • AVENTIS PHARMA S.A. (France)
  • C.N.R.S. (France)
(71) Applicants :
  • AVENTIS PHARMA S.A. (France)
  • C.N.R.S. (France)
(74) Agent: BERESKIN & PARR LLP/S.E.N.C.R.L.,S.R.L.
(74) Associate agent:
(45) Issued: 2016-01-26
(86) PCT Filing Date: 2003-10-08
(87) Open to Public Inspection: 2004-04-22
Examination requested: 2008-07-16
Availability of licence: N/A
(25) Language of filing: French

Patent Cooperation Treaty (PCT): Yes
(86) PCT Filing Number: PCT/FR2003/002962
(87) International Publication Number: WO2004/033689
(85) National Entry: 2005-04-06

(30) Application Priority Data:
Application No. Country/Territory Date
0212489 France 2002-10-08
0302439 France 2003-02-27
60/493,490 United States of America 2003-08-07

Abstracts

English Abstract

The invention concerns isolation and identification of novel genes of spiramycin biosynthesis process and novel polypeptides involved in said biosynthesis. The invention also concerns a method for producing sand polypeptides. The invention further concerns the use of said genes for increasing the rate of production and purity in the resulting spiramycin. The invention concerns in particular a micro-organism producing spiramycin I but not producing spiramycin II and III and the use of such a micro-organism. The invention also concerns the use of genes in spiramycin biosynthesis process for constructing mutants capable of leading to synthesis of novel antibiotics or derivative forms of spiramycin. Finally the invention concerns molecules produced through expression of said genes and phamacologically active compositions of one molecule produced through expression of such genes.


French Abstract




La présente invention concerne l'isolement et l'identification de nouveaux
gènes de la voie de biosynthèse des spiramycines et de nouveaux polypeptides
impliqués dans cette biosynthèse. L'invention est également relative à un
procédé de production de ces polypeptides. Elle est également relative à
l'utilisation de ces gènes dans le but d'augmenter les taux de production et
la pureté de la spiramycine produite. L'invention concerne notamment un
microorganisme produisant de la spiramycine I mais ne produisant pas de
spiramycine II et III et l'utilisation d'un tel micoorganisme. L'invention a
également trait à l'utilisation des gènes de la voie de biosynthèse des
spiramycines pour la construction de mutants pouvant conduire à la synthèse de
nouveaux antibiotiques ou à des formes dérivées de spiramycines. L'invention
concerne encore les molécules produites grâce à l'expression de ces gènes et
des compositions pharmacologiquement actives d'une molécule produite grâce à
l'expression de tels gênes_________________________

Claims

Note: Claims are shown in the official language in which they were submitted.




215
REVENDICATIONS
1. Polynucléotide codant un polypeptide impliqué dans la biosynthèse des
spiramycines
caractérisé en ce que la séquence dudit polynucléotide est:
(a) l'une des séquences SEQ ID N o 111 ou 141,
(b) l'une des séquences dérivées de la séquence en (a) en raison de la
dégénérescence du code génétique, ou
(c) un polynucléotide présentant au moins 80%, 90%, 95% ou 98% d'identité
en
nucléotides avec un polynucléotide de la séquence en (a).
2. Polynucléotide selon la revendication 1, caractérisé en ce qu'il est isolé
à partir d'une
bactérie du genre Streptomyces.
3. Polypeptide résultant de l'expression d'un polynucléotide selon la
revendication 1 ou 2.
4. Polypeptide selon la revendication 3, ledit polypeptide étant impliqué dans
la
biosynthèse des spiramycines.
5. Polypeptide selon la revendication 3 ou 4, ledit polypeptide ayant une
séquence
comprenant la séquence SEQ ID N o 142.
6. Polypeptide selon la revendication 3 ou 4, ledit polypeptide ayant une
séquence
comprenant la séquence SEQ ID N o 112.
7. Vecteur d'expression caractérisé en ce qu'il comprend au moins une séquence
d'acide
nucléique codant un polypeptide selon l'une quelconque des revendications 3 à
6.
8. Cellule hôte comprenant un vecteur d'expression approprié permettant
l'expression d'un
ou plusieurs polypeptides selon l'une quelconque des revendications 3 à 6.
9. Procédé de production d'un polypeptide selon la revendication 3, 4, 5 ou 6
caractérisé
en ce que ledit procédé comprend les étapes suivantes:
a) insérer au moins un acide nucléique codant ledit polypeptide dans un
vecteur approprié;
b) cultiver, dans un milieu de culture approprié, une cellule hôte
préalablement
transformée ou transfectée avec le vecteur de l'étape a);
c) récupérer le milieu de culture conditionné ou un extrait cellulaire;



216
d) séparer et purifier à partir dudit milieu de culture ou encore â partir de
l'extrait
cellulaire obtenu à l'étape c), ledit polypeptide ; et
e) le cas échéant, caractériser le polypeptide recombinant produit.
10. Bactérie du genre Streptomyces productrice de spiramycine caractérisée en
ce qu'elle
possède une suppression, une substitution, une délétion et/ou une addition
d'une ou plusieurs
bases dans au moins un gène comprenant une des séquences SEQ ID N~ 111 ou 141
ou l'une
des séquences dérivées de celles-ci en raison de la dégénérescence du code
génétique et/ou
qu'elle surexprime au moins un gène comprenant une des séquences SEQ ID N~ 111
ou 141
ou l'une des séquences dérivées de celles-ci en raison de la dégénérescence du
code
génétique , ledit au moins un gène possédant une suppression, une
substitution, une délétion
et/ou une addition d'une ou plusieurs bases et/ou étant surexprimé codant pour
un polypeptide
impliqué dans la biosynthèse des spiramycines.
11. Bactérie du genre Streptomyces selon la revendication 10 caractérisée en
ce que la
surexpression du gène considéré est obtenue en augmentant le nombre de copie
de ce gène
et/ou en plaçant un promoteur plus actif que le promoteur sauvage.
12. Procédé de production de spiramycine(s), caractérisé en ce qu'il comprend
les étapes
suivantes:
(a) cultiver, dans un milieu de culture approprié, une bactérie selon l'une
quelconque
des revendications 10 à 11;
(b) récupérer le milieu de culture conditionné ou un extrait cellulaire; et
(c) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait
cellulaire obtenu à l'étape b), la ou lesdites spiramycines produites.
13. Utilisation d'une séquence selon l'une quelconque des revendications 1, et
2, d'un
vecteur selon la revendication 7 ou d'une cellule hôte selon la revendication
8 pour la
préparation d'antibiotiques hybrides.
14. Souche de Streptomyces selon l'une quelconque des revendications 10 à 11
caractérisée en ce qu'il s'agit de la souche OSC2/pSPM75(1) ou de la souche
OSC2/pSPM75(2) déposée auprès de la Collection Nationale de Cultures de
Microorganismes
(CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France,
le 6 octobre
2003 sous le numéro d'enregistrement 1-3101.



217
15. ADN recombinant caractérisé en ce qu'il comprend :
(a) un polynucléotide codant pour un polypeptide impliqué dans la biosynthèse
des
spiramycines susceptible d'être obtenu par amplification en chaîne par
polymérase en utilisant
le Couple d'amorces de séquence suivante :
5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N~ 138) et
5' GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N~ 139) et comme matrice le
cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, ; ou
(b) un fragment d'au moins 1200, 1400, 1450, ou 1500 nucléotides consécutifs
de ce
polynucléotide codant pour un polypeptide impliqué dans la biosynthèse des
spiramycines.
16. Fragment selon la revendication 15(b), ledit fragment étant efficace pour
amplifier les
séquences définies dans la revendication 1 ou 2.
17. Cellule hôte dans laquelle a été introduit au moins un ADN recombinant tel
que défini
dans la revendication 15 ou la revendication 16.
18. Procédé de production de spiramycine(s), caractérisé en ce qu'il comprend
les étapes
suivantes:
a. cultiver, dans un milieu de culture approprié, une cellule hôte selon la
revendication 17;
b. récupérer le milieu de culture conditionné ou un extrait cellulaire; et
c. séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait
cellulaire obtenu à l'étape b), les spiramycines.

Description

Note: Descriptions are shown in the official language in which they were submitted.


DEMANDES OU BREVETS VOLUMINEUX
LA PRÉSENTE PARTIE DE CETTE DEMANDE OU CE BREVETS
COMPREND PL US D'UN TOME.
CECI EST LE TOME 1 DE 3
NOTE: Pour les tomes additionels, veillez contacter le Bureau Canadien des
Brevets.
JUMBO APPLICATIONS / PATENTS
THIS SECTION OF THE APPLICATION / PATENT CONTAINS MORE
THAN ONE VOLUME.
THIS IS VOLUME 1 OF 3
NOTE: For additional volumes please contact the Canadian Patent Office.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
1
POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES, SEQUENCES
NUCLEOTIDIQUES CODANT CES POLYPEPTIDES ET LEURS APPLICATIONS
La présente invention concerne l'isolement et l'identification de nouveaux
'gènes de
la voie de biosynthèse des spiramycines et de nouveaux polypeptides impliqués
dans
cette biosynthèse. Elle est également relative à l'utilisation de ces gènes
dans le but
d'augmenter les taux de production et la pureté de la spiramycine produite.
L'invention a également trait à l'utilisation de ces gènes pour la
construction de
mutants pouvant conduire à la synthèse de nouveaux antibiotiques ou à des
formes
dérivées de spiramycines. L'invention concerne encore les molécules produites
grâce à
l'expression de ces gènes et enfin des compositions pharmacologiquement
actives d'une
molécule produite grâce à l'expression de tels gènes.
Les Streptomyces sont des bactéries filamenteuses Gram positif du sol. Elles
jouent un rôle important dans la décomposition et la minéralisation des
matières
organiques grâce à la grande diversité des enzymes dégadatives qu'elles
sécrètent. Elles
présentent des phénomènes de différenciations morphologiques uniques chez les
procaryotes s'accompagnant d'une différenciation métabolique caractérisée par
la
production de métabolites secondaires présentant une extraordinaire diversité
de
structures chimiques et d'activités biologiques. Parmi ces métabolites, on
retrouve les
spiramycines produites à l'état naturel par la bactérie Streptomyces
ambofaciens.
La spiramycine est un antibiotique de la famille des macrolides utile aussi
bien en
médecine vétérinaire qu'en médecine humaine. Les macrolides sont caractérisés
par la
présence d'un cycle lactone sur lequel sont greffés un ou plusieurs sucres.
Streptomyces
ambofaciens produit à l'état naturel la spiramycine I, II et III (cf. Figure
1), cependant
l'activité antibiotique de la spiramycine I est nettement supérieure à celle
des

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
2
spiramycines II et III (Liu et al., 1999). La molécule de spiramycine I est
constituée d'un
macro-cycle lactonique, appellé platénolide et de trois sucres : la
forosamine, le
mycaminose et le mycarose (cf. Figure 1). L'activité antibiotique des
spiramycines est
due à une inhibition de la synthèse protéique chez les procaryotes par un
mécanisme
impliquant la liaison de l'antibiotique au ribosome bactérien.
Certins composés membres de la famille des macrolides et possédant également
un cycle lactone ont donné lieu à des utilisations hors du domaine des
antibiotiques.
Ainsi le produit FK506 a des effets immunosuppresseurs et offre des
perspectives
d'application thérapeutique dans le domaine de la transplantation d'organe, de
l'arthrite
rhumatoïde et plus généralement dans des pathologies liées à des réactions
autoimmunes. D'autres macrolides comme l'avermectine ont des activités
insecticides et
anti-helminthiques.
De nombreuses voies de biosynthèse, concernant des antibiotiques appartenant à

des classes variées ainsi que d'autres métabolites secondaires (pour une
revue, Chater K.
, 15 1990), ont à ce jour déjà été étudiées chez les Streptomycètes.
Cependant, la
:
connaissance des voies de biosynthèse des spiramycines n'est que très
partielle à ce jour.
La biosynthèse des spiramycines est un processus complexe comportant de
nombreuses étapes et impliquant de nombreuses enzymes (Omura et al., 1979a,
Omura
et al., 1979b). Les spiramycines appartiennent à la large classe des
polyketides qui
regroupe des molécules complexes particulièrement abondantes dans les
microorganismes du sol. Ces molécules sont regroupées non pas par analogie de
structure mais par une certaine similarité au niveau d'étapes de leur voie de
biosynthèse.
En effet, les polyketides sont produits par une série complexe de réactions
mais
possèdent en commun d'avoir dans leur voie de biosynthèse une série de
réactions
catalysées par une ou des enzymes appelées polyketides synthases (PKS).
Chez
Streptomyces ambofaciens, la biosynthèse du macro-cycle lactonique des
spiramycines
(platénolide) est réalisée par une série de huit modules codés par cinq gènes
PKS
différents (Kuhstoss S., 1996, brevet US 5,945,320). Les spiramycines sont
obtenues à

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
3
partir de ce cycle lactone. Cependant, les diverses étapes et enzymes
impliquées dans la
synthèse des sucres, ainsi que leur liaison au cycle lactone et la
modification de ce cycle
pour l'obtention des spiramycines restent encore inconnues à ce jour.
Le brevet US 5,514,544 décrit le clonage d'une séquence appelée srmR chez
Streptomyces ambofaciens. Il est fait l'hypothèse dans ce brevet que le gène
srmR code
une protéine régulatrice de la transcription des gènes impliqués dans la
biosynthèse des
macrolides.
En 1987, Richardson et collaborateurs (Richardson et al., 1987) ont montré que
la
résistance à la spiramycine de S. ambofaciens est conférée par au moins trois
gènes, ces
derniers ont été appelés srmA, srmB et srmC. Le brevet US 4,886,757 décrit
plus
particulièrement la caractérisation d'un fragment d'ADN de S. ambofaciens
contenant le
gène srmC. Cependant la séquence de ce gène n'a pas été divulguée. En 1990,
Richardson et collaborateurs (Richardson et al., 1990) ont posé l'hypothèse de

l'existence de trois gènes de biosynthèse de la spiramycine proche de srmB. Le
brevet
US 5,098,837 rapporte le clonage de cinq gènes potentiellement impliqués dans
la
biosynthèse de la spiramycine. Ces gènes ont été baptisés srmD, srmE, srmF,
srmd e
srmH.
Une des difficultés majeures dans la production de composés tels que les
spiramycines réside dans le fait que de très grands volumes de fermentation
sont
nécessaires à la production d'une quantité relativement faible de produit. Il
est donc
souhaitable de pouvoir augmenter l'efficacité de production de telles
molécules afin d'en
diminuer les coûts de production.
La voie de biosynthèse des spiramycines est un processus complexe et il serait

souhaitable d'identifier et de supprimer les réactions parasites qui
pourraient exister au
cours de ce processus. Le but d'une telle manipulation est d'obtenir un
antibiotique plus
pur et/ou une amélioration de la productivité. A ce sujet, Streptomyces
ambofaciens
produit à l'état naturel la spiramycine I, II et III (cf. Figure 1), cependant
l'activité
antibiotique de la spiramycine I est nettement supérieure à celle des
spiramycines II et III

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
4
(Liu et al., 1999). Il serait donc souhaitable de pouvoir disposer de souches
ne
produisant que de la spiramycine I.
En raison de l'intérêt commercial des antibiotiques macrolides, l'obtention de

nouveaux dérivés, notamment d'analogues de spiramycines ayant des propriétés
avantageuses est inten5ivement recherchée. Il serait souhaitable de pouvoir
générer en
quantité suffisante les. intermédiaires de biosynthèse de la voie de
biosynthèse des
spiramycines ou des dérivés des spiramycines notamment dans le but de
fabriquer des
antibiotiques hybrides dérivés des spiramycines.
Description générale de l'invention
La présente invention résulte du clonage de gènes dont le produit intervient
dans la
biosynthèse des spiramycines. L'invention concerne tout d'abord de nouveaux
gènes de
la voie de biosynthèse des spiramycines et de nouveaux polypeptides impliqués
dans
cette biosynthèse.
. ,
Les gènes de la voie de biosynthèse et les séquences codantes associées ont
été
clonés et la séquence d'ADN de chacun a été déterminée. Les séquences codantes

clonées seront désignées par la suite orfl*c, orf2*c, orf3*c, orf4*c, orf5*,
orfe, orf7*c,
orf8*, orf9*, orf.10*, orfl, orfl, orf3, orf4, orf5, orf6, orf7, orf8, orf9c,
orf10, orfllc,
orf12, orfl3c, orf14, orfl5c, orf16, orf17, orf18, orf19, orf20, orf21c,
orf22c, orf23c,
orf24c, orf25c, orf26, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 et
orf34c. La
fonction des protéines codées par ces séquences dans la voie de biosynthèse
des
spiramycines est développée dans la discussion ci-après qui est illustrée par
les figures 4,
5, 6 et 8.
1) Un premier objet de l'invention concerne un polynucléotide codant un
polypeptide impliqué dans la biosynthèse des spiramycines caractérisé en ce
que la
séquence dudit polynucléotide est:

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
(a) l'une des séquences SEQ ID N 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25,
28,
30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78,
80, 82, 84, 107,
109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149,
(b) l'une des séquences constituées par les variants des séquences (a),
5 (c) l'une des séquences dérivées des séquences (a) et (b) en raison
de la
dégénérescence du code génétique.
2) La présente invention a également pour objet un polynucléotide s'hybridant
dans des conditions d'hybridation de forte stringence à au moins l'un des =
polynucléotides selon le paragraphe 1) ci-dessus.
3) L'invention concerne également un polynucléotide présentant au moins 70%,
80%, 85%, 90%, 95% ou 98% d'identité en nucléotides avec un polynucléotide
comprenant au moins 10, 12, 15, 18, 20 à 25, 30, 40, 50, 60, 70, 80, 90, 100,
150, 200,
250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950,
1000, 1059,
1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700,
1750,
1800, 1850 ou 1900 nucléotides consécutifs d'un polynucléotide selon le
paragraphe.
ci dessus.
4) L'invention concerne également un polynucléotide selon le pragraphe 2) ou
3)
ci-dessus caractérisé en ce qu'il est isolé à partir d'une bactérie du genre
Streptomyces.
5) L'invention concerne également un polynucléotide selon le pragraphe 2), 3)
ou
4) ci-dessus caractérisé en ce qu'il code une protéine impliquée dans la
biosynthèse
d'un macrolide.
6) L'invention concerne également un polynucléotide selon le pragraphe 2), 3)
ou
4) ci-dessus caractérisé en ce qu'il code une protéine ayant une activité
similaire à la
protéine codée par le polynucléotide avec lequel il s'hybride ou il présente
l'identité.
7) L'invention concerne également un polypeptide résultant de l'expression
d'un
polynucléotide selon le pragraphe 1), 2), 3), 4), 5) ou 6) ci-dessus.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
6
8) Un autre aspect de l'invention concerne un polypeptide impliqué dans la
biosynthèse des spiramycines caractérisée en ce que la séquence dudit
polypeptide est:
(a) l'une des séquences SEQ ID N 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26,
27,
29, 31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56,
57, 58, 59, 61,
63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117,
119, 121,
142, 144, 146, 148 et 150,
(b) l'une des séquences telles que définies en (a) excepté que tout au long de

ladite séquence un ou plusieurs acides aminés ont été substitués, insérés ou
délétés sans
en affecter les propriétés fonctionnelles,
(e) l'une des séquences constituées par les variants des séquences (a) et (b).
9) Un autre objet de l'invention concerne un polypeptide présentant au moins
70%, 80%, 85%, 90%, 95% ou 98% d'identité en acides aminés avec un polypeptide

comprenant au moins 10, 15, 20, 30 à 40, 50, 60, 70, 80, 90,100, 120, 140,
160, 180,
200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480,
500, 520,
540, 560, 580, 600, 620 ou 640 acides aminés consécutifs d'un polypeptide
selon le
paragraphe 8) ci-dessus.
10) Un autre aspect de l'invention concerne un polypeptide selon le paragraphe
9)
ci-dessus caractérisé en ce qu'il est isolé à partir d'une bactérie du genre
Streptomyces.
11) Un autre aspect de l'invention concerne un polypeptide selon le paragraphe
9)
OU 10) ci-dessus caractérisé en ce qu'il code une protéine impliquée dans la
biosynthèse
d'un macrolide.
12) Un autre aspect de l'invention concerne un polypeptide selon le pragraphe
9),
10) ou 11) ci-dessus caractérisé en ce qu'il a une activité similaire à celle
du
polypeptide avec lequel il partage l'identité.
13) Un autre aspect de l'invention concerne un ADN recombinant caractérisé en
ce qu'il comprend au moins un polynucléotide selon l'un des paragraphes 1),
2), 3), 4),
5) ou 6) ci-dessus.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
7
14) Un autre aspect de l'invention concerne un ADN recombinant selon le
pragraphe 13) ci-dessus caractérisé en ce que le dit ADN recombinant est
compris dans
un vecteur.
15) Un autre aspect de l'invention concerne un ADN recombinant selon le
paragraphe 14) ci-dessus caractérisé en ce que ledit vecteur est choisi parmi
les
bactériophhges, les plasmides, les phagemides, les vecteurs intégratifs, les
fosmides, les
cosmides, les vecteurs navettes, les BAC ou les PAC.
16) Un autre aspect de l'invention concerne un ADN recombinant selon le
pragraphe 15) ci-dessus caractérisé en ce qu'il est choisi parmi pOS49.1,
pOS49.11,
pOSC49.12, pOS49.14, pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5,
pSPM7, pOS49.67, pOS49.88, pOS49.106, pOS49.120, pOS49.107, pOS49.32,
pOS49.43, pOS49.44, pOS49.50, pOS49.99, pSPM17, pSPM21, pSPM502, pSPM504,
pSPM507, pSPM508, pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113,
pSPM520, pSPM521, pSPM522, pSPM523, pSPM524, pSPM525, pSPM527,
pSPM528, pSPM34, pSPM35, pSPM36, pSPM37, pSPM38, pSPM39, pSPM4Q,
pSPM41, pSPM42, pSPM43, pSPM44, pSPM45, pSPM47, pSPM48, pSPM50,
pSPM51, pSPM52, pSPM53, pSPM55, pSPM56, pSPM58, pSPM72, pSPM73,
pSPM515, pSPM519, pSPM74, pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 et
pSPM106.
17) Un autre aspect de l'invention concerne un vecteur d'expression
caractérisé en
ce qu'il comprend au moins une séquence d'acide nucléique codant un
polypeptide
selon le pragraphe 7), 8), 9), 10), 11) ou 12) ci-dessus.
18) L'invention est également relative à un système d'expression comprenant un

vecteur d'expression approprié et une cellule hôte permettant l'expression
d'un ou
plusieurs polypeptides selon le paragraphe 7), 8), 9), 10), 11) ou 12) ci-
dessus.
19) L'invention est également relative à un système d'expression selon le
paragraphe 18 ci-dessus caractérisé en ce qu'il est choisi parmi les systèmes
d'expression procaryotes ou les systèmes d'expression eucaryotes.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
8
20) L'invention est également relative à un système d'expression selon le
paragraphe 19) ci-dessus caractérisé en ce qu'il est choisi parmi les systèmes

d'expression chez la bactérie E. cou, les sytèmes d'expression baculovirus
permettant
une expression dans des cellules d'insectes, les sytèmes d'expression
permettant une
expression dans des cellules de levures, les sytèmes d'expression permettant
une
expression dans des cellules de mammifères.
21) L'invention est également relative à une cellule hôte dans laquelle a été
introduit au moins un polynucléotide et/ou au moins un ADN recombinant et/ou
au
moins un vecteur d'expression selon l'un des pragraphes 1), 2), 3), 4), 5),
6), 13), 14),
15), 16) ou 17) ci-dessus.
22) L'invention est également relative à un procédé de production d'un
polypeptide selon le paragraphe 7), 8), 9), 10), 11) ou 12) ci-dessus
caractérisé en ce
que ledit procédé comprend les étapes suivantes:
a) insérer au moins un acide nucléique codant ledit polypeptide dans un
vecteur
approprié ;
b) cultiver, dans un milieu de culture 'approziprié, une cellule hôte
préalablement
transformée ou transfectée avec le vecteur de l'étape a) ;
c) récupérer le milieu de culture conditionné ou un extrait cellulaire;
d) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait cellulaire obtenu à l'étape c), ledit polypeptide ;
e) le cas échéant, caractériser le polypeptide recombinant produit.
23) Un autre aspect de l'invention concerne un microorganisme bloqué dans une
étape de la voie de biosynthèse d'au moins un macrolide.
24) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 23) ci-dessus caractérisé en ce qu'il est obtenu en inactivant la
fonction d'au
moins une protéine impliquée dans la biosynthèse de ce ou de ces macrolides
dans un
microorganisme producteur de ce ou de ces macrolide.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
9
25) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 24) ci-dessus caractérisé en ce que l'inactivation de cette ou de
ces protéines
est effectuée par mutagénèse dans le ou les gènes codant ladite ou lesdites
protéines ou
par expression d'un ou de plusieurs ARN anti-sens complémentaires de l'ARN ou
des
ARN messagers codant ladite ou lesdites protéines. "
26) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 25) ci-dessus caractérisé en ce que l'inactivation de cette ou de
ces protéines
est effectuée par mutagénèse par irradiation, par action d'agent chimique
mutagène, par
mutagénèse dirigée ou par remplacement de gène.
27) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 25) ou 26) ci-dessus caractérisé en ce que la ou les mutagénèses
sont
effectuées in vitro ou in situ, par suppression, substitution, délétion et/ou
addition d'une
ou plusieurs bases dans le ou les gènes considérés ou par inactivation
génique.
28) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 23), 24), 25), 26) ou 27) ci-dessus caractérisé en ce que ledit..4
microorganisme est une bactérie du genre Streptomyces.
29) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 23), 24), 25), 26), 27) ou 28) ci-dessus caractérisé en ce que le
macrolide est
la spiramycine.
30) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 23), 24), 25), 26), 27), 28) ou 29) ci-dessus caractérisé en ce que
ledit
microorganisme est une souche de S. ambofaciens.
31) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 23), 24), 25), 26), 27), 28), 29) ou 30) ci-dessus caractérisé en
ce que la
mutagénèse est effectuée dans au moins un gène comprenant une séquence selon
l'un
des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
32) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 25), 26), 27), 28), 29), 30) ou 31) ci-dessus caractérisé en ce que
la
mutagénèse est effectuée dans un ou plusieurs gènes comprenant une des
séquences
correspondant à une ou plusieurs des séquences SEQ ID N 3, 5, 7, 9, 11, 13,
15, 17, 19,
5 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68,
70, 72, 74, 76, 78,
80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 `et 149;
33) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 25), 26), 27), 28), 29), 30), 31) ou 32) ci-dessus caractérisé en
ce que la
mutagénèse consiste en l'inactivation génique d'un gène comprenant une
séquence
10 correspondant à la séquence SEQ ID N 13.
34) Un autre aspect de l'invention concerne une souche de Streptomyces
ambofaciens caractérisée en ce qu'il s'agit d'une souche choisie parmi l'une
des
souches déposées auprès de la ColleCtion Nationale de Cultures de
Microorganismes
(CNCM) le 10 juillet 2002 sous le numéro d'enregistrement 1-2909, 1-2911, I-
2912,1-
ii 2913,1-2914, I-2915,1-2916 ou 1-2917.
35) Un autre aspect de l'invention concerne un procédé de préparation d'un
intermédiaire de biosynthèse de macrolide caractérisé en ce qu'il comprend les
étapes
suivantes :
a) cultiver, dans un milieu de culture approprié, un microorganisme selon l'un
des
paragraphes 23), 24), 25), 26), 27), 28), 29), 30), 31), 32), 33) ou 34) ci
dessus,
b) récupérer le milieu de culture conditionné ou un extrait cellulaire,
c) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait
cellulaire obtenu à l'étape b), ledit intermédiaire de biosynthèse.
36) Un autre aspect de l'invention concerne un procédé de préparation d'une
molécule dérivée d'un macrolide caractérisé en ce que l'on prépare un
intermédiaire de
biosynthèse selon le procédé du paragraphe 35) ci-dessus et que l'on modifie
l'intermédiaire ainsi produit.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
11
37) Un autre aspect de l'invention concerne un procédé de préparation selon le

paragraphe 36) ci-dessus caractérisé en ce que l'on modifie ledit
intermédiaire par voie
chimique, biochimique, enzymatique et/ou microbiologique.
38) Un autre aspect de l'invention concerne un procédé de préparation selon le
paragraphe 36) ou 37) ci-dessus caractérisé en ce que l'on introduit dans
ledit
microorganisme un ou plusieurs gènes codant des protéines suscefetibles de
modifier
l'intermédiaire en s'en servant comme substrat.
39) Un autre aspect de l'invention concerne un procédé de préparation selon le

paragraphe 36), 37) ou 38) ci-dessus caractérisé en ce que le macrolide est la

spiramycine.
40) Un autre aspect de l'invention concerne un procédé de préparation selon le

paragraphe 36), 37), 38) ou 39) ci-dessus caractérisé en ce que le
microorganisme utilisé
est une souche de S. ambofaciens.
41) Un autre aspect de l'invention concerne un microorganisme produisant de la
= -
spiramycine I mais ne produisant pas de spiramycine II et IQ
42) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 41) ci-dessus caractérisé en ce qu'il comprend l'ensemble des gènes

nécessaires à la biosynthèse de la spiramycine I mais que le gène comprenant
la
séquence SEQ ID N 13 ou l'un de ses variants ou l'une des séquences dérivées
de
celles-ci en raison de la dégénérescence du code génétique et codant un
polypeptide de
séquence SEQ ID N 14 ou l'un de ses variants n'est pas exprimé ou a été rendu
inactif.
43) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 42) ci-dessus caractérisé en ce que la dite inactivation est
réalisée par
mutagénèse dans le gène codant ladite protéine ou par l'expression d'un ARN
anti-sens
complémentaire de l'ARN messager codant ladite protéine.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
12
44) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 43) ci-dessus caractérisé en ce que la dite mutagénèse est
effectuée dans le
promoteur de ce gène, dans la séquence codante ou dans une séquence non
codante de
manière à rendre inactive la protéine codée ou à en empêcher son expression ou
sa
traduction.
45) Un autre aspect de l'invention concerne un microorganisme selon la
revendication 43) ou 44) ci-dessus caractérisé en ce que la mutagénèse est
effectuée par
irradiation, par action d'agent chimique mutagène, par mutagénèse dirigée ou
par
remplacement de gène.
46) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 43), 44) ou 45) ci-dessus caractérisé en ce que la mutagénèse est
effectuée in
vitro ou in situ, par suppression, substitution, délétion et/ou addition d'une
ou plusieurs
bases dans le gène considéré ou par inactivation génique.
47) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 41) ou 42) ci-dessus caractérisé en ce que ledit microorganisme est
obtenu
en exprimant les gènes de la voie de biosynthèse de la spiramycine sans que
ceux-ci ne
comprennent le gène comprenant la séquence correspondant à SEQ ID N 13 ou
l'un de
ses variants ou l'une des séquences dérivées de celles-ci en raison de la
dégénérescence
du code génétique et codant un polypeptide de séquence SEQ ID N 14 ou l'un de
ses
variants.
48) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 41), 42), 43), 44), 45), 46) ou 47) ci-dessus caractérisé en ce que
ledit
microorganisme est une bactérie du genre Streptomyces.
49) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 41), 42), 43), 44), 45), 46), 47) ou 48) ci-dessus caractérisé en
ce que ledit
microorganisme est obtenu à partir d'une souche de départ produisant les
spiramycines
I, II et III.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
13
50) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 41), 42), 43), 44), 45), 46), 47), 48) ou 49) ci-dessus caractérisé
en ce qu'il
est obtenu par mutagénèse dans un gène comprenant la séquence correspondant à
SEQ
ID N 13 ou l'un de ses variants ou l'une des séquences dérivées de celles-ci
en raison
de la dégénérescence du code génétique et codant un polypeptide de séquence
SEQ ID
N 14 ou l'un de ses variants ayant la même fonction.
51) Un autre aspect de l'invention concerne im microorganisme selon le
paragraphe 41), 42), 43), 44), 45), 46), 47), 48), 49) ou 50) ci-dessus
caractérisé en ce
que ledit microorganisme est obtenu à partir d'une souche de S. ambofaciens
produisant
les spiramycines I, II et III, dans laquelle est effectuée une inactivation
génique du gène
comprenant la séquences correspondant à SEQ ID N 13 ou l'une des séquences
dérivées de celle-ci en raison de la dégénérescence du code génétique.
52) Un autre aspect de l'invention concerne une souche de S. ambofaciens
caractérisée en ce qu'il s'agit de la souche déposée auprès de la Collection
Nationale de
Cultures de Microorganismes (CNCM) le 10 juillet 2002 sous le numéro
d'enregistrement 1-2910.
53) Un autre aspect de l'invention concerne un procédé de production de
spiramycine I, caractérisé en ce qu'il comprend les étapes suivantes :
(a) cultiver, dans un milieu de culture approprié, un microorganisme selon
l'un
des paragraphes 41), 42), 43), 44), 45), 46), 47), 48), 49), 50), 51) ou 52)
ci-dessus,
(b) récupérer le milieu de culture conditionné ou un extrait cellulaire,
(c) séparer et purifier à partir dudit milieu de culture ou encore à partir de

l'extrait cellulaire obtenu à l'étape b), la spiramycine I.
54) Un autre aspect de l'invention concerne l'utilisation d'un polynucléotide
selon
l'un des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus pour améliorer la
production en
macrolides d'un microorganisme.
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
14
55) Un autre aspect de l'invention concerne un microorganisme mutant
producteur de macrolide caractérisé en ce qu'il possède une modification
génétique dans
au moins un gène comprenant une séquence selon l'un des paragraphes 1), 2),
3), 4), 5)
ou 6) ci-dessus et/ou qu'il surexprime au moins un gène comprenant une
séquence selon
l'un des paragraphes 1), 2), 3), 4), 5) ou 6) ci-dessus.
56) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55) ci-dessus caractérisé en ce que la modification génétique
consiste en une
suppression, une substitution, une délétion et/ou une addition d'une ou
plusieurs bases
dans le ou les gènes considérés dans le but d'exprimer une ou des protéines
ayant une
activité supérieure ou d'exprimer un niveau plus élevé de cette ou de ces
protéines.
57) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55) ci-dessus caractérisé en ce que la surexpression du gène
considéré est
obtenue en augmentant le nombre de copie de ce gène et/ou en plaçant un
promoteur
plus actif que le promoteur sauvage.
58) Un autre aspect de l'invention concerne un microorganisme mutant selon le.
paragraphe 55) ou 57) ci-dessus caractérisé en ce que la surexpression du gène

considéré est obtenue en transformant un microorganisme producteur de
macrolide par
une construction d'ADN recombinant selon le paragraphe 13, 14 ou 17 ci-dessus,

permettant la surexpression de ce gène.
59) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55), 56), 57) ou 58) ci-dessus caractérisé en ce que la
modification
génétique est effectuée dans un ou plusieurs gènes comprenant une des
séquences
correspondant à une ou plusieurs des séquences SEQ ID N 3, 5, 7, 9, 11, 13,
15, 17, 19,
21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70,
72, 74, 76, 78,
80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou
l'un de ses
variants ou l'une des séquences dérivées de celles-ci en raison de la
dégénérescence du
code génétique.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
60) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55), 56), 57), 58) ou 59) ci-dessus caractérisé le microorganisme
surexprime
un ou plusieurs gènes comprenant une des séquences correspondant à une ou
plusieurs
des séquences SEQ ID N 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30,
34, 36, 40,
5 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84,
107, 109, 111, 113,
115, 118, 120, 141, 143, 145, 147 et 149, ou l'un de ses variants ou l'une des
séquences
dérivées de celles-ci en raison de la dégénérescence du code génétique.
61) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55), 56), 57), 58), 59) ou 60) ci-dessus caractérisé en ce que
ledit
10 microorganisme est une bactéries du genre Streptomyces.
62) Un autre aspect de l'invention concerne un microorganisme mutant selon le
paragraphe 55), 56), 57), 58), 59), 60) ou 61) ci-dessus caractérisé en ce que
le
macrolide est la spiramycine.
63) Un autre aspect de l'invention concerne un microorganisme mutant selon le
15 paragraphe 55), 56), 57), 58), 59), 60), 61) ou 62) ci-dessus
caractérisé en ce que ledit
microorganisme est une souches de S. ambofaciens.
64) Un autre aspect de l'invention concerne un procédé de production de
macrolides, caractérisé en ce qu'il comprend les étapes suivantes :
(a) cultiver, dans un milieu de culture approprié, un microorganisme selon
l'un
des paragraphes 55), 56), 57), 58), 59), 60), 61), 62), 63) ou 64) ci-dessus,
(b) récupérer le milieu de culture conditionné ou un extrait cellulaire,
(c) séparer et purifier à partir dudit milieu de culture ou encore à partir de

l'extrait cellulaire obtenu à l'étape b), le ou lesdits macrolides produits.
65) Un autre aspect de l'invention concerne l'utilisation d'une séquence et/ou
d'un
ADN recombinant et/ou d'un vecteur selon l'un des paragraphes 1), 2), 3), 4),
5), 6), 7),
8), 9), 10), 11), 12), 13), 14), 15), 16) ou 17) ci-dessus pour la préparation

d'antibiotiques hybrides.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
16
66) Un autre aspect de l'invention concerne l'utilisation d'au moins un
polynucléotide et/ou au moins un ADN recombinant et/ou au moins un vecteur
d'expression et/ou au moins un polypeptide et/ou au moins une cellule hôte
selon l'un
des paragraphes 1), 2), 3), 4), 5), 6), 7), 8), 9), 10), 11), 12), 13), 14),
15), 16), 17) ou
21) ci-dessus pour réaliser une ou plusieurs bioconversions.
67) Un autre aspect de l'invention concerne un polynuclêotide caractérisé en
ce
qu'il s'agit d'un polynucléotide complémentaire de l'un des polynucléotides
selon le
paragraphe 1), 2), 3), 4), 5), ou 6) ci-dessus.
68) Un autre aspect de l'invention concerne un microorganisme producteur
d'au moins une spiramycine caractérisé en ce qu'il surexprime :
- un gène susceptible d'être obtenu par amplification en chaîne par
polymérase (PCR) en utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5' =
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens,
- ou un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique.
69) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 68 ou 90 caractérisé en ce qu'il s'agit d'une bactérie du genre
Streptomyces.
70) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 68, 69 ou 90 caractérisé en ce qu'il s'agit d'une bactérie de
l'espèce
Streptomyces ambofaciens.
71) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 68, 69, 70 ou 90 caractérisé en ce que la surexpression dudit gène
est
obtenue par transformation dudit microorganisme par un vecteur d'expression.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
17
72) Un autre aspect de l'invention concerne une souche de Streptomyces
ambofaciens caractérisée en ce qu'il s'agit de la souche OSC2/pSPM75(1) ou de
la
souche OSC2/pSPM75(2) déposée auprès de la Collection Nationale de Cultures de

Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris
Cedex 15, France, le 6 octobre 2003 sous le numéro d'enregistrement 1-3101.
73) Un autre aspect de l'invention concerne un ADN recombinant caractérisé
en ce qu'il comprend :
- un polynucléotide susceptible d'être obtenu par amplification en chaîne par
polyrnérase en utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens,
- ou un fragment d'au moins 10, 12, 15, 18, 20 à 25, 30, 40, 50, 60, 70, 80,
= 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750,
800, 850,
900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460,
1470,
1480, 1490 ou 1500 nucléotides consécutifs de ce polynucléotide.
e
,
74) Un autre aspect de l'invention concerne un ADN recombinant selon le
paragraphe 73 ou 91 caractérisé en ce qu'il s'agit d'un vecteur.
75) Un autre aspect de l'invention concerne un ADN recombinant selon le
paragraphe 73, 74 ou 91 caractérisé en ce qu'il s'agit d'un vecteur
d'expression.
76) Un autre aspect de l'invention concerne une cellule hôte dans laquelle a
été introduit au moins un ADN recombinant selon l'un des paragraphes 73, 74,
75 ou
91.
77) Un autre aspect de l'invention concerne un procédé de production d'un
polypeptide caractérisé en ce que ledit procédé comprend les étapes suivantes:
a) transformer une cellule hôte par au moins un vecteur d'expression selon le
paragraphe 75;
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
18
b) cultiver, dans un milieu de culture approprié, ladite cellule hôte;
c) récupérer le milieu de culture conditionné ou un extrait cellulaire;
d) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait cellulaire obtenu à l'étape c), ledit polypeptide ;
e) le cas échéant, caractériser le polypeptide recombinant produit.
.4
78) Un autre aspect de l'invention concerne un microorganisme 'selon le
paragraphe 51 caractérisé en ce que l'inactivation génique est effectuée par
délétion
en phase du gène ou d'une partie du gène comprenant la séquence correspondant
à
SEQ ID N 13 ou l'une des séquences dérivées de celle-ci en raison de la
dégénérescence du code génétique.
79) Un autre aspect de l'invention concerne un microorganisme selon l'un
des paragraphes 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51 ou 78 caractérisé
en ce en
ce qu'il surexprime en outre :
- un gène susceptible d'être obtenu par amplification en chaîne par polymérase
en
utilisant le couple d'amorces de séquence
suivante : 5'
_
AAGCTTGTGTGCCCGGTGTACCTGGGGAGÉ 3' (SEQ ID N 138) et 5' "'" I
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens,
- ou un gène dérivé de ceux-ci en raison de la dégénérescence du code
génétique.
80) Un autre aspect de l'invention concerne un vecteur d'expression
caractérisé en ce que le polynucléotide de séquence SEQ ID N 47 ou un
polynucléotide dérivé de celui-ci en raison de la dégénérescence du code
génétique
est placé sous le contrôle d'un promoteur permettant l'expression de la
protéine
codée par le dit polynucléotide chez Streptomyces ambofaciens.
81) Un autre aspect de l'invention concerne un vecteur d'expression selon le
paragraphe 80 caractérisé en ce qu'il s'agit du plasmide pSPM524 ou pSPM525.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
19
82) Un autre aspect de l'invention concerne une souche de Streptomyces
ambofaciens transformée par un vecteur selon le paragraphe 80 ou 81.
83) Un autre aspect de l'invention concerne un microorganisme selon l'un des
paragraphes 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 78, 79 ou 92
caractérisé en ce
qu'il syrexprime en outre le gène de séquence codante SEQ ID N 47 ou d'une
séquenee codante dérivée de celle-ci en raison de la dégénérescence du code
génétique.
84) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 83 caractérisé en ce qu'il s'agit de la souche SPM502 pSPM525
déposée
auprès de la Collection Nationale de Cultures de Microorganismes (CNCM)
Institut
Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France, le 26 février
2003
sous le numéro d'enregistrement 1-2977.
=
85) Un autre aspect de l'invention concerne un procédé de production de
spiramycine(s), caractérisé en ce qu'il comprend les étapes suivantes :
,
(a) cultiver, dans un milieu de culture approprié, un microorganisme selon
l'in].
des paragraphes 68, 69, 70, 71, 72, 78, 79, 82, 83, 84, 90 ou 92,
(b) récupérer le milieu de culture conditionné ou un extrait cellulaire,
(c) séparer et purifier à partir dudit milieu de culture ou encore à partir de

l'extrait cellulaire obtenu à l'étape b), les spiramycines.
86) Un autre aspect de l'invention concerne un polypeptide caractérisé en ce
que
sa séquence comprend la séquence SEQ ID N 112 ou la séquence SEQ ID N 142.
87) Un autre aspect de l'invention concerne un polypeptide caractérisé en ce
que sa séquence correspond à la séquence traduite de la séquence codante :
- d'un gène susceptible d'être obtenu par amplification en chaîne par
polymérase (PCR) en utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens,
- ou d'un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique.
5 88) Un autre aspect de l'invention concerne un vecteur d'expression
permettant
l'expression d'un polypeptide selon le paragraphe 86, 87 ou 93 chez
Streptomyces .
ambofaciens.
89) Un autre aspect de l'invention concerne un vecteur d'expression selon le
paragraphe 88 caractérisé en ce qu'il s'agit du plasmide pSPM75.
10 90)
Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 68 caractérisé en ce que le gène susceptible d'être obtenu par
amplification en chaîne par polymérase est le gène de séquence codante SEQ ID
N
141 ou un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique.
91) Un autre aspect de l'invention concerne un ADN recombinant selon
15 paragraphe 73 caractérisé en ce que le polynucléotide susceptible
d'être obtenu paf
amplification en chaîne par polymérase est mi polynucléotide de séquence SEQ
ID
N 141.
92) Un autre aspect de l'invention concerne un microorganisme selon le
paragraphe 79 caractérisé en ce que le gène susceptible d'être obtenu par
20
amplification en chaîne par polymérase est le gène de séquence codante SEQ ID
N
141 ou un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique.
93) Un autre aspect de l'invention concerne un polypeptide caractérisé en ce
que sa séquence est SEQ ID N 142.
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
21
Défmitions générales
Le terme " isolé " au sens de la présente invention désigne un matériel
biologique
(acide nucléique ou protéine) qui a été soustrait à son environnement originel
(l'environnement dans lequel il est localisé naturellement).
Par exemple un polymicléotide présent à l'état naturel dans une plante ou un
animal n'est pas isolé. Le même polynucléotide séparé des acides nucléiques
adjacents
au sein desquels il est naturellement inséré dans le génome de la plante ou
l'animal est
considéré comme " isolé ".
Un tel polynucléotide peut être inclus dans un vecteur et/ou un tel
polynucléotide
peut être inclus dans une composition et demeurer néanmoins à l'état isolé du
fait que le
vecteur ou la composition ne constitue pas son environnement naturel.
Le terme "purifié " ne nécessite pas que le matériel soit présent sous une
forme de
pureté absolue, exclusive de la présence d'autres composés. Il s'agit plutôt
d'une
définition relative.
Un polynucléotide est à l'état " purifié " après purification du matériel de
départ
ou du matériel naturel d'au moins un ordre de grandeur, de préférence 2 ou 3
et
préférentiellement 4 ou 5 ordres de grandeur.
Aux fins de la présente invention le terme ORF ( Open Reading Frame , c'est
à
dire cadre ouvert de lecture) a été employé pour désigner en particulier la
séquence
codante d'un gène.
Aux fins de la présente description, l'expression" séquence nucléotidique
"peut
être employée pour désigner indifféremment un polynucléotide ou un acide
nucléique.
L'expression" séquence nucléotidique " englobe le matériel génétique lui-même
et n'est
donc pas restreinte à l'information concernant sa séquence.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
22
Les termes " acide nucléique ", "polynucléotide ", " oligonucléotide " ou
encore"
séquence nucléotidique " englobent des séquences d'ARN, d'ADN, d'ADNc ou
encore
des séquences hybrides ARN/ADN de plus d'un nucléotide, indifféremment sous la

forme simple chaîne ou sous la forme de duplex.
Le terme " nucléotide " désigne à la fois les nucléotides naturels (A, T, G,
C) ainsi
que des nucléotides modifiés qui comprennent au moins une modification telle
que (1)
un analogue d'une purine, (2) un analogue d'une pyrimidine, ou (3) un sucre
analogue,
des exemples de tels nucléotides modifiés étant décrits par exemple dans la
demande
PCT N'WO 95/04 064.
Aux fins de la présente invention, un premier polynucléotide est considéré
comme
étant " complémentaire " d'un second polynucléotide lorsque chaque base du
premier
polynucléotide est appariée à la base complémentaire du second polynucléotide
dont
l'orientation est inversée. Les bases complémentaires sont A et T (ou A et U),
ou C et G.
Le terme gènes de la voie de biosynthèse des spiramycines comprend
également les gènes régulateurs et les gènes conférant la résistance aux
microorganisines
producteurs.
On entendra par" fragment " d'un acide nucléique de référence selon
l'invention,
une séquence nucléotidique de longueur réduite par rapport à l'acide nucléique
de
référence et comprenant, sur la partie commune, une séquence en nucléotides
identique à
l'acide nucléique de référence.
Un tel " fragment " d'acide nucléique selon l'invention peut être le cas
échéant,
compris dans un polynucléotide plus grand duquel il est constitutif.
De tels fragments comprennent ou alternativement consistent en, des
polynucléotides de longueur allant de 8, 10, 12, 15, 18, 20 à 25, 30, 40, 50,
60, 70, 80,
90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800,
850, 900,
950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550,
1600,

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
23
1650, 1700, 1750, 1800, 1850 ou 1900 nucléotides consécutifs d'un acide
nucléique
selon l'invention.
Par" fragment " d'un polypeptide selon l'invention, on entendra un polypeptide

dont la séquence d'acides aminés est plus courte que celle du polypeptide de
référence et
qui comprend sur toute la partie, commune avec ces polypeptides de référence,
une
séquence en acides aminés identiqu.e.
De tels fragments peuvent, le cas échéant, être compris au sein d'un
polypeptide
plus grand duquel ils font partie.
De tels fragments d'un polypeptide selon l'invention peuvent avoir une
longueur
de 10, 15, 20, 30 à 40, 50, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 220,
240, 260,
280, 300, 320, 340, 360, 380, 400, 420, 440, 460, 480, 500, 520, 540, 560,
580, 600, 620
ou 640 acides aminés.
Par " conditions d'hybridation de forte stringence " au sens de la présente
invention, on entendra des conditions d'hybridation défavorisant l'hybridation
de brins
d'acides nucléiques non homologues. Des conditions d'hybridations de forte
stringence
peuvent être par exemple décrites comme des conditions d'hybridation dans le
tampon
décrit par Church & Gilbert (Church & Gilbert, 1984) à une température
comprise entre
55 C et 65 C, de manière préférée la température d'hyridation est de 55 C, de
manière
encore plus préférée la températue d'hybridation est de 60 C et de manière
tout à fait
préférée la température d'hybridation est de 65 C, suivi d'un ou plusieurs
lavages
effectué en tampon 2X SSC (le tampon 1X SSC correspond à une solution aqueuse
0,15M NaC1, 15 mM de citrate de sodium) à une température comprise entre 55 C
et
65 C, de manière préférée cette température est de 55 C, de manière encore
plus
préférée cette températue est de 60 C et de manière tout à fait préférée cette
température
est de 65 C, suivi d'un ou plusieurs lavages en tampon 0.5X SSC à une
température
comprise entre 55 C et 65 C, de manière préférée cette température est de 55
C, de
manière encore plus préférée cette températue est de 60 C et de manière tout à
fait
préférée cette température est de 65 C.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
24
Il va sans dire que les conditions d'hybridation ci-dessus décrites peuvent
être
adaptées en fonction de la longueur de l'acide nucléique dont l'hybridation
est
recherchée ou du type de marquage choisi, selon des techniques connues de
l'homme du
métier. Les conditions convenables d'hybridation peuvent par exemple être
adaptées
selon l'ouvrage de F. Ausubel et al (2002).
Par " variant " d'un acide nucléique selon l'invention, on entendra un acide
nucléique qui diffère d'une ou plusieurs bases par rapport au polynucléotide
de
référence. Un acide nucléique variant peut être d'origine naturelle, tel qu'un
variant
allélique retrouvé naturellement, ou peut être aussi un variant non naturel
obtenu par
exemple par des techniques de mutagénèse.
En général, les différences entre l'acide nucléique de référence et l'acide
nucléique
variant sont réduites de telle sorte que les séquences nucléotidiques de
l'acide nucléique
de référence et de l'acide nucléique variant sont très proches et, dans de
nombreuses
régions, identiques. Les modifications de nucléotides présentes dans un acide
nucléique
variant peuvent être silencieuses, ce qui signifie qu'elles n'altèrent pas les
séquencs
d'aminoacides codées par ledit acide nucléique variant.
Cependant, les changements de nucléotides dans un acide nucléique variant
peuvent aussi résulter de substitutions, additions, délétions dans le
polypeptide codé par
l'acide nucléique variant par rapport aux peptides codés par l'acide nucléique
de
référence. En outre, des modifications de nucléotides dans les régions
codantes peuvent
produire des substitutions, conservatives ou non conservatives dans la
séquence
d' aminoacides.
De préférence, les acides nucléiques variants selon l'invention codent des
polypeptides qui conservent sensiblement la même fonction ou activité
biologique que le
polypeptide de l'acide nucléique de référence ou encore la capacité à être
reconnus par
des anticorps dirigés contre les polypeptides codés par l'acide nucléique
initial.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Certains acides nucléiques variants coderont ainsi des formes mutées des
polypeptides dont l'étude systématique permettra de déduire des relations
structure
activité des protéines en question.
Par" variant" d'un polypeptide selon l'invention, on entendra principalement
un
5 polypeptide dont la séquence d'acides aminés contient une ou plusieurs
substitutions,
additions ou délétions d'au moins un résidu d'Aide aminé, par rapport à la
séquence
d'acides aminés du polypeptide de référence, étant entendu que les
substitutions
d'aminoacides peuvent être indifféremment conservatives ou non conservatives.
De préférence, les polypeptides variants selon l'invention conservent
sensiblement
10 la même fonction ou activité biologique que le polypeptide de référence
ou encore la
capacité à être reconnus par des anticorps dirigés contre les polypeptides
initiaux.
Par polypeptide ayant" une activité similaire " à un polypeptide de référence
au
sens de l'invention, on entend un polypeptide ayant une activité biologique
proche, mais
pas nécéssairement identique, de celle du polypeptide de référence tel que
mesuré dans
15 un essai biologique convenable à la mesure de l'activité biologique du
polypeptide de
référence.
Par" antibiotique hybride" au sens de l'invention on entend un composé, généré

par la construction d'une voie de biosynthèse artificielle utilisant la
technologie de
l'ADN recombinant.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
26
Description détaillée de l'invention
La présente invention a plus particulièrement pour objet, de nouveaux gènes de
la
voie de biosynthèse des spiramycines et de nouveaux polypeptides impliqués
dans cette
biosynthèse tels que présentés dans la description détaillée ci-dessous.
Les gènes de l'a voie de biosynthèse ont été clonés et la séquence d'ADN de
ces
gènes a été déterminée. Les séquences obtenues ont été analysées grâce au
programme
FramePlot (Ishikawa J & Hotta K. 1999). On a identifié, parmi les phases
ouvertes de
lecture, les phases ouvertes de lecture présentant un usage des codons
typiques de
Streptomyces. Cette analyse a montré que cette région comporte 44 ORFs,
localisées de
part et d'autre de cinq gènes codant l'enzyme polyketide synthase (PKS),
et
présentant un usage des codons typique de Streptomyces. De part et d'autre de
ces cinq
gènes codant la PKS, respectivement 10 et 34 ORFs ont été identifiées en aval
et en
amont (l'aval et l'amont étant définis par l'orientation des 5 gènes de PKS
tous orientés
dans le même sens) (cf figure 3 et 37). Ainsi, les 34 phases ouvertes de
lecture de ce
type, occupant une région d'environ 41,7 kb (cf SEQ ID N 1 présentant une
premièreA
région de 31 kb contenant 25 ORFs et SEQ ID N 140 présentant une région
d'environ =
12,1 kb dont 1,4 kb chevauchent la sequence précédente (SEQ ID N 1) et
environ 10,7
kb correspondent à la suite de la séquence, cette dernière partie d'environ
10,7 kb
contenant 9 ORFs supplémentaires (dont un ORF de séquence partielle), cf.
également
figure 3 et 37 et ci-dessous), ont été identifiées en amont des 5 gènes codant
la PKS et
10 occupant une région d'environ 11,1 kb (SEQ ID N 2 et figure 3), ont été
identifiées
en aval des gènes de la PKS. Les 10 gènes situés en aval des 5 gènes PKS ont
ainsi été
nommés orfl*c, o1j2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9*,
orf10* (SEQ
ID N 3, 5, 7, 9, 11, 13, 15, 17, 19 et 21). Le c ajouté dans le nom du
gène signifiant
pour l'ORF en question que la séquence codante est dans l'orientation inverse
(le brin
codant est donc le brin complémentaire de la séquence donnée en SEQ ID N 2
pour ces
gènes). En utilisant la même nomenclature, les 34 ORFs en amont des gènes de
la PKS
ont été nommés orfl, orf2, orf3, orf4, orf5, orf6, orf7, orf8, orf9c, orf10,
orfllc, orf12,
orfl3c, orf14, orfl5c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c,
orf23c, orf24c,
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
27
orf25c, orf26, orf27, orf28c, orf29, o,j30c, orf31, orf32c, orf33 et orf34c
(SEQ ID N
23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72,
74, 76, 78, 80,
82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et 149) (cf.
figure 3 et 37).
Les séquences protéiques déduites de ces phases ouvertes de lecture ont été
comparées avec celles présentes dans différentes bases de données grâce à
différents
programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997), CD-search,
COGs
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles
notamment
auprès du National Center for Biotechnology Information (NCBI) (Bethesda,
Maryland, ,
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990),
BEAUTY (Worley K. C.. et al., 1995)), (ces deux programmes sont accessibles
notamment auprès du centre de ressources INFOBIOGEN, Evry, France). Ces
comparaisons ont permis de formuler des hypothèses sur la fonction des
produits de ces
gènes et d'identifier ceux susceptibles d'être impliqués dans la biosynthèse
des
spiramycines.
Gènes situés en aval des gènes codant les PKS
Une représentation schématique de l'organisation de la région est présentée en
'
figure 3. Ainsi qu'il sera démontré ci-dessous, sur les 10 gènes identifiés en
aval des
gènes codant les PKS 9 semblent impliqués dans la biosynthèse ou la résistance
aux
spiramycines. Il s'agit des 9 gènes suivants : orfl*c, orf2*c, orf3*c, orf4*c,
orf5*, orf6*,
orf7*c, orf8* et orf9*.
Dans le tableau 1 suivant sont présentées les références à la séquence en ADN
et
en acides aminés des 10 gènes identifiés en aval des 5 gènes PKS.
Tableau 1
Gène Position dans la Séquence ADN Séquences polypeptidiques
séquence SEQ ID N 2
orfl *c 10882 à 10172 SEQ ID N 3 SEQ ID N 4
orf2*c 10052 à8781 SEQ ID N 5 SEQ ID N 6

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
28
orf3*c 8741 à 7476 SEQ ID N 7 SEQ ID N 8
orf4*c 7459 à6100 SEQ ID N 9 SEQ ID N 10
orf5* 5302 à5976 SEQ ID N 11 SEQ ID N 12
orf6* 4061 à 5305 SEQ ID N 13 SEQ ID N 14
orf7*c 3665 à2817 = SEQ ID N 15 SEQ ID N 16
orf8* 1925 à2755 SEQ ID N 17 SEQ ID N 18
orf9* 1007 à 1888 SEQ D N 19 SEQ ID N 20
orf10* 710 à937 SEQ ID N 21 SEQ ID N 22
Le e ajouté dans le nom du gène indique que la séquence codante est dans
l'orientation inverse (le brin codant est donc le brin complémentaire de la
séquence
donnée en SEQ D N 2 pour ces gènes).
Dans le but de déterminer la fonction des polypeptides identifiés, trois
types.:;
d'expériences ont été menés : la comparaison des séquences identifiées avec 4s
séquences de fonctions connues, des expériences d'inactivation de gènes,
conduisant à
construction de souches mutantes et des analyses de la production en
spiramycines et en
intermédiaires de biosynthèse des spiramycines par ces souches mutantes.
Les séquences protéiques déduites de ces phases ouvertes de lecture ont tout
d'abord été comparées avec celles présentes dans différentes bases de données
grâce à
différents programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997),
CD-
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J.
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C.. et al., 1995)).
Ces
comparaisons ont permis de formuler des hypothèses sur la fonction des
produits de ces
gènes et d'identifier ceux susceptibles d'être impliqués dans la biosynthèse
de
spiramycine. Le tableau 2 montre les protéines présentant une forte similitude
avec les
produits 10 gènes situés en aval des 5 gènes PKS.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
29
Tableau 2
Produit Protéine présentant une Numéro d'accès Score Fonction rapportée
de gène similitude significative GenBank BLAST*
orfl *c Ty1MI(orf3*) (S. fradiae) CAA57473 287 N-
méthyltransférase
orf2*c dnrQ gene product AAD15266 153 Inconnue
(Streptomyces peucetius)
orf3*c Ty1MII(orf2*) (S. fradiae) CAA57472 448 Glycosyltransféras
orf4*c Crotonyl-CoA réductase NP 630556 772 Crotonyl-CoA
(S. coelicolor) réductase
orf5* MdmC (S. mycarofaciens) B42719 355 0-
méthyltransférase
orf6* 3-0-acyltransférase (S. Q00718 494 Acyltransférase
mycarofaciens)
orf7*c MdmA (S. A60725 380 Protéine impliquée
mycarofaciens) dans la
résistance,
à la midécamySiiè -
orf8* ABC-transporteur (S. CAC22119 191 ABC-transporteur
griseus)
0r19* ABC-transporteur (S. CAC22118 269 ABC-transporteur
griseus)
orf10* Putative small conserved NP 627432 109 Inconnue
hypothetical protein (S.
coelicolor)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Des expériences d'inactivation de gènes ont été réalisées pour confirmer ces
résultats.
Les méthodes utilisées consistent à effectuer un remplacement de gène. Le gène
cible à
interrompre est remplacé par une copie de ce gène interrompue par une cassette

conférant la résistance à un antibiotique (par exemple l'apramycine, la
généticine ou

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
l'hygromycine). Les cassettes utilisées sont bordées de part et d'autre par
des codons de
terminaison de la traduction dans toutes les phases de lecture et par des
terininateurs de
transcription actifs chez Streptomyces. L'insertion de la cassette dans le
gène cible peut
s'accompagner ou non d'une délétion dans ce gène cible. La taille des régions
flanquant
5 la
cassette peut aller de quelques centaines à plusieurs milliers de paires de
bases. Un
deuxième type de cassettes peut être utilisé polir l'inactivation de gènes :
des cassettes
dites cassettes excisables . Ces cassettes présentent l'avantage de pouvoir
être
excisées chez Streptomyces par un événement de recombinaison de site
spécifique après "
avoir été introduites dans le génome de S. ambofaciens. Le but est d'inactiver
certains
10 gènes
dans des souches de Streptomyces sans laisser dans la souche finale de
marqueurs
de sélection ou de grandes séquences d'ADN n'appartenant pas à la souche.
Après
excision il subsiste uniquement une courte séquence d'une trentaine de paires
de bases
(appelé site cicatriciel ) dans le génome de la souche (cf. figure 10). La
mise en
oeuvre de ce système consiste, dans un premier temps, au remplacement de la
copie
15
sauvage du gène cible (grâce à deux événements de recombinaison homologue, cf.
figure
9) par une construction dans laquelle une cassette excisable a été insérée
dans ce gètie
cible. L'insertion de cette cassette est accompagnée d'une délétion dans le
gène cible (Cf
figure 9). Dans un deuxième temps, l'excision de la cassette excisable du
génome de la
souche est provoquée. La cassette excisable fonctionne grâce à un système de
20
recombinaison site spécifique et a pour avantage de permettre l'obtention de
mutants de
Streptomyces ne portant finalement pas de gène de résistance. On s'affranchit
également
d'éventuels effets polaires sur l'expression des gènes situés en aval du ou
des gènes
inactivés (cf. figure 10). Les souches ainsi construites ont été testées pour
leur
production en spiramycines.
25
L'inactivation des gènes orfl*c, orf2*c, orf3*c et orf4*c n'a pas été
effectuée car
les expériences de comparaison de séquence ont permis de déterminer que ces
gènes
avaient une similitude relativement importante avec des gènes impliqués dans
la
biosynthèse d'un antibiotique relativement proche. Ainsi, le gène orfl*c code
une
protéine présentant une identité de 66% (déterminée grâce au programme BLAST)
avec
30 la
protéine codée par gène ty1M1 qui code une N-méthyltransférase impliquée dans
la

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
31
biosynthèse de tylosine et catalysant la 3 N-méthylation durant la production
du
mycaminose chez Streptomyces fradiae (Gandecha,A.R. et al., 1997; Numéro
d'accès
GenBank : CAA57473 ; Score BLAST: 287). Cette similitude avec une protéine
impliquée dans la voie de biosynthèse d'un autre antibiotique relativement
proche et
plus particulièrement dans la biosynthèse du mycaminose suggère que le gène
orfl*c
code une N-methyltransférase responsable d'une N-méthylation lors de la
biosynthèse de
la forosamine ou du mycaminose (cf. figure 5 et 6). Cette hypothèse est étayée
par le fait
que la protéine codée par le gène orfl*c présente une forte similitude avec
d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 3).
Tableau 3
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
méthyltransferase (S. antibioticus) CAA05643 277 méthyltransférase
N,N-diméthyltransferase (S. venezuelae) AAC68678 268 N,N- =
,=== fr 1, ,
diméthyltransférase.
probable N-méthylase snogX (S. T46679 243 N-
méthyltransférase
nogalater)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf2*c code une protéine présentant une relative forte similitude (35%

d'identité) avec une protéine codée par le gène tylMIII codant une NDP hexose
3,4
isomérase impliquée dans la biosynthèse de la tylosine chez Streptomyces
fradiae
(Gandecha,A.R., et al., 1997 ; Numéro d'accès GenBank : CAA57471 ; Score BMAST
:
130). Cette similitude avec une protéine impliquée dans la voie de biosynthèse
d'un
autre antibiotique proche et plus particulièrement dans la biosynthèse du
mycaminose
suggère fortement que le gène ore2c code une NDP hexose 3,4 isomérase
responsable

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
32
d'isomérisation lors de la biosynthèse d'un des sucres de la spiramycine,
éventuellement
le mycaminose (cf. figure 5 et 6).
Le gène orf3*c code une protéine présentant une relative forte similitude (59%

d'identité) avec une protéine codée par le gène tylMll codant une
glycosyltransférase
impliquée dans la biosynthèse de la tylosine chez Streptomyes fradiae
(Gandecha,A.R.
et al., 1997; Numéro d"accès GenBank : CAA57472 ; Sçore BLAST: 448). Cette
similitude avec une protéine impliquée dans la voie de biosynthèse d'un autre
antibiotique proche suggère fortement que le gène ore3c code une
glycosyltransférase.
Cette hypothèse est étayée par le fait que la protéine codée par le gène
orf3*c présente .
une forte similitude avec d'autres protéines de fonction similaire chez
d'autres
organismes (cf. tableau 4).
Tableau 4
Protéine présentant une similitude Numéro Score Fonction
rapportéé
significative d'accès BLAST*
GrenBanic
Glycosyl transférase (S. venezuelae) AAC68677 426
Glycosyltransférase
Glycosyltransférase (S. antibioticus) CAA05642 425
Glycosyltransférase
Glycosyltransférase CAA74710 395
Glycosyltransférase
(Saccharopolyspora elythraea)
Glycosyltransférase (S. antibioticus) CAA05641 394
Glycosyltransférase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf4*c code une protéine présentant une relative forte similitude avec
plusieurs crotonyl-CoA réductases. Notamment, la protéine codée par orf4*c
possède
une similitude importante avec une crotonyl CoA réductase de chez Streptomyces

coelicolor (Redenbach,M et al., 1996; Numéro d'accès GenBank : NP_630556 ;
Score

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
33
BLAST: 772). Cette similitude avec une protéine impliquée dans la voie de
biosynthèse
d'un autre antibiotique proche suggère fortement que le gène orf4*e code
également une
crotonyl-CoA réductase. Cette hypothèse est étayée par le fait que la protéine
codée par
le gène orf4*e présente une forte similitude avec d'autres protéines de
fonction similaire
chez d'autres organismes (cf. tableau 5).
Tableau 5
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
trans-2-énoyl-CoA réductase S72400 764 trans-2-énoyl-CoA
(EC1.3.1.38) (S. collinus) réductase
Crotonyl CoA réductase (S..fradiae) CAA57474 757 Crotonyl CoA réductase
Crotonyl-CoA réductase S. AAD53915 747 Crotonyl-CoA réductase
cinnamonensis)
* une plus grande similitude de séquence est associée à un score BLAST plus "
élevé (Altschul et al., 1990).
Le gène orf6* présente une certaine similitude avec le gène mdmB présent chez
Streptomyces mycarofaciens (Hara et Hutchisnson, 1992; numéro d'accès GenBank
:
A42719; Score BLAST : 489) producteur d'antibiotique macrolide. Chez ce
producteur,
le gène est impliqué dans l'acylation du cycle lactone. Le gène orf6* coderait
donc une
acyltransférase. Cette hypothèse est étayée par le fait que la protéine codée
par le gène
orf6* présente une forte similitude avec d'autres protéines de fonction
similaire chez
d'autres organismes (cf. tableau 6).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
34
Tableau 6
Protéine présentant une Numéro Score Fonction rapportée
similitude significative d'accès BLAST*
GenBank
AcyA (Streptomyces J4001 450 macrolide 3-0-
acyltransférase
thermotolerans)
Midécamycine 4"-0- BAA09815 234 Midécamycine 4"-O-
propionyl
propionyl transférase (S. transférase
mycarofaciens)
Mycarose 0-acyltransférase AAG13909 189 Mycarose 0-
acyltransférase
(Micromonospora
=
megalomicea subsp. Nigra)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
L'inactivation du gène orf6* a ete realisee par une délétion/insertion en
phase et il
a été montré que la souche résultante ne produit plus de spiramycine II et III
mais
uniquement de la spiramycine I (cf figure 1). Ceci confirme que le gène orf6*
est bien
impliqué dans la synthèse de spiramycine II et III. L'enzyme codée par ce gène
est
responsable de la formation de spiramycine II et III par fixation d'un
groupement acétyl
ou butyryl sur le carbone 3. Les souches n'exprimant plus la protéine codée
par le gène
orf6* sont particulièrement intéressantes puisqu'elles ne produisent plus de
spiramycine
II et III mais seulement de la spiramycine I. Comme il a été précisé ci-
dessus, l'activité
antibiotique de la spiramycine I est nettement supérieure à celle des
spiramycines II et III
(Liu et aL, 1999).
Le gène orf5* code une protéine présentant une relative forte similitude avec
plusieurs 0-méthyltransférase. Notamment, la protéine codée par orf5* possède
une
similitude importante avec une 0-méthyltransférase (EC 2.1.1.-) MdmC de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Streptomyces mycarofaciens (Hara & Hutchinson, 1992; Numéro d'accès
GenBank :B42719; Score BLAST: 355). Cette similitude avec une protéine
impliquée
dans la voie de biosynthèse d'un autre antibiotique suggère fortement que le
gène orf5*
code également une 0-méthyltransférase. Le gène orf5* serait impliqué dans la
5 formation de précurseurs incorporés dans le cycle lactone. En effet,
d'après les
compi:araisons de séquences, le produit du gène orf5* est également
relativement proche
de FkbG qui est responsable de la méthylation de l'hydroxymalonyl-ACP d'après
(Wu et
al., 2000 ; Hoffineister et al., 2000; Numéro d'accès GenBank: AAF86386 ;
Score
W;
BLAST: 247) (cf. figure 8). Cette hypothèse est étayée par le fait que la
protéine codéé
10 par le gène orf5* présente une forte similitude avec d'autres protéines
de fonction
similaire chez d'autres organismes (cf. tableau 7).
Tableau 7
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST* g
GenBank
õ
Probable 0-méthyltransferase (EC T18553 223 0-
méthy1traniféràe
2.1.1.-) sait (Myxococcus xanthus)
4-0-méthyltransferase (EC 2.1.1.-) ¨ JC4004 222 0-
méthyltransférase
(Streptomyces sp.)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
15
Grâce à l'effet polaire de l'insertion d'une cassette non excisée dans le gène
orf 6*,
il a pu être déterminé que le gène orf 5* est essentiel à la voie de
biosynthèse des
spiramycines. En effet, l'insertion de la cassette excisable dans la partie
codante du gène
orf 6* entraîne un arrêt total de la production en spiramycines. Cependant,
une fois que
la cassette insérée a été excisée (et donc lorsque seul le gène orf6* est
inactivé, cf
20 exemples 14 et 15), on retrouve une production en spiramycine I. Ceci
montre que le

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
36
gène orf 5* est essentiel à la voie de biosynthèse des spiramycines puisque
son
inactivation entraîne un arrêt total de la production en spiramycines.
Le gène orf5* code une protéine présentant une relative forte similitude avec
plusieurs 0-méthyltransférase. Le gène orf5* serait une 0-méthyl transférase
impliquée
soit directement dans la synthèse du platénolide, soit dans la synthèse d'un
précurseuÉ.
méthylé (méthoxymalonyl, voir figure 8) incorporé dans le platénolide par la
PKS. Pour
vérifier cette hypothèse, des expériences d'analyse CL/SM et de RMN ont été
conduites
sur une souche de S. ambofaciens de génotype : orf6*:.yittlQhyg+. Dans cette
souche le'
gène orf5* n'est pas exprimé à cause de l'effet polaire de l'insertion, dans
le gène orf6*,
de la cassette qui contient des terminateurs de transcription (cf. exemple
27). Il a été
montré que cette souche produit une molécule dont le spectre UV a une allure
similaire
à celui de la spiramycine I mais le spectre de masse montre un ion moléculaire
à 829. La
différence de masse de 14 par rapport à la masse de la spiramycine peut
s'expliquer part.
l'absence de méthyl sur l'oxygène portée par le carbone n 4 du cycle lactone
(là
:
. 15 strucutre de ce composé est présenté en figure 39). Les résultats obtenus
par RMN soiiï
Y,.=!fNfi
compatibles avec cette hypothèse. La présence d'un composé à 829 permet de
valider,f
l'hypothèse du rôle de orf5* dans la biosynthèse des spiramycines. En outre,
le produit
correspondant à la spiramycine sans le groupement méthyle présente une très
faible
activité microbologique (plus faible d'un facteur 10) par rapport à la
spiramycine non
modifiée, lorsque testée sur le microorganisme Micrococcus luteus.
Le gène orf7*c code une protéine présentant une relative forte similitude avec
une
protéine codée par le gène mdmA de Streptomyces mycarofaciens, ce dernier
codant une
protéine impliquée dans la résistance à la midécamycine chez cet organisme
producteur
(Hara et al., 1990; Numéro d'accès GenBank : A60725; Score BLAST : 380). Cette
similitude avec une protéine impliquée dans la voie de biosynthèse d'un autre
antibiotique suggère fortement que le gène o1j7*c code également une protéine
impliquée dans la résistance à la spiramycine. Plus particulièrement, l'enzyme
codée par
le gène orf7*c possède une activité méthyltransférase et est impliquée dans la
résistance
à la spiramycine chez Streptomyces ambofaciens. Il a été démontré que ce gène
confère

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
37
une resistance de type MLS I, résistance dont on sait qu'elle est dûe à la
mono-
méthylation en position A2058 de l'ARN ribosomal 23S (Pernodet et al., 1996).
Cette
hypothèse est étayée par le fait que la protéine codée par le gène orf7*c
présente une
forte similitude avec d'autres protéines de fonction similaire chez d'autres
organismes
(cf. tableau 8).
Tableau 8
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
macrolide-lincosamide-streptogramin B JC5319 238 23S
rRNA
resistance determinant (S. fradiae) méthyltransférase
23S ribosomal RNA methyltransferase AAL68827 119 23S
rRNA
ErmML (Micrococcus luteus) méthyltransférase
=e.*.
!e.?
* une plus grande similitude de séquence est associe'e à un score BLAST plus,
élevé (Altschul et d., 1990).
Le gène orf8* code une protéine présentant une relative forte similitude avec
une
protéine de type transporteur ABC chez Streptomyces griseus (Campelo, 2002,
Numéro
d'accés GenBank : CAC22119 ; Score BLAST: 191). Cette similitude avec une
protéine
de type transporteur ABC suggère fortement que le gène ore* code également
une
protéine de type transporteur ABC pouvant être impliquée dans la résistance à
la
spiramycine. Cette hypothèse est étayée par le fait que la protéine codée par
le gène
orf8* présente une forte similitude avec d'autres protéines de fonction
similaire chez
d'autres organismes (cf. tableau 9).
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
38
Tableau 9
Protéine présentant une similitude Numéro d'accès Score Fonction
significative GenBank BLAST* rapportée
AcrW (Streptomyces galilaeus) BAB72060 94
Transporteur
ABC
= Daunorubicin
resistance transmembrane P32011 89 Résistance à la
protéine (Streptomyces peucetius)
daunorubicine
Probable ABC-transporter, NP 626506 89
Transporteur
transmembrane component. ABC
(Streptomyces coelicolor)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé
1.?".
(Altschul et al., 1990).
, Le gène orf9* code une protéine présentant une relative forte
similitude avec une
= 71;i .
protéine de type transporteur ABC chez Streptomyces griseus (CamPelo, 2002,
Nuriéi,..e;
d'accés GenBank : CAC22118 ; Score BLAST : 269). Cette similitude avec une
protéine
de type transporteur ABC suggère fortement que le gène orf9* code également
une
protéine de type transporteur ABC pouvant être impliquée dans la résistance à
la
spiramycine. Cette hypothèse est étayée par le fait que la protéine codée par
le gène
olf8* présente une forte similitude avec d'autres protéines de fonction
similaire chez
d'autres organismes (cf. tableau 10).
Tableau 10
Protéine présentant une similitude significative Numéro Score Fonction
d'accès BLAST* rapportée
GenBank
Probable ABC-type transport protein, ATP- NP 626505 231
Transporteur
binding component (S. coelicolor) ABC

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
39
Putative ABC transporter ATP-binding NP 627624 228
Transporteur
component (Streptomyces Coelicolor) ABC
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé
(Altschul et al., 1990).
Le gène orf10* code une brotéine présentant une relative forte similitude avec
une
protéine de fonction inconnue. Cependant des gènes similaires à orf10* sont
retrouvés
au milieu de plusieurs groupes de gènes impliqués dans la biosynthèse
d'antibiotiques.
Ainsi un gène proche de 0110* est retrouvé chez S. coelicolor (Redenbach et
al., 1996,
numéro d'accès GenBank : NP 627432, score BLAST: 109). Un gène proche (CouY)
est également retrouvé chez S. rishiriensis (Wang et al., 2000, numéro d'accès

GenBank : AAG29779, score BLAST 97).
=i
= =
Gènes situés en amont des gènes codant les PKS
=
,
Dans la séquence d'ADN située en amont des gènes codant les PKS (l'aval et
l'amont étant défini par l'orientation des 5 gènes de PKS tous orientés dans
le même
sens) (cf. figure 3), 34 ORFs ont été identifiées (cf. ci-dessus). Ainsi, les
34 phases
ouvertes de lecture de ce type, occupant une région d'environ 41,7 kb (cf. SEQ
ID N 1
présentant une première région de 31 kb contenant 25 ORFs et SEQ ID N 140
présentant une région d'environ 12,1 kb dont 1,4 kb chevauchent la sequence
précédente
(SEQ ID N 1) et environ 10,7 kb correspondent à la suite de la séquence),
cette dernière
partie d'environ 10,7 kb contenant 9 ORFs supplémentaires (dont un ORF de
séquence
partielle), cf. également figure 3 et 37 et ci-dessous). Une représentation
schématique de
l'organisation de la région est présentée en figure 3 et 37. Les 34 gènes
identifiés ont été
nommés : orfl, orfl, orf3, orf4, orf5, orf6, oi17, orf8, orf9c, orf10, orfllc,
orf12, orfl3c,
orf14, orfl5c, orf16, orf17, orf18, orf19, orf20, orf21c, orf22c, ol:123c,
orf24c, orf25c,
oî126, orf27, orf28c, orf29, orf30c, orf31, orf32c, orf33 et orf34c.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Dans le tableau 11 suivant sont présentées les références à la séquence en ADN
et
en acides aminés des 34 gènes identifiés en amont des 5 gènes PKS.
Tableau 11
Gène Position dans la Séquence ADN Séquence(s) polypeptidique(s)2
séquence SEQ ID N 1
orfl 658à 1869 SEQ ID N 23 SEQIDN 24
orf2 1866 à 2405 SEQ ID N 25 SEQ ID N 26 et 27
orf3 2402 à3568 SEQ ID N 28 SEQ ID N 29
orf4 3565 à4473 SEQ ID N 30 SEQIDN 31,32 et 33
orf5 4457 à 5494 SEQ LD N 34 SEQ ID N 35
orf6 5491 à 6294 SEQ ID N 36 SEQ ID N 37,38 et 39
orf7 6296 à 7705
SEQ ID N 40 SEQ ID N 41 et 42
:
orf8 8011 à9258 SEQ ID N 43 SEQ ID N 44
ori9c 10081 à 9362 SEQ ID N 45 SEQ ID N 46
orf10 10656 à 12623 SEQ ID N 47 SEQ ID N 48
orfllc 14482 à 12734 SEQ ID N 49 SEQ ID N 50,51 et 52
orf12 14601 à 16031 SEQ ID N 53 SEQ ID N 54, 55, 56, 57, 58
et
orfl3c 17489 à 16092 SEQ ID N 60 SEQ ID N 61
orf14 17809 à 18852 SEQ ID N 62 SEQ ID N 63
orfl5c 20001 à 18961 SEQ ID N 64 SEQ ID N 65
orf16 20314 à 21552 SEQ ID N 66 SEQ ID N 67
orf17 21609 à22879 SEQ ID N 68 SEQ ID N 69
orf18 22997 à24175 SEQ ID N 70 SEQ ID N 71

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
41
orf19 24177 à25169 SEQ ID N 72 SEQ ID N 73
orf20 25166 à26173 SEQ ID N 74 SEQ ID N 75
orf21c 27448 à26216 SEQ ID N 76 SEQ ID N 77
orf22c 28560 à27445 SEQ ID N 78 SEQ ID N 79
orf23c 29770 à 28649 SEQ ID N 80 SEQ ID N 81
orf24c 30074 à 29763 SEQ D N 82 SEQ ID N 83
orf25c 30937 à 30071 SEQ ID N 84 SEQ ID N 85
Gène' Position dans la Séquence ADN Séquence(s)
polypeptidique(s)2
séquence SEQ ID NO:
140
orf26 1647 à 2864 SEQ ID N 107 SEQ ID N 108
orf27 2914 à 3534 SEQ ID N 109 SEQ ID N 110
=
orf28c 4967 à 3804 SEQ ID N 141 SEQ ID N 142
=
orf29 5656 à 6663 SEQ ID N 113 SEQ ID N 114
.
orf30c 7723 à6686 SEQ ID N 115 SEQ ID N 116 et 117
7534 à 6686 SEQ ID N 143 SEQ D N 144
orf31 7754 à 8728 SEQ ID N 118 SEQ ID N 119
orf32c 10488 à8977 SEQ ID N 145 SEQ ID N 146
orf33 10562 à 10837 SEQ ID N 147 SEQ ID N 148
orf34c 12134à 10899 SEQ ID N 149 SEQ ID N 150
Le e ajouté dans le nom du gène indique que la séquence codante est dans
l'orientation inverse (le brin codant est donc le brin complémentaire de la
séquence
donnée en SEQ ID N 1 ou SEQ ID N 140 pour ces gènes).
2 Lorsque plusieurs séquences protéiques sont indiquées pour une seule orf,
les
protéines correspondantes sont issues de plusieurs sites possibles de
démarrage de la
traduction.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
42
Dans le but de déterminer la fonction des polypeptides identifiés dans le
tableau 11
ci-dessus, trois types d'expériences ont été menées : la comparaison de
l'identité des
séquences identifiées avec des séquences de fonctions connues, des expériences

d'inactivation de gènes et des analyses de la production en spiramycines de
ces souches
mutantes.
Les séquénces protéiques déduites de ces phases ouvertes de lecture ont tout
d'abord été comparées avec celles présentes dans différentes bases de données
grâce à
différents programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997),
CD-
search, COGs (Cluster of Orthologous Groups), FASTA ((Pearson W. R & D. J.
Lipman, 1988) et (Pearson W. R., 1990), BEAUTY (Worley K. C.. et al., 1995)),
(cf. ci-
dessus). Ces comparaisons ont permis de formuler des hypothèses sur la
fonction des
produits de ces gènes et d'identifier ceux susceptibles d'être impliqués dans
la
biosynthèse de spirarnycine. Le tableau 12 montre les protéines présentant une
forte
similitude avec les 34 gènes situés en amont des 5 gènes PKS.
= 15 Tableau 12
;=Mè.5
=
Gène Protéine présentant une similitude Numéro Score Fonction
='''
significative d'accès BLAST* rapportée
GenBank
69f1 Cytochrome P450 tylI (Streptomyces S49051 530
Cytochrome P45
fradiae)
orf2 ORF15x4 (Listonella anguillarum) AAB81630 113 Inconnue
orf3 aminotransferase-like protein AAF59939 431 Amino-
(Streptomyces antibioticus)
transférase
orf4 alpha-D-glucose-l-phosphate AAC68682 404 alpha-D-glucose.
thymidylyltransferase (Streptomyces 1-
phosphate
venezuelae)
thymidylyltranst
rase
otf.5 AprE (Streptomyces tenebrarius) AAG18457 476 dTDP-
glucose
4,6-déshydratase

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
43
orf6 'Thioesterase (Streptomyces avermitilis) BAB69315 234
Thioestérase
orf7 TylCVI (Streptomyces fradiae) AAF29379 461 dNTP hexose
2,3-déshydratas(
orf8 probable aminotransferase AAG23279 465
Aminotransféras
(Saccharopolyspora spinosa)
orf9c SrmX (Streptomyces ambofaciens) S25204 ' 445
Méthyltransfém
orf10 SrmR (Streptomyces ambofaciens) S25203 1074 Protéine de
régulation
orfl lc SrmB (Streptomyces ambofaciens) S25202 955 Résistance à
la
spiramycine
orf12 UrdQ (Streptomyces fradiae) AAF72550 634 NDP-hexose
3,4
déshydratase
orfl3c SC4H2.17 (Streptomyces coelicolor) T35116 619 Inconnue
orf14 putative reductase (Streptomyces CAB90862 147 Réductase
coelicolor)
= :1 . .
, =Iµitt
orfl5c Probable 3-ketoreductase (Streptomyces T51102 285 3-
cétorédudaie:
antibioticu,$)
,
orf16 Hypothetical NDP hexose 3,4 CAA57471 209 NDP hexose
3,4
isomerase (Streptomyces fradiae) isomérase
orfl 7 Glycosyl transférase (Streptomyces AAC68677 400 Glycosyl
venezuelae)
transférase
orf18 Glycosyl transférase (Streptomyces AAG29785 185 Glycosyl
rishiriensis)
transférase
orf19 NDP-hexose 4-cétoreductase TylCIV AAD41822 266 NDP-hexose 4-

(Streptomyces fi-adiae)
cétoréductase
orf20 EryBII (Saccharopolyspora erythraea) AAB84068 491 aldocéto
réductase
orfilc TylCIII (Streptomyces fradiae) AAD41823 669 NDP-hexose 3-
C
méthyltransféras(

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
44
orf22c FkbH (Streptomyces hygroscopicus) AAF86387 463 Impliqué
dans la
biosynthèse du
méthoxymalony]
orf23c FkbI (Streptomyces hygroscopicus) AAF86388 387 Acyl CoA
déshydrogénase
orf24c FkbJ (Streptomyces. hygroscopicus) AAF86389 87 Impliqué
dans la
biosynthèse du
méthoxymalonyl
orf25c FkbK (Streptomyces hygroscopicus) AAF86390 268 Acyl CoA
déshydrogénase
orf26 TylCV (Streptomyces fradiae) AAD41824 471 Mycarosyl
transferase
orf27 TylCVII (Streptomyces fradiae) AAD41825 243 NDP-hexose
3,5.
(ou 5-) épimeras
orf28c AcyB2 (Streptomyces thermotolerans) JC2032 451 protéine
régulatrice
tr= =
=
orf29 Béta-manannase (Sorangium. AAK19890 139 Glycosyl
celtulosum) hydrolase
=
orf30c Epimérase de sucre-nucléoside- NP 600590 89 Epimérase
de
diphosphate (Colynebacterium sucre-
nucléoside-
glutamicum)
diphosphate
orf31 Oxidoréductase (Streptomyces NP 631148 261
Oxidoréductase
coelicolor)
orf32c Protéine régulatrice de la famille GntR NP_824604 282 Protéine
(Streptomyces avermitilis)
régulatrice
orf33 Protéine hypothetique (Xanthomonas NP_635564 54 Inconnue
campestris)
o7:134c Arabinofuranosidase (Streptomyces NP 630049 654
Arabinofuranosid
coelicolor) ase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Des expériences d'inactivation de gènes ont été réalisées pour confirmer ces
résultats. Les méthodes utilisées consistent à effectuer un remplacement de
gène. Le
gène cible à interrompre est remplacé par une copie de ce gène interrompue par
une
cassette conférant la résistance à un antibiotique (par exemple l'apramycine
ou
5 l'hygromycine). Les cassettes utilisées sont bordées de part et d'autre
par des codons de
terminaison de la traduction dans toutes les phases de lecture et par 4es
terminateurs de
transcription actifs chez Streptomyces. L'insertion de la cassette dans le
gène cible peut
s'accompagner ou non d'une délétion dans ce gène cible. La taille des régions
flanquant
la cassette peut aller de quelques centaines à plusieurs milliers de paires de
bases. Lin
10 deuxième type de cassettes peut être utilisé pour l'inactivation de
gènes : des cassettes
dites cassettes excisables (cf. ci dessus). Les souches ainsi construites
ont été testées
pour leur production en spiramycines.
Le gène orfl code une protéine présentant une relative forte similitude avec
plusieurs cytochrome P450. Notamment, la protéine codée par orfl possède une'
15 similitude importante avec la protéine codée par le gène tylI impliquée
dans la
;;=:;; biosynthèse de tylosine chez Streptomyces fraelia Merson-Davies,LA.
et al., 1994,
-"
Numéro d'accès GenBank : S49051 ; Score BLAS't : 530). Cette similitude avec
une
protéine impliquée dans la voie de biosynthèse d'un autre antibiotique proche
suggère
fortement que le gène orfl code également une cytochrome P450. Cette hypothèse
est
20 étayée par le fait que la protéine codée par le gène orfl présente une
forte similitude
- avec d'autres protéines de fonction similaire chez d'autres organismes
(cf. tableau 13).
Tableau 13
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenB ank
Putative cytochrome P450 YJIB 034374 248 Cytochrome
P450
(Bacillus subtilis)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
46
Cytochrome P450 113A1 P48635 237 Cytochrome P450
(Saccharopolyspora erythraea)
Cytochrome P-450 hydroxylase AAC46023 208 Cytochrome P-
450
homolog (Streptomyces caelestis) hydroxylase
Cytochrome P450 monooxygénase AAC64105 206 Cytochrome P450
(Streptomyces venezuelae) monooxygénase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orfl code une protéine présentant une relative forte similitude avec
une
dTDP-6-deoxy-3,4-keto-hexulose isomerase de Aneurinibacillus thermoaerophilus
(Pfoestl,A. et al., 2003, Numéro d'accès GenBank : AA.006351 ; Score BLAST :
118).
Cette similitude suggère fortement que le gène orfl code une isomérase
responsable de
la réaction d'isomérisation nécessaire à la biosynthèse d'un des sucres
présents dans la
= ?*,
molécule de spiramycine, ce sucre pouvant être le mycarose (cf. figure 5).
L'inactivation
du gène orf2 a été réalisée. Il a pu être montré que la souche résultante ne
produit plus de
spiramycines. Ceci confirme que le gène orfl est bien impliqué dans la
biosynthèse des
spiramycines.
Le gène orf3 code une protéine présentant une relative forte similitude avec
plusieurs aminotransférases. Notamment, la protéine codée par orf3 possède une
similitude importante avec une aminotransférase de Streptomyces antibioticus
impliquée
dans la biosynthèse de l'oléandomycine (Draeger,G., et a/.,1999 ; Numéro
d'accès
GenBank : AAF59939 ; Score BLAST : 431). Cette similitude avec une protéine
impliquée dans la voie de biosynthèse d'un autre antibiotique proche suggère
fortement
que le gène orf3 code une 3 amino-transférase responsable de la réaction de
transamination nécessaire à la biosynthèse d'un des sucres aminés des
spiramycines (cf.
figure 5). Cette hypothèse est étayée par le fait que la protéine codée par le
gène orf3

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
47
présente une forte similitude avec d'autres protéines de fonction similaire
chez d'autres
organismes (cf. tableau 15).
Tableau 15
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
Aminotransférase (Streptomyces T51111 429
Aminotransférase
antibioticus)
Transaminase (Streptomyces AAC68680 419 Transaminase
venezuelae)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
L'inactivation du gène orf3 a été réalisée. Il a ainsi pu être montré que la
souche.:.;,
,
résultante ne produit plus de 'spiraniycines. Ceci confirme que le gène orf3
est bien
impliqué dans la biosynthèse des spiramycines. L'enzyme codée par ce gène est
donc
bien responsable d'une étape de bioconversion essentielle à la biosynthèse des
spiramycines. La production de spiramycines peut être complémentée par
l'expression
de la protéine TylB de S. fradiae (cf exemple 23). Ceci démontre que le gène
orf3 code
une 3 amino-transférase responsable de la réaction de transamination
nécessaire à la
biosynthèse du mycaminose (cf. figure 5). Comme le mycaminose est le premier
sucre à
être fixé sur le platénolide, il est attendu que la souche interrompue dans
orf3 (0S49.67)
accumule du platénolide.
Les intennédaires de biosynthèse de la souche interrompue dans le gène orf3
ont
été étudiés (cf. exemple 20). Ces expériences ont permis de démontrer que
cette souche
produit deux formes de platénolide: le platénolide A et le platénolide B, la
structure
déduite de ces deux molécules est présentée en figure 36. Cette souche produit
également du platénolide A + mycarose et du platénolide B + mycarose (cf.
exemple 20

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
48
et figure 40). Ces composés comportent un sucre mais ne comportent pas de
mycaminose. De plus si on les compare à de la spiramycine (cf. figure 1), ces
composés
comportent du mycarose à la place du mycaminose. Ces résultats sont en accord
avec
l'implication du produit du gène orf3 dans la biosynthsèe du mycaminose et son
rôle en
tant que 3 amino-transférase responsable de la réaction de transamination
nécessaire à la
biosynthèse du mycaminose (cf. figure 5). On peut remarquer que la spécificité
de
glycosylation ne semble pas absolue puisque l'on trouve des molécules avec le
mycarose
fixé à la position noramalement occupée par le mycaminose (cf. figure 40).
Le gène orf4 code une protéine présentant une relative forte similitude avec
plusieurs NDP-glucose synthétases. Notamment, la protéine codée par orf4
possède une
similitude importante avec une alpha-D-glucose-1 -phosphate
thymidylyltransférase de
Streptomyces venezuelae (Xue Y et cd.,1998 ; Numéro d'accès GenBank : AAC68682
;
Score BLAST 404). Cette similitude avec une protéine impliquée dans la voie de
,
biosynthèse d'un autre antibiotique proche suggère fortement que le gène orf4
code une
NDP-glucose syntéthase responsable de la synthèse du NDP-glucose nécessaire à
la
biosynthèse des trois sucres atypiques incorporés dans la molécule de
spiramycine (d.
figure 4, 5 et 6). Cette hypothèse est étayée par le fait que la protéine
codée par le gène
orf4 présente une forte similitude avec d'autres protéines de fonction
similaire chez
d'autres organismes (cf. tableau 16).
Tableau 16
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
Glucose-1-phosphate BAA84594 402 Glucose-1 -
phosphate
thymidyltransférase (Streptomyces
thymidyltransférase
avermitilis)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
49
AclY (Streptomyces galilaeus) BAB72036 400 dTDP-1-
glucose
synthétase
Putative glucose-1-phosphate AAK83289 399 glucose-l-
phosphate
thymidyltransférase
thymidyltransférase
(Saccharopolyspora spinosa)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf5 code une protéine présentant une relative forte similitude avec
plusieurs glucose déshydratases. Notamment, la protéine codée par orf5 possède
une
similitude importante avec une dTDP -glucose 4,6-déshydratase de Streptomyces
tenebrarius (Li,T.B. et cd.,2001 ; Numéro d'accès GenBank : AAG18457, Score
BLAST : 476). Cette similitude avec une protéine impliquée dans la voie de
biosynthèse
d'un autre antibiotique proche suggère fortement que le gène orf5 code une NDP
,
glucose déshydratase nécessaire à la biosynthèse des trois sucres atypiques
incorporég.:,
'
'5`' = 10 dans la molécule de spiramycine (cf. figure 4, 5 et 6). Cette
hypothèse est étayée par lé
fait que la protéine codée par le gène orf5 présente une forte similitude avec
d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 17).
Tableau 17
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
DTDP-glucose 4,6-déshydratase AAK83290 464 DTDP-glucose
4,6-
(Saccharopolyspora spinosa) déshydratase
thymidine diphosphoglucose 4,6- AAA68211 445 thymidine
déshydratase (Saccharopo/yspora
diphosphoglucose
etythraea) 4,6-
déshydratase

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
dTDPglucose 4,6-déshydratase (EC S49054 443 dTDPglucose
4,6-
4.2.1.46) ¨ (Streptomyces fradiae) déshydratase
TDP-glucose-4,6-déshydratase AAC68681 421 TDP-glucose-
4,6-
(Streptomyces venezuelae) déshydratase
SgcA (Streptomyces globisporus) AAF13998 418 dNDP-glucose-
4,6-
déshydratase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf6 code une protéine présentant une relative forte similitude avec
plusieurs thioestérases. Notamment, la protéine codée par orf6 possède une
similitude
5 importante avec une thioestérase de Streptomyces avermitilis
(Omura,S. et al., 2001;
Numéro d'accès GenBank : BAB69315 ; Score BLAST : 234). Cette similitude avec
une
7
, protéine impliquée dans la voie de biosynthèse d'un autre,
antibiotique proche suggère
õ.
,
, fortement que le gène orf6 code également 1.#w thioestérase Cette
hypothèse est etayée
par le fait que la protéine codée par le gène orf6 présente une forte
similitude avec
10 d'autres protéines de fonction similaire chez d'autres organismes
(cf. tableau 18).
Tableau 18
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
RifR (Amycolatopsis mediterranei) AAG52991 216 Thioestérase
Thioestérase ¨ (Streptomyces fradiae) S49055 215 Thioestérase
Thioestérase (Streptomyces BAB69188 213 Thioestérase
avermitilis)

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
51
Thioestérase II (EC 3.1.2.-) ¨ T17413 203
Thioestérase
(Streptomyces venezuelae)
PimI protein (Streptomyces natalensis) CAC20922 201
Thioestérase
Thioestérase (Streptomyces griseus) CAC22116 200
Thioestérase
= * une plus grande similitude de séquence est associée à un score BLAST
plus
élevé (Altschul et al., 1990).
Le gène orf7 code une protéine présentant une relative forte similitude avec
plusieurs hexose déshydratases. Notamment, la protéine codée par orf7 possède
une
similitude importante avec une dNTP hexose 2,3-déshydratase (codée par lé gène
TylCVI) de Streptomyces fradiae impliquée dans la biosynthèse de la tylosine
(Merson-
Davies,L.A. et al., 1994 ; Numéro d'accès GenBank : AAF29379 ; Score BLAST :
461).
Cette similitude avec une protéine impliquée dans la voie de biosynthèse d'un
autre
antibiotique proche suggère fortement que le gène orf7 code également une
hexose 2-3
' 10 déshydratase nécessaire à la biosynthèse de deux sucres atypiques
incorporés dans' la
molécule de spiramycine (cf. figure 4 et 6). Cette hypothèse est étayée par le
fait que la
protéine codée par le gène orf7 présente une forte similitude avec d'autres
protéines de
fonction similaire chez d'autres organismes (cf. tableau 19).
Tableau 19
Protéine présentant une similitude Numéro Score
Fonction rapportée
significative d'accès BLAST*
GenBank
Rifl 8 (Amycolatopsis inediterranei) AAG52988 459 Hexose déshydratase
SimB3 (Streptomyces antibioticus) AAK06810 444 dNDP-4-keto-6-déoxy-
glucose-2,3-déshydratase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
52
Le gène orf8 code une protéine présentant une relative forte similitude avec
plusieurs aminotransférases. Notamment, la protéine codée par orf8 possède une

similitude importante avec une aminotransférase probablement impliquée dans la

biosynthèse de la forosamine chez Saccharopolyspora spinosa (Waldron,C. et
al., 2001 ;
Numéro d'accès GenBank : AAG23279 ; score BLAST : 465). Cette similitude avec
une
protéine impliquée dans la voie de biosynthèse d'un autre antibiotique proché.
suggère
fortement que le gène orf8 code une 4 amino-transférase responsable de la
réaction de
transamination nécessaire à la biosynthèse de la forosamine (cf. figure 6).
Cette
hypothèse est étayée par le fait que la protéine codée par le gène orf8
présente une forte
similitude avec d'autres protéines de fonction similaire chez d'autres
organismes (cf.
tableau 20).
Tableau 20
Protéine présentant une similitude Numéro Score Fonction rapportée =
significative d'accès BLAST*
GenBank
Putative amino-sugar biosynthesis CAA07666 213 Proteine impliquée dans
'la.
protein (Bordetella bronchiseptica) biosynthèse d' amino-
sucre
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
L'inactivation du gène orf8 a été réalisée. Il a pu ainsi être montré que la
souche
résultante ne produit plus de spiramycines. Ceci confirme que le gène orf8 est
bien
impliqué dans la biosynthèse des spiramycines. L'enzyme codée par ce gène est
donc
bien responsable d'une étape de bioconversion essentielle à la biosynthèse des

spiramycines. La validation de l'hypothèse du rôle joué par le produit du gène
orf8 dans
la biosynthèse de la forosamine est apportée par le fait qu'un mutant incativé
pour le
gène orf8 produit de la forocidine, ce mutant est donc bloqué au stade de la
forocidine et
ne produit pas de néo-spiramycine (cf. figure 7 et exemple 25). Ces résultats
sont en

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
53
accord avec une implication du produit du gène orf8 dans la biosynthèse de
forosamine
(cf. figure 6).
Le gène orf9c a déjà été identifié chez Streptomyces ambofaciens et a été
désigné
srrnX par Geistlich et al. (Geistlich,M., et al., 1992). La similitude de la
protéine codée
par ce gène avec plusieurs méthyltransférases impliquées dans la voie de
biosynthèse
d'autres aritibiotiques proches suggère fortement que le gène or9c code une
méthyl-
transférase responsable de la réaction de méthylation nécessaire à la
biosynthèse du
mycaminose ou de la forosamine (cf. figure 5 et 6). Cette hypothèse est étayée
par le fait
que la protéine codée par le gène orf9c présente une forte similitude avec
d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 21).
Tableau 21
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
; N,N-diméthyltransférase AAC68678 240 N,N-
(Streptomyces venezuelae)
diméthyltransférasè
Méthyltransférase (Streptomyces CAA05643 232
Méthyltransférase
antibloticus)
Putative amino methylase AAF01819 219 Aminométhylase
(Streptomyces nogalater)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf10 a déjà été identifié chez Streptomyces ambofaciens et a été
désigné
srmR par Geistlich et al. (Geistlich,M., et al., 1992). La protéine codée par
ce gène est
impliquée dans la régulation de la voie de biosynthèse des spiramycines chez
Streptomyces ambofaciens. L'inactivation du gène orf10 a été réalisée. Il a pu
ainsi être
montré que la souche résultante ne produit plus de spiramycines. Ceci confirme
que le
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
54
gène orf10 est bien impliqué dans la biosynthèse des spiramycines. La protéine
codée
par ce gène est donc bien essentielle à la biosynthèse des spiramycines.
D'autre part ; le point de démarrage de la traduction de orf 10 a été
déterminé et il
a pu être montré que la surexpression de ce gène entraine une amélioration de
la
production en spiramycines. Le site de démarrage de la traduction correspond à
un ATG
situé en amont de l'ATG proposé par Geistlich et al. (Geistlich,M., et al.,
1992). Il a en
outre été démontré que cette extrémité 5' est esentielle à la fonction de
Orf10 puisqu'un
messager tronqué en 5' est inactif (cf. exemple 17). Pour obtenir l'effet
recherché sur la
,
production en spiramycines, il est donc essentiel que la surexpression de
orf10 soit
réalisée en prenant garde de ne pas exprimer un messager tronqué en 5' de
orf10.
Le gène orfl le a déjà été identifié chez Streptomyces ambofaciens et a été
désigné
srmB par Geistlich et al. (Geistlich,M. et al., 1992) et Schoner et al.
(Schoner B et al., .
1992). La protéine codée par ce gène est impliquée dans la résistance à la
spiramycin,e
chez Streptomyces ambofaciens et est un transporteur de type ABC.
'ft;
Le gène off12 code une protéine présentant une relative forte similitude
Miêêl:%1
plusieurs hexose déshydratases. Notamment, la protéine codée par orf12 possède
une
similitude importante avec une NDP-hexose 3,4-déshydratase codée par le gène
UrdQ
de Streptomyces fradiae et impliquée dans la biosynthèse de l'urdamycine
(Hoffmeister,D. et al., 2000 ; Numéro d'accès GenBank : AAF72550 ; Score BLAST
:
634). Cette similitude avec une protéine impliquée dans la voie de biosynthèse
d'un
autre antibiotique proche suggère fortement que le gène orf12 code une 3,4
déshydratase
responsable de la réaction de déshydratation nécessaire à la biosynthèse de la
forosamine
(cf. figure 6). Cette hypothèse est étayée par le fait que la protéine codée
par le gène
orf12 présente une forte similitude avec d'autres protéines de fonction
similaire chez
d'autres organismes (cf. tableau 22).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Tableau 22
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
AknP (Streptomyces galilaeus) AAF73452 625 3 -
déshydratase
NDP-hexose 3,4-dehydratase homolog D13547 624 NDP-hexose
3,4-
(Streptomyces cyanogenus) déshydratase
RdmI (Streptomyces purpurascens) AAL24451 608 hexose-C-
3-
déshydratase
Probable CDP-4-keto-6-deoxyglucose- T46528 602 CDP-4-céto-6-
3-dehydratase (El) (Streptomyces déoxyglucose-3-
violaceoruber) déshydratase
Probable NDP-hexose-3,4-dehydratase AAG23278 582 NDP-hexose-3,4-
. = . (Saecharopolyspora spinoSa) déshydratase
;
dNTP-hexose déshydratase AAC01730 576 dNTP-
hexose
(Amycolatopsis mediterranei) déshydratase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
L'inactivation du gène orf12 a été réalisée. Il a pu être montré que la souche
5 résultante ne produit plus de spiramycines. Ceci confirme que le gène
orf12 est bien
impliqué dans la biosynthèse de la spiramycine. L'enzyme codée par ce gène est
donc
bien responsable d'une étape de bioconversion essentielle à la biosynthèse de
la
spiramycine. La validation de l'hypothèse du rôle joué par Orf12 dans la
biosynthèse de
la forosamine est apportée par le fait qu'un mutant incativé pour le gène
orf12 ne produit
10 plus de forosamine. Il produit cependant une faible quantité de
forocidine. Ce mutant est
donc bloqué au stade de la forocidine et ne produit pas de néo-spiramycine
(cf. figure 7

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
56
et exemple 26). Ce mutant produit en outre un composé de structure présentée
en figure
38. Ce dernier composé comporte deux sucres, le mycaminose et le mycarose mais
ne
comporte pas de forosamine. De plus si on le compare à la structure de la
spiramycine
(cf. figure 1), ce composé comporte le sucre mycarose à la place attendue de
la
forosamine. Ces résultats sont en accord avec l'implication du produit du gène
orf12
' dans la biosynthsèe de la forosamine (cf. figure 6). On peut remarquer
que la spécificité
de glycosylation n'est pas absolue puisque l'on observe des molécules dans
lesquelles le
mycarose est fixé à la position normalement occupée par la forosamine (voir
figure 38).
Le gène orfl3c code une protéine présentant une relative forte similitude avec
une
protéine de fonction inconnue chez Streptomyces coelicolor. Cette protéine a
été
nommée SC4H2.17 (numéro d'accès GeneBank : T35116 ; Score BLAST: 619). La
protéine codée par le gène orfl3c présente également une forte similitude avec
d'autres
=
=
protéines d'autres organismes (cf. tableau 23).
Tableau 23
=
= ;' Protéine présentant Une
similitude' Ninnérô Score Fonction rapPiiFteë,: ,Ym
' significative d'accès BLAST*
.
GenBank
hflX protein (Mycobacterium leprae) S72938 473 Inconnue
Possible ATP/GTP-binding protein NP_301739 470 Protéine
fixant
(Mycobacterium leprae) l'ATP/GTP
GTP-binding protein (Mycobacterium AAK47114 468 Protéine
fixant le
tuberculosis CDC1551) GTP
ATP/GTP-binding protein T44592 388 Protéine
fixant
(Streptomyces fradiae) l'ATP/GTP
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
57
Aucune fonction précise n'a été assignée aux protéines proches de celle codée
par orfl3c. L'inactivation du gène orfl3c a été réalisée dans le but d'étudier
la fonction
de ce gène dans la voie de biosynthèse des spiramycines chez Streptomyces
ambofaciens. Il a pu être montré que la souche résultante produit des
spiramycines. Ceci
indique que le gène orfl3c n'est pas essentiel à la biosynthèse des
spiramycines et qu'il
n'est pas essentiel à la survie de la bIctérie. L'enzyme codée par ce gène
n'est donc pas
responsable d'une étape de bioconversion essentielle à la biosynthèse des
spiramycines.
Le gène orf14 code une protéine présentant une relative forte similitude avec
une '= z;
réductase putative (Redenbach,M., et a/.,1996 ; Bentley et al., 2002; numéro
d'accès
GenBank : CAB90862 ; Score BLAST : 147).
L'inactivation du gène orf14 a été réalisée. Il a pu ainsi être montré que la
souche
résultante ne produit plus de spiramycines. Ceci confirme que le gène orf14
est bien
impliqué dans la biosynthèse des spiramycines. L'enzyme codée par ce gène est
donc
bien responsable d'une étape de bioconversion essentielle à la biosynthèse
dei:
= 15 spiramycines. Les interinédaires de biosynthèse de la souche
interrompue dans le enlé:Ii
=
' orf14 ont été étudiés (cf. exéniPle 20). Ces expériences ont permis de
démontrer que
cette souche produit du platénolide A mais ne produit pas de platénolide B
(cf. figure
36).
Le gène orfl5c code une protéine présentant une relative forte similitude avec
plusieurs cétoréductases. Notamment, la protéine codée par orfl 5c possède une
similitude importante avec une 3-cétoréductase chez Streptomyces antibioticus
(Numéro
d'accès GenBak : T51102, Score BLAST : 285). Cette similitude suggère
fortement que
le gène orfl5c code une 3 céto-réductase responsable de la réaction de
réduction
nécessaire à la biosynthèse de la forosamine (cf. figure 6). Cette hypothèse
est étayée par
le fait que la protéine codée par le gène orfl5e présente une forte similitude
avec
d'autres protéines de fonction similaire chez d'autres organismes (cf. tableau
24).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
58
Tableau 24
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
oxidoreductase homolog (Streptomyces AAD13550 272 Oxidoréductase
cyanogeims)
D-oliose 4-cétoreductase CAB96550 265 D-oliose 4-

(Streptomyces argillaceus) cétoréductase
AlmQ (Streptomyces galilaeus) AAF73453 263 putative 3-

cétoréductase
Probable NDP-hexose-3-ketoreductase AAG23275 253 NDP-hexose-3-
(Saccharopolyspora spinosa) cétoréductase
* une plus grande similitude de séquence est associée à un score BLAST plus ;
élevé (Altschul et. al., 1990). ,
Le gène orf76 code une protéine présentant une relative forte similitude avec
plusieurs isomérases. Notamment, la protéine codée par orf16 possède une
similitude
importante avec une NDP hexose 3,4 isomérase chez Streptomyces fradiae
(Gandecha et
al., 1997 ; Numéro d'accès GenBak : CAA57471, Score BLAST : 209). Cette
similitude
suggère fortement que le gène orf16 code une protéine impliquée dans la
biosynthèse
d'un des sucres de la spiramycine (cf. figure 5 et 6). Cette hypothèse est
étayée par le fait
que la protéine codée par le gène orf16 présente une forte similitude avec
d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 25).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
59
Tableau 25
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
Putative tautomerase (Streptomyces AAC68676 145 Tautomérase
venezuelae)
TDP-4-céto-6-déoxyhexose 3,4- AAG13907 112 TDP-4-céto-6-
isomérase (Micromonospora déoxyhexose
3,4-
megalomicea subsp. nigra) isomérase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf17 code une protéine présentant une relative forte similitude avec
plusieurs glycosyl transférases. Notamment, la protéine codée par orfl 7
possède ug&'=
=
similitude importante avec une glycosyl trensférase de Streptomyces venezuelae
(Xue,r.. ,
el , = = =
; = , et cd.,1998 Numéro d'accès .0enBaniu AAC68677 ; score BLAST : 400)La
=
similitude de la protéine codée par le gène orf17 avec plusieurs glycosyl
transférases
impliquées dans la voie de biosynthèse d'autres antibiotiques proches suggère
fortement
que ce gène code également une glycosyl transférase. Cette hypothèse est
étayée par le
fait que la protéine codée par le gène orfl 7 présente une forte similitude
avec d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 26).
Tableau 26
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
Glycosyltransférase (Streptomyces CAA57472 399
Glycosyltransférase
fradiae)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
=
Glycosyltransférase (Streptomyces CAA05642 378
Glycosyltransférase
antibioticus)
Glycosyltransférase (Streptomyces CAA05641 360
Glycosyltransférase
antibloticus)
Glycosyltransférase = CAA74710 344
Glycosyltransférase
(Saccharopolyspora eiythraea)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf18 code une protéine présentant une relative forte similitude avec
plusieurs glycosyl transférases. Notamment, la protéine codée par otf18
possède une
5 similitude importante avec une glycosyl transférase de Streptomyces
rishiriensis (Wang
et cd.,2000 ; Numéro d'accès GenBank : AAG29785 ; score BLAST: 185). La
similitude de la protéine codée par le gène orf18 avec plusieurs glycosyl
transférases
,
= ' . =
,impliquées dans la voie dé biosynthèse d'autres antibiotiques proches suggère
fortement
que ce gène code également une glycosyl transférase. Cette hypothèse est
étayée par le
10 fait que la protéine codée par le gène orf18 présente une forte
similitude avec d'autres
protéines de fonction similaire chez d'autres organismes (cf. tableau 27).
Tableau 27
Protéine présentant une similitude Numéro Score
Fonction rapportée
significative d'accès BLAST*
GenB ank
NovM (Streptomyces spheroides) AAF67506 184
Glycosyltransférase
probable glycosyl transferase T46519 169
Glycosyltransférase
(Streptomyces violaceoruber)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
61
Glycosyl transferase homolog AAD13553 167
Glycosyltransférase
(Streptomyces cyanogenus)
Glycosyl transferase homolog AAD13555 163
Glycosyltransférase
(Streptomyces cyanogenus)
dNTP-hexose glycosyl transférase AAC01731 160
Glycosyltransférase
(Amycolatopsis mediterranei)
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène oif19 code une protéine présentant une relative forte similitude avec
,
plusieurs cétoréductases. Notamment, la protéine codée par orf19 possède une
similitude
importante avec une NDP-hexose 4-cétoréductase (TylCIV) de Streptomyces
(Bate et aL,2000 ; Numéro d'accès GenBank AAD41822 ; score BLAST: 266).
similitude de la protéine codée Par le 'gène grip avec cette cétoréductase
impliquée dsnsie
la voie de biosynthèse d'Un antibiotique pro.Che suggère forteniént que ce
gène' C4de
également une 4-cétoréductase responsable de la réaction de réduction
nécessaire à la
biosynthèse du mycarose (cf. figure 4). Cette hypothèse est étayée par le fait
que la
protéine codée par le gène orf19 présente une forte similitude avec d'autres
protéines de
fonction similaire chez d'autres organismes (cf. tableau 28).
Tableau 28
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
NDP-4-céto-6-déoxyhexose 4- AAL14256 251 NDP-4-céto-
6-
cétoreductase (Streptomyces venezuelae) déoxyhexose 4-
cétoréductase

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
62
EryBIV (Saccharopolyspora erythraea) AAB84071 249 oxidoréductase
TDP-4-céto-6-déoxyhexose 4- AAG13916 218 TDP-4-
céto-6-
cétoreductase (Micromonospora déoxyhexose
4-
megalomicea subsp. Nigra) cétoréductase
dTDP-4-céto-6-déoxy-L-hexose 4- BAA84595 212 dTDP-
4-céto-6-
réductase (Streptomyces avermitilis) déoxy-L-hexose
4-
réductase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf20 code une protéine présentant une relative forte similitude avec
plusieurs hexose réductases. Notamment, la protéine codée par od20 possède une
similitude importante avec le gène EryBIT de Saccharopolyspora elythraea qui
code une :-
dTDP-4-céto-L-6-déoxy-hexose 2,3-réductase (Surnmers,R.G., et cd.,1997),
Numéro
=
d'accès GenBank : A.AB84068 ; Score BLAST : 491). La similitude de la protéine
code
. = ed" ;
par le gène orj20 avec plusieurs hexose réductases impliquées dans la voie de
biosynthèse d'autres antibiotiques proches suggère fortement que ce gène code
une 2-3
réductase responsable de la réaction de réduction nécessaire à la biosynthèse
du
mycarose (cf. figure 4). Cette hypothèse est étayée par le fait que la
protéine codée par le
gène orf20 présente une forte similitude avec d'autres protéines de fonction
similaire
chez d'autres organismes (cf. tableau 29).
Tableau 29
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
TylCII (Streptomyces fradiae) AAD41821 464 NDP-
hexose 2,3-
énoyl réductase
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
63
TDP-4-céto-6-deoxyhexose 2,3- AAG13914 446 TDP-4-céto-6-
réductase (Micromonospora déoxyhexose
2,3-
megalomicea subsp. Nigra) réductase
dTDP-4-céto-6-déoxy-L-hexose 2,3- BAA84599 377 dTDP-4-céto-6-
réductase (Streptomyces avermitilis) déoxy-L-hexose
2,3-réductase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf21c code une protéine présentant une relative forte similitude avec

plusieurs hexose méthyltransférases. Notamment, la protéine codée par orfilc
possède
une similitude importante avec le gène TylCIII de Streptomyces fradiae qui
code une
NDP-hexose 3-C-méthyltransférase (Bate,N et al., 2000; Numéro d'accès GenBank
:
, = AAI/41823 ; Score BLAST: 669). La similitude de la protéine codée par
le gène orf21c ?.
=
avec plusieurs hexose méthyltransféra.ses impliquées dans la voie de
biosynthèse'
' . . = , =
d'autres antibiotiques proches suggère fortement que ce gène code une hexose
=0;,
méthyltransférase responsable de la réaction de méthylation nécessaire à la
biosynthèse
du mycarose (cf. figure 4). Cette hypothèse est étayée par le fait que la
protéine codée
par le gène orf21c présente une forte similitude avec d'autres protéines de
fonction
similaire chez d'autres organismes (cf. tableau 30).
Tableau 30
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
EryH (Saccharopolyspora erythraea) 228448 592 Gène
de
biosynthèse
de
érythromycine
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
64
S-adenosyl-dependent methyl AAK71270 358 Méthyltransferase
transferase (Coxiella burnetii)
NovU (Streptomyces spheroides) AAF67514 184 C-
méthyltransférase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990). =
Le gène orf22c code une protéine présentant une relative forte similitude avec
la .
protéine codée par le gène fkbH de Streptomyces hygroscopicus var.
ascomyceticus qui
code une enzyme impliquée dans la biosynthèse du méthoxymalonyl (Wu,K. et
aL,2000 ; Numéro d'accès GenBank : AAF86387 ; Score BLAST: 463). La similitude

de la protéine codée par le gène orf22c avec cette protéine impliquée dans la
voie de
biosynthèse d'un autre macrolide proche suggère fortement que ce gène code
également
une enzyme impliquée dans la biosynthèse du méthoxymalonyl chez Streptomyces:
ambofaciens (cf. figure 8).
Le gène orf23c gode une protéine:préSentant,une,relative forte similitude
ave9,4eit:
protéine codée par le gène fie de StreptomyCes..hygrèsëopicus var.
ascomyceticus ui
code une acyl CoA déshydrogénase impliquée dans la biosynthèse du
méthoxymalonyl
(Wu,K. et al., 2000; Numéro d'accès GenBank : AAF86388 ; Score BLAST 387). La
similitude de la protéine codée par le gène orf23c avec plusieurs acyl CoA
déshydrogénases impliquées dans la voie de biosynthèse d'autres antibiotiques
proches
suggère fortement que ce gène code une acyl CoA déshydrogénase impliquée dans
la
biosynthèse du méthoxymalonyl (cf. figure 8). Cette hypothèse est étayée par
le fait que
la protéine codée par le gène orf23c présente une forte similitude avec
d'autres protéines
de fonction similaire chez d'autres organismes (cf. tableau 31).
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
Tableau 31
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
Acyl-CoA déshydrogénase AAK19892 171 Acyl-CoA
(Polyangium cellulosum) déshydrogénase
Probable acyl-CoA dehydrogenase ¨ T36802 160 acyl-CoA
(Streptomyces coelicolor) déshydrogénase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf24c code une protéine présentant une relative forte similitude avec
la
5 protéine codée par le gène fiebJ de Streptomyces hygroscopicus var
ascomyceticus qui
coderait la protéine de liaison du groupement acyl (Acyl Carrier Protein
(ACP))
impliquée dans la biosynthèse du méthoxymalonyl (Wu,K., et al., 2000; Numérc?
. d'accès genBai* :AAP8630. ;,Score BLAST 87). La similitude de la protéine
'0004t
par le gène olf24c avec cette protéine impliquées dans la voie de biosynthèse
d'un autre
10 macrolide proche suggère fortement que ce gène code une protéine
impliquée dans la
biosynthèse du méthoxymalonyl chez Streptomyces ambofaciens (cf. figure 8).
Le gène orf25c code une protéine présentant une relative forte similitude avec
la
protéine codée par le gène fkbK de Streptomyces hygroscopicus var.
ascomyceticus qui
code une acyl CoA déshydrogénase impliquée dans la biosynthèse du
méthoxymalonyl
15 (Wu,K., et al., 2000 ; Numéro d'accès GenBank : AAF86390 ; score BLAST:
268). La
similitude de la protéine codée par le gène orf25c avec plusieurs acyl CoA
déshydrogénases impliquées dans la voie de biosynthèse d'autres antibiotiques
proches
suggère fortement que ce gène code une acyl CoA déshydrogénase impliquée dans
la
biosynthèse du méthoxymalonyl (cf. figure 8). Cette hypothèse est étayée par
le fait que
20 la protéine codée par le gène orf25c présente une forte similitude avec
d'autres protéines
de fonction similaire chez d'autres organismes (cf. tableau 32).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
66
Tableau 32
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
Probable 3-Hydroxybutyryl-CoA P45856 177 3 -Hydroxybutyryl-
Dehydrogenase (Bacillus subtilis) CoA déshydrogénase
3-hydroxybutyryl-CoA dehydrogenase AAL32270 174 3 -hydroxybutyryl-
protein (Bacillus thuringiensis serovar CoA déshydrogénasé
kurstaki)
3-hydroxybutyryl-CoA dehydrogenase NP_294792 167 3-hydroxybutyryl-
(Deinococcus radiodurans) CoA déshydrogénase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
,
Le gène orf26 code une protéine pres.é.41P:hi :Prie identité de 65%
(déterrninée gràcê
au programme BLAST) avec la protéine codée par le gène lylCV qui code une
mycarésyf
transferase impliquée dans la biosynthèse de tylosine chez Streptomyces
fradiae (Bate,N.
et al., 2000; Numéro d'accès GenBank : AAD41824, Score BLAST: 471). Plus
particulièrement, TylCV est une glycosyl-transférase liant la molécule de
mycarose lors
de la synthèse de la tylosine. Cette similitude avec une protéine impliquée
dans la voie
de biosynthèse d'un autre antibiotique relativement proche et plus
particulièrement dans
le transfert du mycarose, suggère que le gène 01126 code une glycosyl
transferase. Cette
hypothèse est étayée par le fait que la protéine codée par le gène orf26
présente une forte
similitude avec d'autres protéines de fonction similaire chez d'autres
organismes (cf.
tableau 33).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
67
Tableau 33
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
Glycosyl transferase (Streptomyces BAA84592 218 Glycosyl
transferase
avermitilis)
=
Ca1G4 (Micromonospora echinospora).AAM70365 217 Glycosyl
transferase
Ca1G2 (Micromonospora echinospora) AAM70348 197 Glycosyl
transferase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
Le gène orf27 code une protéine présentant une identité de 70% (déterminée
grâce
au programme BLAST) avec la protéine codée par le gène tylC VII qui code une
NDP-
hexose 3,5- (ou 5-) épimerase impliquée dans la biosynthèse de tylosine chez
=- e
Streptomyces fradiae (Bate,N.= 'et ai.; 2000, Numéro d'accès Gen13ank :
AAD41825,1
Score BLAST: 243). Plus 'pàrtiCulièrenient, tYléVil est une hexose 3,5- (ou 54
t:!:
épimerase impliquée dans la biosynthèse du mycarose. Cette similitude avec une
protéine impliquée dans la voie de biosynthèse d'un autre antibiotique
relativement
proche et plus particulièrement dans la biosynthèse du mycarose, suggère que
le gène
orf27 code une épimérase. Cette hypothèse est étayée par le fait que la
protéine codée
par le gène orf27 présente une forte similitude avec d'autres protéines de
fonction
similaire chez d'autres organismes (cf. tableau 34). Une analyse des séquences
proches
obtenues grâce au programme BLAST suggère fortement que le gène orf27 code une
5
épimérase responsable de la réaction d'épimérisation nécessaire à la
biosynthèse du
mycarose (cf. figure 4).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
68
Tableau 34
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
LanZ1 (Streptomyces cyanogenus) AAD13558 172 NDP-hexose
3,5-
epimerase ,
Epi (Saccharopolyspora spinosa) AAK83288 169 TDP-4-keto-6-.
deoxyglucose 3,5
epimerase
dNTP-hexose 3,5 epimerase AAC01732 166 dNTP-hexose
3,5
(Amycolatopsis mediterranei) epimerase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé (Altschul et al., 1990).
.
.
La séquence d'od28c a dans un premier temps été déterminée de manière
partielle,.u,
:
= ==
-= 5 puisque la séquence d'une région d'environ 450 paires de bases n'a été
déterminée.''',',
qu'après reséquençage (cette région est symbolisée par des N dans la
séquence
incomplète SEQ ID N 106). La séquence partielle de cette ORF (SEQ ID N 111)
a
néanmoins été utilisée pour l'analyse avec les différents programmes
informatiques
comme expliqué ci-dessus. Il a ainsi pû être déterminé que le gène orf28c code
une
protéine présentant une identité de 64% sur la séquence déterminée (SEQ ID N
112, qui
est la séquence partielle de la protéine Orf28c) (déterminée grâce au
programme
BLAST) avec la protéine codée par le gène acyB2 qui code une protéine
régulatrice
impliquée dans la biosynthèse de carbomycine chez Streptomyces thermotolerans
(Arisawa,A., et al., 1993; Numéro d'accès GenBank : JC2032, Score BLAST: 329).
Cette similitude avec une protéine impliquée dans la voie de biosynthèse d'un
antibiotique relativement proche suggère que le gène orf28c code une protéine
régulatrice impliquée dans la biosynthèse des spiramycines. Cette hypothèse
est étayée
par le fait que la protéine codée par le gène orf28c présente également une
forte

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
69
similitude avec la protéine Ty1R qui est une protéine régulatrice impliquée
dans la
biosynthèse de tylosine chez Streptomyces fradiae (Bate,N. et al., 1999;
Numéro d'accès
GenBank : AAF29380, Score BLAST : 167).
Le gène orf28c a pu être amplifié grace à des oligonucléotides situés de part
et
d'autre de la séquence non déterminée et sous cloné dans un vecteur
d'expression. Il a
pu ainsi être démontré que la surexpression du gène orf28c augmente
significativement
la production en spiramycines de la souche OSC2 (cf. exemple 24). Ceci
démontre que
la surexpression de orf28c conduit à une augmentation de la production en
spiramycinest.'
=
et confirme son rôle en tant que régulateur de la voie de biosynthèse des
spiramycines. e
La séquence partielle d' orf28c a été complétée par la suite et la région
manquante
d'environ 450 paires de bases a été déterminée (cf. SEQ ID N 140 et SEQ ID N
141).
La séquence complète de cette ORF (SEQ ID N 141) a été utilisée pour
l'analyse avec
-
les différents programmes informatiques comme expliqué ci-dessus. Il a ainsi
pû être
déterminé que le gène orf28c code une protéine présentant une identité de 69%
sur
, 15 séquence déterminée (SEQ ID N 142, qui est la séquence complète de la
protéM014
0rf28c) (déterminée grâce au programme BLAST) avec la protéine codée par le
gèhéle
acyB2 qui code une protéine régulatrice impliquée dans la biosynthèse de
carbomycine
chez Streptomyces thermotolerans (Arisawa,A., et al., 1993; Numéro d'accès
GenBank : JC2032, Score BLAST : 451). Cette similitude avec une protéine
impliquée
dans la régulation de la biosynthèse d'un antibiotique relativement proche
suggère que le
gène orf28c code une protéine régulatrice impliquée dans la biosynthèse des
spiramycines. Cette hypothèse est étayée par le fait que la protéine codée par
le gène
orf28c présente également une forte similitude avec la protéine Ty1R qui est
une protéine
régulatrice impliquée dans la régulation de la biosynthèse de tylosine chez
Streptomyces
fradiae (Bate,N. et al., 1999; Numéro d'accès GenBank : AAF29380, Score BLAST
:
224). Les résultats de la surexpression de ce gène (cf exemple 24) confirment
son rôle
en tant que régulateur de la voie de biosynthèse des spiramycines.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
L'inactivation du gène orf28e a été réalisée. Il a pu ainsi être montré que la
souche
résultante ne produit plus de spiramycines. Ceci confirme que le gène orf28c
est bien
impliqué dans la biosynthèse des spiramycines et est essentiel à la
biosynthèse des
spiramycines. Ces résultats associés aux résultats de la surexpression de ce
gène (cf.
5 exemple 24) sont en accord avec un rôle d'activateur essentiel à la
biosynthèse des
spiramycines d' 01128 c.
Le gène orf29 code une protéine présentant une identité de 31% (déterminée
grâce
au programme BLAST) avec une probable glycosyl hydrolase localisée dans le
groupe ,
de gènes impliqué dans la biosynthèse de soraphen A (un antifongique de la
classe dès
10 polyketides) chez Sorangium cellulosum (Ligon,J., et al., 2002 ;
Numéro d'accès
GenBank : AAK19890, Score BLAST: 139). Cette similitude avec une protéine
impliquée dans la voie de biosynthèse d'une molécule relativement proche
suggère que
le gène orf29 code une protéine ayant une activité glycosyl hydrolase. Cette
hypothèse
est étayée par le fait que la protéine codée par le gène orf29 présente une
forte similitude
15 avec d'autres protéines de fonction similaire chez d'autres organismes
(cf. tableau 35). .;
Ygn.
Une analyse de la séquence de la protéine codée par orf29 grâce au Programme
CD,4A,1
. , search (cf. ci-dessus) suggère également que le gène orf29 code une
glycosyl hydrolase
Tableau 35
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
ManA (Caldicellulosiruptor AAC44232 136 beta-1,4-
mannanase
saccharolyticus)
ManA (Dictyoglomus thermophilum) AAB82454 129 beta-mannanase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé
20 (Altschul et al., 1990).
L'analyse de la séquence protéique déduite de Porf29 par le programme SignalP
(http://www.cbs.dtu.dk/services/SignalP/) (Nielsen,H., et al., 1997) montre
que cette

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
71
protéine possède une séquence signal C-terminale avec un site de coupure
prédit entre
les positions 30 et 31 (QSA/QA). On peut prédire que cette protéine est extra-
cellulaire.
Elle pourrait, en temps que glycosyl-hydrolase, avoir un rôle dans la
réactivation de la
spiramycine inactivé par glycosylation par les glycosyl-transferases GimA
et/ou GimB
(Gourmelen et al, 1998).
Le gène co:f30c code une protéine présentant une identité de 31% (déterminée
grâce au programme BLAST) avec une épimérase de sucre-nucléoside-diphosphate
de
Cotynebacterium glutamicum (Numéro d'accès GenBank : NP_600590, Score BLAST
89). Cette similitude suggère que le gène orf30c code une épimérase. Cette
hypothèse est
étayée par le fait qu'une analyse de la séquences grâce au programme CD-search
(cf. ci-
dessus) suggère également que le gène orf30c code une épimérase.
L'orf30c présente deux codons d'initiations possibles (cf. SEQ ID N 115) qui
donnent deux protéines possibles de 345 et 282 acides aminés respectivement
(SEQ
N 116 et 117). Toutefois, l'usage des codons est typique de Streptomyces
seulement à
; 15 partir du deuxième ATG de plus, la séquence protéique déduite de la
séquence entre le
. õ õ
' premier ATG et le deuxième ne s'aligne pitâ avec les séquences
proches identifiées,,.
=
alors que la séquence protéique la plus courte (à partir du 2ème ATG: SEQ ID N
144)
s'aligne bien avec le début de ces protéines. On peut donc en déduire que le
deuxième
ATG est le bon codon d'initiation et que la séquence de cet off est donc celui
présenté
en SEQ ID N 143 qui une fois traduit corespond à la protéine de séquence SEQ
ID N
144.
Le gène orf31 code une protéine présentant une identité de 52% (déterminée
grâce
au programme BLAST) avec une oxidoreductase chez Streptomyces coelicolor
(Numéro
d'accès GenBank : NP 631148, Score BLAST: 261). Cette similitude suggère que
le
gène orf31 code une réductase. Cette hypothèse est étayée par le fait qu'une
analyse de
la séquences grâce au programme CD-search (cf. ci-dessus) suggère également
que le
gène orf31 code une réductase. Cette hypothèse est également étayée par le
fait que la
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
72
protéine codée par le gène orf31 présente une forte similitude avec d'autres
protéines de
fonction similaire chez d'autres organismes (cf. tableau 36).
Tableau 36
Protéine présentant une similitude Numéro Score Fonction
rapportée
significative d'accès BLAST*
GenBank
Putative oxidoreductase (Streptomyces BAB79295 173 Oxidoreductase
griseus)
=
MocA (Xanthomonas axonopodis) NP 640644 171 Oxidoreductase
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé
(Altschul et al., 1990).
L'inactivation du gène orf31 a été réalisée. Il a pu ainsi être montré que la
souche
résultante ne produit plus de spiramycines. Ceci confirme que le gène orf31
est bien:.
impliqué dans la biosynthèse des spirarnycines. L'enzyme codée par ce gène
est. don6,:.;
=
bien responsable d'une étape de bioconversion essentielle à la biosynthèse des
'4
=
spiramycines.
La séquence d'or:02c a tout d'abord été déterminée de manière partielle (cf.
exemple 19), puisque la séquence codante en 5' n'a été déterminée que dans un
second
temps. La séquence partielle de cette orf (SEQ ID N 120) a néanmoins été
utilisée pour
l'analyse avec les différents programmes informatiques comme expliqué ci-
dessus. Il a
ainsi pû être déterminé que le gène orf32c code une protéine présentant une
identité de
47% sur la séquence déterminée (SEQ ID N 121, qui est la séquence partielle
de la
protéine Orf32c) (déterminée grâce au programme BLAST) avec une protéine
régulatrice de la famille GntR chez Streptomyces coelicolor (Numéro d'accès
GenBank :
NP 625576, Score BLAST: 229). Cette similitude suggère que le gène orf32c code
un
régulateur transcriptionel de la famille GntR. Cette hypothèse est étayée par
le fait que la

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
73
protéine codée par le gène orf32c présente une forte similitude avec d'autres
protéines
de fonction similaire chez d'autres organismes.
La séquence partielle d' orf32c a été complétée par la suite et la région
manquante
a été déterminée (cf. SEQ ID N 140 et SEQ ID N 145). La séquence complète de
cette
orf code une protéine présentant une identité de 44% (déterminée grâce au
programme
BLAST) avec une protéine régulatrice de la famille GntR chez Streptomyces
avermitilis
(Numéro d'accès GenBank : NP 824604, Score BLAST: 282). Cette similitude
suggère
que le gène orf32c code un régulateur transcriptionel de la famille GntR.
Cette
hypothèse est étayée par le fait que la protéine codée par le gène orf32c
présente une
forte similitude avec d'autres protéines de fonction similaire chez d'autres
organismes
(cf. tableau 37).
Tableau 37
Protéine présentant une similitude Numéro Score Fonction rapportée
significative d'accès BLAST*
GenBank
tµ;
Protéine régulatrice de la famille GntR Np-e8:241: 276 Protéine
régulatrice.,
= =
(Streptomyces avermitilis) de la famille GntR
Protéine régulatrice de la famille GntR NP 625576 266 Protéine
régulatrice
Streptomyces coelicolor) de la famille GntR
SC5G8 .04 (Streptomyces coelicolor) NP_628991 258 Protéine
régulatrice
de la famille GntR
transcriptional regulator (Streptomyces AAF01064 224 Régulateur
venezuelae) transcriptionel
Protéine régulatrice de la famille GntR NP_827432 239 Protéine
régulatrice
(Streptomyces avermitilis) de la famille GntR

CA 02501445 2005-04-06
PCT/FR2003/002962
WO 2004/033689
74
* une plus grande similitude de séquence est associée à un score BLAST plus
élevé
(Altschul et al., 1990).
L'inactivation du gène orf32c a été réalisée dans le but d'étudier la fonction
de ce
gène dans la voie de biosynthèse des spiramycines chez Streptomyces
ambofaciens. Il a
pu être montré que la souche résultante produit des spiramycines. Ceci indique
que le
gène orf32 n'est pas essentiel à la biosynthèse des spiramycines et qu'il
n'est pas
essentiel à la survie de la bactérie.
Le gène orf33 code une protéine présentant une identité de 49% (déterminée
grâce
au programme BLAST) avec une protéine hypothétique de Xanthomonas campestris
(Numéro d'accès GenBank : NP 635564, Score BLAST : 54).
La séquence d'orf34c est partielle. En effet, les comparaisons effectuées
entre le
produit de cette orf et les banques de données suggèrent que la partie C-
terminale
cette protéine n'est pas dans le produit déduit de la séquence nucléotidique
et donc que
=
=
cette orf serait plus longue et continuerait en dehors de la région séquencée.
La séquence

partielle de cette ORF a néanmoins été utilisée pour l'ealyse avec les
différents
; = programmes informatiques comme expliqué ci-dessus. Il a ainsi pû
être déterminé que le
gène orf34c code une protéine présentant une identité de 91% sur la séquence
déterminée (SEQ ID N 150, qui est la séquence partielle de la protéine
Orf34c)
(déterminée grâce au programme BLAST) avec une arabinofuranosidase de chez
Streptomyces coelicolor (Bentley et al., 2002; Numéro d'accès GenBank : NP
630049,
Score BLAST: 654). Chez S. coelicolor le gène codant cette arabinofuranosidase
ne
semble pas impliqué dans la biosynthèse de métabolite secondaire. Chez S.
ambofaciens,
ce gène n'est donc probablement pas impliqué dans la biosynthèse de
spiramycine.
La présente invention a également pour objet des polynucléotides s'hybridant
dans des conditions d'hybridation de forte stringence à au moins l'un des
polynucléotides de séquence SEQ ID N 3, 5, 7, 9, 11, 13, 15, 17, 19, 21,23,
25, 28, 30,
34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80,
82, 84, 107, 109,
111, 113, 115, 118, 120, 141, 143, 145, 147 et 149, ou l'un de ses variants ou
l'une des

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
séquences dérivées de celles-ci en raison de la dégénérescence du code
génétique.
Préférentiellement, cesdit polynucléotides sont isolés à partir d'une bactérie
du genre
Streptomyces, plus préférentiellement, ces polynucléotides codent des
protéines
impliquées dans la biosynthèse d'un macrolide et encore plus
préférentiellement, ces
5 polynucléotides codent une protéine ayant une activité similaire à la
protéine codée par
les polynucléotides avec lesquels ils s'hybrident. Les conditions
d'hybridation de forte
stringence peuvent être définies comme des conditions d'hybridation
défavorisant
l'hybridation de brins d'acides nucléiques non homologues. Des conditions
d'hybridations de forte stingence peuvent être par exemple décrites comme des
=
10 conditions d'hybridation dans le tampon décrit par Church & Gilbert
(Church &
Gilbert, 1984) à une température comprise entre 55 C et 65 C, de manière
préférée la
température d'hyridation est de 55 C, de manière encore plus préférée la
températue
d'hybiidation est de 60 C et de manière tout à fait préférée la température
d'hybridation'
est de 65 C, suivi d'un ou plusieurs lavages effectué en tampon 2X SSC à une
15 température comprise entre 55 C et 65 C, de manière préférée cette
température est de
55 C, de manière encore plus préférée cette températue est de 60 C et de
manière tout àq
fait préférée cette température est de 65 C, suivi d'uri,beplusieirs lavages
en tampon
=
0.5X SSC à une température comprise entre 55 C ét 65 C, de manière préférée
cette
température est de 55 C, de manière encore plus préférée cette températue est
de 60 C
20 et de manière tout à fait préférée cette température est de 65 C. Les
conditions
d'hybridation ci-dessus décrites peuvent être adaptées en fonction de la
longueur de
l'acide nucléique dont l'hybridation est recherchée ou du type de marquage
choisi, selon
des techniques connues de l'homme du métier. Les conditions convenables
d'hybridation peuvent par exemple être adaptées selon l'ouvrage de F.Ausubel
et al.,
25 2002.
L'invention concerne également un polynucléotide ayant au moins 70%, de façon
plus préférée 80%, de façon plus préférée 85%, de façon encore plus préférée
90%, de
façon encore plus préférée 95% et de manière tout à fait préférée 98%
d'identité en
nucléotides avec un polynucléotide comprenant au moins 10, 12, 15, 18, 20 à
25, 30,
30 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500,
550, 600, 650, 700,

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
76
750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400,
1450,
1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850 ou 1900 nucléotides consécutifs
d'un
polynucléotide choisi dans le groupe constitué des séquences nucléotidiques
SEQ ID N
3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47,
49, 53, 60, 62, 64,
66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120,
141, 143, 145,
147 et 149, ou l'un de ses variants ou l'une des séquences dérivées de celles-
ci en raison
de la dégénérescence du code génétique, ou un polynucléotide de séquence
complémentaire. Préférentiellement, ces dits polynucléotides sont isolés à
partir d'une
bactérie du genre Streptomyces, plus préférentiellement, ces polynucléotides
codent des
protéines impliquées dans la biosynthèse d'un macrolide et encore plus
préférentiellement, ces polynucléotides codent des protéines ayant des
activités
similaires aux protéines codées par les polynucléotides avec lesquels ils
présentent
l'identité. De façon tout à fait préférée, un polynucléotide selon l'invention
est choisi
dans le groupe constitué des séquences nucléotidiques SEQ ID N 3, 5, 7, 9,
11, 13, 15,
17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64, 66,
68, 70, 72, 74,
=..
76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147 et
149, ou tel; 4.e
polynucléotide de séquence conipléineritaire.
L'alignement optimal des séquences pour la comparaison peut être réalisé de
manière informatique à l'aide d'algorithmes connus, par exemple ceux du
package
FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible
notamment auprès du centre de ressources INFOBIOGEN, Evry, France. A titre
d'illustration, le pourcentage d'identité de séquence pourra être determiné à
l'aide du
logiciel LFASTA (Chao K.-M. et al., 1992) ou LALIGN (Huang X. et Miller W.,
1991). Les programmes LFASTA et LALIGN font partie du package FASTA. LALIGN
retourne les alignements locaux optimaux : ce programme est plus rigoureux,
mais aussi
plus lent que LFASTA.
Un autre aspect de l'invention concerne un polypeptide résultant de
l'expression
d'une séquence d'acide nucléique telle que définie ci-dessus.
Préferentiellement, les
polypeptides selon l'invention présentent au moins 70%, de façon plus préférée
80%, de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
77
façon plus préférée 85%, de façon encore plus préférée 90%, de façon encore
plus
préférée 95% et de manière tout à fait préférée 98% d'identité en acides
aminés avec un
polypeptide comprenant au moins 10, 15, 20, 30 à 40, 50, 60, 70, 80, 90,100,
120, 140,
160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 420, 440,
460, 480,
500, 520, 540, 560, 580, 600, 620 ou 640 acides aminés consécutifs d'un
polypeptide
d. choisi parmi SEQ ID N 4, 6,8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 27,
29, 31, 32, 33, 35,
= 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57, 58, 59, 61,
63, 65, 67, 69, 71,
73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119, 121, 142, 144,
146, 148 et
150, ou l'une de ces séquences excepté que tout au long de ladite séquence un
ou i'qr;i
plusieurs acides aminés ont été substitués, insérés ou délétés sans en
affecter les
propriétés fonctionnelles ou l'un des variant de ces séquences.
Préferentiellement les
polypeptides selon l'invention sont exprimés à l'état naturel par une bactérie
du genre
Streptomyces, plus préférentiellement, ces polypeptides sont impliqués dans
.1a,
biosynthèse d'un macrolide et encore plus préférentiellement, ces polypeptides
ont unéi.
activité similaire à celle du polypeptide avec lequel il partage l'identité.
De faç4,:.:!Z
préférée, un polypeptide selon l'invention est choisi dans le groupe
constituè*1
séquences polypeptidiques SEQ ID N 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24,
26,
:4
31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57,
58, 59, 61, 63, r.
65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119,
121, 142,
144, 146, 148 et 150, ou l'une de ces séquences excepté que tout au long de
ladite
séquence un ou plusieurs acides aminés ont été substitués, insérés ou délétés
sans en
affecter les propriétés fonctionnelles ou l'un des variant de ces séquences.
De façon tout
à fait préférée, un polypeptide selon l'invention est choisi dans le groupe
constitué des
séquences polypeptidiques SEQ ID N 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24,
26, 27, 29,
31, 32, 33, 35, 37, 38, 39, 41, 42, 44, 46, 48, 50, 51, 52, 54, 55, 56, 57,
58, 59, 61, 63,
65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 108, 110, 112, 114, 116, 117, 119,
121, 142,
144, 146, 148 et 150.
L'alignement optimal des séquences pour la comparaison peut être réalisé de
manière informatique à l'aide d'algorithmes connus, par exemple ceux du
package

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
78
FASTA (Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990), accessible

notamment auprès du centre de ressources INFOBIOGEN, Evry, France. A titre
d'illustration, le pourcentage d'identité de séquence pourra être determiné à
l'aide du
logiciel LFASTA (Chao K.-M. et al., 1992) ou LALIGN (Huang X. et Miller W.,
1991), en utilisant les paramètres par défaut tel que défini par le centre de
ressources
INFOBIOGEN, Evry, France. Les programmes LFASTA et LALIGN font partie du
package FASTA. LALIGN retourne les alignements locaux optimaux : ce programme
est plus rigoureux, mais aussi plus lent que LFASTA.
Un autre aspect de l'invention concerne un ADN recombinant comprenant au
moins un polynucléotide tel que décrit ci-dessus. Préférentiellement ; cet ADN
recombinant est un vecteur. Encore plus préférentiellement, le vecteur est
choisi parmi
les bactériophages, les plasmides, les phagemides, les vecteurs intégratifs,
les fosmides, ,
les cosmides, les vecteurs navettes, les BAC (Bacterial Artificial Chromosome)
ou les
PAC (P1-derived Artificial Chromosome). A titre illustratif on peut citer
comme
bactériophages le phage lambda et le phage M13. Comme plasmides on peut citer
les
,
. , plasmides se répliquant chez E coli par exemple pl3R322 et ses dérivés,
pUC18 et sese
n = dérivés, pijC19 et ses dérivés, pGÉ2 et ses dérivés (Churchward G.
et al., 1984)1,e..7.1
pACYC177 (numéro d'accès GenBank : X06402) et ses dérivés, pACYC184 (numéro
d'accès GenBank : X06403) et ses dérivés. On peut également citer les
plasmides se
répliquant chez Streptomyces comme par exemple pIJ101 et ses dérivés, pSG5 et
ses
dérivés, SLP1 et ses dérivés, SCP2* et ses dérivés (Kieser et al. 2000). Comme

phagemides on peut citer à titre illustratif pBluescript II et ses dérivés
(commercialisés
notamment par la société Stratagene (LaJolla, Californie, USA)), pGEM-T et ses

dérivés (commercialisé par la société Promega (Madison, Wisconcin, USA)),
1ZAPII et
ses dérivés (commercialisés notamment par la société Stratagene (LaJolla,
Californie,
USA)). Comme vecteurs intégratifs on peut citer à titre illustratif, les
vecteurs
intégratifs chez Streptomyces comme par exemple ceux dérivés de SLP1 (Kieser
et al,
2000), ceux dérivés de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les
systèmes
d'intégration des phages PhiC31 (Kieser et al, 2000) (par exemple pSET152
(Bierman
et al., 1992)) ou de VWB (Van Mellaert L, et al. 1998), ainsi que les vecteurs
utilisant

CA 02501445 2005-04-06
PCT/FR2003/002962
WO 2004/033689
79
le système d'intégration de IS117 (Kieser et al. 2000). Comme fosmides on peut
citer à
titre illustratif le fosmide pF0S1 (commercialisé par la société New England
Bioloabs
Inc., Beverly, Massachussetts, USA) et ses dérivés. Comme cosmides on peut
citer à
titre illustratif le cosmide SuperCos et ses dérivés (commercialisés notamment
par la
société Stratagene (LaJolla, Californie, USA)), le cosmide pWED15 (Wahl et
al., 1987)
et ses dérivés. Comme vecteurs navettes on peut citer à titre illustratif les
plasmides
navettes E.. cou i I Streptomyces comme par exemple pIJ903 et ses dérivés, la
série des
plasmides pUWL, pCA0106, pWHM3, p0J446 et leurs dérivés (Kieser et al. 2000),
les
BAC navettes E. cou i I Streptomyces comme par exemple ceux décrits dans la
demande
de brevet WO 01/40497. Comme BAC (Bacterial Artificial Chromosome) on peut
citer
à titre illustratif le BAC pBe1oBAC11 (numéro d'accès GenBank :U51113). Comme
PAC (P1 -derived Artificial Chromosome) on peut citer à titre illustratif le
vecteur ,
pCYPAC6 (numéro d'accès GenBank : AF133437). De façon tout à fait préférée, un
;:.
vecteur selon l'invention est choisi parmi pOS49.1, pOS49.11, pOSC49.12,
pOS49.14,
,
, 15 pOS49.16, pOS49.28, pOS44.1, pOS44.2, pOS44.4, pSPM5, pSPM7, pOS49.67,
-
-
e
pOS49.88, pOS49.106, pOS49.120, pffl9.107, p0S493 2, pOS49A3, pOS49 44,
pOà49:50, iifà$49.99, pSPM17, P$PM21 PeM502, 'f;SPM504, pSPM507, pSPM508; ,1
pSPM509, pSPM1, pBXL1111, pBXL1112, pBXL1113, pSPM520, pSPM521, -
pSPM522, pSPM523, pSPM524, pSPM525, pSPM527, pSPM528, pSPM34, pSPM35,
pSPM36, pSPM37, pSPM38, pSPM39, pSPM40, pSPM41, pSPM42, pSPM43,
pSPM44, pSPM45, pSPM47, pSPM48, pSPM50, pSPM51, pSPM52, pSPM53,
pSPM55, pSPM56, pSPM58, pSPM72, pSPM73, pSPM515, pSPM519, pSPM74,
pSPM75, pSPM79, pSPM83, pSPM107, pSPM543 et pSPM106.
Un autre aspect de l'invention concerne un système d'expression comprenant un
vecteur d'expression approprié et une cellule hôte permettant l'expression
d'un ou
plusieurs polypeptides tels que décrits ci-dessus dans un système biologique.
Les
vecteurs d'expression selon l'invention comprennent une séquence d'acide
nucléique
codant un ou plusieurs polypeptides tels que décrits ci-dessus et peuvent être
destinés à
l'expression des différents polypeptides selon l'invention dans diverses
cellules hôtes
bien connues de l'homme du métier. A titre d'exemple, on peut citer les
systèmes

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
d'expression procaryote comme les systèmes d'expression chez la bactérie E.
cou, les
sytèmes d'expression eucaryotes, comme le système d'expression baculovirus
permettant une expression dans des cellules d'insectes, les sytèmes
d'expression
permettant une expression dans des cellules de levures, les sytèmes
d'expression
5 permettant une expression dans des cellules de mammifères, notamment des
cellules
humaines. Les vecteurs d'expression utilisables dans de tels systèmes sont
bien connus
de l'homme du métier, en ce qui concerne les cellules procaryotes, on peut
citer à titre
illustratif les vecteurs d'expression chez E. cou i par exemple, de la famille
pET
commercialisés par la société Stratagene (LaJolla, Californie, USA), les
vecteurs de la .;
10 famille GATEWAY commercialisés par la société Invitrogen (Carlsbad,
Californie,
USA), les vecteurs de la famille pBAD commercialisés par la société Invitrogen

(Carlsbad, Californie, USA), les vecteurs de la famille pMAL commercialisés
par la
société New England Bioloabs Inc. (Beverly, Massachussetts, USA), les vecteurs

d'expression inductibles par le rhamnose cités dans la publication Wilms B et
al., 2001
15 et leurs dérivés, on peut également citer les vecteurs d'expression chez
Streptomyces
comme par exemple les vecteurs pll4123, 0-6021, pPM927, pANT849, pANT
pANT 851, pA11T1200, pANT1201, pANT1202 et leurs dérives (Kieser et al.,
2000). ,
En ce qui concerne les cellules de levures, on peut citer à titre illustratif
le vecteur pESC
commercialisé par la société Stratagene (LaJolla, Californie, USA). En ce qui
concerne
20 le système d'expression baculovirus permettant une expression dans des
cellules
d'insectes on peut citer à titre illustratif le vecteur BacPAK6 commercialisé
par la
société BD Biosciences Clontech, (Palo Alto, Californie, USA). En ce qui
concerne les
cellules de mammifères, on peut citer à titre illustratif des vecteurs
comprenant le
promoteur des gènes précoces du virus CMV (Cytomegalovirus) (par exemple le
25 vecteur pCMV et ses dérivés commercialisés par la société Stratagene
(LaJolla,
Californie, USA), ou le promoteur des gènes immédiats (SV40 early promoter) du
virus
simien vacuolisant SV40 (par exemple le vecteur pSG5 commercialisé par la
société
Stratagene (LaJolla, Californie, USA).
L'invention est également relative à un procédé de production d'un polypeptide
30 tel que décrit ci-dessus ledit procédé comprenant les étapes suivantes:

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
81
a) insérer un acide nucléique codant ledit polypeptide dans un vecteur
approprié
b) cultiver, dans un milieu de culture approprié, une cellule hôte
préalablement
transformée ou transfectée avec le vecteur de l'étape a) ;
e) récupérer le milieu de culture conditionné ou un extrait cellulaire, par
exemple par sonication ou par choc osmotique ; =
d) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait cellulaire obtenu à l'étape c), ledit polypeptide ;
e) le cas échéant, caractériser le polypeptide recombinant produit.
Un polypeptide recombinant selon l'invention peut être purifié par passage sur
une série appropriée de colonnes de chromatographie, selon les méthodes
connues de
l'homme de l'art et décrites par exemple dans F.Ausubel et al (2002). On peut
citer à
titre illustratif la technique du Tag-Histidine , qui consiste à ajouter une
courte =.,;v:;;
à.
. , séquence poly-histidine au polypeptide à produire, ce dernier
pouvant ensuite êtreige
purifié sur colonne de nickel. Un polypeptide selon l'invention peut être
également
préparé par les techniques de synthèse in vitro. A titre illustratif de telles
techniques, un
polypeptide selon l'invention pourra être préparé grâce au système rapid
translation
system (RTS) , commercialisé notamment par la société Roche Diagnostics France
S.A,
Meylan, France.
Un autre aspect de l'invention concerne des cellules hôtes dans laquelle a été
introduit au moins un polynucléotide et/ou au moins un ADN recombinant et/ou
au
moins un vecteur d'expression selon l'invention.
Un autre aspect de l'invention concerne des microorganismes bloqués dans une
étape de la voie de biosynthèse d'au moins un macrolide. L'intérêt réside
d'une part dans
l'étude de la fonction des protéines mutées et d'autre part dans la
réalisation de
microorganismes produisant des intermédiaires de biosynthèse. Ces
intermédiaires

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
82
peuvent être modifiés, éventuellement après séparation, soit par ajout de
composants
particuliers dans les milieux de production, soit par introduction dans les
microorganismes ainsi mutés d'autres gènes codant des protéines susceptibles
de
modifier l'intermédiaire en s'en servant comme substrat. Ces intermédiaires
peuvent
ainsi être modifiés par voie chimique, biochimique, enzymatique et/ou
microbiologique.
Les microorganismes bloqués dans une étape de la voie de biosynthèse de
macrolides
peuvent être obtenus en inactivant la fonction d'une ou plusieurs protéines
impliquées
dans la biosynthèse de ce ou de ces macrolides dans des microorganismes
producteurs
de ce ou de ces macrolide. Selon la ou les protéines inactivées, on pourra
ainsi obtenir
des microorganismes bloqués dans les différentes étapes de la voie de
biosynthèse de ce
ou de ces macrolides. L'inactivation de cette ou de ces protéines peut être
effectuée par
toute méthode connue de l'homme du métier, par exemple par mutagenèse dans le
ou
les gènes codant ladite ou lesdites protéines ou par l'expression d'un ou de
plusieurs ,
ARN anti-sens complémentaires de l'ARN ou des ARN messagers codant ladite ou
lesdites protéines. La mutagenèse peut, par exemple, être effectuée par
irradiation, par
action d'agent chimique mutagène, par mutagenèse dirigée, par remplacement de
gènelai\,:.
t'At
!.
; 4 ou toute autre méthode connue. l'homme du, Métier._ Les conditions
convenables ei
d'une telle mutagénèse peuvent par exemple être adaptées selon l'enseignement
contenu
dans les ouvrages de Kieser, T et al (2000) et Ausubel et al., (2002). La
mutagenèse
peut être effectuée in vitro ou in situ, par suppression, substitution,
délétion et/ou
addition d'une ou plusieurs bases dans le gène considéré ou par inactivation
génique.
Cette mutagénèse peut être effectuée dans un gène comprenant une séquence
telle que
décrite ci-dessus. Préférentiellement, les microorganismes bloqués dans une
étape de la
voie de biosynthèse de macrolides sont des bactéries du genre Streptomyces.
Plus
préférentiellement, l'inactivation de la fonction d'une ou plusieurs protéines
impliquées
dans la biosynthèse du ou des macrolides en question est effectuée par
mutagénèse.
Encore plus préférentiellement, le macrolide en question est la spiramycine et
les
microorganismes dans lesquels sont effectuées la ou les mutagénèses sont des
souches
de S. ambofaciens. Plus préférentiellement, la mutagénèse est effectuée dans
un ou
plusieurs gènes comprenant une des séquences correspondant à une ou plusieurs
des

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
83
séquences SEQ ID N 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30, 34,
36, 40, 43,
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109,
111, 113, 115,
118, 120, 141, 143, 145, 147 et 149. De façon préférée, la ou les mutagénèses
sont
effectuées par inactivation génique. De façon tout à fait préférée, la
mutagénèse consiste
en l'inactivation génique d'un gène comprenant une séquence correspondant à la
séquence SEQ ID N 13.
A titre illustratif, les microorganismes suivants peuventêtre cités à titre
d'exemple
de tels microorganismes : 0S49.16 (orf3:; ..Qhyg, cf. exemple 2), 0S49.67
(orf3délétion
en phase, cf exemple 6), 0S49.107 (orf8;: 12hyg, cf. exemple 7), 0S49.50
(orf10:: .0,hyg, cf. exemple 8), SPM21 (orf2::att3.(2aac-, cf. exemple 10),
SPM22
(orf2::att3 délétion en phase, cf. exemple 10), SPM501 (orf6*::attl.Qhyg+, cf.
exemple
14), SPM502 (orf6*::attl délétion en phase, cf. exemple 14), SPM507 .
(orf12::att3f2aac-, cf. exemple 11), SPM508 (orfl3c::att3flaac-, cf. exemple
12),
SPM509 (orf14::att3.C2aac-, cf. exemple 13), SPM107 (orf28c::att3aac+, cf.
exemple =
29), SPM543 (orfil::att3aac+, cf. exemple 30), SPM106 (oif32c::att3aac+,
!
, .
4, e,ît
exemple 31).
Un autre aspect de l'invention concerne un procédé de préparation d'un
intermédiaire de biosynthèse de macrolide utilisant les microorganismes
bloqués dans
une étape de la voie de biosynthèse de macrolides, tels que décrits ci-dessus.
Le procédé
consiste à cultiver, dans un milieu de culture approprié, un microorganisme
bloqué dans
une étape de la voie de biosynthèse de macrolides, tels que décrits ci-dessus,
récupérer
le milieu de culture conditionné ou un extrait cellulaire, par exemple par
sonication ou
par choc osmotique, séparer et purifier à partir dudit milieu de culture ou
encore à partir
de l'extrait cellulaire obtenu à l'étape précédente, ledit intermédiaire de
biosynthèse.
Les conditions de culture de tels microorganismes pourront être déterminées
selon des
techniques bien connues de l'homme du métier. Le milieu de culture pourra par
exemple être le milieu MP5 ou le milieu SL11 pour les Streptomyces et
notamment
pour Streptomyces ambofaciens (Pernodet et al., 1993). L'homme du métier
pourra
notamment se référer à l'ouvrage de Kieser et al. (2000) en ce qui concerne la
culture

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
84
des Streptomyces. L'intermédiaire produit peut être récupéré par toutes
techniques
connues de l'homme du métier. L'homme du métier pourra se référer, par
exemple, aux
techniques enseignées dans le brevet américain US 3,000,785 et plus
particulièrement
aux méthodes d'extraction des spiramycines décrites dans ce brevet.
Un autre objet de l'invention concerne un procédé de préparation d'une
molécule
dérivée d'un macrolide utilisant les microorganismes bloqués dans une étape de
la voie
de biosynthèse de ce macrolide, tels que décrits ci-dessus. Le procédé
consiste à obtenir
un intermédiaire de biosynthèse selon le procédé ci-dessus et à modifier
l'intermédiaire
ainsi produit, éventuellement après séparation du milieu de culture. Les
conditions de '
culture de tels microorganismes pourront être déterminées selon des techniques
bien
connues de l'homme du métier. Le milieu de culture pourra par exemple être le
milieu
MP5 ou le milieu SL11 pour les Streptomyces et notamment pour Streptomyces
ambofaciens (Pernodet et al., 1993). L'homme du métier pourra notamment se
référer à
l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des
Streptomyces. Les
intermédiaires produits peuvent être modifiés, éventuellement après
séparation, soit par
ajout de composants appropriés dans les milieux de production, soit par
introduction .
dans les microorganismes d'autres gènes codant des protéines susceptibles de
modifier
l'intermédiaire en s'en servant comme substrat. Ces intermédiaires peuvent
ainsi être
modifiés par voie chimique, biochimique, enzymatique et/ou microbiologique.
Plus
préférentiellement, le macrolide en question est la spiramycine et les
microorganismes
dans lesquels sont effectuées la ou les mutagénèses sont des souches de S.
ambofaciens.
L'invention est également relative à un microorganisme produisant de la
spiramycine I mais ne produisant pas de spiramycine II et III. Ce
microorganisme
comprend l'ensemble des gènes nécessaires à la biosynthèse de la spiramycine I
mais ne
produit pas de spiramycine II et III car le gène comprenant la séquence
correspondant à
SEQ ID N 13 ou l'un de ses variants ou l'une des séquences dérivées de celles-
ci en
raison de la dégénérescence du code génétique et codant un polypeptide de
séquence
SEQ ID N 14 ou l'un de ses variants n'est pas exprimé ou a été rendu inactif.

L'inactivation de cette protéine peut être effectuée par toute méthode comme
de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
l'homme du métier, par exemple par mutagénèse dans le gène codant ladite
protéine ou
par l'expression d'un ARN anti-sens complémentaire de l'ARN messager codant
ladite
protéine, étant entendu que si l'expression de orf5* est affectée par cette
manipulation,
il sera nécessaire de procéder à une autre modification pour que le gène orf5*
soit
5 correctement exprimé. La mutagénèse peut être effectuée dans la séquence
codante ou
dans une séquence non codante de manière à rendre inactive la protéine eodée
ou à en
empêcher son expression ou sa traduction. La mutagénèse peut être effectuée
par
mutagénèse dirigée, par remplacement de gène ou toute autre méthode connue de
l'homme du métier. Les conditions convenables d'une telle mutagénèse peuvent
par
10 exemple être adaptées selon l'enseignement contenu dans les ouvrages de
ICieser, T et
al (2000) et Ausubel et al., 2002. La mutagénèse peut être effectuée in vitro
ou in situ,
par suppression, substitution, délétion et/ou addition d'une ou plusieurs
bases dans le
gène considéré ou par inactivation génique. Le microorganisme peut être
également
obtenu en exprimant les gènes de la ,voie de biosynthèse de la spiramycine
sans que
15 ceux-ci ne comprennent le gène comprenant la séquence SEQ ID N 13 ou
l'un de ses
variants ou l'une des séquences dérivées de celles-ci en raison de la
dégénérescence du' =:*
code géne'tique et codant un .polypeptide de séquence SEQµ ID N 14 ou l'un de
sé:ate
variants. Préférentiellement, le microorganisme est une bactérie du genre
Streptomyces.
Plus préférentiellement, le microorganisme produisant de la spiramycine I mais
ne
20 produisant pas de spiramycine II et III est obtenu à partir d'un
microorganisme de départ
produisant les spiramycines I, II et III. Encore plus préférentiellement, le
microorganisme est obtenu par mutagénèse dans un gène comprenant la séquence
correspondant à SEQ ID N 13 ou l'un de ses variants ou l'une des séquences
dérivées
de celles-ci en raison de la dégénérescence du code génétique et codant un
polypeptide
25 de séquence SEQ ID N 14 ou l'un de ses variants ayant la même fonction.
Encore plus
préférentiellement, cette mutagénèse est effectuée par inactivation génique.
De manière
préférée le microorganisme est obtenu à partir d'une souche de S. ambofaciens
produisant les spiramycines I, II et III dans laquelle est effectuée une
inactivation
génique du gène comprenant la séquence correspondant à SEQ ID N 13 ou l'une
des
30 séquences dérivées de celle-ci en raison de la dégénérescence du code
génétique. De

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
86
manière tout à fait préférée, l'inactivation génique est effectuée par
délétion en phase du
gène ou d'une partie du gène comprenant la séquence correspondant à SEQ ID N
13 ou
l'une des séquences dérivées de celle-ci en raison de la dégénérescence du
code
génétique. A titre illustratif, la souche SPM502 (orf6*::attl, cf. exemple 14)
peut être
citée comme un microorganisme produisant de la spiramycine I mais ne
produisant pas
de spiramycine II et III.
L'invention est également relative à un microorganisme produisant = de la
spiramycine I mais ne produisant pas de spiramycine II et III tel que décrit
ci-dessus
caractérisé en ce en ce qu'il surexprime en outre :
- un gène susceptible d'être obtenu par amplification en chaîne par polymérase
en
utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus ,
préférentiellement il s'agit du gène de séquence codante SEQ ID N 141,
.5=1i
;e
,
¨ ou un gène dérivé de ceux-ci en raison de la dégénérescence du code
génétique.
,
Un exemple de séquence d'un tel gène est donné en SEQ ID N 111 (ADN),
cependant
cette séquence est partielle puisqu'elle ne comprend pas la partie 3' de la
séquence
codante correspondante. La traduction en protéine de cette partie de séquence
codante
est donnée en SEQ ID N 112. L'homme du métier pourra aisément la compléter
notamment en utilisant l'enseignement présenté dans l'exemple 24. La séquence
indéterminée dans SEQ ID N 111 a été déterminée dans un second temps et la
séquence
complète de cette orf (orf28c) est donnée en SEQ ID N 141. La traduction en
protéine
de cette séquence codante est donnée en SEQ ID N 142. Il est présenté dans
l'exemple
24 une méthode pour cloner le gène orf28c et pour fabriquer un vecteur
d'expression
permettant l'expression de orf28c. Il est également montré dans cet exemple
que la
surexpression du gène orf28c dans la souche OSC2 conduit à l'amélioration de
la
production en spiramycines de cette souche. La surexpression du gène orf28c
peut être
obtenue en augmentant le nombre de copies de ce gène et/ou en plaçant un
promoteur

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
87
plus actif que le promoteur sauvage. De façon préférée, la surexpression dudit
gène est
obtenue en apportant dans le microorganisme une construction d'ADN
recombinant,
permettant la surexpression de ce gène. De façon préférée, cette construction
d'ADN
recombinant augmente le nombre de copie dudit gène et permet d'obtenir une
surexpression dudit gène. Dans cette construction d'ADN recombinant, la
séquence
codante du gène peut être placée sous le contrôle d'un promoteur plus actif
que 14e
promoteur sauvage. On peut citer à titre d'illustration le promoteur ptrc
actif chez
Streptomyces ambofaciens (Amann, E. et al., 1988) ainsi que le promoteur
ermE*.
Ainsi, de façon préférée, la ou les copies du gène orf28c apportée sont
placées sous le .
contrôle du promoteur ermE* comme c'est le cas dans la construction pSPM75
(cf.
exemple 24).
L'invention est également relative à un microorganisme produisant de la
spiramycine I mais ne produisant pas de spiramycine II et HI tel que décrit ci-
dessus
caractérisé en ce en ce qu'il surexpiime en outre le gène de séquence codante
SEQ ID
N 47 ou d'une séquence codante dérivée de celle-ci en raison de la
dégénérescence du.*
'.µ code génétique. Préférentiellement, ce microorganisme est caractérisé
en ce qu'il s'agit::,'2!
de la souche SPM502 pSPM525 déposée auprès de la Collection Nationale de
Cultures
de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724
Paris
Cedex 15, France, le 26 février 2003 sous le numéro d'enregistrement 1-2977.
L'invention est également relative à un procédé de production de spiramycine
I, le
procédé consiste à cultiver dans un milieu de culture approprié un
microorganisme
produisant de la spiramycine I mais ne produisant pas de spiramycine II et III
tel que
décrit ci-dessus, récupérer le milieu de culture conditionné ou un extrait
cellulaire,
séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait
cellulaire obtenu à l'étape précédente la spiramycine I. Les conditions de
culture de tel
microorganisme pourront être déterminées selon des techniques bien connues de
l'homme du métier. Le milieu de culture pourra par exemple être le milieu MP5
ou le
milieu SL11 pour les Streptomyces et notamment pour Streptomyces ambofaciens
(Pernodet et al., 1993). L'homme du métier pourra notamment se référer à
l'ouvrage de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
88
Kieser et al. 2000 en ce qui concerne la culture des Streptomyces. La
spiramycine I
produite peut être récupérée par toutes techniques connues de l'homme du
métier.
L'homme du métier pourra se référer, par exemple, aux techniques enseignées
dans le
brevet américain US 3,000,785 et plus particulièrement aux méthodes
d'extraction des
spiramycines décrites dans ce brevet.
Un autre aspect de l'invention concerne l'utilisation d'une séquence
nucléotidique
selon l'invention pour améliorer la production en macrolides d'un
microorganisme.
Ainsi, l'invention concerne un microorganisme mutant producteur de macrolide :

caractérisé en ce qu'il possède une modification génétique dans au moins un
gène
comprenant une séquence telle que définie ci-dessus et/ou qu'elle surexpiime
au moins
un gène comprenant une séquence telle que définie ci-dessus. La modification
génétique
peut consister en une suppression, une substitution, une délétion et/ou une
addition d'une
ou plusieurs bases dans le ou les gènes considérés dans le but d'exprimer une
ou des
protéines ayant une activité supérieure ou d'exprimer un niveau plus élevé de
cette ou lzk
ces protéines. La surexpression du gène considéré peut être obtenue en
augmentant
, , r
= =
nombre de copies de ce gène et/ou en plaçant un promoteur plus actif que le
prottiçtent:51
sauvage. On peut citer à titre d'illustration le promoteur ptrc actif chez
Streptomycesieb
ambofaciens (Amann, E. et al., 1988) ainsi que le promoteur ermE* (Bibb et
al., 1985),
(Bibb et al., 1994). Ainsi la surexpression du gène considéré peut être
obtenue en
apportant dans un microorganisme producteur du macrolide considéré une
construction
d'ADN recombinant selon l'invention, permettant la surexpression de ce gène.
En effet,
certaines étapes de la biosynthèse des macrolides sont limitantes et si l'on
exprime une
ou plusieurs protéines plus actives ou un niveau d'expression plus important
de la ou des
protéines sauvages impliquées dans ces étapes limitantes, on peut améliorer la
production du ou des macrolides concernés. Une augmentation du taux de
production de
la tylosine a par exemple été obtenue chez Streptomyces fradiae par
duplication du gène
codant une methyl transférase limitante convertissant la macrocine en tylosine
(Baltz R,
1997). L'obtention de l'expression d'une protéine plus active peut être
obtenue
notamment par mutagénèse, l'homme du métier pourra par exemple se référer à ce
sujet
à l'ouvrage de F.Ausubel et al (2002). Préférentiellement, ces microorganismes
mutants

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
89
améliorés pour leur production en macrolides sont des bactéries du genre
Streptomyces.
Plus préférentiellement, le macrolide en question est la spiramycine et les
microorganismes dans lesquels sont effectuées la ou les mutagénèses sont des
souches
de S. ambofaciens. Plus préférentiellement, la modification génétique est
effectuée dans
un ou plusieurs gènes comprenant une des séquences correspondant à une ou
plusieurs
des séquences SEQ ID N 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 28, 30,
34, 36, 40,43,
45, 47, 49, 53, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 107, 109,
111, 113, 115,
118, 120, 141, 143, 145, 147 et 149, ou l'un de ses variants ou l'une des
séquences:
dérivées de celles-ci en raison de la dégénérescence du code génétique. De
façon
préférée, le microorganisme surexprime un ou plusieurs gènes comprenant une
des
séquences correspondant à une ou plusieurs des séquences SEQ D N 3, 5, 7, 9,
11, 13,
15, 17, 19, 21, 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53, 60, 62, 64,
66, 68, 70, 72,
74, 76, 78, 80, 82, 84, 107, 109, 111, 113, 115, 118, 120, 141, 143, 145, 147
et 149, ou
l'un de ses variants ou l'une des séquences dérivées de celles-ci en raison de
la
= -.-
dégénérescence du code génétique. De façon préférée, le microorganisme
surexprime 1e7
gène comprenant une séquence correspondant à SEQ ID N 111 ou 141, ou l'un de
ses
= =
= = .à;
e:,!: t; = variants ou l'une des séquences dérivées de celles-ci en raison
de la dégénérescenceli
,L)
.1'
code génétique. La séquence donnée en SEQ II) N 111 est partielle, cependant
l'homme du métier pourra aisément la compléter notamment en utilisant
l'enseignement
présenté dans l'exemple 24. La séquence indéterminée dans SEQ ID N 111 a été
déterminée dans un second temps et la séquence complète de cette orf (orf28c)
est
donnée en SEQ ID N 141. La traduction en protéine de cette séquence codante
est
donnée en SEQ ID N 142. Il est ainsi présenté l'exemple 24 une méthode pour
cloner le
gène orf28c et pour fabriquer un vecteur d'expression permettant l'expression
de orf28c.
fi est également montré dans cet exemple que la surexpression du gène orf28c
dans la
souche OSC2 conduit à l'amélioration de la production en spiramycines de cette
souche.
La surexpression du gène orf28c peut être obtenue en augmentant le nombre de
copies
de ce gène et/ou en plaçant un promoteur plus actif que le promoteur sauvage.
De façon
préférée, la surexpression du gène orf28c est obtenue en apportant dans le
microorganisme une construction d'ADN recombinant, permettant la surexpression
de

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
ce gène. De façon préférée, cette construction d'ADN recombinant augmente le
nombre
de copie du gène orf28c et permet d'obtenir une surexpression du gène orf28c.
Dans
cette construction d'ADN recombinant, la séquence codante de orf28c peut être
placée
sous le contrôle d'un promoteur plus actif que le promoteur sauvage. On peut
citer à titre
5 d'illustration le promoteur ptrc actif chez Streptomyces ambofaciens
(Amann, E. et al.,
1988) ainsi que le promoteur ermE*. Ainsi, de façon préférée, la ou les copies
du gène
. orf28c apportée sont placées sous le contrôle du promoteur ermE* comme
c'est le cas
dans la construction pSPM75 (cf. exemple 24).
=
Un autre aspect de l'invention concerne un procédé de production de macrolides
1.0 utilisant les microorganismes décrits au paragraphe précédent. Ce
procédé consiste à
cultiver dans un milieu de culture approprié un microorganisme défini dans le
paragraphe précédent, récupérer le milieu de culture conditionné ou un extrait
cellulaire,
séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait
cellulaire obtenu à l'étape précédente le ou les macrolides produits. Les
conditions 4
15 culture de tels microorganismes pourront être déterminées selon des
techniques bien
, . connues de l'homme du métier. Le milieu de culture pourra par
exemple être le mili.41;,e
. n-
MP5 ou le milieu SL11 pour les Streptomyces et notamment pour Streptomycéee
ambofaciens (Pemodet et al., 1993). L'homme du métier pourra notamment se
référer à
l'ouvrage de Kieser et al. 2000 en ce qui concerne la culture des
Streptomyces. Le ou les
20 macrolides produits peuvent être récupérés par toutes techniques connues
de l'homme
du métier. L'homme du métier pourra se référer, par exemple, aux techniques
enseignées dans le brevet américain US 3,000,785 et plus particulièrement aux
méthodes d'extraction des spiramycines décrites dans ce brevet.
Préférentiellement, les
microorganismes utilisés dans un tel procédé sont des bactéries du genre
Streptomyces.
25 Plus préférentiellement, le macrolide en question est la spiramycine et les

microorganismes mutants améliorés pour leur production en spiramycines sont
des
souches de S. ambofaciens.
Un autre aspect de l'invention concerne l'utilisation d'une séquence et/ou
d'un
vecteur selon l'invention pour la préparation d'antibiotiques hybrides. En
effet, les

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
91
polynucléotides selon l'invention peuvent servir à l'obtention de
microorganismes
exprimant une ou plusieurs protéines mutantes donnant lieu à une modification
dans la
spécificité du substrat ou encore être exprimés dans de multiples
microorganismes
producteurs d'antibiotiques dans le but de générer des antibiotiques hybrides.
Ainsi les
polynucléotides selon l'invention peuvent permettre, par transfert des gènes
entre
microorganismes producteurs, de fabriquer des antibiotiques hybrides ayant des

propriétés pharmacologiquement intéressantes (Hopwood et a/.,1985a, Hopwood et

aL,1985b, Hutchinson et aL,1989). Le principe par lequel l'ingénierie
génétique peut
conduire à la production d'antibiotiques hybrides a été tout d'abord proposé
par
Hopwood (Hopwood 1981). Il a ainsi été proposé que les enzymes participant à
la
biosynthèse d'antibiotiques acceptent souvent des substrats reliés
structurellement, mais
différents de leur substrat naturel. Il est généralement admis (Hopwood 1981,
Hutchinson 1988, Robinson 1988) que les enzymes codées par les gènes de la
voie dé
biosynthèse d'antibiotiques ont une spécificité de substrat moins stricte que
les enzymes
du métabolisme primaire. Il a ainsi pu être montré qu'un grand nombre de
substrats non7...;
= , naturels sont transformés par des microorganismes producteurs
d'antibiotique, lenyliq
mutants ou des enzymes purifiées de la Voie -de biosynthèse de ces
antibiotique
,
(Hutchinson 1988). En utilisant cet enseignement, l'homme du métier pourra
construire
des microorganismes exprimant une ou plusieurs protéines mutantes donnant lieu
à une
modification dans la spécificité du substrat dans le but de générer des
antibiotiques
hybrides.
L'invention concerne également l'utilisation d'au moins un polynucléotide
et/ou
au moins un ADN recombinant et/ou au moins un vecteur d'expression et/ou au
moins
un polypeptide et/ou au moins une cellule hôte selon l'invention pour réaliser
une ou
plusieurs bioconversions. Ainsi l'invention permet de construire des souches
bactériennes ou fongiques dans lesquelles on exprime, sous le contrôle de
signaux
d'expression appropriés, une ou plusieurs protéines selon l'invention. De
telles souches
peuvent alors être utilisées pour réaliser une ou des bioconversions. Ces
bioconversions
peuvent se faire soit à l'aide de cellules entières, soit à l'aide d'extraits
acellulaires des
dites cellules. Ces bioconversions peuvent permettre de transformer une
molécule en une
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
92
forme dérivée, avec une enzyme d'une voie de biosynthèse. Par exemple,
Carreras et al.
décrit l'utilisation de souche de Saccharopolyspora etythraea et de
Streptomyces
coelicolor pour la production de nouveau dérivés d'érithromycines (Carreras et
al.,
2002). Walczar et al. décrit l'utilisation d'une P450 mono-oxygénase de
Streptomyces
pour la bioconversion de désacétyladriamycine (un analogue de l'anthracycline)
en de
nouvelles anthracyclines (Walczar et al., 2001). Olonao et al. décrit
l'utilisation d'une
souche de Streptomyces lividans modifiée pour la bioconversion de
rhodomycinone-
epsilon en rhodomycine D (Olonao et al., 1999). L'homme du métier pourra
appliquer
ce principe à tout intermédiaire de biosynthèse.
õ
L'invention concerne également un ADN recombinant caractérisé en ce qu'il
comprend :
- un polynucléotide susceptible d'être obtenu par amplification en chaîne par
polymérase en utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
=
`;;s = matrice le cos/nide pSPM36 ou l'ADN total de Streptomyces
ambofaciens, plusi5:eie
préférentiellement il s'agit d'un polynucléotide de séquence SEQ ID N 141,
- ou un fragment d'au moins 10, 12, 15, 18, 20 à 25, 30, 40, 50, 60, 70, 80,
90, 100,
150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850,
900, 950,
1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1460, 1470, 1480,
1490 ou 1500 nucléotides consécutifs de ces polynucléotides.
Préférentiellement ; cet ADN recombinant est un vecteur. Encore plus
préférentiellement, le vecteur est choisi parmi les bactériophages, les
plasmides, les
phagemides, les vecteurs intégratifs, les fosmides, les cosmides, les vecteurs
navettes,
les BAC (Bacterial Artificial Chromosome) ou les PAC (P1 -derived Artificial
Chromosome). A titre illustratif on peut citer comme bactériophages le phage
lambda
et le phage M13. Comme plasmides on peut citer les plasmides se répliquant
chez E.
cou i par exemple pBR322 et ses dérivés, pUC18 et ses dérivés, pUC19 et ses
dérivés,
pGB2 et ses dérivés (Churchward G. et al., 1984), pACYC177 (numéro d'accès

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
93
GenBank: X06402) et ses dérivés, pACYC184 (numéro d'accès GenBank: X06403)
et ses dérivés. On peut également citer les plasmides se répliquant chez
Streptomyces
comme par exemple pIJ101 et ses dérivés, pSG5 et ses dérivés, SLP1 et ses
dérivés,
SCP2* et ses dérivés (Kieser et al. 2000). Comme phagemides on peut citer à
titre
illustratif pBluescript II et ses dérivés (commercialisés notamment par la
société
Stratagene (LaJolla, Californie, USA)), pGEM-T et ses dérivés (commercialisé
par la
société Promega (Madison, Wisconcin, USA)), 1ZAPII et ses dérivés
(commercialisés notamment par la société Stratagene (LaJolla, Californie,
USA)).
Comme vecteurs intégratifs on peut citer à titre illustratif, les vecteurs
intégratifs
chez Streptomyces comme par exemple ceux dérivés de SLP1 (Kieser et al, 2000),
ceux dérivés de pSAM2 (Kieser et al, 2000), les vecteurs utilisant les
systèmes
d'intégration des phages PhiC31 (Kieser et al, 2000) (par exemple pSET152
(Bierman et al., 1992)) ou de VWB (Van Mellaert L, et al. 1998), ainsi que les
:
vecteurs utilisant le système d'intégration de IS117 (Kieser et al. 2000).
Comme f:
fosmides on peut citer à titre illustratif le fosmide pF0S1 (commercialisé par
la
société New England Bioloabs Inc., Beverly, Massachussetts, USA) et ses
dérivé,,s;'''.'"'qià
Comme cosrnides on peut citer à titre illustratif le cosmide SuperCos et ses
dérivés'
(commercialisés notamment par la société Stratagene (LaJolla, Californie,
USA)), le
cosmide pWED15 (Wahl et al., 1987) et ses dérivés. Comme vecteurs navettes on
peut citer à titre illustratif les plasmides navettes E. cou I Streptomyces
comme par
exemple pIJ903 et ses dérivés, la série des plasmides pUWL, pCA0106, pWHM3,
p0J446 et leurs dérivés (Kieser et al. 2000), les BAC navettes E. cou I
Streptomyces
comme par exemple ceux décrits dans la demande de brevet WO 01/40497. Comme
BAC (Bacterial Artificial Chromosome) on peut citer à titre illustratif le BAC
pBeloBAC11 (numéro d'accès GenBank :U51113). Comme PAC (Pl-derived
Artificial Chromosome) on peut citer à titre illustratif le vecteur pCYPAC6
(numéro
d'accès GenBank : AF133437). Plus préférentiellement, cet ADN recombinant est
un
vecteur d'expression. Les vecteurs d'expression utilisables dans différents
systèmes
d'expression sont bien connus de l'homme du métier, en ce qui concerne les
cellules
procaryotes, on peut citer à titre illustratif les vecteurs d'expression chez
E. cou i par

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
94
exemple, de la famille pET commercialisés par la société Stratagene (LaJolla,
Californie, USA), les vecteurs de la famille GATEWAY commercialisés par la
société Invitrogen (Carlsbad, Californie, USA), les vecteurs de la famille
pBAD
commercialisés par la société Invitrogen (Carlsbad, Californie, USA), les
vecteurs de
la famille pMAL commercialisés par la société New England Bioloabs Inc.
(Beverly,
Massachussetts, USA),, les vecteurs d'expression inductibles par le rharnnose
cités
dans la publication Wilms B et al., 2001 et leurs dérivés, on peut également
citer les
vecteurs d'expression chez Streptomyces comme par exemple les vecteurs
p114123,
pll6021, pPM927, pANT849, pANT 850, pANT 851, pANT1200, pANT1201, .
pANT1202 et leurs dérivés (Kieser et al., 2000). En ce qui concerne les
cellules de
levures, on peut citer à titre illustratif le vecteur pESC commercialisé par
la société
Stratagene (LaJolla, Californie, USA). En ce qui concerne le système
d'expression
baculovirus permettant une expression dans des cellules d'insectes on peut
citer à titre _
illustratif le vecteur BacPAK6 commercialisé par la société BD Biosciences
Clontech, (Palo Alto, Californie, USA). En ce qui concerne les cellules de '
mammifères, on peut citer à titre illustratif des vecteurs comprenant le
promoteur des .
gènes précoces du virus CMV (Cytomegalovirus) (par exemple le vecteur pCMV et'
:i't5.à"
ses dérivés commercialisés par la société Stratagene (LaJolla, Californie,
USA), ou le
promoteur des gènes immédiats (SV40 early promoter) du virus simien
vacuolisant
SV40 (par exemple le vecteur pSG5 commercialisé par la société Stratagene
(LaJolla,
Californie, USA). Un autre aspect de l'invention concerne des cellules hôtes
dans
laquelle a été introduit au moins un ADN recombinant décrit dans ce
paragraphe.
Un autre aspect de l'invention concerne un procédé de production d'un
polypeptide caractérisé en ce que ledit procédé comprend les étapes suivantes:
a) transformer une cellule hôte par au moins un vecteur d'expression tel que
décrit dans le paragraphe ci-dessus;
b) cultiver, dans un milieu de culture approprié, ladite cellule hôte;
c) récupérer le milieu de culture conditionné ou un extrait cellulaire;
d) séparer et purifier à partir dudit milieu de culture ou encore à partir de
l'extrait cellulaire obtenu à l'étape c), ledit polypeptide ;
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
e) le cas échéant, caractériser le polypeptide recombinant produit.
Le polypeptide recombinant ainsi produit peut être purifié par passage sur une

série appropriée de colonnes de chromatographie, selon les méthodes connues de

l'homme de l'art et décrites par exemple dans F. Ausubel et al (2002). On peut
citer à
5 titre illustratif la technique du Tag-Histidine , qui consiste à
ajouter une courte
séquence poly-histidine au pblypeptide à produire, ce dernier pouvant ensuite
être
purifié sur colonne de nickel. Ce polypeptide peut également être préparé par
les
techniques de synthèse in vitro. A titre illustratif de telles techniques, le
polypeptide
=
pourra être préparé grâce au système rapid translation system (RTS) ,
commercialisé 7;
10 notamment par la société Roche Diagnostics France S.A, Meylan, France.
Un autre aspect de l'invention àonceme un microorganisme producteur d'au
moins une spiramycine caractérisé en ce qu'il surexprime :
-un gène susceptible d'être obtenu par amplification en chaîne par polymérase
(PCR) en=
,
utilisant le couple d'amorces de séquence suivante : 5'
15 AAGCTMTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et
GGATCCCGCGACGGACACGACOGCCGCGCA 3' (SEQ ID N 139) et commei
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus
préférentiellement il s'agit du gène de séquence codante SEQ ID N 141,
- ou un gène dérivé de ceux-ci en raison de la dégénérescence du code
génétique.
20 Un exemple de séquence d'un tel gène est donné en SEQ ID N 111 (ADN),
cependant
cette séquence est partielle puisqu'elle ne comprend pas la partie 3' de la
séquence
codante correspondante. La traduction en protéine de cette partie de séquence
codante
est donnée en SEQ ID N 112. L'homme du métier pourra aisément la compléter
notamment en utilisant l'enseignement présenté dans l'exemple 24. Il est ainsi
présenté
25 dans cet exemple une méthode pour cloner le gène orf28c et pour
fabriquer un vecteur
d'expression permettant l'expression de orf28c. Il est également montré dans
cet
exemple que la surexpression du gène orf28c dans la souche OSC2 conduit à
l'amélioration de la production en spiramycines de cette souche. De façon
préférée, le
microorganisme surexprimant

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
96
- un gène susceptible d'être obtenu par amplification en chaîne par polymérase
(PCR) en
utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus
préférentiellement il s'agit du gène de séquence codante SEQ ID N 141,
- ou un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique
est une bactérie du genre Streptomyces, de manière encore plus préférée, il
s'agit d'une
bactérie de l'espèce Streptomyces ambofaciens. De façon préférée, la
surexpression
dudit gène est obtenue par transformation dudit microorganisme par un vecteur
d'expression, de manière tout à fait préféré, la souche de microorganisme est
la souche
OSC2/pSPM75(1) ou de la souche OSC2/pSPM75(2) déposée auprès de la Collection
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du
Docteur
Roux 75724 Paris Cedex 15, France, le 6 octobre 2003 sous le numéro
d'enregistrement
t.
1-3101.
f
Un autre aspect de l'invention concerne un procédé de production !sie
, 11
spiramycine(s) utilisant lés 'microorganismes décrits au paragraphe précédent

procédé consiste à cultiver dans un milieu de culture approprié un
microorganisme
défini dans le paragraphe précédent, récupérer le milieu de culture
conditionné ou un
extrait cellulaire, séparer et purifier à partir dudit milieu de culture ou
encore à partir de
l'extrait cellulaire Obtenu à l'étape précédente le ou les spiramycines
produites. Les
conditions de culture de tels microorganismes pourront être déterminées selon
des
techniques bien connues de l'homme du métier. Le milieu de culture pourra par
exemple être le milieu MP5 ou le milieu SL11 pour les Streptomyces et
notamment
pour Streptomyces ambofaciens (Pertiodet et al., 1993). L'homme du métier
pourra
notamment se référer à l'ouvrage de Kieser et al. 2000 en ce qui concerne la
culture des
Streptomyces. Le ou les spiramycines produites peuvent être récupérés par
toutes
techniques connues de l'homme du métier. L'homme du métier pourra se référer,
par
exemple, aux techniques enseignées dans le brevet américain US 3,000,785 et
plus
particulièrement aux méthodes d'extraction des spiramycines décrites dans ce
brevet.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
97
Préférentiellement, les microorganismes utilisés dans un tel procédé sont des
bactéries
du genre Streptomyces. Plus préférentiellement, les microorganismes sont des
souches
de S. ambofaciens.
Un autre aspect de l'invention concerne un vecteur d'expression caractérisé
en ce que le polynucléotide de séquence SEQ ID N 47 ou un polynucléotide
dérivé
de celui-ci en raison de la dégénérescence du code génétique est placé sous le

contrôle d'un promoteur permettant l'expression de la protéine codée par le
dit
polynucléotide chez Streptomyces ambofaciens. Des exemples de vecteurs
d'expression utilisables chez Streptomyces ont été donnés ci-dessus.
Préférentiellement un tel vecteur d'expression est caractérisé en ce qu'il
s'agit du
plasmide pSPM524 ou pSPM525.
Un autre aspect de l'invention concerne une souche de Streptomyces
ambofaciens transformée par un vecteur défini dans le paragraphe précédent.
Un autre aspect de l'invention concerne un polypeptide caractérisé en ce que
=
sa séquence comprend la séquence SEQ N
112. L'invention est éga1ementi'Mr4..
relative à un polypeptide caractérisé en ce que sa séquence correspond à la
séquence
traduite de la séquence codante :
- d'un gène susceptible d'être obtenu par amplification en chaîne par
polymérase (PCR) en utilisant le couple d'amorces de séquence suivante : 5'
AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138) et 5'
GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139) et comme
matrice le cosmide pSPM36 ou l'ADN total de Streptomyces ambofaciens, plus
préférentiellement il s'agit du gène de séquence codante SEQ ID N 141,
-ou d'un gène dérivé de celui-ci en raison de la dégénérescence du code
génétique.
Préferentiellement ces polypeptides sont exprimés à l'état naturel par une
bactérie du
genre Streptomyces, plus préférentiellement, ces polypeptides sont impliqués
dans la
biosynthèse des spiramycines.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
98
Un autre aspect de l'invention concerne un vecteur d'expression permettant
l'expression d'un polypeptide tel que défini dans le paragraphe précédent chez

Streptomyces ambofaciens. Des exemples de vecteurs d'expression utilisables
chez
Streptomyces ont été donnés ci-dessus. Préférentiellemnt, le vecteur
d'expression en
question est le plasmide pSPM75.
LISTE DES FIGURES
Figure 1: Structure chimique des spiramycines I, II et III.
Figure 2 : Cosmides utilisés pour le séquençage de la région.
Figure 3 : Organisation d'un groupe de gènes impliqués dans la voie de
biosynthèse des
spiramycines.
Figure 4 : Voie de biosynthèse proposée du mycarose.
Figure 5 : Voie de biosynthèse proposée du mycaminose.
Figure 6 : Voie de biosynthèse proposée de la forosamine.
Figure 7 : Ordre préférentiel d'ajout des sucres dans la molécule de
spiramycine 9t
-
intermédiaires.
. . :
Figure 8 : Voie de biosynthèse proposée du méthoxymalonyl chez S
canbofaciens.'eti.é.
voie est proposée par analogie avec la biosynthèse du méthoxymalonyl chez
Streptomyces hygroscopicus var. ascomyceticus (Wu,K. et ai., 2000).
Figure 9 : Etapes conduisant à l'inactivation d'un gène:
A) Clonage du gène cible dans un vecteur se répliquant chez E. cou i mais pas
chez Streptomyces;
B) Insertion de la cassette de résistance dans le gène cible (par clonage ou
recombinaison entre courtes séquences identiques);
C) Introduction du plasmide chez Streptomyces ambofaciens (par
transformation ou conjugaison avec E. cou) et sélection des clones ayant
intégré
la cassette puis criblage de clones ayant perdu la partie vecteur pour avoir
un
remplacement de gène;
D) Région du chromosome de la souche mutante dans laquelle le gène cible est
inactivé par remplacement de gène.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
99
Figure 10 : Etapes optionnelles suivant l'inactivation d'un gène selon la
méthode décrite
en figure 9, pouvant être conduites si une cassette excisable a été employée
pour
interrompre le gène cible :
E) Introduction dans la souche mutante du plasmide pOSV508 portant les gènes
xis et int de pSAM2 dont les produits vont permettre l'excision efficace par
recombinaison spécifique de sites entre les séquences attL et attR bordant la
cassette;
F) Obtention de clones ayant perdu la cassette excisable et sensibles à
l'antibiotique à laquelle la cassette conférait la résistance;
G) Après croissance et sporulation sur milieu solide sans antibiotique le
plasmide pOSV508 est perdu à haute fréquence. On peut ainsi obtenir des clones

sensibles au thiostrepton dans lesquels le gène cible contient une délétion en

phase. La séquence du gène cible délété peut être contrôlée par amplification
PCR et séquençage du produit PCR.
Figure 11 : Amplification de la cassette excisable dans le but de l'utiliser
pour une =
,
expérience de recombinaison homologue La teditticiué de recombinaison
homologue >
. .
;K =
grâce à de courtes séquences homologues a été déCrite par (Chaveroche et al.,
2000). Lés
39 ou 40 déoxy-nucléotides situés à l'extrémité 5' de ces oligonucléotides
comportent
une séquence correspondant à une séquence du gène à inactiver et les 20 déoxy-
nucléotides, situés le plus en 3' correspondent à la séquence d'une des
extrémités de la
cassette excisable.
Figure 12: Obtention d'une construction pour l'inactivation d'un gène cible
grâce à la
technique décrite par (Chaveroche et al., 2000).
Figure 13: Carte du plasmide pWHM3. Strepto on: origine de réplication
Streptomyces.
Figure 14: Carte du plasmide pOSV508.
Figure 15 : Exemple de structure d'une cassette excisable. Celle-ci est
constituée de la
cassette fllzyg (Blondelet-Rouault et al., 1997) bordée des sites attR et attL
(Raynal et

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
100
al., 1998), entre lesquels un événement de recombinaison permettra l'excision
de la
cassette, grâce à l'expression des gènes xis et int.
Figure 16 : Carte du plasmide pBXL1111.
Figure 17 : Carte du plasmide pBXL1112.
Figure 18: Test microbiologique de production de spiramycine, basé sur la
sensibilité
d'une souche de Micrococcus luteus à la spiramycine. La souche de Micrococcus
luteus
utilisée est une souche naturellement sensible à la spiramycine mais
résistante à la
congocidine. Les différentes souches de Streptomyces à tester ont été
cultivées en
erlenmeyers de 500 ml contenant 70 ml de milieu MP5, inoculés à une
concentration
initiale de 2.5 106 spores/mi et mises à pousser à 27 C sous agitation
orbitale de 250
rpm. Des prélèvements de moûts de fermentation ont été réalisés après 48, 72
et 96
heures de culture et centrifugés. Une dilution au dixième de ces surnageants
dans du
milieu de culture stérile est utilisée pour le test. La souche indicatrice de
Micrococcus
luteus résistante à la congocidine mais sensible à la spiramycine (Gourmelen
et al.,
1998) a été cultivée dans une boîte carrée de 12x12 cm. Des disques en papier
Whatman
AA ont été imbibés de 70 pl de la dilution au dixième de chaque surnageant et
déposés ,4
sur la surface de la boîte. Des disques imbibés d'une solution de
spiramycine'de,,,e
=
différentes concentrations (2-4-8 pg/m1 dans du milieu de culture MP5) sont
utilisés =
comme gamme étalon. Les boîtes sont incubées à 37 C pendant 24 à 48h. Si le
disque
contient de la spiramycine, celle-ci diffuse dans l'agar et inhibe la
croissance de la
souche indicatrice de Micrococcus luteus. Cette inhibition crée un halo
autour du
disque, ce halo reflétant la zone où la souche de Micrococcus luteus n'a pas
poussé. La
présence de ce halo est donc une indication de la présence de spiramycine et
permet de
determiner si la souche de S. ambofaciens en question est productrice ou non
productrice
de spiramycine. Une comparaison avec les diamètres d'inhibition obtenus pour
la
gamme étalon permet d'obtenir une indication de la quantité de spiramycine
produite par
cette souche.
Figure 19: Chromatogramme CLHP du surnageant filtré du milieu de culture de la

souche OSC2.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
101
Figure 20: Chromatogramme CLHP du surnageant filtré du milieu de culture de la

souche SPM501.
Figure 21: Chromatogramme CLHP du surnageant filtré du milieu de culture de la

souche SPM502.
Figure 22: Chromatogramme CLHP du surnageant filtré du milieu de culture de la
souche SPM507.
Figure 23: Chromatogramme CLHP du surnageant filtré du milieu =de culture de
la
souche SPM508.
Figure 24: Chromatogramme CLHP du surnageant filtré du milieu de culture de la
souche SPM509.
Figure 25 : Alignement de la protéine Orf3 (SEQ ID N 29) avec la protéine
TylB (SEQ
ID N 87) de S. fradiae réalisé grâce au programme FASTA.
Figure 26 : Alignement de la protéine MdmA de S. mycarofaciens (SEQ N 88)
avec
la protéine SrmD (SEQ ID N 16) réalisé grâce au programme FASTA.
Figure 27: Exemple de séquences des sites résiduels après excision de la
cassette
excisable. En gras est indiqué le site att26 minimum tel que défini dans
Raynal et
'
1998. La séquence de la phase 1 (att de 33 nucléotides est présentée, en SEQ
ID 1.4 :i.t;õ.%
õ
;.en.
104, la séquence de la phase 2 (att) de 34 nucléotides est présentée en SEQ ID
N 105,
la séquence de la phase 3 (att3) de 35 nucléotides est présentée en SEQ ID N
95.Figure
28: Représentation schématique du gène orf10, localisation des amorces PCR
utlisées
et construction obtenue avec chaque couple d'amorces.
Figure 29 : Construction de la cassette pac-oritT.
Figure 30 : Carte du cosmide pWED2.
Figure 31: Représentation schématique du groupe de gènes impliqués dans la
voie de
biosynthèse des spiramycines et de la localisation des trois sondes utilisées
pour isoler
les cosmides de la banque d'ADN génomique de la souche OSC2 de Streptomyces
ambofaciens chez E. colt (cf. exemple 19).Figure 32: Localisation des inserts
des
cosmides isolés de la banque d'ADN génomique de la souche OSC2 de Streptomyces

ambofaciens chez E. colt (cf. exemple 19).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
102
Nouvelle banque d'ADN cosmidique.Figure 33 : Sous clonage du fragment Pstl-
Pstl du
cosmide pSPM36 (insert du plasmide (pSPM58), sous clonage du fragment StuI-
StuI du
cosmide pSPM36 (insert du plasmide pSPM72) et sous clonage d'un fragment EcoRI-

Stul (insert du plasmide pSPM73).
Figure 34: Localisation des phases ouvertes de lecture indentifiées dans
l'insert Pstl-
PstI du plasmide pSPM58 et dans l'insert EcoRI-Stul du plasmide pSPM73.
Figure 35: Superposition des chromatogrammes CLHP du surnageant filtré du
milieu
de culture de la souche 0S49.67 réalisés à 238 et 280nm (haut) et spectres UV
des
molécules élués à 33,4 minutes et 44,8 minutes (bas). ,
Figure 36: Structure moléculaire des molécules platénolide A et platénolide B.
Figure 37: Organisation du groupe de gènes impliqués dans la voie de
biosynthèse des
spiramycines.
Figure 38: Structure moléculaire d'un intermédiaire de biosynthsèe produit par
la V V:
souche SPM507.
Figure 39: Structure d'un intermédiaire de biosynthsèse produit par une souche
de S.
ambofaciens de génotype mf6*::attg2hyg+ obtenue à partir d'une souche'
¨
surproduisant les spiramycines. L'insertion de la cassette attE2hyk-i- dans
oie* exéeçè
un effet polaire empéchant l'expression de orf5*.
Figure 40: Structure moléculaire des molécules platénolide A + mycarose et
platénolide
B + mycarose produites par la souche 0S49.67
Figure 41: Sous clonage d'un fragment Pstl-Pstl du cosmide pSPM36 (insert du
plasmide (pSPM79)), localisation des phases ouvertes de lecture indentifiées
dans
l'insert Pstl-Pstl du plasmide pSPM79 et localisation de la séquence SEQ ID N
140.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
103
La présente invention est illustrée à l'aide des exemples qui suivent, qui
doivent
être considérés comme illustratifs et non limitatifs.
En résumé, les gènes de la voie de biosynthèse des spiramycines ont été isolés
à
partir d'une banque d'ADN génomique de Streptomyces ambofaciens. Cette banque
a été
obtenue par digestion partielle de l'ADN génomique de Streptomyces
ambofaciens, par
l'enzyme de restriction BamHI. De larges fragments d'ADN, de 35 à 45 kb en
moyeiiiie,
ont été clonés dans le cosmide pWED1 (Gourmelen et al., 1998) dérivé du
cosmide
pWED15 (Wahl et al., 1987). Ces cosmides ont été introduits chez E. cou i
grâce à des
particules phagiques. La banque ainsi obtenue a été hybridée avec une sonde
(de =
séquence SEQ ID N 86) correspondant à une partie du gène tylB de S. fradiae
(Merson-
Davies & Cundliffe, 1994, numéro d'accès GenBank : U08223). Après hybridation,
un
cosmide sur les 4 s'hybridant avec la sonde a été plus particulièrement
sélectionné. Ce
cosmide nommé pOS49.1 a ensuite été digéré par Sad et un fragment de 3,3 kb
contenant la région s'hybridant avec la sonde a été sous cloné dans le vecteur
pUC19 et
séquencé. Quatre phases ouvertes de lectures ont été identifiées et l'une
d'entre elles
code une protéine (SEQ ID N 29) présentant de fortes similitudes de séquence
avec ia!,!;)
=
=
protéine TylB de S. fradiae (SEQ N 87) (cf. figure 25). Ce gène a été nommé
(SEQ ID N 28) et a été inactivé chez S. ambofaciens. Il a pu être démontré
que les
clones inactivés dans le gène orj3 ne produisent plus de spiramycines. Ceci
montre
l'implication du gène orf3 ou de gènes situés en aval dans la biosynthèse des
spiramycines.
Une fois cette confirmation obtenue, une plus grande région du cosmide pOS49.1

a été séquencée, de part et d'autre du fragment Sad précédemment étudié.
Ainsi, à partir
du cosmide pOS49.1, la séquence d'une région comportant sept phases ouvertes
de
lecture entières et deux autres incomplètes, situées de part et d'autre de ces
sept phases
ouvertes complètes, a pu être obtenue. Grâce à une recherche dans les bases de
données,
il a pu être montré que l'une des phases ouvertes de lecture incomplète
correspondait au
locus srmG (région codant une enzyme appelée polyketide synthase (PKS)).
Les
gènes correspondants ont été clonés par Burgett S. et al. en 1996 (Brevet
américain US

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
104
5,945,320). Par ailleurs, les autres phases ouvertes de lecture, les sept ORFs
entières
nommées : orfl, orf2, orf3, orf4, orf5, orf6, o'17 (SEQ ID N 23, 25, 28, 30,
34, 36, 40)
et le début de la huitième ORF nommé orf8 (séquence SEQ ID N 43) n'ont pas
été
retrouvées dans les bases de données.
Dans un deuxième temps et dans le but de cloner d'autres gènes impliqués dans
la biosynthèse des spiramycines, d'autres cosmides comportant des fragments du
génome
de S. ambofaciens dans cette même région ont été isolés. Pour cela une
nouvelle série
d'hybridations sur colonies a été effectuée en utilisant trois sondes. La
première sonde
correspond à un fragment d'ADN de 3,7kb contenant orfl, orf2 et le début de
orf3, sous
cloné à partir de pOS49.1. La deuxième sonde correspond à un fragment de 2 kb
d'ADN
contenant une partie de orf7 et une partie de oie et sous cloné à partir de
pOS49.1. Une
troisième sonde a également été utilisée. Cette dernière correspond à un
fragment d'ADN à
;
de 1.8 kb contenant le gène srmD. Le gène srmD est un gène isolé de S.
ambofacietts.
capable de conférer la résistance à la spiramycine. En effet, des travaux
antérie
avaient permis le clonage de plusieurs déterminants de résistance de S.
ambofaciens,
õ
conférant la résistance à la spiramYciiie à une souche de S. griseofuscus
(souche sensiblef=
= I. =
à la spiramycine) (Pernodet et al., 1993) (Pemodet et al., 1999). Pour
l'isolement de
gènes de résistances, une banque cosmidique de l'ADN génomique de la souche S.

ambofaciens avait été réalisée dans le cosmide pKC505 (Richardson MA et al.,
1987).
Ce pool de cosmides avait été introduit chez S. griseofuscus, naturellement
sensible à la
spiramycine. Cinq cosmides capables de conférer la résistance à l'apramycine
et la
spiramycine chez S. griseofuscus avaient ainsi été obtenus. Parmi ces 5
cosmides, un
cosmide nommé pOS44.1 possède dans son insert le gène srmD qui code une
protéine
présentant une certaine similitude avec la protéine codée par le gène mdmA de
Streptomyces mycarofaciens et impliquée dans la résistance à la midécamycine
chez cet
organisme producteur (Hara et al., 1990, numéro d'accès Genbank : A60725)
(figure
26). La troisième sonde utilisée pour localiser les gènes de biosynthèse de
spiramycine a
été un insert d'environ 1.8kb comprenant le gène srmD.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
105
Ces trois sondes ont été utilisées pour hybrider la banque d'ADN génomique
décrite ci-dessus et ont permis de choisir deux cosmides (pSPM7 et pSPM5)
susceptibles de contenir les inserts les plus longs et n'ayant pas de bandes
communes. Le
cosmide pSMP5 hybridait avec la première et la deuxième sonde, mais
n'hybridait pas
avec la troisième sonde, alors que le cosmide pSPM7 hybridait avec la
troisième sonde
seulement. Ces deux cosmides ont été séquencés en totalité par la technique du

séquençage en aveugle ( shotgun sequencing ). Les séquences des inserts de
ces deux
cosmides : pSPM7 et pSPM5 ont pu être assemblées car bien que ne se
chevauchant pas,
chacun des inserts comprenait une séquence connue à l'une de ses extrémités.
En effet;
chacun de ces inserts comportait un fragment de la séquence d'un des gènes
codant une
enzyme appelée polyketide synthase (PKS). Ces 5 gènes ont été clonés par
Burgett S.
et al. en 1996 (Brevet américain US 5,945,320) (cf. figure 2). Ainsi, il a pu
être
déterminé une séquence unique d'ADN génomique de S. ambofaciens. Une séquence
de
30943 nucléotides partant, en 5', d'un site EcoRI situé dans le premier gène
PKS et
; 15 allant jusqu'à un site B amHI en 3' est présentée en SEQ ID N 1.
Cette séquence
correspond à la région amont des gènes de la PKS (cf figure 2 et 3). Une
deuxièrné;.4;
,
région de 11171 nucléotides, partant d'un site PstI en 5' et allant jusqu'à un
site 441A
-
en 3' situé dans le cinquième gène de la PKS est présentée en SEQ D N 2. Cette
région
est la région aval des gènes de la PKS (l'aval et l'amont étant définis par
l'orientation
des 5 gènes de PKS tous orientés dans le même sens) (cf. figures 2 et 3).
Dans un troisième temps et dans le but de cloner d'autres gènes impliqués dans
la
biosynthèse des spiramycines, d'autres cosmides comportant des fragments du
génome
de S. ambofaciens dans cette même région ont été isolés (cf. exemple 18 et
19).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
106
EXEMPLE 1 : Construction d'une banque d'ADN génomique de la souche
ATCC23877 de Streptomyces ambofaciens chez E. coui
1.1. Extraction de l'ADN génomique de la souche ATCC23877 de Streptomyces
ambofaciens.
1 La souche ATCC23877 de Streptomyces ambofaciens (accessible notamment
'auprès de l'American Type Culture Collection (ATCC) (Manassas, Virginie,
USA), sous
le numéro 23877) a été cultivée en milieu YEME (Yeast Extract-Malt Extract)
((Kieser, :
T, et cd.,2000) et l'ADN génomique de cette souche a été extrait et purifié
selon leà
techniques standards de lyse et précipitation (Kieser T. et al., 2000).
1.2. Construction de la banque d'ADN génomique
L'ADN génomique de la souche ATCC23877 de Streptomyces ambofaciens tel
qu'isolé ci-dessus a été digéré partiellement par l'enzyme de restriction B
amHI de ;>i
= ..........................................................................
manière à obtenir des fragments d'ADN de taille comprise entre environ 35 et
45
.Ces fragments ont été clonés dans le cosmide pWED1 (Gourmelen et al, 1998)
digéré
,
'1.5 au préalable par BamHI. Le cosmide pWED1 est dérivé du cosmide pWE15
(Wahl; â:A
al., 1987) par délétion du fragment Hpal-Hpal de 4.1 kb contenant le module
d'expression actif chez les mammifères (Gourmelen et al., 1998). Le mélange de

ligation a ensuite été encapsidé in vitro dans des particules de phages lambda
grâce au
système Packagene Lambda DNA packaging system commercialisé par la
société
Promega en suivant les recommandations du fabriquant. Les particules phagiques
obtenues ont été utilisées pour infecter la souche SURE d'E. cou i
commercialisée par
la société Stratagene (LaJolla, Californie, USA). La séléction des clones a
été effectuée
sur milieu LB + ampicilline (50 tg/ml) puisque le cosmide pWED1 confère la
résistance
à l' ampicilline.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
107
EXEMPLE 2 : Isolement et caractérisation de gènes impliqués dans la
biosynthèse
de spiramycines chez Streptomyces ambofaciens
2.1 Hybridation sur colonie des clones d' E. cou i de la banque
génomique de
Streptomyces ambofaciens ATCC23877
d Environ 2000 clones d' E. cou i de la banque obtenue ci-dessus, ont été
transférés
sur filtre pour hybridation sur colonies. La sonde utilisée pour l'hybridation
est un
fragment Nael-Nael d'ADN (SEQ ID N 86) comportant une partie du gène tylB de
Streptomyces fradiae. Ce fragment correspond aux nucléotides 2663 à 3702 du
fragment
d'ADN décrit par Merson-Davies, L.A. & Cundliffe E. (Merson-Davies, L.A. &
Cundliffe E., 1994, numéro d'accès GenBank : U08223), dans lequel la séquence
codante du gène tylB correspond aux nucléotides 2677 à 3843.
Le fragment Nael-Nael d'ADN portant une partie du gène tylB de Streptomyces
fradiae (SEQ ID N 86) a été marquée au 32P par la technique du random
priming
(Kit commercialisé par la société Roche) et utilisé comme sonde pour
l'hybridation des
1.5 2000 clones de la banque, transférés sur filtre. Les membranes
utilisées sont .déSS
= =;:;.
membranes nylon Hybond N commercialisées par la société Amersham (Amersham
Biosciences, Orsay, France) et l'hybridation a été effectuée à 55 C dans le
tampon décrit
par Church & Gilbert (Church & Gilbert, 1984). Un lavage a été effectué en 2X
SSC à
55 C pendant 15 minutes et deux lavages successifs en 0.5X SSC ont ensuite été
effectués à 55 C, d'une durée de 15 minutes chacun. Dans ces conditions
d'hybridation
et de lavage, 4 clones parmi les 2000 hybridés présentaient un fort signal
d'hybridation.
Ces 4 clones ont été cultivés en milieu LB+ ampicilline (50 itg/ml) et les 4
cosmides
correspondants ont été extraits par lyse alcaline standard (Sambrook et al.,
1989). Il a
ensuite été vérifié que l'hybridation était bien due à un fragment d'ADN
présent dans
l'insert de ces quatre cosmides. Pour cela, les cosmides ont été digérés
indépendamment
par plusieurs enzymes (BamHI, Pstl et Sac . Les produits de digestions ont été
séparés
sur gel d'agarose, transférés sur membrane Nylon et hybridés par le fragment
Nael-Nael
d'ADN comportant une partie du gène tylB de Streptomyces fradiae (cf. ci-
dessus) dans

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
108
les mêmes conditions que ci-dessus. Les quatres cosmides ont pu être validés
et un de
ces cosmides a été plus particulièrement retenu et a été nommé pOS49.1.
2.2 Vérification de l'implication de la région identifiée et séquençage de
l'insert du
cosmide pOS49.1
Plusieirs fragments de l'insert du cosmide pOS49.1 ont été sons-clonés et
leurs
séquences ont été déterminées. Le cosmide pOS49.1 a été digéré par l'enzyme
Sacl et il
a été montré par Southern blot, dans les conditions décrites précédemment,
qu'un
fragment de 3,3 kb contient la région s'hybridant avec la sonde ty1B. Ce
fragment de 3,3
kb a été isolé par électroélution à partir d'un gel d'agarose 0.8% puis cloné
dans le
vecteur pUC19 (numéro d'accès GenBank M77789) et séquencé. Le plasmide ainsi
obtenu a été nommé pOS49.11. Quatre phases ouvertes de lecture présentant un
usage
des codons typique de Streptomyces ont pu être identifiées dans ce fragment
(deux
complètes et deux tronquées), grâce au programme FramePlot (Ishikawa J & Hotta
K.
1999). Des comparaisons de séquences grâce au programme FASTA (cf. (Pearson W.
R
& D. J. Lipman, 1988) et (Pearson W R, 1990), accessible notamment auprès du
centre
de ressources INFOBIOGEN, Evry, France) Ont permis de montrer que la
protéine?'
déduite de l'une de ces 4 phases ouvertes de lecture présente de fortes
similitudes de
séquence avec la protéine TylB (SEQ ID N 87; Numéro d'accès GenBank : U08223)
de
S. fradiae (cf. figure 25). Cette protéine a été nommée Orf3 (SEQ ID N 29).
Dans le but de tester si le gène correspondant (le gène orf3 (SEQ ID N 28))
était
impliqué dans la biosynthèse des spiramycines chez S. ambofaciens, ce gène a
été
interrompu par une cassette .s2hyg (Blondelet-Rouault M-H. et a/.,1997, numéro
d'accès
GenBank: X99315). Pour cela, le plasmide pOS49.11 a été digéré par l'enzyme
Xhol et
le fragment contenant les quatre phases ouvertes de lecture (deux complètes et
deux
tronquées, dont orf3 en entier) a été sous-cloné au niveau du site XhoI du
vecteur pBC
SK+ commercialisé par la société Stratagene (LaJolla, Califormie, USA). Le
plasmide
ainsi obtenu a été nommé pOS49.12. Dans le but d'inactiver orf3, un fragment
Pmll-
BstEll interne à orf3 a été remplacé par la cassette ..Qhyg par clonage bout
franc dans ce

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
109
dernier plasmide. Pour cela, le plasmide pOS49.12 a été digéré par les enzymes
Pmll et
BstEll dont le site unique se trouve dans la séquence codante du gène orf3.
Les
extrémités du fragment correspondant au vecteur ont été rendues bouts francs
par un
traitement par l'enzyme de Klenow (grand fragment de la DNA polymerase I). La
cassette Qhyg a été obtenue par digestion par l'enzyme BamHI du plasmide pHP45
Qhyg (Blondelet-Rouault et al., 1997, numéro d'accès GenBank : X99315). Le
fragment
correspondant à la. cassette Qhyg a été récupéré sur gel d'agarose et ses
extrémités ont
été rendues bouts francs par un traitement par l'enzyme de Klenow. Les deux
fragments
bouts francs ainsi obtenus (la cassette Qhyg et le plasmide pOS49.12) ont été
ligués et le
produit de ligation a été utilisé pour la transformation de bactéries E. cou.
Le plasmide
ainsi obtenu a été nommé pOS49.14 et contient le gène orf3 interrompu par la
cassette
Qhyg.
L'insert du plasmide pOS49.14, sous la forme d'un fragment Xhol-Xhol dont les
extrémités ont été rendues non cohésives par un traitement par l'enzyme de
Klenow, a
été cloné au niveau du site EcoRV du plasmide p0J260 (le plasmide p0J260 est
un ,
. ,= plasmide conjugatif capable de se répliquer chez E.' cou i mais
incapable de se répliquer
1.ïe
chez S. ambofaciens .(Bieiman M et al., 1992). Ce plasmide confère la
résistance 'à
l'apramycine chez E. cou i et Streptomyces). Le plasmide obtenu (insert du
plasmide
pOS49.14 cloné dans le plasmide p0J260) a été nommé pOS49.16. Ce dernier a été
transféré dans la souche ATCC23877 de S. ambofaciens par conjugaison à l'aide
de la
souche conjugative E. cou S17-1, comme décrit par Mazodier et al. (Mazodier et
al.,
1989). La souche E. cou S17-1 est dérivée de la souche E. cou i 294 (Simon et
al., 1983)
(Simon, et al., 1986). Des clones transconjugants possédant le marqueur de
résistance à
l'hygromycine porté par la cassette Qhyg et ayant perdu le marqueur de
résistance à
l'apramycine porté par le vecteur p0J260 ont pu être obtenus. Pour cela, après
conjugaison, les clones sont sélectionnés pour leur résistance à
l'hygromycine. Les
clones résistants à l'hygromycine sont ensuite repiqués respectivement sur
milieu avec
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'hygromycine (HygR) et sensibles à l'apramycine
(ApraS)
sont en principe ceux où un double événement de recombinaison s'est produit et
qui

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
110
possèdent donc le gène orf3 interrompu par la cassette Qhyg. Le remplacement
de la
copie sauvage de orf3 par la copie interrompue a été vérifié par deux
hybridations
successives. Ainsi, l'ADN total des clones obtenus, a été digéré par
différentes enzymes,
séparé sur gel d'agarose, transféré sur membrane et hybridé avec une sonde
correspondant à la cassette Qhyg (cf. ci-dessus)) pour vérifier la présence de
la cassette
dans l'ADN génomique ,des clones obtenus. Une deuxième hybridation a été
effectuée
en utilisant comme sonde l'insert XhoI-4,YhoI du plasmide pOS49.11 contenant
les quatre
phases ouvertes de lecture (deux complètes et deux tronquées, dont orf3 en
entier). La
vérification du génotype peut également être réalisée par toute méthode connue
de
l'homme du métier et notamment par PCR en utilisant les oligonucléotides
appropriés et
séquençage du produit de PCR. Un des clones orf3:: Dhyg ainsi obtenu et dont
le
génotype a été vérifié, a été choisi et a été appelé 0S49.16.
La production en spiramycine du clone 0S49.16 ainsi obtenu a été testée grâce
au
test de production décrit plus bas (cf. exemple 15). Il a ainsi pu être
démontré que cette
souche ne produit plus de spiramycine, confirmant l'implication de orf3 et/ou
des gènes
,==it=
situés en aval comme par exemple olf4 dans la biosynthèse des spiramycines.
. ..;. ..
Une fois cette confirmation obtenue, une plus grande région du cosmide pOS49.1

a été séquencée, de part et d'autre du fragment Sad précédemment étudié.
Ainsi, à partir
du cosmide pOS49.1, la séquence d'une région comportant sept phases ouvertes
de
lecture entières et deux autres incomplètes, situées de part et d'autre de ces
sept phases
ouvertes complètes, a pu être obtenue. Grâce à une recherche dans les bases de
données,
il a pu être montré que l'une des phases ouvertes de lecture incomplète
correspondait au
locus srmG (région codant une enzyme appelée polyketide synthase (PKS)).
Les
gènes correspondants ont été clonés par Burgett S. et al. en 1996 (Brevet
américain US
5,945,320). Par ailleurs, les autres phases ouvertes de lecture: les sept ORFs
entières
nommées : orfi, olf2, orf3, orf4, orf5, orf6, orf7 (SEQ ID N 23, 25, 28, 30,
34, 36 et
40) et le début de la huitième ORF nommée orf8 (la séquence entière de cette
orf est
donnée en SEQ ID N 43) n'ont pas été retrouvées dans les bases de données.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
111
EXEMPLE 3 : Isolement et caractérisation d'autres gènes impliqués dans la
biosynthèse de spiramycines chez Streptomyces ambofaciens
Dans un deuxième temps et dans le but de cloner d'autres gènes impliqués dans
la
biosynthèse des spiramycines, d'autres cosmides comportant des fragments du
génome
de S. ambofaciens dans cette même région ont été isolés. Pour cela il a été
procédé à une
nouvelle série d'hybridations sui colonies en utilisant trois sondes :
- La première sonde utilisée correspond à un fragment d'ADN BamHI-PstI de
3,7kb
contenant un fragment du gène de la PKS (Les gènes correspondant à la PKS ont
été
clonés par Burgett S. et al. en 1996 (Brevet américain US 5,945,320)), orfl,
orf2 et le
début de orf3, sous cloné à partir de pOS49.1 et allant d'un site BamHI situé
1300 paires
de bases en amont du site EcoRI définissant la position 1 de SEQ ID N 1,
jusqu'au site
PstI situé en position 2472 (SEQ ID N 1). Ce fragment BamHI-PstI a été sous
cloné à
partir de pOS49.1 dans le plasmide pBC SK+, ce qui a permis d'obtenir le
plasmide .
pOS49.28.
- La deMiiénie sonde Utilisée c'Orr' p¨ond à un fragment d'ADN PstI-BamHI
2kb contenant un fragment d'orf7 et d'orf8, sous cloné à partir de pOS49.1 et
allant d'un
site PstI situé en position 6693 de SEQ ID N 1 jusqu'au site BamHI situé en
position
8714 de SEQ ID N 1. Ce fragment PstI-BamHI a été sous cloné à partir de
pOS49.1
dans le plamside pBC SK+, ce qui a permis d'obtenir le plasmide pOS49.76.
- Une troisième sonde a également été utilisée. Cette dernière correspond à un
fragment d'ADN de 1.8kb EcoRI-HindIII contenant le gène srmD. Le gène srmD est
un
gène isolé de S. ambofaciens capable de conférer la résistance à la
spiramycine. En effet,
des travaux antérieurs avaient permis le clonage de plusieurs déterminants de
résistance
de S. ambofaciens, conférant la résistance à la spiramycine à une souche de S.
griseofuscus (souche sensible à la spiramycine) (Pernodet et al., 1993)
(Pernodet et al.,
1999). Pour isoler des gènes de résistance, une banque cosmidique de l'ADN
génomique
de la souche S. ambofaciens ATCC23877 avait été réalisée dans le cosmide
pKC505

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
112
(Richardson MA et al., 1987). Pour cela l'ADN génomique de la souche S.
ambofaciens
ATCC23877 avait été digéré partiellement par Sau3A1 de manière à obtenir des
fragments de taille comprise entre environ 30 et 40 kb. L'ADN génomique ainsi
digéré
(3pg) avait été ligué avec 1 pg du pKC505 préalablement digéré par l'enzyme
BamHI
(Pemodet et al., 1999). Le mélange de ligation avait ensuite été encapsidé in
vitro dans
des particules phagiques. Les particuiles phagiques obtenues avaient été
utilisées pour
infecter la souche d'E. cou HB101 (4ccessible notamment auprès de l'American
Type
Culture Collection (ATCC) (Manassas, Virginie, USA), sous le numéro 33694).
Environ
20 000 clones d'E. cou résistant à l'apramycine avaient été poolés et les
cosmides de ces
clones avaient été extraits. Ce pool de cosmides avait été introduit par
transformation de
protoplastes dans la souche DSM 10191 de S. griseofuscus (Cox KL & Baltz RH.
1984),
naturellement sensible à la spiramycine (Rao RN et al., 1987, cette souche est
disponible
notamment auprès de la German Collection of Microorganisms and Cell Cultures
(Deutsche Sammlung von Mikro-organismen und Zellkulturen (imbH, DSMZ),
.';
(Braunschweig, Allamagne), sous le numéro DSM 10191). Les transformants
avaient été
sélectionnés sur un milieu contenant de l'apramycine. 1300 des clones poussant
sur
" = = .. milieu contenant de l'àiiramYcine*A:14ent été transférés sur
Milieu contenant 51.tg/m1jFle:::r1
õ
spiramycine. Plusieurs clones résistants à l'apramycine avaient également
poussé Sur =
milieu contenant de la spiramycine et les cosmides de ces colonies avaient été
extraits et
utilisés pour transformer E. cou i et S. griseofuscus (Pernodet et al., 1999).
Cinq cosmides
capables de conférer la résistance à l'apramycine à E. cou i et la co-
résistance à
l'apramycine et la spiramycine chez S. griseofuscus avaient ainsi été obtenus.
Parmi ces
5 cosmides, il a été déterminé qu'un cosmide nommé pOS44.1 possède dans son
insert
un gène (SEQ ID N 15) qui code une protéine (SEQ ID N 16) présentant une
certaine
similitude avec une protéine codée par le gène mdmA de Streptomyces
mycarofaciens
(SEQ ID N 88), ce gène a été nommé srmD (cf. alignement présenté en figure 26
réalisé
grâce au programme FASTA (cf.. (Pearson W. R & D. J. Lipman, 1988) et (Pearson
W.
R., 1990), accessibles notamment auprès du centre de ressources INFOBIOGEN,
Evry,
France).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
113
Pour isoler le déterminant de résistance contenu dans le plasmide pOS44.1,
celui-
ci a été digéré partiellement par l'enzyme de restriction Sau3A1 de manière à
obtenir des
fragments de taille d'environ 1,5 à 3 kb, ces fragments ont été ligués dans le
vecteur
pIJ486 linéarisé par l'enzyme BamHI (Ward et al., 1986). Un plasmide a été
sélectionné
pour sa capacité à conférer la résistance à la spiramycine chez la souche DSM
10191 de
S. griseofuscus (Rao RN et al., 1987), naturellement sensible à la spiramycine
(cf. ci-
dessus). Pour cela, le pool de plasmides correspondant aux fragment Sau3A1 de
pOS44.1
ligués dans le vecteur pI.1486 (cf. ci-dessus), a été introduit par
transformation de
protoplastes dans la souche DSM 10191 et les transformants ont été
sélectionnés pour
leur résistance au thiostrepton (due au gène tsr porté par pli-486). Les
clones poussant
sur milieu contenant du thiostrepton ont été transférés sur milieu contenant
de la
spiramycine. Plusieurs clones résistants au thiostrepton ont également poussé
sur milieu
contenant de la spiramycine et les plasmides de ces colonies ont été extraits.
Un
plasmide conférant la résistance et contenant un insert d'environ 1.8kb a été
sélectionné
et nommé pOS44.2. Cet insert de 1.8kb peut être sorti facilement grâce à un
site Hinall .
et un site EcoRI présents dans le vecteur de part et d'autre de l'insert. Cet
insert de 1.8kb
gène résistance"1
HindlII-EcoRI a été séqüenCê e d e
qu'il renferme a été nommé snnD.,
. ,
Ce fragment contenant le gène srmD a ainsi pu être facilement sous-cloné dans
le
vecteur pUC19 (numéro d'accès GenBank M77789) ouvert par EcoRI-HindIII, le
plasmide obtenu a été nommé pOS44.4. L'insert de 1.8kb HindIII-EcoRI,
contenant le
gène srmD, de ce plasmide a été utilisé comme sonde pour localiser les gènes
de
biosynthèse de spiramycine (cf. ci-dessous).
Un échantillon d'une souche Escherichia Cou DH5a contenant le plasmide
pOS44.4 a été déposé auprès de la Collection Nationale de Cultures de
Microorganismes
(CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris Cedex 15, France,
le 10
juillet 2002 sous le numéro d'enregistrement 1-2918.
Environ 2000 clones de la banque, obtenus ci-dessus (cf. exemple 1), ont été
transférés sur filtre pour hybridation sur colonies selon les techniques
classiques
(Sambrook et al., 1989).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
114
Les trois sondes décrites ci-dessus ont été marquées au 32P par la technique
du
random priming (Kit commercialisé par Roche) et utilisées pour l'hybridation
des
2000 clones de la banque, transférés sur filtre. L'hybridation a été effectuée
à 65 C dans
le tampon décrit par Church & Gilbert (Church & Gilbert, 1984). Un lavage a
été
effectué en 2X SSC à 65 C pendant 15 minutes et deux lavages successifs ont
ensuite
été effectués en 0.5X SSC à 65 C, d'une duréç de 15 minutes chacun. Dans ces
conditions d'hybridation et de lavage, 16 clones parmi les 2000 hybridés
présentaient un
fort signal d'hybridation avec au moins une des sondes. Cependant, aucun
cosmide
n'hybridait avec les trois sondes. Les 16 cosmides ont été extraits et digérés
par
l'enzyme de restriction BamHI. La comparaison des profils de restriction de
ces
différents cosmides entre eux, a conduit à choisir deux cosmides susceptibles
de contenir
les inserts les plus longs de la région et n'ayant pas de bandes communes.
Ainsi deux
cosmides l'un nommé pSPM5 et l'autre pSPM7 ont été choisis. Le cosmide pSPM5
hybridait avec les sondes orfl à orf4 et la sonde orf8, mais n'hybridait pas
avec la sonde
srmD. pSPM7 hybridait seulement avec la sonde srmD et pas avec les deux autres
sondes.
=
,
Ces deux cosmides ont été séquencés en totalité par la technique du séquençage
én:
aveugle ( shotgun sequencing ). Les séquences des inserts de ces deux
cosmides:
pSPM7 et pSPM5 ont pu être assemblées car bien que ne se chevauchant pas,
chacun
des inserts comprenait une séquence connue à l'une de ses extrémités. En
effet, chacun
de ces inserts comportait un fragment de la séquence d'un des gènes codant une
enzyme
appelée polyketide synthase (PKS). Ces 5 gènes ont été clonés par Burgett
S. et al.
en 1996 (Brevet américain US 5,945,320) (cf. figure 2). Ainsi, il a pu être
déterminé une
séquence unique d'ADN génomique de S. ambofaciens. Une séquence de 30943
nucléotides partant en 5' d'un site EcoRI situé dans le premier gène PKS et
allant
jusqu'à un site BamHI en 3' est présentée en SEQ ID N 1. Cette séquence
correspond à
la région amont des gènes de la PKS (cf. figure 2 et 3). Une deuxième région
de 11171
nucléotides, partant d'un site PstI en 5' et allant jusqu'à un site Ncol en 3'
situé dans le
cinquième gène de la PKS est présentée en SEQ ID N 2. Cette deuxième région
est la

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
115
région aval des gènes de la PKS (l'aval et l'amont étant défini par
l'orientation des 5
gènes de PKS tous orientés dans le même sens) (cf. figure 2 et 3).
EXEMPLE 4 : Analyse des séquences nucléotidiques, détermination des phases
ouvertes de lecture et caractérisation des gènes impliqués dans la biosynthèse
des
spiramycines.
Les séquences obtenues ont été analysées grâc.e au programme FramePlot
(Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier, parmi les phases
ouvertes de
lecture, les phases ouvertes de lecture présentant un usage des codons typique
de
Streptomyces. Cette analyse a permis de déterminer que cette région comporte
35 ORFs
localisées de part et d'autre de cinq gènes codant l'enzyme polyketide
synthase
(PKS). Respectivement 10 et 25 ORFs ont été identifiées en aval et en amont de
ces
gènes (l'aval et l'amont étant défini par l'orientation des 5 gènes de PKS
tous orientés
dans le même sens) (cf. figure 3). Ainsi, les 25 phases ouvertes de lecture de
ce type, ,
occupant une région d'environ 31 kb (SEQ ID N 1 et figure 3) ont été
identifiées en ln.
=
. 15 amont des 5 gènes codant la PKS et 10 occupant une région d'environ
11,1 kb (SEQ
. .
,
N 2 et figure 3), ont été identifiées en aval des' gènes de la PKS. Les gènes
de la iéiidn',4
=
, :
amont ont été nommés mil, orfl, or13, orf4, orf5, orf6, orf7, orf8, orf9c,
orf10, orfl lc,
orf12, orfl3c, o7114, orfl5c, orf16, od17, orf18, orf19, orf20, orf21c,
orf22c, orf23c,
ot:124c et orf25c (SEQ ID N 23, 25, 28, 30, 34, 36, 40, 43, 45, 47, 49, 53,
60, 62, 64,
66, 68, 70, 72, 74, 76, 78, 80, 82 et 84). Les gènes de la région aval ont été
nommés
orfl *c, orf2*c, orf3*c, orf4*c, orf5*, orf6*, orf7*c, orf8*, orf9*, orf10*
(SEQ ID N 3,
5, 7, 9, 11, 13, 15, 17, 19 et 21). Le c ajouté dans le nom du gène
signifiant pour
l'ORF en question que la séquence codante est dans l'orientation inverse (le
brin codant
est donc le brin complémentaire de la séquence donnée en SEQ ID N 1 ou SEQ ID
N 2
pour ces gènes) (cf. figure 3).
Les séquences protéiques déduites de ces phases ouvertes de lecture ont été
comparées avec celles présentes dans différentes bases de données grâce à
différents
programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997), CD-search,
COGs
(Cluster of Orthologous Groups) (ces trois programmes sont accessibles
notamment

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
116
auprès du National Center for Biotechnology Information (NCBI) (Bethesda,
Maryland,
USA)), FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990),
BEAUTY (Worley K. C.. et al., 1995)), (ces deux programmes sont accessibles
notamment auprès du centre de ressources INFOBIOGEN, Evry, France). Ces
comparaisons ont permis de formuler des hypothèses sur la fonction des
produits de ces
gènes et d'identifier ceux susceptibles d'être impliqués dans la biosynthèse
de
spiramycine.
EXEMPLE 5 : Inactivation de gène : principe de la construction d'une souche de

Streptomyces ambofaciens interrompue
Les méthodes utilisées consistent à effectuer un remplacement de gène. Le gène
cible
à interrompre est remplacé par une copie de ce gène interrompue par une
cassette
conférant la résistance à un antibiotique (par exemple l'apramycine ou
l'hygromycine),
comme l'illustre la figure 9. Les cassettes utilisées sont bordées de part et
d'autre par des
codons de terminaison de la traduction dans toutes les phases de lecture et
par des
terminateurs de transcription actifs chez Streptomyces.
,
. ,
= L'insertion de la cassette dâriile gérte.cible' peut s'iccornpagner ou
non d'une délétiotil'''
dans ce gène cible. La taille des régions flanquant la cassette peut aller de
quelques
centaines à plusieurs milliers de paires de bases.
Les constructions nécessaires à l'inactivation du gène par la cassette ont été
obtenues
chez E. cou, organisme de référence pour l'obtention de constructions d'ADN
recombinant. Le gène interrompu a été obtenu dans un plasmide se répliquant
chez E.
cou i mais ne pouvant pas se répliquer chez Streptomyces.
Les constructions ont ensuite été sous-clonées dans des vecteurs pour
permettre la
transformation et l'inactivation du gène voulu chez S. ambofaciens. Pour cela,
deux
plasmides ont été utilisés :
- p0J260 (Bierman M. et al., 1992) (cf. exemple 2) qui confère la résistance à

l'apramycine chez E. cou i et Streptomyces et qui a été employé quand le gène
cible
a été interrompu par une cassette conférant la résistance à l'hygromycine.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
117
-
pOSK1205 (4726pb). Ce plasmide dérive du plasmide pBK-CMV (commercialisé
par la société Stratagene (LaJolla, Californie, USA)) dans lequel un fragment
Avril contenant la séquence codant la résistance à la Néomycine/Kanamycine a
été remplacé par une séquence codant la résistance à l'hygromycine, tout en
conservant le promoteur P SV40. Pour cela, le plasmide pHP45-Qhyg (Blondelet-
Rouault et al., 1997) a été digéré par les enzymes Noti et Pflml et le
fragment
conférant la résistance à l'hygromycine a été sous-cloné au niveau du site
Avril du
vecteur pBK-CMV après que toutes les extrémités aient été rendues bout franc
par traitement à l'enzyme de Klenow. Dans pOSK1205, la cassette qui confère la
résistance à l'hygromycine est précédée du promoteur pSV40. Ce plasmide
confère la résistance à l'hygromycine chez E. cou i et Streptomyces et a été
employé quand le gène cible a été interrompu par une cassette conférant la
résistance à l'apramycine.
Les cassettes ont été introduites dans le gène cible soit par clonage en
utilisant des
sites de restriction présents dans le gène cible, soit par recombinaison entre
de courtesu
sequences identiques comme décrit par exemple par Ceayeréche et al (Chaveroche
MK:H;
:
et al., 2000).
Le plasmide portant le gène interrompu par la cassette peut ensuite être
introduit chez
Streptomyces ambofaciens, par exemple par conjugaison entre E. cou i et
Streptomyces
(Mazodier P, et al., 1989). Cette technique a été utilisée dans le cas où le
vecteur de base
est le vecteur p0J260. Une deuxième technique peut être utilisée : la
technique de la
transformation de protoplastes après dénaturation par traitement alcalin de
l'ADN
(Kieser, T et al., 2000), pour augmenter la fréquence de recombinaison comme
décrit
par exemple par Oh & Chater (Oh & Chater, 1997). Cette technique a été
utilisée dans le
cas où le vecteur de base est p0J260 ou pOSK1205 (cf. ci-dessous). Les
transformants
sont ensuite sélectionnés avec l'antibiotique correspondant à la cassette
présente dans le
gène cible (cf. figure 9, antibiotique B). On sélectionne ainsi un mélange de
clones
parmi lesquels il y a eu intégration par un seul ou par deux événements de
recombinaison. Dans un deuxième temps on recherche les clones sensibles à

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
118
l'antibiotique pour lequel le gène de résistance est présent dans le vecteur
(hors de la
cassette de recombinaison) (cf. figure 9, antibiotique A). On peut ainsi
sélectionner les
clones pour lesquels il y a eu en principe deux événements de recombinaison
aboutissant
au remplacement du gène sauvage par la copie interrompue par la cassette. Ces
étapes
sont schématisées figure 9.
Plusieurs cassettes peuvent être utilisées pour l'interruption des gènes
cibles. On peut
par exemple utiliser la cassette Qhyg qui confère la résistance à
l'hYgromycine
(Blondelet-Rouault et al., 1997, numéro d'accès GenBank : X99315).
EXEMPLE 6: Construction d'une souche de Streptomyces ambofaciens
interrompue en phase dans le gène orf3
=
Le gène oif 3 avait été interrompu par la cassette Qhyg (cf. exemple 2.2) et
il a pu
être démontré qu'une souche orf3:: ..<2.hyg ne produit plus de spiramycine,
confirmant
. .
l'implication d'un ou plusieurs gènes de la région clonée dans la biosynthèse
des

spiramycines (CE exemple 2.2). Au vu de leur
une C.Otrana'cription des Édeeei
1 à 7 est probable (cf. figure 3) et le phénotype observé (non producteur de
spiramycines) peut être dû à l'inactivation d'un ou plusieurs des gènes co-
transcrits avec
orf3. Pour confirmer l'implication de orf3 dans la biosynthèse de
spiramycines, une
nouvelle inactivation du gène orf3 a été effectuée, cette dernière étant
réalisée en phase.
Pour cela, un fragment DraIII interne à orf3 de 504 paires de bases a été
délété. Un
fragment d'ADN obtenu à partir de pOS49.1, allant du site EcoRI situé en
position 1
(SEQ ID N 1) jusqu'au site Sad situé en position 5274 (SEQ ID N 1) et qui
comporte
une délétion entre les deux sites DraIII aux positions 2563 et 3067 (504
nucléotides
retirés) a été cloné dans le plasmide p0J260 (Bierman M. et al., 1992). Le
plasmide
ainsi obtenu a été nommé pOS49.67.
L'insert de pOS49.67 est donc constitué par un fragment d'ADN de S.
ambofaciens
contenant les gènes orfl, orf2, orf3 avec la délétion en phase, orf4 et une
partie de orf5.
Le vecteur dans lequel cet insert a été sous-cloné est p0J260, le plasmide
pOS49.67

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
119
confère donc la résistance à l'apramycine et a été introduit par
transformation de
protoplastes dans la souche 0S49.16 (cf. exemple 2). La souche 0S49.16 étant
résistante
à l'hygromycine, des transformants hygR et apraR ont été obtenus. Après deux
passages
de tels clones sur milieu non , sélectif, les clones sensibles à l'apramycine
et à
l'hygromycine (apraS et hygS) ont été recherchés. Dans certains de ces clones,
on
s'attend en effet à ce qu'un événement de recombinaison entre séquences
homologues
conduise au remplacement de la copie de orf3 interrompue par la cassette
.(2hyg (contenu
dans le génome de la souche 0S49.16) par la copie de orf3 avec la délétion en
phase
présente sur le vecteur. Les clones résultant de cette recombinaison sont
attendus comme.
apraS et hygS après l'élimination des séquences du vecteur. Le génotype des
souches
ainsi obtenues peut être vérifié par hybridation ou par PCR et séquençage du
produit de
PCR (pour vérifier que seule une copie de orf3 délétée en phase est présente
dans le
génome des clones obtenus). Des clones n'ayant que la copie de orf3 avec une
délétion
en phase ont ainsi été obtenus et leur génotype a été vérifié. Un clone
présentant les,,
, 15 caractéristiques recherchées a été plus particulièrement sélectionné et a
été nominé
0S4967
4,11
';' =
= ,
'
Un échantillon de la souché 0É49.67 a été déposé auprès de la Collection
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du
Docteur
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numéro
d'enregistrement
1-2916.
EXEMPLE 7: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène orf8
Pour réaliser l'inactivation du gène orf8, une construction dans laquelle la
cassette
Ohyg a été introduite dans la séquence codante de ore a été obtenue. Pour
cela, le
plasmide pOS49.88 a tout d'abord été construit. Le plasmide pOS49.88 est
dérivé du
plasmide pUC19 (numéro d'accès GenBank M77789) par insertion d'un fragment de
3.7
kb (fragment PstI-EcoRI obtenu à partir du cosmide pSPM5), contenant la fin de
orfi,

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
120
orf8 et le début de orf9, cloné dans les sites PstI-EcoRI de pUC19. La
cassette flhyg
(sous forme d'un fragment BamHI, rendu bout franc par traitement à l'enzyme de

Klenow) a été clonée au niveau du site unique Sal1 de pOS49.88 situé dans orf8
après
que toutes les extrémités aient été rendues bout franc par traitement à
l'enzyme de
Klenow.
Le clonage étant bout franc, deux types de plasmides ont été obtenus selon le'
sens
d'insertion de la cassette : pOS49.106 dans lequel les gènes hyg et orf8 sont
dans la
même orientation et pOS49.120 dans lequel les gènes hyg et orf8 sont dans des
orientations opposées. L'insert du plasmide pOS49.106 a ensuite été sous-cloné
dans le
plasmide p0J260 pour donner pOS49.107. Pour cela, le plasmide pOS49.106 a été
digéré par l'enzyme Asp718I et les extrémités ont été rendues bout franc par
traitement à
= l'enzyme de Klenow, ce produit de digestion a été redigéré par l'enzyme
PstI et le
fragment contenant le gène orf8 dans lequel la cassette f2hyg a été insérée, a
été cloné .!!
dans le vecteur p0J260 (cf. ci dessus). Pour cela, le vecteur p0J260 a été
digéré par les
, 15 enzymes EcoRV et PstI et utilisé pour la ligation. Cette manipulation
permet donc9.kio
. . . = d'obtenir une ligation orientée puisque chacun des deux
fragments est bout franc
côté et PstI de l'autre. Le plasmide obtenu a été nommé pOS49.107.
Le plasmide pOS49.107 a été introduit dans la souche ATCC23877 de S.
ambofaciens par transformation de protoplastes (Kieser, T et al., 2000). Après
transformation des protoplastes, les clones sont sélectionnés pour leur
résistance à
l'hygromycine. Les clones résistants à l'hygromycine sont ensuite repiqués
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec

apramycine (antibiotique A) (cf. figure 9). Les clones résistants à
l'hygromycine (HygR)
et sensibles à l'apramycine (ApraS) sont en principe ceux où un double
événement de
crossing over s'est produit et qui possèdent le gène orf8 interrompu par la
cassette Ohyg.
Le remplacement de la copie sauvage de orf8 par la copie interrompue par la
cassette
Qhyg a été vérifié par Southern Blot. Ainsi, l'ADN total des clones obtenus, a
été digéré
par plusieurs enzymes, séparé sur gel d'agarose, transféré sur membrane et
hybridé avec

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
121
une sonde correspondant à la cassette Qhyg pour vérifier la présence de la
cassette dans
l'ADN génomique des clones obtenus. Une deuxième hybridation a été effectuée
en
utilisant comme sonde l'insert PstI-EcoRI contenant la fin de orf7, orf8 et le
début de
orf9 d'une taille d'environ 3,7 kb du plasmide pOS49.88. La vérification du
génotype
peut être réalisée par toute méthode connue de l'homme du métier et notamment
par
PCR en utilisant les oligonucléotides appropriés et séqtfpnçage du produit de
PCR.
Un clone orf8::Qhyg a été choisi et nommé 0S49.107. Un échantillon de la
souche
0S49.107 a été déposé auprès de la Collection Nationale de Cultures de*A
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris
Cedex =
15, France, le 10 juillet 2002 sous le numéro d'enregistrement 1-2917.
EXEMPLE 8: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène orf10
.
,
õ
Un fragment d'ADN de te:g.,,int-ème au gène orf10 a été obtenu par
PCII!en;',:i';
;
" 15 utilisant comme matrice, l'ADN génomique de S. ambofaciens et les
amorces suivantes : ¨
SRMR1 : 5' CTGCCAGTCCTCTCCCAGCAGTACG 3' (SEQ ID N 89)
SRMR2 : 5' TGAAGCTGGACGTCTCCTACGTCGG 3' (SEQ ID N 90)
Ce fragment d'ADN issu de la PCR a été cloné dans le vecteur pCR2.1
commercialisé
par la société Invitrogen (Carlsbad, Californie, USA). Le plasmide ainsi
obtenu a été
nommé pOS49.32. La cassette Qhyg (sous forme d'un fragment BamHI, cf. ci-
dessus) a
été clonée au niveau du site unique BstEII interne au fragment du gène orf10,
après que
toutes les extrémités aient été rendues bout franc par traitement à l'enzyme
de Klenow.
Le clonage étant bout franc, deux types de plasmides ont été obtenus selon le
sens
d'insertion de la cassette : pOS49.43 dans lequel les gènes hyg et orf10 sont
dans la
même orientation et pOS49.44 dans lequel les gènes hyg et orf10 sont dans des

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
122
orientations opposées. L'insert du plasmide pOS49.43 a été transféré (sous
forme d'un
fragment Asp7181-Xbal dont les extrémités ont été rendues bout franc par
traitement à
l'enzyme de Klenow) dans le site EcoRV du plasmide p0J260 ce qui a permis
d'obtenir
le plasmide pOS49.50. Le plasmide pOS49.50 contenant le fragment du gène orf10
interrompu par la cassette Qhyg a été introduit dans la souche ATCC23877 de
Streptomyces ambofaciens. Après transformation, les clones;sont sélectionnés
pour leur
résistance à l'hygromycine. Les clones résistants à l'hygromycine sont ensuite
repiqués
respectivement sur milieu avec hygromycine (antibiotique B) et sur milieu avec

apramycine (antibiotique A) (cf. figure 9). Les clones résistants à
l'hygromycine (HygR)
et sensibles à l'apramycine (ApraS) sont en principe ceux où un double
événement de
crossing over s'est produit et qui possèdent le gène otf10 interrompu par la
cassette
Qhyg. Des clones qui possédaient le marqueur de résistance à l'hygromycine
porté par la
cassette et qui avaient perdu le marqueur de résistance à l'apramycine porté
par le
vecteur p0J260 ont ainsi été obtenus. L'événement de remplacement de la copie
sauvage
=
de orf10 par la copie interrompue orf10::Qhyg a été vérifié par Southern Blot.
Ainsi,
l'ADN génomique total des clones obtenus, a été digéré par plusieurs enzymes,
séparé
-.; , , = = , .
sur gel d'agarose, transféré sur Membrane et hybridé avec une sonde
correspondant à là
cassette Qhyg pour vérifier la présence de la cassette dans l'ADN génomique
des clones
obtenus. Une deuxième hybridation a été effectuée en utilisant comme sonde le
produit
PCR de 1,5 kb interne au gène orf10 (cf. ci-dessus).
Un clone présentant les caractéristiques attendues (orf10::Dhyg) a été plus
particulièrement sélectionné et nommé 0S49.50. Il a pu en effet être vérifié
grâce aux
deux hybridations que la cassette Qhyg était bien présente dans le génome de
ce clone et
que l'on obtient bien le profil de digestion attendu dans le cas d'un
remplacement, à la
suite d'un double événement de recombinaison, du gène sauvage par la copie
interrompue par la cassette Qhyg dans le génome de ce clone. La vérification
du
génotype peut également être réalisée par toute méthode connue de l'homme du
métier
et notamment par PCR en utilisant les oligonucléotides appropriés et
séquençage du
produit de PCR.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
123
EXEMPLE 9: Inactivation de gènes : principe de la construction d'une souche de

Streptomyces ambofaciens interrompue selon la technique des cassettes
excisables (cf. Figure 9 et 10)
Un deuxième type de cassettes peut être utilisé pour l'inactivation de gènes :
les
cassettes dites cassettes excisables . Ces cassettes présentent l'avantage
de pouvoir
être excisées chez Streptomyces par un événement de recombinaison spécifique
de site
après avoir été introduites dans le génome de S. ambofaciens. Le but est
d'inactiver
certains gènes dans des souches de Streptomyces sans laisser dans la souche
finale de
marqueurs de sélection ou de grandes séquences d'ADN n'appartenant pas à la
souche.
Après excision il subsiste uniquement une courte séquence d'environ une
trentaine de
paires de bases (appelé site cicatriciel ) dans le génome de la souche (cf.
figure 10).
La mise en oeuvre de ce système consiste, dans un premier temps, au
remplacement
,
de la copie ,sauvage du gène ciblé (grâce" à deux événements de recombinaison
= homologue, cf. figure 9) par une construction dans laquelle une cassette
excisable a été
insérée dans ce gène cible. L'insertion de cette cassette est accompagnée
d'une délétion
dans le gène cible (cf. figure 9). Dans un deuxième temps, l'excision de la
cassette
excisable du génome de la souche est provoquée. La cassette excisable
fonctionne grâce
à un système de recombinaison spécifique de site et a pour avantage de
permettre
l'obtention de mutants de Streptomyces ne portant finalement pas de gène de
résistance.
On s'affranchit également d'éventuels effets polaires sur l'expression des
gènes situés en
aval du ou des gènes inactivés (cf. figure 10).
L'emploi de cassettes excisables a été décrit et utilisé chez de nombreux
organismes
dont les cellules de mammifère, de levures et chez E. cou (Bayley et al., 1992
; Brunelli
et Pall, 1993 ; Camilli et al., 1994 ; Dale et Ow, 1991 ; Russell et al.,
1992; Lakso et al.,
1992). Ces cassettes excisables utilisent toutes la recombinase spécifique de
site Cre
agissant sur les sites lox. Ce système de recombinaison provient du
bactériophage Pi.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
124
Pour la construction d'un système de type cassette excisable chez
Streptomyces, il
a été tiré partie du système de recombinaison spécifique de site décrit pour
l'élément
génétique mobile pSAM2 de Streptomyces ambofaciens (Boccard et al., 1989a et
b). Le
système mis en place consiste dans un premier temps à construire un vecteur
recombinant comportant le gène à interrompre dans lequel est insérée une
cassette
excisable. L'insertion dans le gène cible de la cassette excisable
s'accompagne d'une
délétion dans le gène cible. Elle peut être réalisée par clonage en utilisant
des sites de
restriction présents dans le gène cible ou par recombinaison entre de courtes
séquences
identiques comme décrit par exemple par Chaveroche et al (Chaveroche MK et
al.;
2000). La cassette excisable peut être construite en utilisant par exemple la
cassette
Qhyg (Blondelet Rouault et a/.,1997). Cette cassette a été bordée par des
séquences attR
et attL qui flanquent normalement la copie intégrée de pSAM2 (cf. figure 15).
Les
séquences attL et attR contiennent tous les sites nécessaires à la
recombinaison site-
spécifique permettant l'excision de pSAM2 ou de tout fragment d'ADN situé
entre ces
deux régions (Sezonov et al., 1997, Raynal et a/.,1998). La construction d'une
telle
. cassette n'est évidemment pas limitée à l'utilisation d'une cassette
Qhyg, mais d'autre'
; =
cassettes de résistances jaelivént servir de base à là cénstruction de cette
cassettte (Pà.ea
e ;!µ
exemple la cassette Qaac ou Qvph (Blondelet Rouault et a/.,1997)).
Après l'obtention de cette construction, la souche de Streptomyces est
transformée
avec le plasmide recombinant. Les transformants sont ensuite sélectionnés avec

l'antibiotique correspondant à la cassette présente dans le gène cible (cf.
figure 9,
antibiotique B, il s'agit par exemple d'une sélection par Phygromycine si la
cassette
excisable dérive de la cassette Qhyg). On sélectionne ainsi un mélange de
clones parmi
lesquels il y a eu intégration par un seul ou par deux événements de
recombinaison.
Dans un deuxième temps on recherche les clones sensibles à l'antibiotique pour
lesquels
le gène de résistance est présent dans le vecteur (hors de la cassette de
recombinaison)
(cf. figure 9, antibiotique A). On peut ainsi sélectionner les clones pour
lesquel il y a eu
en principe deux événements de recombinaison aboutissant au remplacement du
gène
sauvage par la copie interrompue par la cassette. Ces étapes sont schématisées
figure 9,
le génotype des clones ainsi obtenus est vérifié par Southern blot et une
souche
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
125
présentant les caractéristiques voulues (le remplacement du gène sauvage par
la copie
interrompue par la cassette excisable) est sélectionnée.
Dans un deuxième temps, la souche selectionnée ci-dessus, est transformée par
un
plasmide permettant l'expression des gènes xis et int qui sont tous deux
nécessaires à la
recombinaison spécifique de site entre les sites attR et attL. Cette
recombinaison
entraîne lé départ de la cassette excisable du génome de la souche, grâce à un
événement
de recombinaison (cf. figure 10) (Raynal et al., 1998). Il est intéressant de
choisir le
vecteur portant les gènes xis et int parmi les vecteurs relativement instables
chei>.
Streptomyces (par exemple dérivé du vecteur Streptomyces pWHM3, (Vara et al.,
1989)), ceci permet d'obtenir une souche ayant perdu ce dernier vecteur après
quelques
cycles de sporulation en absence de pression de sélection.
Pour exciser la cassette, on peut par exemple utiliser le plasmide pOSV508
(cf. figure.
14) qui est introduit par transformation de protoplastes dans la souche de S.
ambofaciens,
,
'
contenant un gène interrompu par la cassette excisable. Le plasmide pOSV508
est dérivé
õ
le=;Y='. 15 du plasmide pWHM3 (Vara J et al ,1989) (cf, figure 13) dans lequel
ont été ajoutes IOS
=
gènes xis et int de pSAM2 (Boccard F. et al., 198.9b) placés sous le contrôle'
diïç'P'l
promoteur ptrc (Amann, E. et al., 1988). Les gènes xis et int placés sous le
contrôle du
promoteur pire ont été sous clonés dans le plasmide pWHM3 à partir du plasmide

pOSint3 (Raynal et al., 1998) (cf. figure 14). L'introduction dans la souche
mutante du
plasmide pOSV508 portant les gènes xis et int de pSAM2 va permettre l'excision
efficace par recombinaison spécifique de site de la cassette excisable entre
les sites attL
et attR flanquant cette cassette (Raynal A. et al., 1998) (figure 10). Parmi
les
transformants, sélectionnés pour leur résistance au thiostrepton due au gène
tsr porté par
pOSV508, on choisit ceux devenus sensibles à l'antibiotique auquel la présence
de la
cassette confère la résistance (cf. figure 10). L'excision est efficace et il
a été observé
que plus de 90% des transformants sont de ce type. Après un ou plusieurs
cycles de
croissance et sporulation sur un milieu solide dépourvu de thiostrepton, on
obtient des
clones ayant perdu le plasmide pOSV508. Ces clones sont repérables par leur
sensibilité

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
126
au thiostrepton. La séquence du gène cible délété peut être vérifiée par PCR
et
séquençage du produit PCR.
Finalement, la souche résultante porte au niveau du gène inactivé (délétion
interne par
exemple) un site att cicatriciel correspondant au site attB minimal
(Raynal et al.,
1998), issu de la recombinaison entre les sites attR et attL. Ce site attB
minimal qui
subsiste est semblable à celui présent naturellement dans les souches de
Streptomyces
ambofaciens, Streptomyces pristinaespiralis et Streptomyces lividans (Sezonov
et al.,
1997).
Le gène que l'on veut inactiver peut être cotranscrit avec d'autres gènes
situés en
aval. Pour éviter que l'inactivation d'un des gènes ait un effet polaire sur
l'expression
des gènes en aval dans l'opéron, il est important d'obtenir une délétion en
phase après
excision de la cassette. Le système des cassettes excisables tel que décrit ci-
dessus
permet de répondre à une telle exigence. L'homme du métier pourra, en effet,
aisément
construire trois cassettes excisables distinctes, celles-ci laissant après
excision une
15,
séquence de 33, 34 ou 35 nucléotides respectivement, sans codon stop quelle
que soit la
õ
:= '=
phase de lecture. Connaissant la 'séquence du gène cible et la taille de la
délétion
associée à l'insertion de la cassette, il est possible de choisir entre ces
trois cassettes
excisables de façon à ce que l'excision conduise à une délétion en phase. Sur
les 33, 34
ou 35 nucléotides rajoutés, 26 correspondent à la séquence attB minimale (cf.
figure 27).
Dans le cas de la présente demande, deux cassettes excisables ont été
utilisées. Ces
deux cassettes sont les suivantes : attlQhyg+ (SEQ ID N 91) et att3Daac- (SEQ
ID N
92), ces cassettes laissent respectivement 33 et 35 nucléotides après
excision. Elles
comportent respectivement la cassette Qhyg ou la cassette Qaac, les signes +
et ¨
correspondant à l'orientation de la cassette de résistance. Ces deux cassettes
ont été
construites et clonées au niveau du site EcoRV du vecteur pBC SK+ dont le site
HindlIl
a été suprimé au préalable. Les plasmides obtenus ont été nommés patt1f1hyg+
et
patt3naac- respectivement. Les cassettes excisables peuvent être facilement
sorties par
une digestion du plasmide par EcoRV.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
127
EXEMPLE 10: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène orfl
L'inactivation du gène orf2 a été réalisée grâce à la technique des cassettes
excisables (cf. ci-dessus). La souche de départ utilisée est la souche
Streptomyces
ambofaciens OSC2 qui dérive de la souche ATCC23877. Cependant, la souche OSC2
diffère de la souche ATCC23877 en ce qu'elle a perdu l'élément génétique
mobile
pSAM2 (Boccard et al., 1989a et b). Cet élément mobile peut être perdu de
manière
spontanée au cours de la protoplastisation (action du lysozyme pour digérer la
paroi
bactérienne et fragmenter le mycélium (Kieser et al., 2000)) et de la
régénération des
protoplastes de la souche ATCC23877. Pour sélectionner les clones ayant perdu
l'élément pSAM2, il a été mis en place un crible, basé sur la répression du
gène pra par
le répresseur de transcription KorSA (Sezonov et al., 1995) (Sezonov G. et
al., 2000).
Pour cela, un fragment d'ADN contenant le promoteur du gène pra placé en amont
du .::;
gène aph (conférant la résistance à la kanamycine et dépourvu de son propre
promoteur) er,
a été cloné dans le vecteur instable pWHM3Hyg, ce dernier dérivant du
plasmide,i'
Pe-= pWHM3 (Vara et al., 1989) dans lequel le gène tsr a été remplacé par
le gèneleé:;;:t1
=
(conférant la résistance à l'hygromycine). Le plasmide ainsi obtenu a été
nomnié
pOSV510. La souche ATCC23877 a été transformée après protoplastisation par le
plasmide pOSV510. Le promoteur Pra est un promoteur réprimé par le répresseur
KorSA, le gène codant ce dernier étant situé au sein de l'élément mobile pSAM2
(Sezonov G. et al., 2000). Après transformation par le plasmide pOSV510, les
bactéries
transformées sont sélectionnées pour leur résistance à la kanamycine (due au
gène aph
porté par pOSV510). Les clones ayant perdu l'élément intégratif pSAM2 ont
perdu le
répresseur KorSA et le promoteur Pra n'est donc plus réprimé et permet
l'expression du
gène de résistance à la kanamycine aph. Une sélection par la kanamycine après
transformation par le plasmide pOSV510 permet donc de sélectionner les clones
ayant
perdu l'élément intégratif pSAM2 (et donc KorSA) et possédant le plasmide
pOSV510.
Le plasmide pOSV510 étant instable, après quelques cycles de sporulation sans
antibiotique, des clones isolés sont repiqués sur milieu avec kanamycine, sur
milieu avec
hygromycine et sur milieu sans antibiotique. Les clones sensibles à la
kanamycine et à

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
128
l'hygromycine ont perdu pOSV510. La perte de l'élément pSAM2 a été vérifiée
par
hybridation et PCR. Un clone présentant les caractéristiques souhaitées a été
sélectionné
et a été nommé OSC2.
Un échantillon de la souche OSC2 a été déposé auprès de la Collection
Nationale
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur
Roux
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numéro
d'enregistrement I-
2908.
L'inactivation du gène oie a été réalisée grâce à la technique des cassettes
excisables (cf. ci-dessus et figure 10). Pour cela, un insert de 4,5 kb dont
la séquence
part du site EcoRI situé en position 1 jusqu'au site BamHI situé en position
4521 (SEQ
ID N 1) a été sous-cloné au niveau des sites Ecolb et BamHI du plasmide pUC19
.
(numéro d'accès GenBank M77789) à partir du cosmide pSPM5. Le plasmide ainsi
obtenu a été nommé pOS49.99.
Ce plasmide a été introduit dans la souche E colt KS272 qui contenait déjà:14,
,

plasmide pKOBÉG (Chaveroche et al., 2000) (cf. figure 12).
' ="''
En parallèle, la cassette excisable att3Qaac- (SEQ ID N 92, cf. ci dessus) a
été
amplifiée par PCR en utilisant comme matrice le plasmide pOSK1102 (Le plasmide

pOSK1102 est un plasmide dérivé du vecteur pGP704Not (Chaveroche et al., 2000)

(Miller VL & Mekalanos JJ, 1988) dans lequel la cassette att3Qaac- a été
clonée comme
un fragment EcoRV dans le site unique EcoRV de pGP704Not) et à l'aide des
amorces
suivantes :
ORF2A
5' COCGCGCGGCAGOCTOTCCGTGATCGAGTCCGGCGTGACCATCGCGCGCGOTTCGTTCGG-31 (SEQ
ID N 93)
ORF2B
5' GCTOCGTGCGTCATGCAGGAA3GTGTCGTAGTCGCGGTAGATCTGCCTOTTCGTCCCGAA-3, (SEQ
ID N 94)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
129
Les 40 déoxy-nucléotides situés à l'extrémité 5' de ces oligonucléotides
comportent une séquence correspondant à une séquence dan' s le gène cible
(orf2 dans le
cas présent) et les 20 déoxy-nucléotides situés le plus en 3' (figuré en gras
ci-dessus)
correspondent à la séquence d'une des extrémités de la cassette excisable
att3Qaac- (cf.
figure 11).
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E.
épli contenant
les plasmides pKOBEG et pOS49.99 comme décrit (Chaveroche et al., 2000) (cf.
figure
12). Ainsi, les bactéries ont été transformées par électroporation et
sélectionnées pour
leur résistance à Papramycine. Les plasmides des clones obtenus ont été
extraits et
digérés par plusieurs enzymes de restriction, dans le but de vérifier que le
profil de
digestion obtenu correspond au profil attendu s'il y a eu insertion de la
cassette
(att3Qaac-) dans le gène cible (orf2), c'est à dire si il y a bien eu
recombinaison .
homologue entre les extrémités du produit PCR et le gène cible (Chaveroche et
al.,
2000). La vérification de la construction peut également être réalisée par
toute méthode
connue de l'homme du métier et notamment par PCR en utilisant les
oligonucléotides .
= appropriés et séquençage du produit de PCR. Un clone dont le plasmide
possède lé
¨
profil attendu a été sélectionné et le plasmide correspondant a été nominé
pSPM17.
plasmide dérive de pOS49.99 dans lequel o,12 est interrompue par la cassette
apramycine (cf. figure 12).
L'insertion de la cassette s'accompagne d'une délétion dans orf2, entre les
nucléotides
211 et 492 de la partie codante de orfl.
Le plasmide pSPM17 a été digéré par l'enzyme EcoRI puis les extrémités ont été

rendues bout franc par traitement à l'enzyme de Klenow, ce produit de
digestion a été
ensuite digéré par l'enzyme XbaI et l'insert contenant le gène orf2 délété a
été cloné
dans le vecteur pOSK1205 (cf. ci dessus). Pour cela, le vecteur pOSK1205 a été
digéré
par l'enzyme BamHI puis les extrémités ont été rendues bout franc par
traitement à
l'enzyme de Klenow, ce produit a été ensuite digéré par l'enzyme Xbal, et
utilisé pour la
ligation avec l'insert obtenu à partir de pSPM17 comme ci-dessus. Cette
manipulation
permet donc d'obtenir une ligation orientée puisque chacun des deux fragments
est bout
franc d'un côté et Xbal de l'autre. Le plasmide ainsi obtenu a été nommé
pSPM21, il

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
130
porte un gène de résistance à l'hygromycine (partie vecteur) et un insert dans
lequel le
gène orf2 délété est remplacé par la cassette att32aac-.
Le vecteur pSPM21 a été introduit dans la souche Streptomyces ambofaciens OSC2

(cf. ci dessus) par transformation de protoplastes (Kieser, T et al., 2000).
Après
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
mili4 avec
apramycine (antibiotique B) et sur milieu avec hygpromycine (antibiotique A)
(cf. 'figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à l'hygromycine
(HygS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orf2 interrompu par la cassette att3Daac-. Ces clones ont
été
sélectionnés et le remplacement de la copie sauvage de orf2 par la copie
interrompue par
la cassette a été vérifié. La présence de la cassette att3Daac- a été vérifiée
par PCR sur
colonie. Une hybridation a également été effectuée. Pour cela, l'ADN total des
clones
obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré sur , ,
membrane et hybridé avec une sonde de 3 kb correspondant à un fragment EcoR1-
BamHI de l'insert du plasmide pOS49.99 (cf ci-dessus). La vérification du
génotYpe,'',..
peut également être réalisée par toute méthode connue de l'homme du métier
èt.'!.=?.i
notamment par PCR en utilisant les oligonucléotides appropriés et séquençage
du
produit de PCR.
Un clone présentant les caractéristiques attendues a été sélectionné et nommé
SPM21. Il a pu être vérifié grâce à la PCR et à l'hybridation que la cassette
att3Qaac-
était bien présente dans le génome de ce clone et que l'on obtient bien le
profil de
digestion attendu dans le cas d'un remplacement, à la suite d'un double
événement de
recombinaison, du gène sauvage par la copie interrompue par la cassette
att3Qaac- dans
le génome de ce clone. Ce clone possède donc le génotype : orf2::att312aac-.
Un échantillon de la souche SPM21 a été déposé auprès de la Collection
Nationale
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur
Roux
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numéro
d'enregistrement I-
2914.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
131
La souche SPM21 a été transformée par le vecteur pOSV508 par transformation de

protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le
plasmide
pOSV508 est dérivé du plasmide pWHM3 (Vara J et a/.,1989) (cf. figure 13) dans

lequel il a été ajouté les gènes xis et int de pSAM2 (Boccard F. et al.,
1989b) placé sous
le contrôle du promoteur ptrc (Amann, E. et al., 1988) (cf. figure 14).
L'introduction
dans la souche SPM21 du plasmide pOSV508 portant les gènes xis et int de pSAM2

permet l'excision efficace par recombinaison spécifique de site de la cassette
excisable
entre les sites attL et attR flanquant cette cassette (Raynal A. et al., 1998)
(figure 10).
Parmi les transformants sélectionnés pour leur résistance au thiostrepton due
au gène tsr
porté par pOSV508, on choisit ceux devenus sensibles à l'apramycine dont le
gène de
résistance est porté par la cassette ataaaac-, l'excision entraîne en effet la
perte de ce
gène de résistance (cf. figure 10). Le plasmide pOSV508 est instable et après
deux
passages successifs sur milieu sans antibiotique des clones isolés sont
repiqués sur ;-
'
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles
au ',==
thiostrepton ont perdu pOSV508. Il a été vérifié que l'excision de la cassette
aboutit bien ,
. .
. à une délétion en phase dans le gène orf2 par PCR et séquençage du
produit Pqt,
l'excision de la cassette laisse en effet une séquence ' cicatricielle att3
caractérisfiquè
(qui est similaire au site attB d'origine après recombinaison entre les sites
attL et attR):
5' ATCGCGCGCGCTTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N 95).
La souche ainsi obtenue et possédant le génotype voulu (orf2::att3) a été
nommée
SPM22.
Un échantillon de la souche SPM22 a été déposé auprès de la Collection
Nationale
de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur
Roux
75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numéro
d'enregistrement I-
2915.

CA 02501445 2005-04-06
PCT/FR2003/002962
WO 2004/033689
132
EXEMPLE 11: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène m112
Pour l'inactivation de orf12, orfl3c et orf14 un même plasmide de départ
(pSPM504) a été employé pour introduire à différentes positions une cassette
de type
cassette excisable . Ce plasmide possède un insert de )5,1 kb qui correspond
à la
région de orf7 à orf17. Pour construire ce plasmide un' fragment Bg111 de 15,1
kb
provenant de la digestion du cosmide pSPM7 (cf. ci-dessus) a été cloné dans le
plasmide
pMBL18 (Nalçano et al., 1995) digéré par BamHI. Les extrémités BamHI et Bg111
étant
compatibles, on obtient après ligation, le plasmide pSPM502. La totalité de
l'insert de
pSPM502 a ensuite été sous-cloné (sous forme d'un fragment HinclIIIINhel) dans
le
plasmide pOSK1205 (digéré par Hindln/NheI) ce qui a permis d'obtenir le
plasmide
pSPM504.
Ce plasmide a été introduit dans la souche E. cou KS272 qui contenait déjà le
=
plasmide pKOBEG (Chaveroche et al., 2000) (cf. figure 12).
=
õ
,,r. =
=
. it
En parallèle, la cassette excisable att3e2aac- a été amplifiée par PCR en
utilisant
comme matrice le plasmide pOSK1102 (le plasmide pOSK1102 est un plasmide
dérivé
du vecteur pGP704Not (Chaveroche et al., 2000) (Miller VL & Mekalanos JJ,
1988)
dans lequel la cassette att3Qaac- a été clonée comme un fragment EcoRV dans le
site
unique EcoRV de pGP704Not), les amorces utilisées sont les suivantes :
EDR8:5' CGGGATGATCGCTTGTCCGGCGGCCGGATGCCTAGCCTCATCGCGCGCGCTTCGTTCGG 3'
(SEQ ID N 96)
EDR9:5' CCCGATCCAGAACGTCTGGTCGGTGATCAGGTCGCTGTTCATCTGCCTCTTCGTCCCGAA 3'
(SEQ ID N 97)
Les 40 (seulement 39 pour EDR8) déoxy-nucléotides situés à l'extrémité 5' de
ces
oligonucléotides comportent une séquence correspondant à une séquence dans le
gène

CA 02501445 2005-04-06
PC T/FR2003/002962
WO 2004/033689
133
cible (orf12 dans le cas présent) et les 20 déoxy-nucléotides situés le plus
en 3' (figuré en
gras ci-dessus) correspondent à la séquence d'une des extrémités de la
cassette excisable
att3Qaac- (cf. figure 11).
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E. cou
KS272 contenant les plasmides, pKOBEG et pSPM504 (cf. ci-dessus), comme décrit
par
Chaveroche et al. (Chaveroche* et al., 2000) (cf. figure 12 pour le principe,
le plasmide
pOS49.99 doit être remplacé par le plasmide pSPM504 et le plasmide obtenu
n'est plus
pSPM17 mais pSPM507). Ainsi, les bactéries ont été transformées par
électroporation
par ce produit de PCR et les clones ont été sélectionnés pour leur résistance
à
l'apramycine. Les plasmides des clones obtenus ont été extraits et digérés par
plusieurs
enzymes de restriction, dans le but de vérifier que le profil de digestion
obtenu
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-)
dans le gène
cible (orf12), c'est à dire si il y a bien eu recombinaison homologue entre
les extrémités
du produit PCR et le gène cible (Chaveroche et al., 2000). La vérification de
la
construction peut également être réalisée par toute méthode connue de l'homme
du
métier et notamment par PCR en Utilisant les oligonucléotides appropriés et
séquençage
du produit de PCR. Un clone dont le plasmide possède le profil attendu a été
sélectionné
et le plasmide correspondant a été nommé pSPM507. Ce plasmide dérive de
pSPM504
dans lequel orf12 est interrompue par la cassette att32aac- (cf. figure 12).
L'insertion de
la cassette s'accompagne d'une délétion dans le gène orf12, l'interruption
commence au
niveau du trentième codon de orf12. Il reste après la cassette les 46 derniers
codons de
orf12.
Le vecteur pSPM507 a été introduit dans la souche Streptomyces ambofaciens
OSC2
(cf. ci-dessus) par transformation de protoplastes (Kieser, T et al., 2000).
Après
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine. Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
milieu avec
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à l'hygromycine
(HygS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orf12 interrompu par la cassette att3Qaac-. Ces clones ont
été plus

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
134
particulièrement sélectionnés et le remplacement de la copie sauvage de orf12
par la
copie interrompue par la cassette a été vérifié par hybridation. Ainsi, l'ADN
total des
clones obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré
sur membrane et hybridé avec une sonde correspondant à la cassette att3Qaac-
pour
vérifier la présence de la cassette dans l'ADN génomique des clones obtenus.
Une
deuxième hybridation a été effectuée en utilisant comme sonde un fragment
d'ADN
obtenu par PCR et correspondant à une très large partie de la séquence codante
du gène
orf12.
La vérification du génotype peut également être réalisée par toute méthode
connue de ,
l'homme du métier et notamment par PCR en utilisant les oligonucléotides
appropriés et
séquençage du produit de PCR.
Un clone présentant les caractéristiques attendues (orf12::att3Qaac-) a été
plus
particulièrement sélectionné et nommé SPM507. II a pu en effet être vérifié
grâce aux
. .
deux hybridations que la cassette att3Qaac- était bien présente dans le génome
de ce
clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un
remplacement, à la suite d'un doublé événement de recombinaison, du gène
sauvage par
la copie interrompue par la cassette att3Qaac- dans le génome de ce clone. Ce
clone
possède donc le génotype : orf12::att3É2aac- et a été nommé SPM507. Il est
inutile de
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orf12, au
vu de l'orientation des gènes (cf. figure 3). En effet, le fait que orfl3c
soit orienté en
sens opposé à orf12 montre que ces gènes ne sont pas co-transcrits.
L'utilisation d'une
cassette excisable permet en revanche d'avoir la possibilité de se débarrasser
du
marqueur de sélection à tout moment, notamment par transformation par le
plasmide
pOSV508. Un échantillon de la souche SPM507 a été déposé auprès de la
Collection
Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du
Docteur
Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le numéro
d'enregistrement
1-2911.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
135
EXEMPLE 12: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène orfl3c
La cassette excisable att3Qaac- a été amplifiée par PCR en utilisant comme
matrice le plasmide pOSK1102 (cf. ci-dessus) à l'aide des amorces suivantes :
1
ACCGGGGCGGTCCTCCCCTCCGGGGCGTCACGGCCGCGGAATCTGCCTCTTCGTCCCGAA 3'
(SEQ ID N 98)
EDR4:5' CACGCAGCGAGCCGACGCACTGATGGACGACACGATGGCCATCGCGCGCGCTTCGTTCGG
(SEQ ID N 99)
=
Les 40 déoxy-nucléotides situés à l'extrémité 5' de ces oligonucléotides
comportent
une séquence correspondant à une séquence dans le gène cible (orf1.3c dans le
cas
présent) et les 20 déoxy-nucléotides situés le plus en 3' (figuré en gras ci-
dessus)
correspondent à la séquence d'une des extrémités de la cassette excisable
att3Qaac- (c
figure 11).
=,.1:;),
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E
P =
'
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme décrit
par
Chaveroche et al. (Chaveroche et al., 2000) (cf. figure 12 pour le principe,
le plasmide
pOS49.99 doit être remplacé par le plasmide pSPM504 et le plasmide obtenu
n'est plus
pSPM17 mais pSPM508). Ainsi, les bactéries ont été transformées par
électroporation
par le produit de PCR et les clones ont été sélectionnés pour leur résistance
à
l'apramycine. Les plasmides des clones obtenus ont été extraits et digérés par
plusieurs
enzymes de restriction, dans le but de vérifier que le profil de digestion
obtenu
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-)
dans le gène
cible (orfl3e), c'est à dire si il y a bien eu recombinaison homologue entre
les extrémités
du produit PCR et le gène cible (Chaveroche et al., 2000). La vérification de
la
construction peut également être réalisée par toute méthode connue de l'homme
du
métier et notamment par PCR en utilisant les oligonucléotides appropriés et
séquençage
du produit de PCR. Un clone dont le plasmide possède le profil attendu a été
sélectionné
et le plasmide correspondant a été nommé pSPM508. Ce plasmide dérive de
pSPM504

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
136
dans lequel orfl3c est interrompue par la cassette apramycine (cf. figure 12).
L'insertion
de la cassette s'accompagne d'une délétion dans le gène orfl3c, l'interruption
commence
au niveau du sixième codon de orfl3c. Il reste après la cassette les 3
derniers codons de
orfl3c.
Le vecteur pSPM508 a été introduit dans la souche Streptomyces ambofaciens
OSC2 (cf. ci-aessus) par transformation de protoplastes (Kieser, T et al.,
2000). Après
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine. Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
milieu avec
, .
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à l'hygromycine
(HygS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orfl3c interrompu par la cassette att3Qaac-. Ces clones ont
été plus
particulièrement sélectionnés et le remplacement de la copie sauvage de orfl3c
par la
copie interrompue par la cassette a été vérifié par hybridation. Ainsi, l'ADN
total des
clones obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré":;:,
=
k -rê= sur membrane et hybridé avec une sonde correspondant à la cassette
att3Qaac- pour.
vérifier la présence de la cassette dans l'ADN génomique des clones obtenus.
Une = '
deuxième hybridation a été effectuée en utilisant comme sonde un produit de
PCR
correspondant à une séquence débordant d'une centaine de paires de base en
amont et en
aval de la séquence codante de orfl3c. La vérification du génotype peut
également être
réalisée par toute méthode connue de l'homme du métier et notamment par PCR en

utilisant les oligonucléotides appropriés et séquençage du produit de PCR.
Un clone présentant les caractéristiques attendues (orfl3c::att3f2aac-) a été
plus
particulièrement sélectionné et nommé SPM508. Il a pu en effet être vérifié
grâce aux
deux hybridations que la cassette att3Qaac- était bien présente dans le génome
de ce
clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un

remplacement, à la suite d'un double événement de recombinaison, du gène
sauvage par
la copie interrompue par la cassette att3Qaac- dans le génome de ce clone. Ce
clone
possède donc le génotype : orfl3c::att3f2aac- et a été nommé SPM508. Il est
inutile de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
137
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orfl3c, au
vu de l'orientation des gènes (cf. figure 3), le fait que orf14 soit orienté
en sens opposé à
orfl3c montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une
cassette
excisable permet en revanche d'avoir la possibilité de se débarrasser du
marqueur de
sélection à tout moment. Un échantillon de la souche SPM508 a été déposé
auprès de la
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur,
25, rue
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le
numéro
d'enregistrement 1-2912.
EXEMPLE 13 Construction d'une souche de Streptomyces ambofaciens
=
interrompue dans le gène orf14
La cassette excisable att312aac- a été amplifiée par PCR en utilisant comme ;
matrice le plasmide pOSK1102 (cf. ci-dessus) à l'aide des amorces suivantes :
,
EDR5: 5'GG6CGTGAAàCGGGCGAGTàTOdâTàTCAI'déGAG.T'ACTdATCOCGdOCGCTirCGTTCGC
,
(SEQ ID N 100)
EDR6: 5'CGGGAAACGGCGTCGCACTCCTCGGGGGCCGCGTCAGCCCATCTGCCTCTTCGTCCCGAA 3'
(SEQ ID N 101)
Les 40 déoxy-nucléotides situés à l'extrémité 5' de ces oligonucléotides
comportent
une séquence correspondant à une séquence dans le gène cible (orf14 dans le
cas
présent) et les 20 déoxy-nucléotides situés le plus en 3' (figuré en gras ci-
dessus)
correspondent à la séquence d'une des extrémités de la cassette excisable
att3Qaac- (cf.
figure 11).
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E.
coui
KS272 contenant les plasmides pKOBEG et pSPM504 (cf. ci-dessus), comme décrit
par

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
138
Chaveroche et al. (Chaveroche et al., 2000) (cf. figure 12 pour le principe,
le plasmide
pOS49.99 doit être remplacé par le plasmide pSPM504 et le plasmide obtenu
n'est plus
pSPM17 mais pSPM509). Ainsi, les bactéries ont été transformées par
électroporation
par le produit de PCR et les clones ont été sélectionnés pour leur résistance
à
l'apramycine. Les plasmides des clones obtenus ont été extraits et digérés par
plusieurs
enzymes de restriction, dans le but de vérifier que le profil de digestion
obtenu
correspond au profil attendu s'il y a eu insertion de la cassette (att3Qaac-)
dans le gène
cible (orf14), c'est à dire si il y a bien eu recombinaison homologue entre
les extrémités ,
du produit PCR et le gène cible (Chaveroche et al., 2000). La vérification de
la
construction peut également être réalisée par toute méthode connue de l'homme
du
métier et notamment par PCR en utilisant les oligonucléotides appropriés et
séquençage
du produit de PCR. Un clone dont le plasmide possède le profil attendu a été
sélectionné
et le plasmide correspondant a été nommé pSPM509. Ce plasmide dérive de
pSPM504 '
dans lequel orf14 est interrompu par la cassette apramycine (cf. figure 12).
L'insertion de ... ;
la cassette s'accompagne d'une délétion dans le gène orf14, l'interruption
commence au
=
=
niveau du quatrième codon de Orf14. 11 reste après la cassette le dernier
codon de olf14.,
Le vecteur pSPM509 a été introduit dans la souche Streptomyces ambofaciens'
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al.,
2000). Après
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine. Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
milieu avec
apramycine (antibiotique B) et sur milieu avec hygromycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à l'hygromycine
(HygS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orf14 interrompu par la cassette att3Qaac-. Ces clones ont
été plus
particulièrement sélectionnés et le remplacement de la copie sauvage de orf14
par la
copie interrompue par la cassette a été vérifié par hybridation. Ainsi, l'ADN
total des
clones obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré
sur membrane et hybridé avec une sonde correspondant à la cassette att3Qaac-
pour
vérifier la présence de la cassette dans l'ADN génomique des clones obtenus.
Une
deuxième hybridation a été effectuée en utilisant comme sonde un produit de
PCR

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
139
correspondant à une séquence débordant d'une centaine de paires de base en
amont et en
aval de la séquence codante de orf14. La vérification du génotype peut
également être
réalisée par toute méthode connue de l'homme du métier et notamment par PCR en

utilisant les oligonucléotides appropriés et séquençage du produit de PCR.
Un clone présentant les caractéristiques attendues (orf14::att3.0aac-) a été
plus
particulièrement sélectionné et nommé SPM509. Il a pu en effet être vérifié
grâce aux
deux hybridations que la cassette att3Qaac- était bien présente dans le génome
de ce
clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un

remplacement, à la suite d'un double événement de recombinaison, du gène
sauvage par
la copie interrompue par la cassette att3Qaac- dans le génome de ce clone. Ce
clone
possède donc le génotype : orf14::att3.0aac- et a été nommé SPM509. Il est
inutile de
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orf14, au
vu de l'orientation des gènes (cf. figure 3), le fait que orfl5c soit orienté
en sens opposé=
à orf14 montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une
cassette '
. 15 excisable permet en revanche d'avoir la possibilité de se débarrasser
du marqueur deAi
sélection à tout moment Un échantillon de la souche SPM509 à été déposé auprès
dela
=
Collection Nationale de Cultures de Microorganismes (CNCM) Institut Pasteur,
25, rue
du Docteur Roux 75724 Paris Cedex 15, France, le 10 juillet 2002 sous le
numéro
d'enregistrement 1-2913.
EXEMPLE 14: Construction d'une souche de Streptomyces ambofaciens
interrompue dans le gène orf6*
L'inactivation du gène orf6* a été réalisée grâce à la technique des cassettes

excisables (cf. ci-dessus et figure 10). Pour cela, le cosmide pSPM7 a été
utilisé comme
matrice pour amplifier un fragment du gène orf6* grâce aux oligonucléotides
suivants :
C9583 : 5' CTGCAGGTGCTCCAGCGCGTCGATCT 3' (oligo sens) (SEQ ID No 102)

CA 02501445 2005-04-06
WO 2004/033689 PC T/FR2003/002962
140
C9 5 8 4 : 5' CTGCAGACGGAGGCGGACCTGCGGCT 3' (oligo antisens) (SEQ ID No
1 0 3 )
Les 20 déoxy-nucléotides situés à l'extrémité 3' de ces oligonucléotides
correspondent à une séquence située dans la partie codante du gène orf6* (SEQ
N
13) et les 6 déoxy-nucléotides situés les plus en 5' correspondent à la
séquence d'un site
Pstl permettant de faciliter le clonage par la suite. Le fragment d'ADN
amplifié fait une
taille d'environ 1,11 kb. Ce produit de PCR est cloné dans le vecteur pGEM-T
Easy
(commercialisé par la société Promega (Madison, Wisconcin, USA)) ce qui a
permis
d'obtenir le plasmide nommé pBXL1111 (cf. figure 16).
La cassette excisable attlayg+ a ensuite été introduite dans la séquence
codante
du gène orf6*. Pour cela, le plasmide pBXL1111 a été digéré par les enzymes de

restriction Smal et Asp718I et le produit de digestion a été traité par
l'enzyme de
Klenow. Cette manipulation permet de réaliser une délétion interne de 120 pb
dans la
séquence codante du gène orf6* (cf figure 15). De plus, de part et d'autre des
sites de
restrictions, il reste respectivement 511 pb et 485 pb de la séquence de orf6*
.44
= . .
permettront la recombinaison homologue pour l'inactivation du gène orf6*. La
casseif0
excisable attLahyg+ a été préparée à partir du plasmide pattlnhyg+ (cf. ci-
dessus) par
digestion de ce plasmide par EcoRV. Cette dernière a ensuite été sous-clonée
dans le
vecteur pBXL1111 préalablement préparé comme décrit ci-dessus (digestion Smal
et
Asp718I puis traitement à l'enzyme de Klenow). Le plasmide obtenu a été nommé
pBXL1112 (cf. figure 17). Dans cette construction, le gène orf6* comporte une
délétion
de 120pb et est interrompu par la cassette attLe2hyg+.
Le plasmide pBXL1112 a été ensuite digéré par l'enzyme Pstl (site bordant la
cassette puisque présent dans les oligonucléotides PCR) et l'insert Pstl de
3.7 kb
comprenant une partie de orf6* interrompu par la cassette attli2hyg+ a ensuite
été cloné
au niveau du site Pstl du plasmide p0J260 (cf. ci-dessus). Le plasmide ainsi
obtenu a été
nommé pBXL1113.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
141
Le vecteur pBXL1113 a été introduit dans la souche Streptomyces ambofaciens
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al.,
2000). Après
transformation, les clones sont sélectionnés pour leur résistance à
Phygromycine. Les
clones résistants à Phygromycine sont ensuite repiqués respectivement sur
milieu avec
hygromycine (antibiotique B) et sur milieu avec apramycine (antibiotique A)
(cf. figure
9). Les clones résistants à Phygromycine (HygR) et:sensibles à l'apramycine
(ApraS)
sont en principe ceux où un double événement de Crossing over s'est produit et
qui
possèdent le gène orf6* interrompu par la cassette attl f2hyg+. Ces clones ont
été plus
particulièrement sélectionnés et le remplacement de la copie sauvage de orf6*
par là
copie interrompue par la cassette a été vérifié par la technique du Southern
blot. Ainsi,
l'ADN total des clones obtenus, a été digéré par plusieurs enzymes, séparé sur
gel
d'agarose, transféré sur membrane et hybridé avec une sonde correspondant au
gène hyg
(obtenu par PCR) pour vérifier la présence de la cassette dans l'ADN génomique
des
clones obtenus. Une deuxième hybridation a été effectuée en utilisant comme
sondé
l'insert PstI-PstI contenant le gène orf6*, d'une taille d'environ 1,1 kb et
obtenu à partjr
;.= du plasmide pBXL1111 (cf ci-dessus et figure 16). La vérification du
génotype Pei#.1µe
..=
également être réalisée par toute méthode cOnnite l'homme du métier et
notamMent.
=
par PCR en utilisant les oligonucléotides appropriés et séquençage du produit
de PCR.
Un clone présentant les caractéristiques attendues (orf6*::att.1 f2hyg+) a été
plus
particulièrement sélectionné et nommé SPM501. Il a pu en effet être vérifié
grâce aux
deux hybridations que la cassette attl f2hyg+ était bien présente dans le
génome de ce
clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un

remplacement, à la suite d'un double événement de recombinaison, du gène
sauvage par
la copie interrompue par la cassette attl flhyg+ dans le génome de ce clone.
Ce clone
possède donc le génotype : orf6*::att. 1.0hyg+ et a été nommé SPM501. Un
échantillon
de la souche SPM501 a été déposé auprès de la Collection Nationale de Cultures
de
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris
Cedex
15, France, le 10 juillet 2002 sous le numéro d'enregistrement 1-2909.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
142
La souche SPM501 a été transformée par le vecteur pOSV508 par transformation
de protoplastes pour provoquer l'excision de la cassette (cf. figure 14). Le
plasmide
pOSV508 est dérivé du plasmide pWHM3 (Vara J et a/.,1989) (cf. figure 13) dans

lequel les gènes xis et int de pSAM2 (Boccard F. et al., 1989b) placés sous le
contrôle
du promoteur ptrc (Amann, E. et al., 1988) ont été ajoutés (cf. figure 14).
L'introduction
dans la souche SPM501 du plasmide pOSV508 portant leg. gènes xis et int de
pSAM2
permet l'excision efficace par recombinaison site spécifique de la cassette
excisable
entre les sites attL et attR flanquant cette cassette (Raynal A. et al., 1998)
(figure 10).
Parmi les transformants, sélectionnés pour leur résistance au thiostrepton due
au gène tsr
porté par pOSV508, on choisit ceux devenus sensibles à l'hygromycine dont le
gène de
résistance est porté par la cassette attl f2hyg+, l'excision entraîne en effet
la perte de ce
gène de résistance (cf. figure 10). Le plasmide pOSV508 est instable et après
deux
passages successifs sur milieu sans antibiotique des clones isolés sont
repiqués sur
milieu avec thiostrepton et sur milieu sans thiostrepton. Les clones sensibles
au
thiostrepton ont perdu pOSV508. Il a été vérifié que l'excision de la cassette
a bien qu
- lieu en phase dans le gène orf6* par PCR.. et séquençage du produit
PCR. L'interruptioA1,1,
commence au 158ième codon, 40 codons sont délétés (1/0pIi) et l'excision de la
casseier,:
laisse une séquence cicatricielle attl caractéristique de 33pb : 5'
ATCGCGCGC'TTCGTTCGGGACGAAGAGGTAGAT 3' (SEQ ID N 104).
La souche ainsi obtenue et possédant le génotype voulu (orf6*::attl) a été
nommée
SPM502.
Un échantillon de la souche SPM502 a été déposé auprès de la Collection
Nationale de
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux
75724
Paris Cedex 15, France, le 10 juillet 2002 sous le numéro d'enregistrement 1-
2910.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
143
EXEMPLE 15: Analyse des souches de Streptomyces ambofaciens interrompue
dans les gènes orf2, orf3, orf8, orf10, orf12, orfl3c, orf14, orf6*
Pour tester la production en spiramycine des diverses souches obtenues, un
test
microbiologique basé sur la sensibilité d'une souche de Micrococcus luteus a
été mis au
point (cf. (Gourmelen A. et al.,11998)). La souche de Micrococcus luteus
utilisée est une
souche dérivée de la souche DSM1790 naturellement sensible à la spiramycine
(cette
souche est disponible notamment auprès de la Gerinan Collection of
Microorganisms
and Cell Cultures (Deutsche Sammlung von Mikro-organismen und Zellkulturen
GmbH,'
DSMZ), (Braunschweig, Allemagne), sous le numéro DSM1790), la souche utilisée
dans le présent test diffère de la souche DSM1790 en ce qu'elle est résistante
à la
congocidine. Cette souche est un mutant spontané obtenu par sélection sur
milieu
contenant des doses croissantes de congocidine. Une telle souche a été
sélectionnée du
fait que Streptomyces ambofaciens produit à la fois de la spiramycine et de la

congocidine. Le but étant de doser la production en spiramycine des diverses
souches 4f.*
. 15 obtenues grâce à un test microbiologique basé sur la sensibilité d'une
souche dé:',1
" s
= .
= ,
Micrococcus luteus,. il est :nécessaire de disposer d'une souche résistante à
laâ15
congocidine.
Les différentes souches de Streptomyces à tester ont été cultivées dans des
erlenmeyers à baffles (erlenmeyers chicanés) de 500 ml contenant 70 ml de
milieu MP5
(Pernodet et al., 1993). Les erlenmeyers chicanés ont été inoculés à une
concentration
initiale de 2.5 106 spores/mi des différentes souches de S. ambofaciens et
mises à
pousser à 27 C sous agitation orbitale de 250 ipm. Des prélèvements de 2 ml de

suspensions ont été réalisés après 48, 72 et 96 heures de culture et
centrifugés. Les
différents surnageants ont ensuite été congelés à ¨20 C. Une dilution au
dixième de ces
surnageants dans du milieu de culture stérile est utilisée pour le test (cf.
figure 18).
La souche indicatrice de Micrococcus luteus résistante à la congocidine mais
sensible à la spiramycine a été cultivée dans du milieu 2TY (Sambrook et al.,
1989)
contenant de la congocidine à 5 pg/m1 pendant 48h à 37 C. La densité optique
(DO) de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
144
la culture est mesurée et cette culture est diluée de façon à ajuster la
densité optique à 4.
0,4 ml de cette pré-culture est dilué dans 40 ml de milieu DAM5 (Difco
Antibiotic
Medium 5, commercialisé par la société Difco), préalablement porté à une
température
d'environ 45 C. Ce milieu est ensuite coulé dans une boîte carrée de 12x12 cm
et laissé
à reposer à température ambiante.
Une fois le milieu refroidi et se:ffidifié, des disques en papier Whatman AA
(cf.
Gourmelen A. et al., 1998) de 12 mm de diamètre ont été imbibés de 70 id de la
dilution
au dixième de chaque surnageant et déposés sur la surface de la boîte. Des
disques
imbibés d'une solution de spiramycine de différentes concentrations (2-4-8
,g/m1 dans
du milieu de culture MP5) sont utilisés comme gamme étalon. Les boîtes sont
laissées à
4 C pendant 2 h de façon à permettre la diffusion des antibiotiques dans
l'agar puis sont
incubées à 37 C pendant 24 à 48h.
=
Si le disque contient de la spiramycine, celle-ci diffuse dans l'agar et
inhibe la
croissance de la souche indicatrice de Micrococcus luteus. Cette inhibition
crée un
=
. : 15 halo autour du disque, ce halo reflétant la zone où la souche de
Micrococcus
-
n'a pas Poussé. La présence de ce' halo est donc une indication de la présence

spiramycine et permet de déterminer si la souche de S. ambofaciens
correspondant au
disque en question est productrice ou non productrice de spiramycine. Une
comparaison
avec les diamètres d'inhibition obtenus pour la gamme étalon permet d'obtenir
une
indication de la quantité de spiramycine produite par cette souche.
Les différentes souches décrites dans les exemples précédents ont été
utilisées
dans ce test pour détecter leur production en spiramycine. Les résultats
obtenus ont été
regroupés dans le Tableau 38.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
145
Tableau 38
Souche Gène inactivé Exemple dans Phénotype :
lequel la Producteur (+)
ou
souche est non-producteur (-) de
décrite spiramycine
,
ATCC23877 Aucun 1 ( )
,
0S49.16 orf3;:12hyg 2 (-) ,
0S49.67 oedélétion en phase 6 (-)
0S49.107 orf8;:f2hyg 7 (-)
,
0S49.50 orf10:: Élhyg ' 8 ' (-)
;
OSC2 Aucun . 10 (+)
.
,=:.. ; -...e.
. .=
SPM21 orf2::att3f2aae- 10 (-) =
SPM22 orf2::att3 délétion en phase 10 (-)
SPM501 orf6*::attlflhyg+ 14 (-)
SPM502 orf6*::attl délétion en phase 14 (4-)
SPM507 orf12::att3r2aac- 11 (-)
SPM508 orfl3e::att3 Daae- 12 (+)
SPM509 orf14: :att3 É2aae- 13 (-)
Ces résultats permettent de tirer un certain nombre de conclusions en ce qui
concerne la fonction des différents gènes impliqués dans la biosynthèse de la

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
146
spiramycine. Ainsi le gène orf3 est essentiel à la biosynthèse de la
spiramycine. En effet
une inactivation en phase dans ce gène conduit à une souche (0S49.67, (cf.
exemple 6))
ne produisant plus de spiramycine. L'inactivation en phase permet d'écarter
l'hypothèse
d'une éventuelle influence de la cassette introduite sur l'expression des
gènes situés en
aval de orf3.
d
De même,. les gènes orf8 et 0rf10 codent des protéines essentielles à la
biosynthèse
de la spiramycine puisque les souches 0S49.107 et 0S49.50 ont un phénotype non

producteur. De plus, dans ces deux dernières souches, c'est bien
l'inactivation du gène '
correspondant qui est responsable de ce phénotype non producteur, puisqu'au vu
de
l'orientation des différentes orfs (cf. figure 3), la construction introduite
ne peut avoir
d'effet polaire.
L'étude des souches possédant une cassette excisable permet également de tirer
un
certain nombre de conclusion en ce qui concerne la fonction des gènes
interrompus. La
souche SPM507 possède le génotype : orf12::attlanac-. Il est inutile de
procéder Ià
,
-- 15 l'excision de la cassette pour l'étude de l'effet de l'inactivation de
orf12, au vu de"
l'orientation des gènes (cf. figure 3). Le fait que orfl3c soit orienté en
sens opposé à
orf12 montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une
cassette
excisable permet en revanche d'avoir la possibilité de se débarrasser du
marqueur de
selection à tout moment. Le phénotype de la souche SPM507 est non producteur,
on
peut donc en conclure que le gène orf12 est un gène essentiel à la biosynthèse
de la
spiramycine chez S. ambofaciens.
La souche SPM508 possède le génotype : orfl3c::att3S2aac-. Il est inutile de
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orfl3c, au
vu de l'orientation des gènes (cf. figure 3). Le fait que orf14 soit orienté
en sens opposé
à orfl3c montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une
cassette
excisable permet en revanche d 'avoir la possibilité de se débarrasser du
marqueur de
selection à tout moment. Le phénotype de la souche SPM508 est producteur, on
peut

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
147
donc en conclure que le gène orfl3c n'est pas un gène essentiel à la
biosynthèse de la
spiramycine chez S. ambofaciens.
La souche SPM509 possède le génotype : orf14::att3 flaac-. Il est inutile de
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orf14, au
vu de l'orientation des gènes (cf. figure 3), le fait que orfl5c soit orienté
en sens opposé
à orf14 montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une
cassette
excisable permet en revanche d'avoir la possibilité de se débarrasser du
marqueur de
selection à tout moment. Le phénotype de la souche SPM509 est non producteur,
on .
peut donc en conclure que le gène orf14 est un gène essentiel à la biosynthèse
de la
spiramycine chez S. ambofaciens.
La souche SPM21 possède le génotype : orf2::att3.0aac-. Le phénotype de cette
souche est non producteur de spiramycines. Cependant, l'orientation des gènes
orfl à
ore (cf. figure 3) laisse penser que ces gènes sont cotranscrits. Aussi, le
phénotype .
observé peut être dû à un effet polaire de la cassette introduite dans orf2
sur l'expression
.;.
de gènes situés en aval dans l'o.péron. La souche SPM22 possède le génotype
orf2::ciii3
-
et a été obtenue après excision en phase de la cassette introduite. L'excision
de la
cassette laisse seulement une séquence cicatricielle caractéristique (cf.
exemple 10).
La souche SPM22 étant également de phénotype non producteur, on peut en
conclure
que le gène orf2 est un gène essentiel à la biosynthèse de la spiramycine chez
S.
ambofaciens. On observe ici uniquement l'effet dû à l'inactivation de orf2.
La souche SPM501 possède le génotype : orf6*::attlx2hyg+. Le phénotype de
cette souche est non producteur de spiramycines. Cependant, les gènes orf5* et
orf6*
(cf. figure 3) ayant la même orientation, le phénotype observé peut être dû à
un effet
polaire de la cassette introduite dans orf6* sur l'expression de orf5*. La
disposition de
ces gènes laisse penser qu'ils peuvent être cotranscrits. Pour répondre à
cette question, la
souche SPM502 a été obtenue après excision en phase de la cassette introduite.
Dans
cette souche, on observe uniquement l'effet de l'inactivation de orf6*. Cette
souche

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
148
possède le génotype orf6*::attl (cf. exemple 14). L'excision de la cassette
laisse
seulement une séquence cicatricielle en phase (cf. exemple 14). La souche
SPM502
possède un phénotype producteur (cette souche ne produit cependant que de la
spiramycine I (ce. exemple 16)). On peut donc conclure que le gène orf5* est
un gène
essentiel à la biosynthèse de la spiramycine chez S. ambofaciens, puisque son
inactivation indirecte dans la souche SPM501 conduit à un phénotype non
producteur.
Par contre ; le gène orf6* n'est pas un gène essentiel à la biosynthèse de la
spiramycine I
chez S. ambofaciens (par contre il est essentiel à la production de
spiramycine II et III
(cf. exemple 16)).
EXEMPLE 16. Dosage de la production des spiramycines I, II et III dans les
= souches mutantes obtenues
,
== r
Les différentes souches à tester ont été cultivées chacune dans 7
erlensmeyere,4
=
chicanés de 500 mL contenant 70 ml de milieu MP5 (Pernodet et al., 1993). Les
ei1éiie4
=i
ont été inoculés par 2.5 106 spores/m1 des différentes souches de S.
ambofaciens à =
mises à pousser à 27 C sous agitation orbitale de 250 rpm pendant 72 heures.
Les
cultures correspondant au même clone sont rassemblées, éventuellement filtrées
sur
filtre plissé, et centrifugées 15 min à 7000 tr/min. Les différents
surnageants ont ensuite
été stockés à ¨30 C.
Les dosages ont été effectués par Chromatographie Liquide à Haute Performance
(CLHP) par appariement d'ions. L'analyse CLHP du milieu de culture permet de
déterminer précisément la concentration des trois formes de spiramycine. La
colonne
utilisée (Macherey-Nagel) est remplie avec une phase Nucleosil de silice
greffée octyle.
La granulométrie est de 5 m et la taille des pores 100Å. Le diamètre interne
de la
colonne est de 4,6mm et sa longueur 25 cm. La phase mobile est un mélange de
tampon
H3PO4 (pH2,2) et d'acétonitile 70/30 (v/v) contenant 6,25g/L de perchlorate de

NaC104. L'analyse est réalisée en régime isocratique avec un débit fixé à 1
ml/min. La
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
149
colonne est thermorégulée à 23 C. La détection est assurée par
spectrophotométrie UV
à 238nm. L'échantillon est réfrigéré à +10 C et la quantification est
déterminée à partir
de l'aire des pics (par étalonnage externe). Dans ces conditions, les temps de
rétention
de la spiramycine I, II et III sont respectivement d'environ 17; 21 et 30
minutes, comme
il a pu être vérifié grâce à un échantillon commercial comprenant les trois
formes de
spiramycine. 4.
La souche OSC2 possède un phénotype producteur de spiramycine. C'est la
souche parentale utilisée pour l'obtention des souches possédant une cassette
excisable
(cf. exemple 15). Cette souche a donc été utilisée comme témoin positif de
production
des trois formes de spiramycine. Cette souche produit bien les trois formes de
spiramycines comme il a été vérifié par CLHP (cf. figure 19).
L'étude des souches possédant une cassette excisable permet de tirer un
certain
nombre de conclusions en ce qui concerne la fonction des gènes interrompus. La
souche ;..
SPM507 possède le génotype : orf12::att312aac-. Le phénotype de la souche
SPM507,
==
f
est non producteur (cf exemple 15), on peut donc en conclure que le gène orf12
est
, .
gène essentiel à la biosynthèse de la spiramycine chez S. ambofaciens. Cette
souche ne '
produit plus de spiramycines comme il a été vérifié par CLHP (cf. figure 22).
Ce résultat
confirme le caractère essentiel du gène orf12 dans la biosynthèse de la
spiramycine.
La souche SPM508 possède le génotype : orfl3c::att3e2aac-. Le phénotype de la
souche SPM508 est producteur de spiramycine (cf. exemple 15), on peut donc en
conclure que le gène orfl3c n'est pas un gène essentiel à la biosynthèse de la

spiramycine chez S. ambofaciens. Cette souche produit de la spiramycine I, II
et III
comme il a été vérifié par CLHP (cf. figure 23). Ce résultat confirme que le
gène orfl3c
n'est pas un gène essentiel à la biosynthèse des spiramycines I, II et III
ches S.
ambofaciens.
La souche SPM509 possède le génotype : orf14::att3É2aac-. Le phénotype de la
souche SPM509 est non producteur, on peut donc en conclure que le gène orf14
est un

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
150
gène essentiel à la biosynthèse de la spiramycine chez S. ambofaciens. Cette
souche ne
produit plus de spiramycines con-mie il a été vérifié par CLHP (cf. figure
24). Ce résultat
confirme l'essentialité du gène orf14 dans la biosynthèse de la spiramycine.
La souche SPM501 possède le génotype : orf6*::attl.C2hyg+. Le phénotype de
cette souche est non producteur de spiramycines. Cette souche ne produit Mus
de
spiramycines comme il a été vérifié par CLHP (cf. figure 20). Cependant, les
gènes
orf5* et orf6* (cf. figure 3) ayant la même orientation, le phénotype observé
peut être dû
à un effet polaire de la cassette introduite dans orf6* sur l'expression de
orf5* dans
l'opéron. Ceci laisse penser que ces gènes sont cotranscrits. Pour répondre à
cette
question, la souche SPM502 a été obtenue par excision de la cassette
introduite,
produisant une délétion en phase dans le gène or6* et restaurant l'expression
de orf5*.
Cette souche possède le génotype orf6*::attl (cf. exemple 14 et 15).
L'excision de la
cassette laisse seulement une séquence att cicatricielle en phase (cf.
exemple 14). La
souche SPM502 possède un phénotype producteur de spiramycine. Cependant, comme
il
*- = 15 a été prouvé par CLHP, cette souche ne produit que de la spiramycine I
et ne produit
;... =
':=?5'=
- de spiramycine II et III (cf figure 21). On peut donc conclure de ces
résultats que le gêné ..!.
orf5 * est un gène essentiel à la biosynthèse de la spiramycine chez S.
ambofaciens,
puisque son inactivation indirecte dans la souche SPM501 conduit à un
phénotype non
producteur de spiramycine (cf. figure 20). Par contre ; le gène orf6* n'est
pas un gène
essentiel à la biosynthèse de la spiramycine I chez S. ambofaciens, puisque
l'inactivation
de ce gène conduit à un phénotype producteur de spiramycine I (cf. figure 21).

Cependant, orf6* est essentiel à la production de spiramycine II et III (cf.
exemple 16)).
Le gène orf6* code donc bien une acyl-transférase responsable de la
modification du
platénolide à la position 3 (cf. figure 1).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
151
EXEMPLE 17 : Détermination du point de démarrage de la traduction de orf 10 et

amélioration de la production en spiramycines
17.1 Construction des plasmides pSPM523, pSPM524 et pSPM525 :
Le gène orflO a été identifié chez Streptomyces ambofaciens et a été désigné
srmR par Geistlich et al. (Geistlich, M., et al., 1994 L'inactivation du gène
orf10 a
été réalisée (cf. exemple 8). Il a pu ainsi être montré que la souche
résultante ne
produit plus de spiramycines (cf. exemple 15). Ceci confirme que le gène orfl
0 est
bien impliqué dans la biosynthèse des spiramycines. La protéine codée par ce
gène :!*
est donc bien essentielle à la biosynthèse des spiramycines. Cependant,
l'analyse de
la séquence montre que deux codons ATG situés dans la même phase de lecture
peuvent être utilisés pour la traduction de orf10 (cf. Figure 28). Un des deux
codons
possible (le codons le plus en amont) démarre à la position 10656 de la
séquence
donnée en SEQ ID N 1, alors que l'autre codon possible situé plus en aval
démarre à
la position 10809 (cf SEQ ID N 1). Avant de tester un éventuel effet de la:¨
,
, 15 surexpression de tsret sur' la 'production de spiramycine, il est
important de';;U
- = , ,
:tel,-.TN
; déterminer dans un premier ténipg lé point dé dértiarrage'dé la
traduction.
Dans le but de determiner le site de démarrage de la traduction, trois
constructions comportant trois formes d' orf10 ont été réalisées. Ces
dernières ont été
obtenues par PCR en utilisant des oligonucléotides comportant soit un site de
restriction HindIII soit un site de restriction BamHI.
Le premier couple utilisé pour l'amplification correspond aux oligonucléotides

suivants :
EDR39 :
5'CCCAAGCTTGAGAAGGGAGCGGACATTCATGGCCCGCGCCGAACGC3'
(SEQ ID N 122) (le site HindIII figure en gras)
EDR42 :
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'
(SEQ ID N 123) (le site BamHI figure en gras)

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
152
Le couple d'amorces EDR39-EDR42 permet l'amplification d'un fragment d' orf10
comportant l'ATG situé le plus en 3' (position 10809 dans la séquence donnée
en
SEQ ID N 1) (cf. Figure 28). Le fragment obtenu fait une taille d'environ 2
kb et
sera appelé par la suite "orf10 court", il ne contient pas le promoteur de
orf10. Ce
fragment de 2kb a été cloné dans le vecteur pGEM-T easy pour donner naissance
au
plasmide pSPM520.
Le deuxième couple utilisé pour l'amplification correspond aux
oligonucléotides
suivants :
=
EDR40 :
5'CCCAAGCTTGAGAAGGGAGCGGACATTCAATGCTTTGGTAAAGCAC3'
(SEQ ID N 124) (le site HindIII figure en gras)
EDR42 :
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'
(SEQ N 123) (le site B andll figure en gras)
.
Le couple d'amorces EDR40-EDR42 permet l'amplification d'un fragment d' orf10
comportant l'ATG situé le plus en 5' (position 10656 dans la séquence donnée
en
=
' = = =-;'!µ..tî(?,f5
SEQ ID N 1) (cf. Figure 28). Ce fragment de 2,2 kb 'appelé par la suite
"o/f/0 long"
a été cloné dans le vecteur pGEM-T easy pour donner naissance au plasmide
pSPM521, ce plasmide ne contient pas le promoteur de orf10.
Le troisième couple utilisé pour l'amplification correspond aux
oligonucléotides
suivants :
EDR41 :
5'-CCCAAGCTTTCAAGGAACGACGGGGTGGTCAGTCAAGT-3'
(SEQ ID N 125) (le site Hi n dIII figure en gras)
EDR42 :
5'CGGGATCCGGCTGACCATGGGAGACGGGCGCATCGCCGAGTTCAGC3'
(SEQ ID N 123) (le site BamHI figure en gras)
Le couple d'amorces EDR41-EDR42 permet l'amplification du gène orf10 avec les
deux ATG, ainsi que son propre promoteur (cf. Figure 28). Ce fragment de 2,8
kb

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
153
appelé par la suite "orf10 pro" a été cloné dans le vecteur pGEM-T easy pour
donner
naissance au plasmide pSPM522.
Le fragment "orf10 pro" a été obtenu en utilisant comme matrice l'ADN
chromosomique de la souche OSC2. Les fragments "orf10 court" et "orf10 long"
ont
quant à eux été obtenus en utilisant comme matrice l'ADN du fragment "orf10
pro"
préalablement purifié.
Les inserts HindIII-BamHI des plasmides pSPM520, pSPM521 et pSPM522
ont ensuite été sous-clonés dans le vecteur pUWL201 (plamside dérivé du
plasmide
pUWL199 (Wehmeier UF, 1995) dans lequel le fragment Kpnl-BamHI de la région
du promoteur de ermE (cf. Bibb et al., 1985, notamment figure 2) portant une
mutation augmentant la force du promoteur (promoteur ermE*) (Bibb et al.,
1994) a
été introduit (cf. Doumith et al., 2000)) préalablement digéré par les enzymes

Hind111-BamHI. Ainsi, il a été obtenu trois plasmides : pSPM523 (dérivé du
PLTWL201 avec la forme "orf10 court" comme insert), pSPM524 (dérivé du
. 15 pUWL201 avec la forme "orf10 long" comme insert) et pSPM525 (dérivé du.
pUWL201 avec la forme "orf10 pro") (Figure 28).
17.2 Transformation de la souche 0S49.50 par les constructions pSPM523,
pSPM524 et pSPM525:
La souche 0S49.50 (souche interrompue dans le gène orf10, cf. exemple 8) a été
transformée indépendamment par transformation de protoplastes (Kieser, T et
al., 2000)
par chacun des plasmides pSPM523, pSPM524 et pSPM525. Un témoin négatif a
également été réalisé en transformant la souche 0S49.50 par le plasmide
pUWL201 sans
insert. Après transformation des protoplastes, les clones sont sélectionnés
pour leur
résistance au au thiostrepton. La transformation des clones par chacun des
plamides est
vérifiée par extraction de ces plasmides. Ainsi quatre nouvelles souches ont
été
obtenues : la souche 0SC49.50 pUWL201, issue de la transformation par le
plasmide
pUWL201 sans insert, la souche 0SC49.50 pSPM523, issue de la transformation
par le
plasmide pSPM523, la souche 0SC49.50 pSPM524, issue de la transformation par
le

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
154
plasmide pSPM524 et enfin la souche 0S49.50 pSPM525, issue de la
transformation par
le plasmide pSPM525.
La production de spiramycines de chacune de ces quatre souches a été testée
par CLHP. Pour cela, les différentes souches de Streptomyces à tester ont été
cultivées dans des erlenmeyers à baffles (erlenmeyers chicanés) de 500 ml
contenant
70 ml de milieu MP5 (Pernodet et al., .1993). Lorsque la souche contient le
plasmide
pUWL201 ou l'un de ses dérivés, il est ajouté 5 .tg/ml de thiostrepton. Les
erlenmeyers chicanés ont été inoculés à une concentration initiale de 2.5 106
spores/m1 des différentes souches de S. ambofaciens et les cultures ont été
incubées à
27 C sous agitation orbitale de 250 rpm pendant 96 heures. Les cellules ont
ensuite
été séparées du milieu par centrifugation et le surnageant a été analysé par
CLHP (cf.
exemple 16) pour déterminer la quantité de spiramycine produite. Grâce à un
échantillon étalon et à la mesure de l'air des pics, il a été possible de
déterminer la `-
quantité de chacune des spiramycines produites par ces souches. Les résultats
de cette
analyse sont présentés dans le tableau 39, les données sont exprimées en mg
par litre õ
A:e
: de surnageant Les résultats- ef.édop[iid9fit la production totale en
spiramycinesq,'.
. õ
. r
z
(obtenue en additionnant la production en spiramycine I, II et III).
Tableau 39. Production en spiramycines des souches dérivées de 0S49.50,
(résultats exprimés en mg/1).
Souche Production en Spiramycines
0S49.50 0
pUWL201
0S49.50 0
pSPM523
0S49.50 93
pSPM524

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
155
0S49.50 149
pSPM525
Comme le montre les résultats donnés dans le tableau 39, le témoin négatif
(souche 0S49.50 transformée par le plasmide pUWL201) ne produit pas de
spiramyciiie. Lorsque le plasmide pSPM523 (qui contient la forme "orf10
court") est
introduit dans la souche 0S49.50, aucune production de spiramycine n'est
observée.
En revanche, la présence du plasmide pSPM524 (qui contient la forme "orf10
long")
et du plasmide pSPM525 (qui contient la forme "orf10 pro") restaure la
production
de spiramycine dans la souche hôte 0S49.50. Ainsi, seuls les fragments de
orf10
contenant l'ATG le plus en amont permettent de restaurer la synthèse de
spiramycine.
Dans le but de confirmer ces résultats, le plasmide pSPM521 (plasmide
,:=
pGEM-T easy contenant la forme 7orf10 long") a été digéré par l'enzyme de
restriction XhoI (cette enzyme possède un site unique dans ce plasmide,
localisé entre
les deux ATG (cf Figure 28)). Les extrémités XhoI ont ensuite été rendues bout
franc.,
, .
par traitement à l'enzyme de Klenow. Le plasmide a alors été refermé sur lui-
même,24
par action de la T4 DNA ligase pour donner naissance au plasmide pSPM527. Si
l'ATG le plus en amont (position 10656 dans la séquence donnée en SEQ ID N 1)
est bien .utilisé comme site d'initiation de la traduction, ce traitement
entrainera un
décalage du cadre de lecture au niveau du site XhoI et aura pour effet la
production
d'une protéine ne présentant pas d'activité activatrice. Par contre si
l'initiation de la
traduction a lieu au niveau de l'ATG plus en aval (position 10809 dans la
séquence
donnée en SEQ ID N 1), ce traitement devrait avoir peu ou pas d'effet sur
l'expression de Orf10 (compte tenu de la localisation du point de démarrage de
la
transcription) et aucun effet sur la protéine produite.
L'insert BamHI-HincIIII de pSPM527 a ensuite été sous-cloné dans le vecteur
pUWL201 pour donner naissance au plasmide pSPM528. Ce plasmide a été introduit

dans la souche 0S49.50 et un clone possédant le plasmide voulu a plus
particulièrement été sélectionné. La production de spiramycine de la souche

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
156
résultante a ensuite été testée par CLHP (Cf. exemple 16 et ci-dessus).
Contrairement
à ce qui avait été observé avec le plasmide pSPM524 (cf. tableau 39), la
présence du
plasmide pSPM528 dans la souche 0S49.50 ne rétablit pas la production de
spiramycine. Ceci confirme que le démarrage de la traduction du gène orf10 est
l'ATG situé le plus en aval (ATG 1 cf. Figure 28).
17.3 Amélioration de la production en spiramycines de la souche OSC2 de S.
ambofaciens :
Afin de tester l'effet de la surexpression du gène orf10 sur la production de
spiramycines, les plasmides pSPM523, pSPM524, pSPM525 et pSPM528 ont été
introduits dans la souche OSC2. Pour cela, des protoplastes de la souche OSC2
ont
été transformés (Kieser, T et al., 2000) indépendamment par chacun des
plasmides
pSPM523, pSPM524, pSPM525 et pSPM528. Un témoin négatif a également été
= réalisé en transformant la souche OSC2 par le plasmide PUWL201 sans
insert. Après
transformation des protoplastes, les clones sont sélectionnés pour leur
résistance au
au thiostrepton. Ainsi cinq nouvelles souches ont été obtenues : la souche
OSC2
= pUWL201, issue de la transformation par le plasmide pUWL201 sans insert,
la s.,=;===
souche OSC2 pSPM523, issue de la transformation par le plasmide pSPM523, la
souche OSC2 pSPM524, issue de la transformation par le plasmide pSPM524, la
souche OSC2 pSPM525, issue de la transformation par le plasmide pSPM525 et
enfin la souche OSC2 pSPM528, issue de la transformation par le plasmide
pSPM528. La production en spiramycines de ces souches a alors été analysée par

CLHP (de la même manière que dans l'exemple 17.2). L'analyse de la production
en
spiramycine de la souche OSC2 a également été effectée en parallèle pour
comparaison. Les résultats de cette analyse sont présentés dans le tableau 40,
les
données sont exprimées en mg par litre de surnageant. Les résultats
correspondent à
la production totale en spiramycines (obtenue en additionnant la production en

spiramycine I, II et III).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
157
Tableau 40. Production en spiramycines des souches dérivées de OSC2,
(résultats
exprimés en mg/1).
Souche Production en spiramycines
OSC2 69
= OSC2 103
pUWL201
OSC2 19
pSPM523
OSC2 135
pSPM524
OSC2 278
7Z.
pSPM525
= -
=
, . =
i,,; = õ -
, srpqr=
. .
=
OSC2 68
pSPM528
Ainsi, il est observé que la présence du plasmide pSPM524 ou du plasmide
pSPM525 augmente significativement la production en spiramycines de la
souche
OSC2. Ceci démontre bien que la surexpression de Orf10 a un effet positif sur
la
production en spiramycines. Le plasmide pSPM528 n'a par contre pas d'effet sur
la
production en spiramycines.
Les plasmides pSPM525 et pUWL201 ont de la même manière été introduit
dans la souche SPM502 (cf. exemple 14). Ainsi deux nouvelles souches ont été
obtenues : la souche SPM502 pUWL201, issue de la transformation par le
plasmide

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
158
pUWL201 sans insert, et la souche SPM502 pSPM525, issue de la transformation
par
le plasmide pSPM525.
Un échantillon de la souche SPM502 pSPM525 (cette souche contient le plasmide
pSPM525, cf. ci-dessus) a été déposé auprès de la Collection Nationale de
Cultures de
Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux 75724 Paris
Cedex
15, France, le 26 février 2003 sous le numéro d'enregistrement 1-2977.
La production en spiramycines des souches SPM502 pUWL201 et SPM502
pSPM525 a été analysée par CLHP (de la même manière que dans l'exemple 17.2).
=
L'analyse de la production en spiramycines de la souche SPM502 a également été
effectée en parallèle pour comparaison. Les résultats de cette analyse sont
présentés
dans le tableau 41, les données sont exprimées en mg par litre de surnageant.
Les
résultats correspondent à la production en spiramycine I. En effet, aucune de
ces
= souches ne produit de spiramycine II et III.
= !!
: Tableau 41. Production en spiramycine I des souches dérivées de
SPM502, '1 P7-4 eij
' = = ,
õ .
(résultats exprimés en nig/1).
Souche Spiramycine I
SPM502 47
SPM502 pUWL201 72
SPM502 pSPM525 130
Ainsi, il a pu être observé que la surexpression du gène orf10 dans la souche
SPM502 augmente de facon importante la production de spiramycine I.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
159
EXEMPLE 18 : Construction d'une banque d'ADN génomique de la souche OSC2
de Streptomyces ambofaciens chez E. cou l dans la cosmide pWED2.
18.1 Construction du cosmide pWED2 :
Dans le but de faciliter l'inactivation de gènes chez Streptomyces, un
cosmide portant la séquence oriT du plasmide RK2 (ce qui permet son
introduction
par conjugaison dans Streptomyces à partir d'une souche appropriée de E. cou)
et
portant également un gène de résistance à un antibiotique conférant un
phénotype -
repérable chez Streptomyces, a été construit. Un tel cosmide contenant de
grands
inserts d'ADN génomique de Streptomyces ambofaciens peut être utilisé dans des
expériences d'inactivation de gènes.
Pour construire ce vecteur, une cassette pac-oriT (fragment EcoRV) a été
introduite dans le cosmide pWED1 (Gourmelen et al., 1998) , dérivé du cosmide
pWED15 (Wahl et al., 1987), au niveau du site unique Hpal. La cassette pac-
oriT a .
été obtenue par PCR. Pour cela, le gène pac a été amplifié par PCR à partir du
,. . 15 plasmide pVF 10.4 (Vara et al., 1985; Laçalle et 01., 1989) en
utilisant comme
tt
= première amorce, l'amorce A (de séquence
CCAGTAGATATCCCGCCAACCCGGAGCTGCAC-3' (SEQ ID N 126), le site
de restriction EcoRV a été souligné et la séquence en gras de 20 nucléotides
correspond à une région en amont du promoteur du gène pac) et comme deuxième
amorce, l'amorce B (de séquence 5'-
GAAAAGATCCGTCATGGGGTCGTGCGCTCCTT-3' (SEQ ID N 127), qui
comporte à son extrémité 5' une séquence de 12 nucléotides correspondant au
début
de la séquence oriT (souligné double) et une séquence de 20 nucléotides (en
gras)
correspondant à la fin du gènepac (cf. Figure 29, 1ère PCR).
Le gène oriT a quant à lui été amplifié par PCR à partir du plasmide pPM803
(Mazodier,P. et al., 1989) en utilisant comme première amorce, l'amorce C (de
séquence 5'-CACGACCCCATGACGGATCTTTTCCGCTGCAT-3' (SEQ ID N
128)), qui comporte à son extrémité 5' une séquence de 12 nucléotides
correspondant à
une séquence en aval de la séquence codante du gène pac (en gras) et une
séquence de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
160
20 nucléotides correspondant au début de la séquence oril) et comme deuxième
amorce, l'amorce D (de séquence
5'-
GAGCCGGATATCATCGGTCTT CTTGCT GT-3' (SEQ ID N 129)) qui
comporte le site de restriction EcoRV (souligné simple) et une séquence de 20
nucléotides correspondant à la fin de la séquence oriT (souligné double) (cf.
Figure 29,
2ième PCR).
Le produit d'amplification obtenu avec les amorces A et B et celui obtenu àvec

les amorces C et D ont à une de leur extrémité, une séquence commune de 24
nucléotides. Une troisième PCR a été réalisée en mélangeant les deux produits
d'amplification obtenus précédemment et en utilisant comme amorces, les
amorces A et
D (cf. figure 29, 3ièlne PCR). Ceci a permis d'obtenir un produit
d'amplification
correspondant à l'ensemble pac+oriT. Ce fragment pac-oriT a alors été cloné
dans le
vecteur pGEM-T Easy (commercialisé par la société Promega (Madison, Wisconcin,

USA)), ce qui a permis d'obtenir le plasmide pGEM-T-pac-oriT. L'insert de ce
plasmide a ensuite été sous cloné dans le cosmide pWED1. Pour cela le
plasmide..-.,
.;
;=;!..
pGEM-pac-oriT a été digéré par l'enzyme _EcoRV et l'insert EcoRV contenant
= . ;
ez.e
l'ensemble Pae+oriT a été inséré dans le CCSinide pWED1 ouvert au pre'àlàble
par t.
l'enzyme Hpal. Le cosmide ainsi obtenu a été baptisé pWED2 (cf. Figure 30).
Ce cosmide permet de faciliter l'inactivation de gènes chez Streptomyces.
En effet, il porte la séquence oriT (ce qui permet son introduction par
conjugaison
dans Streptomyces à partir d'une souche appropriée de E. cou) mais également
un
gène de résistance à un antibiotique conférant un phénotype repérable chez
Streptomyces. Un tel cosmide contenant de grands inserts d'ADN génomique de
Streptomyces ambofaciens peut être utilisé dans des expériences d'inactivation
de
gènes.
Ainsi un cosmide dérivé de pWED2 contenant le gène cible pourra par
exmeple être introduit dans la souche de E. cou KS272 contenant le plasmide
pKOBEG (cf. Chaveroche et al. 2000) et une cassette sera introduite dans le
gène
cible selon la technique décrite par Chaveroche et al. 2000. Le cosmide obtenu
par
cette technqiue (cosmide dans lequel le gène cible est inactivé), pourra
ensuite être

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
161
introduit dans une souche de E. cou i telle que la souche S17.1 ou toute autre
souche
permettant de transférer par conjugaison des plasmides contenant la séquence
oriT
vers Streptomyces.
Après conjugaison entre E. cou i et Streptomyces, des clones de Streptomyces
dans lesquelles la copie sauvage du gène cible aura été remplacée par la copie
interrompue pourront être obtenues comme décrit dais l'exemple 2.
Le gène de résistance exprimé chez StreptOmyces présent sur ce nouveau
cosmide est le gène pac de Streptomyces alboniger (Vara, J et al., 1985;
Lacalle et
al., 1989) qui code la puromycine N-acétyl transférase et qui confère la
résistance à la *
puromycine. Lors d'expériences d'inactivation de gène, on cherchera les clones
dans
lesquels un double évènement de recombinaison aura eu lieu. Ces clones auront
éliminer le cosmide pWED2 et seront donc redevenus sensibles à la puromycine.
= 18.2 Construction d'une banque d'ADN genomique de la souche OSC2 de
Streptomyces ambofaciens chez E cOli &ma le cosmide pWED2
e
'
!. 7 =
94
-
L'ADN génomique de .la =Skiuclic OSC2 de Streptomyces ambofaciens a 'eféA
digéré partiellement 'par rem:plie de restriction BeinzHI de manière à obtenir
d'è4
fragments d'ADN de taille comprise entre environ 35 et 45 kb. Ces fragments
ont
ensuite été clonés dans le cosmide pWED2, ce dernier ayant été au préalable
digéré par
BamHI, puis traité par la phosphatase alcaline. Le mélange de ligation a
ensuite été
encapsidé in vitro dans des particules de phages lambda grâce au système
Packagene
Lambda DNA packaging system commercialisé par la société Promega (Madison,
Wisconcin, USA) en suivant les recommandations du fabriquant. Les particules
phagiques obtenues ont été utilisées pour infecter la souche SURE d'E. cou
commercialisée par la société Stratagene (LaJolla, Californie, USA). La
séléction des
clones a été effectuée sur milieu LB + ampicilline (50 g/m1), le cosmide pWED2
confèrant la résistance à l'ampicilline.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
162
EXEMPLE 19 : Isolement de cosmides de la nouvelle banque couvrant la région de

la voie de biosynthèse des spiramycines. Sous clonage et séquençage de
fragments
de ces cosmides.
19.1 Hybridation sur colonies de la banque génomique de Streptomyces
ambofaciens OSC2 :
Des cosmides de la nouvelle banque de Streptomyces ambofaciens OSC2 (cf.
exemple 18) couvrant les orf1* à orf10* ou une partie ou la totalité des orfl
à orf25c,
ou une région plus en amont de P orf25c ont été isolés. Pour cela, des
hybridations
successives sur les colonies d'E. cou i obtenues selon l'exemple 18 ont été
réalisées en
utilisant les 3 sondes suivantes (cf. figure 31):
- La première sonde utilisée correspond à un fragment d'ADN d'environ 0,8kb
amplifié par PCR en utilisant comme matrice le cosmide pSPM5 et les amorces
suivantes :
pst ORF23c : 5'-ACGTGCGCGGTGAGTTCGCCOTTOO' (SEQ ID N 130)
.
e
III
= = =
ORIF'25c : 5'-CTGAACGAéGCaTC6CadmeGC-3' (SEQ lb N 131).
Le produit de PCR ainsi obtenu contient un fragment du début de P orf23c,
l'orf24c en
entier et la fin de l'orf25c (cf. figure 31, sonde I).
- La deuxième sonde utilisée correspond à un fragment d'ADN d'environ 0,7kb
amplifié par PCR en utilisant comme matrice l'ADN total de la souche S.
ambofaciens ATCC23877 et les amorces suivantes :
ORF1*c : 5'-GACCACCTCGAACCGTCCGGCGTCA-3' (SEQ ID N 132) et
ORF2*c : 5'-GGCCCGGTCCAGCGTGCCGAAGC-3' (SEQ ID N 133).
Le produit de PCR ainsi obtenu contient un fragment de la fin de 1 'orfl *c et
du début
de 1 'orfl*c (cf. figure 31, sonde II).
- La troisième sonde utilisée correspond à un fragment EcoRI-BamHI d'environ
3kb
contenant les orfl , orfl et orf3 et obtenu par digestion du plasmide pOS49.99
(cf. figure
31, sonde III).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
163
Environ 2000 clones de la banque obtenue dans l'exemple 18.2 ont été
transférés
sur filtre pour hybridation sur colonies selon les techniques classiques
(Sambrook et al.,
1989).
La première sonde (cf. figure 31, sonde I) a été marquée au 32P par la
technique
du random priming (Kit commercialisé par la société Roche) et utilisées
pour
l'hybridation sur 2000 clones de la banque, après transfert sur filtre.
L'hybridation a été
effectuée à 65 C dans le tampon décrit par Church & Gilbert (Church & Gilbert,
1984).
Deux lavages ont été effectués en 2x SSC, 0,1% SDS à 65 C, le premier pendant
10 ;
minutes et le deuxième pendant 20 minutes et un troisième lavage d'une durée
de 30
minutes a ensuite été effectué en 0.2X SSC, 0,1% SDS à 65 C. Dans ces
conditions
d'hybridation et de lavage, 20 clones parmi les 2000 hybridés présentaient un
fort signal
d'hybridation avec la première sonde. Ces 20 clones ont été cultivés en milieu
LB+ =
ampicilline (50 ptg/m1) et les 20 cosmides correspondants ont été extraits par
lyse
alcaline (Sambrook et ai, 1989) puis ils ont été digérés par l'enzyme de
restriction
y

Bamili. Les produits de digestions ont ensuite été séparés sur gel d'agarose,
tans, férW:i:q
sur Membrane de Nylon et hybridés par la première sonde (cf ci-dessus : le
produit de
PCR ORF23c-ORF25c, sonde I) dans les mêmes conditions que ci-dessus. Douze
cosmides possédaient un fragment BamHI hybridant fortement avec la sonde
utilisée.
Ces 12 cosmides ont été nommés pSPM34, pSPM35, pSPM36, pSPM37, pSPM38,
pSPM39, pSPM40, pSPM41, pSPM42, pSPM43, pSPM44 et pSPM45. Les profils,
après digestion par BamHI, de ces 12 cosmides ont été comparés entre eux et
avec celui
du cosmide pSPM5. De plus des expériences d'amplification par PCR en utilisant

différentes amorces correspondant à différents gènes déjà identifiés dans la
région orfl-
orf25e ont permis de positionner l'insert de certains de ces cosmides les uns
par rapport
aux autres et de déterminer également la localisation de ces inserts dans la
région orfl-
orP5e déjà connue (cf. Figure 32). Le cosmide pSPM36 a plus particulièrement
été
choisi car il était susceptible de contenir une grande région en amont de
Porf25e (cf.
Figure31 et 32).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
164
Dans un deuxième temps, et en utilisant les mêmes conditions que celles
décrites ci-dessus, les 2000 clones de la banque de Streptomyces ambofaciens
OSC2 ont
été hybridés avec la deuxième sonde correspondant au produit de PCR: ORF1*c-
ORF2*c (cf. figure 31, sonde II). Cette hybridation a permis d'isoler des
cosmides dont
l'insert est situé dans la région de orfl*c à orflec. Dans les conditions
d'hybridation
utilisés, 16 clones parmi les 2000 hybtidés présentaient un fort signal
d'hybridation avec
cette deuxième sonde. Ces 16 clones ont été cultivés en milieu LB+ ampicilline
(50
gg/m1) et les 16 cosmides correspondants ont été extraits par lyse alcaline
(Sambrook et
al., 1989) puis ils ont été digérés par l'enzyme de restriction BamHI. Les
profils de
digestion (après digestion par Bamill) de ces 16 cosmides ont été comparés
entre eux et
avec celui du cosmide pSPM7. Des expériences d'amplication par PCR avec les
amorces ORF1*c et ORF2*c ont permis de choisir deux cosmides qui renfermaient
bien
les gènes orfl*c et orf2*c et dont les profils possédaient des bandes communes
mais
aussi des bandes différentes. De Plus d'autres expériences d'amplification par
PCR en
= 15 utilisant différentes amorces correspondant à différents gènes déjà
identifiés dans la
région orfl*c à oiflO*c ont permis de positionner l'insert de ces cosmides les
uns
= rapport aux autres et dé déterminer également la localisation de ces
inserts' dans la régiOn
orfl*c à orflO*c déjà connue (cf. Figure 32). Les deux cosmides plus
particulièrement
sélectionnés ont été nommés pSPM47 et pSPM48 (cf. Figure 32).
En utilisant les mêmes conditions que celles décrites ci-dessus, les 2000
clones
de la banque de Streptomyces ambofaciens OSC2 ont également été hybridés avec
la
troisième sonde correspondant au fragment d'ADN EcoRI-Bam111 du plasmide
pOS49.99 (cf. figure 31 sonde III). Cette hybridation a permis d'isoler les
cosmides
contenant la région de l'orfl jusqu'à l'orf3 et susceptibles de contenir soit
une grande
partie des gènes des PKS, soit une grande partie des gènes orfl à orf25c de la
voie de
biosynthèse des spiramycines. Dans ces conditions d'hybridation, 35 clones
parmi les
2000 hybridés présentaient un fort signal d'hybridation avec la troisième
sonde. Ces 35
clones ont été cultivés en milieu LB+ ampicilline (50 g/mi) et les 35
cosmides
correspondants ont été extraits par lyse alcaline (Sambrook et al., 1989) puis
digérés par

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
165
l'enzyme de restriction BamHI. Les profils, après digestion par BamHI, de ces
35
cosmides ont été comparés entre eux et avec celui du cosmide pSPM5. De plus
des
expériences d'amplification par PCR en utilisant différentes amorces
correspondant à
différents gènes déjà identifiés dans la région orfl à orf25c ont permis de
vérifier que
ces cosmides renfermaient bien des inserts provenant de la région orfl à
orf25c et de
positionner les inserts de ces cosmides les uns, par rapport aux autres et par
rapport à la
la région orfl à orf25c déjà connue (cf. Figure 32). Cinq cosmides ont été
plus
particulièrement sélectionnés, ils ont été nommés pSPM50, pSPM51, pSPM53,
pSPM55
et pSPM56 (cf. Figure 32).
19.2 Sous clonage et séquençage d'une partie de l'insert du cosmide pSPM36.
La sonde d'environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c
(cf. ci-dessus et figure 31, sonde I) a également été utilisée dans des
expériences de
Southern Blot sur l'ADN total de S. ambofaciens OSC2 digéré par l'enzyme Pst!.
Dans.:/,':'
les conditions d'hybridation décrite ci-dessus, cette sonde révèle un fragment
umque
.
:
=: 15 Pst! d'environ 6 kb lorsque hybridé sur total 4 S. ambofaciens
OSC2 digéré pet"
l'enzyme Pst!. Il existe un site Pst! au niveau de l'orf23c (cf. SEQ ID N 80)
mais auctin.
autre site PstI jusqu'à l'extrémité (site BamHI) de la séquence connue (cf.
SEQ ID N
1). Ce fragment PstI-BamHI a une taille d'environ 1.4 kb. Le fragment PstI de
6 kb
hybridé sur l'ADN total de S. ambofaciens digéré par l'enzyme PstI contient
donc une
région d'environ 4,6 kb située en amont de orf25c. Cette région est
susceptible de
contenir d'autres gènes dont les produits sont impliqués dans la voie de
biosynthèse de
la spiramycine. Il a été vérifié par digestion que le cosmide pSPM36 contenait
bien ce
fragment PstI de 6 kb. Ce fragment a été isolé à partir de pSPM36, dans le but
de
déterminer la séquence plus en amont de orf25c. Pour cela, le cosmide pSPM36 a
été
digéré par l'enzyme de restriction PstI. Le fragment PstI-PstI d'une taille
d'environ 6kb
a été isolé par électroélution à partir d'un gel d'agarose 0.8% puis cloné
dans le vecteur
pBK-CMV (4512bp) (commercialisé par la société Stratagene (La Jolla,
Californie,
USA)). Le plasmide ainsi obtenu a été nommé pSPM58 (cf. Figure 33) et la
séquence de
son insert a été déterminée. La séquence de cet insert est présentée en SEQ ID
N 134.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
166
Toutefois, toute la séquence n'a pas été déterminée et il subsite un trou
d'environ 450
nucléotides, la partie de la séquence non determinée a été notée par une
succession de
N dans la séquence correspondante.
19.3 Analyse des nouvelles séquences nucléotidiques, détermination des phases
ouvertes de lecture et caractérisation des gènes impliqués dans la biosynthèse
des
spiramycines.
La séquence de l'insert du cosmide pSPM58 obtenue a été analysée grâce au
programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier,
parmi
les phases ouvertes de lecture, les phases ouvertes de lecture présentant un
usage des
codons typique de Streptomyces. Cette analyse a permis de déterminer que cet
insert
comporte 4 nouvelles ORFs en amont de l'orf25e (cf. figure 34). Ces gènes ont
été
nommés orf26 (SEQ ID N 107), orf27 (SEQ ID N 109), orf28c (SEQ ID N 111, la

séquence de cette orf n'a pas été déterminée complètement puisqu'un trou
d'environ 450 ,.
nucléotide subsite lors du séquençage de l'insert de pSPM58, ces 450
nucléotides
;
,15 figurent sous la forme d'une sére de N. dans la sequence SEQ ID N
111) et or129 (la
- = 0.1J
séquence de cette dernière orf était incernplète dans cette insert). Lé c
ajouté dans le
nom du gène signifiant pour l'ORF en question que la séquence codante est dans

l'orientation inverse (cf. figure 34).
Les séquences protéiques déduites de ces phases ouvertes de lecture ont été
comparées avec celles présentes dans différentes bases de données grâce à
différents
programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997), CD-search,
(ces
deux programmes sont accessibles notamment auprès du National Center for
Biotechnology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson
W.
R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce programme est accessible
notamment auprès du centre de ressources INFOBIOGEN, Evry, France). Ces
comparaisons ont permis de formuler des hypothèses sur la fonction des
produits de ces
gènes et d'identifier ceux susceptibles d'être impliqués dans la biosynthèse
de
spiramycines.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
167
19.4 Sous clonage et séquençage d'une autre partie de l'insert du cosmide
pSPM36.
La sonde d'environ 0,8 kb obtenue par PCR avec les amorces ORF23c et ORF25c
(cf. ci-dessus et figure 31, sonde I) a également été utilisée dans des
expériences de
Southern Blot sur l'ADN total de la souche OSC2 digéré par l'enzyme StuI. Dans
les
conditions d'hybridation décrite ci-dessus pour cette solide, cette sonde
révèle un
fragment unique StuI d'environ 10 kb lorsque hybridé sur l'ADN total de la
souche
OSC2 digéré par l'enzyme StuI. Compte tenu de la présence d'un site StuI dans
l' oif23c
(cf. SEQ ID N 80) et de la localisation de ce site par rapport au site Pstl,
ce fragment
de 10 kb inclut la totalité du fragment Pstl précédemment étudié (insert de
pSPM58) et
permet d'avoir accès à une région non encore étudiée d'environ 4 kb. (cf
figure 33). Il a
été vérifié par digestion que le cosmide pSPM36 contenait bien ce fragment
StuI de 10
kb. Ce fragment a été isolé à partir du cosmide pSPM36, dans le but de
déterminer la
séquence de la fin d' orf29 et d'autres gènes plus en amont de orf29. Pour
cela, le .
= 15 cosmide pSPM36 a été digéré par l'enzyme de restriction StuL Le
fragment StuI-StuI
. .
' . d'une taille d'environ 10 kb a été isolé par 61ectrôélution à partir
d'un gel d'agarO444.>
0.8% puis cloné dans le vecteur pBK-CMV (4512bp) (commercialisé par la société

Stratagene (La Jolla, Californie, USA)). Le plasmide ainsi obtenu a été nommé
pSPM72
(cf. Figure 33). Ce dernier a ensuite été digéré par EcoRI (site EcoRI dans
l'insert de
pSPM58) et HindIII (site II n en dans le site de clonage multiple du vecteur,
immédiatement après le site StuI de l'extrémité de l'insert) (cf. Figure 33).
Le fragment
d'ADN EcoRI-HindIII ainsi obtenu, correspond à un fragment de l'insert du
plasmide
pSPM72 (cf. figure 33) et a été sous-cloné dans le vecteur pBC-SK+
(commercialisé par
la société Stratagene (La Jolla, Californie, USA)) digéré au préalable par
EcoRI et
HindIII. Le plasmide ainsi obtenu a été nommé pSPM73 et la séquence de son
insert a
été déterminée. La séquence de cet insert est présentée en SEQ ID N 135.
Un assemblage des séquences des inserts de pSPM58 et pSPM73 est présenté en
SEQ
ID N 106. Cette séquence part du site Pstl au niveau de l'orf23c (cf. SEQ ID
N 80) et
va jusqu'au site StuI au niveau de l'orf32c (cf. figure 34). La séquence de
l'orf28c (SEQ
ID N 111), n'étant pas complète (cf. exemple 19.3), une région d'environ 450

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
168
nucléotides n'est pas séquencée, ces 450 nucléotides figurent sous la forme
d'une série
de N dans la sequence SEQ ID N 106).
19.5 Analyse des nouvelles séquences nucléotidiques, détermination des phases
ouvertes de lecture et caractérisation des gènes impliqués dans la biosynthèse
des
spiramycines.
La séquence partielle de l'insert du cosmide pSPM73 obtenue a été analysée
grâce
au programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis
d'identifier, =
parmi les phases ouvertes de lecture, les phases ouvertes de lecture
présentant un usage
des codons typique de Streptomyces. Cette analyse a permis de déterminer que
cet insert
comporte 4 ORFs, une incomplètes et trois complètes (cf. figure 34). L'ORF
incomplète
correspond à la partie 3' de la séquence codante de orf29 ce qui à permis de
compléter la:
séquence de ce gène grâce à la séquence partielle de ce même orf obtenue lors
du
séquençage de l'insert du plasmide pSPM58 (cf exemple 19.2 et 19.3),
l'ensemble des
4 deux séquences à ainsi permis d'obtenir la Séquence complète de orf29.
Les 4 gènes ont
; : - ,;;. = ; : ::õ
' ainsi été n-oiiiniés .6d29 (SEQ 113), 'od30c (SEQ' ID Nb 115), orf31 (SEQ
118) et orf32c (SEQ ID N 120). Le c ajouté dans le nom du gène signifiant
pour
l'ORF en question que la séquence codante est dans l'orientation inverse (cf.
figure 34).
Les séquences protéiques déduites de ces phases ouvertes de lecture (SEQ ID N
114 pour orf29, SEQ ID N 116 et 117 pour orf30c, SEQ ID N 119 pour orf31 et
SEQ
ID N 121 pour orf32c) ont été comparées avec celles présentes dans
différentes bases
de données grâce à différents programmes : BLAST (Altschul et al., 1990)
(Altschul et
al., 1997), CD-search, (ces deux programmes sont accessibles notamment auprès
du
National Center for Biotechnology Information (NCBI) (Bethesda, Maryland,
USA)),
FASTA ((Pearson W. R & D. J. Lipman, 1988) et (Pearson W. R., 1990) (ce
programme
est accessible notamment auprès du centre de ressources INFOBIOGEN, Evry,
France).
Ces comparaisons ont permis de formuler des hypothèses sur la fonction des
produits de

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
169
ces gènes et d'identifier ceux susceptibles d'être impliqués dans la
biosynthèse de
spiramycines.
19.6 Sous clonage et séquençage d'une troisième partie de l'insert du cosmide
pSPM36.
Une sonde (fragment d'ADN de 0,8 kb) correspondant à une séquence interne à
orf32c a été obtenue par PCR en utilisant comme matrice l'ADN total de la
souche de
Streptomyces ambofaciens et les amorces suivantes
KF36: 5'- TTGCCGTAGCCGAGGACCAGCG-3' (SEQ ID N 151) et
KF37: 5'- CACATGGCCCTGGAGGACCCTG-3' (SEQ ID N 152).
Le produit PCR ainsi obtenu représente une séquence interne de l'orf32c. cettY
µ.
sonde à été utilisée dans des expériences de Southem Biot sur l'ADN
chromosomique
de la souche OSC2 et sur l'ADN du cosmide pSPM36 digérés par l'enzyme Pstl.Ei
"
utilisant. les Mêmes conditions d'hYbridatién.que:,celles décrites ci-dessus
(cf exemplet
= 19.1), cette sonde révèle deux fragments Pstl d'environ 3,4kb et 2,5kb
lorsque hybridée
sur l'ADN total de la souche OSC2 et sur l'ADN du cosmide pSPM36 digérés par
l'enzyme Pstl. Compte tenu de la présence d'un site Pstl dans la sonde
utilisée on peut
expliquer ces résultats. Le premier fragment d'ADN qui a une taille d'environ
3,4kb est
un fragment dont la séquence est déjà connue en totalité. La séquence du
fragment de
2,5 kb n'est connue que partiellement, sur une région de 700 pb. Ce fragment.
a été isolé
à partir du cosmide pSPM36 dans le but de déterminer la séquence de la fin de
l' orf32c
et d'autres gènes en amont de ce dernier. Pour cela, le cosmide pSPM36 a été
digéré par
l'enzyme de restriction Pstl. Le fragment Pstl-Pstl d'une taille d'environ
2,5kb a été
isolé par purification à partir d'un gel d'agarose 0.8% puis cloné dans le
vecteur pBK-
CMV (4518bp) (commercialisé par la société Stratagene (La Jolla, Californie,
USA)). Le
plasmide ainsi obtenu a été nommé pSPM79 (cf. Figure 41) et la séquence de son
insert
a été déterminée.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
170
La séquence de P orf28c (SEQ ID N 111) n'était pas complète (cf. exemple
19.3).
En effet, une région d'environ 450 nucléotides n'avait pas pu être déterminée,
ces 450
nucléotides figurent sous la forme d'une sére de N dans la sequence SEQ ID
N 106.
La séquence de la totalité de la région manquante a été déterminée par
reséquençage de
cette région. La séquence des inserts de pSPM58 et pSPM73 a donc été
déterminée en
entier. La séquence complète de la partie codante de P orf28c est présentée en
SEQ ID
N 141 et la protéine déduite de cette séquence en SEQ ID N 142. La séquence
de
l'insert du plasmide pSPM79 est présentée en SEQ ID N 161.
Un assemblage des séquences des inserts de pSPM58, pSPM73 et pSPM79 est
présentée en SEQ ID N 140 (cf. figure 41). Cette séquence part du site Pst!
au niveau
de Porf23c (cf. SEQ ID N 80) et va jusqu'au site PstI au niveau de Potf34c
(cf. figure
41).
19.7 Analyse des nouvelles séquences nucléotidioues, détermination des phases
ouvertes de lecture et caractérisation ,des gènes pouvant être impliqués dans
la
;'5õ , = ' = = :" ',..=

biosynthèse des spiramycinta. = ', =
= .
La séquence de l'insert du plasmide pSPM79 obtenue a été analysée grâce au
programme FramePlot (Ishikawa J & Hotta K. 1999). Ceci a permis d'identifier,
parmi
les phases ouvertes de lecture, les phases ouvertes de lecture présentant un
usage des
codons typique de Streptomyces. Cette analyse a permis de déterminer que cet
insert
comporte 3 ORFs, deux incomplètes (orf32c et orf34c) et une complète (orf33)
(cf.
figure 41).
La première ORF incomplète correspond à la partie 5' de la séquence codante de

orf32c. Ceci a permis de compléter la séquence de ce gène grâce à la séquence
partielle
de cette même orf obtenue lors du séquençage de l'insert du plasmide pSPM73
(cf.
exemple 19.4 et 19.5), l'ensemble des deux séquences à ainsi permis d'obtenir
la
séquence complète de orf32c. (SEQ ID N 145). Le c ajouté dans le nom du
gène

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
171
signifie pour l'ORF en question que la séquence codante est dans l'orientation
inverse
(cf. figure 41). L'off complète a été nommée orf33 (SEQ ID N 147). La
troisième ORF
a été nommée orf34c (SEQ ID N 149). Le e ajouté dans le nom du gène
signifie
pour l'ORF en question que la séquence codante est dans l'orientation inverse
(cf. figure
37). Les comparaisons effectuées entre le produit de cette off et les banques
de données
suggèrent que la partie C-terminale de cette protéine n'est pas dans le
produit déduit dé.
la séquence nucléotidique et donc que cette off serait plus longue et
continuerait en
dehors de la région séquencée.
Les séquences protéiques déduites de ces phases ouvertes de lecture ont été
comparées avec celles présentes dans différentes bases de données grâce à
différents
programmes : BLAST (Altschul et al., 1990) (Altschul et al., 1997), CD-search,
(ces
deux programmes sont accessibles notamment auprès du National Center for
Bioteclmology Information (NCBI) (Bethesda, Maryland, USA)), FASTA ((Pearson
W...,
R & D. J. Lipman, 1988) et (Pearson W. R, 1990) (ce programme est accessible
=
,=ri = 15 notamment auprès du centre de ressources 1NFOBIOGeN,:.Eµ4=Y France)
Ces
comparaisons Ont permis de formuler des hypothèses sur la fonction' des
produits dé CèS
gènes et d'identifier ceux susceptibles d'être impliqués dans la biosynthèse
de
spiramycines.
EXEMPLE 20: Analyse de la production d'intermédiaires de biosynthèse de
spiramycines :
20.1 Préparation des échantillons :
Les différentes souches à tester ont été cultivées chacune dans 7 erlenmeyers
chicanés de 500 ml contenant 70 ml de milieu MP5 (Pernodet et al., 1993). Les
erlens
ont été inoculés par 2.5 106 spores/mi des différentes souches de S.
ambofaciens et
mises à pousser à 27 C sous agitation orbitale de 250 rpm pendant 96 heures.
Les

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
172
cultures correspondant au même clone sont rassemblées, éventuellement filtrées
sur
filtre plissé, et centrifugées 15 min à 7000 tr/min.
Le pH du moût est ensuite ajusté à 9 avec de la soude et le surnageant est
extrait
par de la méthyl iso-butyryl cétone (MIBK). La phase organique (MIBK) est
alors
récupérée et évaporée. L'extrait sec est ensuite repris dans lml
d'acétonitrile, puis dilué
au 1/10 (100111 qsp lml avec de l'eau) avant d'être utilisé pour les analyses
en
chromatographie liquide couplée à la spectrométrie de masse (CL/SM).
20.2 Analyse des échantillons en CL/SM:
Les échantillons ont été analyés en CL/SM dans le but de déterminer la masse
des
différents produits synthétisés par les souches à tester.
La colonne de chromatographie liquide haute performance utilisée est une .
colonne Kromasil C8 150*4,6mm,m, 5gunrn, 100Å.
. =
La phase mobile est un gradient constitué d'un mélange d'acétonitrile et d'une
solution
aqueuse d'acide trifluoroacétique à 0.0%,,4, débit est fixé k 1 ml/min. La
température
s
= .
= du four colonne est inaintenife à 30 C.;
La détection UV en sortie de la colonne a été effectuée à deux longueurs
d'onde
différentes : 238 mn et 280 nm.
Le spectrométre de masse couplé à la colonne de chromatographie est un
appareil
Simple Quadripole commercialisé par la société Agilent, avec des tensions de
cone à 30
et à 70V.
20.3 Analyse des intermédiaires de biosynthèse produits par la souche 0S49.67:

La souche 0S49.67 dans laquelle le gène orf3 est inactivé par une délétion en
phase ne produit pas de spiramycines (cf. exemple 6 et 15).
Un échantillon a été préparé selon la méthode décrite ci-dessus (cf.
paragraphe 20.1) et
a été analysé par CL/SM comme décrit ci-dessus (cf. le paragraphe 20.2).

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
173
Plus particulièrement, l'analyse par chromatographie a été réalisée en
gradient de
solvant avec comme phase mobile : 20% d'acétonitrile du temps T=0 à 5min puis
montée linéaire à 30% à T=35 minutes, suivie d'un palier jusqu'à T=50 minutes.
Dans ces conditions, deux produits ont plus particulièrement été observés : un
absorbant à 238 nm (temps de rétention de 33.4 min) et un absorbant à 280 nm
(temps
de rétention de 44.8 min) (cf. figure 35). La figure 35 montre la
superposition des
chromatogrammes CLHP réalisés à 238 et 280nm (haut) ainsi que les spectres UV
des
molécules élués à 33,4 minutes et 44,8 minutes (bas).
Les conditions d'analyses en spéctrométrie de masse couplée étaient les
suivantes 4,
: le balayage se fait en mode scan, couvrant une gamme de masse comprise entre
100 et
1000 Da. Le gain de l'électro-multiplicateur était de 1V. Concernant la source

électrospray, la pression du gaz de nébulisation était de 35 psig, le débit du
gaz séchant
de 12.0 1.min-1, la température du gaz séchant de 350 C, la tension du
capilaire était ,
portée à +/- 3000 V. Ces expériences ont permis de déterminer la masse des
deux
produits séparés. Ces masses sont respectivement de 370 g/mole pour le produit
élué en
premier ([M-1120]+=-33 produit majoritaire) et 368 Wmple pour le second
produit (t1W,ii.':r.
=kpei
" H20]+=351 Produit =
Afin d'obtenir la structure, les produits mentionnés ci-dessus ont été isolés
et
purifiés dans les conditions suivantes : la phase mobile est un mélange d'une
solution
aqueuse d'acide trifluoroacétique à 0.05% et d'acétonitrile 70/30 (v/v). La
chromatographie est réalisée en régime isocratique avec un débit fixé de 1
lui/min. Dans
ces conditions, les temps de rétention des 2 produits sont respectivement de 8
et 13.3
minutes. De plus dans ce cas, l'échantillon préparé (cf. paragraphe 20.1)
n'est pas dilué
dans l'eau avant injecton de 100.
Les 2 produits sont récupérés à la sortie de la colonne chromatographique et
isolés
dans les conditions suivantes : une cartouche Oasis HLB 1 cc 30mg (Waters) est

conditionnée séquentiellement par 1 ml d'acétonitrile, puis 1 ml d'
eau/acétonitrile
(20v/80v) et lml d'eau/acétonitrile 80/20. L'échantillon est ensuite introduit
et la
cartouche lavée successivement par 1 ml d'eau/acétonitrile (95/5), lml

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
174
d'eau/acétonitrile deutéré (95/5), puis éluée avec 600111 d'eau/acétonitrile
deutéré 40/60.
La solution récupérée est ensuite directement analysée en RMN.
Les spectres RMN obtenus pour ces deux composés sont les suivants :
- Premier produit élué: Platenolide A: (Spectre 9646V)
Spectre 1H dans CD3CN(déplacements chimiques en ppm): 0,90 (3H, t, J=6Hz),
0,93
(3H, d, J=5Hz), 1,27 (311; d, J=5Hz), entre 1,27 et 1,40 (3H, m), 1,51 (1H,
m), 1,95
(1H, m), 2,12 (1H, m), 2,30 (1H, d, J=12Hz), 2,50 (1H, d, J=11Hz), 2,58 (1H,
dd, J=9
et 12 Hz), 2,96 (1H, d, J=7Hz), 3,43 (3H, s), 3,70 (1H, d, J=9Hz), 3,86 (1H,
d, J=7Hz),
4,10 (1H, m), 5,08 (1H, m), 5,58 (1H, dt, J=3 et 12Hz), 5,70 (1H, dd, J=8 et
12 Hz),
6,05 (1H, dd, J=9 et 12 Hz), 6,24 (1H, dd, J=9 et 12Hz).
-Deuxième produit élué: Platenolide B: (Spectre 9647V)
Spectre 1H dans CD3CN (déplacements chimiques en ppm): 0,81 (3H, t, J=6Hz),
0,89
(1H, m), 1,17 (3H, d, J=5Hz), 1,30 (4H, m), 1,47 (2H, m), 1,61 (1H, t,
J=10Hz), 2,20
(1H, m), 2,38 (1H, d, J=13Hz), 2,52 (IH, m), 2,58 (1H, m), 2,68 (1H, dd, J=8
et .131.1z);,,rti
3,10 (111., d, J=71-1), 3,50 (3H, s), 3,61 (IH, d, T-='811z);" 3,82 (111, d,
J=71-Ii),
-
m), 6,20 (1H, m), 6,25 (1H, dd, J=9 et 12 Hz), 6,58 (1H, d, J=12 Hz), 7,19
(1H, dd, J=9
et 12Hz).
Ces expériences ont ainsi permis de déterminer la structure de ces deux
composés.
Le premier produit élué est le platénolide A et le deuxième est le platénolide
B, la
structure déduite de ces deux méolécules est présentée en figure 36.
Il a également pu être déterminé grâce à la technique de CL/SM associée à la
RMN, dans des conditions légèremment différentes de celles décrites
précédemment
mais dont la mise au point est bien connue de l'homme du métier, que la souche

0S49.67 produit en plus du platénolide A et B un dérivé de ces deux composés.
Il s'agit
du platénolide A+mycaorse et du platénolide B+mycarose (la strucutre de ces
deux

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
175
composés est présenté en figure 40). Les résultats de l'analyse du moût de la
souche
0S49.67 sont présentés tableau 42.
Tableau 42. Les résultats de l'analyse CL/SM du moût de la souche 0S49.67
Identité ] Masses des ions Max
(mg/L) /. d'absorption
[M + Na]
Platénolide A 16,1 393,0 23 lnrn
[M +K]
Masse exacte=370 408,9
[M ¨ H20 + H]+
Formule
353,0
Moléculaire,-----C201-13406
[2M +
763,2
[M ¨ H20 +
Platénolide B 1.4 351,0 283nrn
./ [M + Na]
Masse exacte=368 391,0
[M +Kr'
Formule .
Moléculaire=C2o1132,-,1-1 406,9e .
314
[2M + Na] =
-
759,1
[M + Na]
Platénolide A + `mycarose' 4,27 537,0 230mn
Masse exacte=514 [M +Kr
553,0
Formule
Moléculaire=C27H4609
[M + Na]
Platénolide B + `mycarose' ND 535,0 284nrn
[M +Kr
Masse exacte=512 550,9
Formule [PlatB - H20 +
Moléculaire=C27H4409 H1+350,9

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
176
20.4 Analyse des intermédiaires de biosynthèse produits par la souche SPM509 :

La souche SPM509 dans laquelle le gène orf14 est inactivé (orf14::att3.Qaae-)
ne
produit pas de spiramycines (cf. exemple 13, 15 et 16). Un échantillon a été
préparé
selon la méthode décrite ci-dessus (cf. paragraphe 20.1) et a été analysé par
CL/SM
comme décrit ci-dessus (cf. le paragraphe 20.2 et 20.3). L'analyse des
intermédiaires de
biosynthèse présents dans le surnageani de culture de la souche SPM509
cultivée en
milieu MP5 a montré que cette souche ne produisait que la forme B du
platénolide
( platénolide B , cf. figure 36) mais pas la forme A ( platénolide A , cf.
figure 36).
EXEMPLE 21: Interruption du gène orf14 dans une souche interrompue dans le -
gène orf3 (0S49.67)
Le produit du gène orf14 est indispensable à la biosynthèse des spiramycines
(C:.,!;=
;.e.;
= Pi
exemple 13, 15 et 16 : la souche SPM509 dans laquelle ce gène est interrompu
nèS,e..
1:1 produit, plus de spipMyeines)., L'analyse des intetmécligires de
biosynthèse présents danai7,,:'.i
: '1.5 le surnageant de culture de la souche" SPM509 cultivée en milieu MP5
a montré que` -e
cette souche ne produisait que la forme B du platénolide mais pas la forme A
(cf.
exemple 20). Une des hypothèses pouvant expliquer cette observation est que le
produit
de orf14 soit impliqué dans la conversion de la forme B du platénolide en
forme A par
une étape enzymatique de réduction. Pour tester cette hypothèse, le gène orf14
a été
inactivé dans un mutant ne produisant plus de spiramycine, mais produisant les
formes
A et B du platénolide. C'est le cas de la souche 0S49.67 (cf. exemple 6 et 20)
dans
laquelle le gène orf3 est inactivé par une délétion en phase (Aorf3). Pour
inactiver le
gène orf14 dans cette souche le plasmide pSPM509 a été introduit par
transformation de
protoplastes de la souche 0S49.67 (Kieser, T et al., 2000). L'inactivation du
gène orf14
a déjà été décrite dans le cas de la souche OSC2 (cf. exemple 13) et il a été
procédé de la
même manière pour l'inactivation du gène orf14 dans la souche 0S49.67. Après
= transformation par le plasmide pSPM509, les clones sont sélectionnés pour
leur
résistance à l'apramycine. Les clones résistants à l'apramycine sont ensuite
repiqués
=

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
177
respectivement sur milieu avec apramycine et sur milieu avec hygromycine. Les
clones
résistants à Papramycine (ApraR) et sensibles à Phygromycine (HygS) sont en
principe
ceux où un double événement de crossing over s'est produit et dans lesquels le
gène
orf14 a été remplacé par une copie de orf14 interrompue par la cassette
att3É2aac-. Ces
clones ont été plus particulièrement sélectionnés et le remplacement de la
copie sauvage
de orf14 par la copie interrompue par la cassette a été vérifié par
hybridation Ainsi,
l'ADN total des clones obtenus, a été digéré par plusieurs enzymes, séparé sur
gel
d'agarose, transféré sur membrane et hybridé avec une sonde correspondant à la
cassette
att3Daac- pour vérifier que le remplacement de gène avait bien eu lieu. La
vérification
du génotype peut également être réalisée par toute méthode connue de l'homme
du
métier et notamment par PCR en utilisant les oligonucléotides appropriés et
séquençage
du produit PCR.
Un clone présentant les caractéristiques attendues (Aorf3, orf14::att3Daac-) a
été
plus particulièrement sélectionné et nommé SPM510. Il a pu en effet être
vérifié grâce
aux deux hybridations que la cassette att3Paac- était bien présente dans le
génome de. el
, ce clone et que l'on obtient bien' le 'profil dé digestion attendu'
dans "le cas d'un
remplacement, à la suite d'un double événement de recombinaison, du gène
sauvage
orf14 par la copie interrompue par la cassette att3É2aac- dans le génome de ce
clone.
EXEMPLE 22 : Complémentation fonctionnelle de l'interruption du gène orf14
22.1 Construction du plasmide pSPM519 :
Le gène orf14 a été amplifié par PCR en utilisant le couple d'oligonucléotides

suivant : EDR31 : 5' CCCAAGCTTCTGCGCCCGCGGGCGTGAA 3' (SEQ ID N
136) et EDR37 : 5' GCTCTAGAACCGTGTAGCCGCGCCCCGG 3' (SEQ ID N
137) et comme matrice l'ADN chromosomique de la souche OSC2. Les
oligonucléotides
EDR31 et EDR37 portent respectivement le site de restriction HindlIl et Xbal
(séquence
en gras). Le fragment de 1,2 kb ainsi obtenu a été cloné dans le vecteur pGEM-
T easy

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
178
(commercialisé par la société Promega (Madison, Wisconcin, USA)) pour donner
naissance au plasmide pSPM515. Ce plasmide a ensuite été digéré par les
enzymes de
restriction Hinall et XbaI. L'insert HindIllabal de 1,2 kb obtenu a été cloné
dans le
vecteur pUWL201 (cf. exemple 17.1) préalablement digéré par les mêmes enzymes.
Le
plasmide ainsi obtenu a été nommé pSPM519.
22.1 Transformation des souches SPM509 et SPM510 par le plasmide
pSPM519:
Le plasmide pSPM519 a été introduit dans les souches SPM509 (cf. exemple 13)
et SPM510 (cf. exemple 17) par transformation de protoplastes (Kieser, T et
al., 2000).
Après transformation, les clones sont sélectionnés pour leur résistance au
thiostrepton.
Les clones sont ensuite repiqués sur un milieu contenant du thiostrepton.
La souche SPM509 est une souche non productrice de spiramycines (cf exemple
13, 15 et 16 et figure 24). ta production en spiramycines de la souche
SPM509:'.
. . . transformée par le vecteur pSPM519 (souche nommée SPM509 pSPM519) a
,été
,

analysée en cultivant cette Sôu.Clie dans du milieu W5, ei:t:::pr¨éSetieé de
thiostrepton Les
-
surnageants de culture ont ensuite été analysés par CLHP (cf. exemple 16 et
17). tés
résultats de cette analyse sont présentés dans le tableau 43, les données sont
exprimées
en mg par litre de surnageant. Les résultats correspondent à la production
totale en
spiramycines (obtenue en additionnant la production en spiramycine I, II et
III). Il a été
observé que la présence du vecteur pSPM519 dans la souche SPM509 restaure la
production de spiramycines (cf. tableau 43).
Tableau 43. Production en spiramycines de la souche SPM509 transformée par le
vecteur pSPM519, (résultats exprimés en mg/1 de surnageant).
Souche Production en spyramicines
SPM509 pSPM519 58

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
179
La souche SPM510 transformée par le plasmide pSPM519 a été nommée
SPM510 pSPM509.
EXEMPLE 23 : Complémentation fonctionnelle de l'interruption du gène orf3 par
le gène tylB de S. fradiae
23.1 Construction du plasmide pOS49.52:
Le plasmide pOS49.52 correspond à un plasmide permettant l'expression de la
protéine TylB chez S. ambofaciens. Pour le construire, la séquence codante du
gène tyl.13
de S. fradiae (Merson-Davies & Cundliffe, 1994, numéro d'accès GenBank :
U08223
(séquence de la région), SFU08223 (séquence ADN) et AAA21342 (séquence
protéique)) a été introduite dans le plasmide pKC1218 (Bierman et al., 1992,
Kieser et
al., 2000, une souche de E. cou i contenant ce plasmide est accessible
notamment auprès
de l'ARS (NRRL) Agricultural Research Service Culture Collection) (Peoria,
USA), sous le numéro B-14790). De plus cette séquence codante à été placée
sous le:4
r;µ=e=-=== 15 contrôle du promoteur ermE* (cf
nô , lent exemple 17.1113,4.lb, et ai., 1985,
, ,
Bibb et al., 1994).
23.1 Transformation de la souches 0S49.67 par le plasmide pOS49.52:
La souche 0S49.67 dans laquelle le gène orf3 est inactivé par une délétion en
phase ne produit pas de spiramycines (cf. exemple 6 et 15). Le plasmide
pOS49.52 a été
introduit dans la souche 0S49.67 par transformation de protoplastes (Kieser, T
et al.,
2000). Après transformation, les clones sont sélectionnés pour leur résistance
à
l'apramycine. Les clones sont ensuite repiqués sur un milieu contenant de 1'
apramycine.
Un clone a été plus particulièrement sélectionné et a été nommé 0S49.67
pOS49.52.
Comme il a été démontré ci-dessus, la souche 0S49.67 ne produit pas de
spiramycines (cf. exemple 6 et 15). La production en spiramycines de la souche
0S49.67 transformée par le vecteur pOS49.52 a été analysée par la technique
décrite
dans l'exemple 15. Il a ainsi pu être démontré que cette souche possède un
phénotype
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
180
producteur de spiramycines. Ainsi la protéine TylB permet la complémentation
fonctionnelle de l'interruption du gène orf3.
EXEMPLE 24 : Amélioration de la production en spiramycines par surexpression
du gène orfl8c
24.1 Construction du plasmide pSPM75:
Le gène orf28c a été amplifié par PCR en utilisant un couple
d'oligonucléotides
comportant un site de restriction Hind111 ou un site de restriction BamHI. Ces
amorces
ont la séquence suivante :
KF30 :5' AAGCTTGTGTGCCCGGTGTACCTGGGGAGC 3' (SEQ ID N 138)
avec un site de restriction HindlII (qui figure en gras)
KF31 : 5' GGATCCCGCGACGGACACGACCGCCGCGCA 3' (SEQ ID N 139)
-
avec le site de restriction B amHI (qui figure en gras)
Les amorces KF30 et KF31 portent *respectivement le site de restriction Hinall
:
7
B amHI (séquence en gras). Le couple d'amorces le30 et k.F31 permet
d'amplifier un
, =
fragment d'ADN d'une taillecl'en.
1,5 kb contènint le 'gène- O rfi8c' en utiliSanIA
comme matrice le cosmide pSPM36 (cf. ci-dessus). Le fragment de 1,5 kb ainsi
obtenu a
été cloné dans le vecteur pGEM-T easy (commercialisé par la société Promega
(Madison, Wisconcin, USA)) pour donner naissance au plasmide pSPM74. Le
plasmide
pSPM74 a ensuite été digéré par les enzymes de restriction HindlIl et BamHI et
l'insert
HindIll1BamHI d'environ 1,5 kb obtenu a été sous cloné dans le vecteur pUWL201
(cf.
exemple 17.1) préalablement digéré par les mêmes enzymes. Le plasmide ainsi
obtenu a
été nommé pSPM75, il contient l'ensemble de la séquence codante de orfl8e
placée
sous le contrôle du promoteur ermE*.
24.2 Transformation de la souche OSC2 par le plasmide pSPM75:
Le plasmide pSPM75 a été introduit dans les souches OSC2 par transformation
de protoplastes (Kieser, T et al., 2000). Après transformation des
protoplastes, les
clones sont sélectionnés pour leur résistance au thiostrepton. Les clones sont
ensuite

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
181
repiqués sur un milieu contenant du thiostrepton et la transformation par le
plasmide est
vérifiée par extraction de plasmides. Deux clones ont plus particulièrement
été
sélectionnés et nommés OSC2/pSPM75(1) et OSC2/pSPM75(2).
Un échantillon de la souche OSC2/pSPM75(2) a été déposé auprès de la
Collection Nationale de Cultures de Microorganismes (CNCM) Institüt Pasteur,
25, rue
du Docteur Roux 75724 Paris Cedex 15, France, le 6 octobre 2003 sous le numéro

d'enregistrement 1-3101.
Afin de tester l'effet de la surexpression du gène orfl8c sur la production de

spiramycines, la production en spiramycines des clones OSC2/pSPM75(1) et
OSC2/pSPM75(2) a été testée par la technique décrite dans l'exemple 15.
L'analyse de
la production en spiramycines de la souche OSC2 a également été effectée en
parallèle
pour comparaison. Il a ainsi pu être observé que la présence du plasmide
pSP1v115
augmente significativement la production en spiramycines de la souche OSC2.
Ceci
démontre que la surexpression de orfl8c conduit à une augmentation de la
production
' .15 en
spiramycines et confirme son rôle en tant que régulateur. .
La production en spiramycines des clones OSC2/pSPM75(1) et '
OSC2/pSPM75(2) a également été analysée par CLHP (de la même manière que dans
l'exemple 17.2). L'analyse de la production en spiramycines de la souche OSC2
a
également été effectée en parallèle pour comparaison. Les résultats de cette
analyse sont
présentés dans le tableau 44, les données sont exprimées en mg par litre de
surnageant.
Les résultats correspondent à la production totale en spiramycines (obtenue en

additionnant la production en spiramycine I, II et III).
Tableau 44. Production en spiramycines des souches dérivées de OSC2
transformé par pSPM75, (résultats exprimés en mg/1).
Souche Spiramycines
OSC2 50

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
182
OSC2/pSPM75(1) 120
OSC2/pSPM75(2) 155
Ainsi, il est observé que la présence du plasmide pSPM75 augmente
significativement la production en spiramycines de la souche OSC2. Ceci
démontre bien
que la surexpression de orf28e a un effet positif sur la production en
spiramycines.
EXEMPLE 25: Analyse de la production d'intermédiaires de biosynthèse de
spiramycines d'une souche inactivée dans le gène orf8 :
La souche 0S49.107, dans laquelle le gène orf8 est inactivé par insertion de

cassette Dhyg, ne produit pas de spiramycines (cf. exemple 7 et 15). Le gène
orf8 code
' 10 une protéine présentant une relative forte similitude avec plusieurs
aminotransférases et ,:-fe=
,..=,
. :=====::
..= suggère fortement que le gène oie code ,une 4 iiMino4ransférase
responsable de la
ed.'.;eW
réaction de transamination nécessaire à la biosynthèse de la forésamine (cf.
figure 6)4?,Irii
On s'attend donc à ce que la biosynthèse des spiramycines soit bloquée au
stade de la
forocidine (cf. figure 7). La souche 0S49.107 qui est non productrice de
spiramycine
devrait donc produire de la forocidine.
Un échantillon de surnageant de la souche 0S49.107 a été préparé selon la
méthode décrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a été
analysé par
CL/SM comme décrit ci-dessus (cf. le paragraphe 20.2 et 20.3). En mode SIM, la
masse
558 relative à l'ion moléculaire de la forocidine a été sélectionné et
plusieurs pics ont
été détectés. La présence de composés de masse 558 est compatible avec
l'hypothèse du
rôle de orf8 dans synthèse de forosamine.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
183
EXEMPLE 26: Analyse de la production d'intermédiaires de biosynthèse de
spiramycines d'une souche inactivée dans le gène orf12 :
La souche SPM507, dans laquelle le gène orf12 est inactivé, ne produit pas de
spiramycines (cf. exemple 11 et 15). Le gène orf12 coderait une 3,4
déshydratase
responsable de la réaction de déshydratation nécessaire à la biosynthèse de la
forosamine (cf. figure 6). On s'attend donc à ce que la biosynthèse des
spiramycines soit
bloquée au stade de la forocidine (cf. figure 7). La souche SPM507 qui est non
productrice de spiramycine devrait donc produire de la forocidine. .
Un échantillon de surnageant de la souche SPM507 a été préparé selon la
méthode
décrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a été analysé
par CL/SM
comme décrit ci-dessus (cf. le paragraphe 20.2 et 20.3). Dans ces conditions,
le temps de
rétention de la forocidine est d'environ 12,9 minutes. En mode SIM, la masse
558
relative à l'ion moléculaire [M+Hr de la forocidine a été sélectionné et un
pic a été
détecté. La présence d'un composé à 558 permet de valider l'hypothèse du rôle
du ?;
=
produit de orf12 dans la biosynthèse des spiramycines.
. s{e
-e
Toutefois, la forocidine est présente en 'quantité relativement faible et dans
ces
conditions, un produit absorbant à 238 nm a plus particulièrement été observé
(temps Clé
rétention de 17,1 min). L'analyse en LC/SM a permis de déterminer la masse de
ce
composé qui est de 744,3 g/mole ([M+Hr=744,3 produit majoritaire).
Afin d'obtenir la structure, le produits mentionné ci-dessus a été isolé et
purifié
dans les conditions décrites précedemment (cf. paragraphe 20.1) ). La phase
organique
(MIBK) est alors récupérée et évaporée. L'extrait sec est repris avec de l'eau
et extrait
avec de l'heptane. La solution aqueuse est ensuite extraite par fixation sur
une cartouche
Oasis HLB 1 g (Waters SAS, St-Quentin en-Yvelines, France). Le composé est
récupéré
par élution avec un mélange eau/acétonitrile 30/70. Cette solution est ensuite
injectée
(100 L) sur la colonne analytique et les fractions récupérées sur cartouche
Oasis HLB 1
cc 30mg (Waters). Avant utilisation, les cartouches Oasis HLB 1 cc 30mg
(Waters) sont
conditionnées séquentiellement par de l'acétonitrile, puis un
mélangeeau/acétonitrile
(20v/80v) et un mélanged'eau/acétonitrile 80/20.
=

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
184
La cartouche Oasis HLB 1 cc 30mg (Waters) est ensuite lavée successivement par

1 ml d'eau/acétonitrile (95/5), lml d'eau/acétonitrile deutéré (95/5), puis
éluée avec
600111 d'eau/acétonitrile deutéré 40/60. La solution récupérée est ensuite
directement
analysée en RMN.
Le spectre RMN obtenu pour ce composé est le suivant (Spectre RMN 19312V) :
Spectre 1H dans CD3CN/D20 (déplacements chimiques en ppm): 0,92 (3H, d,
J=6Hz),
1,10 (1H, m), 1,14 (3H, s), 1,17 (3H, d, J=6Hz), 1,22 (3H, d, J=6Hz), 1,25
(3H, d,
J=6Hz), 1,40 (1H, m), 1,75 (1H, dd, J=12 et 2Hz), 1,81 (1H, m), 1,90 (1H, d,
J=12Hz),
2,05 (1H, m), 2,12 (3H, s), 2,15 (1H, m), 2,35 (2H, m), 2,45 (6H, s large),
2,53 (1H, m),
2,64 (1H, dd, J=12 et 9Hz), 2,80 (1H, dd, J=9 et 16Hz), 2,95 (1H, d, J=8Hz),
3,23 (2H,
m), 3,34 (1H, d, J=7Hz), 3,45 (3H, s), 3,49 (1H, m), 3,93 (1H, dd, J=7 et
3Hz), 4,08
(1H, m), 4,37 (1H, d, J=6Hz), 4,88 (1H, m), 5,05 (2H, m), 5,65 (2H, m), 6,08
(1H, dd,
J=8 et 12Hz), 6,40 (1H, dd, J=12 et 9Hz), 9,60(1H, s).
Ces expériences ont ainsi permis de déterminer la structure de ce composé,
cellé-lb
,
0 ci est présentée en figure 38. .=
-
e"- *O."- " = = - =
EXEMPLE 27: Analyse de la production d'intermédiaires de biosynthèse de
spiramycines d'une souche inactivée dans le gène orf5* :
La souche SPM501 possède le génotype orf6*::attlQhyg+. Grâce à l'effet polaire
de l'insertion de la cassette att1S2hyg+ dans le gène orf 6*, il a pu être
déterminé que le
gène orf 5* est indispensable à la voie de biosynthèse des spiramycines. En
effet,
l'insertion de la cassette excisable dans la partie codante du gène orf 6*
entraîne un arrêt
total de la production en spiramycines par effet polaire sur l'expression du
gène orf5*.
Cependant, une fois que la cassette insérée a été excisée (et donc lorsque
seul le gène
orf6* est inactivé, cf exemples 14 et 15), on restaure une production de
spiramycine I.
Ceci démontre que le gène orf 5* est indispensable à la biosynthèse des
spiramycines
puisque son inactivation entraîne un arrêt total de la production en
spiramycines.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
185
Le gène orf5* code une protéine présentant une relative forte similitude avec
plusieurs 0-méthyltransférases. Le gène orf5* serait une 0-méthyl transférase
impliquée
dans la biosynthèse du platénolide. Pour vérifier cette hypothèse, des
expériences
d'analyse CL/SM et de RMN ont été conduites sur une souche de S. ambofaciens
de
génotype orf6*::attlDhyg+ obtenue à partir d'une souche surproduisant les
spiramycines.
Un échantillon du surnageant de cette souche a été préparé selon la méthode
décrite ci-dessus (cf. exemple 16, sans extraction au MIBK) et a été analysé
par CL/SM
=
comme décrit ci-dessus (cf le paragraphe 20.2 et 20.3). Toutefois, la colonne
utilisée est
7 ;'=
une colonne X-Terra (Waters SAS, St-Quentin en-Yvelines, France), et la
tension de
cone du spectromètre est réglée à 380V pour obtenir la fragmentation du
composé
analysé. Dans ces conditions, un produit dont le temps de rétention est
d'environ 13,1 ,
minutes est observé. Le spectre de masse de ce composé a une allure similaire
à celui de'
la spiramycine I mais l'ion moléculaire est à 829. La différence de masse de
14 par
rapport à la masse de la spiramycine peut s'expliquer par l'absence de
groupement .t1
méthyl sur l'oxygène portée par le carbone n 4 du cycle lactone (la strucutre
de ce
. .
composé est présenté en figure 39). La présence d'un CUMPOaé à 829 permet de
viiIi4r:.:"44,
l'hypothèse du rôle de orf5* dans la biosynthèse des spiramycines.
Par un test microbioogique effectué sur une souche sensible de M. luteus (cf.
exemple
15 et figure 18) il a été démontré que la molécule intermédiaire (spiramycine
moins
groupement méhyle dont la structure est présentée en figure 39) produite par
la souche
orf6* .....Qatthyg+ est beaucoup moins active (d'un facteur 10) que la
spiramycine
d'origine avec le groupement méthyl en position 4.
EXEMPLE 28 : Construction de nouvelles cassettes excisables :
De nouvelles cassettes excisables ont été construites. Ces cassettes sont très

semblables aux cassettes excisables déjà décrites dans l'exemple 9. La
différence
principale entre les anciennes et les nouvelles cassettes est l'absence dans
ces dernières

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
186
des séquences correspondant aux extrémités de l'inteiposon n, séquences qui
contiennent un terminateur de transcription provenant du phage T4.
Dans les cassettes sans terminateur, le gène qui confère la résistance à un
antibiotique est flanqué des séquences attR et attL permettant l'excision. Le
gène de
résistance est le gène aac(3)IV qui code une acétyltransferase qui confère la
résistance à
l'apramycine. Ce gène est présent dans la cassette Daac (numéro d'accès
GenBank :
X99313, Blondelet-Rouault, M.H. et al., 1997) et e été amplifié par PCR en
utilisant
comme matrice le plasmide pOSK1102 (cf. ci-dessus) et comme amorces les .
oligonucléotides KF42 et KF'43 contenant chacun le site de restriction Hind111
(en
gras)(AAGCTT) en 5'.
KF42: 5'-AAGCTTGTACGGCCCACAGAATGATGTCAC-3' (SEQ ID N 153)
et
KF43: 5'-AAGCTTCGACTACCTTGGTGATCTCGCCTT-3' (SEQ ID N 154).
= Le produit PCR obtenu d'environ lkb a été cloné dans le vecteur E cou
pGEMT.
Easy donnant naissance au plasmide pSPM83. .
Le vecteur pSPM83 a été digéré Par l'enzyme de restriction HindIII. Le
fragniere
. . ,
Hindi:II-âne' de l'insert a-été isolé par purification à Partir d'un *gel
d'agarose
puis cloné dans le site HindIII situé entre les séquences attL et attR des
différents
plasmides portant les différentes cassettes excisables possibles (cf. exemple
9 et figure
27) de façon à remplacer le fragment HindlIl correspondant à Qacc par le
fragment
Hinc1111 correspondant au gène aac seul. Ceci a permit d'obtenir les cassettes
attlaac,
att2aac et att3aac (selon la phase souhaitée, cf. exemple 9). Selon
l'orientation du gène
aac par rapport aux séquences attL et attR, on distingue attlaac+, attlaac-,
att2aac+,
att2aac-, att3aac+ et att3aac- (selon les mêmes conventions que celles
adoptées dans
l'exemple 9).

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
187
EXEMPLE 29: Construction d'une souche de S. ambofaciens interrompue dans le
gène orf28c :
L'inactivation du gène orf28c a été réalisée grâce à la technique des
cassettes
excisables. La cassette excisable att3aac+ (cf. exemple 28) a été amplifiée
par PCR en
' utilisant comme matrice le plasmide pSPM101 (Le plasmide pSPM101 est un
plasmide
= dérivé du vecteur pGP704Not (Chaveroche et al., 2000) (Miller VL &
Mekalanos JJ,
1988) dans lequel la cassette att3aac+ a été clonée comme un fragment EcoRV
dans l9
site unique EcoRV de pGP704Not) et à l'aide des amorces suivantes :
KF32:
5' CAACCGCTTGAGCTGCTCCATCAACTGCTGGGCCGAGGTATCGCGCGCG
CTTCGTTCGGGACGAA 3' (SEQ ID N 155)
et KF33:
.=
5' TGGGTCCCGCCGCGCGGCACGACTTCGACTCGCTCGTCTATCTGCCTCTT
.-" 15 CGTCCCGAAGCAACT 3' (SEQ ID N 156)
= = ;
-=
=
= Les 39 nucléotides situés à l'extrémité 5' de ces oligonucléotides
comportent une
.z ..=
séquence correspondant à une séquence dans le gène orfl8e et les 26
nucléotides situés
le plus en 3' (figuré en gras et soulignés ci-dessus) correspondent à la
séquence d'une des
extrémités de la cassette excisable att3aac+
Le produit de PCR ainsi obtenu a -été utilisé pour transformer la souche E.
cou hyper-
recombinante DY330 (Yu et al., 2000) (cette souche contient les gènes exo, bet
et gain
du phage lambda intégrés dans son chromosome, ces gènes sont exprimés à 42 C,
elle a
été utilisée à la place de la souche E. cou KS272 (Chaveroche et al., 2000))
contenant le
cosmide pSPM36. Ainsi, les bactéries ont été transformées par électroporation
par ce
produit de PCR et les clones ont été sélectionnés pour leur résistance à
l'apramycine. Les
cosmides des clones obtenus ont été extraits et digérés par l'enzyme de
restriction
BamHI, dans le but de vérifier que le profil de digestion obtenu correspondait
au profil
attendu s'il y a eu insertion de la cassette (att3aac+) dans le gène o,128c,
c'est à dire s'il
y avait bien eu recombinaison homologue entre les extrémités du produit PCR et
le gène

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
188
cible. La vérification de la construction peut également être réalisée par
toute méthode
connue de l'homme du métier et notamment par PCR en utilisant les
oligonucléotides
appropriés et séquençage du produit de PCR. Un clone dont le cosmide possède
le profil
attendu a été sélectionné et le cosmide correspondant a été nommé pSPM107. Ce
cosmide est un dérivé de pSPM36 dans lequel orf28c est interrompue par la
cassette
att3aac+. L'insertion de la cassette, s'accompagne d'une délétion dans le gène
orf28c,
l'interruption commence au niveau du 28ème codon de orf28c Il reste après la
cassette
les 137 derniers codons de orf28c.
;
Le cosmide pSPM107 a dans un premier temps été introduit dans la souche E. cou
DII5a puis dans la souche Streptomyces ambofaciens OSC2 par transformation de
protoplastes. Après transformation, les clones sont sélectionnés pour leur
résistance à
l'apramycine. Les clones résistants à l'apramycine sont ensuite repiqués
respectivement l;
=
sur milieu avec apramycine (antibiotique B) et sur milieu avec puromycine
(antibiotique
15 A) (cf. figure 9). Les clones résistants à l'apramycine (ApraR) et
sensibles à la.
=
I "=''' puromycine (PuroS) sont en principe, ceux où un double événement de
crossing ove
s'est produit e qui Possèdent le gène ief28e interrompu par la cassette
att3aac+.Ces
clones ont été plus particulièrement sélectionnés et le remplacement de la
copie sauvage
de orf28c par la copie interrompue par la cassette a été vérifié par
hybridation. Ainsi,
l'ADN total des clones obtenus, a été digéré par plusieurs enzymes, séparé sur
gel
d'agarose, transféré sur membrane et hybridé avec une sonde correspondant à la
cassette
att3aac+ pour vérifier la présence de la cassette au locus attendu dans l'ADN
génomique des clones obtenus. La vérification du génotype peut également être
réalisée
par toute méthode connue de l'homme du métier et notamment par PCR en
utilisant les
oligonucléotides appropriés et séquençage du produit de PCR.
Un clone présentant les caractéristiques attendues (orf28c::att3aac+) a été
plus
particulièrement sélectionné et nommé SPM107. Ce clone possède donc le
génotype :
orf28c::att3aac+ et a été nommé SPM107. Il est inutile de procéder à
l'excision de la
cassette pour l'étude de l'effet de l'inactivation de orf28c, au vu de
l'orientation des
gènes (cf. figure 3). En effet, le fait que orf29 soit orienté en sens opposé
à orf28c

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
189
montre que ces gènes ne sont pas co-transcrits. L'utilisation d'une cassette
excisable
permet en revanche d'avoir la possibilité de se débarrasser du marqueur de
sélection à
tout moment, notamment par transformation par le plasmide pOSV508.
Afin de tester l'effet de l'extinction du gène orf28c sur la production de
spiramycines, la production en spiramycines de la souche SPM107 a été testée
par la
techniqiie décrite dans l'exemple 15. Il a ainsi pu être démontré que cette
souche
possède un phénotype non producteur de spiramycines. Ceci démontre que le gène

orf28c est un gène essentiel à la biosynthèse de la spiramycine chez S.
ambofaciens.
EXEMPLE 30: Construction d'une souche de S. ambofaciens interrompue dans le
gène orf31 :
L'inactivation du gène orf31 a été réalisée grâce à la teclmique des
cassetteSM.,
excisables. La cassette excisable att3aac+ a été amplifiée par PCR en
utilisant comii.W.,i15
matrice le plasmide pSPM101 et les oligonucléotides EDR71 et EDR72.
,
EDR71: õ
'"
I" ,;=1:',`e
5' CGTCATCGACGTGCGGGGAAGACAGAGGTGATACCGATGATCGCGCGC '
GCTTCGTTCGGGACGAA 3' (SEQ ID N 157)
EDR72:
5' GCCAGCACCTCGTCCAGCTGCTCGACGGAACTCACCCCCATCTGCCTCT
TCGTCCCGAAGCAACT 3' (SEQ ID N 158)
Les 39 nucléotides situés à l'extrémité 5' de ces oligonucléotides comportent
une
séquence correspondant à une séquence dans le gène orf31 et les 26 nucléotides
situés le
plus en 3' (figurés en gras et soulignés ci-dessus) correspondent à la
séquence d'une des
extrémités de la cassette excisable att3aac+.
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E.
colt
KS272 contenant le plasmide pKOBEG et le cosmide pSPM36, comme décrit par
Chaveroche et al. (Chaveroche et al., 2000) (cf. figure 12 pour le principe,
le plasmide

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
190
pOS49.99 doit être remplacé par le cosmide pSPM36 et le plasmide obtenu n'est
plus
pSPM17 mais pSPM543). Ainsi, les bactéries ont été transformées par
électroporation
par ce produit de PCR et les clones ont été sélectionnés pour leur résistance
à
l'apramycine. Les cosmides des clones obtenus ont été extraits et digérés par
plusieurs
enzymes de restriction, dans le but de vérifier que le profil de digestion
obtenu
correspond au profil attendu s'il y a eu insertion .de la cassette (att3aac+)
dans le gène
oi131, c'est à dire s'il y a bien eu recombinaison homologue entre les
extrémités du
produit PCR et le gène cible. La vérification de la construction peut
également être
réalisée par toute méthode connue de l'homme du métier et notamment par PCR en
utilisant les oligonucléotides appropriés et séquençage du produit de PCR. Un
clone
dont le cosmide possède le profil attendu a été sélectionné et le cosmide
correspondant
a été nommé pSPM543. Ce cosmide est un dérivé de pSPM36 dans lequel orf3/ est
interrompue par la cassette att3aac+ (cf. figure 12). L'insertion de la
cassette
s'accompagne d'une délétion dans le gène orf3/, l'interruption commence au
niveau de
,
trente sixième codon de orf31. Il reste après la cassette les 33 derniers
codons de orf31.,
=
Le cosmide pSPM543 à été: mtroduit dans la âoùèhé Streptomyces ambofacienS,
OSC2 (cf. ci-dessus) par transformation de protoplastes (Kieser, T et al.,
2000). Après '
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine. Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
milieu avec
apramycine (antibiotique B) et sur milieu avec puromycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à la puromycine
(PuroS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orf31 interrompu par la cassette att3aac+. Ces clones ont
été plus
particulièrement sélectionnés et le remplacement de la copie sauvage de orf31
par la
copie interrompue par la cassette a été vérifié par hybridation. Ainsi, l'ADN
total des
clones obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré
sur membrane et hybridé avec une sonde correspondant à la cassette att3aac+
pour
vérifier la présence de la cassette au locus attendu dans l'ADN génomique des
clones
obtenus. Une deuxième hybridation a été effectuée en utilisant comme sonde un

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
191
fragment d'ADN obtenu par PCR et correspondant à une très large partie de la
séquence
codante du gène orf31.
La vérification du génotype peut également être réalisée par toute méthode
connue
de l'homme du métier et notamment par PCR en utilisant les oligonucléotides
appropriés et séquençage du produit de PCR.
Un clone prég.éntant les caractéristiques attendues (orf31::att3aac+) a été
plus
particulièrement sélectionné et nommé SPM543. Il a pu en effet être vérifié
grâce aux
deux hybridations que la cassette att3aac+ était bien présente dans le génome
de ce
clone et que l'on obtient bien le profil de digestion attendu dans le cas d'un
remplacement, à la suite d'un double événement de recombinaison, du gène
sauvage par
la copie interrompue par la cassette att3aac+ dans le génome de ce clone. Ce
clone
possède donc le génotype : orf31::att3aac+ et a été nommé SPM543. Il est
inutile de
procéder à l'excision de la cassette pour l'étude de l'effet de l'inactivation
de orf31, au
vu de l'orientation des gènes (cf. figure 3). En effet, le fait que orf32c
soit orienté en
'
sens opposé à 0131 montre que ces gènes ne sont pas co-transcrits.
L'utilisation d'une
.!- . cassette excisable permet en revanche d'avoir la possibilité de se
débarrasser du
marqueur de sélection à tout théMént, notamment par transformation Par le
plaitnidé,
, .
pOSV508.
Afin de tester l'effet de l'extinction du gène orf31 sur la production de
spiramycines, la production en spiramycines de la souche SPM543 a été testée
par la
technique décrite dans l'exemple 15. Il a ainsi pu être démontré que cette
souche
possède un phénotype non producteur de spiramycines. Ceci démontre que le gène
orf31
est un gène essentiel à la biosynthèse de la spiramycine chez S. ambofaciens.
EXEMPLE 31 Construction d'une souche de S. ambofaciens interrompue dans le
gène orf32c:
L'inactivation du gène orf32c a été réalisée grâce à la technique des
cassettes
excisables. La cassette excisable att3aac+ a été amplifiée par PCR en
utilisant comme
matrice le plasmide pSPM101 et à l'aide des amorces suivantes :
=

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
192
KF52:
5' GATCCGCCAGCCTCACGTCACGCCGCGCCGCCTCCCTGACATCGCGCGC
GCTTCGTTCGGGACGAA 3' (SEQ ID N 159).
et KF53:
5' GAGGCGGACGTCGGTACGCGGTGGGAGCCGGAGTTCGACAATCTGCCTC
TTCGTCCCGAAGCAACT 3' (SEQ ID N 160).
Les 40 nucléotides situés à l'extrémité 5' de ces oligonucléotides comportent
une ,
séquence correspondant à une séquence dans le gène orf32c et les 26
nucléotides situés
le plus en 3' (figuré en gras et soulignés ci-dessus) correspondent à la
séquence d'une
des extrémités de la cassette excisable att3aac+.
Le produit de PCR ainsi obtenu a été utilisé pour transformer la souche E.
colt
hyper-recombinante DY330 (Yu et al., 2000) contenant le cosmide pSPM36. Ainsi,
les -
bactéries ont été transformées par électroporation par ce produit de PCR et
les clones
ont été sélectionnés pour leur résistance à l'apramycine. Les cosmides des
clones .
obtenus ont été extraits et digérés par l'enzymes de restriction Bamill, dans
le but de .Z.
; =
;
= vérifier que le profil de digestion obtenu' correspOnd au profil attendu
s'il y a eirl.
insertion de la cassette (att3aac+) dans le gène orf32c, c'est à dire s'il y a
bien eu
recombinaison homologue entre les extrémités du produit PCR et le gène cible.
La
vérification de la construction peut également être réalisée par toute méthode
connue de
l'homme du métier et notamment par PCR en utilisant les oligonucléotides
appropriés
et séquençage du produit de PCR. Un clone dont le cosmide possède le profil
attendu a
été sélectionné et le cosmide correspondant a été nommé pSPM106. Ce cosmide
est un
dérivé de pSPM36 dans lequel orf32c est interrompue par la cassette att3aac+.
L'insertion de la cassette s'accompagne d'une délétion dans le gène orf32c,
l'interruption
commence au niveau du 112ème codon de orf32c. Il reste après la cassette les
91
derniers codons de orf32c.
Le cosmide pSPM106 a dans un premier temps été introduit dans la souche E.
coli
DH5a puis, dans la souche Streptomyces ambofaciens OSC2 par transformation.
Après

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
193
transformation, les clones sont sélectionnés pour leur résistance à
l'apramycine. Les
clones résistants à l'apramycine sont ensuite repiqués respectivement sur
milieu avec
apramycine (antibiotique B) et sur milieu avec puromycine (antibiotique A)
(cf. figure
9). Les clones résistants à l'apramycine (ApraR) et sensibles à la puromycine
(PuroS)
sont en principe ceux où un double événement de crossing over s'est produit et
qui
possèdent le gène orf32c interroeu par la cassette att3aac+. Ces clones ont
été plus
particulièrement sélectionnés et le remplacement de la copie sauvage de orf32c
par la
copie interrompue par la cassette a été vérifié par hybridation. Ainsi, l'ADN
total des'
clones obtenus, a été digéré par plusieurs enzymes, séparé sur gel d'agarose,
transféré
sur membrane et hybridé avec une sonde correspondant à la cassette att3aac+
pour
vérifier la présence de la cassette dans l'ADN génomique des clones obtenus.
La
vérification du génotype peut également être réalisée par toute méthode connue
de
l'homme du métier et notamment par PCR en utilisant les oligonucléotides
appropriés
i.q
et séquençage du produit de PCR.
!lt
Un clone présentant les caractéristiques attendues (orf32c::att3aac+) a été
pluS.
re:
particulièrement sélectionné : ce chine pôssède donc le génotype :
orj32c::att3aact't
, õ
4e,
été nommé SPM106. Il est inutile de procéder à l'excision de la cassette pour
l'étude de'
l'effet de l'inactivation de orf32c, au vu de l'orientation des gènes (cf.
figure 3). En
effet, le fait que orf33 soit orienté en sens opposé à orf32c montre que ces
gènes ne sont
pas co-transcrits. L'utilisation d'une cassette excisable permet en revanche
d'avoir la
possibilité de se débarrasser du marqueur de sélection à tout moment,
notamment par
transformation par le plasmide pOSV508.
Afin de tester l'effet de l'extinction du gène orf32c sur la production de
spiramycines, la production en spiramycines de la souche SPM106 a été testée
par la
technique décrite dans l'exemple 15. Il a ainsi pu être démontré que cette
souche
possède un phénotype producteur de spiramycines. Ceci démontre que le gène
orf32c
n'est pas un gène essentiel à la biosynthèse de la spiramycine chez S.
ambofaciens.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
194
Liste des constructions décrites dans la présente demande
Liste des abréviations : Am: Ampicilline ; Hyg: Hygromycine ; Sp : Spiramycine
; Ts:
Thiostrepton ; Cm: Chloramphénicol. Kn : Kanamycine, Apra: apramycine.
Nom de la Marqueur Principales caractéristiques Référence
construction de sélection
pWE15 Am (Wahl, et at,
1987)
pWED1 Am pWE 1 5 dans lequel un (Gourmeleri et al.,
fragment Hpal-Hpal de 4.1 kb 1998)
a été délété
p0J260 Apra Conjugatif, non réplicatif chez (Bierman et
al.,
Streptomyces 1992)
pHP45 Qhyg Hyg Cassette Qhyg dans pHP45. (Blondelet-
Rouault
et al., 1997)
=
pKC505 Apra Cosmide (Richardson MA
et
al., 1987)
; r p11486 Ts réplicatif (Ward et al.,
1986) = i;.`
,
=
' inülticôpieSsSWeptonzyces
=
pOSint3 Am ptrc-xis-int dans pTrc99A (Raynal et
al., 1998)
pWHM3 Am, Ts Vecteur navette réplicatif E. (Vara et al.,
1989)
coli/Streptomyces.
pKOBEG Cm (Chaveroche et
al.,
2000)
pGP704Not Am (Chaveroche et
al.,
2000)
pMBL18 Am (Nakano et al.,
1995)
pGEM-T Easy Am vecteur E. cou i pour clonage Mezei et al.,
1994
de produits PCR
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
195
pOS49.1 Am pWED1 avec insert au niveau Exemple 2
du site BamHI
pOS49.11 Am Fragment SacI de pOS49.1 Exemple 2
dans pUC19.
pOSC49.12 Ch Fragment xhoj de pOS49.11 Exemple 2
dans pBC SK+1:
pOS49.14 Cm, Hyg pOSC49.12 avec le gène orf3 Exemple 2
interrompu par la cassette
Dhyg
pOS49.16 Apra, Hyg Insert de pOS49.14 dans Exemple 2
p0J260
Cm Fragment BamHI-PstI de Exemple 3
pOS49.28
3,7kb ,de pOS49.1 dans pBC
;i.
SK+
= pOS44.1 Apra, Sp pKC505 contenant un insert
(Pernodet et al.,
= =:!=
conférant la résistance la 1999)
spiramycine chez S.
griseofuscus
pOS44.2 Ts, Sp Fragment Sau3AI de 1,8 kb Exemple 3
pOS44.1 dans p11486
pOS44.4. Am Insert de pOS44.2 dans Exemple 3
pUC19
pSPM5 Am pWED1 avec insert d'ADN de Exemple 3
S. ambofaciens au niveau du
site BamHI
pSPM7 Am pWED1 avec insert d'ADN de Exemple 3
S. ambofaciens au niveau du
site B amHI

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
196
pOSK1205 Hyg pBK-CMV dans lequel hyg Exemple 5
remplace neo
pOS49.67 Apra Fragment EcoRI-SacI de Exemple 6
pOS49.1, comportant une
délétion interne de 504
nucléotides, dans p0J260
pOS49.88 Am Fragment de 3.7 kb Pstl- Exemple 7
EcoRI de pOS49.1 dans
I
pUC19
pOS49.106 Am p049.88 avec hyg dans ore Exemple 7
(hyg et ore dans la même
orientation)
pOS49.120 Am pOS49.88 avec hyg dans orf8 Exemple 7
(hyg et orf8 dans des
orientations opposées) .
pOS4 107 Apra, Hyg Insert ::40 pC)S49.I.06 dans E/44.ppl9
p0J260
pOS49.32 Am, Kn Fragment de 1,5 kb interne à Exemple 8
orf10 dans pCR2.1-TOPO
pOS49.43 Am, Kn pOS49.32 avec hyg dans orf10 Exemple 8
(hyg et orf10 dans la même
orientation)
pOS49.44 Am, Kn pOS49.32 avec hyg dans orf10 Exemple 8
(lzyg et orf10 dans des
orientations opposées)
pOS49.50 Apra, Hyg Insert de pOS49.43 dans Exemple 8
p0J260
pWHM3Hyg Am, Hyg pWHM3 dans lequel tsr est Exemple 10
remplacé par hyg

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
197
pOSV508 Am, Ts ptrc-xis-int dans pWHM3 Exemple 9
pattlnhyg+ Cm, Hyg Cassette attl nhyg+ dans pBC Exemple 9
SK+ dont le site HindIII a été
supprimé
patt3naac- Cm, Gn Cassette att3Shac- dans pBC Exemple 9
SK+ dont le site Hindd a été
supprimé
pOSV510 Ain, Hyg pro pra-Amh dans Exemple 10
pWHM3Hyg .;
pOS49.99 Am Fragment EcoRI-BamHI de Exemple 10
4,5 kb de pSPM5 dans pUC19
pOSK1102 Am, Apra pGP704Not contenant la Exemple 10
cassette att3Qaac-
pSPM17 Am, Apra pOS49.99 dans lequel orf2 est Exemple 10
interrompue par la cassette
att3Qàac-
pSPM21 Hyg, Apra pOSK1205 contenant l'insert Exemple 10
EcoRI-XbaI de pSPM17 (dans
lequel orf2 est interrompue
par la cassette att3Qaac-)
pSPM502 Am Fragment BglII de 15,1 kb de Exemple 11
pSPM7 dans pMBL18
pSPM504 Hyg Insert de pSPM502 dans Exemple 11
pOSK1205
pSPM507 Hyg, Apra pSPM504 dans lequel orf12 Exemple 11
est interrompue par la cassette
att3Qaac-
pSPM508 Hyg, Apra pSPM504 dans lequel orfl 3c Exemple 12
est interrompue par la cassette
att3Qaac-

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
198
pSPM509 Hyg, Apra pSPM504 dans lequel orf14 Exemple 13
est interrompue par la cassette
att3Qaac-
pBXL1111 Am Fragment de 1,11 kb Exemple 14
contenant orf6* amplifié par
PCR à partir de pSPM7, dans
le vecteur pGEM-T Easy
pBXL1112 Am, Hyg pBXL1111 dans lequel la Exemple 14
cassette attl Qhyg+ a été
introduite après délétion de
120 pb dans la séquence
codante du gène orf6*
pBXL1113 Apra, Hyg Insert Pstl de 3.7 kb de Exemple 14
,
pBXL1112 dans p0J260
=.õ
pSPM520 Mn Fragment de PCR amplifié par Exemple 17
.
= M4(4
les oligonucléotides EDR39r=
EDR42 dàriS PbÉM-T Easy r
pSPM521 Am Fragment de PCR amplifié par Exemple 17
les oligonucléotides EDR40-
EDR42 dans pGEM-T Easy
pSPM522 Am Fragment de PCR amplifié par Exemple 17
les oligonucléotides EDR41-
EDR42 dans pGEM-T Easy
pUWL201 Am , Ts (Doumith et al.,
2000)
pSPM523 Am, Ts Fragment HindIII-BamHI de Exemple 17
l'insert du plasmide pSPM520
dans le vecteur pUWL201

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
199
pSPM524 Am, Ts Fragment HindIII-BamHI de Exemple 17
l'insert du plasmide pSPM521
dans le vecteur pUWL201
pSPM525 Am, Ts Fragment HindIII-BamHI de Exemple 17
l'insert du plasmide pSPM522
dans le vecteur pUWL201
pSPM527 Am pSPM521 avec décalage du Exemple 17
cadre de lecture au niveau du
site XhoI
pSPM528 Am , Ts Fragment HindIII-BamHI de Exemple 17
l'insert du plasmide pSPM527
dans le vecteur pUWL201
pVF 10.4 (Vara et al., 1985; ,
Lacalle et al., 1989)
pPM803 Ts (Mazodier,P. et al.,
e1,1
'
1989) =
= =-,:ee,
pGEM-T-pac- Am Cassette pac-oriT (amplifiée Exemple 18
oriT par PCR à partir de pVF 10.4
et pPM803) dans dans pGEM-
T Easy
pWED2 Am Cassette pac-oriT obtenue à Exemple 18
partir de pGEM-T-pac-oriT
insérée dans pWED1
pSPM34 Am pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM35 Am pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM36 Am pWED2 avec insert au niveau Exemple 19
du site BamHI

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
200
pSPM37 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSP M38 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM39 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM40 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM41 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM42 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM43 Mn pWED2 avec insert au niveau Exemple 19
du site B amHI
ty
pSPM44 Mn pWED2 avec insert au niveau Exemple 19
du site Banigl
pSPM45 Mn pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM47 Mn pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM48 Mn pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM50 Am pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM51 Am pWED2 avec insert au niveau Exemple 19
du site B amHI
pSPM52 Am pWED2 avec insert au niveau Exemple 19
du site B amHI

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
201
pSPM53 Am pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM55 Am pWED2 avec insert au niveau Exemple 19
du site BamHI
pSPM56 Am pWED2 avec insert au niveau Exemple 19 ,
=
du site BamHI
pSPM58 Kn Fragment Psd-PstI d'environ Exemple 19
6kb de l'insert de pSPM36
dans pBK-CMV
pSPM72 Kn Fragment StuI-&uI d'environ Exemple 19
kb de l'insert de pSPM36
cloné dans pBK-CMV
= pSPM73 Cm Fragment EcoRI-HindIII de Exemple 19
.1
=
l'insert de pSPM72 dans pBC-
.
=a
SK+
,. pSPM515 Mn Fragment 4 PCR amplifié par exepapié 22 =
EDR31-EDR37 dans pGEM-T
easy
pSPM519 Am, Ts Insert HindIllabal de Exemple 22
pSPM515 dans pUWL201
pOS49.52 Apra Séquence codante de tylB sous Exemple 23
contrôle du promoteur ermE*
dans le plasmide pKC1218
pSPM74 Am Fragment de PCR amplifié par Exemple 24
KF30-KF31 dans pGEM-T
easy
pSPM75 Am, Ts Insert Hind1111BamHI de Exemple 24
pSPM74 dans pUWL201

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
202
pSPM79 Kn Fragment Pstl-Pstl d'environ Exemple 19
2,5kb de l'insert de pSPM36
dans pBK-CMV
pSPM83 Am Fragment de PCR amplifié par Exemple 28
KF42-KF43 dans pGEM-T
easy
pSPM107 Am, Apra pSPM36 dans lequel orfl8c Exemple 29
est interrompue par la cassette
,..
att3aac-F
pSPM543 Am, Apra pSPM36 dans lequel orf31 est Exemple 30
interrompue par la cassette
att3aac+
pSPM106 Am, Apra pSPM36 dans lequel od32c Exemple 31
'
est interrompue par la cassette
,
,
att,3aaC+
,
:s!
õ .
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
203
Dépôt de matériel biologique
Les organismes suivants ont été déposés le 10 juillet 2002 auprès de la
Collection
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724

Paris Cedex 15, France, selon les dispositions du Traité de Budapest.
- Souche OSC2 sous le numéro d'enregistrement 1-2908.
- Souche SPM501 sous le numéro d'enregistrement 1-2909.
- Souche SPM502 sous le numéro d'enregistrement 1-2910.
- Souche SPM507 sous le numéro d'enregistrement 1-2911.
- Souche SPM508 sous le numéro d'enregistrement 1-2912.
.
='`k
- Souche SPM509 sous le numéro d'enregistrement 1-2913.
, ; É
! : = - Souche SPM21 sous le numéro d'enregistrement 1-2914.
- Souche SPM22 sous le numéro d'enregistrement 1-2915.
,
- Souche 0S49.67 sous le numéro d'enregistrement 1-2916.
- Souche 0S49.107 sous le numéro d'enregistrement 1-2917.
- Souche Escherichia cou i DH5a contenant le plasmide pOS44.4 sous le numéro
d'enregistrement 1-2918.
Les organismes suivants ont été déposés le 26 février 2003 auprès de la
Collection
Nationale de Cultures de Microorganismes (CNCM), 25 rue du Docteur Roux, 75724

Paris Cedex 15, France, selon les dispositions du Traité de Budapest.
- Souche SPM502 pSPM525 sous le numéro d'enregistrement 1-2977.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
204
Les organismes suivants ont été déposés auprès de la Collection Nationale de
Cultures de Microorganismes (CNCM) Institut Pasteur, 25, rue du Docteur Roux
75724
Paris Cedex 15, France, le 6 octobre 2003 selon les dispositions du Traité de
Budapest.
- Souche OSC2/pSPM75(2) sous le numéro d'enregistrement 1-3101.
, . . = =
= ==,,
=

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
205
Toutes les publications et brevets cités sont incorporés à la présente demande
par
référence.
Bibliographie :
- Altschul
SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment
search tool. J Mol Biol. (1990). 215 (3):403-410.
- Altschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W,
Lipman DJ.
Gapped BLAST and PSI-BLAST: a new generation of protein database search
programs. Nucleic Acids Res. (1997). 25 (17):3389-402.
- Amatm,E., Ochs,B. and Abel,K.J. Tightly regulated tac promoter vectors
useful
for the expression of unfused and fused proteins in Escherichia cou i Gene
(1988)
69 (2), 301-315.
- Arisawa,A., Kawamura,N., Tsunekawa,H., Okamura,K., Tone,H. and
Okamoto,R. Cloning and nucleotide sequences of two genes involved in the 4"-
0-acylation of macrolide antibiotics from Streptomyces thermotolerans. BioscE
BiotechnoL Biochem. (1993). 57 (12) : 2020-2025.
=
=
.. - Arisawa A, Kawamura N, Takeda K, Tsunekawa H, Okamura K, Okamoto R.
c.
Cloning of the macrolide antibiotic bios3mthesis gene acyA, winch encodes 3-0-
=
acyltransferase, from Streptomyces thermotolerans and its use for direct
fermentative production of ,;,a lerid macrOlide antibiotic Appl Environ
MicrobioL (1994). 60 (7):2657-2666. ¨
:te
, .
- August,P.R., Tang,L., Yoon,Y.J., Ning,Streptomyces, Mueller,R., Yu,T.W.,
Taylor,M., Hoffinann,D., Kim,C.G., Zhang,X., Hutchinson,C.R. et Floss,H.G.
Biosynthesis of the ansamycin antibiotic rifamycin: deductions from the
molecular analysis of the rif biosynthetic gene cluster of Amycolatopsis
mediterranei S699. Chem. Biol. (1998) 5 (2), 69-79.
-
Ausubel Fred M., Brent Roger, Kingston Robert E., Moore David D., Seidman
J.G., Smith John A., Struhl Kevin (Editeurs). Current Protocols in Molecular
Biology, publié par John Wiley & Sons Inc. Current Protocols Customer Service,
605 Third Avenue, 9th Floor New York, NY 10158 USA (édition mise à jour de
Mars 2002).
- Baltz RH, McHenney MA, Cantwell CA, Queener SW, Solenberg PJ.
Applications of transposition mutagenesis in antibiotic producing
streptomycetes.
Antonie Van Leeuwenhoek. (1997). 71 (1-2): 179-187.
- Bate N, Butler AR, Gandecha AR, Cundliffe E. Multiple regulatory genes in
the
tylosin biosynthetic cluster of Streptomyces fradiae. Chem Biol. (1999). 6
(9):
617-624.
=

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
206
- Bate,N., Butler,A.R., Smith,I.P. et Cundliffe,E. The mycarose-
biosynthetic genes
of Streptomyces fradiae, producer of tylosin. Microbiology (2000). 146 (Pt 1),

139-146.
- Bayley C., Morgan, Dale E. C., Ow D. W. Exchange of gene activity in
transgenic plants catalysed by the Cre-lox site specific system. Plant Mol.
Biol
(1992). 18 :353-361.
- Bentley,S.D., Chater,K.F., Cérdeno-Tarraga,A.M., Challis,G.L., Thomson,N.R.,

James,K.D., Harris,D.E., Quail,M.A., Kieser,H., Harper,D., Bateman,A.,
Brown,S., Chandra,G., Chen,C.W., Collins,M., Cronin,A., Fraser,A., Goble,A.,
Hidalgo,J., Hornsby,T., Howarth,S., Huang,C.H., Kieser,T., Larke,L.,
Murphy,L.,
Oliver,K., O'Neil,S., Rabbinowitsch,E., Rajandream,M.A., Rutherford,K.,
Rutter,S., Seeger,K., Saunders,D., Sharp,S., Squares,R., Squares,S.,
Taylor,K.,
Waffen,T., Wietzorrek,A., Woodward,J., Barrell,B.G., Parkhill,J. et
Hopwood,D.A. Complete genome sequence of the model actinomycete
Streptomyces coelicolor A3(2). Nature (2002). 417 (6885), 141-147.
- Bibb MJ, Findlay PR, Johnson MW. The relationship between base
composition
and codon usage in bacterial genes and its use for the simple and reliable .
identification of protein-coding sequences. Gene. (1984) 30 (1-3):157-166.
- Bibb MJ, Janssen GR, Ward J1v1. Cloning and analysis of the
promoter region of
=
the erythromycin resistance gene (ermE) of Streptomyces erythraeus.Gene
, ,
. (1985). 38 (1-3) : 215-26.
= .
= -;
=
- Bibb MJ, White J, Ward JM, Janssen GR. The mRNA for the 23S rRNA
methylase encoded by the ermE gene of Saccharopolyspora erythraea is
translated in the absence of a conventional ribosome-binding site. Mol
Microbiol.
(1994). 14 (3): 533-45.
- Bierman M, Logan R, O'Brien K, Seno ET, Rao RN, Schoner BE. Plasmid
cloning vectors for the conjugal transfer of DNA from Escherichia cou i to
Streptomyces spp. Gene. 1992;116(1):43-9.
- Blondelet-Rouault M-H., Weiser J., Lebrihi A., Branny P. and Pernodet J-L.
Antibiotic resistance gene cassettes derived from the n interposon for use in
E.
coli and Streptomyces. Gene (1997) 190 : 315-317.
- Boccard F., Smokvina T., J.-L., Pernodet Fridmann A., and Guérineau M.,
Structural analysis of loci involved in pSAM2 site-specific integration in
Streptomyces. Plasmid, (1989a). 21 : 59-70.
- Boccard F., Smokvina T., J.-L., Pernodet Fridmann A., and Guérineau M.. The
integrated conjugative plasmpid pSAM2 of Streptomyces ambofaciens is related
to temperate bacteriophages. EMBO J. (1989b) 8 : 973-980.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
207
- Brunelli J.P., Pall M.L., A series of Yeast/ E. cou i lambda
expression vectors
designed for direct ional cloning of cDNA and cre/lox mediated plasmid
excision.
Yeast. (1993) 9: 1309-1318.
- Camilli A., Beattie D. T. et Mekalanos J. J. Use of genetic
recombination as a
reporter of gene expression. Froc. NatL Acad. Sci. USA (1994) 91(7), 2634-
2638.
- Ciampelo,A.B. and Gil,J.A. The candicidin gene cluster from Streptomyces
griseus IMRU 3570. Microbiology (2002) 148 (Pt 1), 51-59.
- Carreras C, Frykman S, Ou S, Cadapan L, Zavala S, Woo E, Leaf
T, Carney J,
Burlingame M, Patel S, Ashley G, Licari P. Saccharopolyspora erythraea-
catalyzed bioconversion of 6-deoxyerythronolide B analogs for production of
novel erythromycins. J BlotechnoL (2002). 92(3): 217-28.
- Chao K.-M., Pearson W.R., Miller W. Aligning two sequences within a
specified
diagonal band. Comput. AppL Biosci. (1992) 8 : 481-487.
- Chater K. F. The improving prospects for yield increase by
genetic engineering
in antibiotic-producing Streptomycetes. Biotechnology. (1990). 8 (2) : 115-
121.
- Chaveroche MK, Ghigo JM, d'Enfert C. A rapid method for efficient gene
replacement in the filamentous finigus Aspergillus nidulans. Nucleic Acids Re
2000,28(22) :E97.
,
r.4=;%:=5 =
e, =;
, r Church GM, Gilbert W. Genornic sequencing. Proc Natl Acad Sci
USA. (1984)
81(7):1991-5.
- Churchward G, Belin D, Nagamine Y. A pSC101-derived plasmid
which shows
no sequence homology to other commonly used cloning vectors. Gene. (1984) 31
(1-3): 165-71.
- Comstock,L.E., Coyne,M.J., Tzianabos,A.O. and Kasper,D.L. Interstrain
variation of the polysaccharide B biosynthesis locus of Bacteroides fragilis:
characterization of the region from strain 638R J. Bacteriol. (1999). 181 (19)
:
6192-6196.
- Cox KL, Baltz RH. Restriction of bacteriophage plaque formation in
Streptomyces spp. J Bacteriol. (1984) 159(2): 499-504.
- Dale E.C., Ow D.W., Gene transfer with subsequent removal of the selection
gene from the host genome. Froc. NatL Acad. Sei. USA (1991). 88 : 10558-
10562.
- Doumith M, Weingarten P, Wehmeier UF, Salah-Bey K, Benhamou B,
Capdevila C, Michel JM, Piepersberg W, Raynal MC. Analysis of genes

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
208
involved in 6-deoxyhexose biosynthesis and transfer in Saccharopolyspora
erythraea. Mol Gen Genet. (2000) 264(4): 477-485.
- Draeger,G., Park,Streptomyces-H.H. et Floss,H.G. Mechanism of the 2-
deoxygenation step in the biosynthesis of the deoxyhexose moieties of the
antibiotics granaticin and oleandomycin J. Am. Chem. Soc. (1999) 121: 2611-
2612.
- Gandecha,A.R., Large,S.L. et Cundliffe,E. =Analysis of four
tylosin biosynthetic
genes from the tylLM region of the Streptomyces fradiae genome. Gene. (1997).
184 (2) :197-203.
- Geistlich,M., Losick,R., Turner,J.R. et Rao,R.N. Characterization of a novel
regulatory gene governing the expression of a polyketide s3mthase gene in
Streptomyces ambofaciens. Mol. Microbiol. (1992). 6 (14) : 2019-2029.
- Gourmelen A, Blondelet-Rouault MH, Pernodet JL. Characterization of a
glycosyl transferase inactivating macrolides, encoded by gimA from
Streptomyces ambofaciens. Antimicrob Agents Chemother. (1998). 42(10): 2612- '
9.
- Huang X. et Miller W. A time-efficient, linear-space local
similarity algorithrn.
Adv. AppL Math. (1991). 12 : 337-357.
=
5
i}t:ref' Hara O et Hutchinsen CR. Cloiiing "Of Midecamycin(MLS)-
resistance genes froM.
2i3 Streptomyces mycaredacienà, Streptem3rces lividans and
Streptomyces coelicolor
A3(2). J Antibiot (Tokyo). (1990). 43 (8):977-991.
- Hara 0 et Hutchinson CR. A macrolide 3-0-acyltransferase gene from the
midecamycin-producing species Streptomyces mycarofaciens. J Bacteriol.
(1992). 174(15) :5141-5144.
- Hoffmeister D, Ichinose K, Domann S, Faust B, Trefzer A, Drager G,
Kirschning
A, Fischer C, Kunzel E, Bearden D, Rohr J et Bechthold A. The NDP-sugar co-
substrate concentration and the enzyme expression level influence the
substrate
specificity of glycosyltransferases: cloning and characterization of
deoxysugar
biosynthetic genes of the urdamycin biosynthetic gene cluster. Chem Biol.
(2000). 7 (11):821-831.
- Hopwood, D.A. Future possibilities for the discovery of new antibiotics by
genetic engineering. In Beta-lactam antibiotics. Edited by M.R.J. Salton and
G.D.
Shockman. New York: Academic Press. (1981). 585-598.
- Hopwood D. A., Malpartida F., Kieser H. M., Ikeda H., Duncan
J., Fujii I., Rudd
A. M., Floss H. G. et Omura S. Production of 'hybrid' antibiotics by genetic
engineering. Nature. (1985a). 314 (6012): 642-644.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
209
- Hopwood D. A., Malpartida F., Kieser H. M., Ikeda H. et Omura S. (1985b)
In
Microbiology (ed S. Silver). American Society for Microbiology, Washington D.
C., 409-413.
- Houben Weyl, 1974, in Meuthode der Organischen Chemie, E. Wunsch Ed.,
Volume 15-1 et 15-II,
-
Hutchinson, C.R. Prospects for the discovery of new (hybrid) antibiotics by
genetic engineering of antibiotic-producing bacteria. Med Res Rev. (1988). 8
(4) :
557-567.
-
Hutchinson C. R., Borell C. W., Otten S. L., Stutzman-Engwall K. J. et Wang
Y.
Drug discovery and development through the genetic engineering of antibiotic-
producing microorganisms J. Med. Chem. (1989) 32 (5) : 929-937.
-
Ishikawa J, Hotta K. FramePlot: a new implementation of the frame analysis
for
predicting protein-coding regions in bacterial DNA with a high G + C content.
FEMS Microbiol Lett. (1999) 174(2):251-3.
- Kieser, T, Bibb, MJ, Buttner MJ, Chater KF, Hopwood DA. Practical
Streptomyces Genetics. 2000. The John limes Foundation, Norwich UK.
-
Kuhstoss et al. Production of a novel polyketide through the construction of
g
= hybrid polyketide synthase. Gene. (1996). 183(1-2): 231-236tt
,
Y.!
= = = . = ,
- Lacalle RA, Pulido D, Vara J, Zalacain M, Jimenez A. Molecùlar
analysis of thé :'e!1
pac gene encoding a puromycin N-acetyl transferase from Streptomyces
alboniger. Gene. (1989). 79(2):375-380.
-
Lakso M, Sauer B, Mosinger B Jr, Lee EJ, Manning RW, Yu SH, Mulder KL,
Westphal H. Targeted oncogene activation by site-specific recombination in
transgenic mice. Proc Natl Acad Sci USA. (1992) 89 (14) :6232-6.
- Li,T.B., Shang,G.D., Xia,H.Z. and Wang,Y.G. Cloning of the sugar related
biosynthesis gene cluster from Streptomyces tenebrarius H6. Sheng Wu Gong
Cheng Xue Bao (2001). 17 (3) : 329-331.
- Ligon,J., Hill,S., Beck,J., Zirkle,R., Molnar,I., Zawodny,J., Money,S. and
Schupp,T. Characterization of the biosynthetic gene cluster for the antifungal
polyketide soraphen A from Sorangium cellulosum So ce26. Gene (2002). 285
(1-2), 257-267.
-
Liu L, Saevels J, Louis P, Nelis H, Rico S, Dierick K, Guyomard S, Roets E,
Hoogmartens J. Interlaboratory study comparing the microbiological potency of
spiramycins I, II and III. J Pharm Biomed Anal. (1999). 20 (1-2):217-24.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
210
- Mazodier P, Petter R, Thompson C. Intergeneric conjugation between
Escherichia cou i and Streptomyces species.JBacteriol. (1989). 171 (6):3583-5.
- Merrifield RB, 1965a, Nature, 207(996): 522-523.
- Merrifield RB., 1965b, Science, 150(693): 178-185.
- Merson-Davies,L.A. et Cundliffe,E. Analysis of five tyl9sin biosynthetic
genes
from the tyllBA region of the Streptomyces fradiae genome, Molecular
microbiology. (1994). 13 (2) : 349-355.
- Miller VL, Mekalanos JJ. A novel suicide vector and its use in
construction of
insertion mutations: osmoregulation of outer membrane proteins and virulence
determinants in Vibrio cholerae requires toxR. J Bacteriol. (1988) 170(6):2575-

83.
- Nakano, Y., Yoshida, Y., Yamashita, Y. & Koga, T. Construction of
a series of
pACYC-derived plasmid vectors. Gene (1995). 162: 157-8.
- Nielsen H., Engelbrecht J., Brunak S. et von Heijne G. Identification of
prokaryotic and eukaryotic signal peptides and prediction of their cleavage
sites.,
Protein Engineering (1997). 10: 1-6.
t.õ
- Oh SH, Chater KF. Denaturation of circ .plar or linear DNA
facilitates targeted=;:A
=. .= =
=== . integrative transformation Of StreptOinyee "ekielicelor43(2):
possible
7 to other organisrns. J
- Olano C, Lomovskaya N, Fonstein L, Roll JT, Hutchinson CR. A two-plasmid
system for the glycosylation of polyketide antibiotics: bioconversion of
epsilon-
rhodomycinone to rhodomycin D. Chem Biol. (1999). 6 (12):845-55.
- Omura S, Kitao C, Hamada H, Ikeda H. Bioconversion and
biosynthesis of 16-
membered macrolide antibiotics. X. Final steps in the biosynthesis of
spiramycin,
using enzyme inhibitor: cerulenin. Chem Pharm Bull (Tokyo). (1979a). 27(1):
176-82.
- Omura S, Ikeda H, Kitao C. Isolation and properties of spiramycin
I 3-hydroxyl
acylase from Streptomyces and ambofaciens. J Biochem (Tokyo). (1979b). 86(6):
1753-8.
- Omura,S., lkeda,H., Ishikawa,J., Hanamoto,A., Takahashi,C., Shinose,M.,
Takahashi,Y., Horikawa,H., Nakazawa,H., Osonoe,T., Kikuchi,H., Shiba,T.,
Sakaki,Y. and Hattori,M. Genome sequence of an industrial microorganism
Streptomyces avermitilis: Deducing the ability of producing secondary
metabolites. Proc. Nati. Acad. Sei. U.S.A. (2001). 98 (21), 12215-12220.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
211
- Pearson W.R. and D. J. Lipman. Improved Tools for Biological Sequence
Analysis. Proc. Natl. Acad. Sci. USA 1988, 85: 2444-2448.
- Pearson W. R. Rapid and Sensitive Sequence Comparison with FASTP and
FASTA. Methods in Enzymology. 1990, 183: 63-98.
- Pernodet JL, Simonet JM, Guerineau M. Plasmids in different strains of
Streptomyces ambofaciens; free and integrated form of plasmid pSAM2. Mol
Gen Genet. (1984);198 (1):35-41.
- Pernodet JL, Alegre MT, Blondelet-Rouault MH, Guerineau M. Resistance to
spiramycin in Streptomyces ambofaciens, the producer organism, involves at
least two different mechanisms. J Gen Microbiol. (1993) ; 139 ( Pt 5):1003-11.
- Pernodet JL, Fish S, Blondelet-Rouault MH, Cundliffe E. The macrolide-
lincosamide-streptogramin B resistance phenotypes characterized by using a
specifically deleted, antibiotic-sensitive strain of Streptomyces lividans.
Antimicrob Agents Chemother. (1996), 40 (3): 581-5.
- Pernodet JL, Gourmelen A, Blondelet-Rouault MH, Cundliffe E. Dispensable
ribosomal resistance to spiramycin conferred by srmA in the spiramycin
producer.
Streptomyces ambofaciens. Microbio/ogy. (1999), 145 (Pt 9):2355-64.
- Pfoestl,A., Hofinger,A., Kosma,P. and Messner,P. Biosynthesis of dTDP
'
' acetamido-3,6-dideoxy-alpha-p-galactos'è in Aneurinibacillus
thermoaerop/ulus e
- 20 - L420-91t. J Biol. Chen. (2003), 278 (29): 26410-26417.
= 4.
- Rao RN, Richardson MA, Kuhstoss S. Cosmid shuttle vectors for cloning and
analysis of Streptomyces DNA. Methods Enzymol. (1987); 153: 166-98.
- Raynal A, Tuphile K, Gerbaud C, Luther T, Guerineau M, and Pernodet JL..
Structure of the chromosomal insertion site for pSAM2: functional analysis in
Escherichia coll. Molecular Microbiology (1998) 28 (2) 333-342.
- Redenbach,M., Kieser,H.M., Denapaite,D., Eichner,A., Cullum,J.,
Kinashi,H. et
Hopwood,D.A. A set of ordered cosmids and a detailed genetic and physical map
for the 8 Mb Streptomyces coelicolor A3(2) chromosome Mol. Microbiol.
(1996). 21 (1) : 77-96.
- Richardson MA, Kuhstoss S, Solenberg P, Schaus NA, Rao RN. A new shuttle
cosmid vector, pKC505, for streptomycetes: its use in the cloning of three
different spiramycin-resistance genes from a Streptomyces ambofaciens library.

Gene. (1987); 61 (3):231-41.
- Robinson, J.A. Enzymes of Secondary Metabolism in Microorganisms.
Chem
Soc Rev. (1988). 17:383-452.

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
212
- Russell SH, Hoopes JL, Ode!! JT. Directed excision of a transgene
from the plant
genome. Mol Gen Genet. (1992). 234 (1): 49-59.
- Sambrook J, Frisch EF, Maniatis T . Molecular Cloning : a laboratory
manual 2nd
cd. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York USA
(1989).
- Schoner B, Geistlich M, Rosteck P Jr, Rao RN, Seno E, Reynolds, P,
Cox K,
Burgett S et Hershberger C. Sequence similarity between macrolide-resistance
determinants and ATP-binding transport proteins. Gene. (1992). 115 (1-2), 93-
96.
- Sezonov G, Hagege J, Pernodet JL, Friedmann A and Guerineau M.
Characterization of pra, a gene for replication control in pSAM2, the
integrating
element of Streptomyces ambofaciens. Mol Microbiol. (1995). 17(3): 533-44.
- Sezonov G., Blanc V., Bamas-Jacques N., Friedmann A., Pernodet J.L.
and M.
Guerineau, Complete conversion of antibiotic precursor to pristinamycin HA by
over expression of Streptomyces pristinaespiralis biosynthetic genes, Nature
Biotechnology. (1997) 15 : 349-353.
- Sezonov G, Possoz C, Friedmann A, Pernodet JL, Guerineau M. KorSA
from the
Streptomyces integrative element pSAM2 is a central transcriptional represscee

target genes and binding sites.'J Bacteriol. (2000). 182(5):1243-50.
"
- Simon R., Priefer U and Piihier. A broad IMst range mobilisation system for
vivo genetic engeneering : transposon mutagenesis in gram negative bacteria.
Bio/Technology (1983). 1 : 784-791.
- Simon, et al., Plasmid vectors for the genetic analysis and manipulation of
rhiweziosbshia and th
h (eods.e)r, mameth-ondes atiinveebnzarncterioiao, gy., 6v4001-659
1
gr g P 18.
,InAAo.adWemeiisosbpacrhes, san
,
Orlando, 1986
- Summers,R.G., Donadio,Streptomyces, Staver,M.J., Wendt-Pienkowski,E.,
Hutchinson,C.R. et Katz,L. Sequencing and mutagenesis of genes from the
erythromycin biosynthetic gene cluster of Saccharopolyspora erythraea that are
involved in L-mycarose and D-desosamine production. Microbiology (1997). 143
(Pt 10) : 3251-3262.
- Van Mellaert L, Mei L, Lammertyn E, Schacht S, Aime J. Site-specific
integration of bacteriophage VWB genome into Streptomyces venezuelae and
construction of a VWB-based integrative vector. Microbiology. (1998). 144 ( Pt
12): 3351-8.
=

CA 02501445 2005-04-06
WO 2004/033689
PCT/FR2003/002962
213
- Vara J, Lewandowska-Skarbek M, Wang YG, Donadio S, Hutchinson
CR.Cloning of genes governing the deoxysugar portion of the erythromycin
biosynthesis pathway in Saccharopolyspora erythraea (Streptomyces erythreus).
J
Bacteriol. (1989). 171(11): 5872-81.
- Vara J, Malpartida F, Hopwood DA, Jimenez A. Cloning and expression of a
puromycin N-acetyl transferase gene from Streptomyces alboniger in
Streptomyces lividans and Escherichia cgli. Gene. (1985). 33(2): 197-206.
=
- Wahl, G. M., K. A. Lewis, J. C. Ruiz, B: Rothenberg, J. Zhao, and G. A.
Evans.
Cosmid vectors for rapid genomic walking, restriction mapping, and gene
transfer. Proc. Nad. Acad. Sci. USA (1987). 84: 2160-2164.
- Waldron,C., Matsushima,P., Rosteck,P.R., Broughton,M.C., Turner,.,
Madduri,K., Crawford,K.P., Merlo,D.J. et Baltz,R.H. Cloning and analysis of
the
spinosad biosynthetic gene cluster of Saccharopolyspora spinosa(1) Chem. Biol.

(2001) 8 (5) : 487-499.
- Walczak RJ, Hines JV, Strohl WR, Priestley ND.Bioconversion of the
anthracycline analogue desacetyladriamycin by recombinant DoxA, a P450- ;..
monooxygenase from Streptomyces sp. strain C5. Org Lett. (2001). 3 (15):2277-
9. , =
- Wang,ZX., Li,S M µet, s
Identification of the coumermycin A(1)1
bioSynthetie gène cluster . of Sir'étjtôniY.C'és rishiriensis DSM 40489.
Antimic,V1
Agents Chemother'. (2000) 44 (11), 3640-3048.
- Ward, J.M., Janssen, G.R., Kieser, T, Bibb, M.J., Buttner, M.J. & Bibb, M.J.

Construction and characterization of a suies of multi-copy promoter-probe
plasmid vectors for Streptomyces using the aminoglycoside phosphotransferase
from Tn5 as indicator. Mol Gen Genet (1986). 203 : 468-478.
- Wehmeier UF. New multifunctional Escherichia coli-Streptomyces shuttle
vectors allowing blue-white screening on XGal plates. Gene. (1995). 165(1):
149-150.
- Wilms B, Hauck A, Reuss M, Syldatk C, Mattes R, Siemann M,
Altenbuchner J.
High-cell-density fermentation for production of L-N-carbamoylase using an
expression system based on the Escherichia coli rhaBAD promoter. Biotechnol
Bioeng. (2001). 73(2) :95-103.
- Worley K. C., Wiese B. A., and Smith R. F. BEAUTY: An enhanced BLAST-
based search tool that integrates multiple biological information resources
into
sequence similarity search results. Genome Research (1995). 5: 173-184.

CA 02501445 2005-04-06
WO 2004/033689 PCT/FR2003/002962
214
- Wu K, Chung L, Revill WP, Katz L et Reeves CD. The FK520 gene cluster
of
Streptomyces hygroscopicus var. ascomyceticus (ATCC 14891) contains genes
for biosynthesis of unusual polyketide extender units. Gene. (2000). 251 (1):
81-
90.
- Xue Y, Zhao L, Liu IIW et Sherman DH. A gene cluster for macrolide
antibiotic
biospthesis in Streptomyces venezuelae: architecture of metabolic diversity.
Proe Natl Acad Sei S A. (1998). 95 (21): 12111-12116.
- Yu D, Ellis HM, Lee EC, Jenkins NA, Copeland NG et Court DL. An
efficient .
recombination system for chromosome engineering in Escherichia cou. Froc
Natl Acad Sci USA. (2000). 97(11): 5978-83.

CA 02501445 2005-12-05
215
SEQUENCE LISTING
<110> Aventis Pharma SA
CNRS
<120> POLYPEPTIDES IMPLIQUES DANS LA BIOSYNTHESE DES SPIRAMYCINES,
SEQUENCES NUCLEOTIDIQUES CODANT CES POLYPEPTIDES ET LEURS
APPLICATIONS
<140> 2,501,445
<141> 2003-10-08
<130> 11246-62
<150> FR 0212489
<151> 2002-10-08
<150> FR 0302439
<151> 2003-02-27
<150> US 60/493,490
<151> 2003-08-07
<160> 161
<170> PatentIn version 3.2
<210> 1
<211> 30943
<212> DNA
<213> Streptomyces ambofaciens
<400> 1

CA 02501445 2005-12-05
216
gaattcggca attcccgggg cgccgggaaa ccggcacgcc attccgacca cggcaacggc 60
gtcggaccgg tcgtcactgc gggaaatcgc gagttctcca gacacctgca tccctcatat 120
gttcgccgta ccacgccgtg gcttttctgc cttttcttga tcttcccgag cgtacagcgg 180
gcgaactgcc gggcgacagg aacggccggt gaacgacaat caattgtgtc aagttcggag 240
attgtccacc gattctcgtc accggagacg gcgcgggatc atgcgggacc acacggcatc 300
gcaccaggtc cgcagggtcg gcgctccgac gtcccggccg gtcgcgcact ccggtgacct 360
gcacgcggag tcctgggcga gcggagaaga tttcagtacc tcgcggcgcg ggacaaccac 420
ttcgcgacga atatgtcagg tctccccgag cggtccgtgc cgccccgccc tgacccgtcc 480
gcgcccgtcc cgctccgccc cggtcgtcat ctcggccgga atttcagtcg gcagctcatt 540
gtgtcaggtt cgccttgccg acattctccg gagattccta agctctgccg gtaaccggga 600
ccggaaccac cgtgccgcgc gttcggtcca cacaccgctt ttcgaggagt ccgactgatg 660
ggtgaggccg tgacgggacc gatggagctg agcaaggacg cggacgcccg ggggctgctt 720
gagtggttcg cgtacaacag gacgcgtcat ccggtgttct gggacgagac ccgacaggcg 780
tggcaggtct tcggctacga cgactacgtg acggtgtcga acaacccgca gttcttctcc 840
tcggacttca acatggtgat gccgacgccg cccgaactgg agatgatcat cggtccgggc 900

CA 02501445 2005-12-05
217
acgatcggcg cgctggaccc gcccgcgcac ggaccgatgc gcaagctggt gagccaggcg 960
ttcacccccc gacggatcgc ccggctggag cccagggtgc gcgcgatcac cgaggagctc 1020
ctggacaagg tggggcagca ggacgtcgtc gacgccgtgg gtgacctgtc ctacgcgctg 1080
ccggtcatcg tgatcgccga actgctgggc atacccgccg gcgaccgtga cctgttccgg 1140
gagtgggtcg acaccctgct gacgaacgag ggcctggagt acccgaacct cccggacaac 1200
ttcaccgaga cgatcgcgcc cgcgctcaag gagatgaccg actacctcct gaagcagatc 1260
cacgccaagc gggacgcgcc cgccgacgac ctggtcagcg ggctggtcca ggcggagcag 1320
gacggccgcc ggctgaccga cgtcgagatc gtcaacatcg tcgcgctgct cctgacggcg 1380
gggcacgtct cctccagcac cctgctcagc aacctgttcc tggtcctgga ggagaacccg 1440
caggcgctgg aggacctgcg ggccgatcgc tccctggtgc ccggcgcgat cgaggagacg 1500
ctgcgctacc gcagcccctt caacaacatc ttccggttcg tcaaggagga caccaccgtc 1560
ctcggtccgc tcatggagaa gggccagatg gtgatcgcct ggagccagtc cgccaaccgg 1620
gacccccggc acttcccgga cccggacacc ttcgacatcc gccgctcgga cggcacccgg 1680
cacatggcct tcgggcacgg catccaccac tgcctgggtg ccgccctcgc ccgcctggag 1740
ggcaaggtca tgctcgaact cctcctggac cgggtccaag gcttccgcat cgaccacgag 1800

cA 02501445 2005-12-05
218
cacaccgtgt tctacgaggc cgaccagctc actccgaagt acctgcccgt ccgggtcgac 1860
tggaactgaa cccgagggtc tcgtcccgga gtccagggcc gtcccgagcc ggccctggac 1920
ctcacgaccg cccgataagg agcgccgcca tcgccgagaa cacagccgag ctccctgccc 1980
ggcgggtcgg caggatcaag ccgtgccggc tgatcaggct cgagcagcac atcgacccgc 2040
gcggcagcct ctccgtgatc gagtccggcg tgaccgtgga cttccccgtc cgacgcgtct 2100
actacatgca tggccagacc cagtcctctc ccccgcgcgg cctgcacgcg caccgcaccc 2160
tggaacaact cgtcatcgcc gtccacggcg ccttctccat caccctcgac gacggcttcc 2220
agcacgccac ctaccgtctg gacgaacccg gagccggact ctgcatcggc cccatggtct 2280
ggcgcgtcct gaaggacttc gaccccgaca ccgtggccct ggtcctcgcc tcgcagcact 2340
acgaggagtc cgactactac cgcgactacg acaccttcct gcatgacgca cggagcctca 2400
catgaccatc cccttcctcg acgcgggcgc cggctaccgg gagttgcgag ccgagatcga 2460
cgcggccctg cagcgggtgt ccgcctccgg ccgctatctg ctcgacgcgg aactcgcggc 2520
cttcgaggag gagttcgccg cgtactgcga caacgaccac tgtgtggcgg tgggcagtgg 2580
ctgcgacgcg ctggagctgt ccctgcgggc gctggacatc ggtcccgggg acgaggtggt 2640

ops 50500550v
553060500 og6056056 ;066bp0630 ;505605550 D-466366355
0817 ;504500506
000655oP5 6266660-40D .0600-e.565q. 0000q4.006v 0-4.005E.ft06
ou7E 355055-4035
05v5;520q0 5000v00025 686056Dopo 5055005500 0-260-e60060
09 -2;00553000
36503-20600 0005-450000 u-40-200q-e5; 000v5e00-45 655006-250-e
pou P554055005
005364.05y5 06060655 3505;05334 -26;50-2-45q0 DvD56-45-456
017n 000e-500655
q.000;0500 0;6500D-45D 350Tebo53 peq5500-455 5-430065606
081 680vg660up
500660-2055 0065600500 35055450 60-e50-40650 5035q0e0
luTE 056505;05-4
50055055,0 0445e50-250 4056330q0 000-250-4050 6-455p6o06
090E 5002q5-e5v
655053;355 05-4.00505 ;05-446600g P56o5e.6005 5;5455004.0
000E v5-455600-4
68;5535055 0560E.55555 ;y0050650-4 00-25.056 3030E-40-44.0
(fl,6 5p0-4-45060;
564.6020065 60;0550;y6 5p05006555 00;460006 3560E.30355
088 06053050E.
56P50455-45 0055-403560 20653v5500 506355q0 -43603060
ouz ;00E.500653
0006560E.0 5-40006-4.56 006Te6;300 62600650 ;03000-405
09Lz
05505555; 65-4.3506503 0e53;000q0 q05550550 050-e500325 0;50056;66
00L. 305500585
6002-4060o; 6450065;06 5;005550-4 0-4.g03200 6060006-465
61Z
SO-ZT-SOOZ St,VCOSZO Vo

CA 02501445 2005-12-05
220
ttttcctcta gtgacggaga aacgatgacc gaggtcatgt cagggcgtcc cggaatgaaa 3600
gggatcatcc tcgcaggcgg cggagggacc cgcctacgcc ccttgaccgg cacgctgtcc 3660
aagcaactgc tgcccgtcta cgacaagccg atgatctact acccgctgtc cgtcctgatg 3720
ctgggcggca tccgcgagat cctcgtcgtc tcctccaccc agcacatcga gctgttccag 3780
cggctgctgg gcgacggctc ccgcctcggc ctcgacatca cctacgccga acaggccgag 3840
cccgagggca tagcgcaggc catcaccatc ggcaccgacc acatcggcga ctcaccggtc 3900
gcgctcatcc tgggcgacaa catcttccac ggccccggct tctcggccgt gctccagggc 3960
agcatccgcc acctcgacgg ctgtgtgctg ttcggctacc cggtcagcga cccgaagcgc 4020
tacggcgtcg gcgagatcga cgaccagggc gtactgctgt ccctggagga gaaaccggcc 4080
cggccccgct ccaacctcgc cgtcaccggc ctctacctct acgacaacga cgtggtcgac 4140
atcgccaaga acatccggcc ctcggcgcgc ggcgaactcg agatcacgga cgtcaacagg 4200
acctacctgg agcagaaacg cgcccggctc atcgaactgg gccacggctt cgcctggctc 4260
gacatgggca cccacgactc cctcctccag ggcggccagt acgtccagct catcgagcag 4320
cgccagggag tgcggatcgc ctgcatcgag gagatcgccc tgcgcatggg cttcatcgac 4380
gccgacaccc tccaccggct cggccgcgaa ctgggcacct ccggatacgg cgcgtacctg 4440

cA 02501445 2005-12-05
221
atggaggtgg ccacccgtgc aggcaccgaa tgagacgccg cgccggcccg cccgctccgc 4500
cggccgacgg ccgccggccc ggatcctcgt caccgggggc gccggcttca tcggctcgcg 4560
cttcgtgaac gcgctgctgg acggctccct gccggagttc ggcaaacccg aggtgagggt 4620
gctcgacgcg ctcacctacg cgggcaacct ggccaatctg gccccggtgg gcgactgtcc 4680
ccggctgcgg atcttcccgg gggacatccg cgaccgcggc gcggtcaccc aggcgatggc 4740
gggggtcgac ctggtggtgc acttcgcggc cgagtcgcac gtggaccgct cgatcgacga 4800
cgccgacgcc ttcgtgcgca ccaacgtgct gggcacccag gtcctcctcc aggaggcact 4860
ggccgtacgc cccgggctgt tcgtgcacgt ctcgacggac gaggtgtacg gctccatcga 4920
ggaggggtcc tggcccgagg agcacccgct gaaccccaac tcgccctacg ccgcctcgaa 4980
ggcgtcctcc gacctgctgg cgctggccca ccaccgcacg cacggactgc cggtgtgcgt 5040
cacccgctgc tccaacaact acgggcccta ccagtacccg gagaagatca tcccgctgtt 5100
caccagcagc ctcctcgacg gcgggaccgt cccgctctac ggggacggcg gcaaccggcg 5160
cgactggctg cacgtggacg accactgccg gggcatcgcc ctggtggccc ggggcggccg 5220
gcccggcgag gtctacaaca tcggcggcgg caccgagctg agcaacgtcg agctcacgga 5280
gcgtctgctg aaactgtgcg gagccgactg gtcggcggtg cggcgggtgc ccgaccgcaa 5340

CA 02501445 2005-12-05
222
gggccacgac cggcgctact ccgtcgacta caccaagatc gcggacgagc tgggttacgc 5400
gccgcggatc accatcgacg aagggctgga gcggaccgtg cactggtacc gggagaaccg 5460
cgcgtggtgg gcgcccgcga agagggggcg atgacggtga cgaccgcatc cgtggacccg 5520
ctcgacctgt ggctccgccg gtaccagccg tccgcgtcac ccgccgtccg gctggtgtgc 5580
ttcccgcacg cgggcggctc ggcgagttcg ttcctgccgt tcacccggca gctgccggac 5640
cggatcgagg tcgtggccgt ccagtacccc gggcgccagg accgcaggag cgaaccgctg 5700
gtcgacacca tcgagggact ggccgagccc ctggccggcc tgctggaggc gcaggccggc 5760
cccccggtgg tgctgttcgg gcacagcatg ggcgcgctgg tggcctacga ggtcgcccgc 5820
gcgctccagc ggcggggagc ggctccggtg cgcctggtgg tctccgggcg ccgggccccc 5880
gccgtcgacc ggccgatgac cgtgcacctc tacgacgacg accggctggt cgaggaactc 5940
cgcaagctcg acggcaccga cagccaggtg ttcgccgatc cggagctgct ccggctggtg 6000
ctgcccgtga tccgcaacga ctaccgggcc gtggcggcct acgcccaccg cccgggggcg 6060
ccgctggact gccccctcac cgtgttcacc ggcgccgacg accccaccgt gaccgcggcc 6120
gaggcggcgg cctggcacga ggcggcggcg tccgacgtcg agacgcgcac cttccccggt 6180

080L .eo5-4;6035D 600.e525666 ouqpqopogo 603505-4D5D 65o55op3gg
33q.D'ebo.25;
ozoL 553.e5D533 D5oo65o.eo 605Doepoo5 go46;3356-4 DErgq.bobo oppou65-1.3
0969 E.EØ46ogo3v 50.255.epogp Bq:25-4366pp booTeEveD55 5ogoop.e6qp
55;DE.Dogq.5
0069 aboo50-e6DD 55253Teo.25 op.E.o.25pg-e6 E.5o.q.63;55; 'PD0500'We
0635VV0235
0D.89 q.Doqq.56qp-e. bo685.ep-e-e6 pogftoDgpo 6-epp5oq.e5q. Dog565op5D
o6boopp5op
08L9 .epogvoqqop oDbogoogq. booDo-epoq5 530550-230.e o5q6fie5ov6 oqqp-
e.e.o.6.ep
ozo 5350-epo66.2 pErg663.2Doo po3oqp5v36 go6553-epog 5D-23653oo 5-2530pp-
2.2o
0999 065.235.4-e5q. DoggoppEr4o 5;5655op63 qq5-2656opo 654poquo65
ogo5;35556
0099 -45.6.253036.2 o5q5DTepTe 5oo5-epog6; 533350-456D ogeboobo-26 Bogob-
eopPo
09 5o6q.D5566e 65gboogoqq. 3q40503655 p-e5-e6o355 o6goo536E) opo556305
00E79 p5oggpoq55 ;5835633-43 55opp6oqqo opoq-e6=6.2 5pg5D-epogq. o5oopp5355
0zt/9 5ODPODP*42 6555-4065.4 D6 3305.456 p55365;p6o 6033;5530 o5oE,55-1.po
099 ou.D.e5op6op gog556-25-45 5531.55o6D 3-2.46056pae opq5pobppq 6250-
455op
00E9 655q5DP6q5 566app5opq 55635530;6 q5635D50-e5 66o055D-45; obqp6o35.e5
0pz9 ogo50-eo5D ;55qpop565 6o5q5q565 5o5oo-25535 op.e-1.5opog goggoDo55
En
SO-ZT-SOOZ St,VCOSZO VO

cA 02501445 2005-12-05
224
cgatctgcac gccatcacca gctgcctcac cgacgtccgg gcgctgcggg tgctgcgcca 7140
gcagagcgtg ccgctcgacg acgcccggcg ggacggctgg gagcggaccg ggagcgcgat 7200
ccggcatcgc agcggcaggc atttcgagat catggcggtg gaggtgaccg cggagcgccg 7260
tgaagtggcc tcgtggaccc agccgttgct gcgcccgtgc tcgcagggac tggcggccct 7320
gatcacccgg cggatcaacg gggtgctgca cgccctggtg gcggcgcggt cggaggtcgg 7380
cacgctcaac gtcgccgagt tcggaccgac cgtccagtgc cggcccgacg aggcggacgg 7440
ccagtcgccc ccgtacctgg accgggtgct gacggccgga gccgaccgcg tccgctacga 7500
cgtggtgcag tcggaggagg gcgggcgctt ctaccacgcg cgcaaccgct atctggtggt 7560
cgaggcgggg ccggagctcg acacgggctg cccgcccggc ttctgctggg ctaccttcgg 7620
ccagctcacc gaactgctcg cgcacggcaa ctatctcaac gtcgaactcc gcaccctcat 7680
ggcgtgcgca cacgcctcct actgaatggt cacgaaagct gcaccgcgcg ggagaatcgg 7740
cagcgcgcca ccggccggcc ggcacccgga aggtaaagcg ccgttctccc gcatcggcgc 7800
cctgcgggaa acggcggaac ggccggcccg gaccgcgcgc aattcccggc gggacacggt 7860
gggagcccgc acgaggaacc gctttccccg ccttcggtgc gcccggccgc gggaccaccc 7920
ccgcctcccg gccgggccgc ggaatacgac gggggcggcc gaggacattc ctttcccgcc 7980

cA 02501445 2005-12-05
225
tccggaaaag cgcgccccga gggcccccga atgccgggcg ggacggacgg cgactgcgcg 8040
cggacggcgg cccggcgtcg aacgcacctg cccgagtccg gacgagacag cgcgacgcga 8100
gaggcgaaaa tgatcaatct cttccagccc cagatggggg ccgaggaact ggcggcggtg 8160
tccgaggtct tcgacgacca atggctcggt cacggacccc ggaccgcggc gttcgagtcc 8220
gcgttcgccg agcacctcgg ggtcggcccc gagcacgtcg tcttcctcaa ctcgggcacc 8280
gccggcctct tcctggccct ggagtcgctc ggcctgcggc ccggcgacga ggtcgtgctc 8340
ccctcgccca gcttcctcgc cgcggcgaac gccgtacagc tctcgggagc gcgcccggtg 8400
ttctgcgaca ccgacccgcg gacgctgaac cccgccctgg agcacatcga ggcggccgtc 8460
accccgcgca ccagggccgt catcgcgctc cactacggcg gccaccccgg cgacatcgtg 8520
cgcatcgccg agcgctgccg ggagcggggc atcaccctga tcgaggacgc cgcgtgctcc 8580
gtggcctccc gcgtcgacgg ccgaccggtc ggcaccttcg gcgacctcgc catgtggagc 8640
ttcgacgcca tgaaggtcct ggtcaccggc gacggaggga tgatctacgt caaggacccc 8700
ggggcggccg cccggatccg gcgcctcgcc taccacggcc tcacgcggtc cagcggcctg 8760
ggatacgcca gggtctcggc gcgctggtgg gagatggacg tccccgaacc gggccgccgc 8820
gtcatcggga acgacctcac cgcggccatc ggcgcggtcc agttgcgccg gcttcccggc 8880

CA 02501445 2005-12-05
226
ttcgtggccc gccgcaggga gatcgtcgcc ctgtacgaca gcgaactgag ctcgctggag 8940
ggcgtgctga caccgcccgc gccacccgcg gggcacgagt ccacgcacta cttctactgg 9000
atccagctgg cccccggcgt ccgggaccgg gtggcacgcg acctgctcac cgacggcatc 9060
tacaccacct tccgctacgc acctctgcac aaggtgcccg cctacggcca caccggaggc 9120
gaactgcccg gcgtggagcg ggcgtccgaa cggaccctgt gcctgcccct gcaccccggc 9180
ctgtcggacg ccgacgtccg caccgtcgtg tcctccctgc gcagagccct gagcgccgcg 9240
gatccggccc ccgcctgacg cgcgcacgcg ccacggcccc tgtcccggcg gtgaccgccg 9300
ggacaggggc cgtggcgcgt cctgcggacg gtccgggcca ccccgccgtc ccgtcggtgc 9360
gtcagcgacg cgtgccgagg aagaagcccg gtgagccctc gcccgtcacg acgtactcga 9420
cgtccaggcc ggccttgcgg tacgcggcct cgtactccgc acgcgagaac agcgtgaggt 9480
agtccacctc gctgcggtgc cggatgccct ccgcggtgtg cgcgatcagg tagtggatct 9540
ccatccgggt ccgcccgccc tcccgggtcg agtgggagac acgggcgacg ccctggtcgc 9600
ccggtgccgt ccgcagggcg tgggtggaga cgtggccgtc caggaaggtg tcggggaagt 9660
accacggttc gacggccagg acaccgtccg cggtcaggtg ccgcgccatg gcggcgacgg 9720

cA 02501445 2005-12-05
227
cgtcctccag gtcggccgtg gtctccaggt acccgatcga gctgaacatg cagaccacgg 9780
cgtcgaacgt ctcgccgagg tcgaacgccc gcatgtcacc gcggtggagg gtgacgccgg 9840
ggagccgctc ctcggcgcgg gccgccatcc actcggacag ctccaggccg ctcacgcggt 9900
cgtagagctt ggcgaaggcc tccaggtggg taccggtgcc gcacgcgatg tcgagcaggc 9960
tggccgcgtc cggcgtacgt tcccggatca ggtcggtgac ccgggcggcc tcacccgcgt 10020
agtccttgcg gtcctggtag agcaggtcgt agacctcggc ggcactgtcg ttctcgtaca 10080
tgggaatcct ccgggccgtg aagggggaac cgtgggtctg tcgaagagga gtgcgccgtg 10140
cgctcggggc gggggcggcc tgccgccggc ccctcgcgat gatctccgta cggacaccca 10200
acagttcacg ccgagccggg gtcaaggaac gacggggtgg tcagtcaagt cgggcgctcc 10260
gcccccgggg cggggcgcgc cggcgacgcg cacggattcg gccaaccggt tgctcgttcc 10320
gccggaaatc acggtgtggc ccccgggcca ccgggtagct tatgcctcgt tcaccgcagc 10380
ggttgaagag gcagccttca accccggccc ggcctttatg gaattcattt ccaccgtgcc 10440
gcaacaccca ctgaaggacg gccggatatc ggccatgaag ccccggcctt tcagccaggc 10500
accctctctt gtcgaataga gtatgtcctc cgctgaagcc gccgaagacg gacgaagggg 10560
acgaacggtc acctcggtcg atctagacgg aatccttgaa agcgtaatag cctgtcaatg 10620

ozsii DE.4;50;0.5 0360550536 5poE.55-;v5; 55.E.353.e0g5 5qopv350-46 00.;00530

09v11 533;66.e353 03eo536353 q300500PD6 33065.25055 3Te3p65p30 5o5qopp056
oopu 50;p003.25 opago6p65 v60;55;066 opp-20506u6 0Te5356;56 060056;0;E.
omIT 50063;350; 06;505;00 vo-466-26pp -eppoo3p6qo qu.06505;65 E.0q6opp630
08z11 60350Eg3q0 0-;65655.5 p0pp536655 53350553 630353355 ;30550535
ozzu 05;3055v6 0050630;60 q.DE.5op60.; 60056260-1.5 ou.06opoggp 6vo-E.555
09111 50qopegop5 50333.255o ;4003;0606 33503-e353 655q-e0050 655-43.e.5605
00111 606005503 6;05.5pogo 56poboq. 55y3;5605 o-evo55053 0606-e5q36-4
or7ou 56;553055 003560365 E.66.e5006; op660;50e; 33;05065 go55;06-4
08601 050553v05 .25.e0503053 .1.00-45.255-; 05;33-e66-ep 055663650o 060360;5o;

0z601 q5-253u,3505 0350v50;56 ;00365053; o5,65356E,5 5500505op 500-eq560;
09801 -e5q.263-45ep 63600'eogoo D63;05633E. oq.;0505.E.5 5go-e500605
gv5500.265
00801 605306056 50-4060-e50 050530056; E.3;05500p5 ovqp5o55 6opo0o560
017L01 -1.6633050; ogq5-e50433 gq0350qopo 60-e60p653; 5u505.2E.5.e .500q.556'e

08901 55-455qoq. -4555;03e5; 6.26;p56605 goo5q56656 q.655-eopo6 -e.e.e.;55;;;0
SO-ZT-SOOZ St,t,TOSZO VD

0u71 35ovo3335p 65.e3565oq6 E,55goopqfq. 555E.5gogo-e. 3pogq.55.4o; P5boypqqp5

09u1 DOEDOD.20'25 oPqop6o;66 gb000p553; .26o=e5o.255.e. oquouq.-456o
opoq.50.25D-e
oom p6u65-26338 ogooq.35q.D 55ogDpgq-45 55qope5opq. op5o5g5obo p.e356056py
017zzI 50650653;p 6D5o6Dogpo o5Er4o.q.6 q.5-2535o36 bE.q.630-2o5 35o.e5op5o;
0811 E.D653-e53-46 33-26Dqop5o poo55D6pq 66855;5=e og5ooDD-236 55DDED6DoE.
uTzT 5opE.5;35E.6 boopp6Dobo oEyeobobbq boobogboop p.e53-253563 Do6go5go5-4
0901 30.453.45005 3650p55535 q.53535q.15q. D556355ogo 6555o53 q.3-26Do6o6
Hoz' booqop65pb 5436606338 ogoov558o6 oppo5535 5 55-455-436 q55-460E.obo
m'Eu Do5oo5oo4-4 p&eog000go gq5fq.poo 5350.2E.555.e oqpogo6Dpo opeD;Dboop
08811 05055550q2 5-1.opf,p6o ggo-qq.555 opoo6P5o 6o56.2poop ol.p5op6o.e.
()nu oEyeopq5o6o Eqoppo5-435 o5D-4Doovo5 opp5og5Erve BooDgo5gDo ODO;500.6D0
09LIT -ep-pooP5635 ae653o1.55o gopu5oov6; ofq.opqq.355 0363366B 55Dopggo5q.
()nu 00005466op 65-4o-455555 opoo55q5op qopopp553 D65oDp5-250 3533555=5
017911 op5q5o5535 p5o5go.e.e55 D-epopoo5pq 6opoo6D5go Do-e555o2g5 eboD6ogo6o
oggii op6D556ogo 6poo6o5q.5 gpo5boD5p5 6D65o55ogo 5055v5pD5o p65pubp6o;
6U,
SO-ZT-SOOZ St,t,TOSZO VO

09u1 6ogE.65=55 5Do53g4fiop 606p6pQ5q. Eq3pE.666qq. bopoboop6 qqpv56q6ft
Hui PDE.o533o 35ppe563p3 oqq5E,pogo5 boogElopboo 5v5po.e0635 oboo5o55
opui opop6oD5q. -e5po5opErgp ogbogog5o5 5ftoop6355 6opq6-20-455 oupftob000
080E1 555o556; op35600pqo op5pq.66.2po qpDgE)545o.6 pogogggfto 5.ep.e5o&ebo
ozocI ob5u.oE-e6q.D 555D653.45 bpoboo5pg5 oboogqopq
pop5.1.05p56
096t 055poTe5og 0g25355500 frepo.eogo6D -4.655oTeopq 56p35-2o5-eo boogflogo5
006u 55-455q455-4 56E.5;56563 opp5Dppop googDpE.opq obq036.4625 oboog5-1.56
or78zI oboo6o650 6opppv5opf, .4555-48o;55 of)Dogobo op566oDE.5 q5boo5D566
onzi Do5e3;65; poogogboop 5ofq.p6obbo qp-epEqp5DE. 5oD5poqq56 ;506=3555
onu poo-456-ebo 50q5Dopoo q.55opoo56 opoofq.q.5 0555o5EYeD 5pD5o6o4E.5
099u 6o6o550;53 po5oopp5o8 635550.2065 pogogoop6; 5.e5o6o61.35 oTe553gobq
pont 5oo155boDD 5-25pp-45366 poupbogoo gpqp5o55o; obo5;56PD; .eqogo56o5q.
of/qm opo55qoppo vq.u.DE55-405 -456535653 DE.ogEyeo65; op55E.5565 go5qp-eq5o6
0817zi 5oTep6o5-e5 5.4D563650-e go-1.503.2pp E.5DoovoEq6 o5o5gopou.6 -
25.eo6005gE,
SO-ZT-SOOZ St,t,TOSZO vo

cA 02501445 2005-12-05
231
tcagggagtc cacggcgagc cgacccgcga cgcgcacgtc ggtgagttcg gccaccgcct 13320
cctccgcctc cgggcccgcg gtgtcgatgc gggcggcgaa ggacaacggg tcggcgggag 13380
cgtggaccgg gttctcggtc agctgcgcca cgcgttgctt cgcgttgcgg atccgcacca 13440
tcgcgccgtg gtcgcgccct cgcctgcggt aggcgccgtg gccgaacacg gagagggaca 13500
tcttgcgcgg gatgccgtcc atccgcgcca cgttggaggt gatcagcccg cggttgcggt 13560
cgagttcggc acgccactcc tcgtactccc gcagccgccg ctcgcgttcc acggccttgg 13620
ccgtcaggta gccctcgtag ccgttgccgt agcgggtgac gctgccggag tcgacctcca 13680
ggatcgtggt ggtgagccgg tcgaggaaga cccggtcgtg ggtgaccgcg atcaccgtgc 13740
cgcggtggcc ggccaggtgg tcctccagcc attccatcgc ccggtcgtcg aggtcgttgg 13800
tcggttcgtc caggagcagc agctccggcg acgaggcgag ggtcgcggcg agcgcgaggc 13860
gggagcgttc gccaccggag agggttccga gcttgcggtc gcggtccagg ctcggcagtc 13920
cgaggccgtg cagcgcgacc tccacgcgca cgtcggcctc gtagccgcca cgcgcctggt 13980
actgctcgac cagagcggcg tagcgctgga ggccggcgga cagctcgcgc tcggagccgt 14040
tctcgtcgct ctcgcccagc tccgcctcgg cctcgcgcat cgccgcttcg agctcgcgca 14100
ggtcggacag ggccaggtcg acggcgtcct ggacggtggc gtcgaggggc agttccagtg 14160

cA 02501445 2005-12-05
232
tctgcgccag gtagccgacg ccgccgggag cgaccacggt gagcgcgccg ttgtcgggct 14220
ccacgcggcc ggcgaggatc ttgagcagcg tggacttgcc ggaaccgttg tcgccgatca 14280
cgccgacctt ctcgcccggc ttgatgctga aaccgacccg gtcgagcacg acacagtcgt 14340
ggtagcgctt cgtgatgtcg tgtagggcgt attgcgcaat cgacacgcgt aagtctcctg 14400
tttccacgat gaggatgagt ggatgcgtga gcgcgctcgc agaaagaacg gaaagcagaa 14460
gggacgccac cactgcggac atggccggtc agggggtgtc acgagcacgc tgctggatgc 14520
ggcaggcgga gtcagctcaa cgccgggcat cctcatctat cacagagatc ccatgcgaag 14580
aactatagcc gtgctacccg gtgccgcgca acggtatgcg tgtcgcaccg gccgacgtga 14640
tgcagtcgga ccgggatgat cgcttgtccg gcggccggat gcctagcctc gggagcaacc 14700
acagcggtct ttcacgagag gggtcgacca tgggcgatct caggaaccgc atcaccgagc 14760
tggtccgcgc gtaccaccgg gaacaggcgc ccgggggctt cgttcccggg acgacgcacg 14820
taccggtctc cggcgcggtg ctgagcgagg aggaccggct ggcgctggtg gagacggcgc 14880
tggagatgcg gatcgcggcc ggcccggcct cccggggctt cgagcggcag ttcgcccggt 14940
acctcgggct ccggaaggcg cacctgacca actccggttc ctccgccaac ctcctcgccc 15000
tcggcgcgct cacctcgccg cagctggagg agagacggct gcgtccgggg gacgaggtcg 15060

096g1 33gg3-45556 Dqp55goT45 op5oo-e5Do poqp5goo-e5 o6feo.e'e5,55 -4DDogo5603
006gi -4.5.45563p-eg 560q5pot.53 ovougoo5op povo6605q5 ogoo3555 663;q6;036
omgi op6opoPp5P oTe5500505 oqeu56goop op.e5pq.56go op55p5.65o 5o.2.4605op
oust 53-256poo.e5 5-45Do-eDg-eo qopq4556D; ;55-4pEceboo qp5o5e0556
00.20E'DOE)Te
ongT oqop5;35qp Eq.0-4650005 qp566D-e55; ;5 633605o 6q.ogo.66o6 6.4330606
0991 o5ftoo65.E.5 op-epqq6v55 .e5oTe65poo p5goEyeoppg 6;05663qop 05.63.66o6q.
009T ODP5D0.260; 5.6-4333 .2qq.553-450-2 obogoggpq-e. opq6E-23.eop
.25opq.565op
cu,ssT Dboo6qopp6 ;555q-e5E.5 oppboq-465 o5ogoo5q. o5ooppe65 P5q.556po6
0817gT 605;56;05; p53505566 6;o63535; opq.'e5Erq6 3g-256 6056 goop55qopp
ou7gi voubooE.ogo 5q5o6q3655 555v6;655q. pbobol.ovo op6o6opoq. pqoqqoftog
09EsT 5oop5og5qo DE,5065ogqo oqobboo-epq 0652o55550 ou,go600pq5 555-455353-e
00EgI 535go'epE.5 5P5ogpoqpo qq6ygo5-2565 o5v5Dp6635 ogoo5Doo55 -456533
of,zqi 55.e5ogqopo D.E.3556goo o5ovo63534 5-4,oq..2506 5533-256Do opp563-400
HIST 555o55oqu. p6o55pop5 DE.53oupp-e q.60356ogo 5p5pq5D.e56 q5oggo.4533
ozIsT p5.466-4o665 p.e.D'epoqqo qv5opouvoq 55D5oppo Dg-4555305p o6D;55o.eog
EU
SO-ZT-SOOZ St,t,TOSZO vo

00891 ogbboobboo ogb3u.pq-456 033.1.30-1.053 q500536;q5 qqoppo&eop 6op-
250665.e
opoi 5356338-2.5 -455qq.5355o oBggovEq.6 35 5555356p5553 3g3553353P
08991 05P33P33qD gq.53555.23 -e5o55;555p opg5g5og5E. 3v353p5333 5og53g5o55
0991 035333535 55
555;p53550q5q5 150.eopo5re6 pg6DE.6;56 v56505;86-4
09g91 65.eop.epoqo 363-e-2560.eu, 85;533,253; gog335353 og53535q85
.e.DDDft.ofq.
0091 6DE.3pP53-45 o3u535;55 503;5655pp 53535go5pD D55p53ov35 353q3p.e.o5p
0m791 o53o3q53-e3 3353553353 g3E.56.1.563-1. 33P53PO3P5 opElTeggoo 553q.3E.535

08E91 33;555335 p-285-253568 D5,35pDpq. 36goog3553 3.48353Te53 5o.E.DE,6535
oz91 553.5333E. 533335Te53 -3,5oqp5-2053 o3.146e3g6 3;55355'235 35.638;555
09z91 53.1.33-e33g3 3p33q33E,53 .ogE,5555.eq. bogE,Dgoopo go56pou.op
53.6poo.235-4
00z9T Sog53goop5 ogoovo6v5; o5q.65ogo5; 5;535533;3 3354555p35 -25;5535353
0f7191 o3E.55;5555 3g555355p 533q.35u53 3-4535553 5oo56Doq6 3655533;33
08091 ;33553555 50355u656 655;53535 ;55655opq5 6065D5656P 6g33goo5
0091 ,3q.35-
4535-4 5566poqp5 o2op53653; E.ogoo53-4-2 5q.e5.266opo ou.ogo55op
tEG
SO-ZT-SOOZ St,VCOSZO VD

CA 02501445 2005-12-05
235
ttcagctgct ccagctcccg gcggagcctg gccatcttgt cgttgatccg ccgccggtcc 16860
gtctcgatct tcgtctcacc gggaccgcgc gtggccatgc caccgccgcc accgccgccc 16920
atctgccggg acagcgactg gccccagccg cgcagccgcg gcagcatgta ctgcatctgc 16980
gccagcgcca cctgcgcctt gccctcccgg gactgggcgt gctgcgcgaa gatgtccagg 17040
atcagggccg tgcggtccac gaccttgacc ccgacgacct cctccaggtg catcagctga 17100
ctggggctca gttccccgtc gcacaccacg gtgtcggcgc cggtctcctc gacgatgtcg 17160
cgcagctgcg acgccttgcc cgagccgatg tacgtcgccg ggtccggctt ctgccggcgc 17220
tgcacgacgc cgtccagcac gagggcgccc gcggtctcgg cgagcgccgc cagctcggcg 17280
agcgaactgt cggcctccgc ggccgttccc gaggtccaga tgccgacgag caccacccgc 17340
tcgagtcgca gctggcggta ctcgacctcg gagacgtcgg tcagttcggt ggagagcccc 17400
gcgacgcggc ggagggaggc ccggtcctcg cggtctaact gatcgccgtc ccattcctcg 17460
gcgtcggcgc cggccatcgt gtcgtccatc agtgcgtcgg ctcgctgcgt gccggcgaag 17520
tcctcgggat gcgtcaaagt acttccaatc tggggggttc gagagcgttc cggggcgggg 17580
cgcgtccggc ctgcggggcc gggcgcgggg ccggggggtc ggggccgacg tgtccgcacc 17640
tcgccgtcgg gggccggtgc cgtggaggtc gctgccggaa ctcacatgcc gtccacccta 17700

00981 633q6v6;50 65ovo52600 60034665 6.2606065 5q655335 660600650;
017s8I q6533.e.3366 .evoq.505;5u 550.23;05g; 5.255660q40 0.230.eou-e5e
56600600
ci8ts1 3Poq63g2o qq33636533 -2;63065026 6353;305;o E,50;30653-4 ;0;53363;6
0p81 .;5060q.50 .e50;6-1.005 o6Te0656q5 55opoopo 656300063; 06;666306o
0981 3-e35-256565 E.63350;635 35;236355; 5;355;0050 6ogo6qp05 06qp03vou.6
00E81 3u.35335563 goog2o-46q6 60066505;o 006goope5 500666060; qopp65006
ovzu 5;53350636 v506;065op 55-5;03.45 o66 ;o6; 66360360-2 po6603e55
08181 3053p55035 3335q3.e50.2 poo5q0opoq 3-263p53p65 ;5603600-; 56066.23506
ouu 66go60336 go35goo5og -E.06-203q3q6 opqogoogo 0.20.e56053 065600;6;0
09081 5355360056 ogoo55566; 663v063330 6504650 5.1.03.20.256; 6056050-e5
00081 65q0.2356- 5600;6;66; 06636551.3 0p6o560366 ;555350op 605666-eog6
of/6LI 5355263;63 660305qopy 6oppo5835p oq6;666503 E.E.ogq.5033 E.0;655poup
088L1 5565350356 q0.E.056.2533 6006oggoo6 5503655;6o qq.5E.D0q.q.6 55553Tegg
0z8L1 ogo.eq5.e606 1.0q5-4p55; 6;5536663 55-450555 06003536;o .eq56503.235
ouLT -1.6q.b.efrep-e6 -435.e3333g0 3-20;v53550 Teq53e55.cre 35;555563
0535g2305
91
SO-ZT-SOOZ St,t,TOSZO vo

0061 638;55e5 65056o55p 5q56v6550 553605 55o ;50;63-45q.E. D5062-4653;
0pr76I 5553-46.1.63 06336Do5D6 q.5.E.355pg5 gq6Do5D.25 .4656o6Po5o Do5bo6D5E.D

08E61 5q5e.256.253 pq.555oggEie p6o55-eog56 op5D55D-206 -235056D.23;
56D55356Do
061 o35oE.5DE,33 556005yq.3 5065p3E)6 3663565565 g3op5peo35 53665;55e5
0961 p6Eye-e6006q .epogq6q6oD 52;55o6-e63 053-2-463;o5 -208q6op6go Eq.E.6D36-
26o
01361 56o655E,o; 355;532 5;50-46655o p-45.4356q55 q.5556oE,-45 o5oD5Po55
5D65gool.55 ;86opogooq. 363ED563 65632opq.55 3o6q5p-eboe 3qq6q.E.65.80
08061 .253ou5ce.265 3550.23533-e 3q.5533355 3g33.453.e.5.2 55 553;o-25
3pq6o65053
o061 5.2o5355qo3 5oopo5Poo.2 .6D-453goTe5 3voo555353 55oloq_55pE, 5155opp2q3
09681 5535355553 0353550p3; Er45q.opq.505 p65o563335 5053333500 q6;5353;p5
00681 35535v5585 obogo6opog gq5op5o63 6q5p555po poo5505op5 qp555365p5
0d,881 5D6-4553563 bogo5o565 qop5op6ogo 5go5E,558 p5560055; poo-45q0385
08/.81 o5q0663055 D6Dgo5oo5q. owe55oopq5 poo65op55 5Dog5pq.55v 565qop5ou6
()nu 55o5q5Dovo E'Dogroggoo 355opErqop6 6;3;65505o o556o33535 p6opE.0655
09981 Do56o555-45 q5ogDpo-eop 5550535po o-e6poo5;66 5g5Te5o36; DD.255o.e.56;
LEZ
SO-ZT-SOOZ St,t,TOSZO Vo

0t,c0z 535853385 3234880602 55385;5553 6086855888 5865;35035 08365553o
08z0z =6635885o 0;56=5385 353385;553 8330535535 D585;558;3 8653335336
puin 5;55355583 855;5;3;88 D08500638; 083853085 ;360338;5p boopo5q.563
0910z ;5=855585 3350633E35 83838543;8 5036588366 38606388p3 0553560338
0010z go5885;poo 553555;880 6533-;336pq 585383038p 8363850355 3886;5E35o
cu,00z 583835838o 1.56q855opq 653;8835o oq365;886; 835636658 0=8;68868
08661 3583;35538 8536535;55 533566365o 53355poggo 5385565338 o583635886
0661 33;063;880 358353353; 5385350335 538505555 8355535552 3586855;55
09861 565306;56o 83583;5580 5385335;35 5350;635pp -46533366.13 3355583335
00861 ;335;58853 q.68.353;036 3386363565 8;53;33555 835800;353 55653;5383
017L61 3;53553858 ;5;2535338 355E335;83 58365365o ;383335535 3353353583
08961 5opoboop5; ;35;538558 53833g3qqo 6663860553 55;355;535 50;6353356
O961 5355238853 68;803556o pogobobooq 58338;583; 833;3;3588 5;83885585
09S61 5;5552585 ;35;5355;5 6386;34355 5832833;33 5630835E38 533;3;358o
8-Z
SO-ZT-SOOZ St,VCOSZO vo

cA 02501445 2005-12-05
239
gccgaccgcg aactggggcg cagactgcac cggatacgcg gcgtccactg gtatttcggc 20400
aaccacggtg acccgtacgc cctcatcctg cgcggtcaga ccgacgaccc gtcggtgtac 20460
gaggagcggg tccgcgaggg cgggccgctg ttccgcagcc gtaccgggac ctgggtgacc 20520
gcggacccgg aggtggccgc ggccgtgctg ggcgactcgc gcttcggtgc gctggaccgc 20580
gccggacggc gcccggagga gtacctccag ccgtcgcccg ccacgtacct ggggctggac 20640
cgcgccgcgt acgcgcgtct gcggcgggtg gccgagcccg tgctgggcgc ggacgccgcc 20700
gccgcgtggc gccggctcgg cgaggacgtc gggcgccggc tgctcgccgg ccgcggttcc 20760
ggcctcgacc tgacggcgga cttcgcccgc cggctgccgg cattggtcct ggccgcgtgg 20820
ctcggggtgc cgggcgaacg gtgcgacgag tgggaggagt cgctgcgggc ggcggggccg 20880
ctgctggacg gtctgctgtg tccgcagacg ctggcggcca cccgtgcggc ggactcggcc 20940
gccgaggggc tgcgcgcgct gttggacgag gtggtcgccg cgcgtcccgg cgggtccggc 21000
gagggtgcgg tggcccgcat ggtcggcgcc ggagccgccc ccgacgacgc ggtggccgcc 21060
gccgtgtgcc tggcgctctc ggccgtcgaa ccgacgacga ccctggtgtg cgaagcggtc 21120
cggctgctgc tcgaccgacc cgagtggtgg cggcggttgt gcgactcccc cgctctggcg 21180
ccggccgcgg tccggcacac cctgcggcac gcgcccccgg tgcggctgga gagccgggtg 21240

CA 02501445 2005-12-05
240
gcccacgagg acgtgacggt ggcggatcgt ccgctgcccg ccgggagcca cgtggtggtg 21300
ctcgtgggcg cggcacggcg cgcgggcgcc ccggccgcgg agccggcgga cctggcgggc 21360
gcaccggcgg cggagctgcc ggacgacctg tggttcgcgc tgtccgggga gttcgtcggc 21420
cgtgccgccg agaccgcgct gggcgtgctg gccgaggccg ccccgggact gcggcgggac 21480
ggcgacatcg tccggcggcg ccgttccccg gtcctcggca ggtacgcgcg gttccccgtc 21540
gcgtactcct gacgggcccg cggccggcgt cccctcagtc ccccacgacg tttcatgaaa 21600
ggagtgccgt gcgcgtcctg gtgacctcca tcccgcacca cacgcactac taccacctgg 21660
taccgctgat ctgggctctg cgtgcctcgg ggcacgaggt ggtggcggcc ggccagccgt 21720
cgctggtcga cgccatcacc gccagcggca tcccggcgtt cgccctggcc gaggaggagt 21780
cgctggcgca gatcttcgag gaggtcgagg gcgatctcca gccgtatcag cacggcatcg 21840
acgagttcga cttcttcggc accctgaagg acgagctgga ctgggagaag ctgctcgccc 21900
agcaggtgat cctgtccggc ctgtggctgg aaccgctcaa cggcgccacg accctcgaca 21960
gcatcgtcga cttcgcccgg gcctggaagc ccgacctggt gctgtgggag ccgttcacct 22020
atgcggggcc ggtggcggcc cgggcgtgcg gggccgcgca cgcccgcgtc ctgtgggggc 22080
cggacacgat cgggctgctg cggacgaagt tccttcaggc ccaggcgcgt cagcccgagg 22140

CA 02501445 2005-12-05
241
agcaccggga cgacccggtc gcggagtgga tgacctgggc cctggcgcgc tacgggtgcg 22200
acttccggga ggaggacgtg ctcggtcagt ggagcgtgga cccgatggcg gagggcgtca 22260
gtctgggcct cgacctgccg accgtcccga tgcgctacac cccgtacaac gggtcggcgg 22320
tgatccccga ctggctgacc gaggaaccga aacggcctcg ggtctgcctg accctggggg 22380
tgtcctcgcg ggagcacagt gaggacgagg tcccggtgca gaggtttatc gaggcgctgg 22440
ccgatctcga catcgagctg gtggcgaccc tggacgacgc ccagcgggac ctgctgccga 22500
ggatcccgga caacacgcgc atcgtcgact tcgtgcccat ggacgcgttg ctgccgacgt 22560
gctcggcgat catcaaccac agcggttcgg gcacgtgcaa caccgccgcg ctgcacgggg 22620
tgccgcagat catcctcggc ggcatcctgg acgccgccgt acggcagcac atgttcgcgc 22680
agaactccgc cgccctcacc ttcgctccgg aggaggtgac cggcgcgtcg ctgaggagcg 22740
cgctggtgcg cctgctcgag gagccgcggt tccgcgacgg cgcgcggcgg ctgaaggagc 22800
ggatgcgggc catgcccagc ccggccggga tcgtgccgac cctggagcgc ctcacggccc 22860
agcaccgccg ggcgtgttga accggcgcgc gggcccgtgc cggcggtgac cgcccgaccc 22920
gactctcgcg tgtgatcgat ctcgtcgact cagccgtgga ccggttcgcc tgtccgcgcc 22980
cgacactgga gtgctgatgc gggccctctt cacgaccgcg ccgctcgcgg gccacctgct 23040

CA 02501445 2005-12-05
242
tccgctggtg cccatcgcgt gggccctgcg ggcggccggc cacgaggtac tggtggcgac 23100
ccgggaggac ttcgtgccgg tcgccctgcg gtcggggctg ccgtccgcct cgtgcgggcc 23160
gcccgccgcg gacctggcgg gcgcggccga ggcgggggcg ctcgcgcggc cccgcggagc 23220
ggcggaggct cggggggtcc tgagcggggc gctggcgcgc gtcgcccggg gcagtctggc 23280
gggggtgcgg cggctggcgg acgcctggcg gccggatctg atcgtcagcg aacgggccga 23340
gttcgccggg ccgctggtcg cggcggccct cggggtcccg tgggtccgct accactggtc 23400
ggtctcgtcc ctggaggagt accggcgagc ggccgaggcc gagttcgcgc ccgagctggc 23460
ggcgctcggc ctcgaccggt tcccggaggc ggcgcgcgtg ctcgatccgt ggccggtgtc 23520
gctgcgccgg ccggacgcgg tcgcccacga cggggtccgg cacgtaccgg cccacgggga 23580
cgcccccgtc cccgactggg cgttcacgcg cggtcgcggg ccgcggatct gcgtgacgct 23640
cggcaccatg ctgccccggt acggcgccgc cgggatggcc gacttcctga cggagctggt 23700
ggcggagacc cgcggagggg actgcgaact gctcgtggcg gtcgacgacg acgtcgtcgc 23760
gcggtggccg tcgctgccct ccgcggtgcg gtacgccggc cggctgccgc tggcggaggt 23820
gctgcccgcg tgcgacgcgg tggtgcacca cggcgggcag ggcacgtccc tgaccgcgct 23880

CA 02501445 2005-12-05
243
ggccgcgggt cggccgcagg tcgtcatggc gcggctcgac gaccagttcg acaacgcgcg 23940
ggcactggcg gcggcggggg cggccctgct cgtaccgccg tcccgggcca ctcccgcggc 24000
cgtggccgcg gggtgcgccg aagtgctgga gaacgccctg tatgccaagg cggcagccgg 24060
gctcgccgag gagatggcgc tgctgccgtc gccgtcggcg gcggtcggac tcctggaaca 24120
cccggggccc gggccggaca tgccgcggag ttacccgaac gaggatgcgg tgtgacgtga 24180
atctggaagt actcaaccgt tcgaacgatc cgcgcgggcc ggtgatcacg gtggtcggcg 24240
cgtccggctt catcgggtcc gccctggtcg ccgagctggc gcgcatgccg gtgcggctgc 24300
gggcggtggc ccggcgcgag acccccgttc ccgcgggggc acgggccgcc gtcgaggtcc 24360
gccgggcgga cctcgcccgg ccggacgagg tcggggccgc cgtcgagggg gcggacgccg 24420
tcgtgcacct cgccgcccac atcggcggcg cgcggtcgtg gcgcgcggcc gacgagcggt 24480
cgctgcgggt gaacgtcggt ctgctgcgcg acgtggccga cgcgttccgg gaccgctcgg 24540
ggcccgcccc ggccgtggtc ctggccagta ccctccaggc cggcgtcgag ctgtcccggc 24600
agggcccgta cgcccggcag aagtcggcgg ccgaggaggt cctgctgcgg gccgcctccg 24660
aggaggtggt ccgcggcgtc gtgctgcggc tgccgaccgt ctacgggcgc agcccgctga 24720
ccgggtggac gggccgcggg gtggtcgcgt cggtggcacg gcaggccgtc tcgggcgagc 24780

CA 02501445 2005-12-05
244
cggtcacgat gtggcacgac ggcacggtcg ggcgcgatct gctccacgtg gaggacgcgg 24840
cccgcgcctt cgcggcggcg ctcggtcacg tggagcggct ggacggcggc acgtggtccg 24900
tcggtacggg ccggctggag cccttgggag aggtgttctc ggccctcgcc gggctggtgg 24960
ccgagcggac ggggaggccc cccgtaccgg tggtctccac ggagccgccc gaccatgccg 25020
aggcgggcga cttcgagagc gcggtctgtg acccctccgc gttccgcgcg gtgaccgggt 25080
ggtctcccct cgttccgttg cgggcggggc tcggcgccgt ggtggagacg atggtggccg 25140
acggagcgag gggtgggatc cgaacgtgag cacggaccgg gagcaggccg cgcacacgcg 25200
gctcggtcgc agcgcgaccc tggtgagccg gctctggctg ggcaccgtga acttcagcgg 25260
ccgggtcgag gacggtgacg cgatgcagct gatggaggcg gcggtcgacc gcggcatcaa 25320
ctgcatcgac accgcggaca tctacggctg gcggatccac aagggccaca ccgaggaact 25380
ggtgggccgg tggctggcca agagcgccgc gcggcgggag gacgtcctgc tggccaccaa 25440
ggtcggcggg gacatgagcg aacggctcaa cgacggcggc ctgtcggcgc ggcacatcgt 25500
cacggcctgc gagcagtcgc tgcggcgcct gggcgtggac cacatcgacc tgtaccagat 25560
gcaccgcgtc gaccacgccg cgccgtggga cgagatctgg caggcgatgg accgtctggt 25620
ggcgagcggc aaggtgacct acgtggggtc gtcgaacttc gccggctgga acgtcgccgc 25680

cA 02501445 2005-12-05
245
cgcgcaggac gcggcccggc ggcgccagtc cctcggtctg gtgtccgagc agtgcctgta 25740
caacctggcg gtgcgccacg ccgagctgga actgctgccg gccgcccagg cgtacggact 25800
gggcgtgttc gcctggtcgc cgctgcacgg cgggctgctc agcggggtgc tgcgcaagct 25860
cgcggcgggc gtcgcggtga agtcggcaca ggggcgggcc cagctgctgc tgcccgagct 25920
gcgcgcgacg atcgaggcgt acgaggggtt ctgcggccgg atcggcgcgg atccggccga 25980
ggtcggtctg gcctgggtgc tgtcccggcc ggggatcagc ggcgcggtga tcggtccgcg 26040
cacggtggac cagctggact cggcgctgcg gtccctggac ctggtcctcg gggaggccga 26100
actggccgag ctggacgcca tcttcccgcc cctgggcaag ggcggccggg cgccggacgc 26160
gtggatcagc tgaagggggt gcatcggccg acgtcacgcc ggccgatgcc gccggtcaca 26220
cgacgtcgag cgcgggcagc gggaagacca gtcggccgcc gccgtcgagg aactcccgct 26280
cccgttcgac gaacccgtcc cggtagatcc agggcaggac cagcaactgg tccggcttct 26340
gcgccttcgc gtcctcctcg gacacgatgg ggatgcccgt cccgggggtg aaacgccccg 26400
ccttctcctc gctcacctcg ccgatgcacg gcaggtcccg ttcggtgatc ccgcagtact 26460
ggaggatgac gttgcccttg gtggaggcgc cgtacccgag ggtcagcagg ccctcttggc 26520
gggagcggtc caggaagccg cgcagggcgt cccgctggtc ggcgacgcgg cgggcgaagg 26580

CA 02501445 2005-12-05
246
cctcgaacgg tgccatgccg tccagtcccg cggcggcctc ggcggcccgg atgcgggcca 26640
ggcccgcctc gtccctcggg tgccgggaac cggtcctggc gagcgtgacg cacaggctgc 26700
cgccgtacac ctcggtgagc tcggcccgga tgacggtgag gccgacgcgt tccgccatcc 26760
actcgatctg gcgcagcgcg tagtactcca ggtgctcgtg gcagacgatg tcgtacgcgt 26820
cggcttcgag catggcgggc aggtagctct gctccatcat ccagacgccg tcctcggcga 26880
ggacgtcgcg gacgtcgctc atgaagcgca gcgggtccgg caggtcgtag aacatcgcga 26940
tggaggtgac ggccttcgcc cgccgcgccc cgaagcggtt ctcgaaggtc gcgcgggtga 27000
agtagtccac gaccaactcg gcgttcggcg ggtacaggtc gcggaacttg ccgccggtcg 27060
ggtcgatgcc gaccagtcgc gggccgtcgg cggggtagcc cttgaggagc gtggcgtcgt 27120
tgctgccgat gtcgaggacc aggtcgtccg ggccgaggtc caccagccgg cggacggcgg 27180
cgaccttgcc atgcaggtgg tcgaccatga agggccggat gcccgagcgg tagccgtagc 27240
cctcgccgta catgaggtcc gggtcggggg tgtggcgcag ttgcacgagg ccgcatccgg 27300
ccggggaaca cgcgacgagt tccagcggga ccgacggcac gacctcgtcg cggtcggccg 27360
ggaacacccc ggtgagcgcc tgttcgccca ggtcgagtac ggagagcagc tccttgttgc 27420

ozuz ;00qP50052 00006660T; 0E.50;q0u,60 0-e65050;0; e50560;550 050-;q6v.e6
09m? 05065005; 666.e6066.ep 5g:25060;5 5;0665u2b0 ;46000560; 00.e.b;655;5
00m? 0-;45P05500 ;005505q6 6E-46065055 0;061.0060; 6560050q6 500656560
otuz 0q0E,254055 60006;550 5-456060q5 -e60;665.056 066.06u55-; oug66;0060
0808? 55-
e.55065 000;50650; 0500660q5 e5q.5500q6 660;60600; 6E560606
onsz .e506E.00;5; 6600q.060 02E1;05505 05.6;505665 E.00;050-25 06000.2500
096L? 0.;q6.20;566 -20506;6E40 56;0g-20;45 055;6500;0 E.0645.eq.6.25
60;00460;0
006/2 506050555 .25;50;60; 65660;65;6 0-40006p00 P5;561.650.e 6-;650;605
0178Lz 500.2555
q60060600 50060p600 6p0606006 050055550; 0066e00500
onLz T25;405.206 e00551.55-e6 D206500023 0.e0-2505-e00 00066006;5 ODPDTP55VD
onu 60500ft0-; 500-455;005 05;5600055 0000.e.06;65 .e500;0660; 5E.6500066
099/2 ;550g-4605g ;6500;e0Te 00-;;0005.6 ug650.660 .6600q-e-e6q5 50;60g:2566
009u p05560p065 ;00;505ft6 5055056;56 006060-450 06606606-; 55-e000560
or7sL2 ,565655005 560565660; 6;656E.550-e 6=2004;066 660q65006 5;60006600
08tu 5005056650 056;00;v55 50;4;00;55 55q.e0;:e05 6;56060205 5060-e5.2060
LtZ
SO-ZT-SOOZ St,VCOSZO vo

cA 02501445 2005-12-05
248
cgggagcacg aagtactcgg cgacgccgag ctgttcgagc ttcgcccagg cgtgatcgtg 28380
gtcgttcttg ctggccaccg cctgcaggat gccgcgcgcg tccagctcgg tgatggtccg 28440
caggacgtcc ggggcgagcc ggacctcgtc ctcctcgagg agggtgccct gccagagggt 28500
gttgtccagg tcccagacca ggcatttgac caacggctcg gcggcgttgt cccggtgcac 28560
gtcgttccct tctctcgata cggcggttgc gaccgcgact cctcgacagg gcgtacgcgg 28620
cccgcggccg gcggggacac gggccggttc acccggccgc ggacatcacg tgccgggcca 28680
ggaccagttc gcagatctcg ttgctgccct cgatgatctc catgagcttg gcgtcgcggt 28740
gcgcccgtgc gacgacgtgt ccctcccgcg ccccggccga cgccagcacc tgcacggccc 28800
gttcggcccc gcgtgcggcg ccggtggccg cgacgtgctt ggccaggacg gcggcgacca 28860
ccatgtcggg gctgccctcg tcccactggg cgctggcgtg ctcgcacgcc cgggcggcgt 28920
gctgttcggc gacgaacagt tcggcgaggt gccgggcgac gagctggtgg tccgagagcc 28980
gcgtgccgaa ctgctcccgt ccgccggcgt gacgtgcggc ggcggccagg caggcgcgca 29040
ggatgcccag ggagccccag gccaccgaca tccggccgta gctcagcgcg gtggtgacca 29100
gcagggcggg ggtgcggtcg tggccctgga gcagggcgtc tgccggcagc cggaccccgt 29160
ccaggtggat gtcggcgtgt ccggccgcgc ggcagccgtg cgcgtcggtg atgcgctcga 29220

DEMANDES OU BREVETS VOLUMINEUX
LA PRÉSENTE PARTIE DE CETTE DEMANDE OU CE BREVETS
COMPREND PLUS D'UN TOME.
CECI EST LE TOME 1 DE 3
NOTE. Pour les tomes additionels, veillez contacter le Bureau Canadien des
Brevets.
JUMBO APPLICATIONS / PATENTS
THIS SECTION OF THE APPLICATION / PATENT CONTAINS MORE
THAN ONE VOLUME.
THIS IS VOLUME 1 OF 3
NOTE For additional volumes please contact the Canadian Patent Office.

Representative Drawing

Sorry, the representative drawing for patent document number 2501445 was not found.

Administrative Status

For a clearer understanding of the status of the application/patent presented on this page, the site Disclaimer , as well as the definitions for Patent , Administrative Status , Maintenance Fee  and Payment History  should be consulted.

Administrative Status

Title Date
Forecasted Issue Date 2016-01-26
(86) PCT Filing Date 2003-10-08
(87) PCT Publication Date 2004-04-22
(85) National Entry 2005-04-06
Examination Requested 2008-07-16
(45) Issued 2016-01-26
Expired 2023-10-10

Abandonment History

There is no abandonment history.

Payment History

Fee Type Anniversary Year Due Date Amount Paid Paid Date
Application Fee $400.00 2005-04-06
Maintenance Fee - Application - New Act 2 2005-10-11 $100.00 2005-04-06
Registration of a document - section 124 $100.00 2005-07-14
Maintenance Fee - Application - New Act 3 2006-10-10 $100.00 2006-09-22
Maintenance Fee - Application - New Act 4 2007-10-09 $100.00 2007-09-27
Request for Examination $800.00 2008-07-16
Maintenance Fee - Application - New Act 5 2008-10-08 $200.00 2008-09-24
Maintenance Fee - Application - New Act 6 2009-10-08 $200.00 2009-09-28
Maintenance Fee - Application - New Act 7 2010-10-08 $200.00 2010-09-10
Maintenance Fee - Application - New Act 8 2011-10-10 $200.00 2011-09-09
Maintenance Fee - Application - New Act 9 2012-10-09 $200.00 2012-09-24
Maintenance Fee - Application - New Act 10 2013-10-08 $250.00 2013-09-23
Maintenance Fee - Application - New Act 11 2014-10-08 $250.00 2014-09-22
Maintenance Fee - Application - New Act 12 2015-10-08 $250.00 2015-09-08
Final Fee $4,170.00 2015-11-12
Maintenance Fee - Patent - New Act 13 2016-10-11 $250.00 2016-09-14
Maintenance Fee - Patent - New Act 14 2017-10-10 $250.00 2017-09-13
Maintenance Fee - Patent - New Act 15 2018-10-09 $450.00 2018-09-12
Maintenance Fee - Patent - New Act 16 2019-10-08 $450.00 2019-09-18
Maintenance Fee - Patent - New Act 17 2020-10-08 $450.00 2020-09-16
Maintenance Fee - Patent - New Act 18 2021-10-08 $459.00 2021-10-04
Maintenance Fee - Patent - New Act 19 2022-10-11 $458.08 2022-10-03
Owners on Record

Note: Records showing the ownership history in alphabetical order.

Current Owners on Record
AVENTIS PHARMA S.A.
C.N.R.S.
Past Owners on Record
BLONDELET-ROUAULT, MARIE-HELENE
DARBON-RONGERE, EMMANUELLE
DOMINGUEZ, HELENE
GERBAUD, CLAUDE
GONDRAN, ANNE
KARRAY, FATMA
LACROIX, PATRICIA
OESTREICHER-MERMET- BOUVIER, NATHALIE
PERNODET, JEAN-LUC
TUPHILE, KARINE
Past Owners that do not appear in the "Owners on Record" listing will appear in other documentation within the application.
Documents

To view selected files, please enter reCAPTCHA code :



To view images, click a link in the Document Description column. To download the documents, select one or more checkboxes in the first column and then click the "Download Selected in PDF format (Zip Archive)" or the "Download Selected as Single PDF" button.

List of published and non-published patent-specific documents on the CPD .

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.


Document
Description 
Date
(yyyy-mm-dd) 
Number of pages   Size of Image (KB) 
Abstract 2005-04-06 2 103
Claims 2005-04-06 16 728
Drawings 2005-04-06 41 695
Description 2005-04-06 293 15,240
Description 2005-04-06 134 5,329
Cover Page 2005-07-06 2 49
Claims 2011-07-20 3 121
Claims 2005-12-05 16 663
Description 2005-12-05 250 12,894
Description 2005-12-05 250 3,794
Description 2005-12-05 207 3,487
Description 2007-06-13 250 12,894
Description 2007-06-13 250 3,794
Description 2007-06-13 207 3,487
Claims 2012-07-24 4 119
Claims 2013-09-19 3 113
Claims 2014-09-15 3 114
Cover Page 2016-01-06 2 50
PCT 2005-04-06 23 919
Assignment 2005-04-06 4 108
Prosecution-Amendment 2005-04-06 26 913
Correspondence 2005-04-28 3 115
Assignment 2005-04-06 6 183
Correspondence 2005-07-04 1 32
Assignment 2005-07-14 4 128
Correspondence 2006-04-12 1 31
Prosecution-Amendment 2006-04-12 1 60
Prosecution-Amendment 2006-04-18 1 43
Correspondence 2005-12-05 505 8,818
Correspondence 2007-06-01 2 38
Prosecution-Amendment 2007-06-13 1 45
Prosecution-Amendment 2008-07-16 1 37
Prosecution-Amendment 2011-07-20 6 218
Prosecution-Amendment 2011-01-31 3 97
Prosecution-Amendment 2012-01-27 2 104
Prosecution-Amendment 2012-07-24 10 392
Prosecution-Amendment 2013-03-26 3 130
Prosecution-Amendment 2014-04-14 3 139
Prosecution-Amendment 2013-09-19 7 311
Final Fee 2015-11-12 1 57
Prosecution-Amendment 2014-09-15 6 252

Biological Sequence Listings

Choose a BSL submission then click the "Download BSL" button to download the file.

If you have any difficulty accessing content, you can call the Client Service Centre at 1-866-997-1936 or send them an e-mail at CIPO Client Service Centre.

Please note that files with extensions .pep and .seq that were created by CIPO as working files might be incomplete and are not to be considered official communication.

BSL Files

To view selected files, please enter reCAPTCHA code :