Note: Descriptions are shown in the official language in which they were submitted.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
Dispositif pour le marquage et la restitution de signaux multimédia.
La présente invention concerne un dispositif pour le marquage et la
restitution de signaux
multimédia.
Le marquage d'un signal multimédia, encore connu sous le nom de procédé de
tatouage,
consiste à insérer de façon invisible un message dans le signal multimédia
avant sa transmis-
sion afm de pouvoir le restituer de façon lisible en réception. Pour garantir
le secret du
message inséré, un ensemble de clés privées ou publiques est souvent utilisé
afin de ne pas
offrir la possibilité à des personnes non autorisées de retrouver, voir
d'enlever le message
caché.
_ 15
Les domaines d'application d'un procédé de marquage de signaux multimédia sont
nombreux.
Tout d'abord, dans un contexte de protection, il peut être intéressant
d'insérér dans le
contenu d'un signal multimédia un message caché permettant par la suite
d'identifier ce
contenu, de connaître le propriétaire de ce contenu ou bien encore de
connaître les règles
d'utilisation de ce contenu, telles que par exemple le droit de diffusiôn ou
le droit de copie.
Cependant, le contenu du message multimédia peut étre altéré de différentes
façons. Par
exemple, il peut être altéré suite à l'utilisation d'un format de
représentation introduisant des
dégradations, tel qu'un codage avec perte (par exemple, JPEG pour les images
fixes, MPEG
pour la vidéo ou bien encore MP3 pour l'audio) ou bien encore par divers
procédés
d'acquisition tels que l'enregistrement analogique, l'impression ou le
"scanning" pour une
image.
Le contenu d'un signal multimédia peut aussi être altéré suite à une remise en
forme, par
exemple lors d'une sélection d'une portion d'un fichier audio ou lors du
recadrage d'une
image.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
2
Le contenu d'un signal multimédia peut aussi subir des attaques
intentionnelles dans le but
de mettre à défaut le procédé d' extraction du message. Ceci peut être
effectué en aj outant du
bruit au .signal, en utilisant une technique de filtrage ou en utilisant des
techniques
désynchronisantes (par exemple, la transformation géométrique pour les images
ou le
changement de fréquence pour les fichiers sonores). Dans ce cadre
d'applications, il est
important d'assurer que le message inséré puisse être extrait correctement que
le contenu ait
subi des modifications intentionnelles ou non.
Un autre cadre d' applications concerne la mise à dispositiôn, grâce à un
procédé de tatouage,
d'un canal de transmission d'informations de façon non perceptible et lié au
contenu lui-
même des signaux multimédia. En particulier, ceci peut être intéressant dans
le cas d'un
transcodage ou d'une diffusion ultérieure du contenu, où l'existence et/ou la
pérennité d'un
tel canal de transmission n'est pas garantie. Ce canâl adjacent peut alors
être utilisé, suivant
sa capacité, pour transmettre toute informâtion utile. On peut citer à titre
d'exemple
l'insertion de méta-données décrivant le contenu tatoué (telles que
l'identifiantdu contenu
ou la description d'éléments du contenu) qui peuvent être utilisées
ultérieurement afm
d'assurer un service à valeur ajoutée, ou bien encore des informations annexes
(telles qu'un
service de type télétexte ou des sous-titres). Ici encore, il est important de
pouvoir extraire
ces informations suite à différentes manipulations du contenu, principalement
du transcodage
et donc de disposer d'un système de tatouage robuste.
Dans des dispositifs de marquage connus, on utilise une technique de
modulation de type
COFDM, couramment utilisée en communication numérique, où des bits bj
définissent le
message et sont modulés par plusieurs porteuses définies par des clés
publiques et privées.
Le signal ainsi modulé vient s'ajouter au signal original. A l'extraction, une
démodulation
permet de retrouver les bits insérés bj. Cependant cette technique de marquage
souffre
d'imperfections car le signal hôte peut interférer sur les porteuses
utilisées, le signal inséré
peut être visible ou encore la re-synchronisation peut être imparfaite.
Le but de l'invention est de remédier à cette situation.
L'invention propose à cet effet un dispositif de traitement d'un signal
comprenant un module
de transformation de signal capable de produire un signal transformé à partir
d'un signal
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
3
original et un module mélangeur destiné à marquer le signal transformé par un
message de
marquage. Selon une caractéristique de (invention, le module mélangeur
comprend
- un module de mise en forme capable de calculer une réponse du signal
transformé à la
démodulation d'un premier ensemble de porteuses définies par des clés de
protection du
message et de calculer une information de marquage en fonction de cette
réponse et de mots
de codes associés au message de marquage,
- un modulateur capable de moduler les informations de marquage fournies par
le module
de mise en forme par un coefficient donné des porteuses du premier ensemble de
porteuses,
et de moduler en amplitude le coefficient ainsi obtenu par une quantité
correspondante liée
au terme de pondération de (énergie du message de marquage et à (ensemble de
porteuses,
ce qui fournit un coefficient de marquage,
- un additionneur capable d'ajouter le coefficient de marquage au coefficient
correspondant
du signal original transformé.
La modulation d'amplitude effectuée par le modulateur permet ainsi de rendre
Ie signal
ajouté peu visible. De plus, le dispositif de l'invention met en oeuvre une
technique de
codage canal avec information de bord. Selon cette technique, les composantes
de
l'information de marquage sont des inîormations à valeurs flottantes définies
de telle façon
que leur insertion compense la réponse du signal hôte.
Selon une autre caractéristique de l'invention, le ,module de mise en forme
comprend un
démodulateur destiné à effectuer la démodulation, ce démodulateur étant apte à
multiplier
chaque coefficient diz signal transformé par le coefficient correspondant
d'une porteuse
donnée du premier ensemble de porteuses, par le poids perceptuel de distorsion
et par le
facteur d'atténuation associés au coefficient du signal transformé, et à
additionner les
coefficients ainsi déterminés, ce qui fournit une composante de la réponse du
signal
transformé.
Le module de mise en forme est également apte à calculer (information de
marquage à partir
d'un paramètre prédéterminé, d'un premier vecteur associé à un mot de code
parüculier du
message de marquage et d'un deuxième vecteur formant avec ledit premier
vecteur une base
orthogonale normalisée définissant un hyperplan.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
En particulier, le mot de code particulier est obtenu en minimisant un critère
d'erreur
quadratique entre les mots de code associés au message de marquage et la
valeur normalisée
de la réponse du signal transformé à la démodulation.
Chaque composante du deuxième vécteur est proportionnelle à la différence
entre la
composante correspondante de la réponse à la démodulation et la projection du
vecteur
représentant la réponse à la démodulation sur un vecteur unitairé colinéaire
au premier
vecteur.
Le paramètre prédéterminé correspond à l' angle entre le vecteur représentant
(information
de marquage et le premier vecteur, ce paramètre étant déterminé en maximisant
la relation:
K.(uo + cos e )2 - (vo + sin 6)~
dans laquelle:
- uo réprésente le produit scalaire entré le vecteur représentant la réponse à
la
démodulation et le premier vecteur, divisé par le nombre m de composantes de
la
réponse à la dëmodulation,
= vo représente le produit scalaire entre le vecteur représentant la réponse à
la
démodulation et le deuxième vecteur, divisë par le nombre m,
- K ~ 1/ (2wc~R~~"' _ 1 ), C et R représentant respectivement le nombre de
bits utiles et de
bits d' adaptation au signal original et m représente le nombre de composantes
de la
réponse à la démodulation.
Selon une autre caractéristique de l'invention, le mélangeur comporte un
module de mise à
l'échelle capable de moduler en amplitude chaque coefficient du signal fourni
par le circuit
additionneur par une quantité liée, au terme de pondération de l'énergie du
message de
marquage et de la variance du coefficient correspondant du signal transformé.
Cette quantité est définie par a,~2 / (Q,~2 + 0~2), où 6~;~ est le terme
défroissant l'énergie du
message de marquage et a~;2 est la variance du coefficient correspondant du
signal
transformé.
Cette modulation d'amplitude correspond à un filtre de Wiener et permet de
limiter le bruit
ainsi aj outé sur le signal hôte.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
S
Selon une autre caractéristique de (invention, le dispositif comporte un
module de
transformation inverse en sortié du mélangeur, apte à effectuer sur le signal
marqué une
transformation inverse de celle effectuée par le module de transformation, et
un module de
transformation de signal apte à transformé le signal marqué resynchronisé, ce
qui fournit un
signal marqué transformé.
Le dispositif peut également comporter un dispositif d'extraction en sortie du
module de
transformation inverse pour extraire le message du signal marqué, ce
dispositif d'extraction
comportant un module de resynchronisation capable de resynchroniser le signal
marqué.
En particulier, le dispositif d'extraction est capable de calculer une réponse
du signal marqué
resynchronisé à la démodulation d'un deuxième ensemble de porteuses définies
par dés clés
de protecüon du message, ce qui fournit une éstimation de l'information de
marquage insérée.
Dans une variante de réalisation, le premierensemble de porteuses et le
deuxième ensemble
de porteuses sont identiques.
Par ailleurs, le dispositif d'extraction peut comprendre un démodulateur
destiné à effectuer
la démodulation, ce démodulateur étant apte à multiplier chaqué coefficient du
signal marqué
resynchronisé par le coefficient correspondant d'une porteuse donnée du
deuxième ensemble
de porteuses et par le poids perceptuel de distorsion associé audit
coefficient du signal
marqué resynchronisé, et à additionner les coefficients ainsi déterminés, ce
qui fournit une
composante de l'estimation de (information de marquage.
En complément, le dispositif (extraction peut comporter un module générateur
de porteuses
propres à générer 1e deuxième ensemble des porteuses à partir des clés de
protection du
message.
Le dispositif d'extraction peut aussi comporter un décodeur capable de
déterminer le mot de
code le plus proche de l'estimation de l'information de marquage en maximisant
un critère
(erreur quadratique entre un ensemble de mots de code et l'estimation de
l'information de
marquage, ce qui fournit le message de marquage.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
6
Selon une aune caractéristique de l'invention, le dispositif de traitement
peut également
comprendre un module de définition de paramètres d'insertion couplé au module
mélangeur
capable de déterminer le terme de pondération de (énergie du message de
marquage et le
facteur d'atténuation à partir des propriétés intrinsèques du signal, des
contraintes du
domaine applicatif, et des propriétés de la transformation utilisée.
En particulier, le module de définition de paramètres d'insertion est capable
de calculer deux
paramètres globaux d'insertion en fonction de la distorsion d'insertion. Due,
entre le signal
original et le signal marqué dans l'espace transformé, de la distorsion
d'attaque maximale
tolérée Due,., entre le signal original et le signal marqué resynchronisé,
dans l'espace
transformé, et du rapport signal à bruit entre l'énergie du message de
marquage et le bruit
d' attaque Eb/No.
Les deux paramètres globaux d'insertion sont câ.lculés en recherchant les
paramètres ~, et x
qui maximise la relation:
Eb/No + ~, Due,, - ~ Due,.
Le module de définition de paramètres d'insertion est apte à calculer le terme
de pondération
de (énergie du message de marquage et le facteur d'atténuation à partir des
deux paramètres
globaux d'insertion déterminés.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de
la description
qui suit et des figures des dessins annexés dans lesquels:
- la figure 1 illustre la composition d'un système de transmission de signaux
multimédia
marqués pour la mise en oeuvre de .l'invention,
- la figure 2 est une organisation générale du dispositif d'insertion de la
figure 1,
- la figure 3 est une organisation générale du dispositif d'extraction de la
figure 1,
- la figure 4 est un schéma fonctionnel du module d'insertion de la figure 2,
- la figure 5 est un schéma fonctionnel du module mélangeur de la figure 4,
- la figure 6 est une représentation graphique permettant d'apprécier la
robustesse d'un
signal, suite à l' aj out de bruits d' énergie donnée,
- la figure 7 est un schéma fonctionnel d'un mode de réalisation du module
d'extraction de
la figure 3, et
- la figure 8 est le schéma d'un mécanisme utilisé dans un mode de
réalisation.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
L'annexe I répertorie les diverses notations utilisées dans la description.
L'annexe II répertorie les formules mathématiques utilisées dans la
description.
Les dessins et les annexes à la description comprennent, pour l'essentiel, des
éléments de
caractère certain. Ils pourront donc non seulement servir à mieux faire
comprendre la
description, mais aussi contribuer à la définition de l'invention, le cas
échéant.
Le dispositif pour le marquage et la restitution de signaux multimédia pour la
mise en oeuvre
de l'invention, représenté schématiquement sur la figure 1, se compose d'un
dispositif
d'insertion d'un message marqueur 1 et d'un dispositif d'extraction du message
marqueur
2.
Le dispositif d'insertion de message 1 élâbore un marquage d'un signal
multimédia S à
transmettreau travers d'un domaine applicatif 3, à partir du contenu d'un
message marqueur
M. La technique de marquage utilisée est une technique additive mettant en,
oeuvre un
procédé de modulation par étalement de spectre. Elle s'apparente à la
technique de
modulation de type COFDM couramment utilisée en communication. numérique. Les
composantes bj qui définissent le message marqueur M sont modulées par des
porteuses
définies par des clés publiques et privées, et appliquées à l'entrée du
dispositif d'insertion.
Le signal ainsi modulé vient.s'ajouter au signal original S. A l'extraction,
une démodulation
permet de retrouver les composantes insérées bj du message marqueur.
Selon une caractéristique avantageuse de l'invention, pour .garantir un bon
niveau de
robustesse et pour éviter que le signal inséré ne soit visible, une modulation
d'amplitude du
signal ajouté est effectuée en fonction de l'énergie de la marque ajoutée à
chaque coefficient
du signal dans le domaine transformé. Suite à cet ajout, une autre modulation
d'amplitude
est effectuée sur chaque coefficient marqué. Cette deuxième modulation
correspond à un
filtre de Wiener visant à limiter le bruit ainsi ajouté sur le signal hôte.
Traditionnellement, les composantes bj correspondent aux bits définissant le
message à
insérer après une éventuelle utilisation de codes correcteurs. Dans le schéma
ici présenté, une
technique de codage canal avec information de bord est utilisée. Les
composantes bj de ce
modèle de marquage sont alors des informations à valeurs flottantes.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
ô
Le procédé de marquage, décrit ci-après, prend en compte un tel modèle de
marquage et
l'optimise afin de résister à des attaques du type ajout de bruit, filtrage et
désynchronisation
partielle, modélisant assez bien les différents traitements que peut subir un
signal.
Le dispositif d'insertion, représénté sur la figure 2 comprend un module
d'insertion 4 couplé
en amont à un module de transformation 5 et en aval à un module de
transformation inverse
6. Dans cette configuration, le signal original S, défini dans un premier
espace, est appliqué
au module de transformation 5 pour être transformé en un nombre n de
coefficients xi,
définis dans un deuxième espace. Tout procédé de transformation peut être mis
en oeuvre
sans exclure la transformation identité qui amène à travailler directement sur
le signal
original. Différentes transformations peuvent être utilisées, comme par
exempté la
transformation dé Fourier, la transformation en cosinus discrets ou la
transformation en
ondelettes.
Après transformation du signal original S, le message M à insérer est appliqué
dans le
module d'insertïon 4 siar les différents coefficients xi du signal transformé
pour former des
coefficients marqués yi. Les coefficients marqués yi sont ensuite appliqués au
module de
transformation inverse 6 afm de subir une transformation inverse de celle
appliquée avant
marquage et restituer ainsi un signal marqué proche du signal original. Ce
signal marqué est
alors transmis à un dispositif d'extraction, comme représenté à la figure 3.
Sur la figure 3, le dispositif d'extraction 2, qui est représenté à
l'intérieur d'une ligne fermée
en pointillés, comprend un module de transformation 7 couplé en amont à un
module de
resynchronisation 8 et en aval à un module d'extraction 9. Le signal marqué
reçu est tout
d'abord resynchronisé par le module de resynchronisation 8, puis transformé
par le module
de transformation 7 en une suite de coefficients yi' par une transformation
identique à celle
qui a été utilisée lors de l'insertion: Les coefficients yi' sont ensuite
appliqués au dispositif
d'extraction 9 pour extraire le signal de marquage M. Le procédé de
resynchronisation utilisé
peut étre quelconque (recherche exhaustive liée à l'insertion d'un signal
pilote ôu à une
propriété intrinsèque de la marque) ou bien encore implicite grâce à
l'insertion dans un
domaine invariant aux désynchronisations (par exemple, amplitudes dans un
domaine de
Fourier ou transformation de Fourier-Mellin).
Dans la description qui suit, les notations de l'annexe I sont utilisées.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
9
Un mode de réalisation du module d'insertion 4 est représenté sur la figure 4,
à l'intérieur
d'une ligne fermée en pointillés. Ce module comprend un module mëlangeur 10,
un module
d'analyse du signal 11, un module d'analyse des propriétés intrinsèques 12 et
un module de
définition de paramètres d'insertion globaux 13.
L'insertion d'un message M dans un signal de coefficients xi débute dans le
module 11 par
une analysè qui permet de définir les propriétés liées au signal, à savoir le
poids de
pondération perceptuel dans la métrique de distorsion cpi, défini pour chaque
coefficient xi
du signal original transformé en fonction de la valeur de la variance Q~;2 dû
coefficient
correspondant. Le poids de pondération perceptuel cpi de chaque coefficient xi
du signal est
fonction du type du signal traité, de la transformation utilisée et des
valeurs du.signal
obsérvé.
Afin d'estimèr les variances a~;2 du signal (Annexe I-1), tout.procédé peut
être utilisé. On
peut, .par exemple, utiliser une moyenne quadratique pondérée dans un
voisinage (ou
moyenne quadratique glissante), selôn la relation (2) de l'annexe II de la
description. Dans
cette relation, vi représente un voisinage du coefficient considéré.
La valeur naïve cpi =1 correspond à (erreur quadratique moyenne classique. Un
exemple de
modèle plus adapté pour les images prenant en compte les phénomènes de
masquage peut
être défini par la relation (3), exprimée dans l'annexe II à la description.
Dans cette relation,
66;a correspond à un seuil de visibilité pour le i-ème coefficient, et Vi
correspond à un facteur
de force de masquage local défini par une moyenne glissante sur le voisinage
vi du
coefficient considéré, selon la relation (4) de l' annexe II. p est un
paramètre de l'ordre de 0.5
à 1 (typiquement les valeurs 0.5, 0.6 et 0.7 sont les plus couramment
utilisées).
A partir des contraintes applicatives et des propriétés de la transformation
utilisée, des
paramètres applicatifs ai, bi et ci sont déterminées par le module d'analyse
des propriétés
intrinsèques 12, pour chaque coefficient xi. Le paramètre ai représente le
dégré d'interférence
avec le signal original, le paramètre bi le degré d'auto interférence du
signal inséré et le
paramètre ci est le paramètre d'atténuation du site.
Les paramètres applicatifs ai, bi et ci permettent de prendre en compte un
phénomène de
désynchronisation sur chaque site, c'est à dire sur chaque fréquence porteuse
de l'espace
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
transformé. Par exemple, pour une désynchronisation 0; sur le i-ème site,
représentant la
précision de la localisation du coefficient, on utilisera typiquement les
valeurs définies par
les relations (5) de l'annexe II à la description.
5 A partir des paramètres cpi, a~;a; ai, bi et ci fournis. par les modules 11
et 12, le module 13
estime lës paramètres globaux d'insertion ~, et x. A partir de ces paramètres
globaux
d'insertion, le module 13 détermine ensuite les paramètres d'insertion ~yi et
a~;, définissant
les propriétés intrinsèques du signal de marquage. Le premier paramètre
d'insertion yi
représente le facteur d'atténuation du site considéré et le deuxième paramètre
d'insertion o~;
10 représente le terme de pondération de l'énergie de marquage.
Une fois les différents paramètres établis, l' insertion du message M dans le
signal transformé
f xi} est réalisée par le module mélangeur 10 à partir des paramètres
applicatifs ai, bi et ci,
calculés par le module 12, du poids de pondération perceptuel ~cpi} et de la
variance {6,~2}
calculés par le module d'analyse du signal 11, et des paramètres d'insertion
a~; et yi estimés
par le module 13.
Le module mélangeur comprend un démodulateur 15 qui estime la réponse rx du
signal
original transformé à une démodulation d'un premier ensemble de porteuses {G~.
Cette
démodulation prend en compte les valeurs du poids de pondération perceptuel
cpi et les
valeurs du facteur d'atténuation yi.
Le module mélangeur 10 comprend en outre un générateur de porteuses 16 qui
génère le
premier ensemble de m porteuses f G~} à partir de clés publiques ou privées.
Chaque
composante rxj de la réponse du signal original transformé est déterminée à
partir de la
relation ~;E~u"~cpi (~yi.xi).G;~, où G;~ désigne le i-ième coe~cient de la j-
ème porteuse fournie
par le générateur de porteuses 16.
Le module mélangeur 10, représenté sur la figure 5, comprend également un
module 14 de
mise en forme du message propre à~fournü~ m composantes bj défnissant le
message à
insérer, à partir des réponses rxj fournies par le démodulateur 15 et d'un
ensemble de mots
de code U appliqués au dispositif de mise en forme 14 en même temps que le
message de
marquage M.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
11
Les valeurs des n coefficients ~yi) du signal après marquage sont alors
calculées à partir de
ces composantes bj, via un modulateur .18, un additionneur 20 et un module de
mise à
l'échelle 17, selon la relation (6) de l'annexe II de la description.
Plus précisément, pour chacun dés bits des clés publiques ou privées, le
dispositif générateur
de porteuses 16 fournit les porteuses G;~ au modulateur 18 pour moduler les
composantes bj.
Le modulateur 18 effectue une modulation des composantes bj de (information de
marquage
par les porteuses G;~ pour fournir n coefficients relatifs à (information de
marquage. Le i-ème
coefficient relatif à finformatiôn de marquage est donné par la relation
~~Et~,m~bjG,;.
Le modulateur 18 peut en outre effectuer une modulation en amplitude de ces
coefficients
relatifs à (information de marquage, par le terme k2,.--- d~;/ ~~E ~l~ m~G,~i,
relatif au terme de
pondération de l'énergie du message de marquage o~; et aux porteuses G;~.
Le modulateur 18 fournit alors au circuit additionneur 20 un nombre n de
coefficients relatifs
à (information de marquage de la forme:
x~i= ~.,ri/ ~iE fl.mlGüa ~~iyl,mlbJGü.
Le circuit additionneur 20 ajoute ces coefficients x'i aux coefficients xi du
signal original
transformë. Ce résultat est ensuite mis à l'échelle par le module de mise à
l'échelle 17 à
partir du terme kl; =a~;2 / (a~;2 + osa), exprimé en fonction des valeurs de
la variance a~,~2 du
signal dans l' espace transformé pour les différents coefficiénts xi et du
terme ~de pondération
e~; de l'énergie de la marque ajoutée. Ce terme correspond à un filtre de
Wiener.
Le module de mise à l'échelle 17 fournit donc le signal marqué de coefficients
yi dans
l'espace transformé, comme indiqué par la relation (6) de l'annexe II.
Le module de mise en forme 14 du mélangeur 10 est maintenant décrit plus en
détail. Le
module de mise en forme 14 reçoit un message M à insérer, qui est défini à
partir d'un
ensemble de mots de code U. Cet ensemble est de taille 2~+R et est découpé en
2~ sous-
ensembles UM. Chacun de ces sous-ensembles comporte 2R mots de codes et sont
associés
à chacun des 2~ messages possibles. Les différents mots de codes sont définis
dans un espace
m-aire et sont tels que :1/m. E~ (U2~) = 1 pour j ~ [l,m].
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
12
Tout procédé de génération de ces mots de codes et de regroupement de ces mots
de codes
en sous-ensemblés UM peut être utilisé. Parmi ceux-ci, on peut notamment citer
les mots de
codes générés par un système de codes correcteurs (par exemple, les C premiers
bits sont des
bits utiles qui identifient le message, tandis que les R derniers bits sont
des bits d'adaptation
au signal hôte qui identifient le mot dé code utilisé pour le message M).
Le module de mise en formë 14 reçoit en outre la réponse rx du signal original
transformé,
fournie par le démodulateur 15. Pour déterminer les composantes rxj de cette
réponse, le
démodulateur 15 en fournit d'abord une estimation selon la relation
~,,E~l~n~cpi (~yi.xi).G;~,
indiqué ci-avant. Puis il renormalise cette estimation de façon adéquate en
rxj de telle façon
que l'insertion des rxj, en utilisant la technique proposée précédemment par
la relation (6),
compense la réponse du signal hôte au point d'âttaque considéré défini par les
paramètres
d'attaque, que cette attaque soit matérialisée par ajout de bruit et filtrage
ou encore par une
désynchronisation partielle. '
Le module de mise en forme 14 recherche alors un mot de code Uk, parmi les
mots de code
associés au message M à insérer, en minimisant le critère d'écart quadratique
défini par la
relation (7) de l' annexe II à la description, à partir de la réponse rx au
signal original
transformé. Ce mot de code représente un vecteur Uk ayant m composantes U,~.
A partir de ce mot de code Uk et de la réponse rx fournie par le démodulateur
15, le module
de mise en forme 14 définit un vecteur V' de dimension m ayant des composantes
définies
par la relation (8) de l' annexe II, où la notation <A~B> _ ~AjBj représente
le produit scalaire
entre deux vecteurs A et B.
A partir de ce vecteur V', le module de mise en forme 14 définit un vecteur V
de composan-
tes Vj selon.la relation (9) de l' annexe II, de telle sorte que le vecteur V
soit proportionnel
au vecteur V' et que l'on ait <V~V> = 0 ou <V~V> = m,~ suivant que V' est nul
ou non. En
particulier, ce vecteur V a la propriété d'être orthogonal au vecteur Uk.
Le module de mise en forme 14 recherche ensuite la valeur d'un paramètre 8
maximisant la
relation (10) formulée de l'annexe II, à partir de paramètres u0, v0 et K
déterminés en
fonction de la réponse au signal original transformé rx, du vecteur Uk et du
vecteur V. Ces
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
13
paramètres u0, v0 et I~ sont définis par les relations (11) également
incorporées à l'annexe
II.
Finalement le module de mise en forme 14 calcule les valeurs des composantes
bj à partir
du paramètre 8 ainsi. déterminé, et des composantes U~ et V~ des vecteurs Uk
et V, selon la
relation (12) de l'annexe II.
Le but du calcul des valeurs des composantes bj est de définir le signal à aj
outer de telle sorte
que la réponse du démodulateur utilisé lors de l'extraction soit cohérente
avec celle du mot
de code Uk et la plus robuste possible. La robustesse est définie par
l'équation (10). Cette
robustesse correspond au niveau d' énergie du bruit pouvant être aj outé sans
pour autant sortir
du cône associé au mot de code Uk de la figure 6.
En référence à le figure 6, lës vecteurs Uk, représenté par le vecteur u, et
le vecteur V,
représenté par le vecteur v_, forment une basë orthogonale normalisée
définissant l'hyperplan
contenant le vecteur.réponse rx et le vecteur code Uk. Dans cet hyperplan, le
déplacement
(cos 8, sin 8) définit le signal pouvant être ajoutés La maximisation.de
l'équation (10) revient
alors à rechercher le vecteur de composantes bj maximisant la robustesse.
Ramené sur
chaque composante de la modulation (i.e. valeurs bj), celui-ci s'exprime alors
par l'équation
(12).
La figure 6 représente une interprétation géométrique de cette définition. Le
cône représenté
par la zone hachurée représente l' ensemble des valeurs amenant un décodage
correct du mot
de code. Sp représente l' ensemble des points qui respectent une contraïnte de
puissance P du
signal pouvant être ajouté. (ici P=1) . Le vecteur w correspond au vecteur de
composantes bj
et x correspond au vecteur rx. Les hyperboles Hn correspondent aux réponses de
robustesse
constante (i,e suite à l'ajout d'un bruit d'une énergie donnée).
Un tel principe de définition du signal a ëté proposé par Cox et al dans un
article intitulé
"Watermarking as communications with side information", Proc.IEEE, 87(7):1127-
1141,1999 dans le cadre d'un tatouage appliqué directement au signal original,
et dans un
contexte de détection. La détection diff'ere de l'extraction dans le sens où
l'on recherche la
présence d'un message U connu. Par ailleurs, l'interprétation du paramètre K
de l'équation
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
14
(10) difF'ere. Dans le document de Cox et al le paramètre I~ est lié à un test
d'hypothèse de
présence, tandis qu'en extraction, il assure de décoder le bon message
(l'ouverture du cône
de la figure 6 dépend alors du dictionnaire utilisé - cf équation (11)).
Cette technique visant à limiter l'interférence du signal hôte correspond à la
technique de
codage canal avec information de bord. Le principe général de cette technique
de codage
canal a été initialement proposé par Costa dans un article intitulé "Writing
on dirty paper",
IEEE Trans. Info. Thy, 29(3):439-441, May 1983. Dans le cadre de l'invention
cette
technique est appliquée sur les informations issues de la démodulation des
porteuses G;~.
Le module de définition des paramètres d'insertion globaux 13 définissant les
propriétés
intrinsèques du dispositif de marquage est décrit plus en détail ci-après. Le
module de
définition 13 recherche tout d'abord le couple de paramètres globaux (~,,x),
pour définir les
paraznètrès d'insértion.
Le couple (~,,x) optimal recherché peut être défini en spécifiant deux
propriétés parmi les
trois suivantes qui sont:
- la distorsion d'insertion Due, entre le signal original x et le signal
marqué y, dans l'espace
transformé, calculée suivant une relation similaire à celle donnée par la
relation(1) de
l'annexe lI;
- la distorsion d'âttaque maximale tolérée D~,> entre le signal original x et
le signal marqué
resynchronisé y', dans l'espace transformé;
- la mesure de performance EblNo du système de marquage.
Par exemple, pour des distorsions Due, ét D~,> données, le système recherche
le couple (~,,x)
cônduisant à la plus forte valeur du rapport Eb/No, ou pour Eb/N9 et Due,
donnés, le système
recherche le couple (~.,x) conduisant à la plus forte valeur de D,~,>, ou
encore pour Eb/No et
D~,> donnés, le système recherche le couple (~.,x) conduisant à la plus petite
valeur de D,~.
Les valeurs de D,n" Due,, et Eb/No sont exprimées en fonction de (~.,x) selon
les relations (13)
et (14) formulées dans l'annexe II de la description.
Après avoir déterminé les paramètres globaux d'insertion (~.,x), le module 13
détermine alors
les paramètres d'insertion yi et o~;. yi et 6,~ sont des variables auxiliaires
de travail, fonctions
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
de ~, et x, qui définissent les propriétés d'insertion pour un site i
correspondant à la position
d'un coefficient xi dans le spectre du signal transformé. Pour un site i,
étant donnés les
paramètres globaux (~.,x) et les paramètres locaux ai, bi, ci et a,~, le
couple (yi, o~ est
déterminé par l'exécution des étapes de l'organigramme représenté sur la
figure 8.
S
A l'étape 100; a~; est recherché, dans l'intervalle [0, cpi~~,Q~;2 / ci] qui
maximise la fonction
(16) de l'annexe II, avec yi donné par la relation (17) de (annexe II.
A l'étape 102, pour le point trouvé, le dispositif teste si yi~0 et yi <_
[a~;a / (0~~;2 + ff~2)]
10 - Si yiz0 et yi <_ [a,~2 l (a~;a + 0~2)], le couple (yi, 6~;) est retenu à
l'étape 104;
- Sinon, à l'étape 106, on utilise le couple (yi=1,Q,~= 0): Soit aucun
marquagë n'est effectué
sur ce site.
En particulier, dans le cas où ai = bi
1 S - si ~. > x ou si a,~ < [ci / ( cpi~òaiv%(x - .~,)], on utilise le couple
(yi, a~;) donné par les
relations (18) de l'annexe II;
- sinon, c'est le couple (yi = 1, a~; = 0) qui est retenu.
On remarque notamment que lorsque ai = bi = 1, 6~; = epi.a~;2.~~. / ci.
Üne base théorique sur laquelle s'appuient les développements décrits
précédemment est la
suivante. Les différentes expressions utilisées pour la définition des
paramètres d'insertion
correspondent aux expressions liées à une modélisation statistique des
différents signaux et
à un modèle d'attaque assez général. Les coefficients xi sont supposés suivre
une loi de
probabilité Gaussienne de moyenne 0, et de variance a~;2 et être indépendants.
Les attaques
considérées sont du type "scaling" (facteurs yi ) et ajout de bruit gaussien
de variance aaiz.
Soit encore : yi' _ (yi/y~)yi + 8i avec y~; = a~;al(a~;2 + 0,~2).
Le facteur d'échelle permet, en outre, de bien prendre en compte les
techniques de filtrage
pouvant être appliquées. La nouveauté de l'approche proposée ici est de
considérer des
signaux non identiquement distribués, (utilisation d'une métrique
perceptuelle, la prise en
compte de désynchronisation partielle et (utilisation d'une technique
d'insertion/extraction
basée sur (utilisation d'une modulation type COFDM (acronyme pour "Coded
Qrthogonal
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
16
Frequency Division Multiplex", multiplexage de fréquence orthogonal codé) à
étalement de
spectre utilisée sur l'ensemble des coefficients.
Afin de définir les paramètres o,~2 définissant l'énergie d'insertion, on peut
aussi considérer
un jeu entre un attaquant et un défenseur selon la théorie des jeux.
L'attaquant, connaissant
le système utilisé essaie, suivant le principe connu de Kerckoffs, de
minimiser la mesure de
performance du système Eb/No sous une contrainte .de distorsion (attaque
maximale
D,~>_max .
Le défenseur cherche quant à lui au contraire à maximiser cette mesure de
performance sous
une contrainte de distorsion (insertion maximale Due, max. Dans le cas présent
EblNo
représente le rapport signal à bruit entre l'énergie du message caché et le
bruit (attaque. Ce
problème peut alors être résolu en utilisant une formalisation Lagrangienne du
problème. On
introduit alors les facteurs de Lagrange ~, > 0 et x> 0, et on considère alors
le sous problème
suivant dépendant de (~.,x), à savoir rechercher une solution générale à
l'équation (15)
définie dans l'annexe II de la description.
La solution générale est définie comme la solution associée au couple (~.,x)
aboutissant à une
solution telle que D~,> = Due, =max et D,~, = Due,-max.
Dans la description ci-dessus, on retrouve la recherche sur (~.,x) pour
respecter les contraintes
de distorsion. L'expression à maximiser dans l'étape 100 correspond au terme
{EbINo +
~..D,~> - x.D,~~. Les deux derniers termes étant les termes Lagrangiens
associés respective-
ment à la distorsion (attaque et (insertion. Les termes liées au contraintes
D~,=max et
D~ max ont été supprimés, car ils sont constants et également pour des raisons
de simplicité.
Il est à noter que la minimisation sur les paramètres d'attaques (yi, aa~ a
déjà été prise en
compte notamment dans la définition du paramètre yi dans la première étape.
L'extraction d'un message inséré après attaques se réalise en deux phases dans
le dispositif
d'extraction 2. Dans un premier temps, une démodulation linéaire est effectuée
afm d' obtenir
des observations bj avec jE[l,m]. Ensuite, le message extrait est défini
recherchant le mot de
code proche des observations.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
17
Dans le dispositif d'extraction 2, le signal marqué yi est resynchronisé par
le module de
resynchronisation 8, puis transformé par le module de transformation 7 en une
suite de
coefficients yi' par une transformation identique à celle qui a été utilisée
lors de l'insertion.
Le module d'extraction qui est représenté à la figure 7 comprend un
démodulateur 2lcouplé
à un décodeur du message extrait. Le démodulateur 21 calcule une réponse du
signât f yi'}
à une démodulation d'un deuxième ensemble de porteuses G~ fournies par un
générateur de
porteuses 23, selon la relation (19) de (annexe II. Cette démodulation prend
en compte le
poids de pondération perceptuel cpi calculé à partir d' une analyse effectuée
par un module 24
d' analyse du signal yi' .
A
La démodulation repose sur l' extraction d'une estimation du message inséré bj
par la relation
( 19) de l' annexe II, sur l' ensemble des sites mârqués.
1 S Il est à noter que tout.estimateur définissant une réponse proportionnelle
à cet estimateur peut
être également considéré.
Dans une variante de réalisation, le deuxième ensemble de porteuses est
identique au premier
ensemble de porteuses produites par le module générateur de porteuses 16 du
module
d'insertion.
Le décodage du message a lieu après sa mise en forme estimé bj . Il consiste à
rechërcher le
mot de code Uk le plus proche des valeurs estimées bj par la relation (20)
définie dans
l'annexe II.
Le message associé au mot de code Uk correspond alors au message extrait. Pour
réaliser la
recherche du mot de code le plus proche, on peut utiliser un procédé de
recherche exhaustive,
ou bien encore profiter de toute technique de recherche rapide liée à la
définition des mots
de codes utilisés, par utilisation de technique de décodage de code canal par
exemple.
Il est à noter que l'invention n'est pas limitée aux formes de réalisations
décrites ci-dessus.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
1g
ANNEXEI
I-1 Si,_n
- n : nombre de coefficients du signal dans le domaine transformé,
-xi, i E [1, n] : les valeurs des coefficients du signal dans (espace
transformé,
yi, i ~ [1, n] : les valeurs des coe~cients du signal dans l'espace transformé
après
marquage.
-yi', i E [1, n] : les valeurs des coefficients du signal dans féspace
transformé après
marquage, attaques et resynchronisation.
- osa, i E [1, n] : les valeurs de la variance du signal dans (espace
transformé pour
les différents coefficients.
-Due, _ ~D,n,~i: la distorsion entre deux signaux x et y définie par la
relation (1) répertoriée
dans l'annexe II à la description.
cpi : poids de pondération perceptuel pour le i ème coefficient dans la
métrique de
distorsion. Ces poids sont définis en rapport avec le type de signal traité,
la transformation
utilisée et les valeurs du signal observée.
-Due,: distorsion d'insertion.
-Due,,: distorsion d'attaque.
= (ai, bi, ci): variables identifiant les propriétés du système relatives aux
différents
coefficients (insertion (variables comprises entre 0 et 1).
- ai: degré (interférence avec le signal original.
- bi: degré (auto interférence du signal inséré.
- ci: paramètre (atténuation fun site (par exemple lié à sa sensibilité face
aux attaques
désynchronisantes); ce terme dépend de (espace de transformation utilisé et de
l'ordre de
grandeur de (erreur de désynchronisation escomptée suite à la
resynchronisation effectuée
à l'extraction, et des dégradations tolérées.
I-2 Variables de travail
- (~.,x) : variables auxiliaires globales de travail permettant de définir les
paramètres
d'insertion sur chaque coefficient dans le domaine transformé.
- (~yi, aN,;), i E f 1, .., n} : variables auxiliaires de travail définissant
les paramètres (insertion
de chaque coefficient
- yi : facteur (atténuation
-a~; terme de pondération de l'énergie de la marque ajoutée.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
19
I-3 Modulation
-m : nombre de porteuses utilisées lors de l'ïnsertion du message.
-bj avec j E f l, .., m] : informations définissant l'information à ajouter
pour insérer le
message.
- G;1 avec (i, j) E f 1, .., n} ~ f 1, .., m] : informations définissant les
porteuses d'insertion du
message connues à l'insertion et à l'extraction. Tout procédé de génération de
telles
porteuses peut étre considéré moyennant qu'elles vérifient Ei,j [G;~] = 0 et
Ei~j [G;j2] = 1.
Elles peuvent étre par exemple ainsi générées par l'intermédiaire d'une clé
secrète et d'un
générateur de nombre aléatoire contrôlé par cette clé secrète.
I-4 Dictionnaire de mots de codes
- 2~ : nombre de messages existants susceptibles d' être insérés dans le
signal.
-U : ensemble des mots de codes utilisés. 2~+R mots de codes m aire sont
définis, et
regroupés en 2R sous ensembles UM associés aux différents messages M
existants.
-Uk : mot de code utilisé, de taille m et défini par les valeurs U~ avec j E f
1, .., m].
I-5 Paramètre perceptuel
cpi : poids perceptuels de distorsion des coefficients du signal.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
ANNEXE a
Liste des formules mentionnées dans la description.
DxY _ ~i e [l;n] ~Plz~(xi-Yi)~ (1)
.5
c'~2 = (~; E~~ xi2)/ ~ vi ~ (2)
~pi2 = 1 / (ab;z+ Vi2) ,
10 Vi = (~; E~; ~ xi ~ P) / ~ vi ~ ~ (4)
ai ,= bi = 1 - c2i avec ci = (sinc(Di))a
où sinc(x) = sin(~x)/~x et d, la dimension du signal considéré (1 pour un
signal audio 1D,
2 pop ~e image, etc).
yi = kl;.( xi + k~;.~j E[i,m] (bj ~G~~)) 6
( )~
avec : kl; =(a,~2 / (a,~2 + Q~;2)
k2f _~",; /~(~jE[l,m]~T;j
Uk = ârg mnl~ E UM ~~j e[l,m] ~kj - ~~)2~ (%)
V'~ = rX~ - <~~u,~ /,~<uk I~k> (ô
Si <V°~V°> = 0, Vj = 0
Sinon, Vj = Vj'. ~m / ~<V'~V'> .
f K.(uo + cos 6)2 - (v~ + sin 6)2 } (10)
avec
ufl = 1/m <rx ~Uk>
(11)
vo = 1/m <rx~V>
K = 1 / (2z~O+it)~m -1 )
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
21
bj = U~.cos A + Vj.sin 8 (12)
n
D,~ _ ~ D,~~l
i=1
n
D~° = D~r,~i. (13)
T=1
n
Eb/No = ~ Eb/No~i
¿=I
avec:
D,~y~i = api (~~a Qw,;2) / (o~2+~H,;a) (14)
Due, ~ i = epia a,~a ( i -yi) _
iEb/No)~i = ~Pi2 i%.ci yi ~~;
l0
max~,; {min(r;, aa,~ f Eb/No + ~,(D~,. - Due, =max) - x(D~, - Due,-max) ~ } (
15)
~b~o)li + ~, D,~,, ~ i - x D,~,~i (16)
yi = [6,~2 - ci a~; / (cpi~h,)] / [(i-ai)o~;~ + (i-bi)6~;z] (17)
QH,; _ [ A;.Q~2 - Clz + V ((A;.Ux;2 - c2i)a + B; 2.Ux;2)] / B;, (18)
yi = [Q~z - D;] / [(i-~)( a~2 +a~2)]
avec
A; = cpia(~.- x(1-ai))
B; = 2 cpi ~~, ci
D; = ci.Q~;/(cpi.~~.)
b-1 = ~~ E iW (~Pi 3'i' G;;) ( 1 g)
avec Iw = ensemble des sites marqués.
CA 02503466 2005-04-22
WO 2004/043072 PCT/FR2003/003208
22
Uk ai'g 111âXUk E U l L.i)E [l,m]~k,j -