nombres complexes - mpberthollet.files.wordpress.com · c est muni de deux lois + et ×dont les...

174
Chapitre 1 Nombres Complexes On note C l’ensemble des nombres complexes. Ils furent utiliser, sans démonstration de leur existence par Cardan (XVIème siècle) pour résoudre x 3 = 15x +6. Gauss en a donné en 1810 une interprétation géométrique. I Deux ou Trois rappels I.1 exp, cos, sin et tan. I.2 Un peu de trigonométrie cos a = cos b a b mod 2π ou a ≡-b mod 2π sin a = sin b a b mod 2π ou a π - b mod 2π cos et sin d’une somme Formules de l’angle double sin(a + b) = sin a cos b + sin b cos a sin(2a) = 2 sin a cos a, sin(a - b) = sin a cos b - sin b cos a cos(2a) = 2 cos 2 a - 1=1 - 2 sin 2 a, cos(a + b) = cos a cos b - sin a sin b cos(2a) = cos 2 a - sin 2 a, cos(a - b) = cos a cos b + sin a sin b 1 - cos a = 2 sin 2 a 2 , tan(a + b)= tan a + tan b 1 - tan a tan b , 1 + cos a = 2 cos 2 a 2 Sicocosicocosisi Tangente de l’angle moitié sin a + sin b = 2 sin a + b 2 cos a - b 2 Si t = tan(a/2), sin a - sin b = 2 cos a + b 2 sin a - b 2 cos a = 1 - t 2 1+ t 2 cos a + cos b = 2 cos a + b 2 cos a - b 2 sin a = 2t 1+ t 2 cos a - cos b = -2 sin a + b 2 sin a - b 2 tan a = 2t 1 - t 2 . 1

Upload: duongnhu

Post on 12-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Chapitre 1

Nombres Complexes

On note C l’ensemble des nombres complexes. Ils furent utiliser, sans démonstration de leurexistence par Cardan (XVIème siècle) pour résoudre x3 = 15x + 6. Gauss en a donné en 1810 uneinterprétation géométrique.

I Deux ou Trois rappels

I.1 exp, cos, sin et tan.

I.2 Un peu de trigonométrie

cos a = cos b⇔

a ≡ b mod 2πoua ≡ −b mod 2π

sin a = sin b⇔

a ≡ b mod 2πoua ≡ π − b mod 2π

cos et sin d’une somme Formules de l’angle double

sin(a+ b) = sin a cos b+ sin b cos a sin(2a) = 2 sin a cos a,sin(a− b) = sin a cos b− sin b cos a cos(2a) = 2 cos2 a− 1 = 1− 2 sin2 a,cos(a+ b) = cos a cos b− sin a sin b cos(2a) = cos2 a− sin2 a,cos(a− b) = cos a cos b+ sin a sin b 1− cos a = 2 sin2 a

2 ,

tan(a+ b) = tan a+ tan b1− tan a tan b , 1 + cos a = 2 cos2 a

2

Sicocosicocosisi Tangente de l’angle moitié

sin a+ sin b = 2 sin a+ b

2 cos a− b2 Si t = tan(a/2),

sin a− sin b = 2 cos a+ b

2 sin a− b2 cos a = 1− t2

1 + t2

cos a+ cos b = 2 cos a+ b

2 cos a− b2 sin a = 2t1 + t2

cos a− cos b = −2 sin a+ b

2 sin a− b2 tan a = 2t1− t2 .

1

II Deux notations des nombres complexes

II.1 Notation algébrique

Nous pouvons construire l’ensemble des nombres complexes simplement à l’aides nombres réels,de la manière suivante : On note C l’ensemble R× R muni des deux lois suivantes :

(a, b) + (c, d) = (a+ c, b+ d),(a, b)× (c, d) = (ac− bd, ad+ bc).

En notant alors pour tout réel x, x = (x, 0) et i = (0, 1) nous voyons que tout complexe s’écrit(a, b) = a.(1, 0) + b.i et retrouvons ainsi que :

Définition II.1

Tout élément z ∈ C s’écrit de manière unique z = a+ ib, avec a et b réels. a est la partie réellede z et b sa partie imaginaire.C est muni de deux lois + et × dont les règles de calcul sont

(a+ ib) + (c+ id) = (a+ c) + i(b+ d),(a+ ib)× (c+ id) = (ac− bd) + i(bc+ ad).

i est donc un complexe qui vérifie i × i = −1 ; on le notera j en physique et I en Maple.Muni de ces deux lois, C est un corps commutatif.

De cette définition 1 découle :B si a, b, c, d sont quatre nombres REELS, alors

Si a+ ib = c+ id, alors

a = c,

b = d.

B Un nombre réel x est un nombre complexe : x = x+ 0.i.On appellera imaginaire pur tout complexe de la forme ix, où x est réel. L’ensemble desimaginaires purs sera noté iR.

Interprétation géométrique : Soit P un plan muni d’un r.o.n.d (O,~i,~j). Si a et b sont deux nombres réels, on peut

représenter a + ib par le point A de coordonnées (a, b) ou par le vecteur ~u de composantes (a, b). On parle d’affixe et

d’image.

II.2 Conjugué et module

Définition II.2

On appelle conjugué de z = a+ ib, où a et b sont réels le complexe z = a− ib.On appelle module de z le réel positif

√zz =

√x2 + y2, où x = Re z et y = Im z.

Géométriquement, l’image de z est le symétrique orthogonal de z par rapport à l’axe des abs-cisses de l’image de z, alors que le module est la norme de l’image ~u de z. Enfin, A1A2 = |z2− z1| =√

2.

1. (ce qui signifie pour l’instant l’autorisation pour vous de faire toutes les opérations usuelles : commutativité, distribu-tivité, associativité, élément neutre,...). C contient le sous-corps R, et l’ensemble des imaginaires purs iR.

2

EXEMPLES

♥B Calcul des parties réelle et imaginaire de (x + iy)−1 où x et y sont deux réels non

simultanément nuls :

1x+ iy

= x− iy(x+ iy)(x− iy) = x

x2 + y2︸ ︷︷ ︸∈R

−i y

x2 + y2∈R︸ ︷︷ ︸ .

La partie réelle de (x+ iy)−1 est donc xx2+y2 et sa partie imaginaire est − y

x2+y2 .

B Idem pour3 + 6i3− 4i .

Voyons maintenant comment se comportent ces différentes fonctions par rapport aux opérations.

Propriétés II.3 (Conjugué)

Pour tous complexes z, z′ et tout réel a,B Re (az + z′) = aRe (z) + Re (z′), Im (az + z′) = aIm (z) + Im (z′), az + z′ = az + z′.

Bz + z

2 = Re (z), z − z2i = Im (z).

B z ∈ R⇔ z = z et z ∈ iR⇔ z = −z .

B z = z, zz′ = zz′,( zz′

)= z

z′.

Démonstration : Notons z = x + iy et z′ = x′ + iy′, où x, x′, y, y′ sont des réels. Alors, par exemple,az + z′ = (ax + x′) + i(ay + y′), où ax + x′ et ay + y′ sont réels. Ce sont donc respectivement lesparties réelle et imaginaire du complexe az + z′. Aucune identité ne pose problème, je vous les laissedonc.

Propriétés II.4 (Module)

Pour tous complexes z1, z2,

1. |z1| = 0⇔ z1 = 0, |z1| = |z1|, |Re z1| 6 |z1|.

2. |z1.z2| = |z1|.|z2|, et∣∣∣ z1z2

∣∣∣ = |z1||z2| .

3. |z1 + z2|2 = |z1|2 + |z2|2 + 2Re (z1z2).4. Inégalité triangulaire : |z1 + z2| 6 |z1|+ |z2|.

Démonstration : Nous noterons xk et yk les parties réelle et imaginaire de zk, pour k prenant les valeurs1 ou 2.

1. La première est très simple, tout comme la deuxième. Quant à la dernière :

|z1| =√x2

1 + y21 >

√x2

1 = |x1| = Re (z1),

l’inégalité provenant de la positivité de y21 et de la croissance de la fonction √.

2.|z1z2|2 = (x1y1 − x2y2)2 + (x1y2 + x2y1)2 = (x2

1 + y21)(x2

2 + y22) = |z1|2|z2|2.

Quant au rapport, nous nous contenterons de prouver que∣∣ 1z2

∣∣ = 1|z2|

. Le cas général s’obtiendra

avec ce qui précède et l’égalité∣∣ z1z2

∣∣ = |z1| ×∣∣ 1z2

∣∣ :

∣∣∣ 1z2

∣∣∣ =∣∣∣∣ 1x2 + iy2

∣∣∣∣ =∣∣∣∣ x2

x22 + y2

2− i y2

x22 + y2

2

∣∣∣∣ =

√(x2

x22 + y2

2

)2

+(

y2

x22 + y2

2

)2

=√

1x2

2 + y22

= 1|z2|

.

3. |z1 + z2|2 = (x1 + x2)2 + (y1 + y2)2 = |z1|2 + |z2|2 + 2(x1x2 + y1y2). Il suffit de faire maintenantle calcul de Re (z1z2), que je vous laisse.

3

4. D’après le premier point de cette propriété, |Re z1z2| 6 |z1z2|. Ainsi,|z1 +z2|2 6 |z1|2 + |z2|2 +2|z1z2| = |z1|2 + |z2|2 +2|z1||z2| =

(|z1|+ |z2|

)2. On conclut à nouveau

grâce à la croissance de la racine carré.

La complexification du plan euclidien (i.e l’identification des points ou vecteurs avec leurs af-fixes) garde trace des deux outils fondamentaux que nous avons introduits dans le cours de géomé-trie :Propriétés II.5 (Déterminant et Produit scalaire)

Soient z1, z2 ∈ C. Notons −→u1,−→u2 leurs images. Alors

det(−→u1,−→u2) = Im (z1z2), −→u1.

−→u2 = Re (z1z2),

ou autrement dit z1z2 = −→u1.−→u2 + i det(−→u1,

−→u2).

Démonstration :(x1 − iy1)(x2 + iy2) = x1x2 + y1y2 + i(x1y2 − y1x2).

II.3 La fonction exponentielle complexe

Nous aurons besoin de quelques rappels trigonométriques :

Remarques :

B Parité des fonctions cos, sin, périodicité, cercle trigonométrique,cos a+ b = cos a cos b− sin a sin bsin a+ b = sin a cos b+ sin b cos a.

B Congruences : Soient m un réel > 0, x, y ∈ R. On dit que

x et y sont congrus modulo m ⇐⇒ m divise y − x,⇐⇒ ∃k ∈ Z/y = x+ km.

On note alors x ≡ y mod m. Par exemplex ≡ y mod 2π ⇔ x, y ont même image par cos et sin.

Ces petits rappels achevés, nous pouvons étendre à C la fonction exponentielle que vous avezvue dans votre cours de Terminale S :

Définition II.6

La fonction exponentielle Pout tout x, y ∈ R, on note

exp(x+ iy) := ex+iy := ex(cos y + i sin y) .

B Si z est réel, y est nul, et on retrouve la fonction exponentielle réelle.B Si z est imaginaire pur, exp iy = cos y + i sin y appartient au cercle trigonométrique S1.

L’intéret essentiel de cette fonction est le suivant :

Propriétés II.7 (Morphisme de groupe)

Pour tous z, z′ ∈ C, exp(z + z′) = exp z × exp z′

4

Démonstration : Avec les notations habituelles,

exp(z + z′) = exp((x+ x′) + i(y + y′)

)= ex+x′( cos(y + y′) + i sin(y + y′)

)= ex+x′((cos y cos y′ − sin y sin y′) + i(sin y cos y′ + sin y′ cos y)

)= ex+x′( cos y + i sin y

)(cos y′ + i sin y′

)=

(ex(cos y + i sin y)

)︸ ︷︷ ︸=exp z

×(ex′(cos y′ + i sin y′)

)︸ ︷︷ ︸=exp z′

D’où on déduit facilement :

Corollaire II.8

Pour tout z ∈ C,

1. ez est non nul et (ez)−1 = e−z,

2. Pour tout p ∈ Z, (ez)p = epz.

Démonstration : 1. ez × e−z = ez+(−z) = e0 = 1, donc ez 6= 0 et son inverse est bien le complexe e−z.

2. On effectue une récurrence sur p ∈ NSi p < 0, on peut utiliser ce résultat, car −p > 0 : (ez)−p = e−pz. Passons aux inverses : celui dee−pz est epz d’après le premier point, et celui de (ez)−p est (ez)p d’après la définition même despuissances d’exposant entier négatif. D’où (ez)p = epz.

II.4 le groupe des complexes de module 1On note S1 l’ensemble des complexes de module 1.

Proposition II.9

1. S1 = eiθ, θ ∈ R, ce qui signifie :B pour tout x ∈ R, exp(ix) ∈ S1, etB pour tout z ∈ S1, il existe θ ∈ R tel que z = eiθ

2. Pour tout réel θ, (eiθ = 1)⇔ θ ≡ 0 mod 2π.

3. Pour tous réels θ, θ′,eiθ = eiθ

′ ⇔ θ ≡ θ′ mod π.

Démonstration : 1. Le premier B provient de la relation cos2 + sin2 = 1. Nous admettrons temporai-rement le deuxième B. Un petit dessin vous convaincra de sa justesse. Sachez seulement qu’ilutilise le TVI.

2. eiθ = 1 ⇔ cos θ = 1 et sin θ = 0, mais l’hypothèse sur le cos contient celle sur le sin . Doncl’exponentielle de iθ vaut 1 ssi cos θ = 1 qui est lui-même équivalent à θ ≡ 0 mod 2π.

3. eiθ = eiθ′⇔ ei(θ−θ

′) ≡ 1 mod 2π ⇔ θ − θ′ ≡ 0 mod π, d’après le point 2.

Corollaire II.10

La fonction exponentielle de C dans C∗ est surjective.

Démonstration : Soit w ∈ C∗. Notons r son module et α son argument. Posons alors z = ln r + iθ ∈ C. zest un antécédent de w en vertu de la relation ez = exp(ln r + iθ) = eln reiθ = reiθ = w.

II.5 Notation trigonométrique

On parle aussi de notation exponentielle, ou polaire.

5

Pour tout complexe non nul z, le complexez

|z|est de module 1. Il s’écrit ainsi d’après la propo-

sition ,z

|z|= eiθ. Ainsi, il existe un réel θ tel que z = |z|eiθ.

Définition II.11 (Notation exponentielle)

Soit z ∈ C∗. On appelle argument de z tout réel θ qui vérifie z = |z|eiθ.On note alors arg z ≡ θ mod 2π.

Remarques :

B Ainsi, si θ0 est un argument de z, l’ensemble de tous ses arguments est l’ensemble desréels congrus à θ0 modulo 2π. On appelle argument principal l’unique argument dans]− π, π].

B Si M a pour affixe z non nul, tout argument de z est une mesure de l’angle orientéθor(−→i ,−−→OM).

B Si z ∈ C∗ et si ρ et ϕ sont deux réels. Alors

z = ρeiϕ ⇐⇒

ρ > 0 et arg z ≡ ϕ mod 2π, ouρ < 0 et arg z ≡ ϕ+ π mod 2π.

Propriétés II.12 ( de l’argument)

Soient z et z′ deux complexes non nuls. Alors :

1. z ∈ R⇐⇒ arg z ≡ 0 mod π, et z ∈ iR⇐⇒ arg z ≡ π/2modπ.2. arg(zz′) ≡ arg z + arg(z′) mod 2π,

3. arg z

z′≡ arg z − arg(z′) mod 2π.

Démonstration : Notons z = reiϕ et z′ = r′eiϕ′.

1. z ∈ R⇔ Im z = 0⇔ r sinϕ = 0⇔ sinϕ = 0⇔ ϕ ≡ 0 mod π. L’autre point est identique.

2. zz′ = rr′ei(ϕ+ϕ′), et rr′ > 0, donc arg(zz′) ≡ ϕ+ ϕ′.

3. z/z′ = r/r′ei(ϕ−ϕ′).

Soit α ∈ [−π, π]. Montrer que le module de z = 1 + eiα est 2 cosα/2 et que son argument estcongru à α/2.

III Quelques formules centrales

III.1 Formules d’Euler

Pour tout réel θ,

cos θ = eiθ + e−iθ

2 ,

sin θ = eiθ − e−iθ

2i .

Les applications de ceci sont nombreuses. En voici une

qui mérite un ♥ :Calculons le module et un argument de z = 1+eiθ. Il y a une discussion à engager selon le signe

de cos θ2 , car z = 2 cos θ2eiθ/2.

III.2 Formules de Moivre

Pour tout x ∈ R et n ∈ N :

cos(nx) + i sin(nx) = (cosx+ i sin x)n ,

6

On peut exprimer cos 4x en fonction de puissances de cosx et sin x.

III.3 Binôme de Newton

Sur les coefficients binômiaux : rappel de la définition, que j’explicite pour C0n, C

1n, C

2n, C

nn , C

kn =

Cn−kn et des sommes.Applications : ♥(x + 1)n =. On se sert de cette formule pour linéariser des fonctions du type

cos4, cos2 sin2.

III.4 Sommes géométriques

Proposition III.1 (Sommes géométriques)

Pour tout z ∈ C \ 1,∀n ∈ N∗,

n∑k=0

zk = 1− zn+1

1− z .

Remarques :

B Il faut savoir la retrouver sous la formen∑k=0

(−1)kzk = 1− (−z)n+1

1 + z

ainsi que zn − 1 = (z − 1)(n−1∑k=0

zk

).

B ♥ Calcul den∑k=0

ekix, etn∑k=0

sin(kx) (Oral petites Mines 2006).

IV Equations Algébriques sur COn appelle équation algébrique en z toute équation du type P (z) = 0, où P est un polynôme à

coefficients complexes. Vous savez depuis bien longtemps résoudre les équations de degré 1. Nousallons voir celles de degré 2, puis le calcul de racines n−ièmes.

IV.1 Racines carrées

Ici, la situation est bien plus limpide que dans l’ensemble des complexes où un nombre peut nepas avoir de racines carrées.

Proposition IV.1 (racines carrées)

Pour tout a ∈ C non nul, il existe exactement deux complexes z solutions de z2 = a. Ces deuxcomplexes sont opposés.

Démonstration : On résout cette équation avec les notations trigonométriques, en notant a = reiθ, où

r = |z| et θ ∈ R. Posons alors z0 =√rexpiθ

2 . Nous avons clairement l’égalité z20 = a, i.e une solution

de cette équation. Pour déterminer toutes les solutions, écrivons :

z2 = a⇔ z2 = z20 ⇔ z2 − z2

0 = 0⇔ (z − z0)(z + z0) = 0⇔ z = z0 ou − z0.

7

Du point de vue pratique, on utilise la notation algébrique en écrivant : z2 = a⇒

Re z2 = Re a,|z2| = |a|.

On obtient quatre solutions de ce système, dont on élimine 2 à l’aide du signe de xy qui nousest donné par l’égalité des parties imaginaires.

Résolvons z2 = i−2, en posant z = x+ iy, où x, y ∈ R. Alors, puisque (x+ iy)2 = x2−y2 +2ixy,et |i− 2| =

√5,

(x+ iy)2 = −2 + i⇔

x2 − y2 = −2,x2 + y2 =

√5⇔

x2 = −2+

√5

2 ,

y2 = 2+√

52

x = ±√−2+

√5

2 ,

y = ±√

2+√

52

soit encore 4 possibilités pour les valeurs de x+ iy. On en élimine finalement 2 en remarquant queIm z = 1, i.e 2xy = 1. Ce qui implique que x et y doivent être du même signe. D’où

S = ł

√−2 +

√5

2 +

√2 +√

52 ,−

√−2 +

√5

2 −

√2 +√

52

Σ

IV.2 Equations d’ordre 2La résolution de cette équation est toute entière basée sur le calcul de racine carrée, grâce à la

forme canonique, tout comme dans le cas réel.Soient a, b, c trois complexes où a est non nul. Soit l’équation d’inconnue z :

(E) az2 + bz + c = 0

Théorème IV.2 (Résolution et factorisation)

Notons ∆ = b2 − 4ac son discriminant.

B Si ∆ = 0, (E) n’admet qu’une seule solution, dite double : z0 = −b2a . De plus,

az2 + bz + c = a(z − z0)2.

B Si ∆ 6= 0, (E) admet deux solutions, dites simples : z1 = −b+ δ

2a et z2 = −b− δ2a , où δ

vérifie δ2 = ∆. De plus,az2 + bz + c = a(z − z1)(z − z2).

Remarques :

B La deuxième formule est en fait toujours valable, puisque si ∆ = 0, alors δ est nulaussi.

B Si a, b, c ∈ R :

1. soit ∆ > 0, et on retrouve ce que l’on savait puisque δ =√

∆.

2. Soit ∆ < 0, et on peut poser δ = i√−δ. Les solutions sont alors conjuguées :z1 =

z2.

B Si θ ∈ R, z2 − 2z cos θ + 1 = (z − eiθ)(z − e−iθ).

Résoudre z2 − 2iz − 1 + 2i = 0.Le discriminant vaut ∆ = −8i, on peut donc choisir δ = 2− 2i.

Faisons une remarque importante, concernant les équations du second degré :

8

Proposition IV.3 (Relations coefficients-racines)

Soient a, b, c ∈ C, où a 6= 0. Notons z1 et z2 les solutions (éventuellement confondues) del’équation az2 + bz + c = 0. Alors

z1 + z2 = − ba

et z1z2 = c

a.

Démonstration : Elle est basée sur la factorisation valable pour tout complexe z :

az2 + bz + c = a(z − z1)(z − z2), i.e z2 + b

az + c

a= z2 + (−z1 − z2)z + (z1z2).

En posant z = 0 dans cette égalité, on obtient la deuxième relation, et il suffit alors de poser z = 1pour obtenir la première.

IV.3 Racines de l’unitéDéfinition IV.4

Soit n ∈ N∗. On appelle racine n−ième de l’unité tout nombre complexe z qui vérifie zn = 1.On note Un leur ensemble.

Par exemple,B 1 = 1B 2 = −1, 1B 3 = 1, j, j2.B 4 = 1, i,−1,−i.

Théorème IV.5 (Description de n)

Soit n ∈ N∗. n contient exactement n éléments :

n = ł1, exp 2iπn, exp 4iπ

n, exp 6iπ

n, . . . , exp 2(n− 1)iπ

= łexp 2ikπn

où k parcourt [[0, n− 1]]Σ

= łωk où k parcourt [[0, n− 1]]Σ, où ω = e2iπ/n

Remarquons que l’on peut remplacer dans ces descriptions l’ensemble des entiers [[0, n − 1]] par[[1, n]] puisque e0 = e2inπ/n = 1.Démonstration : Un petit coup d’oeil rapide nous convainc que si z est solution, alors il est de module 1.

Notons donc z = eiθ, où θ ∈ R est un argument de z que nous choisissons dans l’intervalle [0, 2π[. Alorszn = 1⇐⇒ exp(niθ) = 1⇐⇒ niθ ≡ 0 mod 2π. Autrement dit, il existe un entier relatif k tel que θ =2kπn. Mais les seuls réels de cette forme appartenant à [0, 2π[ sont 0, 2π/n, 4π/n, . . . , 2(n− 1)π/n.

Proposition IV.6

La somme des n racines n−ièmes de l’unité est nulle.

Démonstration : Reprenons la notation ω = exp 2iπn

. D’après la description de n donnée dans le théorème

IV.5, la somme Sn des n racines n−ièmes de l’unité vaut :

Sn = 1 + ω + ω2 + · · ·+ ωn−1

= 1− ωn

1− ω d’après la proposition III.1 et le fait que ω 6= 1,

= 1− 11− ω = 0 car ωn = 1.

9

Enfin, sachez que résoudre l’équation en z

zn = a, où a ∈ C∗,

est aisée dès lors que l’on connait une solution z0. En effet, z est alors solution si et seulement si ilexiste ξ ∈n tel que z = z0ξ.

V C et la géométrie plane

V.1 De brefs rappels

1. Barycentre pondéré de n complexes :Soit n ∈ N∗, a1, a2, . . . , an des réels dont la somme est non nulle, et z1, z2, . . . , zn ∈ C les af-fixes de n pointsM1,M2, . . . ,Mn du plan. Le barycentre des points pondérés

((M1, a1), (M2, a2), . . . , (Mn, an)

)admet pour affixe

a1z1 + a2z2 + · · ·+ anznn

.

2. Colinéarité et de l’orthogonalité de deux vecteurs :Soient ~u et ~v deux vecteurs du plan admettant pour affixes respectifs z1 et z2. Alors

~u est colinéaire à ~v ⇐⇒ ∃k ∈ R/z1 = kz2 ⇐⇒z1

z2∈ R⇐⇒ z1z2 ∈ R.

De même,

~u ⊥ ~v ⇐⇒ ∃k ∈ iR/z1 = kz2 ⇐⇒z1

z2∈ iR⇐⇒ z1z2 ∈ iR.

3. Angles orientés :

L’angle orienté entre−−→MA et

−−→MB est arg b−m

a−m.

V.2 Les similitudesDéfinition V.1 (Similitudes directes)

On appelleB similitude directe toute application f de C dans lui-même pour laquelle il existe a ∈ C∗ etb ∈ C tels que f : z 7→ az + b.

B similitude indirecte toute application f de C dans lui-même pour laquelle il existe a ∈ C∗ etb ∈ C tels que f : z 7→ az + b.

On reconnait quelques trasformations déjà rencontrées :

(a) L’application z 7→ rz, où r > 0 est l’homothétie hr de centre O et de rapport r.

(b) L’application z 7→ eiθz, où θ ∈ R est la rotation Rθ de centre O et d’angle θ.

(c) L’application f : z 7→ eiθz est la composée de hr et de Rθ, i.e f = hr Rθ = Rθ hr.(d) L’application z 7→ z est la réflexion par rapport à la droite (Ox).

Nous aurons l’occasion de revoir les similitudes lors du cours sur les transformations du plan.

10

Chapitre 2

La géométrie Plane

I Rappels du cours du secondaire...

I.1 ...sur le monde affine

C’est celui qui s’occupe des objets et des propriétés suivantes : points, vecteurs, droites, aligne-ments, intersection de droites, segments, colinéarité, barycentres.

Nous noterons P le plan euclidien maintes fois vu en TS.Soient ~u un vecteur du plan et A,B ∈P. Si

−−→AB = ~u, on note B = A+ ~u.

Rappelons que la colinéarité de ~u et ~v signifie l’inexistence d’un réel x qui vérifie soit ~u = x~v,soit ~v = x~u. Mais les mathématiciens n’aiment pas la non existence et préfèrent la formulationsuivante :Définition I.1 (Colinéarité)

Soient −→u et −→v deux vecteurs du plan.B Ils sont dits non colinéaires lorsque pour tous x, y réels, si x~u+ y~v = ~0, alors x et y sont

nuls.Une base du plan P est un couple (~u,~v) de vecteurs non colinéaires.

B −→u et −→v sont colinéaires lorsqu’il existe deux réels x et y non tous nuls (i.e dont l’un aumoins est non nul) tels que x−→u + y−→v = −→0 .

Ainsi le vecteur nul est colinéaire à tous les vecteurs du plan car 0.−→u + 1.−→0 = −→0 .D’où l’on déduit sans difficulté notre première proposition de l’année :

Proposition I.2

Soient−→u ,−→v deux vecteurs non colinéaires et x, y, a, b quatre réels. Alors si a−→u +b−→v = x−→u +y−→v ,nous avons a = x et b = y.

Démonstration : Les propriétés élémentaires des lois sur les ensembles de vecteurs impliquent que

(a− x)−→u + (b− y)−→y = −→0 ,

et on conclut avec la non-colinéarité des deux vecteurs.

L’intérêt des bases réside dans le résultat suivant :Propriétés I.3

Soient B := (~u,~v) une base de−→P. Alors pour tout vecteur ~w, il existe un unique couple de réels

(x, y) tel que ~w = x~u+ y~v.

Bxy

sont les composantes de ~w dans la base B.

B Un repère de P est un triplet (Ω, ~u,~v) où Ω est un point quelconque du plan et ~u et ~v sontdeux vecteurs non colinéaires.On appelle cordonnées cartésiennes du point M ∈P dans le repére R les composantes de−−→ΩM dans la base B.

11

Remarques :

En effet, ce procédé, qui remonte à Descartes, construit une bijection entre le plan et R2.Il permet de transformer un problème géométrique en une question analytique, offrantainsi un nouveau débouché à l’algèbre et l’analyse.

I.2 ...sur le monde euclidien

Apparait ensuite le monde euclidien, celui où il devient possible de mesurer, et dont l’outilprincipal est la distance dite euclidienne, dont découleront les notions d’angle, orthogonalité, cercle,aire.

Nous suivrons pour ce cours seulement (et parce que c’est l’esprit de cette première partie del’année) la structure proposée dans le cursus du secondaire , à savoir que nous admettrons quenous savons mesurer les angles, et que nous disposons d’une distance dite euclidienne dont l’ex-pression dans une base orthonormée découle du théorème de Pythagore. Un tel exposé présentel’avantage de mettre immédiatement à disposition l’outil mathématique, en particulier pour l’op-tique géométrique, mais fait peu de cas de la cohésion interne des mathématiques qui est la basede son élégance. Les objets correspondent à l’intuition géométrique que nous en avons, mais cetteconstruction ne bénéficie pas d’une assise rigoureuse et ne permet pas de savoir en particulier sil’aire dépend du produit scalaire, ou si c’est l’inverse.Heureusement, nous verrons ultérieurement qu’il suffit de définir dans une base quelconque B0 leproduit scalaire de deux vecteurs par la formule bien connue pour disposer sans efforts de la no-tion d’orthogonalité et de norme de vecteurs. On constatera que la base B0 est orthonormée, puisquelques efforts supplémentaires permettront la définition de ce qu’est un angle.

Nous fixons ici les notations :Dans tout ce cours, P est le plan euclidien usuel. On CHOISIT un repère orthonormé direct

(ROND) R0 = (O,~i,~j), dans lequel par défaut toutes les composantes seront calculées. Ainsi, pourtous réels x et y,

‖x~i+ y~j‖2 = x2 + y2 et AB = ‖−→AB‖ =√

(xA − xB)2 + (yA − yB)2,

si (xA, yA) sont les coordonnées du point A et (xA, yA) celles de B.Intéressons-nous aux angles maintenant, qui est la notion la plus délicate et pour laquelle nous

nous appuierons le plus sur votre intuition.Ne pouvant dire que 0 est égal à 2π sans risque que tout l’édifice mathématique ne s’écroule,

nous dirons de deux nombres qu’ils sont congrus l’un à l’autre modulo 2π :

Définition I.4

Soient x, y deux réels. Nous noterons x ≡ y mod 2π lorsqu’il existe un entier relatif k tel quex− y = k × 2π.

Voici les propriétés que vérifie cette relation :

Propriétés I.5

Soient x, y, z trois nombres réels.B x ≡ x mod 2π.B Si x ≡ y mod 2π, alors y ≡ x mod 2π.B Si x ≡ y mod 2π et y ≡ z mod 2π, alors x ≡ z mod 2π.B Si x ≡ y mod 2π, alors ax ≡ ay mod a× 2π, pour tout réel a non nul.

Les angles possèdent plusieurs mesures, que nous noterons en radians. Par exemple, si π/2 estune mesure de notre angle, il en est de même de π/2+2π, ainsi que π/2−8π. Nous en distingueronsune, la mesure principale : c’est l’unique mesure comprise dans l’intervalle [0, 2π[.

Nous noterons donc, si α est une mesure de l’angle orienté entre les deux vecteurs ~u et ~v,θor(~u,~v) ≡ α mod 2π. Les propriétés des angles orientés sont les suivantes :

12

Propriétés I.6

Pour tous vecteurs ~u,~v, ~w non nuls,

θor(~u,~v) ≡ −θor(~v, ~u) mod 2π,θor(~u,−~v) ≡ π + θor(~u,~v) mod 2π,

θor(~u,~v) + θor(~v, ~w) ≡ θor(~u, ~w) mod 2π.

Une base (~u,~v) sera dite directe lorsque θor(~u,~v) sera congru à un angle compris dans l’intervalle]0, π[. Nous utiliserons presque exclusivement les bases orthonormées directes (BOND) :

Définition I.7

Soient ~u et ~v deux vecteurs du plan. (−→u ,−→v ) est une BOND lorsque ‖−→u ‖ = ‖−→v ‖ = 1 et queθor(−→u ,−→v ) ≡ π/2 mod 2π.

Une BOND est évidemment une base au sens où nous l’avons définie dans le chapitre précédent.

Remarques :

Attention aux angles non-orientés ](~u,~v) ∈ [0, π].](~u,~v) = ](~v, ~u), donc cette notion d’angles ne vérifie pas la relation de Chasles. Ce sontles angles dont il s’agit dans le théorème sur la somme des angles d’un triangle.

A la demande de Mme Ponsolle, je vous rappelle ce que sont les fonctions cos, sin, tan sur lecercle trignonométrique ainsi que dans un triangle rectangle.

II Repérage du point d’un plan

II.1 Les coordonnées polaires

O est appelé pôle et (O,~i) axe polaire.

Définition II.1

Soit M ∈ P. Un système de coordonnées polaires de M (SCP) est un couple (r, θ) de réelsqui vérifie

−−→OM = r(cos θ~i+ sin θ~j)

Remarques :

Un SCP n’est pas unique. On parle du couple de coordonnées cartésiennes, mais descouples de coordonnées polaires. Les SCP de l’origine O sont tous les couples (0, θ), où θest un réel quelconque. Si (r, θ) est un SCP, alors (−r, θ + π) aussi.Pour résumer, (r1, θ1) et (r2, θ2) sont deux SCP de M ssir1 = r2 et θ1 ≡ θ2 mod [2π], our1 = −r2 et θ1 ≡ θ2 + π mod [2π].

Pour passer des coordonnées polaires aux coordonnées cartésiennes, pour tout r 6= 0,

13

x = r cos θy = r sin θ ⇐⇒

|r| =√x2 + y2

cos θ = x/rsin θ = y/r

.

II.2 Equations cartésiennes et polaires

Définition II.2

Soit A une partie du planB Si G : R2 → R, on dit que G(x, y) = 0 est une équation cartésienne de A lorsque

∀M xy∈P,

(M ∈ A

)⇔(G(x, y) = 0

).

B Si G : R2 → R, on dit que G(r, θ) = 0 est une équation polaire de A lorsque pour toutM ∈P,(

M ∈ A)⇔(il existe AU MOINS un SCP (r, θ) de M tel que G(r, θ) = 0.

)Nous verrons en détail les équations cartésiennes des droites et des cercles.

II.3 Changement de repère orthonorméProposition II.3

Si (~u,~v) est une BOND du plan, alors~u = cos θ~i+ sin θ~j,~v = − sin θ~i+ cos θ~j

où θ est une mesure de θor(~i, ~u).

Démonstration : Que ~u soit égal à cos θ~i+ sin θ~j vient des définitions même de cos et sin.De même, puisque −→v est directement orthogonal à −→u , −→v est le vecteur cos(θ+π/2)~i+sin(θ+π/2)~j =− sin θ~i+ cos θ~j (se conférer aux relations de trigonométrie).

Le vecteur cos θ~i + sin θ~j sera noté −→uθ et le vecteur − sin θ~i + cos θ~j sera noté −→vθ (notation quideviendront −→ur et −→uθ en physique).

Proposition II.4

Fixons deux repères orthonormés directs (ROND) R = (O,~i,~j) et R′ = (Ω, ~u,~v).Notons (a, b) les coordonnées de Ω dans le repère R.Soit M un point du plan de coordonnées (x, y) dans R et de coordonnées (x′, y′) dans R′. Alors,en notant θ une mesure de θor(~i, ~u), nous avons la relation :

x = a+ x′ cos θ − y′ sin θ,y = b+ x′ sin θ + y′ cos θ

Démonstration : Rappelons pour commencer que la phrase “M un point du plan de coordonnées (x, y)dans R et de coordonnées (x′, y′) dans R′” signifie précisément

−−→OM = x

−→i +y−→j et

−−→ΩM = x′−→u +y′−→v .

x−→i + y

−→j = −−→

OM = −→OΩ +−−→ΩM =(a−→i + b

−→j)

+(x′−→u + y′−→v

)=

(a−→i + b

−→j)

+(x′(

cos θ~i+ sin θ~j)

+ y′(− sin θ~i+ cos θ~j

)v)

=(a+ x′ cos θ − y′ sin θ

)−→i +

(b+ x′ sin θ + y′ cos θ

)−→j .

14

On conclut grâce à la première proposition de l’année.

III Produit scalaire et Déterminant

Ce sont deux outils pratiques qui traduisent l’orthogonalité ou la colinéarité de deux vecteurs àl’aide d’une équation intrinsèque, i.e qui ne nécessite pas l’introduction d’une variable auxiliaire.

III.1 Le déterminant

Soient −→u et −→v deux vecteurs du plan et A,B,C,D quatre points tels que ~u = −−→AB,~v = −→AC et−−→AD = −−→AB +−→AC.

Notons det(~u,~v) l’aire algébrique du parallélogramme ABCD. Par “algébrique”, nous signifions

det(~u,~v) =

0 si les deux vecteurs sont colinéaires,+A(ABCD) si (−→u ,−→v ) est une base directe−A(ABCD) si (−→u ,−→v ) est une base indirecte.

L’avantage de cette définition, outre qu’elle est purement géométrique, est qu’elle permet d’éta-blir sans difficulté les propriétés essentielles. Pour commencer :

Propriétés III.1

Le réel det(~u,~v) est nul si et seulement si ~u est colinéaire à ~v.

On peut la reformuler ainsi : (~u,~v) est une base ssi son déterminant est non nul, et elle est alorsdirecte ssi il est strictement positif.

L’aire d’un triangle s’exprime depuis le collège à l’aide de la fonction sinus, ce qui nous permetd’écrire (remarquer que les signes coïncident) :

det(~u1, ~u2) = ‖~u1‖‖~u2‖ sin(~u1, ~u2)

On en déduit l’inégalité d’Hadamard∣∣det(~u1, ~u2)∣∣ 6 ‖~u1‖‖~u2‖,

l’égalité étant vérifiée ssi les deux vecteurs sont orthogonaux.

Etablissons maintenant une expression simple de cette aire en fonction des composantes desdeux vecteurs dans une BOND :Propriétés III.2

Soient deux vecteurs −→u xy

et −→v x′

y′dont les coordonnées sont exprimées dans une BOND,

alors det(−→u ,−→v ) = xy′ − x′y

Démonstration : Passons en coordonnées polaires en posantx = r cosαy = r sinα

et

x′ = r′ cosβy′ = r′ sin β

,

où r, r′ > 0. Alors, l’angle orienté entre −→u et −→v vaut β − α. On peut donc commencer le calcul :

det(−→u ,−→v ) = ‖−→u ‖‖−→v ‖ sin θor(−→u ,−→v ) = rr′ sin(β − α)= rr′(sin β cosα− sinα cosβ)= xy′ − x′y.

Le point clé et la beauté de cette quantité est qu’elle est linéaire par rapport à ~u et à ~v :

15

Propriétés III.3

Le déterminant est une application antisymétrique, et bilinéaire.

Remarquons que dans une base quelconque, l’expression xy′ − x′y ne représente plus l’aireeuclidienne, mais garde la caractérisation de la colinéarité.B Résoudre l’équation det(−−→AM,~u) = α, où α ∈ R.B Le déterminant permet dans la pratique de vérifier l’alignement, ou de trouver des expres-

sions cartésiennes de droites : M(x, y) appartient à la droite passant par A et parallèle à(BC) ssi det(−−→AM,

−−→BC) = 0.

III.2 Le produit scalaire

Pythagore (-580) nous incite à poser :

~u.~v = ‖~u+ ~v‖2 − ‖~u‖2 − ‖ ~v‖2

2 ,

et à en déduire :Propriétés III.4

~u.~v = 0 ssi ~u est orthogonal à ~v.

Calculons tout de suite son expression dans une bon :

Propriétés III.5

Dans toute BON, ~u.~v = xx′ + yy′.

Démonstration : Il suffit d’utiliser la définition de la norme euclidienne dans toute BON.

De là on déduit l’essentiel :Propriétés III.6

Le produit scalaire est bilinéaire et symétrique.

Remarquons maintenant, à l’aide de l’expression cartésienne, que le produit scalaire de ~u et ~vest égal au déterminant de ~u avec le vecteur directement orthogonal à ~v et de même norme. On endéduit l’interprétation géométrique du produit scalaire ainsi que l’inégalité de Cauchy-Schwarz :

Propriétés III.7

~u1.~u2 = ‖~u1‖‖~u2‖ cos(~u1, ~u2).|~u1.~u2| 6 ‖~u1‖‖~u2‖ avec égalité ssi les deux vecteurs sont colinéaires.

Enfin, Al-Kashi (1380, Perse), qui généralise Pythagore : ‖~u1 + ~u2‖2 = ‖~u1‖2 + ‖ ~u2‖2 + 2~u1.~u2 .Cette formule permet d’exprimer le cosinus d’un angle à l’aide de distances.

Résolvons−−→AM.~u = α.

Résolvons−−→AM.

−−→BM = 0.

Le produit scalaire permet dans la pratique de trouver des expressions cartésiennesde perpendiculaires : M(x, y) appartient à la droite passant par A et perpendiculaireà (BC) ssi

−−→AM.

−−→BC = 0.

Rappelons queles bases orthonormées (~u,~v) sont celles qui vérifient ‖~u‖ = ‖~v‖ = 1 et ~u.~v = 0.Elles ont un avantage essentiel sur les autres :

Propriétés III.8

Si (~i′,~j′) est une b.o.n. de ~P, alors pour tout vecteur ~u de ~P,

~u = (~u.~i′)~i′ + (~u.~j′)~j′.

16

IV Droites

B Il faut connaitre les trois types d’équations : cartésiennes, polaire et paramétrique. Les connaitresignifie pouvoir les reconnaitre, les dessiner, et inversement pouvoir donner une équationd’une droite donnée.

B Intersection de droites : formules de Cramer lorsque le déterminant est non nul.B Distance d’un point de coordonnées (x0, y0) à la droite d’équation cartésienne ax+ by+ c = 0

est|ax0 + by0 + c|√

a2 + b2.

V Cercles

B Equations cartésiennes, polaire, et paramétrique (dont la représentation rationnelle).B Intersection d’une droite (∆) et d’un cercle C (Ω, R) : sa nature dépend du signe de d∆(Ω)−R.B Intersection de deux cercles C (Ω, R) et C (ω, r) : on la ramène pratiquement à l’intersection

d’une droite et d’un cercle.

VI Quelques transformations du plan

17

Chapitre 3

Les entiers

I Un peu de propédeutique

I.1 Applications

La notion d’application est absolument indispensable en mathématiques. Ce n’est d’ailleurs passon apanage, puisque les physiciens en usent et en abusent aussi, sous le terme générique de signal.

Entre autres exemples de signaux, on trouve :B intensité d’un courant électrique,B différence de potentiel entre deux points d’un circuit,B position d’un mobile, repréré par sa position dans le temps, M = M(t), ou dans l’espaceM = M(x, y, z),

B niveaux de gris des points d’une image,B composante d’un champ V (x, y, z),B un son,...

Définition I.1 (de base)

Soient E et F deux ensembles.

1. Une fonction f de E vers F associe à tout élément x de E au plus un élément y de F . Onnote alors y = f(x). On pourra noter cette fonction

f : x ∈ E 7→ f(x) ∈ F, ou Ef−→ F, ou f E −→ F

x 7−→ f(x).

2. On appelle ensemble (ou domaine) de définition de la fonction f , et on note Df , l’en-semble des éléments x ∈ E qui sont associés à un élément de F .

3. Une fonction f de E vers F est appelée application si et seulement si Df = E.L’ensemble des applications de E vers F est noté FE , ou parfois F(E,F ).

4. Pour tout ensemble E, on notera IdE , l’application IdE : x ∈ E 7→ x ∈ E.

5. Pour tout x ∈ Df , l’élément y de F tel que y = f(x) est appelé l’image de x.

6. Pour tout y ∈ F , tout élément x ∈ E qui vérifie y = f(x) est appelé antécédent de y parf (pour chaque y de F , il peut en exister 0,1 ou plusieurs).

7. Soit f : E → E une application et A ⊂ E. A est dit stable par f ssi f(A) ⊂ A.

18

Remarques :

Il faut être vigilant au fait qu’une fonction est un triplet (E,F, f). Il ne suffit ainsi pas,pour que deux fonctions soient égales, qu’elles aient par exemple mêmes expressionsalgébriques. Elles seront égales si et seulement siB Elles ont même ensemble de départ et même ensemble d’arrivée, etB Pour tout x ∈ E, f(x) = g(x).

I.2 La loi de composition Comment construire une application à partir de deux :

Définition I.2 (Composition de fonctions)

Soient E,F,G trois ensembles, et f et g deux fonctions vérifiant

Ef−→ F

g−→ G.

On définit une fonction Egf−→ F , que l’on appelle composée de g et f , par :

B Si x ∈ Df et f(x) ∈ Dg, on pose(g f

)(x)g

(f(x)

),

B Sinon on ne lui en associe aucun, i.e x /∈ Dgf .

Remarques :

RN est l’ensemble des fonctions u : N → R. Un élément u de RN est appelé suite réelle,l’image d’un entier n par u est plutôt notée un, et u se note aussi (un)n∈N.

Propriétés I.3 (Associativité de la loi de composition)

Quelles que soient f : E → F, g : F → G, h : G→ H, on a (h g) f = h (g f).

Remarques :

Attention, La composition n’est en revanche pas commutative. Par exemple, si f : x ∈R 7→ 2x ∈ R et g : x ∈ R 7→ x+1 ∈ R, f g(x) = 2x+2 et gf(x) = 2x+1, si bien que parexemple, f g(0) 6= g f(0). La nature offre d’ailleurs très peu d’exemples d’applicationsqui commutent entre elles.

B Soit E un ensemble et f : E → E une application. On note f0 = IdE , f1 = f et pour tout

n > 2, fn = f fn−1, lorsqu’il n’y a pas de confusion possible avec les autres opérations. Sil’on désire préciser que fn désigne la fonction obtenue en composant n fois f avec elle-même,on notera fn.

B Soit E un ensemble et A une partie de E. Pour toute partie A de E, on définit la fonctioncaractéristique de A, ou fonction indicatrice de A, la fonction :

χA :E → 0, 1

x 7→

1 si x ∈ A0 si x /∈ A

.

19

Ainsi, l’inclusion A ⊂ B se traduit par l’inégalité de fonctions χA 6 χB .

I.3 Injectivité, Surjectivité, Bijectivité

Définition I.4

Une application f : E → F est dite :B injective lorsque

∀ x, x′ ∈ E,(f(x) = f(x′)⇒ x = x′

);

i.e ssi tout élément de F a au plus un antécédent par f .B surjective lorsque

∀y ∈ F,∃x ∈ E, y = f(x),

i.e ssi tout élément de F a au moins un antécédent.B bijective ssi f est surjective et injective, i.e

∀y ∈ F,∃!x ∈ E, y = f(x),

c’est-à-dire tout élément de F a exactement un antécédent.

B x ∈ R 7→ x2 ∈ R n’est pas surjective, mais x ∈ R 7→ x2 ∈ R+ l’est.B x ∈ R 7→ x2 ∈ R n’est pas injective, mais x ∈ R+ 7→ x2 ∈ R l’est.B x ∈ R+ 7→ x2 ∈ R+ est bijective.

Proposition I.5

Soient E,F,G trois ensembles, et f et g deux fonctions vérifiant Ef−→ F

g−→ G.

1. Si f et g sont injectives, alors g f est injective.

2. Si f et g sont surjectives, alors g f est surjective.

3. Si f et g sont bijectives, alors g f est bijective.

Démonstration : 1. Supposons f et g injectives. Alors, pour tout x, x′ ∈ E,

g f(x) = g f(x′) =⇒ g(f(x)) = g(f(x′))=⇒ f(x) = f(x′) car g est injective,

=⇒ x = x′ car f est injective,

2. Supposons f et g surjectives. Soit z ∈ G. g est surjective, donc il existe y ∈ E tel que g(y) = z.De plus, la surjectivité de f assure l’existence d’un x ∈ E tel que f(x) = y. Ainsi, g f(x) =g(f(x)) = g(y) = z. Donc x est un antécédent de z par g f : E → G.

3. Si f et g sont bijectives, la bijectivité de g f découle des deux points précédents.

Lorsque f : E → F est bijective, tout élément de F possède un unique antécédent par f , si bienque nous disposons d’une nouvelle application g : F → E qui à tout y de F associe l’unique x ∈ Etel que g(x) = y. Remarquons alors que f g(y) = f(x) = y, i.e f g = IdF . De même, f g = IdF .

Proposition I.6 (Réciproque d’un application bijective)

Soit f : E → F une application.

1. Il existe une application g : F → E qui vérifie g f = IdE et f g = IdF si et seulementsi f est une bijection.

2. Si f est effectivement bijective, cette fonction g est unique. On la note f−1 := g et onl’appelle application réciproque de f .

20

Démonstration : 1. Le sens ⇐ vient d’être fait. Montrons le sens direct : Soient x, x′ ∈ E tels quef(x) = f(x′). Alors, g f(x) = g f(x′), et donc x = x′. f est ainsi injective. De plus, soit y ∈ F .En posant x = g(y), on remarque que f(x) = y. D’où sa surjectivité.

2. Soient g1, g2 : F → E telles que g1 f = IdE , f g1 = IdF et g2 f = IdE , f g2 = IdF . Alors,g1 = g1 IdE = g1

(f g2

)=(g1 f

) g2 = IdF g2 = g2.

Proposition I.7

Si f : E → F et g : F → G sont deux bijections, alors g f est bijective et (g f)−1 = f−1 g−1.

I.4 Images d’un ensemble par une application

Définition I.8 (Images Directes et Images Réciproques)

Soient E,E′ deux ensembles et f : E → E′ une application.B Pour toute partie A de E, on définit l’image directe de A par f , notée f(A), comme

l’ensemble de toutes les images des éléments de A :

f(A) = x′ ∈ E′,∃a ∈ A, x′ = f(a).

On nomme souvent l’image de E l’ensemble f(E) ⊂ F .B Pour toute partie A′ de E′, on définit l’image réciproque de A′ par f , notée f−1(A′),

comme l’ensemble de tous les éléments de E dont l’image est incluse dans A′ :

f−1(A′) = x ∈ E, f(x) ∈ A′.

Remarques :

B La notation f−1(A′) ne suppose pas que f soit bijective. Ainsi, pour un y ∈ E′, on nepeut utiliser la notation f−1(y) que si f est bijective, alors que la notation f−1(y) aun sens quelle que soit l’application f .

B Dire que f : E → F est surjective est équivalent à dire que f(E) = F .

Définition I.9 (Restrictions et Prolongements)

Soient E et F deux ensembles, f : E → FB Soit A ⊂ E. On appelle restriction de f à A l’application notée f|A et définie par f|A : x ∈A 7→ f(x) ∈ F .

B Soit E′ un ensemble tel que E ⊂ E′. On appelle prolongement de f à E′ toute application: g : E′ → F dont la restriction à E est f ; c’est-à-dire toute application g : E′ → F telleque ∀x ∈ E, g(x) = f(x).

Remarques :

B Par exemple, l’exponentielle complexe, telle qu’on l’a définie dans le cours sur lescomplexes, est un prolongement de x ∈ R 7→ ex ∈ R.

B Trouver un prolongement g d’une application f : E → F à E′ ⊂ E est en soit unechose très simple : il suffit de donner une valeur arbitraire à tous les g(x) où x 6= E.La difficulté, et donc l’intérêt d’un prolongement apparait lorsque l’on désire que leprolongement de f conserve une propriété de f : continuité, dérivabilité, linéarité,...

21

II Les relations binaires

II.1 Définition des relations et relations d’équivalence

Définition II.1

Soit E un ensemble. On appelle relation binaire sur E toute partie Ω de E × E. On note pourtous x, y dans E xRy lorsque le couple (x, y) ∈ Ω.

1. Ω = (x, x2) où x ∈ R est une relation binaire sur R. Ainsi, xRy ssi y est le carré de x, cepourquoi on appelle cette relation “est le carré de”.

2. Dans l’ensemble E des droites affines du plan, Ω = (d1, d2) où d1 ⊥ d2 ; Ici R =“est per-pendiculaire à”.

3. Dans E = R, la relation de congruence modulo π. Dans ce cas, Ω = (x, x+kπ) où x ∈ R, k ∈Z.

4. Dans E = N, Ω = (n,m) ∈ N2/n 6 m. Ici, R =“est inférieur ou égal à”.

5. Dans E = N, Ω = (n,m) ∈ N2/n|m. Ici, R =“divise”.

6. Dans E = P(F ), l’ensemble des parties d’un ensemble quelconque F , on dispose de la rela-tion “est inclus dans” que l’on note évidemment R =⊂.

7. Enfin, un autre ordre que nous renconterons très souvent, sur E = F (I,R), où I est unensemble quelconque :

∀f, g ∈ E,(f 6 g

)⇐⇒

(∀x ∈ I, f(x) 6 g(x)

).

Essayons de distinguer les relations les plus intéressantes pour nous cette année :

Définition II.2

Soir E un ensemble et R une relation sur E. On dit queB R est réflexive lorsque ∀x ∈ E, xRx.B R est symétrique lorsque ∀x, y ∈ E, si xRy, alors yRx.B R est antisymétrique lorsque ∀x, y ∈ E, si xRy et yRx, alors x = y.B R est transitive lorsque ∀x, y, z ∈ E, si xRy et yRz, alors xRz.

On dira d’une relation binaire R qu’elle est une relation d’ordre, on un ordre lorsqu’elle estantisymétrique, réflexive et transitive, (on dit alors que (E,R) est un ensemble ordonné) et quec’est une relation d’équivalence lorsqu’elle est symétrique, réflexive et transitive.

Reprenons les exemples ci-dessus : la relation de perpendicularité n’est ni réflexive, ni transitive,mais elle est symétrique. La relation “est inférieur ou égal à” ou la relation d’inclusion sont lesexemples-type de relations d’ordre. La relation de congruence sur l’ensemble des réels est unerelation d’équivalence. “est le carré de” n’est pas réflexive.

Lorsque l’on dispose d’une relation d’équivalence sur E, on appelle classe d’équivalence d’unélément x de E l’ensemble de tous les éléments de E qui sont en relation avec X. Par exemple dansla relation de congruence modulo π sur R, la classe d’équivalence de 0 est l’ensemble des mutiplesde π.

II.2 Les ensembles ordonnésDéfinition II.3 (Ordre total)

Soit (E,R) un ensemble ordonné. L’ordre R est dit total lorsque ∀x, y ∈ E, xRy ou yRx.

Evidemment 6 est un ordre total sur R, alors que ⊂ ne l’est pas puisque [0, 2] et [1, 3] ne sontpas comparables.

Profitons-en pour définir la monotonie des fonctions :

Définition II.4 (Croissance et décroissance)

Soient (E,6) et (F,6) deux ensembles totalement ordonnés, et f : E → F . On dit que f est :

22

1. croissante lorsque ∀x, y ∈ E, (x 6 y)⇒(f(x) 6 f(y)

).

2. décroissante lorsque ∀x, y ∈ E, (x 6 y)⇒(f(x) > f(y)

).

3. strictement croissante lorsque ∀x, y ∈ E, (x < y)⇒(f(x) < f(y)

).

4. strictement décroissante lorsque ∀x, y ∈ E, (x < y)⇒(f(x) > f(y)

).

On dit que f est monotone lorsqu’elle est croissante ou décroissante.

Proposition II.5 (Monotonie et injectivité)

Soient (E,6) et (F,6) deux ensembles totalement ordonnés, et f : E → F .Si f est strictement monotone, alors elle est injective. C’est donc une biejction de E sur f(E).

Proposition II.6 (Composition de fonctions monotones)

Soient (E,6), (F,6) et (G,6) trois ensembles totalement ordonnés. Soient aussi f : E → F etg : F → G deux fonctions monotones. Alors

1. g f est monotone, et est croissante si et seulement si f et g ont même monotonie.

2. si f est bijective et monotone, alors f−1 a la même monotonie que f .

II.3 Elements remarquables d’un ensemble totalement ordonné

Définition II.7

Soit (E,6) un ensemble ordonné. 1 Soit aussi A ⊂ E.B On appelle majorant de A tout élément A ∈ E qui vérifie ∀x ∈ E, x 6M .B On dit que A est majorée lorsque ∃M ∈ E,∀x ∈ E, x 6M .B On dit d’un élément M de A qu’il est le plus grand élément de A lorsque M ∈ A et qu’il

est un majorant de A.

On peut montrer qu’un plus grand élément lorsqu’il existe, est unique.[0, 1[ est majoré par 1 mais ne possède pas de plus grand élément. En effet, aucun m ∈ [0, 1[

n’est un majorant de [0, 1[ puisque m+12 est strictement supérieur à m et appartient à [0, 1[.

Remarques :

Tout ensemble fini est borné.

III L’ensemble des entiers naturels

L’arithmétique, et toute la théorie des nombers se construisent sur l’axiome suivant :AXIOME : Il existe un ensemble noté N, non vide, totalement ordonné, et qui vérifie :

1. Toute partie non vide de N a un plus petit élément.

2. Toute partie non vide et majorée de N a un plus grand élément.

3. N n’a pas de plus grand élément.

Le plus petit entier sera noté 0, les suivants 1, 2, 3, ....Tout entier n ∈ N a donc un successeur noté n+ 1.

Théorème III.1 (Principe de récurrence (dite simple))

Soit P(n) un prédicat dépendant d’un entier n > n0. Alors si

1. P(n0) est vrai,

2. ∀n ∈ [[n0,+∞[[,(P(n)⇒P(n+ 1)

)est vrai.

23

Alors P(n) est vrai ∀n > n0.

Démonstration : Effectuons un raisonnement par l’absurde en supposant que la conclusion est fausse etposons Ω = n > n0 tels que P(n) est faux.. Ω est alors une partie non vide de N, donc elle possèdeun plus petit élément n1. n1 ∈ Ω, et en tant que plus petit élément de Ω, il nous assure que n1−1 /∈ Ω.Mais ceci contredit le deuxième point pour n = n1 − 1.

Montrons que 1 + 3 + 5 + · · ·+ (2n− 1) = n2.Nous utiliserons parfois deux autres types de récurrence parfaitement équivalents à la précé-

denteThéorème III.2 (Principe de récurrence d’ordre 2)

Soit P(n) un prédicat dépendant d’un entier n > n0. Alors si

1. P(n0) et P(n0 + 1) sont vrais, et

2. ∀n ∈ [[n0,+∞[[,(P(n) et P(n+ 1)

)⇒P(n+ 2) est vrai,

alors P(n) est vrai ∀n > n0.

Montrer que si u0 = 1, u1 = 2 et ∀n ∈ N, un+2 = 3un+1 − 2un, alors pour tout entier natureln, un = 2n.

Théorème III.3 (Principe de récurrence (dite forte))

Soit P(n) un prédicat dépendant d’un entier n ∈ N. Alors si

1. P(0) est vrai, et

2. ∀n ∈ N,(∀k ∈ [[0, n]],P(k)

)⇒P(n+ 1) est vrai.

Alors P(n) est vrai ∀n > n0.

Montrer que tout entier naturel n > 2 s’écrit comme le produit de nombres premiers.

IV Symboles Σ et ∏Soit n0 ∈ N. Soit

(ak)k>n0 une suite de nombres complexes. Nous définissons

B

n0∑k=n0

ak = an0 ,

∀n > n0,

n+1∑k=n0

ak =( n∑k=n0

ak

)+ an+1.

B

n0∏k=n0

ak = an0 ,

∀n > n0,

n+1∏k=n0

ak =( n∏k=n0

ak

)an+1.

Soit en clair,∑nk=0 ak = a0 + a1 + a2 + · · ·+ an, et idem pour le produit.

Montrer et retenir que pour tout n ∈ N∗,

n∑k=1

k = n(n+ 1)2 et

n∑k=1

k2 = n(n+ 1)(2n+ 1)6 .

Rappelons aussi la fonction factorielle :

0! = 1! = 1 et ∀n ∈ N, (n+ 1)! = n!× (n+ 1).

Quelques propriétés centrales :

Propriétés IV.1

24

1.n∑i=1

ai =n∑k=1

ak =n−1∑i=0

ai+1 =n+p−1∑k=p

ak−p.

2.n∑i=0

ai =n∑k=0

an−k

3.n∑i=0

λai = λ

n∑i=0

ai etn∏i=0

(λai) = λn+1n∏i=0

ai.

4.n∑i=0

(ai + bi) =n∑i=0

ai +n∑i=0

bi, etn∏i=0

(ai × bi) =(

n∏i=0

ai

(n∏i=0

bi

)

5.2n∑k=0

ak =n∑i=0

a2i +n−1∑i=0

a2i+1.

6.n∑k=0

(ak+1 − ak) = an+1 − a0.

V Cardinal

V.1 Ensembles finisDéfinition V.1 (Equipotence)

Deux ensembles E et F sont dits équipotents lorsqu’il existe une bijection de E dans F .Un ensemble E est dit dénombrable lorsqu’il est équipotent à N.

On voit que si la relation d’équipotence est symétrique, réflexive et transitive.Remarquons que 2N est dénombrable.

Nous noterons pour tout n ∈ N∗, Nn = [[1, n]] .

Propriétés V.2

Soient n, p ∈ N∗.1. S’il existe une injection de Nn vers Np, alors n 6 p.

2. S’il existe une surjection de Nn vers Np, alors n > p.

3. S’il existe une bijection de Nn vers Np, alors n = p.

Démonstration : 1. Se prouve par récurrence sur n, p étant fixé.

2. On construit une injection de Np vers Nn et on utilise le 1.

Définition V.3 (Ensembles finis)

Un ensemble E est dit fini s’il existe une entier n ∈ N∗ tel que cet ensemble soit équipotent àNn. n est alors unique et appelé cardinal de E et noté n = Card E. On convient que ∅ est finiet que son cardinal est nul.Si E n’est pas fini, on dit qu’il est infini.

Théorème V.4

Une partie de N est finie si et seulement si elle est majorée.

V.2 Propriétés des ensembles finis

Propriétés V.5

B Toute partie F d’un ensemble fini E est finie et Card F 6 Card E, avec égalité si et

25

seulement si E = F .B Si E est fini, et si f : E → F , alors f(E) est fini, Card (f(E)) 6 Card E, avec égalité si et

seulement si f est injective.

Propriétés V.6

Soient E et F deux ensembles finis de même cardinal, et f : E → F . Alors les assertionssuivantes sont équivalentes :

1. f est injective,

2. f est surjective,

3. f est bijective.

VI Dénombrement

1. Card(A ∪B

)= Card A+ Card B − Card

(A ∩B

).

2. Card F (E,F ) = Card E × Card F.

3. Card P(Nn) = 2n.

4. Nombre d’injections de Nn dans Np5. Nombre de permutations de Nn.

6. Coefficients Binômiaux : définition, valeurs remarquables, formule de récurrence.

7. Binôme de Newton.

26

Théorème VI.1 (Binôme de Newton)

Soit n ∈ N et a, b ∈ C ; Alors (a+ b)n =n∑k=0

(nk

)akbn−k.

Démonstration : Je vous laisse l’initialisation n = 0. Soit n ∈ N pour lequel le binôme est vérifié. Alors

(a+ b)n+1 = (a+ b)× (a+ b)n = (a+ b)×n∑k=0

(nk

)akbn−k d’après P(n)

=n∑k=0

(nk

)ak+1bn−k +

n∑k=0

(nk

)akbn+1−k

=n+1∑p=1

(n

p− 1

)apbn+1−p +

n∑p=0

(np

)apbn+1−p où k + 1 = p dans la 1ère et k = p dans la 2ème,

=

(n∑p=1

(n

p− 1

)apbn+1−p +

(nn

)an+1b0

)+

(n∑p=1

(np

)apbn+1−p +

(n0

)a0bn+1

)

=n∑p=1

((n

p− 1

)+(np

))apbn+1−p + an+1 + bn+1

=n∑p=1

(n+ 1p

)apbn+1−p + an+1 + bn+1d’après la formule de récurrence sur les

(np

),

=n∑p=1

(n+ 1p

)apbn+1−p +

(n+ 1n+ 1

)an+1bn+1−(n+1) +

(n+ 1

0

)a0bn+1−0

=n+1∑p=0

(n+ 1p

)apbn+1−p

Théorème VI.2 (Binôme de Newton)

Soit n ∈ N et a, b ∈ C ; Alors (a+ b)n =n∑k=0

(nk

)akbn−k.

Démonstration : Je vous laisse l’initialisation n = 0. Soit n ∈ N pour lequel le binôme est vérifié. Alors

(a+ b)n+1 = (a+ b)× (a+ b)n = (a+ b)×n∑k=0

(nk

)akbn−k d’après P(n)

=n∑k=0

(nk

)ak+1bn−k +

n∑k=0

(nk

)akbn+1−k

=n+1∑p=1

(n

p− 1

)apbn+1−p +

n∑p=0

(np

)apbn+1−p où k + 1 = p dans la 1ère et k = p dans la 2ème,

=

(n∑p=1

(n

p− 1

)apbn+1−p +

(nn

)an+1b0

)+

(n∑p=1

(np

)apbn+1−p +

(n0

)a0bn+1

)

=n∑p=1

((n

p− 1

)+(np

))apbn+1−p + an+1 + bn+1

=n∑p=1

(n+ 1p

)apbn+1−p + an+1 + bn+1d’après la formule de récurrence sur les

(np

),

=n∑p=1

(n+ 1p

)apbn+1−p +

(n+ 1n+ 1

)an+1bn+1−(n+1) +

(n+ 1

0

)a0bn+1−0

=n+1∑p=0

(n+ 1p

)apbn+1−p

27

28

VII Lois de composition interne

29

Chapitre 4

La droite R

I Les propriétés générales

I.1 Inégalités

Autant la construction de Z et de Q se fait sans souci majeur, autant celle de R pose de réellesdifficultés. Nous passerons allègrement dessus, et nous vous demanderons à nouveau d’admettreque...

Proposition I.1

Il existe un ensemble notée R, contenant Q, muni d’un ordre total 6 et de deux lois + et × quivérifient• 6 est compatible avec l’addition :

∀x, y, a, b ∈ R,

x 6 y

a 6 b⇒ x+ a 6 y + b.

• 6 est compatible avec la multiplication :

∀x, y, a ∈ R,

x > y

a > 0⇒ ax > ay.

∀x, y, a ∈ R,

x > y

a 6 0⇒ ax 6 ay.

On notera

R∗ = R \ 0,R+ = x ∈ R tels que x > 0,R− = x ∈ R tels que x 6 0,R∗+ = x ∈ R tels que x > 0,R∗− = x ∈ R tels que x < 0.

Définition I.2 (Intervalles)

Soit Ω un sous-ensemble non vide de R. On dit que Ω est un intervalle lorsque ∀x < y ∈ Ω,∀x0 ∈[x, y], x0 ∈ Ω.

Un intervalle est finalement une partie de R qui ne contient pas de trou. Par exemple, tout singletonest un intervalle.

Voici une liste exhaustive des intervalles que l’on rencontre :

1. les fermés bornés, ou les segments :∀a, b ∈ R tels que a 6 b, on note [a, b] = x ∈ R tels que a 6 x 6 b.

30

2. les ouverts bornés :∀a, b ∈ R tels que a < b, on note ]a, b[= x ∈ R tels que a < x < b.

3. les semi-fermés bornés :∀a, b ∈ R tels que a 6 b, on note [a, b[= x ∈ R tels que a 6 x < b, et]a, b] = x ∈ R tels que a < x 6 b.

4. les ouverts non bornés :∀a ∈ R, on note

(a) ]a,+∞[= x ∈ R tels que a < x,(b) ]−∞, a[= x ∈ R tels que a > x,(c) ]−∞,+∞[= R.

5. les fermés non bornés :∀a ∈ R, on note

(a) [a,+∞[= x ∈ R tels que a 6 x,(b) ]−∞, a] = x ∈ R tels que a > x,

Les seuls intervalles sont ceux ci-dessus.Proposition I.3

Soient (Ωi)i∈I une famille d’intervalles indexée par un ensemble I. Alors ∩i∈IΩi est aussi unintervalle.

I.2 La valeur absolueDéfinition I.4

B Pour tout réel x, on note |x| = maxx,−x =x si x > 0,−x si x < 0.

.

B On appelle aussi, pour tous x, y ∈ R, distance entre x et y le réel positif d(x, y) = |x−y|.

Nous ne rappelons pas les propriétés évidentes de la valeur absolue, pour ne pas vous offenser,sauf :Propriétés I.5 (Inégalité triangulaire)

Soient x, y ∈ R. Alors, ∣∣|x| − |y|∣∣ 6 |x+ y| 6 |x|+ |y|.

Démonstration : B L’inégalité de droite : Comparons les carrés, en utilisant la positivité de toutcarré de nombre réels :(

|x|+ |y|)2 − (|x+ y|

)2 = x2 + y2 + 2|xy| − x2 − y2 = 2|xy| > 0.

B L’inégalité de gauche : |x| = |x + y − y| 6 |x + y| + |y|, et donc |x| − |y| 6 |x + y|. Enintervertissant les rôles de x et y, on obtient aussi |y| − |x| 6 |x+ y|. Il suffit alors de combinerces deux inégalités.

Remarques :

En voici deux qui pourront être utiles :B Pour tous x, y ∈ R, 2|xy| 6 x2 + y2.B Soient x et x0 ∈ R. Alors

d(x, x0) 6 ε⇐⇒ x0 − ε 6 x 6 x0 + ε⇐⇒ x ∈ [x0 − ε, x0 + ε].

31

Propriétés I.6 (De la distance)

La distance est une fonction d : R× R→ R+ qui vérifie :

1. Symétrie : ∀x, y ∈ R, d(x, y) = d(y, x).2. Cas de nullité : ∀x, y ∈ R, d(x, y) = 0⇐⇒ x = y.

3. Inégalité triangulaire : ∀x, y, z ∈ R, d(x, z) 6 d(x, y) + d(y, z).

I.3 La partie entière

Définition I.7

Soit x ∈ R. On appelle partie entière de x et on note E(x) l’entier relatif

E(x) = bxc = maxn ∈ Z, n 6 x.

Propriétés I.8 (De la partie entière)

1. Pour tout réel x, bxc 6 x < bxc+ 1, et x− 1 < bxc 6 x.2. Pour tout rél x, bxc = x⇐⇒ x ∈ Z.

I.4 Valeur décimale approchée

Définition I.9

Soit x ∈ R et n ∈ N. On appelle valeur décimale approchée à la précision 10−n par excès et pardéfaut les deux décimaux suivants :

xn = b10nxc10n et yn = b10nxc+ 1

10n .

Ces deux rationnels donnent de bonnes approximations de x :

Proposition I.10

Soit x ∈ R et n ∈ N. Alorsb10nxc

10n 6 x <b10nxc

10n + 10−n.

I.5 La droite achevéeDéfinition I.11

On note R = R∪+∞,−∞. On étend la relation d’ordre à cette droite achevée et partiellementles deux lois :

1. ∀a ∈ R,−∞ 6 a 6 +∞.2. ∀a ∈ R, si a 6= +∞, a+ (−∞) = −∞.3. ∀a ∈ R, si a 6= −∞, a+ (+∞) = +∞.4. ∀a ∈ R, si a > 0, alors a×+∞ = +∞ et a×−∞ = −∞.

32

Remarques :

Le 1. nous dit que +∞ est le plus grand élément de R et −∞ son plus petit élément. Sibien que toute partie de R est majorée et minorée.

II Densité

II.1 Rationnels, mon QDéfinition II.1 (Rationnels)

Soit x ∈ R. On dit que x est un rationnel lorsqu’il existe p ∈ Z et q ∈ N tels que x = p

q. Si x

n’est pas rationnel, on dit qu’il est irrationnel. On note Q l’ensemble des rationnels.

Ce qui suit sera basé sur le lemme suivant :

Lemme 1

Soient x et y deux réels tels que x < y.

1. Si y − x < 1, alors il existe un entier n ∈ Z tel que x < n < y.

2. Si x et y sont rationnels, il existe un irrationnel z dans ]x, y[.

Proposition II.2 (Densité de Q et R \ Q dans R)

Soient x < y deux réels. Il existe une infinité de rationnels et d’irrationnels dans l’intervalle[x, y].

Démonstration : Faire une preuve par l’absurde.

Définition II.3 (Densité)

Soit B une partie de R et Ω ⊂ B. On dit que Ω est dense dans B lorsque

∀x < y ∈ B, il existe ω ∈ Ω qui vérifie x < ω < b.

III La borne supérieure

Définition III.1 (Borne supérieure)

Soit Ω une partie non vide de R, et M ∈ R. On dit que M est une (la) borne supérieure de Ω, eton note M = sup Ω lorsque

1. ∀ω ∈ Ω, ω 6M.

2. ∀x ∈ R, si x < M , alors il existe ω ∈ Ω tel que x < ω.

33

Remarques :

1. Si cette borne sup existe, elle est unique et on la note donc M = supA.i

2. Le 1. nous dit que la borne supérieure de Ω est un majorant de Ω et le 2. qu’aucunréel < à la borne supérieure de Ω n’est un majorant de Ω ; D’où le nom de plus petitmajorant que l’on donne à la borne supérieure.

3. Nous remplacerons parfois le 2. par

2.′∀ε > 0, il existe ω ∈ Ω tel que M − ε < ω.

Nous avons évidemment :Définition III.2 (Borne inférieure)

Soit Ω une partie non vide de R, et m ∈ R. On dit que m est une (la) borne inférieure de Ω, eton note m = inf Ω lorsque

1. ∀ω ∈ Ω, ω > m.2. ∀x ∈ R, si x > m, alors il existe ω ∈ Ω tel que x > ω.

Théorème III.3 (de la borne sup)

Soit Ω une partie non vide et majorée de R. Alors elle possède une borne supérieure M ∈ R.

La preuve est difficile.Grâce à la définition de la droite achevée, nous avons une version un chouia plus élégante :

Théorème III.4 (de la borne sup dans R)

Soit Ω une partie non vide de R. Alors elle possède une borne supérieure M ∈ R.

34

Chapitre 5

Les suites numériques

Nous noterons K le corps des réels R ou celui des complexes C. Les éléments de K serontappelés scalaires, pour nous mettre petit à petit en exergue les similitudes qu’il existe entre l’espacedes suites et celui des vecteurs.

I KN et quelques ensembles de suites remarquables

I.1 Les trois loisDéfinition I.1 (Les suites)

Une suite d’éléments de K est une fonction u : N → K. Pour tout entier n ∈ N, nous noteronsun l’image u(n).Cette suite sera notée, u, ou (un), ou (un)n∈N. L’ensemble des suites à valeurs dans K sera notéKN.

Remarques :

• Attention à ne pas confondre le scalaire un et la suite (un).• On rencontrera des suites dont les premiers termes ne sont pas définis, auquel cas, en

notant n0 l’entier à partir duquel elles le sont, nous noterons (un)n>n0 .

Donnons quelques manières de définir les suites :

B Comme une fonction de n : un = n2 − 2n2 + 3 .

B Par une propriété : pour tout n ∈ N∗, xn est l’unique réel de l’intervalle [0, 1] solution del’équation xn = 1− x,

B Par récurrence : u0 = 1 et ∀n ∈ N, un+1 = sin un.La récurrence peut être d’ordre 2, comme par exemple la suite de Fibonacci :

F0 = 0, F1 = 1, et ∀n ∈ N, Fn+2 = Fn+1 + Fn.

B En tant que série : Soit (un) une suite. La série de terme général (un) est la suite (Sn)n∈N =(n∑k=0

uk

)n∈N

. Par exemple,

1. la série géométrique de raison q ∈ C est

(n∑k=0

qk

)n∈N

,

2. la série harmonique est

(n∑k=1

1k

)n∈N∗

, elle-même un cas particulier de

35

3. la série de Riemann

(n∑k=1

1kα

)n∈N∗

, où α ∈ R.

On définit trois lois sur KN ainsi : Soient (un)n∈N et (vn)n∈N deux suitesB L’addition

(un)n∈N + (vn)n∈N = (un + vn)n∈N.

B La multiplication(un)n∈N × (vn)n∈N = (un × vn)n∈N.

B La multiplication par un scalaire λ

λ.(un)n∈N = (λ× un)n∈N.

Par souci d’économie rédactionnel, nous dirons d’un prédicat P(n) qu’il est vrai à partir d’uncertain rang - ce que nous noterons APCR - lorsque

∃n0 ∈ N, ∀n ∈ N, si n > n0, alors P(n) est vrai.

I.2 Les suites bornéesDéfinition I.2 (majorée, minorée bornée)

Soit (un)n∈N une suite réelle. Elle est diteB minorée lorsque ∃m ∈ R,∀n ∈ N, un > m.B majorée lorsque ∃M ∈ R,∀n ∈ N, un 6 m.B bornée lorsqu’elle est majorée et minorée.

Une suite complexe (zn)n∈N est dite bornée lorsque la suite de ses modules (|zn|)n∈N est majorée.

Remarques :

Une suite (un)n∈N est majorée APCR (respectivement minorée, bornée) si et seulement sielle est majorée (respectivement minorée, bornée). Ceci se prouve sans trop de heurts enutilisant qu’une partie finie est toujours bornée.

Proposition I.3

Soit (un)n∈N une suite réelle. Elle est bornée ssi la suite (|un|)n∈N est majorée.

Démonstration : ⇐ : Si il existe A > 0 tel que pour tout n ∈ N, |un| 6 A, alors (un)n∈N est minorée par−A et majorée par A.⇒ : Si (un)n∈N est majorée par M et minorée par m, alors en posant A = max|m|, |M |, on a pour

tout entier n ∈ N :

−A 6 −|m| 6 m 6 un 6M 6 |M | 6 A et donc |un| 6 A.

Propriétés I.4

Soient (un)n∈N et (vn)n∈N deux suite réelles. Si elles sont toutes les deux majorées - respective-ment minorées, bornées - alors leur somme et leur produit est majorée -respectivement minorée,bornée.

Démonstration : C’est évident : si la première est majorée par m1 et la seconde par m2 alors leur sommel’est par m1 +m2.

Proposition I.5

Soient (un)n∈N et (vn)n∈N deux suite réelles qui vérifient

un 6 vn à partir d’un certain rang. Alors

36

1. Si (un)n∈N est minorée, alors (vn)n∈N l’est.

2. Si (vn)n∈N est majorée, alors (un)n∈N l’est.

Démonstration : Nous nous contenterons de prouver le premier point. S’il existe m ∈ R tel que pour toutentier n, un > m, alors vn > m APCR, ce qui nous garantit qu’elle est bien minorée.

1. Montrons que la série harmonique n’est pas majorée. Puisque pour tout x > −1, ln(1+x) 6

x, nous avons pour tout k ∈ N∗, ln(k + 1) − ln k = ln k + 1k

= ln(

1 + 1k

)6

1k. Fixons alors

n ∈ N∗ et sommons toutes ces inégalités pour les entiers allant de 1 à n :

n∑k=1

(ln(k + 1)− ln k) 6n∑k=1

1k

= Hn.

L’intérêt est que le minorant de la série harmonique est une série télescopique. Après rétrac-tation de clui-ci, on obtient

∀n ∈ N∗, Hn > ln(n+ 1).

La fonction ln n’étant pas majorée, la série harmonique ne l’est pas non plus.

2. Montrons que la série de Riemann

(n∑k=1

1kα

)n∈N∗

est majorée lorsque α > 2. Remarquons,

que puisque1kα6

1k2 pour tout k > 1, il suffit de montrer que

(n∑k=1

1k2

)n∈N∗

est majorée.

Or, pour k > 2, 1k2 6

1k(k − 1) = 1

k − 1 −1k

. Ainsi, on majore notre série par une série

télescopique : pour tout n > 2,

II La convergence

II.1 Les suites convergentes

Définition II.1

Soit (xn)n∈N ∈ KN et ` ∈ R. On dit que (xn) converge, ou tend, vers ` lorsque

∀ε > 0,∃n0 ∈ N,∀n ∈ N, (n > n0)⇒ |un − `| 6 ε.

On note alors xn → `. Une suite est dite convergente lorsqu’il existe un scalaire ` vers lequelelle tend. Sinon, elle est dite divergente.

Proposition II.2 (Unicité de la limite)

Si xn → `1 et xn → `2, alors `1 = `2.

Démonstration : Faisons une preuve par l’absurde. Si `1 < `2, posons ε = `2 − `14 dans la définiton de ces

deux limites. Nous obtenons ainsi l’existence d’un entier n0 au-delà duquel |un−`1| 6 ε et |un−`2| 6 ε.Alors :

`1 = (`1 − un) + (un − `2) + `2 > −ε− ε+ `2 = `1 − `22 + `2 > `1 − `2 + `2 = `1,

ce qui est effectivement absurde.

37

Remarques :

B La limite, lorsqu’elle existe, est donc unique. Nous noterons alors limn→∞

xn = `.

B limn→∞

xn = ` ⇐⇒ limn→∞

|xn − `| = 0. Tout résultat concernant la convergence d’une

suite positive vers 0 aura donc une portée générale, comme par exemple :

Proposition II.3

Soient (xn)n∈N et (yn)n∈N deux suites réelles telles que• limn→∞

yn = 0, et

• ∃n0 ∈ N, n > n0 ⇒ |xn| 6 yn.Alors lim

n→∞xn = 0.

Démonstration : Soit ε > 0. Il existe n1 ∈ N, que l’on peut choisir> n0, tel que pour tout n > n0, |yn| 6 ε,et donc |xn| 6 ε.

B Pour tout p ∈ R, limn→∞

p1/n = 1 et limn→∞

n1/n = 1. En effet, si on pose xn = p1/n − 1,

alors p = (xn + 1)n >(n1

)xn, d’après le binome de Newton et la positivité de xn. Ainsi,

0 6 xn 6 pn . On conclut avec le résultat précédent.

B De même, si yn = n1/n − 1, alors n = (yn + 1)n >(n2

)y2n, et ainsi 0 6 yn 6

√2

n− 1 .

Proposition II.4

Toute suite convergente est bornée.

Démonstration : Posons ε = 1 dans la définition de lim xn = `. Alors APCR |xn − `| 6 1, et donc`− 1 6 xn 6 `+ 1. La suite est bornée APCR, donc bornée.

Notons déjà, mais c’est une évidence, que le réciproque est fausse, comme nous le prouvel’exemple de la suite ((−1)n).

Revenons, avec bonheur, sur la question de la borne supérieure, et donnons-en une caractérisa-tion séquentielle :

Proposition II.5

Soit Ω une partie non vide et bornée de R. Soit M ∈ R. Alors

M = sup Ω⇐⇒∀x ∈ Ω, x 6M, et∃(xn)n∈N une suite d’éléments de Ω telle que lim

n→∞xn = M.

De même,

Proposition II.6

Soit A une partie de R. A est dense dans R si et seulement si pour tout réel x, il existe une suited’éléments de A qui converge vers x.

Démonstration : =⇒ Supposons la densité de A dans R. Soit x ∈ R. Pour tout n ∈ N∗, il existe donc unélément de A dans l’intervalle [x− 1/n, x+ 1/n]. Notons-le xn. La suite (xn) ainsi construite répond à

notre demande puisqu’elle vérifie |xn − x| 61n

, pour tout n ∈ N∗.

⇐= Soit [a, b] un intervalle non réduit à un singleton de R. Il existe une suite qui converge vers

le milieua+ b

2 de cet intervalle. En posant ε = b− a4 dans la définition de cette limite, nous voyons

qu’il existe un (tous APCR en fait) élément de cette suite dans l’intervalle.

38

Par exemple, on retrouve la densité des rationnels dans les réels, en notant que pour tout réelx, la suite de ses valeurs décimales approchées tend vers x :

limn→∞

b10nxc10n = x.

II.2 Arithmétique des suites convergentesProposition II.7

Soient (xn)n∈N et (yn)n∈N deux suites réelles ou complexes.

Si

limn→∞

xn = 0,(yn)n∈N est bornée

, alors limn→∞

xnyn = 0.

Démonstration : Il existe M > 0 tel que pour tout n ∈ N, |yn| 6 M . Alors Soit ε > 0. Il existe n0 ∈ N telque pour tout n ∈ N, n > n0 ⇒ |xn| 6

ε

M. Pour un tel n, on a alors |xnyn| 6

ε

M×M = M .

Proposition II.8

Soient (xn)n∈N et (yn)n∈N deux suites réelles ou complexes convergentes de limites respectivesα et β. Alors,

1. (xn + yn)n∈N converge vers α+ β.

2. (xnyn)n∈N converge vers αβ.

3. Pour tout λ ∈ K, (λxn)n∈N converge vers λα.

4. Si α 6= 0, alors APCR xn 6= 0 et limn→∞

1xn

= 1α

.

Démonstration : 1. Soit ε > 0. Il existe un rang n0 au-delà duquel |xn − α| et |yn − β| 6 ε/2. Ainsi,pour ces valeurs de n, d’après l’inégalité triangulaire,∣∣∣(xn + yn)− (α+ β)

∣∣∣ 6 |xn − α|+ |yn − β| 6 ε.2. Pour tout n ∈ N, xnyn−αβ = xn(yn−β)+β(xn−α). Or xn(yn−β) −−−−→

n→∞0 en tant que produit

d’une suite tendant vers 0 et d’une suite bornée (car convergente). Quant à la suite (β(xn − α)),elle tend aussi vers 0.

3. Je vous le laisse.

4. Quitte à changer la suite (xn) en son opposée, on peut supposer que α > 0. En appliquant lepremier point de la proposition II.9, avec λ = α/2, nous obtenons la relation xn > λ APCR. Or,∣∣∣ 1xn− 1α

∣∣∣ = |α− xn|αxn

6|α− xn|αλ

. Or cette dernière suite tend vers 0, donc( 1xn− 1α

)n∈N

aussi.

II.3 Limites et relations d’ordre

Toutes les suites de cette section seront réelles.Le deuxième point de cette proposition s’énonce ainsi : “Les inégalités larges passent à la limite”.

Autrement dit :Proposition II.9

Soit (xn) une suite réelle convergente et ` sa limite. Alors,

1. Pour tout λ < `, xn > λ APCR.

2. (a) Si xn > 0 APCR, alors ` > 0.

(b) Si il existe M ∈ R telq que xn >M APCR, alors ` >M .

(c) Si il existe M ∈ R telq que xn 6M APCR, alors ` 6M .

3. Si ` > 0, alors xn > 0 APCR.

39

Démonstration : Pour le troisième, il suffit de poser ε = ` > 0 dans la définition de la limite de (xn).Montrons le deuxième par contraposition : si ` < 0, alors (−xn) tend vers −` qui est > 0, donc

d’après le 3., −xn > 0 APCR, i.e xn < 0 APCR, et ne peut donc être positif APCR.Enfin, pour le premier point, il suffit d’appliquer le troisième point à la suite (xn − λ), puisque

celle-ci converge vers un réel > 0, à savoir `− λ.

Corollaire II.10

Soient (un) et (vn) deux suites réelles convergentes. Alors

1. Si un 6 vn APCR, on a lim un 6 lim bn.

2. S’il existe M ∈ R tel que un 6M APCR, on a lim un 6M .

Théorème II.11 (d’encadrement)

Soient (xn)n∈N, (yn)n∈N, (zn)n∈N trois suites réelles telles que

limn→∞

xn = limn→∞

yn = `,

xn 6 zn 6 yn.Alors

(zn)n∈N est convergente et limn→∞

zn = `.

Démonstration : D’après l’hypothèse, |zn − xn| 6 yn − xn. Puisque yn − xn −−−−−→n→+∞

0, d’après la pro-

position II.3, la suite zn − xn −−−−−→n→+∞

0, et donc la suite (zn) = (zn − xn) + (xn) converge vers

0 + `.

Soit (un)n∈N une suite réellle positive telle que limn→+∞

u1/nn = ` ∈ R.

1. Si ` < 1, alors limn→+∞

un = 0.

2. Si ` > 1, alors limn→+∞

un = +∞.

3. Si ` = 1, on ne peut rien dire.

II.4 Suites extraitesDéfinition II.12 (Suites extraites)

Soit (xn)n∈N une suite réelle ou complexe. On appelle suite extraite, ou sous-suite, de (xn)n∈N,toute suite de la forme (xϕ(n))n∈N, où ϕ : N→ N est une fonction strictement croissante.

Par exemple, (u2n)n∈N, (u2n+1)n∈N ou (un+1)n∈N sont des suites extraites de (un)n∈N.

Lemme 2

Soit ϕ : N→ N une fonction strictement croissante. Alors pour tout n ∈ N, ϕ(n) > n.

Démonstration : On le prouve par récurrence. L’initialisation provient de l’appartenance de ϕ(0) auxentiers naturels. Si maintenant n est un entier pour lequel le prédicat est vrai, alors ϕ(n + 1) > ϕ(n)car la croissance est stricte. Mais alors, d’après l’HdR, ϕ(n + 1) > n, et puisque ces inégalités portentsur des entiers, ϕ(n+ 1) > n+ 1.

Voici un théorème dont la contraposée nous sera bien utile :

Théorème II.13

Si (xn)n∈N converge vers un complexe `, alors toutes ses sous-suites convergent aussi vers `.

Démonstration : Soit ε > 0. Il existe n0 au dela duquel, |xn−`| 6 ε. Or ϕ(n) > n, donc si n > n0, ϕ(n) >n0 et on a aussi |xϕ(n) − `| 6 ε.

On se sert donc de sa contraposée pour prouver la divergence de suites, en exhibant deux sous-suites qui convergent vers deux limites distinctes.

1. (un)n∈N = ((−1)n)n∈N diverge, car sa sous-suite (u2n)n∈N est la suite constante égale à 1,donc converge vers 1, alors que sa sous-suite (u2n+1)n∈N converge vers −1.

40

2. La série harmonique ne converge pas car pour tou n ∈ N∗, H2n −Hn > 1.

3.(

cosn)n∈N ne converge pas, car dans la cas contraire, sa limite ` vérifierait :

cos(n− 1) + cos(n+ 1) = 2 cos 1 cosn⇒ ` = 0,cos(2n) = 2 cos2(n)− 1⇒ ` 6= 0.

Proposition II.14

Si (u2n)n∈N et (u2n+1)n∈N convergent vers la même limite, alors (un)n∈N converge.

Démonstration :

III Comparaisons de suites

S AIDER DE MON RESUME POUR REFAIRE CETTE PARTIE

III.1 Relation de domination

III.2 Relation de négligeabilité

III.3 Relation d’équivalence

B f est dominée par g au voisinage de a lorsqu’il existe λ > 0 tel qu’au voisinage de a, |f(x)| 6λ|g(x)|.On note alors f = Oa(g), ou f = O(g) quand x→ a.

B f est négligeable devant g, ou g est prépondérante devant f , en a lorsque ∀ε > 0, il existeun voisinage de a sur lequel |f(x) 6 ε|g(x)|.On note alors f = oa(g), ou f = o(g) quand x→ a.

B f est équivalente à g au voisinage de a lorsque f − g = o(g) au voisinage de a.On note alors f ∼a g, ou f ∼ g quand x→ a.

B Voici des interprétations qui permettent de visualiser ces trois définitions : Si g ne s’annulepas sur I, alors

– f = Oa(g) si et seulement sif

gest bornée au voisinage de a ;

– f = oa(g) si et seulement si lima

f

g= 0 ;

– f ∼a g si et seulement si lima

f

g= 1.

LES PROPRIÉTÉS QUI SUIVENT PEUVENT PARAÎTRE COMPLEXES, ÉTANT DONNÉ LEUR NOMBRE. POUR LES

RETROUVER, REVENEZ SYSTÉMATIQUEMENT AUX TROIS CARACTÉRISATIONS QUI PRÉCÈDENT. PAR EXEMPLE,LA RELATION (]) SE LIT : LE PRODUIT D’UNE FONCTION BORNÉE PAR UNE FONCTION TENDANT VERS 0 TEND

VERS 0.B Domination• Si f1 = Oa(g) et f2 = Oa(g), alors f1 + f2 = Oa(g).• Si f = Oa(g) et g = Oa(h), alors f = Oa(h).• Si f1 = Oa(g1) et f2 = Oa(g2), alors f1f2 = Oa(g1g2).• Soient f1, f2, g trois fonctions telles que f1 g et f2 g existent. Soient a, b ∈ R. Si f1 =

Oa(f2) et limb g = a, alors f1 g = Ob(f2 g). Autrement dit, on peut composer à droite par une

fonction g les relations o,O,∼, mais pas à gauche comme en témoignent f1 = id, f2 = 2id et g = exp.

B Prépondérance• Si f = oa(g), alors f = Oa(g). Remarquer que f = oa(1) signifie que lima f = 0.• Si f1 = oa(g) et f2 = oa(g), alors f1 + f2 = oa(g).• Transitivité mixte

f = oa(g) et g = Oa(h) ⇒ f = oa(h),f = Oa(g) et g = oa(h) ⇒ f = oa(h).

41

• Produit (])

f1 = oa(g1) et f2 = Oa(g2) ⇒ f1f2 = oa(g1g2),f1 = Oa(g1) et f2 = oa(g2) ⇒ f1f2 = oa(g1g2).

• Soient f1, f2, g trois fonctions telles que f1g et f2g existent. Soient a, b ∈ R. Si f1 = oa(f2)et limb g = a, alors f1 g = ob(f2 g).

B Equivalence• Si f ∼a (g), alors f = Oa(g) et g = Oa(f). Cette relation est d’équivalence sur les fonctions.• – Pour tout a, ` ∈ R, si f ∼a g et lima g = `, alors lima f = `.

– De plus, si ` est un réel non nul,(f ∼a `

)⇔(

lima f = `).

– Si f ∼a g, alors f et g sont du même signe au voisinage de a.• Produit f1 ∼a g1 et f2 ∼a g2, alors f1f2 ∼a g1g2.

• Inverse Si f ne s’annule pas au voisinage de a, et si f ∼a g, alors1f∼a

1g.

• Puissance Soit α ∈ R.Si f est strictement positive au voisinage de a et si f ∼a g, alorsfα ∼a gα.

• Soient f1, f2, g trois fonctions telles que f1g et f2g existent. Soient a, b ∈ R. Si f1 ∼a f2et limb g = a, alors f1 g ∼b f2 g.

IV Les suites monotones

Puisqu’il est question de relatiosn d’ordre, toutes les suites ici seront réelles.Une suite (un)n∈N est diteB croissante lorsque pour tout n ∈ N, un 6 un+1,B décroissante lorsque pour tout n ∈ N, un > un+1,B monotone lorsqu’elle est croissante ou décroissante.

IV.1 LE théorème

Le gros intérêt du théorème qui suit, et ce qui explique sa centralité est, outre que ses hypothèsessont minimalistes, qu’il dissocie les deux questions de la convergence d’une part, et du calcul de lalimite, i.e qu’il fournit la convergence sans exiger la connaissance de la limite.

Théorème IV.1

Toute suite croissante et majorée converge dans R.

Démonstration : Soit (un)n∈N une suite croissante et majorée. Notons α = supun, n ∈ N. Soit ε > 0.α − ε n’étant pas un majorant de cette suite, il existe n0 ∈ N, tel que un0 > α − ε. Alors d’après lacroissance de celle-ci, pour tout n > n0, α > un > un0 > α− ε, donc |un − α| 6 ε.

IV.2 Suites adjacentes

Définition IV.2

Soient (un)n∈N et (vn)n∈N deux suites réelles. Elles sont dites adjacentes lorsqueB (un)n∈N croît et (vn)n∈N décroît.B et vn − un −−−−→

n→∞0.

Le résultat est alors simple :

Théorème IV.3

Si (un)n∈N et (vn)n∈N sont adjacentes, alors elles convergent vers la même limite.

Démonstration : Il est clair que la seule difficulté, toute relative par ailleurs, consiste à prouver que lesdeux suites convergent. Or, la suite (vn − un)n∈N est décroissante, comme somme de deux suitesdécroissantes. Comme elle converge vers 0, elle est positive. Donc pour tout n ∈ N, un 6 vn, et ainsi,

42

un 6 v0 car la suite (vn)n∈N décroît. En conclusion, (un)n∈N croît et est majorée par v0, donc converge.Je vous laisse vous exercer sur l’autre suite.

Montrons que les deux suites (un)n∈N∗ = ł(n∑k=1

1k− lnnΣ)n∈N∗ et (vn)n∈N∗ = ł(un −

1nΣ)n∈N∗ sont

adjacentes :

B Soit n ∈ N∗. un+1 − un = 1n+ 1 − ln(n + 1) + lnn = ln ł(1 − 1

n+ 1Σ) + 1

n+ 1 6 0, que l’on

obtient en posant x = − 1n+ 1 dans ln(1 + x) 6 x.

B Soit n ∈ N∗. vn+1−vn = ł(un+1−unΣ)−1

n+ 1 + 1n

= ł( 1n+ 1 − ln(n+1)+lnnΣ)+ł(− 1

n+ 1 +1nΣ) = 1

n− ln ł(1 + 1

nΣ) > 0, que l’on obtient en posant x = 1

ndans ln(1 + x) 6 x.

B Soit n ∈ N∗. un − vn = 1n−−−−→n→∞

0.

En particulier, on obtient la convergence de la suite (un). On note γ sa limite. Ses premières déci-males sont γ ' 0, 57721566. Elle est appelée constante d’Euler. On a ainsi prouvé :

n∑k=1

1k

= ln(n) + γ + o(1) ♥

.

IV.3 Limites infinies

Les suites seront réelles.Définition IV.4

Soit (un)n∈N ∈ RN. on dit que (un)n∈N admet• +∞ pour limite, ou qu’elle tend vers +∞ lorsque

∀M ∈ R,∃n0 ∈ N,∀n ∈ N, n > n0 ⇒ xn >M .

• −∞ pour limite, ou qu’elle tend vers −∞ lorsque

∀M ∈ R,∃n0 ∈ N,∀n ∈ N, n > n0 ⇒ xn 6M .

Attention à la terminologie : Une telle suite admet une limite, mais elle est divergente dans R.

Proposition IV.5

Soient (un)n∈N et (vn)n∈N deux suites réelles.

1. Si un 6 vn APCR et un −−−−→n→∞

+∞, alors vn −−−−→n→∞

+∞.

2. Si un 6 vn APCR et vn −−−−→n→∞

−∞, alors vn −−−−→n→∞

−∞.

3. Si

un −−−−→

n→∞+∞, et

(vn)n∈N est minoréealors un + vn −−−−→

n→∞+∞.

4. Si

un −−−−→

n→∞−∞, et

(vn)n∈N est majoréealors un + vn −−−−→

n→∞−∞.

5. Supposons que un −−−−→n→∞

+∞ et un −−−−→n→∞

` ∈ R. Alors,

(a) Si ` > 0, un × vn −−−−→n→∞

+∞.

(b) Si ` < 0, un × vn −−−−→n→∞

−∞.

(c) Si ` = +∞, un × vn −−−−→n→∞

+∞.

(d) Si ` = −∞, un × vn −−−−→n→∞

−∞

43

6. Supposons que (un)n∈N ne s’annule pas et qu’elle tende vers ` ∈ R.

(a) Si ` 6= 0, 1un−−−−→n→∞

1`

.

(b) Si ` = 0, et un > 0 ∀n ∈ N, alors1un−−−−→n→∞

+∞.

(c) Si ` = 0, et un < 0 ∀n ∈ N, alors1un−−−−→n→∞

−∞.

Démonstration : 1. Soit M ∈ R. ∃n0 ∈ N tel que n > n0 ⇒ un >M , donc vn >M .

2. On applique ce qui précède en remarquant que −vn 6 −un et que −vn −−−−→n→∞

+∞.

3. Si m est un minorant de (vn)n∈N, alors la suite (un+vn)n∈N est minorée par la suite (vn+m)n∈Nqui tend vers +∞. On applique alors le 1.

4. Sous ces hypothèses,

−un −−−−→

n→∞+∞, et

(−vn)n∈N est minoréeet on peut aplliquer à nouveau le 3.

V Suppléments

V.1 Suites récurrentes Linéaires d’ordre 2

Soient a et b ∈ K, b non nul, et (un)n∈N une suite de KN. Notons

E =

(un)n∈N ∈ KN telles que ∀n ∈ N, un+2 = aun+1 + bun,

On appelle équation caractéristique de cette équation :

r2 − ar − b = 0, (Ec)et ∆ = a2 + 4b son discriminant.

Commençons par un théorème de structure sur l’ensemble des solutions qui s’avèrera capital dèsque l’on abordera l’algèbre linéaire :

Proposition V.1 (Structure de E )

1. La suite nulle est dans E .

2. Quelque soient (un) et (vn) ∈ E , et quelque soient A,B ∈ K,

(Aun +Bvn)n∈N ∈ E .

Théorème V.2

Deux cas se présentent :• Si ∆ 6= 0, (Ec) possède deux solutions r1 et r2. Alors

(un)n∈N ∈ E ⇐⇒ ∃A,B ∈ C,∀n ∈ N, un = Arn1 +Brn2 .

• Si ∆ = 0, (Ec) possède une solution double r0. Alors

(un)n∈N ∈ E ⇐⇒ ∃A,B ∈ C,∀n ∈ N, un = (An+B)rn0

On détermine les constantes A et B grâce aux deux premières valeurs de la suite (un)n∈N.

Démonstration : Pour le sens ⇐, il n’y a aucun problème. Pour l’autre sens, on peut commencer parprouver que si (un) est une suite de E dont les deux premiers termes sont nuls, alors la suite −un) est

nulle, puis déterminer A et B tels que les deux premiers termes de la suites(un − Arn1 − Brn2

)n∈N

soient nuls.

44

V.2 Suites complexes

Ici, les suites sont à valeurs complexes.La définition de lim

n→+∞un = `, où ` ∈ C, est identique, si on lit les |.| comme des modules, et

non plus comme des valeurs absolues. D’un manière générale, tout marche, sauf les résultats oùl’on compare des suites (avec 6,>), et ceux où il est question de limites infinies. Explicitons :B Ont encore un sens :

1. La définition de la limite, son unicité. Convergente⇒ bornée.

2. Tout l’arithmétique des suites convergentes.

3. (un) est bornée ssi (|un|) est majorée devient une définition.

4. Tous les résultats sur les suites extraites.

5. Tout sur les o,O,∼.

B N’ont plus de sens :

1. Les notions de suites minorées, ou majorées.

2. Tout le chapitre “Limites et relations d’ordre”.

3. La monotonie, et le lien avec la convergence.

4. Les suites adjacentes.

5. Les limites infinies

Néanmoins, on peut ramener l’étude d’une suite à celles de ses deux suites Re (un) et Im (un),qui sont elles réelles :

Proposition V.3

Soit (zn)n∈N et ` ∈ C. Alors

zn −−−−→n→∞

`⇐⇒

Re zn −−−−→n→∞

Re `,

Im zn −−−−→n→∞

Im `.

Soient a et x deux réels. Calculons la limite lorsque n tend vers +∞ de ł(n∑k=0

eak sin(kx)Σ)n∈N.

VI Comparaison Séries/Intégrales

Cas des séries de Riemann

VII Les moyennes de Cesaro

45

Chapitre 6

Limites et continuité de fonctions

Les fonctions seront toutes définies sur un intervalle I. Nous noterons F (I,R) ou RI , l’ensembledes fonctions de I dans R. Il possède les deux structures suivantes :• (F (I,R),+, .) est un R−espace vectoriel ;• (F (I,R),+,×) est un anneau.Si f : I → R, on appelle courbe représentative de f l’ensemble des points d’un plan euclidien

orienté muni d’un repère orthonormé direct (O,~i,~j) défini par

(Cf ) =(x, f(x)

), x parcourt I

Commençons par introduire une notion qui nous simplifiera beaucoup les énoncés qui suivront.

Définition .1 (Voisinages)

Soit a ∈ R. Un ensemble Ω ⊂ R est un voisinage de a lorsque :• si a ∈ R, il existe ε > 0 tel que ]a− ε, a+ ε[⊂ Ω,• si a = +∞, il existe M ∈ R tel que ]M,+∞[⊂ Ω,• si a = −∞, il existe M ∈ R tel que ]−∞,M [⊂ Ω.

On dit d’un prédicat P(x) portant sur un réel x qui appartient lui à un ensemble I ⊂ R, qu’ilest vrai au voisinage de a lorsqu’il existe un voisinage V (a) de a sur lequel il l’est, i.e

∃ un voisinage V de a tel que ∀x ∈ I ∩ V ,P(x) est vrai.(f : I → R est majorée par π sur un voisinage de +∞

)signifie :

∃M ∈ R, ∀x ∈ I, Si x >M, alors f(x) 6 π.

Définition .2 (I)

Soit I un intervalle de R. Nous noterons I la partie de R constituée de tous les éléments de I etles bornes, éventuellement infinies, de I.

Par exemple, ]0, 1] = [0, 1], ]0,+∞[ = [0,+∞].

I Définitions de Base

On rappelle que• f : I → C est la fonction nulle ssi ∀x ∈ [a, b], f(x) = 0.• Deux fonctions f et g définies sur I sont égales ssi pour tout x dans I, f(x) = g(x).• Soit f : I → K et Ω ⊂ I. On appelle restriction de f à Ω et on note f|Ω la fonctionx ∈ Ω 7→ f(x) ∈ K.

46

I.1 Relations d’ordreDéfinition I.1

On dit que f est> majorée si f(x), x ∈ I est un ensemble majoré, i.e si supI f < +∞.> minorée si f(x), x ∈ I est un ensemble minoré, i.e si infI f > −∞.> bornée lorsqu’elle est majorée et minorée, i.e lorsque |f | est majorée.

Enfin si m ∈ R,B le prédicat

(∀x ∈ I, f(x) 6 m

)se notera f 6 m,

B et le prédicat(∀x ∈ I, f(x) 6 g(x)

)se notera f 6 g.

Définition I.2

Soient f, g ∈ RI . On note :> |f | la fonction

(x ∈ I 7→ |f(x)|

).

> sup(f, g) la fonction(x ∈ I 7→ maxf(x), g(x)

).

> supI f :=

supf(x), x ∈ I si cet ensemble est majoré,+∞ sinon.

.

> infI f :=

inff(x), x ∈ I si cet ensemble est minoré,−∞ sinon.

.

I.2 Les lois

Rappelons les définitions des composées de fonction à l’aide des lois sur C :Soient f, g : I → K. On définit :• la somme de f et g :

(f + g) : x ∈ I 7→ f(x) + g(x) ∈ K.

• le produit de f et g :(f × g) : x ∈ I 7→ f(x)× g(x) ∈ K.

• l’inverse de f , si f ne s’annule pas :

1f

: x ∈ I 7→ 1f(x) ∈ K.

Beaucoup plus subtil est la définition de la composée :

Définition I.3

Soient I, J ⊂ R. Soient deux fonctions f : I → R et g : J → K. Si f(I) ⊂ J , on définit lacomposée de f et g comme la fonction

g f I −→ Kx 7−→ g

(f(x)

) .A toutes fins utiles, on se souviendra que cette loi n’est pas commutuative, i.e que bien souvent,

f g 6= g f .

I.3 MonotonieDéfinition I.4

Soit f : I → R. f est dite> croissante lorsque ∀x, y ∈ I, (x < y) =⇒ f(x) 6 f(y).> décroissante lorsque ∀x, y ∈ I, (x < y) =⇒ f(x) > f(y).> monotone lorsqu’elle est croissante ou décroissante.

47

> strictement croissante lorsque ∀x, y ∈ I, (x < y) =⇒ f(x) < f(y).> strictement décroissante lorsque ∀x, y ∈ I, (x < y) =⇒ f(x) > f(y).> strictement monotone lorsqu’elle est strictement croissante ou strictement décroissante.

Remarques :

B Si f et g sont définies sur I à valeurs réelles et toute deux croissantes, alors leur sommeest croissante, et il suffit que l’une d’entre elles le soit strictement pour que f + g lesoit strictement aussi.

B Si f, g : I → R sont positives et croissantes, alors f × g est croissante.B Soit f ∈ RI et g ∈ RJ où g(J) ⊂ I (condition nécessaire et suffisante pour que f g

existe), alors f g est croissante si f et g sont toutes les deux décroissantes ou toutesles deux croissantes, et f g est décroissante si l’une d’entre elles est croissante etl’autre décroissante.

Proposition I.5

Une fonction strictement monotone est injective.

Démonstration : Quite à considérer −f , nous pouvons supposer que f est strictement croissante. Soientf : I → R et x, y ∈ I deux réels distincts. Si x < y, alors f(x) < f(y) et donc f(x) 6= f(y). Puisque xet y sont deux variables muettes qui jouent un rôle symétrique dans l’énoncé, nous avons en fait traitétous les cas.

I.4 Parité et pérodicité

Un ensemble Ω ⊂ R est dit symétrique lorsque ∀x ∈ Ω,−x ∈ Ω.Définition I.6

Soit I un intervalle symétrique. Une fonction f : I → C est dite paire si ∀x ∈ I, f(x) = f(−x)et impaire si ∀x ∈ I, f(−x) = −f(x).

Définition I.7

Soit f : R→ K, et soit T ∈ R∗. La fonction f est dite T−périodique (ou périodique de périodeT ) si ∀x ∈ R, f(x+ T ) = f(x). T est alors une période de f .

Une fonction est dite périodique s’il existe T ∈ R∗ tel que f est T−périodique.

Remarques :

B Toute fonction impaire s’annule en x = 0.B Toute fonction de R dans C est la somme d’une fonction paire et d’une fonction impaire :

∀x ∈ I, f(x) =f(x) + f(−x)

2+f(x)− f(−x)

2♥

On remarque en effet que x 7→ f(x)+f(−x)2 est paire alors que x 7→ f(x)−f(−x)

2 est impaire.On les appelle respectivement composantes paires et impaires de f . Tiens, quelles sont-elles pour f : x ∈R 7→ exp(ix) ∈ C ?

B x 7→ x− E(x) est 1−périodique, et x 7→ cos (ωx) est2πω−périodique.

B Si T est une période de f , alors nT en est aussi une pour tout n ∈ Z.B Il existe des fonctions non constantes qui admettent pour période tout T ∈ Q (cf TD).B Une somme de deux fonctions périodiques n’est pas forcément périodique (cf TD).

48

I.5 Fonctions Lipschitziennes

Soit f : I → R et x 6= y ∈ I.

On appelle taux d’accroissement de f entre x et y le réel Tx(y) = f(y)− f(x)y − x

.

Remarques :

B Le taux d’accroissement est symétrique, i.e Tx(y) = Ty(x).B Géométriquement, c’est la pente du segment qui relie les deux points de (Cf ) d’abs-

cisses x et y.B Ainsi, on peut lire certaines informations essentielles sur f en regardant l’ensemble de

ses taux d’accroissement Ω = łf(y)− f(x)y − x

, où x, y ∈ I, x 6= yΣ. Par exemple,

1. f est injective⇔ 0 /∈ Ω,

2. f est croissante⇔ Ω ⊂ [0,+∞[.3. f est strictement décroissante⇔ Ω ⊂]−∞, 0[.

Voici une première classe de fonctions qui présentent des régularités ( ce qui signife que cesfonctions ne varient pas trop vite) : celles dont les taux d’accroissements sont bornés.

Définition I.8

Soit k > 0. Soit f ∈ F (I,R). f est dite k−Lipschitzienne lorsque

∀x, y ∈ I,∣∣f(x)− f(y)

∣∣ 6 k∣∣x− y∣∣.f est dite Lipschitzienne quand il existe un réel k > 0 pour lequel f est k−Lipschitzienne.

1. La fonction sin est 1−Lipschitzienne sur R.

Démonstration : Pour tous x, y ∈ R,| sin x−sin y| = 2ł| cos x+ y

2 sin x− y2Σ| 6 2ł| sin x− y2

Σ| pour une raison que je ne vous ferai pas l’affront

de rappeler. Utilisons l’inégalité, que je vous incite à prouver ∀a ∈ R, | sin a| 6 |a| :| sin x− sin y| 6 2ł|x− y2

Σ| = ł|x− yΣ|.

2. La fonction g : x ∈ R+ 7→ x2 n’est pas Lipschitzienne. En revanche, sa restriction à [0, 1] est2−Lipschitzienne.

Démonstration : ∀x 6= 0, T0(x) = ł|g(x)− g(0)x− 0

Σ| = ł|xΣ| qui n’est pas majorée sur R.

3. La fonction h : x ∈ [0, 1] 7→√x n’est pas Lipschitzienne.

Démonstration : ∀x ∈]0, 1], T0(x) = ł|h(x)− h(0)x− 0

Σ| = 1√x

qui n’est pas majorée sur ]0, 1].

II Limites

II.1 Définitions de limites

Elles ont été formalisées par Bolzano(1817) et Weierstrass(1874)

Définition II.1 (limites finies)

Soit f : I → K. Soit a ∈ I, et b ∈ R.

49

• Si a ∈ R, on dira que f(x) −−−→x→a

b lorsque

∀ε > 0,∃α > 0,∀x ∈ I,(|x− a| < α⇒ |f(x)− b| < ε

)• On dira que f(x) −−−−−→

x→+∞b lorsque

∀ε > 0,∃M ∈ R,∀x ∈ I,(x >M ⇒ |f(x)− b| < ε

).

• On dira que f(x) −−−−−→x→−∞

b lorsque

∀ε > 0,∃M ∈ R,∀x ∈ I,(x 6M ⇒ |f(x)− b| < ε

).

Définition II.2 (Limite +∞)

Soit f : I → R. Soit a ∈ I.• Si a ∈ R, on dira que f(x) −−−→

x→a+∞ lorsque

∀A ∈ R,∃α > 0,∀x ∈ I,(|x− a| < α⇒ f(x) > A

)• On dira que f(x) −−−−−→

x→+∞+∞ lorsque

∀A ∈ R,∃M ∈ R,∀x ∈ I,(x >M ⇒ f(x) > A

).

• On dira que f(x) −−−−−→x→−∞

+∞ lorsque

∀A ∈ R,∃M ∈ R,∀x ∈ I,(x 6M ⇒ f(x) > A

).

Définition II.3 (Limite −∞)

Soit f : I → R. Soit a ∈ I.• Si a ∈ R, on dira que f(x) −−−→

x→a−∞ lorsque

∀A ∈ R,∃α > 0,∀x ∈ I,(|x− a| < α⇒ f(x) 6 A

)• On dira que f(x) −−−−−→

x→+∞−∞ lorsque

∀A ∈ R,∃M ∈ R,∀x ∈ I,(x >M ⇒ f(x) 6 A

).

• On dira que f(x) −−−−−→x→−∞

−∞ lorsque

∀A ∈ R,∃M ∈ R,∀x ∈ I,(x 6M ⇒ f(x) 6 A

).

Ce qui ne fait pas moins de 9 définitions de limites, que l’on peut condenser en une seule :

Définition II.4

Soit f : I → R, a ∈ I et b ∈ R. On dira que f(x) −−−→x→a

b lorsque pour tout voisinage B de b, il

existe une voisinage A de a tel que ∀x ∈ I,(x ∈ A =⇒ f(x) ∈ B

).

Proposition II.5 (Unicité de la limite)

Soit f : I → K. Soit a ∈ I, et b, c ∈ R.Si f(x) −−−→

x→ab et f(x) −−−→

x→ac, alors b = c.

50

Ce qui nous permet à nouveau de parler de LA limite de f en a, dés lors que nous avons prouvé sonexistence, et de noter indifféremment

f(x) −−−→x→a

b⇐⇒ f −→ab⇐⇒ lim

x→af(x) = b⇐⇒ lim

af = b

II.2 Limites à droite et à gauche

Définition II.6 (Limites à gauche et à droite)

Soit f : I → K, a ∈ I et ` ∈ R. On dira que• On dira que f(x) −−−−→

x→a+`, ou que f admet ` pour limite à droite de a lorsque sa restriction

à droite f|I∩]a,+∞[ admet ` pour limite en a. Nous noterons alors lima+ f cette limite.• On dira que f(x) −−−−→

x→a−`, ou que f admet ` pour limite à gauche de a lorsque sa res-

triction à gauche f|I∩]−∞,a[ admet ` pour limite en a. Nous noterons alors lima− f cettelimite.

Evidemment, si f admet une limite en a, elle admet une limite à gauche et une limite à droite ( siceci a un sens), et ces trois limites coincident.

II.3 Caractérisation séquentielle des limites

Il faut comprendre le théorème suivant comme l’analogue fonctionnel du théorème qui affirmequ’une suite tend vers une limite ` ∈ R ssi toutes ses suites extraites tendent vers `.

Théorème II.7

Soit f : I → R, a ∈ I et ` ∈ R. Alors,

f(x) −−−→x→a

`⇐⇒ ∀(un)n∈N ∈ IN,(

lim un = a⇒ lim f(un) = b).

En particulier, il nous permettra de prouver qu’une fonction n’admet pas delimite en a. Par exemple,la fonction sin n’admet pas de limite en +∞ car les deux suites (un)n∈N = (nπ)n∈N et (vn)n∈N =(2nπ+π

2 )n∈N tendent vers +∞mais leurs suites images(f(nπ)n∈N

)et(f(2nπ+π/2)n∈N

)convergent

vers deux limites distinctes.

III Arithmétique des limites

f, g, ... sont des fonctions définies sur un même intervalle I de R. Dans tout ce qui suit, a seraun élément de R appartenant à I ou bien une de ses bornes.

III.1 Comparaisons

Tous les résultats ci-dessous ont leurs analogues au royaume des suites, que nous avons déjàprouvés. Les démonstrations sont identiques.

Proposition III.1

Soit ` ∈ R. On suppose f(x) −−−→x→a

`.

1. Pour tout m < `, il existe un voisinage de a sur lequel f > m.

2. Pour tout M > `, il existe un voisinage de a sur lequel f 6M .

Corollaire III.2

Si f possède une limite finie en a, alors f est bornée au voisinage de a.

Théorème III.3 (Passage à la limite des inégalités larges)

Soient f et g deux fonctions qui admettent en a des limites dans R.Si f 6 g au voisinage de a, alors lim

x→af(x) 6 lim

x→ag(x).

51

Théorème III.4 (dit d’encadrement)

Soient f, g, h : I → R et ` ∈ R.

Si

f(x) −−−→

x→a`

h(x) −−−→x→a

`et f 6 g 6 h au voisinage de a, alors g(x) −−−→

x→a`.

Proposition III.5

1. Soient f, g telles que f(x) −−−→x→a

+∞ et f 6 g au voisinage de a. Alors g(x) −−−→x→a

+∞.

2. Soient f, g telles que f(x) −−−→x→a

−∞ et f > g au voisinage de a. Alors g(x) −−−→x→a

−∞.

III.2 Opérations

Proposition III.6 (Limite d’une somme)

1. Soient m, ` ∈ R. Si

f(x) −−−→

x→a`

h(x) −−−→x→a

malors f(x) + h(x) −−−→

x→a`+m.

2. Si

f(x) est minorée au voisinage de a

h(x) −−−→x→a

+∞ alors f(x) + h(x) −−−→x→a

+∞.

Proposition III.7 (Limite d’un produit)

1. Si f(x) −−−→x→a

0 et si g est bornée au voisinage de a, alors f(x)g(x) −−−→x→a

0.

2. Soient `,m ∈ R. Si

f(x) −−−→

x→a`

g(x) −−−→x→a

m, alors f(x)g(x) −−−→

x→a`m.

3. Si f(x) −−−→x→a

+∞ et si g est minorée au voisinage de a par une constante strictement

positive, alors f(x)g(x) −−−→x→a

+∞.

Proposition III.8 (Limite d’une inverse)

1. Si f(x) −−−→x→a

`, où ` ∈ R∗, alors1

f(x) −−−→x→a

1`

.

2. Si f(x) −−−→x→a

±∞, alors1

f(x) −−−→x→a0.

3. Si f(x) −−−→x→a

0 et si f > 0 au voisinage de a, alors1

f(x) −−−→x→a+∞.

III.3 Composition

Dans ce paragraphe, J désigne un autre intervalle non trivial de R.

Théorème III.9 (Composition des limites)

Soient f ∈ F (I,R) et g ∈ F (J,R). On suppose que f(I) ⊂ J , de sorte que la compositiong f ait un sens.

Soient a ∈ I , b ∈ J et ` ∈ R. Si

f(x) −−−→

x→ab

g(x) −−−→x→b

`alors g f(x) −−−→

x→a`.

52

III.4 Limites et monotonieProposition III.10

Soit f : I → R une fonction croissante. Alors

1. pour tout a ∈ I , limx→a+

f(x) et limx→a−

f(x) existent dans R.

2. Si a n’est pas une borne de I, alors ces deux limites sont finies.

3. Si a est la borne droite de I, alors limx→a−

f(x) est finie si et seulement si f est majorée sur

I.

IV La continuité du point de vue local

IV.1 ContinuitéDéfinition IV.1 (Continuité en un point)

Soit f : I → K et a ∈ I. On dit que f est continue en a (que l’on note C 0) lorsque la restrictionde f à I \ a admet une limite en a et que celle-ci est égale à f(a). Si a n’est pas une borne deI, alors cci est équivalent à

lima+

f et lima−

f existent et sont égales à f(a).

Définition IV.2 (Continuité à gauche et à droite)

Soit f : I → K et a ∈ I.• On dit que f est continue à droite de a lorsque f|I∩[a,+∞[ est continue en a, ou autrement

dit lorsque lima+

f existe et que lima+

f = f(a).• On dit que f est continue à gauche de a lorsque f|I∩]−∞,a] est continue en a.f est continue en a ssi elle est continue à droite et à gauche de a.

Nous en déduisons une caractérisation séquentielle de la continuité :

Proposition IV.3

Soit f : I → K une fonction continue sur I. Pour toute suite convergente (un)n∈N d’éléments deI dont la limite est dans I, on a

limn→+∞

f(un) = f(

limn→+∞

un

).

Les théorèmes sur l’arithmétique des limites induisent le résultat suivant :

Proposition IV.4 (Opérations et continuité)

Soient f, g : I → K deux fonctions continues en a. Alors les fonctions f + g, λf, (pour tout

λ ∈ K), fg et si g(a) 6= 0,1g,f

gle sont aussi.

Corollaire IV.5 (Continuité d’un composée)

On reprend les hypothèses et les notations du théorème III.9, et on suppose que a ∈ I. Alors sif est continue en a et si g est continue en f(a), alors g f est continue en a.

Ces théorèmes permettent d’obtenir la continuité de larges classes de fonctions sans trop d’ef-forts. Donnons quelques exemples :

1. Tous les polynomes sont des fonctions continues sur R.

2. Toute fraction rationnelle est continue en tout x0 réel qui n’annule pas son dénominateur.

53

V La continuité d’un point de vue global

V.1 Image continue d’un intervalle

Proposition V.1 (de Cauchy)

Soit I un intervalle est f : I → R une fonction continue. Alors pour tous a < b ∈ I, si f(a) <f(b), il existe c ∈]a, b[ tel que f(c) = 0.

1. Contre-exemples lorsque l’on enlève une hypothèse.

2. Montrer que toute fonction f : [0, 1]→ [0, 1] continue admet un point fixe.

Théorème V.2 (des valeurs intermédiaires)

Soit f : I → R, où I est un intervalle. Supposons f continue. Alors pour tous ab ∈ I et pour toutλ ∈]f(a), f(b)[,∃c ∈]a, b[ tel que f(c) = λ.

Montrer que si f : [a, b] → R est continue et injective, alors elle est strictement monotone (onpourra tenter une contraposée).

Théorème V.3 (des valeurs intermédiaires (V2))

Si I est un intervalle et f : I → R est une fonction continue, alors f(I) est une intervalle.

V.2 Image continue d’un segment

Théorème V.4

Soit f : [a, b]→ R une fonction continue. Alors ∃α, β ∈ [a, b] tels que

∀x ∈ [a, b], f(α 6 f(x) 6 f(β).

Ce qui signifie qu’une fonction continue sur un segment est bornée et atteint ses bornes.

Corollaire V.5

L’image continue d’un segment est un segment.

VI Florilège

VI.1 un+1 = f(un)

VI.2 Prolongement par continuité

VI.3 Fonctions à valeurs complexes

VI.4 Dichotomie

54

Chapitre 7

Calcul Différentiel à une variableréelle

Motivation historique : L’idée originelle du calcul différentiel est essentiellement de deux ordres qu’il estintéressant de garder à l’esprit : géométrique d’une part et cinématique de l’autre. Notons quelques applicationshistoriques :B Calcul de l’angle d’intersection de deux courbes (Descartes),B Construction de lunettes astronomiques (Galilée) et d’horloges (Huygens 1673),B Recherche des extrema d’une fonction (Fermat 1638),B Calcul de la vitesse et de l’accélération d’un mouvement (Galilée 1638, Newton 1686).Les fonctions seront toutes définies sur un intervalle I et à valeurs indifféremment dans R ou C

lorsque ce n’est pas précisé. On reprendra les notations du cours précédent.

I La dérivation

I.1 Définition

Soit f une fonction à valeurs réelles ou complexes définie sur un intervalle I et a ∈ I. On formele quotient

Ta : x ∈ I \ a 7→ f(x)− f(a)x− a

, (7.1)

taux d’accroissements de f entre les points a et x, dont nous avons déjà parlé dans le cours précé-dent.Définition I.1 (Dérivée)

Soit f : I → R ou C et a ∈ I. On dit que f est dérivable en a lorsque Ta admet une limite finieen a. On pose alors

f ′(a) := limx→a

Ta(x), (7.2)

On peut alors associer à toute fonction f une fonction f ′ = d

dxf dont le domaine est l’ensemble

des points x où la limite réelle (7.2) est finie. Si f ′ est définie en tout point d’un ensemble Ω ⊂ [a, b],on dit que f est dérivable sur Ω.Si on considère dans (7.2), la limite à droite ou à gauche, on a alors la notion de dérivée à droiteou à gauche.

55

Remarques :

B Sont dérivables sur R :– Les fonctions constantes : leurs dérivées sont nulles puisqu’en tous points x, Tx(t) =

0.– Les fonctions affines x 7→ ax + b : leurs dérivées sont x 7→ a car d’après la formule

de Bernoulli Tx(t) = a.– pour tout entier naturel n, la fonction x 7→ xn. Sa dérivée est x 7→ nxn−1 car

tn − xn

t− x=n−1∑k=0

tkxn−1−k.

B Deux Interprétations :• Cinématique : Si f(t) est la mesure algébrique de la position d’un mobile au tempst sur une droite (ou un plan quand f est à valeurs dans C), alors f ′(t) est pardéfinition son vecteur-vitesse instantané et |f ′(t)| sa vitesse instantanée.

• Géométrique : Si f est dérivable en a, on dit que sa courbe représentative admetune tangente au point d’abscisse a, celle-ci étant la droite d’équation y = f ′(a)(x−a) + f(a).Si elle n’est pas dérivable mais que Ta(x) −−−→

x→a+∞ ou −∞, alors Cf admet une

tangente verticale en a d’équation x = a.B Mise en garde : Si une fonction est dérivable en a, elle est donc dérivable à gauche et

à droite de a. La réciproque est fausse : x 7→ |a| est dérivable à droite et à gauche de0, mais n’est pas dérivable en 0.

Voici une formulation dont l’évidence de la preuve me dispense de sa rédaction :

Proposition I.2 ( Dérivabilité et existence d’un DL à l’ordre 1)

Soit f une fonction continue en a.f est dérivable en a si et seulement si il existe un réel A tel que

f(x) = f(a) + (x− a)A+ o(x− a) quand x→ a.

Le réel A est alors f ′(a).

La dérivabilité d’un fonction est une propriété à classer dans celles qui mesurent la régularitédes fonctions, au même tittre que la continuité, le caractère Lipschitzien. Comparons ces notions :

Proposition I.3 (Dérivabilité, Continuité et Caractère Lipschitzien)

Soit f est une fonction définie sur un intervalle I.

1. Soit a ∈ I. Si f est dérivable en a, alors f est continue en a.

2. Si f est dérivable sur I et k−Lipschitzienne 1, alors |f ′| 6 k.

Démonstration : 1. Quand t→ x, on a d’après le théorème sur les produits de limites,

f(t)− f(x) = f(t)− f(x)t− x .(t− x)→ f ′(x).0 = 0.

La réciproque de ce théorème est fausse : la fonction valeur absolue est continue en 0, mais n’yest pas dérivable. Il existe même des fonctions continues sur toute la droite réelle mais dérivableen aucun point.

2. Pour tout x 6= a ∈ I, les taux d’accroissement Ta(x) sont majorés par k, donc leurs limites aussi,puisque les inégalités larges passent à la limite.

56

I.2 L’algèbre des fonctions dérivables

La proposition suivante, souvent appelée théorèmes généraux, permet de prouver à peu de fraisla dérivabilité sur de grands intervalles des fonctions que nous verrons cette année.

Proposition I.4

Soit I un intervalle et f et g deux fonctions définies sur I et dérivables en x ∈ I, alors f+µg, f×gsont dérivables en x, de même que f/g si g ne s’annule pas sur I. De plus,

1. (λf + µg)′(x) = λf ′(x) + µg′(x), pour tous scalaires λ, µ ;

2. (f × g)′(x) = f ′(x)g(x) + f(x)g′(x);

3.(f

g

)′(x) = f ′(x)g(x)− f(x)g′(x)

g2(x) .

Démonstration : Le premier point est évident. Pour le deuxième, posons h = fg. Alors,

h(t)− h(x)t− x) = f(t)

[g(t)− g(x)t− x)

]+ g(x)

[f(t)− f(x)

t− x

].

Si nous faisons tendre t vers x, nous obtenons le deuxième point en remarquant que f(t) tend versf(x).Posons enfin h = f/g. Alors :

h(t)− h(x)t− x) = 1

g(t)g(x)

[g(x)f(t)− f(x)

t− x − f(x)g(t)− g(x)t− x)

].

On obtient le résultat voulu.

On en déduit en particulier la dérivabilité des polynômes sur R, ainsi que celle des fractionsrationnelles sur leur ensemble de définition.

Le théorème suivant concerne la dérivation des fonctions composées ; c’est probablement l’undes plus importants théorèmes de dérivation. Nous ne fournissons aucun exemple, car nous lesavons abondamment illustrés dans notre cours sur les fonctions usuelles.Théorème I.5 (Dérivée d’une composée)

Soit f une fonction continue sur [a, b], dérivable en un point x0 ∈ [a, b] et g définie sur unintervalle I contenant l’image de f , dérivable en f(x0). Si on pose

h(t) = g(f(t)), (a 6 t 6 b)

alors h est dérivable en x0 eth′(x0) = g′

(f(x0)

)f ′(x0).

Démonstration : Soit y0 = f(x0). Par définition de la dérivée nous avons l’existence de deux fonctions ε1et ε2 qui tendent vers 0 respectivement en x0 et en y0 et telles que

f(x)− f(x0) = (x− x0)(f ′(x0) + ε1(x)

),

g(y)− g(x0) = (y − y0)(g′(y0) + ε1(y)

),

où x ∈ [a, b], y ∈ I. Si on pose y = f(x), nous obtenons :

h(x)− h(x0) = g(f(x)

)− g(f(x0)

)=

[f(x)− f(x0)

][g′(y0) + ε1(y)

], d’après (7.3)

= (x− x0)(f ′(x0) + ε1(x)

)[g′(y0) + ε1(y)

], d’après (7.3).

Il n’y a plus alors qu’à diviser par x− x0 et à faire tendre cette quantité vers 0.

Théorème I.6 (Dérivabilité de f−1)

Soit I un intervalle, f : I → J une fonction dérivable et bijective. Si f ′(x0) 6= 0, alors f−1 est

dérivable en y0 = f(x0) et alors(f−1)′(y0) = 1

f ′ f−1(y0) .

57

Démonstration : La dérivabilité de f−1 sous cette hypothèse est admise. Puisque f f−1(x) = x pourtout x ∈ J , que f−1 est dérivable en y0 et que f l’est en f−1(y0) = x0, nous obtenons en dérivant cetteexpression en y0 :

f ′(x0)×(f−1)′(y0) = 1, soit

(f−1)′(y0) = 1

f ′ f−1(y0) .

I.3 Classes C k, Dk, C∞

Nous allons monter d’un cran dans la régularité des fonctions, en définissant les dérivées suc-cessives :Définition I.7

On définit par récurrence les dérivées successives de f lorsqu’elles existent : f (0) = f et pour

tout k ∈ N, si f (k) est dérivable, on note f (k+1) = d

dxf (k).

Pour tout k ∈ N∗, f est dite

1. de classe Dk sur I si elle est k fois dérivable sur I,

2. de classe C k si elle est de classe Dk et si de plus sa dérivée k−ième est continue sur I,

3. de classe C∞ si elle est C k pour tout k ∈ N.

Les théorèmes généraux sont encore valables pour ces classes de fonctions :

Proposition I.8

Soit k ∈ N ∪ ∞.1. Si f, g ∈ C k(I,K), alors f + µg, f × g ∈ C k(I,K), de même que f/g si g ne s’annule pas

sur I.

2. Si f ∈ C k(I, J), g ∈ C k(J,K), alors g f ∈ C k(I,K).3. Si f : I → J est bijective, de classe C k et que sa dérivée ne s’annule pas sur I, alors f−1

est de classe C k sur J .

Démonstration : Pour le cas k = 1, il suffit de remarquer que f ′ et g′ étant continues, f ′ + µg′, f ′g +

fg′,f ′g − fg′

g2 , f ′×g′f et1

f ′ f−1 le sont, d’après les théorèmes généraux sur les fonctions continues.

Pour les k > 2, on récurre. Par exemple, montrons l’hérédité du 2 et du 3 :• Posons pour tout k ∈ N∗ :

P(k) :(∀f ∈ C k(I, J), ∀g ∈ C k(J,K), g f ∈ C k(I,K)

).

Soit k > 1 tel que P(k) est vérifié. Montrons que P(k) l’est. Soient f ∈ C k(I, J) et g ∈C k(J,K). Puisqu’elles sont au moins de classe C 1, leur composée l’est et (g f)′ = f ′ × g′ f .Or, f ′ et g′ sont de classe C k, donc g′ f est de classe C k d’après l’hypothèse de récurrence, etd’après le 1., (g f)′ = f ′ × g′ f est donc de classe C k, ce qui signifie exactement que g fest C k+1.

• Posons pour tout k ∈ N∗ :

R(k) :(∀f ∈ C k(I, J) bijective, si f ′ ne s’annule pas, alorsf−1 ∈ C k(J,R)

).

Soit k tel que R1(k) est vrai.

58

Remarques :

Retenons donc que si f : I → J est bijective :

1. f−1 est de classe C 0 sur J si f est de classe C 0 sur I.

2. Pour k > 1, f−1 est de classe C k sur J si f est de classe C k sur I et que f ′ nes’annule pas.

Les fonctions sin, cos, arctan, ch, ch,þ, , expa, loga sont C infty sur leurs ensembles de définition.

Théorème I.9 (Formule de Leibnitz)

Soitent n ∈ N∗, et f et g deux fonctions de classe C n sur I. Alors f × g est de classe C n et

dn

dxn(f × g) =

n∑k=0

(nk

)f (k) × g(n−k).

Démonstration : Une petite récurrence et ça tombe aussitôt.

Calculer la dérivée n−ième de x 7→ e−x sin x.

II Les accroissements finis

II.1 ExtremaDéfinition II.1

Soit f : I → R et a ∈ I. On dit que f admetB un maximum global en a lorsque ∀x ∈ I, f(x) 6 f(a) ;B un maximum local en a lorsque il existe ε > 0 tel que ∀x ∈ I, si |x − a| 6 ε, alorsf(x) 6 f(a).

B un minimum global en a lorsque ∀x ∈ I, f(x) > f(a) ;B un minimum local en a lorsque il existe ε > 0 tel que ∀x ∈ I, si |x − a| 6 ε, alorsf(x) > f(a).

Lemme 3

Soit f : [a, b] → R et c ∈]a, b[. Si f admet un extremum local en c et si elle est dérivable en c,alors f ′(c) = 0.

Démonstration : Quitte à c onsidérer −f , on peut spposer que l’extremum est un minimum. Le tauxd’accroissement Tc(x) est alors positif si x > c. Ainsi f ′(c) = lim

x→c+Tc(x) > 0.

De même, Tc(x) est négatif si x < c. Ainsi f ′(c) = limx→c−

Tc(x) 6 0.

II.2 Les accroissements finis

Les théorèmes suivants sont tous des conséquences du deuxième :

Théorème II.2 (de Rolle)

Soit f : [a, b]→ R une fonction. f ∈ C 0([a, b],R)f ∈ D1(]a, b[,R)f(a) = f(b)

=⇒ ∃c ∈]a, b[ tel que f ′(c) = 0.

59

Démonstration : En tant que fonction continue sur un segment, f y admet un maximum et un minimum.Si ce minimum ou ce mximum est atteint en c ∈]a, b[, le lemme 3 nous affirme que c est un pointcritique de f . Si enfin, le maximum et le minimum sont atteints au bord, i.e en a et en b, puisquef(a) = f(b), la fonction est constante, et sa dérivée est la fonction nulle.

1. Soit P : x ∈ R 7→ x4 + ax3 + bx2 + cx + d un polynçome à coefficients réels de degré 4 quiadmet quatre racines réelles distinctes r1 < r2 < r3 < r4. Montrer que son polynçome dérivéeadmet 3 racines réelles distinctes.

2. Soit f une fonction de classe C n sur un intervalle de R, et à valeurs dans R. Montrer que si fs’annule en n+ 1 points distincts de cet intervalle, alors f (n) s’annule en au moins un point.

Si on ne dispose plus de la dernière hypothèse, il reste :

Théorème II.3 (Egalité des accroissements finis)

Soit f : [a, b]→ R une fonction.f ∈ C 0([a, b],R)f ∈ D1(]a, b[,R) =⇒ ∃c ∈]a, b[ tel que f(b)− f(a) = f ′(c)(b− a).

Démonstration : Il suffit d’appliquer le théorème de Rolle à g : x ∈ [a, b] 7→ f(x) − p(x − a) ∈ R, où

p = f(b)− f(a)b− a , après avoir vérifié qu’elle prenait la même valeur aux points a et b. Ce théorème nous

fournit un point c ∈]a, b[ critique pour g, i.e un point où f ′(c) = p.

On en déduit une version moins précise (elle ne fournit pas par exemple le signe de f(a)−f(b)),mais bien souvent suffisante :Théorème II.4 (Inégalité des accroissements finis)

Soit f : [a, b]→ R une fonction. f ∈ C 0([a, b],R)f ∈ D1(]a, b[,R)∃M ∈ R,∀x ∈]a, b[, |f ′(x)| 6M

=⇒∣∣f(b)− f(a)

∣∣ 6M |b− a|.

Démonstration : Très simple, une fois l’égalité obtenue.

Montrer que pour tous 0 < a < b, arctan b− arctan a 6 b− a1 + a2 .

Théorème II.5 (Inégalité des accroissements finis (version fine)) f ∈ C 0([a, b],R)f ∈ D(]a, b[,R)∃m,M ∈ R,∀x ∈]a, b[,m 6 f ′(x) 6M

=⇒ m(b− a) 6 f(b)− f(a) 6M(b− a).

60

Remarques :

1. L’inégalité a en particulier comme conséquence qu’une fonction de classe C 1 sur unsegment est Lipschitzienne. Précisément, si k > l > 1 et si I = [a, b],

C∞(I,R) ⊂ C k(I,R) ⊂ C l(I,R) ⊂ C 1(I,R) ⊂ Lip(I,R) ⊂ C 0(I,R) .

On peut de plus intercaler Dk(I,R) entre C k et C k+1.

2. Si I n’est plus un segment, ces inclusions restent vraies si on ôte Lip(I,R).3. Cas des fonctions à valeurs complexes : Sur ces quatre résultats, seule subsiste

l’inégalité des accroissements finis version faible (la dernière n’a pas de sens), sif : I → C. Les valeurs absolues deviennent évidemment des modules. Vérifiez avecx ∈ [0, 2π] 7→ exp(ix) ∈ C que l’égalité n’est plus valable.

Théorème II.6 ( Dérivées et croissance )

Soit f ∈ D1(I,R) :• f est constante⇔ f ′(x) = 0 pour tout x ∈ I.• f est croissante⇔ f ′(x) > 0 pour tout x ∈ I.• f est strictement croissante si la fonction f ′ ne s’annule qu’en un nombre fini de points.

III Deux applications...

III.1 ... aux suites récurrentes

Soit f : I → I et (un)n la suite réelle définie par u0 ∈ I et un+1 = f(un) pour tout entier natureln.L’hypothèse de stabilité de I par f est nécessaire pour que (un) soit définie.

Les résultats essentiels sont les suivants :• Si f est continue et si (un) converge, alors sa limite ` est un point fixe de f , i.e elle vérifief(`) = `.

• Si f est croissante, alors (un) est monotone. Il suffit alors de regarder le signe de u1−u0 poursavoir si elle est croissante ou décroissante.

• Si f est décroissante, f f est croissante, et d’après ce qui précède les deux suites (u2n) et(u2n+1) sont monotones.

Dans la pratique, on commencera par chercher les points fixes de f , à étudier l’éventuelle monotonie de (un)(ou de ses sous-suites u2n et u2n+1), puis si nécessaire, à trouver un intervalle J ⊂ I stable par f pour lequelil existe n ∈ N tel que un ∈ J et qui aurait le bon goût soit d’être borné, soit d’être un intervalle où f estmonotone. Enfin, l’estimation de |un − `|, lorsque (un) tend vers ` s’obtient souvent avec l’inégalité des AF :|un+1 − `| = |f(un)− f(`)| 6M |un − `| si |f ′| 6M . Il suffit alors de récurrer si M < 1.

1. u0 ∈ R et un+1 = u2n + 1.

2. u0 = 1 et un+1 = eun − 1 converge si u0 < 0 et diverge sinon, mais est toujours croissante.

3. u0 > 0 et un+1 = un + 5un + 1 .

III.2 ...au théorème de prolongement C 1 :

Théorème III.1

Soit f ∈ C 1(]a, b],R). Si f est continue sur [a, b] de classe C 1 sur ]a, b], et si f ′ :]a, b]→ R admetune limite finie ` en a+, alors f est de classe C 1 sur [a, b] et f ′(a) = `.

Montrer que la fonction x 7→ x2 ln x définie sur ]0,+∞[ se prolonge par continuité en 0 et queson prolongement est C 1 ;

61

IV Les polynômes de Taylor

On fixe dans toute cette partie n un entier naturel, I un intervalle.Soit a ∈ I. On suppose que f est de classe C n sur I à valeurs réelles ou complexes.

Définition IV.1 (Polynômes de Taylor de f)

On appelle n−ième polynôme de Taylor de f en a, et on note Tn,a le polynôme :

Tn,a(x) = f(a) + f ′(a)(x− a) + . . .+ f (n)(a)n! (x− a)n.

Remarques :

1. Tn peut être défini comme le polynôme de degré n dont toutes les dérivées n−ièmesen a coïncident avec celles de a.

2. Il faut connaitre les polynômes de Taylor à l’ordre n en 0 des fonctions suivantes :

(a) exp : Tn(x) =n∑k=0

xk

k! .

(b) sin : Tn(x) =n∑k=0

xk

k! .

(c) cos : Tn(x) =n∑k=0

xk

k! .

(d) ch : Tn(x) =n∑k=0

xk

k! .

(e) sh : Tn(x) =n∑k=0

xk

k! .

(f) ln(1 + x) : Tn(x) =n∑k=0

xk

k! .

(g)1

1− x : Tn(x) =n∑k=0

xk

k! .

(h)1

1 + x: Tn(x) =

n∑k=0

xk

k! .

(i) (1 + x)α : Tn(x) =n∑k=0

xk

k! .

(j) arctan : Tn(x) =n∑k=0

xk

k! .

On pose, pour tout x ∈ I, Rn(x) = f(x) − Tn(x). La raison d’être de ces trois résultats est deconsidérer Tn comme une approximation de f . Pour s’assurer que c’est bien le cas, il s’agit d’éva-luer Rn et de pouvoir le quantifier. Ces trois théorèmes donnent trois estimations qualitativementdifférentes.

UNE MAJORATION GLOBALE : L’INÉGALITÉ DE TAYLOR-LAGRANGE

62

Théorème IV.2 (Taylor-Lagrange)

Si f ∈ C n+1(I,C), et si il existe M > 0 tel que ∀x ∈ I, |f (n+1)(x)| 6M , alors pour tout a, b ∈ I,

ł|f(b)−n∑k=0

f (k)(a)k! (b− a)kΣ| 6M |b− a|

n+1

(n+ 1)! .

Démonstration : Notons que cette preuve ne fonctionne que si f est à valeurs réelles.Il existe une constante k ∈ R telle que

g [a, b] −→ R

x 7−→ f(x)−n∑k=0

f (k)(a)k! (x− a)k −K(x− a)n+1

s’annule en b, car l’équation g(b) = 0 est du premier ordre en K. La valeur de K ne nous intéresse pas.De plus, pour tout j ∈ [[0, n]], g(j)(a) = 0. On prouve alors par récurrence sur j ∈ [[1, n+ 1]] le prédicat

P(j) :(g(j) s’annule au moins une fois sur ]a, b[

).

P(n+ 1) nous fournit donc un c ∈]a, b[ tel que g(n+1)(c) = 0, i.e f (n+1)(c) = K(n+ 1)!. Ainsi,

f(b) =n∑k=0

f (k)(a)k! (x− a)k + f (n+1)(c)(x− a)n+1

(n+ 1)! .

On en déduit que

ł|f(b)−n∑k=0

f (k)(a)k! (b− a)kΣ| 6 Mn+1|b− a|n+1

(n+ 1)! .

UNE EXPRESSION EXACTE :L’ÉGALITÉ DE TAYLOR AVEC RESTE INTÉGRAL

Théorème IV.3 (Taylor avec reste intégral)

Si f ∈ C n+1(I,C), alors pour tout x ∈ I,

f(x) =n∑k=0

f (k)(a)k! (x− a)k +

∫ x

a

(x− t)n

n! f (n+1)(t)dt.

Ce qui signifie donc que Rn(x) = f(x)− Tn(x) =∫ x

a

(x− t)n

n! f (n+1)(t)dt.

Démonstration : Faisons une récurence sur n ∈ N.Si n = 0, f est C 1 sur I, donc d’après le théorème fondamental du calcul différentiel,

f(x) = f(a) +∫ x

a

f ′(t)dt.

On voit que T0(x) = f(a) et l’intégrale est bien celle qui apparait dans l’énoncé pour n = 0.X

Supposons l’égalité vraie pour un entier n ∈ N, c’est-à-dire Rn(x) =∫ x

a

(x− t)n

n! f (n+1)(t)dt. Grâce à

une intégration par parties,

Rn(x) =[− (x− t)n+1

(n+ 1)! f (n+1)(t)]t=xt=a

+∫ x

a

(x− t)n+1

(n+ 1)! f (n+2)(t)dt

= (x− a)n+1

(n+ 1)! f (n+1)(a) +∫ x

a

(x− t)n+1

(n+ 1)! f (n+2)(t)dt.

Remplacer cette expression de Rn dans l’hypothèse de récurrence aboutit bien à l’égalité de Taylor avecreste intégral au rang n+ 1.X

63

UNE ESTIMATION LOCALE : LE THÉORÈME DE TAYLOR-YOUNG

Théorème IV.4 (Taylor-Young)

Si f ∈ C n(I,C)„ alors f admet un développement limité à l’ordre n en tout point a de I :

f(x) = Tn(x) + o((x− a)n

)quand x→ a.

Démonstration : Nous sommes dans les hypothèses de Taylor avec reste intégral, mais à l’ordre n − 1, sibien que l’on peut écrire :

f(x)− Tn(x) =∫ x

a

(x− t)n−1

(n− 1)! f (n)(t)dt− (x− a)n

n! fn(a)

=∫ x

a

(x− t)n−1

(n− 1)! f (n)(t)dt−∫ x

a

(x− t)n−1

(n− 1)! f (n)(a)dt

=∫ x

a

(x− t)n−1

(n− 1)!(f (n)(t)− f (n)(a)

)dt.

Soit ε > 0. Comme f (n) est continue en a, il existe un réel α > 0 tel que pour tout t ∈ I, si |t− a| < α,alors |f (n)(t)− f (n)(a)| 6 ε. Soit x ∈ I tel que |x− a| 6 ε. Pour tout t ∈ [a, x], |t− a| < α et donc

|f(x)− Tn(x)| 6∣∣∣∣∫ x

a

(x− t)n−1

(n− 1)!∣∣f (n)(t)− f (n)(a)

∣∣dt∣∣∣∣6

∣∣∣∣∫ x

a

(x− t)n−1

(n− 1)! dt

∣∣∣∣× ε6 ε× |x− a|

n

n! 6 ε|x− a|n.

En relisant ce qui est souligné et la conclusion, nous avons bien prouvé que

limx→a

f(x)− Tn(x)(x− a)n = 0.

64

Remarques :

sur les différences entre ces trois formules

1. Il y a deux distinctions essentielles à faire : TRI et T-L sont des formules globales,i.e qu’elles sont valables pour tous les réels x appartenant à un intervalle, alors queTaylor-Young est un résultat local, i.e qu’il ne donne une information sur f(x) quepour x tendant vers a. En outre, TRI nous donne une formule précise du reste alorsque Taylor-Lagrange n’en donne qu’une majoration.

2. Taylor-Young peut assurer l’existence d’un intervalle centré sur a sur lequel une pro-priété est vérifiée, mais ne nous dit rien sur la longueur de cet intervalle. L’énoncéen est en revanche plus simple et suffira à nous donner les DL des fonctions usuelles.Par exemple, pour tout n ∈ N,

ex =n∑k=0

xk

k! + o(xn) quand x→ 0.

3. Taylor-Lagrange permet, comme nous l’avons vu en cours, d’induire l’écriture desfonctions exp, sin, cos, ... comme somme d’une série (ce dont TY est incapable). Parexemple :

∀x ∈ C, ex = limn→+∞

n∑k=0

xk

k! .

4. Enfin, Taylor avec reste intégral est le plus puissant des trois (mais inutilementpuissant parfois, et sa formule est plus compliquée). Contrairement aux autres, ilpeut fournir des estimations sur le signe du reste, comme dans l’exemple suivant

Montrons

0 < x < π =⇒ x− x3

6 < sin x < x− x3

6 + x5

120 .

Il faut bien comprendre que Taylor-Young ne pourrait nous donner ces deux inégalités sur toutl’intervalle ]0, π[.

Démonstration : On reconnait respectivement à gauche et à droite les troisième et cinquième polynômesde Taylor de la fonction sin au point 0. Il s’agit donc de prouver que R3(x) > 0 et R5(x) < 0 pourπ > x > 0. Or, d’après Taylor avec reste intégral,

R3(x) =∫ x

0

(x− t)3

3! sin(4)(t)dt =∫ x

0

(x− t)3

3! sin(t)dt,

qui est strictement positif car c’est l’intégrale d’un fonction positive continue non nulle. De même,

R5(x) = −∫ x

0

(x− t)5

5! sin(t)dt < 0.

V Convexité

V.1Définition V.1

Soit f : I → R. f est dite convexe ssi

∀x, y ∈ I, ∀λ ∈ [0, 1], f(λx+ (1− λ)y) 6 λf(x) + (1− λ)f(y) .

65

Géométriquement, une fonction convexe est une fonction dont la courbe sur le segment [a, b] esten-dessous de la corde joignant les points d’abscisses a et b, et ce pour tout a < b dans I.

On peut généraliser :

Proposition V.2

f est convexe ssi

∀n ∈ N− 0, 1,∀x1, . . . xn ∈ I,∀t1, . . . , tn > 0,

n∑i=1

ti = 1 =⇒ f

(n∑i=1

tixi

)6

n∑i=1

tif(xi).

Démonstration : On effectue une récurrence sur n, le cas n = 2 étant la définition de la convexité.Supposons le résultat vrai pour un entier n > 2. Soient x1, . . . xn+1 ∈ I et t1, . . . , tn+1 > 0 dont la

somme vaut 1. Posons y =n∑i=1

ti1− tn+1

xi. Par hypothèse de récurrence, f(y) 6n∑i=1

ti1− tn+1

f(xi)

Alors

f

(n+1∑i=1

tixi

)= f

((1− tn+1)y + tn+1xn+1

)6 (1− tn+1)f(y) + tn+1f

(xn+1)

)6 (1− tn+1)

n∑i=1

ti1− tn+1

f(xi) + tn+1f(xn+1) =n+1∑i=1

tif(xi).

On n’utilisera la plupart du temps que la version faible suivante, où les coefficients ti sont égaux :

Corollaire V.3

Si f est convexe, alors ∀n > 2,∀x1, . . . xn ∈ I, f

(1n

n∑i=1

xi

)6

n∑i=1

1nf(xi).

V.2 Convexité et fonction dérivéeLemme 4

Soit f : I → R une fonction convexe. Soit a ∈ I. Alors

f est convexe ⇐⇒ Ta : x ∈ I \ a 7→ f(x)− f(a)x− a

est croissante.

Démonstration :

Corollaire V.4 (Convexité et régularité)

Si f : I −→ R est convexe, alors en tout point de I autre que ses bornes, f est continue et admetune dérivée à droite et à gauche.

Démonstration : Soit a un point de I autre que ses bornes. Rappelons que Ta, en tant que fonctioncroissante sur I, admet en a une limite finie à gauche et à droite, si bien que f ets dérivable à gaucheet à droite de a. De plus, f(x)− f(a) = Ta(x)× (x− a) tend vers 0 quand x tend vers a. La continuitéen a est donc prouvée.

Corollaire V.5 (Monotonie de la dérivée)

Soit f : I −→ R.

1. Si f ∈ D1(I,R), alors elle est convexe⇐⇒ f ′ est croissante.

2. Si f ∈ D2(I,R), alors elle est convexe⇐⇒ f ′′ > 0. Les points où f ′′ change de signe sontappelés points d’inflexion.

66

Démonstration : 1. =⇒ Supposons f convexe. Soient x < y ∈ I. Alors pour tout t1 < t2 ∈]x, y[,

Tx(t1) 6 Tx(t2)︸ ︷︷ ︸Tx est croissante

= Tt2 (x) 6 Tt2 (y) = Ty(t2).

Faisons tendre t1 vers x et t2 vers y : f ′(x) 6 f ′(y).⇐= Supposons maintenant f ′ croissante et fixons a ∈ I. Il s’agit de prouver la croissance de la

fonction Ta, d’après le lemme 4. On s’appuiera sur l’égalité des accroissements finis.B Si x < a < y, il existe c ∈]x, a[ et d ∈]a, y[ tel que Ta(x) = f ′(c) et Ta(y) = f ′(d). DoncTa(x) 6 Ta(y).

B Si x < y < a,

Proposition V.6 (Convexité et Tangente)

Soit f ∈ D1(I,R) une fonction convexe. Pour tout a ∈ I,

f(x) > f ′(a)(x− a) + f(a).

Démonstration : Il suffit de remarquer que d’après la croissance de Ta, si x < a, Ta(x) 6 limx→a−

Ta(x) =

f ′(a), et de même à droite de a.

Une fonction convexe dérivable est une fonction dont la courbe est toujours au-dessus de ses tangentes, inégalité valable

sur tout l’intervalle I contrairement à celle portant sur les cordes.

67

Chapitre 11

Les Développements Limités

Motivation : On cherche à obtenir une estimation fine d’une fonction donnée au voisinage d’un point a.Les équivalents constituent une première approche des DL, on peut voir une majorité d’entre eux comme desDLs à l’ordre 1. L’idée heuristique est de remplacer notre fonction f par une fonction proche de f au voisinagede a suffisamment simple. Pour répondre à la deuxième condition, on choisira les polynômes, fonction de(x− a), et non de x de façon à obtenir une suite de monômes dont chacun est négligeable devant celui qui leprécède.

I Définitions

Soit I un intervalle et a ∈ I. f sera une fonction définie sur I \ a.Définition I.1

Soit n ∈ N. On dit que f admet un développement limité à l’ordre n en a (ou au voisinage dea), que l’on note DLn(a), lorsqu’il existe un polynôme P de degré au plus n tel que

f(x) = P (x− a) + o((x− a)n

), quand x tend vers a.

Si a = 0 :f(x) = P (x) + o

(xn), quand x tend vers 0.

B Pour tout k 6 n, f(x)−p∑k=0

αkxk ∼ αp+1x

p+1 quand x tend vers 0 si αp+1 6= 0.

B Si f(x) = 3 + o(x) quand x tend vers 0, f admet un DL à l’ordre 1 en 0, le polynôme P valantici P (x) = 3 est bien de degré au plus 1.

B Si f(x) = 3 + o(1) quand x tend vers 0, f admet un DL à l’ordre 0 en 0.B Si f(x) = π − 3(x− 2) + o

((x− 2)

)quand x tend vers 2, alors f admet un DL d’ordre 1 en 2.

B Si (∗) : f(x) = 1 + 2x − 3x2 + o(x), on ne peut pas dire que f possède un DL à l’ordre 2. Apriori, l’ordre est 1, et le monôme −3x2 n’apporte aucune information ; on peut le supprimercar il est négligeable devant x. Finalement,

f(x) = 1 + 2x− 3x2 + o(x)⇔ f(x) = 1 + 2x+ o(x).

B Contre-Exemple : La fonction x 7→√x ne possède pas DL en 0 à l’ordre n dès lors que n > 1.

B On peut procéder aux deux changements de variables suivants :– En posant x = a + h et en considérant g(h) = f(a + h), les DLs de f en a correspondent

de manière évidente aux DL de g en 0. C’est pourquoi dans la suite, nous énoncerons lesrésultats en 0.

– Si f est définie au voisinage de +∞ ou de −∞, on dira qu’elle possède un DL en l’infini

lorsque la fonction x 7→ g

(1x

)en possède un en 0.

Enonçons les premières propriétés :

68

Propriétés I.2

Soit f : I → R ou C.

1. Unicité du DL à l’ordre n : Soit n ∈ N. Si P et Q sont deux polynômes de degré au plusn tels que f(x) = P (x) + o(xn) = Q(x) + o(xn) quand x tend vers 0, alors P = Q. Lepolynôme P est ainsi unique et est appelé partie régulière de f à l’ordre n en 0.

2. Troncature d’un DL : Soit n ∈ N. Si f(x) =n∑k=0

akxk+o(xn) quand x→ 0, alors pour tout

entier naturel p 6 n, f possède un DL à l’ordre p en 0 dontp∑k=0

akxk est la partie régulière.

On appelle ce polynôme la troncature à l’ordre p et on le note Troncp

(n∑k=0

akxk

)3. Parité : Si f admet un DL à l’ordre n en 0 et qu’elle est paire ou impaire, alors ses parties

régulières ont la même parité que f .

Démonstration : 1. Posons

P (x) =

∑n

k=0 pkxk

Q(x) =∑n

k=0 qkxk

. En soustrayant les deux DL, nous obtenons P (x)−

Q(x) =∑n

k=0(pk−qk)xk = o(xn) quand x tend vers 0. Supposons qu’il existe au moins un entierk tel que pk 6= qk, et notons l le plus petit de ces entiers. Alors P (x)−Q(x) ∼ (pl − ql)xl et donc(pl − ql)xl = o(xn), ce qui implique que le réel non nul pl − ql est un o(xn−l) et donc qu’il tendvers 0. C’est absurde.

2. Il suffit de constater que pour tout k > p,

n∑k=p+1

akxk = o(xp) et que o(xn) = o(xp) donc

f(x)−p∑k=0

akxk = o(xn)−

n∑k=p+1

akxk = o(xp)− o(xp) = o(xp).

3.

f(x) =

∑n

k=0 akxk + o(xn)

f(−x) =∑n

k=0 ak(−1)kxk + o(xn). Supposons par exemple que f est paire. Alors, puisque

f(x) = f(−x), par unicité du DL, ∀k ∈ [[0, n]], ak = (−1)kak, si bien que ak est nul quand k estimpair.

Les DLs aux ordres 1 et 0 sont de nouveaux patronymes de propriétés que nous connaissionsdéjà :

Propriétés I.3 (Limite, dérivabilité et DLs)

Soit f : I → R ou C.

1. f admet un DL à l’ordre 0 en a0 si et seulement si limx→0,x6=0

f(x) existe et vaut a0.

2. Soit f continue en 0. Si f admet un DL à l’ordre 1 en 0 de partie régulière f(0) + bx, alorsf est dérivable en 0 et f ′(0) = b.Réciproquement, si f est dérivable en 0, elle admet f(0) + f ′(0)x comme partie régulièrede son DL à l’ordre 1.

Exemples et Remarques :B Ceci ne se généralise pas aux ordres supérieurs. Par exemple, si f : x 7→ x3 sin(1/x), alors f(x) = o(x2) en 0, et donc f

admet un DL à l’odre 2 en 0, mais elle n’est pourtant pas deux fois dérivable en 0 car

f ′x) =

0 si x = 03x2 sin(1/x)− x cos(1/x) sinon.

.

II Les fonctions usuelles

II.1 La formule de Taylor-Young

Théorème II.1 (Taylor-Young)

Soit f de classe C n sur I. Alors pour tout a ∈ I, f admet un DL à l’ordre n en a dont la partie

69

régulière est son n−ième polynôme de taylor évalué en x− a, i.e

f(x) =n∑k=0

f (k)(a)k! (x− a)k + o

((x− a)n

)quand x tend vers a.

Démonstration : Nous sommes dans les hypothèses de Taylor avec reste intégral, mais à l’ordre n − 1, sibien que l’on peut écrire :

f(x)−n∑k=0

f (k)(a)k! (x− a)k =

∫ x

a

(x− t)n−1

(n− 1)! f (n)(t)dt− (x− a)n

n! fn(a)

=∫ x

a

(x− t)n−1

(n− 1)! f (n)(t)dt−∫ x

a

(x− t)n−1

(n− 1)! f (n)(a)dt

=∫ x

a

(x− t)n−1

(n− 1)!(f (n)(t)− f (n)(a)

)dt.

Soit ε > 0. Comme f (n) est continue en a, il existe un réel α > 0 tel que pour tout t ∈ I, si |t− a| < α,alors |f (n)(t)− f (n)(a)| 6 ε. Soit x ∈ I tel que |x− a| 6 ε. Pour tout t ∈ [a, x], |t− a| < α et donc∣∣∣∣∣f(x)−

n∑k=0

f (k)(a)k! (x− a)k

∣∣∣∣∣ 6

∣∣∣∣∫ x

a

(x− t)n−1

(n− 1)!∣∣f (n)(t)− f (n)(a)

∣∣dt∣∣∣∣6

∣∣∣∣∫ x

a

(x− t)n−1

(n− 1)! dt

∣∣∣∣× ε6 ε× |x− a|

n

n! 6 ε|x− a|n.

En relisant ce qui est souligné et la conclusion, nous avons bien prouvé que

limx→a

f(x)−n∑k=0

f (k)(a)k! (x− a)k

(x− a)n = 0.

II.2 Les DLs usuels

Toutes les fonctions suivantes sont de classe C∞ au voisinage de 0. Pour tout entier naturel n,la formule de Taylor-Young permet d’écrire :

70

ex = 1 + x

1! + x2

2! + . . .xn

n! + o(xn)

cosx = 1− x2

2! + x4

4! + . . . (−1)n x2n

(2n)! + o(x2n) ou O(x2n+1)

sin x = x− x3

3! + x5

5! + . . . (−1)n x2n+1

(2n+ 1)! + o(x2n+1) ou O(x2n+2)

ch(x) = 1 + x2

2! + x4

4! + . . .x2n

(2n)! + o(x2n) ou O(x2n+1)

sh(x) = x+ x3

3! + x5

5! + . . .x2n+1

(2n+ 1)! + o(x2n+1) ou O(x2n+2)

ln(1 + x) = x− x2

2 + x3

3 + . . . (−1)n+1xn

n+ o(xn)

11− x = 1 + x+ x2 + x3 + · · ·+ xn + o(xn)

arctan(x) = x− x3

3 + x5

5 − · · ·+ (−1)n x2n+1

2n+ 1 + o(x2n+1),

(1 + x)α = 1 +n∑k=1

α(α− 1) . . . (α− k + 1)k! xk + o(xn),∀α ∈ R.

Exemples :B On peut se servir de la dernière pour obtenir le DL suivant :

1√

1− x2= (1− x2)−1/2 = 1 +

n∑k=1

− 12 (− 1

2 − 1) . . . (− 12 − k + 1)

k!(−x2)k + o(xn)

B Si on veut obtenir un DL en un point autre que a = 0 pour les fonctions précédentes, nous pouvons bien sûr utiliser ànouveau Taylor-Young an point a, dans la limite où les dérivées successives de f en ce point sont calculables. Nouspouvons aussi procéder au changement de variables :

lnx = ln(a+ x− a) = ln(a) + ln(1 + t/a) où t = x− a

= ln a+(t

a

)−

(ta

)22

+

(ta

)33

+ . . . (−1)n+1

(ta

)nn

+ o(tn)

= ln a+x− aa−

(x− a)2

2a2 +(x− a)3

3a3 + . . . (−1)n+1 (x− a)n

nan+ o((x− a)n)

B1x

=1a×

11 + x−a

a

, ex = ea.ex−a, sinx = sin a cos(x− a) + cos a sin(x− a). Pour la dernière, on lui péfèrera

sûrement la formule de Taylor.

III Les fonctions composées

Nous donnons ici des règles de calcul permettant d’obtenir des DLs de fonctions obtenues àpartir de fonctions usuelles en les multipliant, intégrant, composant...

Propriétés III.1 ( +,× et∫

)

Ici, An(x) et Bn(x) seront toujours des polynômes en x de degrés au plus n.

1. Linéarité : Si

f(x) = An(x) + o(xn)g(x) = Bn(x) + o(xn)

, alors f et g admettent un DL à l’ordre n en 0 de

parties régulières respectives An et Bn, alors pour tous scalaires λ, µ, la fonction λf + µgadmet un DL à l’ordre n en 0 dont la partie régulière est λAn + µBn.

2. Produit Si f et g admettent un DL à l’ordre n en 0 de parties régulières respectives An etBn, alors f × g admet aussi un DL à l’ordre n en 0, et sa partie régulière est la troncatureà l’ordre n de An ×Bn.

71

3. Primitives : Soit f continue sur I et F une de ses primitives.

Si f(x) =n∑k=0

akxk + o(xn) quand x tend vers 0, alors F (x) = F (0) +

n∑k=0

akk + 1x

k+1 +

o(xn+1).

Démonstration : 1. Car λo(xn) + µo(xn) = o(xn).2. Tout est dit.

3. Notons

A(t) =

n∑k=0

aktk

B(t) =n∑k=0

akk + 1 t

k+1.

Soit ε > 0. Il existe α > 0tel que pour tout t ∈ I, si |t| 6 α, alors∣∣f(t) − A(t)

∣∣ 6 ε|tn|. Or(F −B)′ = f −A. Soit |x| 6 α. Appliquons l’IAF à F −B sur [0, x] :∣∣∣F (x)−B(x)

∣∣∣ 6 supt∈[0,x]

∣∣f(t)−A(t)∣∣x 6 εxn+1.

B Dl à l’ordre 2n de cosh.

B Calculons le DL à l’ordre 2 de x 7→ ex√1 + x

.

ex = 1 + x+ x2

2 + o(x2)√

1 + x−1 = 1− x

2 + 38x

2 + o(x2).. Alors

ex√1 + x

= 1+ x2 + 3x2

8 +o(x2) en tronquant à l’ordre 2 le produit(

1 + x+ x2

2

)×(1− x

2 + 38x

2).B Effectuons un DL à l’ordre 4 en 0 de exp cos. On écrit

ecos x = exp ł(1− x2

2 + x4

24 + o(x4)Σ) = e× exp ł(−x2

2 + x4

24︸ ︷︷ ︸y

+o(x4)Σ)

= e(

1 + y + y2

2 + y3

3! + y4

4! + o(y4))

= e(

1 + ł(−x2

2 + x4

24Σ) + 1

2ł(−x2

2 + x4

24Σ)2 + o(x4)

)car

y3

3! + y4

4! = o(x4)

= e(

1 + ł(−x2

2 + x4

24Σ) + 1

2 ×x4

4 + o(x4))

B DL à l’ordre 5 de 1/ cos.Proposition III.2 (DL d’un rapport)

Si f admet un DL en 0 à l’ordre n et que f(x) = 1−An(x) + o(xn), où An(0) = 0, alors1f

admet

aussi un DL en 0 à l’ordre n, égal à

1f(x) = 1 +An(x) +

(An(x)

)2 +(An(x)

)3 + · · ·+(An(x)

)n + o(xn)

= Troncn[1 +An(x) +

(An(x)

)2 +(An(x)

)3 + · · ·+(An(x)

)n]+ o(xn).

Démonstration :1

1− t = 1 +n∑j=1

tj + tn+1

1− t = 1 +n∑j=1

tj + o(tn) quand t→ 0. Donc,

1f(x) = 1 +

n∑j=1

(An(x) + o(xn)

)j+ o((An(x) + o(xn)

)n)Or, d’après la formule sur les DL d’un produit,

(An(x) + o(xn)

)j= Troncn

(An(x)

)j + o(xn). De

plus, An(x) = O(x) ⇒(An(x) + o(xn)

)n =(O(x) + o(xn)

)n = O(xn) ⇒ o((An(x) + o(xn)

)n) =o(O(xn)) = o(xn).

72

1. DL en 0 à l’ordre 4 de1

cos :

1cos(x) = 1

1−(x2/2− x4/24

)+ o(x4)

= 1 +(x2/2− x4/24

)+(x2/2− x4/24

)2 + o(x4)

= 1 + x2

2 + 524x

4 + o(x4).

2. Et si f(0) = ` 6= 0, mais 6= 1 ?Et bien, c’est simple : il suffit de factoriser le numérateur par `, et on se retrouve dans la

situation précédente. Faisons le DLà l’ordre 3 de x 7→ 11 + ex

en 0.

3. Et si enfin f(0) = 0 ?Et bien, c’est simple, on factorise par le premier monôme intervenant dans le DL de f(x).Faisons par exemple le DL à l’ordre 5 de x 7→ 1

sin(2x) .

Proposition III.3 (DL d’une composée)

Soient f : I → J et g : J → R. Soient An et Bn deux polynomes de degrés 6 n tels queAn(0) = 0.Si f(x) = An(x) + o(xn) et g(x) = Bn(x) + o(xn) quand x tend vers 0, alors g f possède aussiun DL à l’ordre n en 0 obtenu en tronquant à l’ordre n le polynôme Bn An.

Démonstration : On écrit f(x) = A(x) + o(xn) et g(x) = B(x) + o(xn), où B(x) =∑n

k=1 bkxk = O(x).

En particulier, un o((g(x)n) = o(xn). De plus, pour tout j ∈ [1, n],(g(x)

)j =(B(x) + o(xn)

)j= B(x)j +

j∑k=1

Ckj B(x)j−ko(xkn)

= B(x)j + o(xn)M(x) = B(x)j + o(xn),

où M est une fonction bornée au voisinage de x = 0. D’où A(g(x)) = A(B(x)) + o(xn), et doncf(g(x)) = A(B(x)) + o(xn) = Tronn(A(B(x)) + o(xn).

1. DL à l’ordre 4 de ln cos en 0.

ln(

cosx)

= ln(1− (x2/2− x4/24) + o(x4)

)= −(x2/2− x4/24)− 1

2(x2/2− x4/24)2 + o(x4).

MORALE : IL EST PARFOIS INUTILE DE POUSSER LE DL DE g A L’ORDRE 4.

2. x 7→ (1 + x)1/x à l’ordre 2 en 0.

IV Application à l’étude des fonctions

IV.1 Prolongement en un point

B Question 1 : f est-elle prolongeable par continuité en x0 ?Oui, si et seulement si f possède un DL à l’ordre 0 en x0.

B Question 2 : Auquel cas, son prolongement est-il dérivable ?Oui, ssi f admet un DL à l’ordre 1 en x0.

B Question 3 : Auquel cas la courbe admet une tangente en x0. Quelle est la position de lacourbe localement par rapport à sa tangente ?Supposons que f(x) = a0 + a1(x− x0)︸ ︷︷ ︸

Equation de la tangente

+ap(x − x0)p + o((x − x0)p

). On voit que la

position dépend du signe de ap, de la parité de p et du signe de (x− x0).

73

IV.2 Recherche d’asymptotes et de développement asymptotique

1. Si en +∞, poser g(t) = f(1/t).2. Explqiuer DAS : on cherche un équivalent simple, puis un équivalent simple de la différence,

and so on...

3. Pour une fonction, en +∞, on s’arrête à o(1) si on cherche asymptote, et le terme suivant sion veut connaitre la position par rapport à celle-ci.

1. DAS deln(1 + x)√

xen 0 à la précision x5/2.

2. DAS en +∞ à la précision 1/x2 de√x+ 1.

3. Etudions les branches infinies de f : x 7→ x arctan x

x− 1 .

La difficulté est souvent de savoir jusqu’à quel ordre on doit pousser le DL. On le donne parfois

en ecigeant une précision à1

x2 ln x près par exemple.

f tend vers une limite finie en 1+ et en 1−, il n’y a donc des branches infinies qu’en +∞ et en−∞.En l’infini, il s’agit ici de donner un DL de arctan x

x− 1 jusuq’à l’ordre 1x , ou le suivant si

on veut de plus la position par rapport à l’asymptote. En dérivant, nous tomberons sur unefraction rationnelle, dont nous savons donner les DL à tout ordre.

Si x > 0, posons g(u) = f(1/u) = arctan 11− u . Il nous faut un DL à l’ordre 1 en 0 de g, donc

sa dérivée en 0 : g′(0) = −1/2.

74

Chapitre 12

Le calcul intégral

I Les théorèmes fondamentaux

I.1 Notion de primitive

Définition I.1 (Primitive)

Soit Ω ⊂ R et f, F : Ω→ R. On dit que F est une primitive de f lorsque pour tout x ∈ Ω, F ′(x) =f(x).

Proposition I.2 (Un résultat d’unicité)

Si Ω est un intervalle, et que F et G sont deux primitives de f sur Ω, alors il existe uneconstante C ∈ C telle que pour tout x ∈ Ω, F (x) = G(x) + C.

I.2 Le Théorème fondamental du calcul différentielThéorème I.3 (TFCD)

Soit I un intervalle, a ∈ I et f une fonction continue sur I. Alors la fonction F : x ∈ I 7→∫ x

a

f(t)dt est une primitive de f sur I.

En particulier, F est de classe C 1.

Dorénavant, le notation∫f(x)dx représentera une primitive quelconque de f ∈ C 0(I,C), où I

est un intervalle. Cette fonction n’est donc définie qu’à une constante additive près.

Corollaire I.4

Soit I un intervalle. Si F, f : I → C, que f est continue et que F ′ = f , alors

∀a, b ∈ I,∫ b

a

f(t)dt = F (b)− F (a) =:[F (t)

]ba

=[ ∫ b

a

f]ba.

I.3 Les propriétés de base de∫ b

af(x)dx

1. Linéarité : Si f et g sont continues sur I, alors pour tous a, b ∈ I, et tous α, β ∈ C∫ b

a

(αf + βg

)(x)dx = α

∫ b

a

f(x)dx+ β

∫ b

a

g(x)dx.

75

2. Chasles : Si f est continue sur I, alors pour tous a, b ∈ I∫ c

a

f(x)dx =∫ b

a

f(x)dx+∫ c

b

f(x)dx.∫ a

a

f(x)dx = 0,∫ b

a

f(x)dx = −∫ a

b

f(x)dx.

I.4 Intégration par parties

I est un intervalle.Théorème I.5 (IPP)

Soient u,w ∈ C 1(I,C). Soient a, b ∈ I,∫ b

a

u′(x)w(x)dx =[u(x)w(x)

]ba−∫ b

a

u(x)w′(x)dx.

Calculer∫ 1

0

dx(1 + x2)2 .

I.5 Changement de variables

Théorème I.6

Soit ϕ : [a, b]→ R une application de classe C 1 et f : I → R ou C une fonction continue sur unintervalle I contenant l’image de ϕ. Alors∫ ϕ(b)

ϕ(a)f(t)dt =

∫ b

a

(f ϕ)(x)ϕ′(x)dx.

On dit que l’application ϕ définit un changement de variables.

Remarques :

Dans la pratique, dans∫ β

α

f(t)dt,

1. on remplace t par ϕ(x) dans f(t) :

2. on remplace dt par ϕ′(x)dx ;

3. On remplace la borne supérieure de l’intégrale par la valeur en laquelle ϕ vaut cetteborne, et idem pour la borne inférieure.

Pour les primitives, dans∫f(t)dt, on fait la première étape, on tombe alors sur une

fonction dont on connait la primitive, et à la fin, on remplace x par ϕ−1(t).

1. Calculer une primitive de t 7→√

1− t2 sur ]− 1, 1[ en posant ϕ(x) = sin(x).

2. Calcul d’une primitive de t 7→ 1cosh t : ϕ(x) = ln(x).

II Les règles de cuisine

II.1 Les primitives usuelles

Soit I un intervalle et u ∈ C 1(I,R). Alors :

76

1. Si ∀x ∈ I, u(x) > 0, et si α ∈ R \ −1,∫u′uα = uα+1

α+ 1 .

2.∫u′eu = eu.

3. Si u ne s’annule pas,∫u′

u= ln |u| ;

4.∫

u′

1 + u2 = arctan u

II.2 Les fractions rationnelles x 7→ 1Q(x) simples

1./ Si f : x 7→ 1Q(x) , où Q est un trinôme dont le ∆ > 0, alors il existe α, β ∈ R tels que f :

x 7→ 1(x− α)(x− β) . On peut alors faire une Décomposition en éléments simples, i.e chercher

a, b ∈ R tels que f : x 7→ a

x− α+ b

x− β. On obtient

∫f = ln

[|x− α|a|x− β|b

].

2./ Si f : x 7→ 1Q(x) , où Q est un trinôme dont le ∆ < 0, alors avec une transformation canonique,

il existe a, b ∈ R tels que f : x 7→ 1(x+ b)2 + a2 . On utilise alors que

∫dx

x2 + a2 = 1a

arctan xa.

3./ Si f : x 7→ 1Q(x) , où Q est un trinôme dont le ∆ = 0, alors f : x 7→ 1

(x+ a)2 dont une primitive

est x 7→ − 1x+ a

.

II.3 Les fractions rationnelles en cos, sin, tanOn peut toujours se ramèner à une fraction rationnelle en faisant un changement de variables

du type u = tan θ/2.

II.4 Quelques cas particuliers

1. Si n ∈ N, a ∈ C,∫xneaxdx se calcule en faisant des IPP successives pour tuer le terme xn.

2. Si n ∈ N,∫xn sin(x)dx se calcule de même en écrivant que

∫xn sin(x)dx = Im

( ∫xneixdx

).

77

Chapitre 13

Equations différentielles linéaires

I L’ordre 1I est un intervalle. Dans ce paragraphe, a et b ∈ C 0(I,R).On appelle équation différentielle linéaire d’ordre 1 en y toute équation du type

∀x ∈ I, y′(x) = a(x)y(x) + b(x), (E).

L’équation est dite homogène lorsque b est la fonction nulle, ou, ce qui est équivalent, lorsquela fonction nulle est solution de (E).Une solution y de (E) est une fonction de classe D1(I,R qui vérifie (E).On appelle Courbe intégrale de (E) toute courbe représentative d’une solution de (E).Proposition I.1 (Solutions de l’équation homogène)

y ∈ D1(I,R) est solution de y′ = ay si et seulement si il existe K ∈ R telle que

y : x ∈ I 7→ K exp(A(x)

)où A est une primitive de a sur I.

Soit y :]− π/2, π/2[→ R une fonction dérivable. Cette fonction vérifiey′ + (tan x)y = 0⇐⇒ il existe K ∈ R telle que y = K cos.Proposition I.2 (Structure de l’ensemble de solutions de l’équation (E))

Soit y0 ∈ D1(I,R) une solution de y′ = ay + b.

y ∈ D1(I,R) est solution de y′ = ay + b

⇐⇒ il existe ϕ ∈ D1(I,R) telle que y = y0 + ϕ

⇐⇒ il existe K ∈ R telle que y : x ∈ I 7→ y0 +K exp(A(x)

).

où A est une primitive de a sur I.

78

Remarques :

Dans la PRATIQUE, bien souvent, pour résoudre y′ = ay + b, on multipliera par e−A :

y′ = ay + b ⇐⇒ e−Ay′ − ae−Ay = be−A

⇐⇒(e−Ay

)′ = be−A,

et il suffit alors de trouver une primitive de be−A.Exemple : Résoudre y′ + y tan x = sin(2x) sur ]− π/2, π/2[ :

Ici, a = − tan dont une primitive est donnée par A = ln cos, donc e−A = 1cos . Ainsi,

y′ + y tan x = sin(2x)⇐⇒ y′

cosx + y sin xcos2 x

= sin 2xcosx

⇐⇒( y

cos

)′= 2 sin x⇐⇒ ∃K ∈ R,∀x ∈]− π/2, π/2[, ycos = −2 cosx+K

⇐⇒ ∃K ∈ R, y]−π2 ,

π2[−→ R

x 7−→ K cosx− 2 cos2 x.

Corollaire I.3 (Problème de Cauchy)

Pour tous t0 ∈ I, α ∈ R, il existe une unique solution de y′ = ay + b qui vérifie y(t0) = α.

LA solution au problème de Cauchy de

y′ + y tan x = sin(2x)y(0) = 0

est la fonction y = 2 cos−2 cos2, car K cos 0− 2 cos2(0) = 0⇔ K = 2.

Remarques :

Si a, b, c ∈ C 0(I,R), l’équation ay′ = by + c est dite non résolue. Pour déterminer ses

solutions, il suffit de résoudre à l’aide de ce qui précède y′ = b

ay+ c

asur chaque intervalle

où a ne s’annule pas, puis de regarder comment recoller ces solutions aux points où as’annule.

II L’ordre 2Soient α, β ∈ C, et c ∈ C 0(I,C). Une solution de l’équation différentielle d’ordre 2 linéaire à

coefficients constants y′′ + αy′ + βy = c est une fonction y ∈ D2(I,C) qui vérifie ∀x ∈ I, y′′(x) +αy′(x) + βy(x) = c(x).L’équation est dite homogène lorsque b est la fonction nulle, ou, ce qui est équivalent, lorsque lafonction nulle est solution de (E).On appelle Courbe intégrale de (E) toute courbe représentative d’une solution de (E).

II.1 Le cas homogène

On note SH ⊂ D2(R,C) l’ensemble des solutions y solutions de y′′ + αy′ + βy = 0. On appelleéquation caractéristique (Ec) associée à cette équation différentielle l’équation en r : r2+ar+b = 0et ∆ = a2 − 4b son discriminant.

Théorème II.1

79

B Cas 1 : Si ∆ 6= 0, alors (Ec) admet deux solutions disctinctes r1 et r2, et y ∈ SH ⇐⇒ ilexiste A,B ∈ C telles que

y : x ∈ R 7→ Aer1x +Ber2x.

B Cas 2 : Si ∆ = 0, alors (Ec) admet une solution r0, et y ∈ SH ⇐⇒ il existe A,B ∈ Ctelles que

y : x ∈ R 7→ Aer0x +Bxer0x.

1. y ∈ D2(R,R) vérifie y′′ − 3y′ + 2y = 0⇐⇒ il existe A,B ∈ R telles que y : x 7→ Aex +Be2x.

2. y ∈ D2(R,R) vérifie y′′ + 6y′ + 9y = 0⇐⇒ il existe A,B ∈ R telles que y : x 7→ Ae−3x +Bxe−3x.

3. y ∈ D2(R,R) vérifie y′′ − 2y′ + 5y = 0⇐⇒ il existe A,B ∈ C telles que y : x 7→ Ae(1+2i)x + Be(1−2i)x. Or, on veut les solutions àvaleurs réelles. D’après un lemme déjà vu, il existe α, β ∈ R telles que y : x 7→ ex

(α cos(2x) +

β sin(2x)).

II.2 Le cas général

Proposition II.2 (Structure de l’ensemble de solutions de l’équation (E))

Soit y0 ∈ D1(I,R) une solution de y′′ + αy′ + βy = c.

y ∈ D2(I,R) est solution de y′′ + αy′ + βy = c

⇐⇒ il existe ϕ ∈ D2(I,R) telle que y = y0 + ϕ

Résoudre (E) y′′ + y = 6x+ x3 :x 7→ 6x est la dérivée seconde de x 7→ x3, donc y0 : x 7→ x3 est une solution particulière de (E).D’où y est solution de (E)⇐⇒ il existe a, b ∈ R telle que

y : x 7→ x3 + a cosx+ b sin x.

II.3 Recherche d’une solution particulière

MORALE : Il faut et il suffit donc de trouver une solution particulière de l’équation y′′+αy′+βy =c. Il faut savoir :B Si c est un polynôme de degré n, alors il existe une solution de y′′+αy′+βy = c polynômiale

de degré 6 n+ 2.B Si c : x 7→ P (x)eγx, où γ ∈ C et P est un polynôme de degré n, alors il existe une solution dey′′ + αy′ + βy = c de la forme y0 : x 7→ Q(x)eγx où Q est un polynôme de degré 6 n+ 2.

B Méthode de la variation de la constante, ou méthode de Laplace : Dans le cas général,on choisit une solution ϕ de y′′ + αy′ + βy = 0 qui ne s’annule pas, ou une solution ϕ dey′′+αy′+βy = c, et on cherche les solutions y de y′′+αy′+βy = c sous la forme y = Kϕ, oùK ∈ D2(I,C). On obtient alors une équation différentielle d’ordre 2 en K, mais sans termeen K, i.e une équation différentielle linéaire d’ordre 1 en K ′, que l’on sait résoudre grâce àla section I.

1. Résoudre y′′+ y = e2x : on cherche une solution particulière de la forme y0 : x 7→ (ax2 + bx+c)e2x et on trouve c = 1/5 et aucune condition sur a ni sur b ; on choisit donc la plus simple,à savoir y0 : x 7→ e2x

5 . Les solutions cherchées sont donc les fonctions

y : x 7→ cosx+ sin x+ e2x

5 .

80

2. Résoudre (remarquer qu’elle n’est pas à coefficients constants) (t2 + 1)y′′(t) − 2y(t) = t encommençant par rechercher des solutions polynômiales de l’équation homogène :t 7→ t2 + 1 est solution de (EH). On cherche donc y sous la forme y = K(t)(t2 + 1). Alors

(t2 + 1)y′′(t)− 2y(t) = tan t⇐⇒ K ′′(t) + 4tt2 + 1K

′(t) = t.

81

Chapitre 9

Les polynômes

Motivation : Les polynomes sont les seules fonctions dont on sache calculer les images des rationnels.K sera le corps R ou C.

I Définitions et structures

I.1 DéfinitionsDéfinition I.1

On appelle polynôme à coefficients dans K toute fonction f : K → K pour laquelle il existen ∈ N et a0, a1, . . . , an ∈ K tels que

∀x ∈ K, f(x) = a0 + a1x+ a2x2 + . . .+ anx

n.

On notera alors ce polynômen∑k=0

akXk, et K[X] l’ensemble de ces polynômes.

Remarques :

B Noter que la fonction X0 est la fonction constante égale à 1 dans la notation∑nk=0 akX

k.B Un trinôme est un polynôme du type x 7→ aX2 + bX + c.B Les fonctions constantes (donc la fonction nulle) et les fonctions affines sont des poly-

nômes.B Soit P (X) =

∑nk=0 akX

k un polynôme. Si m > n, on peut noter P (X) =∑mk=0 akX

k

en posant ak = 0 pour tout k > n. Cette remarque nous permettra par la suite lorsquenous aurons deux polynômes de prendre le même n. Par ailleurs, on peut définir lespolyômes comme les fonctions P (X) =

∑k akX

k, où les ak sont tous nuls sauf unnombre fini d’entre eux.

Proposition I.2 (unicité des coefficients)

B Soit un polynôme P (X) =n∑k=0

akXk ∈ K[X] .

P est la fonction nulle⇐⇒ pour tout i ∈ [[0, n]], ai = 0. On dit alors que P est le polynômenul.

B Soient P (X) =n∑k=0

akXk et Q(X) =

n∑k=0

bkXk ∈ K[X] . Les fonctions P et Q sont égales

si et seulement pour tout i ∈ [[0, n]], ai = bi.

82

Démonstration : Supposons que tous les coefficients ne soient pas nuls. Alors l’ensemble 0 6 k 6n tels que ak 6= 0 est une partie non vide de N. Elle possède donc un plus petit élément k0. Ainsi,P (X) =

∑n

k=k0akX

k. La fonction x ∈ R 7→ f(x)xk0 = ak0 + ak0+1x + ... + anx

n−k0 est nulle sur R∗,donc sa limite en 0 est nulle. Or celle-ci vaut ak0 . ABSURDE.

Définition I.3

Soit P ∈ R[X].On appelle coefficients de P les scalaires ak tels que P (X) =

∑k>0 akX

k.

Propriétés I.4 (Coefficients et Parité)

B P est un polynôme pair lorsque tous ses coefficients d’indice impair sont nuls, i.e lorsqu’ilexiste n ∈ N et a0, a2, . . . , a2n ∈ K tels que P (X) =

∑nk=0 a2kX

2k.B P est un polynôme impair lorsque tous ses coefficients d’indice pair sont nuls, i.e lorsqu’il

existe n ∈ N et a1, a3, . . . , a2n+1 ∈ K tels que P (X) =∑nk=0 a2k+1X

2k+1.

I.2 Lois

On peut définir deux lois sur l’ensemble K[X] :

Soient deux entiers naturels n 6 m, et P (X) =n∑k=0

akXk et Q(X) =

m∑k=0

bkXk. Tous les ai sont

donc nuls pour i > n.B P +Q est le polynôme défini par(

P +Q)

(X) :=m∑k=0

(ak + bk)Xk.

B P ×Q est le polynôme défini par(P ×Q

)(X) :=

n+m∑k=0

ckXk,

où pour tout k ∈ [[0, n+m]], ck =(

k∑i=0

aibk−i

)

Remarques :

B c0 = a0b0, cn+m = anbm.B (a+bX+cX2)×(d+eX+fX2) = ad+(ae+bd)X+(af+be+cd)X2+(ce+bf)X3+cfX4.B A quelle CNS sur a, b le polynôme x4 +ax3 +bX2 +4x+4 est-il le carré d’un polynôme

à coeffs réels ? Réponse : une des deux racines carrées sera de la forme X2 +αX + 2ε,où ε2 = 1. Or le carré de ce polynôme sera X4 + 2αX3 + (α2 + 4ε)X2 + 4αεX + 4. Parunicité des coefficients, ceci est possible ssi il existe α ∈ R et ε valant 1 ou −1 tels queα = a/2, α2 + 4ε = b, et 4αε = 4. Alors soit ε = 1, auquel cas a = 2 et b+ 5, soit ε = −1et a = −2, b = −3.

B Montrons l’égalité Cn2n =∑

(Ckn)2. On serait bien inspirés d’utiliser le binôme deNewton, et d’écrire plus précisément : (X + 1)2n = (X + 1)n × (X + 1)n, soit2n∑k=0

(2nk

)Xk =

(n∑k=0

(nk

)Xk

(n∑k=0

(nk

)Xk

). L’unicité des coefficients implique

que(

2nn

)=

n∑i=0

(ni

)(n

n− i

). On conclut avec

(n

n− i

)=(ni

).

83

Propriétés I.5(K[X],+,×

)est un anneau. C’est en fait un sous-anneau des fonctions de K dans K.

Démonstration : N (K[X],+) est un sous-groupe de (KK,+) car 0 ∈ K[X] et la différence de deuxpolynômes est un polynôme.

N La fonction constante égale à 1 est un polynôme. Le produit de deux polynômes est encore unpolynôme.

I.3 DérivationDéfinition I.6

Soit P (X) =n∑k=0

akXk. On appelle polynôme dérivé de P le polynôme P ′(X) =

n∑k=1

kakXk−1 =

n−1∑k=0

(k + 1)ak+1Xk.

Remarques :

B A ce stade, la dérivation n’est qu’une opération formelle, mais nous savons qu’elleprovient de la dérivation des fonctions si l’on considère P comme une fonction de Rdans R ou C, et que par suite elle hérite de toutes les formules que nous connaissonssur celles-ci.

B On a en particulier ∀p ∈ N, (Xp)′ =pXp−1 si p > 1,0 si p = 0.

B On note P (0) = P, P (1) = P ′ et P (n+1) le polynôme dérivé de P (n) pour tout entiernaturel n.

B On a ∀p, k ∈ N, (Xp)(k) =

p!

(p− k)!Xp−k si p > k,

0 si k > p.

Propriétés I.7

Soient P,Q ∈ K[X].

1. Pout tout a, b ∈ K,(aP + bQ

)′ = aP ′ + bQ′.

2.(PQ)′ = P ′Q+ PQ′.

Démonstration : Soient P (X) =∑

akXk et Q(X) =

∑bkX

k. Soit n ∈ N. Le n−ième coefficient dePQ′ + P ′Q est

n∑k=0

ak(n+ 1− k)bn+1−k +n∑k=0

(k + 1)ak+1bn−k

=n∑k=0

(n+ 1− k)akbn+1−k +n+1∑k=1

kakbn−k+1

= (n+ 1)a0bn+1 +n∑k=1

(n+ 1)akbn+1−k + (n+ 1)an+1b0

= (n+ 1)n+1∑k=0

akbn+1−k.

84

On reconnaît l’expression du n−ième coefficient de (PQ)′.

Proposition I.8

1. Les polynômes constants sont ceux dont le polynôme dérivé est nul.

2. P ′ = Q′ ssi P et Q diffèrent d’une constante.

Démonstration : On a pour tout n ∈ N, (n+ 1)an = 0.

Du cours de calcul différentiel, nous déduisons :

Proposition I.9 (Formule de Leibnitz (1670))

Soient P,Q ∈ K[X] et n ∈ N∗.

(P ×Q

)(n)=

n∑k=0

(nk

)P (k) ×Q(n−k).

II L’aspect algébrique

On aurait pu définir K[X] comme l’ensemble des suites de K dont tous les termes sont nulsAPCR, et munir celui-ci des lois + et × données ci-dessus. Ce point de vue oublierait les propriétésfonctionnelles du poly pour ne s’intéresser qu’aux notions propres aux anneaux : la divisibilité, ladivision euclidienne, l’irréductibilité des polynômes. C’est ce point du vue qui va nous intéresserdans cette partie.

II.1 Le degré

Définition II.1

Soit P (X) =n∑k=0

akXk ∈ K[X]. On pose

B degP :=

max0 6 k 6 n tels que ak 6= 0 si P 6= 0K[X]

−∞ si P = 0K[X].

B SI P est non nul, on note CD(P ) := am si m est le degré de P .B P est dit unitaire s’il est non nul et de coefficient dominant 1.

B (X2 + 1)13 est unitaire et de degré 26.

B Le polynôme P (X) =n∑k=0

akXk est de degré inférieur ou égal à n.

B Soit n ∈ N∗. Quels sont le degré et le coefficient dominant de Pn(X) := (X2 + 1)2n − (X2 −1)2n ? Son dégré est déjà 6 4n. De plus, le coefficient en X4n est nul, celui en X4n−1 aussicar il est pair, et celui en X4n−2 vaut 2n− (−2n) = 4n 6= 0. Son dégré est donc 4n− 2 et sonCD 4n.

Pour simplifier la proposition à venir, on pose pour tout n ∈ R ∪ −∞ :B −∞+ n = −∞,B −∞ 6 n.

Propriétés II.2

Degré et lois Soient P,Q ∈ K[X].

1. deg(P×Q

)= degP+degQ, et, si ces polynômes sont non nuls,CD(PQ) = CD(P )CD(Q)

.

2. deg(P +Q

)6 maxdegP,degQ,

85

et si degP 6= degQ, deg(P +Q

)= maxdegP,degQ.

Démonstration : Ces deux affirmations sont évidentes dans le cas où l’iun des deux polynômes P ou Qest nul. Nous excluons ce cas dans la suite de cette preuve.Notons n = degP > m = degQ, P (X) =

∑n

k=0 akXk et P (X) =

∑m

k=0 bkXk. P×Q est un polynôme

de degré au plus n+m et son coefficient en Xm+n est anbm 6= 0.Le deuxième point est encore plus évident, puisque si n > m, le coefficient dominant de P + Q estcelui de P .

Résolvons l’équation d’inconnue P dans R[X] suivante :

X(X + 1)P ′′ + (X + 2)P ′ − P = 0.

Notons n le degré de P et an son CD. Le coefficient en Xn du polynôme de droite est (n(n−1)+n−1)an = (n2 +2n−1)an. Puisqu’il est nul, n = 1 et P est donc une fonction affine. Si P (X) = aX+b,on trouve aX + 2a− aX − b = 2a− b = 0. L’ensemble des solutions est l’ensemble des polynômesqui s’écrivent P (X) = aX + 2a.

Propriétés II.3 (de l’anneau des polynômes)

1. K[X] est un anneau intègre, i.e que si P,Q ∈ K[X] vérifient P × Q = 0 alors P = 0 ouQ = 0.

2. Les inversibles de K[X] sont les polynômes constants non nuls : soit P ∈ K[X]. Alors ilexiste Q ∈ K[X] tel que P ×Q = 1 ssi degP = 0.

Démonstration : 1. PQ = 0⇒ degPQ = −∞⇒ degP + degQ = −∞⇒ degP ou degQ = −∞.2. Le sens ⇐ est facile. pour ⇒ , il suffit de dire que n + m = 0 implique n = m = 0 lorsque

n,m ∈ N.

II.2 La division euclidienne

Rappelons la définition de la divisibilité dans l’anneau K[X] : soient A,B ∈ K[X]. On dit queB divise A lorsqu’il existe Q ∈ K[X] tel que A = BQ. On note B|A.

B Soient n ∈ N∗ et P (X) =n∑k=0

akXk. X divise P ssi a0 est nul, et Xm divise P ssi a0 = a1 =

... = am−1 = 0.B X2|(X + 1)n − nX − 1 car (X + 1)n = 1 + nX + X2Q(X) où Q est un polynôme d’après le

binôme de Newton.B Si B|A et si A est non nul, alors degA > degB.

Théorème II.4

La division euclidienneSoient A,B ∈ K[X], où B n’est pas le polynôme nul. Il existe un unique couple (Q,R) de

polynômes à coefficients dans K qui vérifie :B A = BQ+R,B degR < degB.

Cette égalité s’appelle division euclidienne de A par B, Q est appelé quotient et R reste.

B Effectuer la division euclidienne de A(X) = 6X4 + 2X3 −X + 6 par B(X) = X2 +X + 4.B Soit a ∈ C et P ∈ C[X]. Le reste de la division euclidienne de P par B(X) = X − α est le

polynôme constant P (α) : P (X) = Q(X)(X − α) + P (α).Démonstration : B Unicité : Supposons que A = BQ1 +R1 = BQ2 +R2 et degRk < degB. Alors

deg(B(Q1 − Q2)

)= deg

(R2 − R1

)< degB, i.e degQ2 − Q1 < 0 et ainsi Q2 = Q1 qui

implique à son tour l’égalité entre R1 et R2.

86

B Existence : Nous allons effectuer une récurrence sur n = degA.P(n) : (∀A ∈ K[X] de degré n,∀B ∈ K[X] non nul, il existe au moins ...). Le cas A = 0 estévident :(Q,R) = (0, 0).L’initialisation P(0) : A est une constante non nulle a. Si B est aussi une constante non nulleb, on prend Q = b/a et R = 0. Sinon, on prend Q = 0 et R = a.Hérédité : Soit n ∈ N. Supposons P(n) vraie et montrons P(n+ 1).– Si degB > n, il suffit de poser (Q,R) = (0, A).

– Supposons degB 6 n. Soit A(X) =n+1∑k=0

akXk où an+1 6= 0, et B(X) =

q∑i=0

biXi où bq 6= 0.

En posant Qn+1(X) = an+1bq

Xn+1−q et An(X) = A−BQn+1, on voit facilement que An estde degré au plus n. Par HdR, il existe (Qn, Rn) couple de polynômes tel que degRn < degBet A−BQn+1 = QnB +Rn, i.e A = B

(Qn+1 +Qn

)+Rn.

Proposition II.5

Soient A,B ∈ K[X], où B 6= 0K[X].B divise A ssi le reste dans la division euclidienne de A par B est nul.

Démonstration : Cela provient de l’unicité du reste : A = BQ+R = BS

Cns pour que X2 + 1 divise X4 + aX3 + bX + c. Réponse : c = −1 et b = a.

III Racines de polynômes

Retour sur le point de vue fonctionnel des polynômes avec une notion qui fait la synthèse,puisqu’elle relie la divisibilité (notion algèbrique) à l’existence de racines (notion fonctionnelle).

III.1 Racines simples

Définition III.1

Soit a ∈ K et P ∈ K[X]. On dit que a est une racine de P lorsque P (a) = 0.On appelle équation algébrique toute équation en x ∈ K du type P (x) = 0 où P est un

polynôme.

B Un polynôme constant ne possède aucune racine s’il est non nul, et tout a ∈ K est racine dupolynôme nul.

B Soient a, b, c ∈ R, a 6= 0, et P (X) = aX2 + bX + c. P possède au moins une racine complexe,et il possède au moins une racine réelle ssi ∆ > 0. Il existe donc des polynômes qui nepossèdent pas de racines réelles, le parangon de ceux-ci étant X2 + 1.

Proposition III.2

Soit P ∈ K[X] et a ∈ K. Alors a est une racine de P ssi le polynôme X − a divise P (X).

Démonstration : Le reste dans la division euclidienne de P par X − a est la constante P (a). Or la divisi-bilité est équivalente à la nullité du reste.

Proposition III.3

Soit P ∈ K[X], k ∈ N∗ et a1, a2, ..., ak k éléments de K deux à deux distincts. Alors(a1, ..., ak sont des racines de P

)⇐⇒

k∏j=1

(X − aj) divise P (X).

Démonstration : Le sens ⇐ est évident.⇒ On effectue une récurrence sur k > 1, puisque l’initialisation est le fait de la proposition précé-

dente.

87

Si P (a1) = ...P (ak+1) = 0, par HdR, il existe un polynôme Q tel que P (X) = Q(X)k∏j=1

(X − aj).

Puisque les racines sont deux à deux distinctes, Q(ak+1) = 0, et on peut lui appliquer à nouveau laproposition précédente.

B Soit n ∈ N∗.

Xn − 1 =n∏k=1

(X − exp 2ikπ

n

)B Il existe au plus un polynôme de degré 4 dont 5 valeurs sont prescrites.

Un corollaire essentiel est

Corollaire III.4

(Version 1) Soit n ∈ N. Un polynôme de K[X] de degré n possède au plus n racines deux à deuxdistinctes.

Démonstration : Soient a1, ...ak k racines deux à deux distinctes de P . Alors il existe Q ∈ K[X] tel que

P (X) =k∏j=1

(X − aj)Q(X). Ce qui implique que n− k = degQ > 0 car Q est non nul.

Corollaire III.5

(Version 2)B Soit n ∈ N. Si P est un polynôme de degré 6 n et s’il possède au moins n+1 racines deux

à deux distinctes, alors P est le polynôme nul.B Si deux polynômes coincident sur une partie infinie, alors ils sont égaux.

Tout polynôme périodique est constant : si P (X+1) = P (X), le polynômeQ(X) := P (X)−P (0)s’annule en tous les entiers naturels. Il est donc nul.

III.2 Dérivation et racine multiples

Définition III.6

Soient P ∈ K[X] et a ∈ K. On appelle multiplicité de a dans P le plus grand entier m ∈ N telque (X − a)m divise P (X). C’est donc le seul entier m ∈ N qui vérifie : il existe Q ∈ K[X] telque P (X) = (X − a)mQ(X) et Q(a) 6= 0.

Remarques :

B a est racine de P ssi sa multiplicité est non nulle.B On parle de racine simple, double, triple...

La multiplicité de a se lit simplement sur les dérivées successives P (a), P ′(a), P ′′(a), ... grâce àla formule de Taylor.

Proposition III.7

Formule de TaylorSoient n ∈ N∗ et P ∈ K[X] de degré au plus n. Soit a ∈ K. Alors

P (X) =n∑k=0

P (k)(a)k! (X − a)k.

88

En particulier, si a0, a1, ...an sont les coefficients de P , alors

∀k ∈ [[0, n]], ak = P (k)(0)k! .

Démonstration : Il suffit de le vérifier pour P (X) = Xi. Or pour cette valeur de P ,dk

dXkP (X) =

i!(i− k)!X

i−k, et donc P (k)(a) = i!(i− k)!a

i−k. Finalement,n∑k=0

P (k)(a)k! (X−a)k =

n∑k=0

i!(i− k)!k!a

i−k(X−

a)k =n∑k=0

(ik

)ai−k(X − a)k = Xi.

Alors :Proposition III.8

Soit P ∈ K[X], a ∈ K et m ∈ N. Alors,

1. a est une racine de P de multiplicité > m ssi

P (a) = P ′(a) = P ′′(a) = ... = P (m−1)(a) = 0.

2. La multiplicité de a dans P est exactement m ssiP (k)(a) = 0, ∀k ∈ [[0,m− 1]],P (m)(a) 6= 0.

Démonstration : On ne prouve que le 2. Le sens ⇐ est évident d’après Taylor.

L’autre sens vient de P (X) = Q(X)(X − a)m et Q(a) 6= 0. ∀k ∈ [[0,m]],

P (k)(X) =k∑j=0

(kj

)((X − a)m

)(j)Q(k−j)

=k∑j=0

(kj

)m!

(m− j)! (X − a)m−jQ(k−j)

Ce polynôme s’annule si k 6 m− 1 et vaut m!Q(a) 6= 0 si k = m.

Montrer que (X − 1)2 divise

(n−1∑k=0

Xk

)2

− n2Xn−1.

On peut généraliser la proposition reliant le nombre de racines au degré dans le cas où lesracines sont multiples :

Proposition III.9

Soient k ∈ N∗, P ∈ K[X], a1, ...ak des racines de P deux à deux distinctes de multiplicités res-

pectives m1, ...mk. Alorsk∏j=1

(X − aj)mj divise P (X).

En particulier, la somme des multiplicités des racines d’un polynôme non nul est toujours 6 àson degré.

Démonstration : Se démontre par récurrences sur k > 1. L’initialisation n’étant que la définition de lamultiplicité.

89

III.3 Relations coefficients-racinesDéfinition III.10

Polynôme scindéSoit P un polynôme de degré > 1. P est dit scindé sur K lorsqu’il s’écrit comme produit de

polynômes de degré 1 à coefficients dans K, i.e lorsqu’il existe p ∈ N∗ complexes a1, ..ap tels queP (X) = c(X − a1)(X − a2) . . . (X − ap), c étant le coefficient dominant de P .

B P (X) = X2 + 1 est scindé en tant que polynôme de C[X], mais pas en tant que polynôme deR[X]. Un trinôme à coefficient réels est scindé sur R ssi ∆ > 0.

B Tout polynôme de degré 1 est scindé.B

(X − a1)(X − a2) = X2 − SX + P,

(X − a1)(X − a2)(X − a3) = X3 − σ1X2 + σ2X − σ3.

Ceci se généralise :

Définition III.11

Fonctions symétriques élémentairesSoit n ∈ N∗, a1, . . . , an n scalaires de K. On appelle FSE de a1, . . . , an les scalaires

σ1 = a1 + · · ·+ an,

σ2 =∑

16i1<i26nai1ai2 ,

σp =∑

16i1<...<ip6nai1ai2 ...aip .

pour tout 1 6 p 6 n. En particulier, σn = a1...an.

B σ1, σ2, σ3, σ4 pour n = 4.

Proposition III.12

Relations coefficients-racinesSoit P (X) =

∑nk=0 akX

k ∈ K[X] un polynôme de degré n > 1 scindé sur K.

Il existe alors α1, . . . , αn ∈ K tels que P (X) = an

n∏k=1

(X − αk). Notons σ1, ..., σn les FSE des ai.

On a alorspour tout k ∈ [[1, n− 1]], σk = (−1)k an−k

an.

B x1, x2, x3, x4 les racines complexes de P (X) = X4 +X3 +X2 +X + 1. Calculer x1 + ...x4 etx2

1 + ...+ x24.

B La somme des racines n−ième de l’unité vaut 0.

IV Polynomes irréductibles

Définition IV.1

Un polynôme est dit irréductible sur K s’il est de degré > 1 et s’il ne peut s’écrire commele produit de deux polynômes de K[X] de degrés > 1. Par exemple, tout polynôme de degré1 est irréductible. Ces polys se situent à l’opposé des polynômes scindés dans l’hémicycle despolynômes.

90

IV.1 Le corps des complexes

Théorème IV.2

de D’AlembertSoit P ∈ C[X]. Il existe α ∈ C tel que P (α) = 0, i.e tel que (X − α) divise P .

Corollaire IV.3

B Tout polynôme à coefficients complexes (a fortiori à coefficients réels) est scindé sur C.B Les polynômes irréductibles sur C sont les polynômes de degré 1.

B Calculern∏k=1

sin kπ

n+ 1 en décomposantn∑k=0

Xk.

IV.2 Le corps des réelsProposition IV.4

B Soit P ∈ C[X]. Alors P ∈ R[X] ssi pour tout z ∈ C, P (z) = P (z).B Soit a un complexe non réel et P ∈ R[X]. Alors multP (a) = multP (a).

Démonstration : Se prouve évidemment avec la carcatérisation de la multiplicité avec les dérivées.

Théorème IV.5

Les polynômes irréductibles de R[X] sont :B les polynômes de degré 1.B les trinômes de discriminant < 0.

Démonstration : Le sens direct se prouve avec les théorème de D’Alembert.

Théorème IV.6

Tout polynôme de R[X] s’écrit comme le produit de polynômes irréductibles sur R.

Exemples de décompositions dans R :B X4 − 2X2 − 3 = (X −

√3)(X +

√3)(X2 + 1).

B X4 +X2 + 1 = (X2 + 1)2 −X2 = (X2 −X + 1)(X2 +X + 1).B Soit n ∈ N∗.

X2n − 1 = (X − 1)(X + 1)n−1∏k=1

(X2 − 2 cos

2nX + 1

),

X2n+1 − 1 = (X − 1)n∏k=1

(X2 − 2 cos

2n+ 1X + 1

).

91

Chapitre 10

La Géométrie Dans l’Espace

I Repérages dans l’espace

II Produit scalaire et Déterminant

II.1

92

Chapitre 9

Systèmes Linéaires

Ce cours se structure ainsi :I- Nous fournissons quelques exemples de systèmes

II- Nous définissons le cadre, en introduisant les matrices, puis nous donnons quelques propriétésimmédiates.

III- On s’intéresse à certains types de systèmes (ceux dits échelonnés), qui ont la propriété deposséder un ensemble de solutions qui s’explicite de manière relativement limpide.

IV- Nous parlons de l’algorithme de Gauss, laissant pour seule explication les quelques systèmesde la partie I.

V- Nous résolvons les systèmes généraux.

Remarques :

1. Tous les exemples et les énoncés seront donnés sur R, mais on peut sans aucunedifficulté troquer celui-ci pour C.

2. Notez tout au long du cours la position centrale qu’occupe la notion de rang d’unematrice.

I Exemples de systèmes linéaires

B un système 3 × 3 à paramètres : soit m ∈ R et soient trois inconnues x, y, z liées par lesrelations

x+ y +mz = 0, x+my + z = 0, mx+ y + z = 0.

L’ensemble des solutions de ce système est l’ensemble des triplets

xyz

∈ R3 qui le vérifient.

On note cet ensemble SolΣ. C’est une partie de R3.On l’écrit sous la forme suivante

(Σ0) :

x + y + mz = 0x + my + z = 0mx + y + z = 0.

On élimine la variable x dans les deux dernières équations en ajoutant à chacune d’entre ellesune équation colinéaire à la première :

(Σ0)⇐⇒

x + y + mz = 0(m− 1)y + (1−m)z = 0(1−m)y + (1−m2)z = 0.

93

Enfin, on ajoute la deuxième à la dernière :

(Σ0)⇐⇒

x + y + mz = 0(m− 1)y + (1−m)z = 0

(2−m−m2)z = 0.

On voit que va être essentielle ici l’éventuelle nullité de m2 +m− 2 = (m− 1)(m+ 2).• Cas 1 : Si m 6= 1 et m 6= −2, alors on obtient un système triangulaire. Il suffit de remonter

pour obtenir :SolΣm=

0

00

.

• Cas 2 : Si m = 2, alors

(Σ2)⇐⇒

x + y + 2z = 0y − z = 0

0 = 0.⇐⇒

x = −3zy = z

.

D’où SolΣ2 =

−3z

zz

, où z parcourt R

, qui est clairement l’ensemble des points de la

droite passant par (0, 0, 0) et dirigée par

−311

.

On a paramété l’ensemble des solutions pas la variable z.• Cas 3 : Si m = 1, alors (Σ1) ⇐⇒ x + y + z = 0 est un plan, dont on obtient une équation

paramétrique ainsi :B Cas d’un système non homogène : Soit a ∈ R et le système

(Σ2) :

x+ y + z + au = 1x+ y + az + u = 1x+ ay + z + u = 1ax+ y + z + u = 1

Afin de ne pas multiplier les occurences des variables, nous noteronsx+ y + z + aux+ y + az + ux+ ay + z + uax+ y + z + u

=

1 1 1 a1 1 a 11 a 1 1a 1 1 1

xyzu

.

si bien que le système peut se réécrire

(Σ2)⇐⇒

1 1 1 a1 1 a 11 a 1 1a 1 1 1

X =

1111

où X =

xyzu

.

Alors,

(Σ2) ⇐⇒

1 1 1 a0 0 a− 1 1− a0 a− 1 0 1− a0 1− a 1− a 1− a2

X =

100

1− a

(a) Si a = 1 :

(Σ2) ⇐⇒

1 1 1 10 0 0 00 0 0 00 0 0 0

X =

1000

⇐⇒

(1 1 1 1

)X =

(1)

94

SolΣ =

y−1100

+ z

−1010

+ u

−1001

où y, z, u ∈ R

(b) Si a 6= 1 :

(Σ2) ⇐⇒

1 1 1 a0 0 1 −10 1 0 −10 1 1 1 + a

X =

1001

⇐⇒

1 1 1 a0 1 0 −10 0 1 −10 0 0 3 + a

X =

1001

⇐⇒

1 0 0 a+ 20 1 0 −10 0 1 −10 0 0 3 + a

X =

1001

B Si a 6= −3, le système possède une unique solution.B Si a = −3, le système n’admet aucune solution.

B Construire un ballon de Hand-Ball avec des hexagones et des pentagones.

On juxtapose deux polygones sur une arête commune, chaque sommet sera communà trois polygones. De telles configurations apparaissent en biologie, en chimie, en ar-chitecture, ... Nous noterons x le nombre de pentagones, y le nombre d’hexagones, ale nombre d’arêtes, f le nombre de faces et s le nombre de sommets. Nous avons lesrelations suivantes :

(Σ1) :

x+ y = f

5x+ 6y = 2a5x+ 6y = 3sf − a+ s = 2

La dernière relation est dite d’Euler.Nous noterons les variables dans l’ordre alphabétique : a, f, s, x, y. Cette égalité entrecinq couples de réels peut être vue comme une égalité de deux vecteurs qui auraientcinq composantes chacun :

(Σ1)⇐⇒

x+ y

5x+ 6y5x+ 6yf − a+ s

=

f2a3s2

.

Afin d’alléger nos équations, nous déciderons de noter la partie située à gauche deségalités ainsi :

a− f − s−f + x+ y−2a+ 5x+ 6y−3s+ 5x+ 6y

=

1 −1 −1 0 00 −1 0 1 1−2 0 0 5 60 0 −3 5 6

afsxy

.

Si bien que nous obtenons la nouvelle écriture suivante :

(Σ1)⇐⇒

1 −1 −1 0 00 −1 0 1 1−2 0 0 5 60 0 −3 5 6

X =

−2000

95

On élimine les a dans les trois dernières équations, donc seulement dans la troisième enlui ajoutant 2 fois la première :

(Σ1)⇐⇒

1 −1 −1 0 00 −1 0 1 10 −2 −2 5 60 0 −3 5 6

X =

−2040

On élimine f dans la troisième en lui soustrayant deux fois la deuxième :

(Σ1)⇐⇒

1 −1 −1 0 00 −1 0 1 10 0 −2 3 40 0 −3 5 6.

X =

−2040

Divisons la troisième par −2 et la deuxième par −1 :

(Σ1)⇐⇒

1 −1 −1 0 00 1 0 −1 −10 0 1 −3/2 −20 0 −3 5 6.

X =

−20−20

Enfin,

(Σ1)⇐⇒

1 −1 −1 0 00 1 0 −1 −10 0 1 −3/2 −20 0 0 1/2 0.

X =

−2026

⇐⇒

1 0 0 0 00 1 0 −1 −10 0 1 −3/2 −20 0 0 1/2 0.

X =

−2026

Il y a donc nécessairement 12 pentagones et ce bien qu’il y ait plus de variables que

d’équations.On peut encore simplifier ce système en exprimant toutes les variables en fonction de y :Il existe plusieurs solutions entières à ce système :B y = 0 : c’est le dodécahèdre (12 faces qui sont des pentagones).B y = 20 : on part de l’icosahèdre (12 sommets de degré 5 et 20 faces triangulaires) auquel on coupe tous les

sommets pour en faire des pentagones, les faces triangulaires deviennent des hexagones. C’est la positiondes atomes de carbone dans la molécule de Buckminsterfullerene C60.

FIxons maintenant la problématique de ce cours : Pour tous les systèmes, nous nous pose-rons les questions suivantes :Q1 : Existe-t-il des solutions à (Σ) ? Si la réponse est positive, on dira que le système est

consistant.Q2 : Si Sol 6= ∅, y a-t-il une solution, ou plusieurs ?Q3 : Si Sol contient plus d’un élément, peut-on paramétrer ces éléments ?On y répond en transformant le système de départ en un système équivalent, dont lenombre de zéros en début de ligne est strictement croissant. Comment ? En échangeantdes lignes, en les multipliant par des réels non nuls, ou en ajoutant une ligne à une autre(trois opérations réversibles).

II Systèmes Généraux

II.1 La notion de matrices, et les systèmes associés

Nous avons vu qu’un système fait intervenir trois tableaux de scalaires, qui ont chacun un statut

différent. Par exemple, dans le système

x+ y + z + 8u = 1x+ y + 8z + u = 1x+ 8y + z + u = 18x+ y + z + u = 1

, nous avons la “tableau” des

96

variables X =

xyzu

, le tableau des membres de gauche

1 1 1 81 1 8 11 8 1 18 1 1 1

, et enfin le tableau

1000

. Formalisons ceci, dans la définition suivante :

Définition II.1 (matrices)

B On appelle matrice à m lignes et n colonnes et à coefficients réels toute suite double(ai,j)

16i6m,16j6n, que l’on représente dans un tableau :

A =

a11 a12 . . . a1na21 a22 . . . a2n...

......

am1 am2 . . . amn

.

On note Mm,n(R) l’ensemble des ces matrices.

B Si n = 1, A =

a11a21...

am1

= 1

a1a2...am

est appelée matrice colonne. On notera Rm = Mm,1(R).

B Si m = 1, A =(a11 a12 . . . a1n

)=(a1 a2 . . . an

)est appelée matrice-ligne. On

notera Rn = M1,n(R).B Si A ∈Mm,n(R), on notera pour tout j ∈ [[1, n]], sa j−ème colonne ainsi :

A•,j =

a1ja2j...

amj

, ou Cj .

B Si A ∈Mm,n(R), on notera pour tout i ∈ [[1,m]], sa i−ème ligne ainsi :

Ai,• =(ai1 ai2 . . . ain

), ou Li.

Nous allons voir qu’à chaque matrice A ∈ Mm,n(R) est associé un système homogène d’équa-tions en n variables. Remarquer que le nombre de variables est égal au nombre de colonnes de lamatrice.Définition II.2 (Système Linéaire)

Un système linéaire est une liste constituée d’un nombre fini d’équations linéaires en x1, . . . xn :

(Σ)

a11x1 + . . .+ a1nxn = b1

......

am1x1 + . . .+ amnxn = bm

Nous le noterons ainsi :

a11 a12 . . . a1na21 a22 . . . a2n...

......

am1 am2 . . . amn

X =

b1b2...bm

, où X =

x1x2...xn

∈ Rn.

Lorsque le système ne comporte qu’une ligne, on parle d’équation linéaire, plutôt que desystème linéaire.

Définition II.3 (Solution d’un système linéaire)

On appelle solution de (Σ) tout n−uplet

x1x2...xn

∈ Rn qui vérifie simultanément cesm équations

linéaires.

97

SolΣ ⊂ Rn , où n est le nombre de colonnes de A.B Deux systèmes linéaires seront dits équivalents lorsqu’ils ont les mêmes ensembles de

solutions.B Le système (Σ) est dit :

– homogène lorsqu’il admet la solution nulle, ce qui est équivalent à supposer que b1 =b2 = · · · = bm = 0.

– compatible lorsque son ensemble de solutions est non vide.

II.2 Système linéaire homogène et Noyau d’une matrice

Définition II.4 (Noyau)

Soit A ∈Mn,p(R). On appelle Noyau de la matrice A et on note kerA l’ensemble des solutionsdu système linéaire homogène associé à A :

kerA = X ∈ Rp/AX = 0Rn ,

où p est le nombre de colonnes de A.

Propriétés II.5 (de stabilité du noyau par combinaison linéaire )

Soit A ∈Mn,p(R).B 0Rp ∈ kerA.

B Homogénéité : ∀X =

x1...xp

∈ kerA et pour tout réel λ, λX =

λx1...

λxp

∈ kerA.

B Additivité : ∀X =

x1...xp

, Y =

y1...yp

∈ kerA, X + Y =

x1 + y1...

xp + yp

∈ kerA.

Remarquons que la stabilité par l’addition et par la multiplication par un scalaire est une propriétéque partagent l’ensemble de solutions d’un système linéaire homogène et l’ensemble de solutionsd’une équation différentielle linéaire sans second membre, d’ordre 1 ou 2.

Quant à SolΣ, où (Σ) est un système linéaire non homogène, il n’est stable par aucune deces opérations, mais il existe un lien fort entre lui et l’ensemble de solutions du système linéairehomogène associé :

Propriétés II.6 (Structure de SolΣ)

Soit (Σ) : AX = B, où les notations sont celles déjà utilisées, et (Σ0) : AX = 0 le systèmehomogène associé.

Si Σ possède au moins une solution X0 =

y1...yp

, alors

∀X =

x1...xp

, X ∈ SolΣ ⇐⇒ X −X0 =

x1 − y1...

xp − yp

∈ kerA.

Ce que l’on écrit ainsi : SolΣ = X0 + kerA .

III Les systèmes échelonnés

Nous allons nous intéresser ici à un type très particulier de systèmes, qui présente deux intérêts :ils sont d’une part simples à résoudre (ce que nous allons voir dans cette section), et d’autre part,

98

ils ne sont pas si singuliers qu’ils peuvent paraître dans la mesure où tout système est équivalent àun système échelonné.

Nous avons montré que les trois systèmes étudiés précédemment pouvaient se mettre sous laforme réduite en échelon. C’est une propriété qui porte sur la matrice associée au système. Nousprenons ici un système homogène.

Définition III.1 (Matrice échelonnée)

Soit A =(ai,j)

une matrice ∈ Mm,n(K), dont nous noterons L1, . . . , Lm les lignes. Soit i ∈[[1,m]] tel que Li est non nulle. Nous notons ji = mink ∈ [[1, n]] tels que ai,k 6= 0, le premiercoefficient non nul de Li.

A est dite échelonnée lorsqu’elle vérifie :B Il existe un entier r ∈ [[0,m]] tel que Li = 0 pour tout i > r et Li 6= 0 sinon. Cet entier

s’appelle le Rang de A. Le rang de la matrice nulle est 0.B Sur les r premières lignes, les indices j1, j2, . . . , jr des premiers coefficients non nuls

forment une liste strictement croissante : 1 = j1 < j2 < . . . < jr.On appelle alors pour tout i ∈ [[1, r]], pivots les valeurs des pi := ai,ji

, variables pivots les rvariables xj1 , . . . , xjr

et variables libres les n− r autres variables lorsqu’elles existent.

Voici une première propriété à peu de frais :

Propriétés III.2 (Valeur maximale du rang)

Soit A ∈Mm,n(K) une matrice échelonnée, et r ∈ N son rang. Alors

r 6 m et r 6 n.

Démonstration : r est inférieur au nombre de lignes de A car c’est le nombre de lignes non nulles, et il estinférieur à n car, la stricte croissance de la suite d’entiers j1, ..jr implique que pour tout i ∈ [[1, r]], i 6ji 6 n, et donc en posant i = r, r 6 jr 6 n.

Toute la question de la résolution des systèmes va porter sur la notion absolument centrale deRANG d’une matrice.

Graphiquement, une matrice est échelonnée lorsqu’elle est de la forme :

A :=

0 . . . 0 p1 ∗ . . .0 . . . 0 0 . . . p2 ∗ . . ....

... . . . p3 ∗...

...... 0 . . .

......

.... . .

...... 0 . . . pr ∗ ∗

...... 0 . . . 0 . . . 0

......

......

...0 . . . 0 0 . . . 0 . . . 0

Résolution du système échelonné : En commençant par la dernière ligne, on peut obtenir la

valeur de xr en imposant n’importe quelle valeur aux variables libres. En remontant, on voit que l’onpeut déterminer ainsi toutes les valeurs des variables pivot.

Formalisons ceci :Propriétés III.3 (Paramétrage de l’ensemble des solutions d’un système homogène échelonné)

Soit A ∈ Mm,n(K) une matrice échelonnée, et r ∈ N son rang. Soit (Σ) le système homogène

AX = 0, où X =

x1...xn

.

99

Pour clarifier, réordonnons les variables en commençant par les pivots. Nous notons doncy1 = xj1 , y2 = xj2 , . . . , yr = xjr

, puis yr+1, yr+2, . . . , yn les n − r variables libres. L’affirmationen italique apparaissant quelques lignes au-dessus s’énonce ainsi :

Il existe une matrice C ∈Mr,n−r(R) telle que AX = O ⇐⇒

y1...yr

= C

yr+1...yn

.

Si bien que l’application suivante est bijective :

Ψ :

y1...yr...yn

∈ SolΣ 7→

yr+1...yn

∈ Rn−r.

Démonstration : Pour construire la matrice C, il suffit de commencer par la dernière équation qui nousdonne yr en fonction des variables libres. On reporte cette expression dans la précédente, si bien queyr−1 s’exprime linéairement à l’aide des variables libres. Une induction claire, et qu’il me semble inutilede formaliser, permet de conclure.

En ce qui concerne Ψ maintenant :

Injectivité : Soient

y1...yr...yn

,

y1...y′r...y′n

∈ SolΣ qui ont même image par Ψ. Alors leurs variables libres

coïncident, et puisque les variables pivots sont des fonctions des variables libres, on a aussiyi = y′i∀i ∈ [[1, r]].

Surjectivité Ca me parait clair.

La proposition suivante occupe une place de choix en algèbre linéaire :

Proposition III.4 (Une CS d’Existence et d’Unicité de la solution)

Si A ∈ Mn(K) est une matrice carrée et échelonnée de rang n, alors le système AX = Bpossède une et une seule solution.

IV Algorithme de Gauss-Fang-Cheng

Soit AX = B un système linéaire à p variables et n équations.L’objectif de cette section est de construire par un algorithme un système équivalent à (Σ) de la

formeA′X = B′, ouA′ est échelonnée. Cet algorithme ne fait intervenir que trois types d’opérationssur les lignes que nous décrivons maintenant.

IV.1 Opérations élémentaires sur les lignes

Elles sont au nombre de trois :

1. Addition d’un multiple d’une ligne à une autre ligne. Li ← Li + λLj

2. Mutiplication d’une ligne par un scalaire non nul. Lj ← λLj

3. Permutation de deux lignes. Li ↔ Lj

On peut voir qu’il n’y en a que deux, car la dernière se déduit des deux autres.

L’intérêt que l’on porte à ces opérations vient de ce qu’elles sont réversibles, et qu’ainsi lesopération élémentaires sur les lignes préservent l’ensemble de solutions du système.

En effet, si on obtient à partir des m lignes L1, ...Lm une suite de m lignes L′1, .., L′m avec

l’opération L2 ← L2 + λL1, on peut revenir aux lignes originelles en faisant L′2 ← L′2 − λL1.

100

Propriétés IV.1

Toute opération élémentaire sur un système (Σ) conduit à un système équivalent à (Σ).

IV.2 Algorithme

Soit un système (Σ)

a11x1 + . . . + a1nxn = b1

......

am1x1 + . . . + amnxn = bm

, que nous notons AX = B, où

A =

a11 a12 . . . a1na21 a22 . . . a2n...

......

am1 am2 . . . amn

∈Mm,n(R), X =

x1x2...xn

∈ Rn et B =

b1b2...bm

∈ Rm.

A l’aide de l’algorithme de Fang-Cheng-Gauss que nous avons développé sur des exemples, noustrouvons que le système AX = B est équivalent à un système échelonné UX = C, où

U =

1 ∗ . . . . . . ∗0 . . . 1 ∗ . . . ∗

0 . . . 1 ∗ . . . ∗... 0 . . .

. . .1 ∗ . . . ∗0 . . . 0...

...0 0 . . . 0

et C =

c1..................cm

. (9.1)

Remarques :

B Ces deux systèmes sont équivalents car on passe de l’un à l’autre par des opérationsélémentaires.

B On procède à un certain nombre d’arbitrages dans cet algorithme, notamment dans lechoix des pivots qui peut amener à intervertir certaines lignes plutôt que d’autres. Sibien que la matrice échelonnée sur laquelle on tombe en partant de A n’est pas unique.Nous avons déjà vu qu’elles ont cependant mêmes ensembles de solutions.

B Sur les matrices associées à ces systèmes, nous avons le résultat fondamental suivant,que nous admettrons provisoirement :

Théorème IV.2

Soit A ∈ Mm,n(R), et soient U et U ′ ∈ Mm,n(R) deux matrices échelonnées obtenues à partirde A par une suite d’opérations élémentaires sur ses lignes. Alors Rang U = Rang U ′.

Et, vous commencez à y être habitués, dès qu’il y a unicité, on peut définir une application :

Définition IV.3 (Rang d’une matrice)

Soit A ∈Mm,n(R). Nous appellerons rang (A) le rang de n’importe quelle matrice U échelonnéeobtenue à partir de A par des opérations élémentaires sur les lignes.

1. Le rang d’une matrice à 2 lignes est 6 2, égal à 0 ssi les L1 = L2 = 0, égal à 1 ssi L1 et L2sont proportionnels et au moins une est non nulle.

2. Le rang d’une matrice à 3 lignes est < 3 ssi une des lignes est combinaison linéaire des autres.

101

V Résolution des systèmes

V.1 Résolution des systèmes homogènes

On a ainsi notre premier résultat

Proposition V.1 (Existence d’une solution non nulle)

Soient 1 6 m < n, et B ∈ Mm,n(R). Le système linéaire homogène (Σ) : BX = 0 à nvariables et m équations admet toujours une solution non nulle.

Démonstration : Grâce à l’algorithme de Gauss, on sait qu’il existe une matrice échelonnée A appartenantà Mm,n(R) telle que (Σ) est équivalent à AX = 0. On conclut alors avec la proposition III.4.

A l’opposé, lorsque r = n, il n’y a aucune variable libre et la dernière ligne donne xn = 0 et ainsila seule solution du système est la solution nulle. Résumons :

Théorème V.2 (du rang)

Soient m,n ∈ N∗, A ∈Mm,n(R).B kerA = O ⇐⇒ Rang A = n.B Si r = Rang A < n, l’ensemble de solutions est paramétré par n− r variables libres. Il est

dit de dimension n− r :dim kerA+ Rang A = n.

V.2 Résolution des systèmes linéaires

Tout système linéaire en X ∈ Rn : AX = B, où A ∈ Mm,n(R) et B ∈ Rm est équivalent à un

système UX = C, où U ∈Mm,n(R) est échelonnée et C =

c1...cm

∈ Rm. Intéressons-nous donc à

un tel système en reprenant les notations de (9.1). En particulier, r sera le rang de U , et donc aussicelui de A.B En lisant les m − r dernières lignes, on voit qu’il existe une condition nécessaire de compa-

tibilité (i.e une CN pour que l’ensemble de solutions de (Σ) soit non vide), et que celle-ciest :

SolΣ 6= ∅ =⇒ cr+1 = . . . = cm = 0.

B La réciproque est également vraie, i.e

SolΣ 6= ∅ ⇐= cr+1 = . . . = cm = 0.

En effet, si cr+1 = . . . = cm = 0 alors en affectant la valeur 0 (par exemple) aux variableslibres (s’il y en a) et en remontant le système, on construit un vecteur solution.

Nous avons prouvé :

Propriétés V.3

Soit un système en X ∈ Rn :

UX = C, où U ∈ Mm,n(R) est échelonnée et C =

c1...cm

∈ Rm. Notons r le rang de U .

Alors :SolΣ 6= ∅ ⇐⇒ cr+1 = . . . = cm = 0

Nous désignerons la nullité de ces m− r scalaires par l’expression conditions de compatibilité.Pour les puristes, finissons par des caractérisations plus fines :

Théorème V.4

Soit le système linéaire AX = B, où X =

x1...xn

, B =

b1...bm

et A ∈ Mm,n(R). Notons r le

rang de A. Alors

102

1. Il y a unicité des solutions ssi r = n.

2. Pour un choix donné de b, il y a existence de solutions ssi les conditions de compatibilitésont assurées.

3. Il y a existence des solutions pour tout choix de B ∈ Rm ssi r = m.

4. Pour tout choix de B ∈ Rm, il y a existence et unicité des solutions ssi r = m = n.

Démonstration : 1. Il n’y a alors aucune variable libre et donc au plus une solution pour chaque choixde B ∈ Rm.

2. Déjà vu.

3. Il n’y a en effet ici aucune condition de compatibilité.

4. On condense 1. et 3.

103

Chapitre 9

Les Espaces Vectoriels et ladimension finie

I Le langage

I.1 Définition axiomatique

Grosso modo, un espace vectoriel est un ensemble dans lequel on dispose de quoi faire descombinaisons linéaires.Définition I.1

Soit K = R ou C. Un ensemble E est dit espace vectoriel sur K lorsqu’il vérifie les hypothèsessuivantes :

1. Il existe une loi interne notée + sur E telle queB (x+ y) + z = x+ (y + z), (associativité)B x+ y = y + x, commutativitéB Il existe un unique élément neutre noté 0E .B Tout x ∈ E possède un symétrique.

2. Il existe une loi externe K× E → E notée λ.x telle que :

(a) a(bx) = (ab)x,

(b) a(x+ y) = ax+ ay,

(c) (a+ b)x = ax+ bx,

(d) 1x = x.

Le 1. de cette définition signifie de manière condensée que (E,+) est un groupe abélien.Nous réserverons la notation 0 pour l’élément neutre pour l’addition dans K.Les éléments de E sont les vecteurs, et ceux de K sont les scalaires.

I.2 Un principe essentielProposition I.2

Si a est un scalaire et x un vecteur, alors

a.x = 0E ⇐⇒(a = 0 ou x = 0E

).

Démonstration : 0.x + 0.x = 0.x et a.0E + a.0E = a.0E prouvent le sens direct, puisque le seul élémentdans un groupe qui soit égal à son double est l’élément neutre. Puis si a 6= 0, et a.x = 0E , alorsa−1.(a.x) = a−1.0E ⇒ (a−1 × a).x = 0E ⇒ x = 0E . On a ici utilisé 2a, 2d et la proposition I.2.

104

I.3 Premiers exemples

B Les matrices, un exemple d’algèbre linéaire : Soient n, p ∈ N∗, et E = Mn,p(K) l’en-semble des matrices à coefficients dans K, à n lignes et p colonnes est un K−espace vectoriellorsqu’on le munit des deux lois :– ∀A = (ai,j), B = (bi,j) ∈ E,A+B = (ai,j + bi,j) ∈ E.– ∀A = (ai,j), λ ∈ K, λ.A =

(λ× ai,j

)∈ E.

Nous vous laissons le plaisir de le prouver. En particulier, l’ensemble des vecteurs colonne Knest un K−ev.

B Les fonctions, un exemple analytique : Soit I un ensemble quelconque. L’ensemble E =F (I,K) des fonctions de I dans K, muni des lois usuelles d’addition et de multiplication parun scalaire est un K−ev. On peut généraliser un peu en remarquant que si F est un K−ev,alors F (I, F ) est aussi un K−ev.

I.4 Les sous-espaces vectoriels

La notion de sev va nous permettre de prouver à moindre frais que des ensembles ont unestructure d’espace vectoriel, en prouvant qu’ils héritent de celle qui existe sur certains espaces plusgros, et qui eux sont notoirement des ev.

Définition I.3 (Sous-espace vectoriel)

Soit F ⊂ E. F est un sous espace vectoriel de E lorsque, muni des deux lois + et . qui existentdans E, il est lui aussi un espace vectoriel.

Nous utiliserons donc plutôt :

Proposition I.4 (Une caractérisation des sev)

Soit E un K−ev et F ⊂ E. Alors F est un sev de E si et seulement si

1. 0E ∈ F .

2. ∀x, y ∈ F , ∀α, β ∈ K, α.x+ β.y ∈ F .

Autrement dit, une partie de E est un sev précisément lorqu’elle contient 0E et qu’elle est stablepar combinaison linéaire.B OE et E sont des sev de E dits triviaux.B Dans l’espace R3, nous connaissons deux autre stypes d’exemples :

1. Les droites vectorielles : λ.X, où λ ∈ R, X étant un vecteur non nul.2. Les plans vectoriels : λ.X + µ.Y, où λ, µ ∈ R, X,Y étant deux vecteurs non coli-

néaires.B Soit I un intervalle de R. Pour tout k ∈ N,

C k(I,R) est un sous-espace vectoriel de F (I,R)

car la fonction nulle est de classe C k, et toute combinaison linéaire de fonctions C k l’estaussi. Nous avions finalement déjà démontré des théorèmes d’algèbre linéaire dans le coursd’analyse.

B Tout ensemble de solutions d’une équation différentielle linéiare d’ordre 1 ou 2 sur un inter-valle I est un sous-espace vectoriel de F (I,R).

Retour en grâce des systèmes linéaires, qui nous fournissent un exemple majeur de sous-espacevectoriel :Proposition I.5 (Structure de Sol d’un système homogène linéaire sur Kn)

L’ensemble de solutions d’un système linéaire homogène sur K à n inconnues et p équations estun sous-espace vectoriel de Kn.

Démonstration : Commençons par le cas p = 1. Soient n ∈ N∗. Fixons a1, . . . , an n scalaires. L’ensemble

F = ł

x1...xn

, tels quen∑i=1

aixi = 0Σ (9.1)

105

des solutions d’une équation linéaire homogène est un sous-espace vectoriel de Rn car :

1.

0...0

∈ F carn∑i=1

ai × 0 = 0.

2. Soient

x1...xn

et

x′1...x′n

∈ F , et α, β ∈ R. Alors α.

x1...xn

+ β.

x′1...x′n

=

αx1 + βx′1...

αxn + βx′n

∈ F ,

carn∑i=1

ai(αxi + βx′i

)= α

n∑i=1

aixi + β

n∑i=1

aix′i = 0.

Quant aux systèmes linéaires, leur ensemble de solutions est une intersection de p ensembles dutype 9.1. Or, nous verrons qu’une intersection de sous-espace vectoriel de E est un sous-espacevectoriel de E.

II Espaces vectoriels finiment engendrés

II.1 GénérateursDéfinition II.1 (Combinaison linéaire)

Soient E un K− espace vectoriel , n ∈ N∗, et e1, . . . , en des vecteurs de E. On appelle combi-naison linéaire de la famille de vecteurs F = (e1, . . . , en) tout vecteur qui s’écrit sous la forme∑16i6n

xiei, où xi ∈ K.

On note alors leur ensemble

Vect (e1, . . . , en) =

∑16i6n

xiei, où xi ∈ K

.

C’est le deuxième exemple, après celui fourni par les systèmes linéaires, de sous-espace vectorielen dimension finie :Proposition II.2 (Sev engendré par une famille)

Soient E un K− espace vectoriel , n ∈ N∗, et e1, . . . , en des vecteurs de E.B Vect (e1, . . . , en) est un sous-espace vectoriel de E.B Soit F un sous-espace vectoriel de E.

Si ∀i ∈ [[1, n]], ei ∈ F alors Vect (e1, . . . , en) ⊂ F.

Littéralement, Vect (e1, . . . , en) est le plus petit (au sens de l’inclusion) sous-espace vecto-riel de E contenant F .

Définition II.3 ( sous-espace vectoriel engendré par une partie)

Soient E un K− espace vectoriel , n ∈ N∗, et F = (e1, . . . , en) une famille de vecteurs de E.

1. L’ensemble Vect (F ) est appelé sous-espace vectoriel engendré par la famille F .

2. On dit que F est une famille génératrice de E lorsque

∀X ∈ E,∃x1, . . . , xn ∈ K tels que X = x1e1 + . . .+ xnen.

i.e lorsque E = Vect (e1, . . . , en).

106

1. Montrer que

Vect ł

100

,

010

,

001

Σ = Vect ł

100

,

110

,

111

Σ = R3.

2. Montrer que, dans C 0(R,R), Vect (exp, f) = Vect (cosh, sinh), où f : x ∈ E 7→ e−x.

Rappelons les trois opérations élémentaires que l’on peut effectuer sur une famille de vecteursF = (e1 . . . , en) :

1. ei ↔ ej pour tout i 6= j.

2. ei → ei + cej pour tout c ∈ K.

3. ei ← c.ei , pour tout c ∈ K∗.

Propriétés II.4 (Stabilité de Vect par les opérations élémentaires)

Soient (e1, . . . , en) des vecteurs d’un K-ev E. Alors

1. Vect (e1, . . . , en) est stable pour toute opération élémentaire sur la famille (e1, . . . , en).2. Quels que soient c1, . . . , cn−1 ∈ K,

Vect (e1, . . . , en−1, en) = Vect

(e1, . . . , en−1, en +

n−1∑i=1

ci.ei

).

3. en ∈ Vect ł(e1, . . . , en−1Σ)⇐⇒ Vect (e1, . . . , en−1, en) = Vect (e1, . . . , en−1) .

Démonstration : 1. Pour la première opération élémentaire, c’est une conséquence de la commutativitéde l’addition dans E. Pour la deuxième, notons F = Vect (e1, e2, . . . , en), et F ′ = Vect (e1 +ce2, e2, . . . , en). Puisque tous les vecteurs de F ′ sont des combinaisons linéaires de vecteurs deF , i.e appartiennent à Vect F et que Vect F est un sous-espace vectoriel de E, Vect F ′ ⊂Vect F (on a appliqué ici le deuxième point de la proposition II.2). L’autre inclusion s’obtient parle même argument, en remarquant que e1 = 1.

(e1 + c.e2

)+ (−c).e2 ∈ Vect F ′.

2. C’est une conséquence de ce qui précède, puisque le vecteur en +∑n−1

i=1 ci.ei s’obtient en faisantn− a opérations élémentaires (du deuxième type) successives à la famille F .

3. Notons F = ł(e1, . . . , en−1Σ) et F ′ = ł(e1, . . . , en−1, enΣ). Puisque F ⊂ F ′, Vect F ⊂ Vect F ′.⇐ : Si Vect F = Vect F ′, alors en étant un élément de F , donc de Vect F , il appartient à

Vect F ′.⇒ : Si en ∈ Vect F , toute la famille F ′ appartient au sous-espace vectoriel Vect F ′, et donc

Vect F ⊂ Vect F ′. C’était l’inclusion qui nous manquait.

Revenons aux systèmes linéaires non homogènes en donnant une interprétation de leur consis-tance en terme de sous-espace vectoriel engendré :

Proposition II.5

Soit A ∈Mm,n(R), et C1, . . . , Cn ∈ Rm ses colonnes. Soit B ∈ Rm et SB l’ensemble de solutionsX ∈ Rn du système AX = B. AlorsB SB 6= ∅ ⇐⇒ B ∈ Vect (C1, ...Cn).B(∀B ∈ Rm,SB 6= ∅

)⇐⇒ Vect (C1, ...Cn) = Rm.

Démonstration : Soient X =

x1...xn

∈ Rn, B =

b1...bm

et Cj =

a1j...

amj

et ∈ Rm, ∀j ∈

[[1,m]].On peut écrire le système sous la forme

x1

a11...

am1

+ . . .+ xn

a1n...

amn

=

b1...bm

,

107

ou plus simplementx1C1 + . . . xnCn = B.

II.2 Indépendance linéaire

Définition II.6 (Familles libres/liées)

La famille (e1, . . . , en) de vecteurs de E est dite libre lorsque

∀x1, . . . , xn ∈ K, sin∑i=1

xiei = 0, alors x1 = . . . = xn = 0.

Une famille est dite liée ou linéairement dépendante lorsqu’elle n’est pas libre.

Ainsi, E est libre si et seulement si la seule combinaison linéaire nulle de vecteurs de E est la com-binaison triviale.

B Les lignes non nulles d’une matrice échelonnée.B Une famille (e1, . . . , ep) de vecteurs échelonnés de Rn, ne contenant pas le vecteur nul. On dit

qu’elle est échelonnée lorsque la fonction k : i ∈ [[1, p]] 7→ ki ∈ N est strictement croissante,où ki = max łk ∈ [[1, n]] tels que ei(k) 6= 0Σ.

B La base canonique de Rn.B ł(x 7→ cos 2x, x 7→ sin2, x 7→ 4Σ) n’est pas une famille libre de C 0(R,R).Voici une condition suffisante, et facile à vérifier, pour qu’une famille de polynômes soit libre :

Proposition II.7

Soit (P1, . . . , Pn) une famille de polynomes ∈ K[X].Si ∀i, j ∈ [[1, n]], i 6= j ⇒ degPi 6= degPj , alors cette famille est libre.

Démonstration : On ordonne les polynomes selon leurs degré croissants, et on fait une récurrence sur n.

II.3 Dimension

Notons les comportements des deux qualificatifs dont nous avons affublé aux familles par rap-port à la relation d’inclusion : Si F et E sont deux familles de vecteurs telles que F ⊂ E , alorsB Si F est génératrice de E, alors E est génératrice de E.B Si E est libre, alors F est libre.Combinons ces deux notions :

Proposition II.8

Soient n,m ∈ N∗ et E un K− espace vectoriel . On suppose que n > m.Une famille de n vecteurs dans un espace engendré par m vecteurs est liée.

Démonstration : utilise que un système homogène de m équations à n inconnues possède une solutionnon nulle.

Le résultat précédent implique : Une famille d’un espace vectoriel E possédant strictement plus d’éléments qu’une famille

génératrice est liée. Toute famille libre de Vect (e1, . . . , en) possède au plus m éléments.

Définition II.9 (Base et espace vectoriel finiment engendré)

On appelle base de E toute famille libre et génératrice de E.Un espace vectoriel est dit finiment engendré lorsqu’il possède une famille génératrice decardinal fini.

108

Par exemple, Rn[X] est finiment engendré, car il l’est par la base canonique, mais R[X] ne l’estpas car les degrés des polynômes de cet espace vectoriel ne sont pas bornés. Après le théorèmesuivant, nous remplacerons “finiment engendré” par “de dimension finie”.

Théorème II.10 (Existence de bases)

Soit E un K− espace vectoriel finiment engendré. Alors,

1. E possède une base.

2. Toutes les bases de E ont même cardinal. On appelle leur cardinal commun dimensionde E.

Démonstration : 1. Notons

Ω = ł Familles F finies génératrices de EΣ,A = łCard (F ) où F parcourt ΩΣ.

Puisque E est finiment engendré, Ω est non vide, et A est alors une partie non vide de N. Elleadmet donc un minorant, i.e il existe F0 ∈ Ω telle que ∀F ∈ Ω,Card F > Card F0. Alors F0 estune base. En effet, elle est génératrice en tant qu’élément de Ω, et c’est la propriété de minimalitéde son cardinal qui en fait une famille libre : Soit e ∈ F0, et F0 la famille obtenue en enlevant eà F0. F0 n’est pas génératrice de E car son cardinal est < Card F0. Donc Vect F0 6= Vect F , sibien que d’après le 3ème point de la proposition II.4, e n’est pas combinaison linéaire des autresvecteurs de F0.

2. Soient B et C deux bases de E. Puisque B engendre E et C est libre, Card B > Card C . Et parsymétrie, on obtient l’autre inégalité.

B K est un K− espace vectoriel de dimension 1.B Kn est un K− espace vectoriel de dimension n. On appelle base canonique de Kn la famille

B0 = ł

10...0

,

01...0

, . . . ,

00...1

Σ

B ∀n, p ∈ N∗,Mn,p(K) est un K− espace vectoriel de dimension n × p. On appelle base cano-nique de cet espace vectoriel la famille de matrices

(Ei,j

)pour (i, j) ∈ [[1, n]] × [[1, p]], où

Ei,j ∈ Mn,p(K) a tous ses coefficients nuls, sauf celui situé sur la i−ème ligne et la j−èmecolonne, qui vaut 1.

B ∀n ∈ N,Kn[X] est un K− espace vectoriel de dimension n + 1. Sa base canonique est B0 =(1, X,X2, . . . , Xn).

B Si E et F sont deux K− espace vectoriel de dimension finie, alors E × F est un K− espacevectoriel de dimension dimE × dimF .

109

Remarques :

B Les lignes non nulles d’une matrice échelonnée U obtenue par un algorithme de Gaussà partie d’une matrice A forment une base de l’ espace vectoriel engendré par leslignes de A, qui est aussi l’ espace vectoriel engendré par les lignes de l’ espace vecto-riel engendré par les lignes de U . Ainsi, le rang de la matrice A est la dimension del’espace engendré par ses lignes Vect (L1, . . . , Ln), si bien que ce rang est indépen-dant des choix effectués dans l’algorithme de Gauss.

B Soit S l’ensemble de solution d’un système AX = 0 où A ∈ Mn,p. AlorsdimS = n− r . Il suffit pour le voir de prendre les valeurs 1, 0..0 puis 0, 1, 00 aux

variables libres pour obtenir une base de S.B Tout C− espace vectoriel E de dimension n est un R− espace vectoriel de

dim 2n. En effet, si (e1, . . . , en) est une base du C− espace vectoriel E, alors(e1, i.e1, e2, i.e2, . . . , en, i.en) est une base du R− espace vectoriel E.

La dimension n d’un K− espace vectoriel apparaît donc à la fois comme le cardinal de toutebase de E. On sait de plus que au-delà de n toutes les familles sont liées et en-deça de n, aucunen’est génératrice. Nous donnons maintenant une caractérisation des familles libres (respectivementgénératrices) de cardinal maximal (respectivement minimal) :

Théorème II.11

Soit E un K−ev de dimension n > 1 et F une famille de vecteurs de E. Alors

1. F est une base si et seulement si elle est libre et de cardinal n.

2. F est une base si et seulement si elle est génératrice de E et de cardinal n.

Démonstration : Dans chacune des affirmations, nous ne monterons que la réciproque.

1. Soit X ∈ E. La famille F ∪ X est de cardinal n + 1, donc est liée, i.e X est combinaisonlinéaire des vecteurs de la base F .

2. Si F est génératrice et de cardinal n, elle ne peut être liée car sinon un de ses vecteurs seraitcombinaison linéaire des autres, et en le retirant de la famille F , on obtiendrait une famille decardinal n − 1 qui engendre le même espace que F , i.e qui serait génératrice de E. On sait quececi est impossible depuis la proposition II.8.

Résumons ce que l’on sait sur les cardinaux des familles d’un K− espace vectoriel de dimensionfinie E : Une famille libre de cardinal maximal est une base, i.e si F est une famille libre :

]F 6 dimE et]F = dimE ⇐⇒ F est une base.

.

Une famille génératrice de cardinal minimal est une base, i.e si F est une famille génératrice :]F > dimE et]F = dimE ⇐⇒ F est une base.

.

On peut traduire la liberté d’une famille avec le seule notion de rang :

Proposition II.12 (Rang d’une famille de vecteurs)

Pour toute famille (e1, . . . , ep) de vecteurs de E, on appelle

Rang (e1, . . . , ep) = dim Vect (e1, . . . , ep) .

110

On a alors

1. Rang (e1, . . . , ep) 6 p.2. Rang (e1, . . . , ep) = p⇐⇒ (e1, . . . ep) est libre.

Démonstration : Notons F = Vect (e1, . . . , ep).1. (e1, . . . , ep) est une famille génératrice de F , donc de cardinal supérieur ou égal à la dimension

de cet espace vectoriel .

2. Si (e1, . . . , ep) est libre, elle forme une famille libre et génératrice de F , donc son cardinal coïn-cide avec la dimension de cet espace. Réciproquement, si (e1, . . . , ep) est de rang p, la famille(e1, . . . , ep) est génératrice de F et son cardinal est égal à dimF , donc c’en est une base d’aprèsle théorème II.11.

Les bases ont un intérêt essentiel en ce qu’elles founissent une bijection entre E et Rn :

Théorème II.13 (Coordonnées dans une base)

Soit B = (e1, . . . , en) une base de E. Alors

∀X ∈ E,∃!(x1, . . . , xn) ∈ Kn tel que X = x1.e1 + . . . xn.en.

(x1, . . . , xn) est appellé système de coordonnées de X dans la base B.

Démonstration : L’existence du n−uplet est exactement la définition du caractère générateur de la fa-mille. Montrons qu’il est unique en prenant deux n−uplets (x1, . . . , xn) et (x′1, . . . , x′n) tels que X =x1.e1 + . . . xn.en = x′1.e1 + . . . x′n.en. En soustrayant la deuxième égalité à la première, (x1 − x′1).e1 +. . . (xn − x′n).en = 0E , si bien que la liberté de B implique l’égalité des deux n−uplets.

Théorème II.14 (Base incomplète)

Soit E un K− espace vectoriel de dimension n ∈ N∗, et (e1, . . . , ep) une famille libre de vecteursde E. Alors il existe ep+1, . . . , en ∈ E tels que (e1, . . . , ep, ep+1, . . . , en) soit une base de E.

Démonstration : Notons Ω = ł Familles F libres de E contenant ei, ∀1 6 i 6 pΣ et A l’ensemble descardinaux de ces familles. A est une partie non vide de N, car contenant p, et majorée par n. Ellepossède donc un maximum 6 n, et toute la question est de prouver que ce maximum est n, puisqu’unefamille libre de cardinal n est une base. Notons donc F0 ∈ Ω telle que n = Card F0. Si F0 n’est pasde cardinal n, elle est libre et non génératrice, donc en lui ajoutant un vecteur qui n’appartient pas àVect F0, on obtient une famille de Ω de cardinal > à celui de F0. Absurde.

III Miscellaneous sur les sous-espaces vectoriels

III.1 Dimension et sous-espace vectoriel

Fort heureusement, notre définition de la dimension respecte le minimum de ce que l’on enattendait, à savoir la croissance sur l’ensemble des sous-espace vectoriel :

Théorème III.1 (Croissance de la dimension)

Soit n ∈ N∗ et E un K−ev de dimension n. Alors, pour tout sous-espace vectoriel F de E :

1. F est de dimension finie et dimF 6 n.

111

2. dimF = n⇐⇒ F = E.

Démonstration : 1. En considérant à nouveau l’ensemble des familles libres de F , on montre qu’il enexiste une de cardinal maximal, et que celle-ci est génératrice de F . D’où le premier point.

2. Si dimF = n, toute base de F est une famille libre de E à dimE éléments, c’en est donc unebase.

Tout sous-espace vectoriel de R3 est soit 0R3, soit E, soit une droite vectorielle, soit un planvectoriel. Nous avions déjà prouvé que ces quatre types de parties de R3 étaient des sous-espacesvectoriels . Ce sont les seuls car tout sous-espace vectoriel de R3 a pour dimension 0, 1, 2 ou 3.

III.2 Intersections et sommes de sous-espaces vectoriels

Définition III.2 (Somme de sous-espaces vectoriels )

Soit E un K−ev. Soient F et G deux sous-espaces vectoriels de E. On note

F +G = x+ y, où x ∈ F, y ∈ G.

Proposition III.3

Soit E un K−ev. Soient F1, . . . , Fp des sous-espaces vectoriels de E. Alors

1. Une intersection de sous-espaces vectoriels est encore un sous-espace vectoriel : ∩pi=1Fi est un sous-espace vectoriel .

2. (a) F1 + F2 est un sous-espace vectoriel de E.

(b) Si F1 ⊂ F3 et F2 ⊂ F3, alors F1 + F2 ⊂ F3.

Le point 2. signifie que F1 + F2 est le plus petit sous-espace vectoriel de E contenant à la foisF1 et F2, i.e :

F1 + F2 = Vect (F1 ∪ F2)

B Montrer sur un exemple que la somme d’une droite et d’un plan ne la contenant pas dansl’espace R3 est égale à R3.

B L’ espace vectoriel des fonctions F (R,R) est la somme de ses deux sous-espaces vectoriels Iet P , où P est l espace vectoriel des fonctions paires et I celui des fonctions impaires.

B Mn(R) = Sn + An.

Propriétés III.4 (des lois ∩,+ sur les sous-espaces vectoriels )

Soit E un K− espace vectoriel et F1, F2, F3 trois sous-espaces vectoriels de E. AlorsB F2 + F1 = F1 + F2.B F1 ∩ F2 ⊂ F1 ⊂ F1 + F2.B F1 ⊂ F2 ⇐⇒ F1 + F2 = F2.B F1 + 0E = F1 et F1 + E = E.B(F1 + F2

)+ F3 = F1 +

(F2 + F3

).

Démonstration :

Proposition III.5 (Formule de Grassmann)

Soit E un K− espace vectoriel et F1, F2 deux sous-espaces vectoriels de E. Alorsdim

(F1 + F2

)= dimF1 + dimF2 − dim

(F1 ∩ F2

).

Démonstration :

III.3 Somme directe et supplémentaires

Nous savons que pour tout vecteur vecteur de F +G, il existe un couple (y, z) ∈ F ×G tel quez = x+ y. La définition suivante va répondre à la question de l’unicité de ce couple.

Définition III.6 (Somme directe)

Soit E un K− espace vectoriel et F,G deux sous-espaces vectoriels de E. On dit que F et G sont

112

en somme directe lorsque F ∩G = 0E. On note alors leur somme F ⊕G, plutôt que F +G.

Proposition III.7 (Unicité de la décomposition)

Soit E un K− espace vectoriel et F,G deux sous-espaces vectoriels de E. Alors

F ∩G = 0E ⇐⇒(∀z ∈ F +G,∃ un unique couple (x, y) ∈ F ×G tel que z = x+ y

)

Démonstration :

Définition III.8

Deux sous-espaces vectoriels de E sont dits supplémentaires dans E lorsque E = F + G etF ∩G = 0E, ce que l’on note E = F ⊕G.

En termes de décomposition, cela donne :

E = F ⊕G⇐⇒(∀z ∈ E,∃ un unique couple (x, y) ∈ F ×G tel que z = x+ y

).

Définition III.9 (hyperplans)

Soit E un K− espace vectoriel . Soi H un sous-espace vectoriel de E. On dit que H est unhyperplan de E lorsque

∃x0 ∈ E tel que E = H ⊕ Vect (x0).

Remarques :

B On se convaint facilement que siH est un hyperplan, pour tout vecteur x n’appartenantpas à H, la droite Vect (x0) est un supplémentaire de H.

B Soit x0 ∈ R. L’ensembleH des fonctions s’annulant en x0 est un hyperplan de F (R,R).

III.4 Supplémentaires en dimension finie

D’après la formule sur les sommes de dimension,

Théorème III.10

Soit E un espace vectoriel de dimension finie n.• Tout sous-espace vectoriel de E possède au moins un supplémentaire.• La somme des dimensions de deux sous-espaces vectoriels supplémentaires est n.

Proposition III.11

Soit E un ev de dimension finie n et F et G deux sev de E. Les trois propositions suivantes sontéquivalentes :• E = F ⊕G.• F +G = E et dimF + dimG = n.• F ∩G = 0E et dimF + dimG = n.

Corollaire III.12

Si E est de dimension finie et H un sev de E. AlorsB H est un hyperplan ssi dimH = n− 1.B Toute droite non incluse dans H fournit un supplémentaire de H.

113

III.5 Sous-espaces affines

Définition III.13

Soit E un K− espace vectoriel , et F ⊂ E. On dit que F est un sous-espace affine de E lorsquel’une des assertions équivalentes suivantes est vérifiée :

1. Il existe x0 ∈ E tel que F := x− x0 où x parcourt F est un sous-espace vectoriel de E.

2. Pour tout x0 ∈ E, F := x− x0 où x parcourt F est un sous-espace vectoriel de E.

Le sous-espace vectoriel F est alors unique, se note parfois−→F , et est appelé ensemble des

directions de F .

F = x0 +−→F .

114

Chapitre 9

Les Applications Linéaires

Motivation : Le fait que l’ens des sols d’un système homogène est un sev provient de ce que LA : x→ Ax

transforme les CL d’im en im de CL.

I La linéarité

I.1 DéfinitionDéfinition I.1 (Applications linéaires)

Soient E,F deux K− espaces vectoriels . Une application f : E → F est dite linéaire lorsque

∀x, y ∈ E,∀λ, µ ∈ K, f(λx+ µy) = λf(x) + µf(y).

SiE = F , on dit que f est un endomorphisme. On note L (E,F ) l’ensemble des applicationslinéaires entre E et F , et L (E) = L (E,E) l’ensemble des endomorphismes de E.

Remarques :

B Si f ∈ L (E,F ), alors f(0E) = 0F . En effet, y = f(0E) vérifie y + y = y, et on saitque dans un groupe, l’élément neutre est le seul qui vérifie cette équation.

B f : E → F est donc linéaire⇔ elle est à la fois

1. homogène : f(λ.x = λ.f(x), et

2. additive : f(x+ y) = f(x) + f(y),i.e finalement ⇐⇒ elle préserve la structure d’ espace vectoriel . On appelle aussimorphismes d’ espaces vectoriels les applications linéaires.

B La définition se généralise aux combinaisons linéaires finies : si f est linéaire,

∀a1, . . . , an ∈ K,∀e1, . . . en ∈ E, f

(n∑i=1

aiei

)=

n∑i=1

aif(ei).

B Interprétation géométrique : En regardant l’image de vt = tx + y où t parcourt R,on voit qu’une application linéaire transforme toute droite affine de E en une droiteaffine de F .

I.2 Exemples

Nous en avons rencontré un grand nombre :

115

1./ f : R→ R est une application linéaire⇐⇒ il existe a ∈ R tel que f : x ∈ R 7→ ax ∈ R.2./ Tout espace vectoriel E admet pour endomorphisme l’application identité IdE : x ∈ E 7→ x ∈

E.

3./ Les formes linéaires sont les applications naturelles sur E

Définition I.2 (Formes Linéaires)

Soit E un K− espace vectoriel . On appelle forme linéaire sur E toute application linéaireϕ : E → K.

La description des formes linéaires sont Kn est la suivante :

Proposition I.3 (Formes linéaires sur Kn)

ϕ : Kn → K est une forme linéaire sur Kn si et seulement si

il existe a1, . . . , an ∈ K tels que ϕ :

x1...xn

∈ Kn 7→n∑i=1

aixi ∈ K.

Démonstration : Je vous laisse la linéarité de ce type d’applications, soit ⇐ . Si ϕ est une forme linéairesur Kn, notons (e1, . . . , en) la base canonique de cet espace vectoriel et pour tout i ∈ [[1, n]], ai = f(ei).La linéarité nous donne donc

f

x1...xn

= f ł(n∑i=1

xieiΣ) =n∑i=1

xif ł(eiΣ) =n∑i=1

xiai.

4./ Soient n, p ∈ N∗ et A = (ai,j) ∈Mn,p(K). Notons LA : X ∈ Kp → AX ∈ Kn, où,

LA

x1...xp

=

a11 a12 . . . a1pa21 a22 . . . a2p...

......

an1 an2 . . . anp

x1

...xp

=

p∑j=1

a1,jxj

...p∑j=1

an,jxj

∈ Kn.

Alors pour tous X,Y ∈ Kp,∀λ, µ ∈ K, LA(λ.X + µ.Y ) = λLA(X) + µLA(Y ).LA est l’application linéaire (endomorphisme si n = p) canoniquement associé a A.Notons que dans le cas où n = 1, A est une matrice-ligne, et on retrouve les formes linéaires sur Kn. Nous verrons

que, tout comme dans ce cas, toute application linéaire de Kp dans Kn est de cette forme.

Ainsi, résoudre le système AX = B, où B ∈ Kp, c’est finalement rechercher les antécédents deB par l’application f , i.e Sol = LA

−1(B). Le système possède au moins une solution⇐⇒ LAest surjective, et il en possède au plus une⇐⇒ LA est injective.

5./ Soit x0 ∈ R. On appelle opérateur d’évaluation en x0 l’application

Ex0 : f ∈ F (R,R) 7→ f(x0) ∈ R.

Ex0 est une forme linéaire sur F (RR).6./ Soit I un intervalle de R.

La dérivation D D1(I,R) −→ F (I,R)f 7−→ f ′

est une application linéaire.

7./ Soit I un intervalle de R et a, b ∈ I.L’intégrale I C 0

m(I,C) −→ C

f 7−→∫ b

a

f(t)dt

est une forme linéaire.

8./ Soit θ ∈ R. Notons Rθ la rotation.

116

II Structure, image et noyau

II.1 Structure de L (E, F ).Proposition II.1 (L (E, F ) est un espace vectoriel )

Soient E et F deux K− espaces vectoriels . L’ensemble L (E,F ) des applications linéaires de Edans F est un sous-espace vectoriel de F (E,F ).

Démonstration : L’application nulle est bien évidemment linéaire. Soient f, g ∈ L (E,F ), a, b ∈ K. Ils’agit de montrer que a.f + b.g est aussi linéaire, ce qui ne pose aucun difficulté.

Proposition II.2 (L (E) est stable par composition)

Soit E un K− espace vectoriel . Soient f et g deux endomorphismes de E. Alors f g est unendomorphisme de E.

Les puissances d’un endomorphisme f seront encore notés fn, pour tout n ∈ N.B Montrer que D : P 7→ P ′ est un endomorphisme de E = Rn[X], et que Dn+1 = 0L (E).B Montrer que D : P 7→ P ′ est un endomorphisme de E = R[X], et que ∀n ∈ N, Dn 6= 0L (E).

II.2 Images et noyaux

Remarques :

B f : E → F et X ⊂ E. On note

f(X) = f(x) où x ∈ X l’image directe de X par f .

L’image de E est f(E). On la note Im f . Rappelons enfin que f est surjective ssiIm f = E.

B f : E → F et Y ⊂ F . On note

f−1(Y ) = x ∈ E tels que f(x) ∈ Y On l’appelle image inverse de Y par f .

Elle ne nécessite pas l’inversibilité de f .B Avec ces notations, on a ainsi f(X) ⊂ F et f−1(Y ) ⊂ E.

Dans le cadre linéaire, ces deux notions sont compatibles avec la structure :

Propriétés II.3

Soient E et F deux K− espaces vectoriels , et f : E → F une application linéaire.

1. Soit W un sous-espace vectoriel de F . L’image inverse f−1(W ) de W par f est un sous-espace vectoriel de E.

2. Soit V un sous-espace vectoriel de E. L’image directe f(V ) de V par f est un sous-espacevectoriel de F .

Corollaire II.4 (L’image et le noyau sont des sous-espaces vectoriels )

Soient E et F deux K− espaces vectoriels , et f : E → F une application linéaire. Alors :

1. ker f =x ∈ E tels que f(x) = 0F

est un sous-espace vectoriel de E. On l’appelle le

noyau de f .2. Si Im f est de dimension finie, on appelle rang de f sa dimension.3. Im f = f(E) = f(x) où x ∈ E est un sous-espace vectoriel de F . Autrement dit :

∀y ∈ F, y ∈ Im f ⇐⇒ ∃x ∈ E tel que y = f(x).

117

B L’ensemble des solutions du système linéaire homogène associé à une matriceA ∈Mn,p est lenoyau de LA ∈ L (Rp,Rn). On retrouve ainsi sa structure de sous-espace vectoriel de Rp. Ondira souvent noyau de la matrice , plutôt que noyau de l’aplication linéiare canoniquementassociée à A.

B f ∈ F (R,R) telles que f(π) = 0 est le noyau de l’opérateur d’évaluation en x0.

B łf ∈ F (R,R) telles que∫ 1

0f(t)dt = 0Σ est le noyau de l’intégrale.

Dans le cas où f = LA :

Proposition II.5 (Image et Noyau d’une matrice)

Soit A ∈Mn,(K). Notons C1, . . . , Cp ses colonnes.

1. Le noyau de LA est l’ensemble de solutions de AX = 0.

2. L’image de LA est Vect (C1, . . . , Cp).

Dans le cadre linéaire, l’injectivité et la surjectivité d’une application se traduit par des égalitésde sous-espaces vectoriels :

Proposition II.6 (Injectivité et surjectivité d’une application linéiare)

Soient E et F deux K− espaces vectoriels , et f : E → F une application linéaire. Alors :B f est injective⇐⇒ ker f = 0E.B f est surjective ⇐⇒ f(E) = F .

III La linéarité en dimension finie

III.1 Comment construire une application linéaire

Pour toute famille E = (e1, . . . ep) de E, on appelle image de E par l’application linéaire f lamaille (f(e1), . . . , f(ep)).

Si E est une base de E, alors

Si(e1, . . . ep

)est une base de E, alors Im f = Vect

(f(e1), . . . f(ep)

),

si bien que coincident alors nos deux notions de rang :

Si(e1, . . . ep

)est une base de E, alors Rang f = Rang

(f(e1), . . . f(ep)

),

Le lemme suivant explique que la connaisance de l’image d’une famille génératrice E de E parune application linéaire f détermine complètement cette application linéaire :

Lemme 5

Soient E et F deux K− espaces vectoriels , f, g ∈ L (E,F ), et E = (e1, . . . , ep) une famillegénératrice de E.Si ∀i ∈ [[1, p]], f(ei) = g(ei), alors f = g.

Démonstration : Puisque E est génératrice de E, ∀x ∈ E,∃a1, . . . , ap ∈ K tels que x =p∑k=1

ai.ei. Alors

f(x) = f ł(p∑k=1

ai.eiΣ) =p∑k=1

ai.f(ei)

=p∑k=1

ai.g(ei) = gł(p∑k=1

ai.eiΣ) = g(x).

Le théorème central de ce paragraphe est le suivant :

118

Théorème III.1

Soient E un K− espace vectoriel de dimension finie et F un K−espace vectoriel.

Soient

B = (e1, . . . , en) une base de vecteurs E et(b1, . . . , bn) une famille de vecteurs de F .

Alors il existe une unique application linéaire f ∈ L (E,F ) qui vérifie pour tout i ∈ [[1, n]], f(ei) =bi.

Démonstration : EXISTENCE : Tout vecteur de E s’écrit de manière unique comme une combinaisonlinéiare de vecteurs de B. Définissons notre application à l’aide de ces coordonnées :

f :n∑i=1

xiei ∈ E 7→r∑i=1

xibi ∈ F.

UNICITE : C’est une conséquence du lemme précédent.

L’image d’une base quelconque de E par f peut donner beaucoup d’informations sur f :

Proposition III.2 (Image d’une base)

Soit f ∈ L (E,F ), (e1, . . . , en) une base de E. Alors,• (f est injective)⇐⇒ (f(e1, . . . , f(en)) est libre.• (f est surjective)⇐⇒ (f(e1, . . . , f(en)) est génératrice de E.• (f est bijective)⇐⇒ (f(e1, . . . , f(en)) est une base de E

III.2 Le théorème du rang

Voici un des résultats les plus importants d’algèbre linéaire, dont nous avons déjà fourni unepreuve lors des systèmes. En effet, avec notre langage d’alors, il s’agit de dire que toute variable estsoit libre soit pivot, et jamais les deux à la fois :

Théorème III.3

Soit E un espace vectoriel de dim finie, F un espace vectoriel , et ∈ L (E,F ). Alors Im f estde dimension finie et

dim ker f + Rang f = dimE.

Preuve : On complète une base de ker f en une base de E par n− k vecteurs. on montre alors quel’image de ces n− k vecteurs forment une base de l’image de f .B Le noyau d’une forme linéaire en dimension finie est un hyperplan.B Cas d’une matrice.B Cas de la dérivation.

III.3 Isomorphisme

Nous tirons de la proposition III.2 :

Corollaire III.4

Soient E et F deux K− espaces vectoriels de dimensions finies, et f ∈ L (E,F ). Alors,

1. Si f est injective, alors dimE 6 dimF .

2. Si f est surjective, alors dimE > dimF .

3. Si f est bijective, alors dimE = dimF .

Considérons maintenant les applications bijectives entre deux espaces vectoriels de même di-mension finie.Théorème III.5

Soient E et F deux K− espaces vectoriels tels que dimE = dimF = n ∈ N, et f ∈ L (E,F ).Alors,

f est injective⇐⇒ f est surjective⇐⇒ f est bijective ⇐⇒ Rang f = n⇐⇒ dim ker f = 0.119

1. C’est FAUX en dimension infinie, par exemple la dérivation sur R[X].Lemme 6

La réciproque d’un isomorphisme est linéaire.

Définition III.6 (Groupe linéaire)

Soit E un K− espace vectoriel de dimension finie. On noteGL(E) l’ensemble des isomorphismesde E. C’est un sous-groupe de

(Bij(E),

).

Théorème III.7

Soit n ∈ N∗. Tout ev de dimension n est isomorphe à Rn.

on refait la dém.

IV Quelques applications à connaître

IV.1 Projecteurs et symétries

IV.2 Hyperplans et formes linéaires

IV.3 Miscellanées

B Les endomorphismes nilpotents : soit f ∈ L (E). On note pour tout entier naturel k,

fk =

IdE , si k = 0,f fk−1, sinon.

.

B Les valeurs propres : Def de valeurs propres et de vecteurs propres d’un endomorphisme.ker f, ker(f−λId), exemple de la matrice 3×3 dont les coeffs diagonaux valent 2 et les autres1.

B L’ensemble des antécédents de y0 par f est soit vide, soit le sous-espace affine x0 + ker f .

120

Chapitre 10

Les Matrices

I Produit matriciel

I.1 Rappels et matrices remarquables

Définitions de Mn,p(K),Mn(K). Structure d’espace vectoriel, base canonique.

1. In. L’esnsemble des matrices diagonales forme un sous-espace vectoriel . Notations Diag etDn.

2. T+n et T−n sont deux sous-espaces vectoriels de dimension n(n+ 1)/2.

3. Sn et An, deux sev de dimension n(n+ 1)/2 et n(n− 1)/2. Ils sont supplémentaires.

I.2 L’opérateur LA

Toute application linéaire de Rp dans Rn est l’application linéaire canoniquement associée à unematrice. Plus clairement,

Proposition I.1

Soient n, p ∈ N∗. L’application Ψ Mn,p(K) −→ L (Kp,Kn)A 7−→ LA

est un isomorphisme d’

espaces vectoriels .

Démonstration : Si (e1, ..., en) est la base canonique de Rp, on se base sur le fait que pour tout i, LA(ei) =Aei = Ci la i−ème colonne de la matrice A. D’où l’injectivité. Quant à la surjectivité, on prend ϕ ∈L (Kp,Kn) et on construit A par ses colonnes.

On en déduit au passage que dim L (Kp,Kn) = n× p.

Remarques :

Voici quelques informations sur LA que l’on peut lire sur A :

1. La ième colonne a tous ses coefficients nuls sauf le i−ème ssi ei est vecteur proprede LA.

2. Interprétation de certains blocs de 0 : ils sont équiavlents à la stabilité de sous-espaces engendrés par des vecteurs de la base canonique.

Quant aux matrices triangulaires :

Proposition I.2

Soit A ∈Mn(K).A ∈ Tn ⇐⇒ ∀i ∈ [[1, n]], Vect (e1, . . . , ei) est stable par LA

⇐⇒ ∀i ∈ [[1, n]], Aei ∈ Vect (e1, . . . , ei).121

D’ailleurs, on peut enlever le cas i = n qui n’amène rien à l’affaire.

I.3 Produit

D’après cette proposition, si on compose deux apllications linéaires qui proviennent de matrices,on obtient une unique matrice C dont c’est l’application linéaire. On crée ainsi une loi sur l’ensembledes matrices. Effectuons un calcul pour deviner la définition du produit matriciel qui permettraitque la matrice de la composée de deux applications de Rn soit la matrice produit.

L(a bc d

) L(2 34 5

) (xy

)= L(a b

c d

) (2x+ 3y4x+ 5y

)=

(a(2x+ 3y) + b(4x+ 5y)c(2x+ 3y) + d(4x+ 5y)

)=

((2a+ 4b)x+ (3a+ 5b)y(2c+ 4d)x+ (3c+ 5d)y

)=

(2a+ 4b 3a+ 5b2c+ 4d 3c+ 5d

)(xy

)= L(2a+ 4b 3a+ 5b

2c+ 4d 3c+ 5d

) (xy

).

Définition I.3 (Produit de Matrices)

Soient n, p,m ∈ N∗, A ∈ Mn,p(K), B ∈ Mp,m(K). La matrice C ∈ Mn,m(K) définie par laformule

∀i, j ∈ [[1, n]]× [[1,m]], ci,j =p∑k=1

ai,kbk,j .

est appelée produit de A et B et notée A×B, ou AB.On définit ainsi une loi interne que Mn(K).

On peut tout de suite énoncer, car c’est pour obtenir cette relation que nous avons construit ceproduit :Proposition I.4

Soient n, p,m ∈ N∗, A ∈Mn,p(K), B ∈Mp,m(K). Alors LA×B = LA LB .

Démonstration : On utilise que deux applications linéaires sont égales ssi elles coïnident sur une base.

B InA et AIp.B AB a sa j−ème colonne nulle si la j−ième colonne de B l’est, et sa j−ème ligne nulle si laj−ième ligne de A l’est.

B A×B = (AC1, . . . , ACn) où (C1, . . . , Cn) sont les colonnes de B.B Si C et L sont un vecteur colonne et un vecteur ligne, CL et LC.B AB 6= BA, avec E12 et E11.B L’anneau n’est pas intègre, avec le même exemple. D’ailleurs E12 est nilpotente.B Eij × Ekl = δjkEil.B Soit A une matrice carrée. LA est un projecteur⇐⇒ A2 = AB Soit A =

(aij)

et D = Diag (d1, . . . , dn). ALorsDA =

(diaij

)et AD =

(djaij

).

B Vu en TD : le commutant d’une matrice M est un sous-espace vectoriel de Mn. Il est égal àMn si et seulement si M est une homothétie, i.e ssi M ∈ Vect In.

Proposition I.5 (Produit de matrices triangulaires)

Si A,B ∈ T +n (K), alors leur produit A × B est aussi triangulaire supérieur, et les éléments

diagonaux de A×B sont

Nous disposons donc de trois lois sur les ensembles de matrices : la mutliplication par un sca-laire, l’addition de deux matrices qui peut se faire si et seulement si elles sont de même tailleet la multiplication A×B qui peut se faire si et seulement si le nombre de lignes de B est égalau nombre de colonnes de A.

122

Propriétés I.6 (Associativité et commutativité)

1. La loi × est associative : A(BC) = (AB)C.

2. Sous réserve que les tailles de matrices soient adéquates,A(B + C) = AB +AC et (B + C)A = BA+ CA.

3. Sous les mêmes hypothèses, pour tout λ ∈ K, λ(AB) = (λA)B = A(λB).4. La loi × n’est pas commutative. Mais si A,B ∈Mn(K) et AB = BA, alors :

∀n ∈ N∗, (A+B)n =n∑k=0

CknAkBn−k, An −Bn = (A−B)

n−1∑k=0

An−1−kBk.

Calcul des puissances de la matrice

1 2 22 1 22 2 1

.

Définition I.7 (Polynômes de matrices carrées)

Soit A ∈Mn(K) et P (X) =∑dk=0 akX

k ∈ K[X]. On note P (A) la matrice

P (A) =d∑k=0

akAk = a0In + a1A+ · · ·+ adA

d.

On dit que P est un polynôme annulateur de A lorsque P (A) = 0.

Remarques :

Calcul de certaines suites récurrentes :B Soient (xn)n∈N et (yn)n∈N deux suites réelles, vérifiant la relation de récurrence li-

néaire suivante : xn+1 = −9xn −18ynyn+1 = 6xn +12yn

avec x0 = −137 et y0 = 18. Il s’agit de déterminer les termes généraux de ces deuxsuites en fonction de n, et non plus en fonction des termes qui les précèdent. Tradui-

sons ce problème en termes matriciels : en posant A =(−9 −186 12

), et Un =

(xnyn

)pour tout n ∈ N, on voit que la formule de récurrence croisée qui régit nos deux suitesdevient une formule de récurrence simple portant sur un vecteur de R2 : Un+1 = AUn,pour tout n ∈ N. On déduit aisément de ceci l’expression de Un en fonction de A, deU0 et de n : Un = AnU0 . Ainsi le calcul de Un se ramène à celui des puissances de A.Nous verrons plus loin des méthodes pour calculer ces puissances.

B Soit (xn) une suite vérifiant ∀n ∈ N, un+2 = aun + bvn, où a, b ∈ C et b 6= 0. Cett

relation est équivalente à Xn+1 =(

0 1a b

)Xn, où Xn =

(unun+1

).

I.4 InversibilitéDéfinition I.8

A ∈ Mn(K) est dite inversible s’il existe B ∈ Mn(K) telle que AB = BA = In. B est alorsunique, et notée A−1. On note GLn(K) l’ensemble des matrices inversibles.

Cas d’une matrice carrée qui vérifie A2 +A+ 2In.

123

Théorème I.9

Soit A ∈Mn(K). on a l’équivalence entre toutes les propriétés suivantes :A est inversible⇔ LA est bijective⇔ kerA = 0 ⇔ Rang A = n⇐⇒ detA 6= 0.

Démonstration : LAB = LA LB .

Exemples de produits :

B Une matrice(a bc d

)∈M2(K) est inversible⇐⇒ son déterminant est non nul. Alors,(

a bc d

)−1=

1detA

(d −b−c a

).

B Soient A,B ∈Mn(K) deux matrices inversibles. Alors leur produit A×B est ausi inversible et

(A×B)−1 = B−1 ×A−1 .

Propriétés I.10 (Le groupe linéaire)

Muni de la loi ×, GLn(K) est un groupe, appelé groupe linéaire. Il n’est pas commutatif saufsi n = 1.

Proposition I.11 (Inversion de matrices triangulaires)

Soit T =(ti,j)

16i,j6n ∈ T +n (K). Alors

B T est inversible⇐⇒ ∀i ∈ [[1, n]], tii 6= 0.B Si T ∈ GLn(K), alors T−1 ∈ T +

n (K) et les coefficienst diagonaux de T−1 sont les inversesdes coefficients diagonaux de T .

Démonstration : =⇒ kerLT = 0 en remontant.⇐= Contraposée : si t22 = 0, la famille (C1, C2) est liée.

II Lignes et colonnes

II.1 Manipulations élémentaires

On sera souvent conduit à mutiplier une matrice A par une matrice inversible dès que l’ons’intéressera aux endomorphismes. Le point essentiel de cette opération est qu’elle préserve le rang.Plus précisément :

Proposition II.1 (Conservation du rang)

Soit A ∈Mn,p. Alors :

1. ∀P ∈ GLn, ker(P ×A

)= kerA.

2. ∀Q ∈ GLp, Im(A×Q

)= Im A.

3. ∀P ∈ GLn,∀Q ∈ GLp,Rang(PAQ

)= Rang A .

Démonstration : 1. Soit X ∈ Kp. Si X ∈ kerA, alors AX = 0Kn , donc P (AX) = 0Kn , i.e X ∈ker(PA). Ainsi, kerA ⊂ ker(PA). Pour l’autre inclusion, il suffit de remarquer queA = P−1(PA),égalité qui implique d’après ce que l’on vient de prouver que ker(PA) ⊂ kerA puisque P−1 estinversible.

2. On peut procéder de manière identique pour l’image, ou bien remarquer que Im (AQ) = Im(LA

LQ)⊂ Im LA d’après un exercice classique du TD. A nouveau, l’autre inclusion procède de

A = (AQ)Q−1.

3. Rang (PAQ) = Rang (PA) d’après le deuxième point, et Rang (PA) = Rang A d’après le pre-mier point et le théorème du rang.

124

Remarques :

Rappelons quelques faits énoncés lors de la définition du produit matriciel. Soit A ∈Mn,p. Notons Cj ses colonnes et Li ses lignes. Les Ei,j sont les matrices élémentaires, detaille convenable pour que les produtis que nous effectuons soient licites.

B Multiplication à gauche : EijA =

00Lj...0

, la ligne Lj apparaissant à la i−ème place.

B Multiplication à droite : AEij =(0, . . . , Ci, . . . 0

), la colonne Ci apparaissant à la

j−ème place.

Rappelons que nous avons défini trois opérations élémentaires sur A lors de l’algorithme deGauss.

Définissons trois types de matrices simples :

Définition II.2 (de Pij, Ei(α), Eij(α))

B Soit i ∈ [[1, n]] et α ∈ K∗. Ei(α) = Diag (1, . . . , 1, α, 1 . . . , 1) est la matrice identité où l’ona remplacé le i−ème coefficient par c sur la diagonale.

B Soient i 6= j ∈ [[1, n]]. Pij est la matrice identité où l’on a permuté les colonnes (ou leslignes) i et j

B Soient i 6= j ∈ [[1, n]], α ∈ K. Eij(α) = In + αEij .

Ces trois types de matrices sont inversibles et stables par passage à l’inverse :

Ei(α) = Ei(α−1), P−1ij = Pij , Eij(α)−1 = Eij(−α) .

Faire des opérations élémentaires sur les colonnes de A revient à multiplier A à droite par unesuite de matrices inversibles :Proposition II.3 (Manipulation élémentaire et produit matriciel)

Soit A ∈Mn,p(K).

1. Si ACi←Ci+αCj−−−−−−−−→ B, alors B = A× Eji(α).

2. Si A Ci←αCi−−−−−→ B, alors B = A× Ei(α).

3. Si ACi↔Cj−−−−−→ B, alors B = A× Pij .

On obtient un résultat strictement indentique en remplaçant “colonne” par “ligne” et en multi-pliant A à gauche par les trois types de matrices définis ci-dessus.

Corollaire II.4 (Invariance par manipulation élémentaire)

Les manipulations élémentaires sur les lignes et les colonnes d’une matrice en conservent lerang.Celles sur les lignes conservent de plus le noyau, et celles sur les colonnes conservent l’image.

On en déduit de plus une nouvelle méthode de calcul de l’inverse d’une matrice.

II.2 Rang des lignes et rang des colonnes

Définition de la transposée d’une matrice. tL = C et tC = L, tXX =.

Propriétés II.5

Transposée

125

1. ttA =)A.

2. La trasposée est linéaire.

3. transposée du produit.

4. transposée de l’inverse.

A est sym ssi. S ⊕A = M .Rappelons que le rang d’une matrice est la dimension de l’ev engendré par ses lignes.

Proposition II.6

Le rang d’une matrice A est égal au rang de sa transposée.

Démonstration : Le noyau de A a pour dimension le nombre de variables libres d’un système échelonnéassocié, i.e n− r, où r est le nombre de variables pivots. D’où le rang de LA est n− (n− r) = r. Enfin,le rang de LA est l’ev engendré par les colonnes de A car .

Ainsi, on a coïncidence entre le rang d’une matrice et le rang de l’endomorphisme qui lui estcanoniquement associé.

Corollaire II.7

Soit A une matrice n× p. Alors

1. A : Rp → Rn est injective⇐⇒ tA : Rn → Rp est surjective.

2. A : Rp → Rn est surjective⇐⇒ tA : Rn → Rp est injective.

Démonstration : dim kerA = 0⇐⇒ Rang A = p⇐⇒ Rang tA = p.

III Matrices d’applications linéaires

Tous les espaces vectoriels seront de dimension finie sur K. Nous étendons les possibilités ducalcul matriciel à l’ensemble des applications linéaires de dimension finie. Ces matrices dépendrontfortement d’une base choisie pour le calcul des coordonnées de vecteurs, et nous nosu attacherons àexpliquer comment elle en dépend. Gardons à l’esprit qu’une bonne définition de ces matrices doitrespecter le morphisme déjà maintes fois utilisé :

Mat (f g) = Mat (f)×Mat (g).

III.1 Des vecteurs aux vecteurs colonnesDéfinition III.1

Soit B = (e1, . . . , en) une base de E. Pour tout X ∈ E, on appelle matrice-colonne des com-posantes de X dans B le vecteur

Mat B(X) =

x1...xn

∈Mn,1(K) = Kn,

où X =n∑k=1

xk.ek.

1. Dans R3, B = ł(

100

,

110

,

111

,Σ), et X =

123

,

126

2. Dans Rn[X], B est la base canonique et P (X) = (X + 1)n. Alors Mat B(P ) =

1n

n(n−1)2...1

.

Il est clair que Mat B E −→ KnX 7−→ Mat B(X)

est un isomorphisme de K− espaces vectoriels de

dimension n.

III.2 Des endomorphismes aux matrices

Enfin, nous pourrons faire de même avec les endomorphismes :

Définition III.2 (Matrice d’endomorphisme)

Soit B = (e1, . . . , en) une base de E, et f ∈ L (E). On appelle matrice de f dans la base B lamatrice carrée suivante :

Mat B(f) =

a1,1 . . . a1,n...

...an,1 . . . an,n

∈Mn(K),

où pour tout j ∈ [[1, n]], f(ej) =n∑k=1

ak,j .ek.

La construction de cette matrice s’effectue selon les colonnes. La colonne 1 nous est donnée parl’image du premier vecteur de B par f .B f : P ∈ R3[X] 7→ P (X + 1) ∈ R3[X] dans la base canonique B0, puis la base B1 =

(X(X −

1), X(X − 2), (X − 1)(X − 2)).

B Même question avec g : P ∈ Rn[X] 7→ P ′ ∈ Rn[X] dans la base canonique.

B Soit f :

xyz

∈ R2 7→

x+ yx− z

2y − 3z

∈ R3. Ecrire la matrice de f dans la base canonique de R3.

MORALITE : Dans le cours sur les applications linéaires, nous avions construit une application

L Mn(R) −→ L (Rn)A 7−→ LA

.

Nous venons maintenant de définir une nouvelle application

Mat B0 L (Rn −→ Mn(R)f 7−→ Mat B0(f)

.

Ce ne sont pas de trop mauvaises définitions puisqu’elles sont réciproques l’une de l’autresi B0 est la base canonique de Rn. Ce qui signifie que la matrice de LA dans la base cano-nique est A et que l’endomorphisme canoniquement associé à Mat B0(f) est f :

∀f ∈ L (Rn), LMat B0 (f) = f,

∀A ∈Mn(R), Mat B0(LA) = A.

(plus fondamentaux)1. Soit E un espace vectoriel de dimension 2 et f ∈ L (E) nilpotente d’indice 2. Alors il existe

une base B de E où Mat B(f) =(

0 10 0

).

Démonstration : L’image de f est de dimension 1 (tiens, pourquoi ?). Notons e1 un de ses vecteursnon nuls, et e2 un de ses antécédents. Admettons temporairement que B = (e1, e2) est une base de E.

127

Alors f(e1) = e2 et f(e2) = f2(e1) = 0, ce qui signifie exactement que Mat B(f) =(

0 10 0

). Il reste à

prouver que B est effectivement une base : soiet x, y ∈ R tels que x.e1 + y.e2 = 0E , on compose par fet on trouve que x.e2 = 0E , soit x = 0 que l’on reporte.

Les projecteurs et les symétries admettent tous des bases dans lesquelles leurs matrices estdiagonale, avec qui plus est des coefficients diagonaux réels qui vérifient x2 = x pour les projcteurset x2 = 1 pour les symétries. Etonnant, non ?

Proposition III.3

Soit E un espace vectoriel de dimension n et f ∈ L (E). Alors,

1. f est un projecteur de E ⇐⇒ il existe une base B de E dans laquelle

Mat B(f) = Diag (1, . . . , 1, 0, . . . , 0) ∈Mn(K).

2. f est une symétrie de E ⇐⇒ il existe une base B de E dans laquelle

Mat B(f) = Diag (1, . . . , 1,−1, . . . ,−1) ∈Mn(K).

Démonstration : 1. Il suffit de prendre une base B = (e1, . . . , en) où (e1, . . . , ek) est une base de Im fet (ek+1, . . . , en) est une base de ker f . Noter que f(v) = v quand v est dans l’image de f .

2. Il suffit de prendre une base B = (e1, . . . , en) où (e1, . . . , ek) est une base de ker(f − IdE

)et

(ek+1, . . . , en) est une base de ker(f + IdE

).

Nous poursuivons avec

Propriétés III.4

Soit E = (e1, . . . , ep) une base de E. Alors, l’application

Ψ L (E) −→ Mn(K)f 7−→ Mat E (f)

est un isomorphisme de K− espaces vectoriels .

De manière plus anecdotique, on peut aussi définir :

Définition III.5

Soit B = (e1, . . . , en) une base de E. Pour toute famille F = (X1, ...Xp) de vecteurs de E, on appelle matrice des

composantes de F dans B le vecteur Mat B(X) =

x1,1 . . . x1,p...

...xn,1 . . . xn,p

∈Mn,p(K),

où pour tout j ∈ [[1, p]], Xj =n∑k=1

xk,j .ek.

Définition III.6 (Matrice d’une application linéaire)

Soit E = (e1, . . . , ep) une base de E, et F = (f1, . . . , fn) une base de F , et fϕ ∈ L (E,F ). On appelle matrice de ϕdans les bases E et F la matrice suivante :

Mat E ,F (ϕ) =

a1,1 . . . a1,p...

...an,1 . . . an,p

∈Mn,p(K),

où pour tout j ∈ [[1, p]], ϕ(ej) =n∑k=1

ak,j .fk.

B L’application linéaire associée à l’évaluation lagrangienne, qui conduit à une matrice de Van Der Monde.

Propriétés III.7

Soit E = (e1, . . . , ep) une base de E, et F = (f1, . . . , fn) une base de F L’applicationΨ L (E,F ) −→ Mn,p(K

f 7−→ Mat E ,F (f)

128

est un isomorphisme de K− espaces vectoriels .

Corollaire III.8

dim L (E,F ) = np.

III.3 Composée et produitProposition III.9

B Mat (f g) =.B Matf(x) = MatfMatx.

Exemple : M est la matrice d’un projecteur ssi M2 = M .

Proposition III.10

rgA = rgf .

Savoir interpréter les blocs de zéros comme des sev stables : La matrice d’une appli est triang ssi

les Vect(e1, ...ek) sont stables, A =(A B0 C

)ssi Vect(e1, ..., ek) est stable par A.

IV Changements de base

IV.1 Deux relations d’équivalence sur les matrices

Def de matrices semblables, de classe de similitude CM d’une matrice M . CIn. Le rang, la trace

et le déterminant sont constants sur chaque classe de similitude, mais ne sont pas des invariantstotaux (prendre I2 et I2 + N). Liens entre les Pusisances et les inverses. Que signifie réduire unematrice.Matrices équivalentes. Le rang est un Invariant total (reporter la preuve), et on connait un beaureprésentant. Le rang est invariant par transposition.

IV.2 Les matrices de passage

Définition IV.1

Soit E un ev de dimension n et B,B′ deux bases de E. On appelle matrice de passage de B àB′ et on note PB′

B = (ai,j) ∈Mn, où ∀j ∈ [[1, n]], e′j =∑ni=1 aijei. P

B′

B = Mat B′,B(Id).

de calculs de P et P 1 dans les deux cas suivants :

1. B = (−→i ,−→j ) et B′ = (−→i + 2−→j ,−→I − 4−→j ).

2. Deux bases de R2[X] : (1, X,X2) et ( (x−1)(x−2)2 , (x−1)(x−3)

−1 , (x−3)(x−2)2 ).

Proposition IV.2

Soient B1,B2,B3 trois bases de E.

1. P 11 = In

2. P 21 × P 3

2 = P 31 .

3. P 21 ∈ GLn(K) et P 2

1 = (P 12 )−1.

Réciproquement, si on se fixe B, l’application qui à B′ associe P est bijective dans Gln, i.E toutematrice inversible peut être vue comme une matrice de passage.

IV.3 Changements de base

Théorème IV.3 (de changement de base)

B Pour les vecteurs : Soit x ∈ E, X,X ′ ses matrices coordonnées. Alors X ′ = PB′

B X.

129

B Pour les endomorphismes : E,B,B′ dimE = n, f ∈ F (E), P = PB′

B . Alors M ′ =P−1MP .

B Pour les applications linéaires : E,F, E ,F ,dimE = p, dimF = n, f ∈ F (E,F ), P =P E2E1, Q = PF2

F1, alors M ′ = Q−1MP .

Démonstration : B Mat(x) = Mat(Id(x)).B M ′ = Mat(Id f Id

1. Tester la formule de changement de base sur l’endomorphisme de dérivation discrète, enprenant la base canonique, et la base (1, X,X(X − 1)/2, X(X − 1)(X − 2)/6).

2. Montrer que

1 1 −11 1 −12 2 −2

∼0 0 1

0 0 00 0 0

.

Définition IV.4 (Réduire une matrice)

IV.4 Deux applications de la réduction

1. aux suites récurrentes

2. Aux systèmes différentiels linéaires

V Déterminant

Définition, morphisme.

Définition V.1

On appelle trace d’un endo, et det d’un endo.

Corollaire V.2

Soit f un projecteur sur un espace vectoriel de dimension finie. Alors Rang f = Trace f .

Proposition V.3

Les valeurs propres de f sont les racines du polynome det(f − xI) = 0.

130

Chapitre 8

Intégration sur un segment

I Les classes de fonctionsDéfinition I.1 (Subdivisions)

gfdrshgrsh

Définition I.2

Soit f : [a, b]→ R. on dit que f est

1. en escaliers lorsque il existe une subdivision (cj)j∈[[0,n]] de [a, b] telle que

∀j ∈ [[0, n− 1]], f est constante sur ]cj , cj+1[.

On note E l’ensemble de ces fonctions.

2. continue par morceaux lorsque il existe une subdivision (cj)j∈[[0,n]] de [a, b] telle que ∀j ∈[[0, n− 1]], f est continue sur ]cj , cj+1[, et admet une limite finie à gauche et à droite encj . 1

On note C 0m l’ensemble de ces fonctions.

Toute fonction en escaliers est continue par morceaux, et toute fonction continue est continuepar morceaux. Toute fonction continue par morceaux sur [a, b] est bornée (mais n’atteint pas forcé-ment ses bornes).

II Définition de l’intégrale...

II.1 ...d’une fonction en escaliers

Elle est naturelle.

Propriétés II.1 (de∫

Isur E )

1. Linéarité :

2. Positivité :

3. Croissance :

4. Intégrale de |ϕ| :5. Relation de Chasles :

II.2 ...d’une fonction continue par morceaux

Théorème II.2 (Densité de E dans C 0m pour ‖.‖∞)

Soit f : [a, b] → R une fonction continue par morceaux. Pour tout ε > 0, il existe ϕ,ψ ∈ E sur

131

[a, b] telles quef − ε 6 ϕ 6 f 6 ψ 6 f + ε.

Propriétés II.3

Soit f ∈ C 0m([a, b],R). Notons

Ω−(f) =ϕ ∈ E ([a, b],R) telles que ϕ 6 f

,

Ω+(f) =ϕ ∈ E ([a, b],R) telles que ϕ > f

Alors,

supf∈Ω−

ł(∫

[a,b]fΣ) = inf

f∈Ω+ł(∫

[a,b]fΣ).

On note∫

[a,b]f(x)dx leur valeur commune.

Lemme 7

Soit f ∈ C 0m([a, b],R), (εk)k∈N une suite de réels qui tend vers 0, et (ϕk)k∈N une suite de fonctions

en escaliers sur [a, b] qui vérifie pour tout k ∈ N, |ϕk − f | 6 εk. Alors∫[a,b]

ϕk(x)dx −−−−−→k→+∞

∫[a,b]

f(x)dx.

II.3 Propriétés de l’intégrale

Par approximation des fonctions en escaliers, on transporte toutes les propriétés de l’intégralede E à C 0

m :

Propriétés II.4 (de∫

Isur C 0

m)

1. Linéarité :

2. Positivité :

3. Croissance :

4. Intégrale de |ϕ| :5. Relation de Chasles :

Démonstration : 1.

2.

3.

4.

5.

Propriétés II.5 (Inégalité de la moyenne)

Soient f, g deux fonctions continues par morceaux sur [a, b]. On a l’inégalité :

ł|∫

[a,b]

(f × g

)Σ| 6 sup[a,b]|f | ×

∫[a,b]|g|.

Définition II.6 (de∫ b

af)

132

III intégrale d’une fonction continue

III.1 Le Théorème fondamental du calcul différentielThéorème III.1 (TFCD)

Soit I un intervalle, a ∈ I et f une fonction continue sur I. Alors la fonction F : x ∈ I 7→∫ x

a

f(t)dt est une fonction de classe C 1 sur I dont la dérivée est la fonction f .

Démonstration : Soit x0 ∈ I.

F (x0 + h)− F (x0)− hf(x0

h=∫ x0+h

x0

(f(t)− f(x0)

)dx.

Définition III.2 (Primitive)

Si I est un intervalle, que f, F sont définies sur I et que F est une primitive de f sur I, alorspour toute fonction G sur I, G est une primitive de f sur I si et seulement si il existe une constanteC telle que G = F + C.

Corollaire III.3 (du TFCD)

Toute fonction continue sur I admet une primitive sur I.

III.2 Croissance stricte de l’intégrale

Propriétés III.4

Si f est continue et positive sur [a, b], alors∫ b

a

f(t)dt = 0⇐⇒ f est la fonction nulle sur [a, b].

Ainsi, si f est continue, positive sur [a, b], et strictement positive en au moins un point de [a, b],

alors∫ b

a

f(t)dt > 0.

III.3 Intégration par parties

III.4 Changement de variables

Théorème III.5

Soit ϕ : [a, b]→ R une application de classe C 1 et f : I → R ou C une fonction continue sur unintervalle I contenant l’image de ϕ. Alors∫ ϕ(b)

ϕ(a)f(t)dt =

∫ b

a

(f ϕ)(x)ϕ′(x)dx.

Démonstration :

On dit que l’application ϕ définit un changement de variables.

1. Calcul d’une primitive de t 7→√

1− t2 : ϕ(x) = sin(x).

2. Calcul d’une primitive de t 7→ 1cosh t : ϕ(x) = ln(x).

3. Calcul de∫ e

1

1t+ T (ln t)2 dt : ϕ(x) = ln x.

4. Comparer g(x2) et g(x) pour g(x) =∫ π/2

0 ln(1− 2x cos t+ x2)dt.

133

Corollaire III.6

SI ϕ est de plus strictement monotone,...

Corollaire III.7 (Intégrale d’une fonction périodique)

Corollaire III.8 (Intégrale d’une fonction paire ou impaire)

III.5 Approximations par des rectangles et des losanges

Théorème III.9 (Approximation par des rectangles)

Soit f une fonction continue sur [a, b]. Alors

b− an

n−1∑k=0

f ł(a+ kb− an

Σ) −−−−−→n→+∞

∫ b

a

f(t)dt.

∑nk=1

n

n2 + k2 .

Théorème III.10 (Approximation par des trapèzes)

Soit f une fonction de classe C 2 sur [a, b]. Alors

b− an

ł(f(a) + f(b)2 +

n−1∑k=1

f ł(a+ kb− an

Σ)Σ)︸ ︷︷ ︸Tn(f)

−−−−−→n→+∞

∫ b

a

f(t)dt.

Précisément,

ł|∫ b

a

f − Tn(f)Σ| 6 (b− a)3

12n2 M2(f),

où M2(f) est la norme infinie de f ′′.

Démonstration : Elle est basée sur∫ b

a

f = b− a2 ł[f(a) + f(b)Σ] + 1

2

∫ b

a

(x− a)(x− b)f ′′(x)dx,

d’où l’on déduit

ł|∫ b

a

f − b− a2

f(a) + f(b)2

Σ| 6M2(b− a)3

12 .

Il faut bien comprendre que Taylor-Young ne pourrait nous donner ces deux inégalités sur tout l’intervalle]0, π[.Preuve : On reconnait respectivement à gauche et à droite les troisième et cinquième polynômes de Taylor dela fonction sin au point 0. Il s’agit donc de prouver que R3(x) > 0 et R5(x) < 0 pour π > x > 0. Or, d’aprèsTaylor avec reste intégral,

R3(x) =∫ x

0

(x− t)3

3! sin(4)(t)dt =∫ x

0

(x− t)3

3! sin(t)dt,

qui est strictement positif car c’est l’intégrale d’un fonction positive continue non nulle. De même,

R5(x) = −∫ x

0

(x− t)5

5! sin(t)dt < 0.

134

Chapitre 11

Les Espaces pré-Hilbertiens

Motivation : On tente de généraliser les notions très fructueuses de norme, d’orthogonalité et d’angleà tout espace vectoriel, en partant de la remarque du’elles découlent toutes de la notion de produitscalaire.

E sera toujours un espace vectoriel réel.

I Produit scalaire et norme euclidienne

I.1 Définitions et Exemples

Définition I.1

On appelle forme bilinéaire symétrique définie positive, ou produit scalaire toute application

ϕ : E × E → R

qui vérifie les propriétés suivantes :

1.

∀x, y, z ∈ E,∀α ∈ R, ϕ(αx+ y, z) = αϕ(x, z) + ϕ(y, z),ϕ(z, αx+ y) = αϕ(z, x) + ϕ(z, y).

2. ∀x, y ∈ E, ϕ(x, y) = ϕ(y, x).3. ∀x ∈ E, ϕ(x, x) > 0.

4. ∀x ∈ E, ϕ(x, x) = 0⇐⇒ x = 0E .On appelle alors norme euclidienne l’application x ∈ E 7→ ‖x‖ =

√ϕ(x, x).

Deux vecteurs x et y sont dits orthogonaux lorsque ϕ(x, y) = 0. On notera xperpy.Un espace préHilbertien est un R−ev muni d’un produit scalaire. Il est euclidien lorsqu’il est deplus de dimension finie.

Nous noterons bien souvent, lorsque toute amiguité sera écartée, et pour revenir à nos vieilleshabitudes < x, y >, ou (x|y) le produit scalaire entre les vecteurs x et y.

Dans toute la suite, E sera un espace pré-Hilbertien.Une famille (e1, ...ep) de vecteurs de E sera diteB orthogonale lorsque ∀i, j ∈ [[1, p]], si i 6= j alors < ei, ej >= 0.B orthonormée lorsqu’elle est orthogonale et que chacu de ses vecteurs est unitaire.B Le produit scalaire usuel sur Rn.

ϕ : (X,Y ) ∈ (Rn)2 7→n∑i=1

xiyi ∈ R.

L’ensemble des vecteurs orthonaux à X0 est un hyperplan, lorsque le vecteur X0 est non nul,et tout l’espace E sinon.

135

B Le produit scalaire usuel sur Mn,p(R) :

ϕ : (M,N) ∈Mn,p(R)×Mn(R) 7→ Trace(tMN

).

Pour prouver que c’est effectivement un produit scalaire, il suffit de remarquer qu’il coïncideavec le produit scalaire défini ci-dessus lorsque l’on identifie l’espace des matrices à l’espacedes vecteurs de Rnp, i.e que l’on constate que

Trace(tMN

)=

n∑i=1

p∑j=1

mi,jni,j .

En utilisant les propriétés de la trace, on peut prouver que toute matrice symétrique estorthogonale aux matrices antismétriques.

B Soit E = C 0([a, b],R l’espace des fonctions continues sur le segment [a, b] à valeurs réelles.L’application

ϕ : (f, g) ∈ E × E 7→∫ b

a

fg

est un produit scalaire surE. Seul le caractère défini nécessite une indication pour le prouver :il faut utiliser la continuité et la positivité de f2.

B Moins fondamental, dans un espace euclidien, on appelle matrice du produit scalaire dans labase B = (e1, ...en) la matrice symétrique M =

(< ei, ej >

)16i,j6n.

Pour tout x, y ∈ E, si on note respectivement X et Y les vecteurs colonnes des composantesde x et y dans cette base, on a x.y =t XMY .

Donnons tout de suite une application de cette notion d’orthogonalité :

Corollaire I.2

Toute famille orthonormée de vecteurs de E est libre.

Démonstration : Soit (e1, .., ep) une famille orthogonale de vecteurs de E, telle que ∀i ∈ [[1, p]], ei 6= 0E .

Soient x1, ..., xn des réels tels quen∑i=1

xiei = 0E . Puisque la famille (x1e1, ..., xnen) est orthogonale,

pour tout k ∈ [[1, n]],

ł <n∑i=1

xiei, ekΣ> =< 0E , ek >= 0

⇒n∑i=1

xi < ei, ek >= 0⇒ xk = 0.

et donc le famille est bien libre.

I.2 Quelques égalités fondamentales

Théorème I.3 (Pythagore et Al-Kashi)

Soit (E,< ., . >) un espace pré-Hilbertien, et x et y deux vecteurs de E.B Al-Kashi :

‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2(x|y).B Pythagore : Si x et y sont orthogonaux, alors

‖x+ y‖2 = ‖x‖2 + ‖y‖2.

B Pythagore pour une famille de vecteurs : Soit p ∈ N∗ et (e1, ..., ep) une famille de vec-teurs deux à deux orthogonaux. On a l’égalité∥∥∥∥∥

p∑i=1

ei

∥∥∥∥∥2

=p∑i=1‖ei‖2 .

136

Démonstration de I.3 :

‖x+ y‖2 = < x+ y, x+ y >=< x, x > + < x, y > + < y, x > + < y, y >

= ‖x‖2 + 2 < x, y > +‖y‖2.

Ce qui est précisément l’énoncé de la formule d’Al-Kashi. La cas de Pythagore s’en déduit aisément.Quant à Pythagore pour une famille de vecteurs, montrons-la par récurrence. Définissons notre prédicatpour p > 2 :

P(p) :

(∀(e1, ..., ep) ∈ Ep, Si ∀i 6= j,< ei, ej >= 0, alors

∥∥∥∥∥p∑i=1

ei

∥∥∥∥∥2

=p∑i=1

‖ei‖2).

L’initialisation est exactement le théorème de Pythagore.Soit un entier p pour lequel P(p) est vrai, et prenons (e1, ...ep+1) une famille de vecteurs de E ortho-

gonaux 2 à 2. Le vecteur X =p∑k=1

ek est orthogonal à ep+1 car

< X, ep+1 >=p∑k=1

< ek, ep+1 >︸ ︷︷ ︸=0

= 0.

Ainsi,∥∥∥∥∥p+1∑i=1

ei

∥∥∥∥∥2

= ‖X + ep+1‖2 = ‖X‖2 + ‖ep+1‖2 d’aprés l’initialisation,

=

∥∥∥∥∥p∑i=1

ei

∥∥∥∥∥2

+ ‖ep+1‖2 =p∑i=1

‖ei‖2 + ‖ep+1‖2 par hypothèse de récurrence,

=p+1∑i=1

‖ei‖2

EXERCICES

Prouver l’égalité du parallélogramme :

∀x, y ∈ E, ‖x+ y‖2 + ‖x− y‖2 = 2‖x‖2 + 2‖y‖2,

et l’identité de polarisation :

∀x, y ∈ E, ‖x+ y‖2 − ‖x− y‖2 = 4(x|y).

Théorème I.4 (Inégalité de Cauchy-Schwarz-Bunyakowski)

Soit (E,< ., . >) un espace pré-Hilbertien, et x et y deux vecteurs de E. Alors,∣∣ < x, y >∣∣ 6 ‖x‖ × ‖y‖.

De plus, on a l’équivalence∣∣ < x, y >∣∣ = ‖x‖ × ‖y‖ ⇐⇒ x et y sont colinéaires.

Démonstration de I.4 : Soit l’application P : t ∈ R 7→ ‖x + ty‖2. D’après la formule d’Al-Kashi, cettefonction est le trinôme en t suivant : P (t) = ‖y‖2t2 + 2 < x, y > t + ‖x‖2. La positivité du produitscalaire implique celle de P , dont le discriminant est par conséquent négatif :

∆ = 4(< x, y >2 −‖x‖2‖y‖2

)6 0.

137

L’inégalité est donc établie. Pour le cas d’égalité, procédons par équivalence :

x et y sont colinéaires ⇐⇒ ∃t ∈ R tel que x+ ty = 0E⇐⇒ P s’annule

⇐⇒ ∆ = 0 (car on savait déjà qu’il était négatif ou nul).

I.3 Norme et angles

Concernant la norme, l’inégalité triangulaire connue dans la cas du plan est toujours valide.C’est elle qui nous assure de la convexité de la boule unité B(0E , 1) = x ∈ E tels que ‖x‖ 6 1.Théorème I.5 (Inégalité de Minkowsky)

Soient x et y deux vecteurs de E. On a l’égalité :

‖x+ y‖ 6 ‖x‖+ ‖y‖,

avec égalité si et seulement si x et y sont positivement colinéaires.

Démonstration : A nouveau, grâce à Al-Kashi,

‖x+ y‖2 = ‖x‖2 + ‖y‖2 + 2 < x, y > 6 ‖x‖2 + ‖y‖2 + 2‖x‖‖y‖ d’après Cauchy-Schwarz,

6 (‖x‖+ ‖y‖)2 ,

et on conclut grâce à la croissance de la fonction racine carrée. Le cas d’égalité dans Minkowski im-plique le cas d’égalité dans Cauchy-Schwarz, donc la colinéarité de x et y, i.e l’existence d’un réel ttel que x = ty (on a supposé y non nul, le cas contraire étant facile à traiter). Réciproquement dansce cas, ‖x + y‖ = ‖x‖ + ‖y‖ si et seulement si |1 + t| = 1 + |t|, égalité elle-même équivalente à(1 + t)2 = (1 + |t|)2, soit t > 0.

On déduit de cette inégalité une minoration de la norme d’une somme :Corollaire I.6

Pour tous x et y dans E, ∣∣‖x‖ − ‖y‖∣∣ 6 ‖x+ y‖ 6 ‖x‖+ ‖y‖.

Démonstration : Il suffit de reprendre la démonstration précédente et d’utiliser l’autre inégalité cachéedans Cauchy-Schwarz, à savoir < x, y >> −‖x‖‖y‖, pour obtenir ‖x+ y‖2 >

(‖x‖ − ‖y‖

)2.

Résumons les propriétés de la normePropriétés I.7

La norme x ∈ E 7→ ‖x‖ ∈ R est une fonction positive qui vérifieB ∀x ∈ E, ‖x‖ = 0⇐⇒ x = 0E ,B ∀x ∈ E,∀t ∈ R, ‖tx‖ = |t|‖x‖,B ∀x, y ∈ E, ‖x+ y‖ 6 ‖x‖+ ‖y‖.

L’inégalité de Cauchy-Schwarz affirme que le réel< x, y >

‖x‖‖y‖appartient à l’intervalle [−1, 1], et

permet la généralisation de la notion d’angle non-orienté à tout espace pré-Hilbertien :Définition I.8

Soient x et y deux vecteurs non nuls de E. On appelle angle entre x et y le réel

θ(x, y) = arccos < x, y >

‖x‖‖y‖.

Cet angle vérifie les propriétés suivantesB θ(x, y) ∈ [0, π].B Si x et y sont non nuls, x ⊥ y ⇐⇒ θ(x, y) = π

2 .B Si x et y sont non nuls, ils sont colinéaires⇐⇒ θ(x, y) = 0 ou π.

138

I.4 Orthogonalité

Définition I.9 (Différentes notions d’orthogonalité)

B Soit x ∈ E et A ⊂ E. x est dit orthogonal à A lorsque pour tout a ∈ A, x ⊥ a.B Soient A et B deux parties de E. A et B sont dits orthogonaux lorsque pour tous a ∈A, b ∈ B, on a a ⊥ b.

B Soit A ⊂ E. On appelle orthogonal de A l’ensemble

A⊥ = x ∈ E tels que ∀a ∈ A,< x, a >= 0.

Propriétés I.10

Soient A,B des parties de E, et F,G des sous-espaces vetoriels de E.

1. A⊥ est un sous-espace vectoriel de E.

2. Si A ⊂ B alors B⊥ ⊂ A⊥.

3. A⊥ = (Vect A)⊥.

4. A ⊂ (A⊥)⊥.

5. E⊥ = 0E et 0E⊥ = E.

6. A ∩A⊥ ⊂ 0E.7. (F +G)⊥ = F⊥ ∩G⊥ et F⊥ +G⊥ ⊂ (F ∩G)⊥.

Démonstration : 1. Soient x, y ∈ A⊥ et α ∈ R. Alors pour tout a ∈ A,< x+ αy, a >= < x, a >︸ ︷︷ ︸

=0

+α< y, a >︸ ︷︷ ︸=0

= 0, ce qui prouve que αx+ y appartient à A⊥.

2. Soit x ∈ B⊥ et a ∈ A. Alors a ∈ B puisque A ⊂ B. Donc < x, a >= 0, et ainsi x ∈ A⊥.

3. A ⊂ Vect A, donc (Vect A)⊥ ⊂ A⊥ d’après 2. Soit maintenant x ∈ A⊥, et y ∈ Vect A. Par

définition de Vect A, il existe n ∈ N∗, α1, ...αn ∈ R et a1, ...an ∈ A tels que y =n∑k=1

αiai. Le

vecteur x est orhtogonal à y car :

< x, y >=< x,

n∑k=1

αiai >=n∑k=1

αi< x, ai >︸ ︷︷ ︸=0

= 0,

et donc x ∈ (Vect A)⊥.

4. Soit x ∈ A. Puisque x est orthogonal à tout vecteur de A⊥, il appartient bien à l’orthogonal deA⊥.

5. La linéarité du produit scalaire par rapport à sa première variable implique que < 0E , x >= 0pour tout x ∈ E, donc 0E est orthogonal à E, i.e 0E⊥ = E et 0E ⊂ E⊥. Si maintenantx ∈ E⊥, alors x est orthogonal à lui-même en tant que vecteur de E : < x, x >= ‖x‖2 = 0, i.ex = 0E .

6. B (F +G)⊥ ⊂ F⊥ ∩G⊥ : Soit x ∈ (F +G)⊥. Puisque F ⊂ F +G, x ∈ F perp (d’après 2.), et

de même x ∈ G⊥, donc x est dans leur intersection.

B (F +G)⊥ ⊃ F⊥ ∩G⊥ : Soit x ∈ F⊥∩G⊥. Soit y ∈ F+G, et a ∈ F, b ∈ G tels que y = a+b.Alors < x, y >= < x, a >︸ ︷︷ ︸

=0 car x∈F⊥

+ < x, b >︸ ︷︷ ︸=0 car x∈G⊥

. D’où x ∈ (F +G)⊥.

B F⊥ +G⊥ ⊂ (F ∩G)⊥ : Soit x ∈ F⊥ +G⊥ et a ∈ F⊥, b ∈ G⊥ tels que x = a+ b. Soit alors

y ∈ F ∩G : < x, y >= < a, y >︸ ︷︷ ︸=0

+< b, y >︸ ︷︷ ︸=0

est nul, donc x ∈ (F ∩G)⊥.

139

II Les espaces Euclidiens

II.1 Bases orthonorméesDéfinition II.1

Soit p ∈ [[1, n]]. Une famille B = (e1, ...ep)de E est diteB orthogonale lorsque ∀i, j ∈ [[1, p]], si i 6= j alors < ei, ej >= 0.B orthonormée lorsqu’elle est orthogonale et que pour tout i ∈ [[1, p]], ‖ei‖ = 1.

B La base canonique de Rn est orthonormée pour le produit scalaire usuel, et la base canoniquede Mn(R) est aussi orthonormée pour le produit scalaire usuel sur cet espace.

Nous déduisons du corollaire I.2 la propriété suivante :Propriétés II.2

Soit B = (e1, ...en) une famille de n vecteurs de E, où n = dimE.Si B est orthonormée, c’est une base de E.

La première remarque importante est qu’elles existent toujours :Théorème II.3

Tout espace euclidien possède une base orthonormée (en fait, il en possède une infinité dès qu’ilest de dimension au moins 2).

Démonstration : Soit le prédicat portant sur l’entier n ∈ N∗ :

P(n) :(

Tout espace euclidien de dimension n possède une base orthonormée.).

• Initialisation : Soit E un espace euclidien de dimension 1, et soir x ∈ E un vecteur non nul.

Alors

(x

‖x‖

)est une base orthonormée de E.

• Hérédité : Soit n ∈ N∗ tel que P(n) est vrai. Soit alorsE un espace euclidien de dimension n+1.Prenons en+1 un vecteur unitaire de E et F =

(Vect (en+1)

)⊥. Puisque Vect (en+1)⊕F = E, F

est dimension n et possède donc une base orthonormée (e1, ..., en) par hypothèse de récurrence.Alors (e1, ..., en, en+1) est une base orthonormée de E car les n+1 vecteurs qu’elle contient sontunitaires, et pour tout i ∈ [[1, n]], < ei, en+1 >= 0.

L’intérêt des bases orthonormées provient de ce que le calcul des composantes de tout vecteurne nécessite pas d’inverser une matrice de taille n : il suffit de calculer n produits scalaires. De plus,le produit scalaire a dans une telle base la même expression que celle que nous connaissons dansRn. Précisément :Propriétés II.4

Soit B = (e1, ...en) une base orthonormée de E.

1. Pour tout vecteur x de E,

x =n∑i=1

< x, ei > ei.

2. Soient x, y ∈ E. Notons x =∑ni=1 xiei et y =

∑ni=1 yiei. Alors :

< x, y >=n∑i=1

xiyi, et ‖x‖2 =n∑i=1

x2i .

Autrement dit, Mat B(x) =

< x, e1 ><, e2 >

...< x, en >

.

Démonstration : 1. Puisque B est une base de E, il existe n réels x1, ..., xn tels que x =∑n

i=1 xiei.Pour tout j ∈ [[1, n]], < x, ej >=

⟨∑n

i=1 xiei, ej⟩

=∑n

i=1 xi< ei, ej >︸ ︷︷ ︸=δi,j

= xj .

140

2. Par bilinéarité du produit scalaire,

< x, y >=

⟨n∑i=1

xiei,

n∑j=1

yjej

⟩=

n∑i=1

n∑j=1

xixj < ei, ej >︸ ︷︷ ︸=δi,j

=n∑i=1

xiyi.

Donnons-en une interprétation matricielle :

Proposition II.5

Soit B = (e1, ...en) une base orthonormée de E.

1. Soient x, y ∈ E et X = Mat B(x) et Y ∈ Mat B(y) ∈ Rn les vecteur des composantes de xet y dans B. Alors

< x, y >= tXY.

2. Soit f un endomorphisme de E. Notons M =(mi,j

)16i,j6n sa matrice dans B. Alors

∀i, j ∈ [[1, n]], mi,j =< f(ej), ei > .

Démonstration : 1. Conséquence immédiate du point 2. de la propriété (II.4.

2. La j−ième colonne de M est la colonne des composantes de f(ej) dans B. D’après le premierpoint de la propriété (II.4), son i−ème coefficient a bien la forme requise.

Nous verrons la question de la construction de bases orthonormées dans le chapitre suivant.

Corollaire II.6 (Dual d’un espace euclidien)

1. Pour toute forme linéaire ϕ : E → R, il existe un unique x0 ∈ E tel que

∀x ∈ E, ϕ(x) =< x, u > .

2. Pour tout hyperplan H ⊂ E, il existe x0 ∈ E tel que H =(Vect (x0)

)⊥.

Démonstration : 1. Posons pour tout réel x, Φx : y ∈ E 7→< x, y >∈ R. Il s’agit de prouver la bijectivitéde l’application linéaire Φ E −→ L (E,R)

x 7−→ Φx. Or E et L (E,R) sont de dimension 1, donc

l’injectivité suffira. Mais, si x ∈ ker Φ, alors pour tout y ∈ E,< x, y >= 0 et en particulier< x, x >= 0, donc x = 0E .

2. Tout hyperplan H est le noyau d’une forme linéaire non nul ϕ. Or, d’après le premier point, ilexiste x0 ∈ E tel que ϕ = Φx0 , et alors H =

(Vect x0

)⊥.

Remarques :

Soit B une base orthonormée de E, p un projecteur de E et M sa matrice dans la baseB. Alors

M ∈ Sn(R)⇐⇒ p est un projecteur orthogonal.

II.2 Les projections orthogonalesProposition II.7

Soit E un espace vectoriel préhilbertien, et F un sous-espace vectoriel de E de dimension finie.Alors

1. Pour tout x ∈ E, il existe un unique y ∈ F tel que x− y ∈ F⊥.

141

2. Pour toute base orthonormée (e1, . . . , ep) de E, ce vecteur y est égal à

y =p∑k=1

< x, ek > ek.

3. F ⊕ F⊥ = E, et F⊥ est appelé supplémentaire orthogonal de F .

Démonstration : 1.

2. Il suffit de vérifier les deux points suivants : l’appartenance de y =∑p

i=1 < x, ei > ei à F et cellede x− y à F⊥. Le premier point est évident, et le deuxième découle de :

∀k ∈ [[1, p]], < x− y, ek >=< x, ek > −p∑i=1

< x, ei > < ei, ek >︸ ︷︷ ︸=δi,k

=< x, ek > − < x, ek >= 0,

donc x− y ∈ Vect (e1, ...ep)⊥.

3.

Proposition II.8 (Le projecteur orthogonal)

Soit E un espace vectoriel préhilbertien, et F un sous-espace vectoriel de E de dimension finie.L’application f E −→ E

x 7−→ yque nous venons de construire est un endomorphisme de E.

C’est de plus un projecteur, précisément le projecteur sur F parallèlement à son supplémentaireorthogonal.

Démonstration :

Résumons et élargissons :

Définition II.9

Soit E un préhilbertien et F un sous-espace vectoriel de dimension finie.F et F⊥ sont alors orthogonaux. On appelleB projection orthogonale p sur F le projecteur sur F parallèlement à F⊥. Alors :

∀x ∈ E, p(x) ∈ F et x− p(x) ∈ F⊥.

B symétrie orthogonale s par rapport à F la symétrie par rapport à F parallèlement à F⊥.Alors :

∀x ∈ E, x+ s(x) ∈ F et x− s(x) ∈ F⊥.

B réflexion par rapport à l’hyperplan H la symétrie orthogonale par rapport à H.

Remarques :

B La réflexion par rapport à H =(Vect (x0)

)⊥, si x0 est unitaire, admet pour expression

s E −→ Ex 7−→ x− < x, x0 > x0

.

B Soit E = Rn muni de son produit scalaire canonique. Soit U ∈ Rn un vecteur unitaire.La matrice du projecteur orthogonal sur Vect U est M = U tU .

B On pourra montrer la caractérisation suivante des projecteurs orthogonaux parmi lesprojecteurs : si p : E → E est un projecteur, alors

p est un projecteur orthogonal⇐⇒ ∀x ∈ E, ‖p(x)‖ 6 ‖x‖.

142

Théorème II.10 (Minimum et projection orthogonale)

Soit E un espace préhilbertien, et F un sous-espace vectoriel de E de dimension finie. Notonsf la projection orthogonale sur F . Alors :

∀x ∈ E,∀y ∈ F, ‖x− y‖ > ‖x− f(x)‖,

et il y a égalité si et seulement si y = f(x).

Démonstration : C’est essentiellement le théorème de Pythagore : puisque x−f(x) ∈ F⊥, et f(x)−y ∈ F ,ces deux vecteurs sont orthogonaux. Or leur somme vaut x−y. Ainsi, ‖x−y‖2 = ‖x−f(x)‖2 +‖f(x)−y‖2 > ‖x− f(x)‖2, avec égalité ssi ‖f(x)− y‖2 = 0.

II.3 Orthonormalisation de Gramm-Schmidt

Nous présentons un procédé de construction de bases orthonormées à partir d’une base de E :

Théorème II.11 (Orthonormalisation de Gram-Schmidt)

Soit E un espace préhilbertien et E = (e1, ..., ep) une famille libre de E. Alors il existe uneunique famille V = (v1, ...vp) de vecteurs de E qui vérifie

(v1, ..., vp) est orthonormée,∀k ∈ [[1, p]], Vect (e1, ..., ek) = Vect (v1, ..., vk),∀k ∈ [[1, p]], < ek, vk >> 0.

On appelle cette nouvelle famille orthonormalisée de Gram-Schmidt de (e1, ..., ep).

Démonstration de l’existence dans (II.11) : Notons pour tout k ∈ [[1, p]],• Fk = Vect (e1, ...ek),• Pk ∈ L (E) le projecteur othogonal sur Fk,

• v1 = e1

‖e1‖et si k > 1, vk = ek − Pk−1(ek)

‖ek − Pk−1(ek)‖ .

La matrice de la famille (v1, ..., vk) dans la base (e1, ...ek) de Fk est clairement triangulaire supérieurepuisque ∀i ∈ [[2, k]], Pi−1(ei) ∈ Vect (e1, ..., ei−1) ⇒ vi ∈ Fi ⊂ Fk. Cette matrice admet comme coef-

ficients diagonaux

(1‖e1‖

,1

‖e2 − P1(e2)‖ , ...,1

‖ek − Pk−1(ek)‖

), dont aucun n’est nul. Cette matrice

est par conséquent inversible, ce qui fait de (v1, ..., vk) une base de Fk, et prouve le deuxième point.La famille V est normée. De plus, par définition des projecteurs, ek − Pk(ek), (et donc vk) appar-

tient à F⊥k = Vect (v1, ..., vk)⊥. Ainsi, pour tout 1 6 i 6 k,< vi, vk >= 0, et la famille V est bienorthonormée.

Reste le dernier point : puisque Pk−1(ek) ∈ Fk−1,

< ek, vk >=⟨ek,

ek − Pk−1(ek)‖ek − Pk−1(ek)‖

⟩=⟨ek,

ek‖ek − Pk−1(ek)‖

⟩= ‖ek‖2

‖ek − Pk−1(ek)‖ > 0.

Démonstration de l’unicité dans (II.11) : Soient (v1, ..., vp) et (w1, ..., wp) deux familles vérifiant les pro-priétés qui définissent l’orthonormalisée de E . Par récurrence sur 1 6 k 6 p, prouvons que vk = wk :

v1 et w1 sont deux vecteurs untaires de la droite F1 : ils sont donc colinéaires, mais la troisièmepropriété implique que leur coefficient de proportionnalité est > 0. Ils sont donc égaux.

vk et wk appartiennent tous les deux au supplémentaire orthogonal de Fk−1 dans Fk. Mais puisqueFk−1 est un hyperplan de Fk ce supplémentaire orthogonal est une droite, et on peut conclure avecexactement les mêmes arguments que dans le cas où k = 1.

143

Remarques :

B Puisque F est orthonormée, la matrice de passage de la base F à la base E est< e1, v1 > < e1, v1 > . . . < ep, v1 >

0 < e2, v2 >...

.... . .

. . ....

0 . . . 0 < ep, vp >

∈ GLp(R) ∩T +n (R).

B On appelle génériquement “polynômes orthogonaux” la problématique suivante : Soitw ∈ C 0([a, b],R) une fonction strictement positive sur [a, b]. On définit alors le produitscalaire suivant sur E = R[X] : < P,Q >=∈ba P (t)Q(t)w(t)dt. La famille des poly-nômes orthogonaux est l’orthonormalisée de Gram-Schmit de la base canonique deE.

III Le groupe orthogonal

Dans tout ce paragraphe, E sera un espace vectoriel euclidien.

III.1 Endomorphismes orthogonaux

Définition III.1

Soit f ∈ L (E). f est un endomorphisme orthogonal, ou une isométrie vectorielle lorsque

∀x, y ∈ E, < f(x), f(y) >=< x, y > .

On note O(E) l’ensemble des endomorphismes orthonaux.

Pour montrer qu’un endomorphisme est une isométrie, nous uiliserons plutôt :

Proposition III.2

Soit f ∈ L (E). Alorsf ∈ O(E)⇐⇒ ∀x ∈ E, ‖f(x)‖ = ‖x‖.

Démonstration : Le sens direct est évident, puisque < x, x >= ‖x‖2.La réciproque utilise la polarisation : ∀x, y ∈ E, 4 < x, y >= ‖x+ y‖2 − ‖x− y‖2. Ainsi, si on supposeque f préserve la norme, pour tous x, y ∈ E,

< f(x), f(y) > = ‖f(x) + f(y)‖2 − ‖f(x)− f(y)‖2

4

= ‖f(x+ y)‖2 − ‖f(x− y)‖2

4 , car f est linéaire

= ‖x+ y‖2 − ‖x− y‖2

4 car f préserve la norme,

= < x, y > .

B Toute isométrie de E est ainsi injective (car ‖f(x)‖ = 0 ⇔ ‖x‖ = 0) et par conséquentbijective car E est de dimension finie.

B Les symétries orthogonales sont des isométries.B IdE est le seul projecteur orthogonal qui soit une isométrie.Plusieurs propriétés (injectivité, surjectivité) d’un endomorphisme f de E se lisent sur les pro-

priétés de l’image d’une base de E par f (libre, génératrice). Il en est de même du caractère ortho-gonal de f :

144

Proposition III.3

Soit E un espace euclidien et f ∈ L (E). Alors on a l’équivalence entre les prédicats suivants :

f ∈ O(E) ⇐⇒ ∃ une BON B de E dont l’image par f est une BON de E

⇐⇒ ∀B BON de E, l’image par f de B est une BON de E.

Démonstration : Supposons que f soit une isométrie. Puisqu’elle conserve le produit scalaire, l’image de laBON (e1, ..., en) vérifie pour tout couple (i, j) l’égalité < f(ei), f(ej) >=< ei, ej >= δi,j , donc elle estorthonormée. Ainsi, le premier prédicat implique les deux autres. Il est de plsu évident que le troisièmeimplique le deuxième. Il reste à prouver que le deuxième implique le premier. Or, si (e1, ..., en) est uneBON dont l’image par f est une BON, alors pour tout x ∈ E,

‖f(x‖2 =

∥∥∥∥∥f(

n∑i=1

xiei

)∥∥∥∥∥2

=

∥∥∥∥∥n∑i=1

xif(ei)

∥∥∥∥∥2

=

⟨n∑i=1

xif(ei),n∑j=1

xjf(ej)

=n∑i=1

n∑j=1

xixj < f(ei), f(ej) >︸ ︷︷ ︸=δi,j

car f(B) est une BON,

=n∑i=1

x2i = ‖x‖2.

145

Proposition III.4 (Le groupe orthogonal)

Si E est un espace euclidien, l’ensemble O(E) est un sous-groupe de (GL(E), ), appelé groupeorthogonal de E.

Démonstration : Nous avons déjà vu l’inclusion O(E) ⊂ GL(E).O(E) est non vide puisqu’il contient l’identité.Si f et g ∈ O(E), alors f g ∈ O(E) car pout tout x ∈ E, ‖f g(x)‖ = ‖f

(g(x)

)‖ = ‖g(x)‖ = ‖x‖.

Si f ∈ O(E), alors pour tout x ∈ E, ‖f(f−1(x)

)‖ = ‖f−1(x)‖, i.e ‖x‖ = ‖f−1(x)‖ et f est bien une

isométrie.

III.2 Matrices orthogonales

Ici, n ∈ N∗, et Rn sera toujours muni du produit scalaire canonique.

Définition III.5

SoitM ∈Mn(R).M est dite orthogonale lorsque l’endomorphisme de Rn LM Rn −→ RnX 7−→ MX

est une isométrie de Rn.On note On(R) l’ensemble des matrices orthogonales.

Proposition III.6

Soit M ∈Mn(R). Sont équivalentes :

1. M ∈ On(R)2. tMM = In3. M tM = In4. Les colonnes de M forment une base orthonormée de Rn.

5. Les lignes de M forment une base orthonormée de Rn.

Démonstration : Rappelons que pour tous X,Y ∈ Rn, < X, Y >= tXY .1⇒ 2 : ∀X,Y ∈ Rn, < X, Y >=< MX,MY > car M ∈ On(R). D’où

tXY = t(MX)(MY )⇒ tXY = tXtMMY.

Or, en notant (e1, ...en) la base canonique de Rn et en prenant X = ei et Y = ej , on se convainc faci-lement que pour toute matrice N , le scalaire tXNY est le coefficient (i, j) de N , et donc le coefficient(i, j) de tMM est < ei, ej >= δi,j . tMM est bien la matrice identité.2⇐⇒ 3 . Lorsque deux matrices carrées vérifient AB = In, elles sont inversibles car LA LB = IdRn ,

donc LA est injective, et par conséquent bijective, ce qui est équivalent à l’inversiblité de A. Mais alors,en multipliant cette égalité par A−1, on voit que B = A−1, et qu’en particulier, BA = In.2⇐⇒ 4 ( et donc 3⇐⇒ 5 ) Si on note (C1, ...Cn) les colonnes de M,∀i, j ∈ [[1, n]], la matrice tMM

a pour coefficient (i, j) le réel tCiCj =< Ci, Cj >. Celui de l’identité étant δi,j , la famille des vecteurscolonne de M vérifie < Ci, Cj >= δi,j , donc est orthonormée.4⇒ 1 Les colonnes de M forment une base orthonormée de Rn et sont aussi l’image de la base

canonique de Rn par l’endomorphisme ŁM . La base canonique de Rn étant orthonormée, Lm est uneisométrie d’après la proposition III.3, et donc M ∈ On(R).

146

Remarques :

B En particulier, inverser une matrice orthogonale est très simple : il suffit de la transpo-ser.

B Toute matrice de rotation(

cosx − sin xsin x cosx

)est orthogonale.

LM n’est pas le seul endomrophisme de Rn dont la matrice dans un BON soit orthogonale. On ace que l’on peut considérer la proposition suivante comme une réciproque de la définition ci-dessus,et une traduction matricielle littérale de la proposition III.3 :

Proposition III.7

Soit E un espace euclidien et f ∈ L (E). Alors on a l’équivalence entre les affirmations sui-vantes :

f ∈ O(E) ⇐⇒ ∀B BON de E,Mat B(f) ∈ On(R)⇐⇒ ∃B BON de E,Mat B(f) ∈ On(R).

Proposition III.8 (Matrice de passage entre deux bases orthonormées)

Soit B0 une BON de E, et B1 une base de E. Alors

B1 est une BON de E ⇐⇒ la matrice de passage PB1B0∈ On(R).

En particulier, la matrice de passage entre deux BON de E est une matrice orthogonale.

Démonstration : Notons (C1, ...Cn) les colonnes de PB1B0

, i.e les composantes des vecteurs v1, ...vn de labase (B1) dans la base orthonormée B0. Alors,

la matrice de passage PB1B0∈ On(R) ⇐⇒ (C1, ...Cn) est une BON de Rn, d’après 2. de III.6

⇐⇒ (v1, ...vn) est une BON, car B0 est une BON.

IV Géométrie Vectorielle euclidienne

Soit n = 2 ou 3. Rappelons qu’un espace euclidien orienté de diemnsion n est un espace euclidiendont on s’est donné une base de référence B0. Toute base B de E est ainsi orienté ; elle est ditedirecte si detPB

B0> 0, et indirecte si detPB

B0< 0.

En particulier, R2 et R3 sont orientés par leur base canonique.

Proposition IV.1 (Conservation de l’aire)

Soit n = 2 ou 3. Pour tout Ω ∈ On(R), det Ω = 1 ou −1.On note SOn(R) = M ∈ On(R)/ det Ω = 1.C’est un sous-groupe de

(On(R),

)appelé groupe spécial orthogonal.

Démonstration : ΩtΩ = In ⇒ det(ΩtΩ

)= det In ⇒ det

(Ω)

det(tΩ)

= 1⇒(

det Ω)2 = 1.

Enfin, pour montrer la qualité de sous-groupe, on peut le faire à la main, ou bien remarquer quedet :

(On(R),

)→(R∗,×

)étant un morphisme de groupes, SLn est un sous-groupe en tant que

noyau de ce morphisme.

La version fonctionnelle de cette proposition est

Corollaire IV.2

si f est un endomorphisme orthogonal d’un plan euclidien E, alors le déterminant de f vaut 1

147

ou −1.

IV.1 Dans le plan orienté

Nous noterons pour tout réel x :

Rx =(

cosx − sin xsin x cosx

)et Sx =

(cosx sin xsin x − cosx

).

Commençons, avant d’étudier ces deux ensembles de matrices, par prouver qu’elles constituenttout O2(R) :

Théorème IV.3 (Réduction de O2(R))

Soit Ω ∈ O2(R)B Si det Ω = 1, alors ∃θ ∈ R tel que Ω = Rθ.B Si det Ω = −1, alors ∃θ ∈ R tel que Ω = Sθ.

Démonstration : Puisque Ω est orthogonale, d’après la proposition, ses vecteurs colonne froment une baseorthonormée de R2. Or, Ω = P

(C1,C2)B0

. Maintenant :

1. Si det Ω = 1, alors (C1, C2) est orthonormée directe, donc il existe θ ∈ R tel que C1 = −→uθ etC2 = −→vθ

2. Si det Ω = −1, alors (C1, C2) est orthonormée indirecte, donc il existe θ ∈ R tel que C1 = −→uθ etC2 = −−→vθ

Propriétés IV.4 (des réflexions)

Soit x ∈ R. AlorsB Sx ∈ O2(R) a pour déterminant −1.

B C’est la réflexion par rapport à la droite vectorielle engendrée par(

cos x2sin x

2

).

B Elle est semblable à la matrice Diag(1,−1). Précisément,

Sx = Rx/2Diag(1,−1)tRx/2.

Démonstration : Le premier point est évident et pour le troisième, il suffit d’effectuer le produit matriciel.Pour le deuxième, on vérifie facilement que S2

x = I2, et que

Sx

(cos x2sin x

2

)=(

cos x2sin x

2

), et Sx

(− sin x

2cos x2

)= −

(− sin x

2cos x2

).

Ainsi, Sx est la matrice dans la base canonique de la symétrie par rapport à Vect

(cos x2sin x

2

)parallèlement

à Vect

(− sin x

2cos x2

). Or, ces deux droites sont orthogonales, donc Sx est une réflexion.

Le cas des rotations est plus connu et ne nécessitera pas de preuve :

Propriétés IV.5 (des rotations)

Soit x ∈ R. AlorsB Rx ∈ O2(R) a pour déterminant 1.B Rx est la rotation vectorielle de centre 0 et d’angle x.B ∀x, y ∈ R, Rx ×Ry = Rx+y et R−1

x ×Ry ×Rx = Ry.

De ces propriétés et du théorème de réduction de O2, on déduit le théorème suivant :

Théorème IV.6 (Réduction de O2(E))

Soit E un plan euclidien orienté et f ∈ O(E).

148

B Si det f = 1, alors

1. ∃θ ∈ R tel que pour toute BOND B de E, Mat B(f) = Rθ.

2. Pour tout vecteur unitaire u ∈ E,

cos θ =< u, f(u) >sin θ = det(u, f(u))

B Si det f = −1, alors

1. Il existe une BON directe B de E dans laquelle Mat B(f) =(

1 00 −1

).

2. Pour tout BON directe B de E, il existe θ ∈ R tel que Mat B(f) = Sθ.

Démonstration : B Supposons que det f = 1. Alors, puisque det f est le déterminant de la matrice def dans n’importe quelle base, Ω := Mat B0 (f) a pour déterminant 1. Ω est de plus une matriceorthogonale, donc une rotation. Si maintenant B est une autre BOND de E, alors la matrice Pde passage entre B et B0 est une matrice orthogonale de déterminant 1, soit ausi une matricede rotation. D’après la dernière propriété énoncée sur les rotations, Mat B(f) = P−1ΩP = Ωet l’angle θ de la rotation est bien indépendant de la BOND dans laquelle on écrit la matrice def .Pour les formules du sinus et du cosinus, elles se vérifient en prouvant que pour tout θ, a, b ∈ R,si a2 + b2 = 1, ⟨(

ab

), Rθ

(ab

)⟩= cos θ, et det

((ab

), Rθ

(ab

))= sin θ

B Dans toute BOND, la matrice de f est orthogonale de déterminant −1, donc on peut utiliser ledernier point du théorème IV.6 pour établir le dernier point de ce théorème. Enfin, on conclutavec une propriété sur les réflexions.

Enfin, le produit de deux réflexions est une rotation (pourquoi ?), et la réciproque est vraie :

Proposition IV.7 (Décomposition d’une rotation)

Soient X,X ′ deux vecteurs non nuls de E, S la réflexion par rapport à Vect X et S′ la réflexionpar rapport à Vect (X ′). Alors S′ S est la rotation d’angle 2θor(X,X ′).

Démonstration : S′ S est une isométrie - car (O2, ) est un groupe- de déterminant 1, donc une rotation.Nous supposerons que S et S′ sont des matrices, ce qui n’est pas restrictif. Si on note x un argumentde X et y un argument de X ′, alors d’une part θor(X,X ′) = y−x, et d’autre part S = S2x et S′ = S2yd’après le deuxième point de la proposition IV.4. Il suffit maintenant de calculer

S′ × S =(

cos 2y sin 2ysin 2y − cos 2y

)(cos 2x sin 2xsin 2x − cos 2x

)=(

cos 2(y − x) sin 2(y − x)sin 2(y − x) − cos 2(y − x)

)= R2(y−x).

IV.2 Dans l’espace orienté

Le cas de la dimension 3 est légèrement plus délicat à étudier car les éléments caractéristiquesd’une rotation par exemple n’apparaissent pas du premier coup d’oeil. Conformément au pro-gramme, nous ne nous intéresserons qu’aux rotations, i.e aux isométries vectorielles qui conserventl’orientation.

On rappelle que E est un espace euclidien orienté de dimension 3, et que SO3(E) est l’ensembledes endomorphismes orthogonaux de E de déterminant 1.

Proposition IV.8 (Réduction de O3(R))

Soit f ∈ SO3(E). Alors il existe une base orthonormée directe B = (O,−→e1 ,−→e2 ,−→e3) et un réel θ

tels que

Mat B(f) =

1 0 00 cos θ − sin θ0 sin θ cos θ

Une telle isométrie est appelée rotation de demi-axe R+

−→e1 et d’angle θ, et notée Rot−→e1,θ.

149

Si θ = π, on dit de f que c’est un retournement, ou un demi-tour.

Démonstration : Il y a plusieurs étapes :B P : x ∈ R 7→ det(f − xId) est un polynôme de degré 3 et de coefficient dominant −1 (utiliser

Sarrus par exemple). Il possède donc une racine x0. Alors, (f −x0Id) est non injectif, et il existeun vecteur −→e1 que l’on peut choisir unitaire tel que f(−→e1) = x0

−→e1 . Enfin, f étant une isométrie,1 = ‖e1‖ = ‖f(−→e1)‖ = ‖x0

−→e1‖ = |x0|, et donc x0 vaut 1 ou −1.B Soit y un vecteur orthogonal à −→e1 . Alors,

± < f(y),−→e1 >=< f(y), x0−→e1 >=< f(y), f(−→e1) > =< y,−→e1 >︸ ︷︷ ︸

car f∈O3

= 0.

Ainsi, f(y) est lui aussi orthogonal à −→e1 , ce qui signifie que f laisse stable le plan −→e1⊥. Prenons

(−→e2 ,−→e3) une base orthonormée de ce plan telle que B soit une bond de E. Ainsi, dans cette base,

Mat (f) =

(ε 0 00 a b0 c d

),

où ε = ±1 et

(a bc d

)∈ O2 puisque les deux dernières colonnes de la matrice 3 × 3 forment

une famille orthonormée.f est une rotation, donc deux cas sont possibles :– soit ε = 1 et alors ad− bc = 1, ce qui signifie que cette matrice 2× 2 est celle d’une rotation,

et alors Mat B(f) a la forme voulue.

– soit ε = −1, et alors

(a bc d

)est la matrice d’une réflexion. Il existe par conséquent un

vecteur unitaire

(xy

)tel que

(a bc d

)(xy

)=(xy

), d’après le théorème IV.6. Ceci entraîne

qu’en posant −→u =

(0xy

), nous obtenons Mat B(f)−→u = −→u . En remplaçant −→e1 par −→u , on est

ramené au cas précédent.

Remarques :

1. Pratiquement, les éléments caractéristiques de cette rotation se retrouvent grâce à :B −→e1 ∈ ker(f − Id).B Trace (f) = 1 + 2 cos θ,B Pour tout vecteur unitaire −→u orthogonal à −→e1 , sin θ = det (−→u , f(−→u ),−→e1) .

2. Une symétrie orthogonale est une isométrie, mais c’est un élément de SO3(R) siet seulement si ker(f + Id) est de dimension paire (réduire cette matrice dans unebase adaptée pour calculer son déterminant) i.e ssi f = Id, ou f est une symétriepar rapport à une droite R−→u , auquel cas f = R−→u ,π.

Proposition IV.9

Soit −→u ∈ R3 et θ ∈ R. L’image d’un vecteur −→x orthogonal à −→u par la rotation de demi-axe −→u etd’angle θ est donné par :

R(x) = (cos θ)−→x + (sin θ)−→u ∧ −→x .

150

V Compléments

V.1 Les matrices de GrammDéfinition V.1 (Matrices de Gramm d’une famille)

Soit F = (v1, ...vp) une famille de vecteurs de E quelconque. On appelle matrice de Gramm decette famille la matrice symétrique d’ordre p suivante

G(v1, ..., vp) =(< vi, vj >

)16i,j6p.

Bien que ne faisant pas partie du programme, cette matrice est très utile et beaucoup de pro-priétés tournent autour d’elle. Nous nous en servirons pour prouver qu’un sous-espace vectoriel deE est toujours supplémentaire de son orthogonal.

Proposition V.2 (Inversibilité de la matrice de Gram)

Soit F = (v1, ...vp) une famille de vecteurs de E, et G(v1, ..., vp) sa matrice de Gram. On al’équivalence suivante :

G(v1, ..., vp) est inversible⇐⇒ la famille (F ) est libre.

Démonstration : Soit X =

x1...xp

∈ Rp. Alors,

X ∈ kerG ⇐⇒ ∀i ∈ [[1, ..ep]],p∑j=1

< ei, ej > xj = 0

⇐⇒ ∀i ∈ [[1, ..ep]],

⟨ei,

p∑j=1

xjej

⟩= 0

⇐⇒ ∀i ∈ [[1, ..ep]],p∑j=1

xjej ⊥ ei.

⇐⇒ ∀i ∈ [[1, ..ep]],p∑j=1

xjej ∈(Vect (e1, ...ep)

)⊥,

Or, en notant F = Vect (e1, ...ep) et y =∑p

j=1 xjej , y appatient donc à F⊥, mais ausi à F , donc il estnul.

Nous avons donc montré que pour toutX =

x1...xp

∈ Rp, l’équivalenceX ∈ kerG⇔∑p

i=1 xiei =

0E . La conclusion est alors simple si l’on se souvient d’une part que G est inversible si et seulement si0E est le seul vecteur dans le noyau de G, et d’autre part que par définition, (e1, ..., ep) est une famillelibre lorsque la seule combinaison linéiare nulle de (e1, ..., ep) est la combinaison triviale.

Proposition V.3 (Supplémentaire orthogonal)

Soit F un sous-espace vectoriel de dimension finie de E. F et F⊥ son supplémentaires, cequi signifie que

∀x ∈ E, il existe un unique y ∈ F tel que x− y ∈ F⊥.

Démonstration : Soit x ∈ E. Soit aussi (e1, ..., ep) une base de F . Tout vecteur de F s’écrit y =∑p

i=1 yiei.Nous cherchons à prouver l’existence et l’unicité d’un p−uplet (y1, ...yp) tel que x −

∑p

i=1 yiei appar-

151

tienne à F⊥. Or, en notant G la matrice de Gram de (e1, ...ep),

x−p∑i=1

yiei ∈ F⊥ ⇐⇒ ∀j ∈ [[1, p]],

⟨x−

p∑i=1

yiei, ej

⟩= 0,

⇐⇒ ∀j ∈ [[1, p]],p∑i=1

yi < ei, ej >=< x, ej >,

⇐⇒ G

y1...yp

=

< x, e1 >...

< x, ep >

,

et puisque (e1, ..., ep) est libre, la matrice de Gram G est inversible d’après la proposition (V.2), donc il

existe bien un unique p−uplet (y1, ...yp) : G−1

< x, e1 >...

< x, ep >

.

152

Chapitre 12

Les Fonctions de plusieurs variables

I Rudiments de topologie

En tout état de cause, jamais il ne viendrait à l’idée d’un examinateur de vous interroger surles notions suivantes, mais il nous faut les introduire afin de nous éviter l’écueil des définitionsbancales, et aussi parce qu’elles résonneront avec certaines choses que l’on a pu voir au royaumedes fonctions à une seule variable réelle.

Toutes les normes qui apparaitront dans ce cours seront les normes euclidiennes, i.e

B Si ω =(xy

)∈ R2, ‖ω‖ =

√x2 + y2.

B Si ω =

xyz

∈ R3, ‖ω‖ =√x2 + y2 + z2.

I.1 Les ouverts de R2

Commençons par le plus simple d’entre eux :

Définition I.1 (Disque ouvert)

Soit ω ∈ R2 et r > 0. On appelle Disque ouvert de centre ω et de rayon r > 0 l’ensemble

D(ω, r) = z ∈ R2 tels que ‖z − ω‖ < r.

En particulier, si Ω ⊂ R2, on a(D(ω, r) ⊂ Ω

)⇐⇒

(∀z ∈ R2, si ‖z − ω‖ < r, alors z ∈ Ω.

)Définition I.2 (Ouvert)

Soit Ω ⊂ R2. On dit que Ω est un ouvert de R2 lorsque

∀w ∈ Ω,∃r > 0 tel que D(w, r) ⊂ Ω.

Autrement dit, Ω est ouvert si et seulement si tout point de Ω est le centre d’un disque ouvert inclusdans Ω.B Un disque ouvert D(ω, r) est ouvert dans R2. En effet, soit z ∈ D(ω, r). Alors, pour tout

point z appartenant à D(ω, r), on a r − ‖z − ω‖ > 0. De plus, soit y ∈ R2.

y ∈ D(z, r − ‖z − ω‖) =⇒ ‖y − z‖ < r − ‖z − ω‖=⇒ ‖y − z‖+ ‖z − ω‖ < r

=⇒ ‖y − w‖ < r d’après l’inégalité triangulaire,

=⇒ y ∈ D(ω, r).

153

Nous avons prouvé :

∀z ∈ D(ω, r), D(z, r − ‖z − ω‖) ⊂ D(ω, r).

B Le demi-plan (dit ouvert) H =(

xy

)∈ R2 tels que y > 0

est ouvert.

En effet, quelque soit ω =(x0y0

)∈ H, le disque D(ω, y0/2) ⊂ H. Montrons-le : soit β =(

xy

)∈ R2.

β ∈ D(ω, y0/2) =⇒ ‖β − ω‖ < y0/2=⇒

√(x− x0)2 + (y − y0)2 < y0/2

=⇒ |y − y0| 6√

(x− x0)2 + (y − y0)2 < y0/2=⇒ y − y0 > −y0/2 =⇒ y > y0/2 > 0=⇒ β ∈ H.

B Le demi-plan (dit fermé) H =(

xy

)∈ R2 tels que y > 0

n’est pas ouvert. Le problème

provient des poinst situés sur l’axe des abscisses. Prenons par exemple le point O et montronsqu’aucun disque de centre O n’est complètement inclus dans H : Soit r > 0. Le point ω =(

0−r/2

)∈ D(O, r), et pourtant son ordonnée est strictement négative. Donc D(O, r) * H.

I.2 Les fonctions continues

Dans toute la suite, les ensembles Ω sur lesquels seront définies nos fonctions seront tous desouverts.Définition I.3

Soit Ω un ouvert de R2 et f : Ω −→ R.Soit ω0 ∈ Ω. On dit f est continue en ω0 lorsque

∀ε > 0,∃α > 0,∀ω ∈ Ω, si ‖ω − ω0‖ < α alors |f(ω)− f(ω0)| < ε.

On dira que f est continue sur Ω lorsque pour tout ω0 ∈ Ω, f est continue en ω0.

154

On ne s’appesantira pas sur cette notion. Tous les théorèmes sur la continuité des fonctions àune variable sont encore valables : stabilité par combinaison linéaire, par produit, par quotient sile dénominateur ne s’annule pas, par composition. Ainsi, les polynômes en x, y sont continus, lesfractions rationnelles aussi sauf aux points que vous devinez, and so on...

La caractérisation séquentielle de la continuité est encore valable et nous servira à nouveau àprouver qu’une fonction n’est pas continue :

Proposition I.4 (Caractérisation séquentielle de la limite)

Soit Ω un ouvert de R2 et f : Ω −→ R. Soit ω0 ∈ Ω. Alors f est continue en ω0 si et seulement sipour toute suite (un)n∈N d’éléments de Ω,(

limn→∞

un = ω0

)=⇒

(limn→∞

f(un) = f(ω0)).

Nous admettrons ce résultat.Montrer que la fonction définie sur R2 suivante

f : (x, y) ∈ R2 7→

∣∣∣∣∣xy

x2 + y2 si (x, y) 6= (0, 0)0 si x = y = 0.

n’est pas continue en (0, 0).

II La différentiation

II.1 Dérivée selon un vecteurDéfinition II.1 (Dérivées partielles)

Soit f : Ω −→ R et ω = (x0, y0) ∈ Ω. Lorsqu’elles existent, on appelleB dérivée partielle selon x en ω le nombre dérivée en 0 de t ∈ R 7→ f(x0 + t, y0). On le

note∂f

∂x(ω) = lim

t→0

f(x0 + t, y0)− f(x0, y0)t

.

B dérivée partielle selon y en ω le nombre dérivée en 0 de t ∈ R 7→ f(x0, y0 + t). On le

note∂f

∂y(ω) = lim

t→0

f(x0, y0 + t)− f(x0, y0)t

.

B gradient de f en ω le vecteur−−→gradf =

∂f∂x (ω)∂f

∂y(ω)

∈ R2.

Si pour tout ω ∈ Ω, la dérivée partielle selon x en ω de f existe, on dispose alors de la fonc-

tion∂f

∂xΩ −→ R

ω 7−→ ∂f

∂x(ω)

. Si de plus l’autre dérivée partielle existe, on dispose d’un champ de

vecteurs−−→gradf : Ω→ R2.

Pour étudier les variations d’une fonction d’ue seule variable réelle, on a besoin d’une fonctiondérivée. Ici, nous en avons deux, et finalement autant que de variables de l’espace de départ endimension supérieure.

Si f : (x, y) ∈ R2 7→ x2 + y2 + ln y, son ensemble de définition est H dont nous savons qu’il estun ouvert. Soit alors (x0, y0) ∈ H. Calculons la dérivée première en posant g : t 7→ f(x0 + t, y0) =(x0 + t)2 + y2

0 + ln y0. g′(0) = 2x0 pour tout x0 ∈ R si bien que∂f

∂x(x, y) = 2x.

De même, en posant g : t 7→ f(x0, y0 + t) = (x0)2 + (y0 + t)2 + ln(y0 + t), g′(0) = 2y0 + 1/y0,

donc∂f

∂y(x, y) = 2y + 1/y.

Notre définition coïncide bien avec celle des physiciens, et nous calculerons dorénavant lesdérivées partielles premières comme eux.

155

Définition II.2 (Fonctions C 1)

Soit f : Ω −→ R. On dira que f est de classe C 1 sur Ω lorsque les deux dérivées partielles de fseront définies et continues sur Ω.

Nous admettrons à nouveau que l’ensemble C 1(Ω,R) est stable par combinaison linéaire, parproduit, par quotient si le dénominateur ne s’annule pas, par composition. Ainsi, les polynômes enx, y sont C 1, les fractions rationnelles aussi sauf aux points que vous devinez, and so on...

II.2 Développement limité à l’ordre 1

Théorème II.3

Soit f : Ω −→ R une fonction de classe C 1. Soit ω = (x0, y0) ∈ Ω. Alors

f(x0 + α, y0 + β) = f(x0, y0) + α∂f

∂x(ω) + β

∂f

∂y(ω) + o(‖~h‖),

où ~h = (α, β), et donc ‖~h‖ =√α2 + β2.

Une manière plus condensée de l’écrire consiste à remarquer que

α∂f

∂x(ω) + β

∂f

∂y(ω) =< −−→gradfω,~h > .

Ce qui permet d’écrire le DL ainsi :

f(ω0 + ~h) = f(ω0)+ <−−→gradfω,~h > +o(‖~h‖).

Grâce à ce théorème (admis), nous pouvons reconstruire les dérivées selon un vecteur à partirdes deux dérivées partielles premières :

Corollaire II.4

Soit f : Ω −→ R une fonction de classe C 1. Soit ω = (x0, y0) ∈ Ω et ~h = (α, β) un vecteur deR2. Alors

1. la dérivée en t = 0 de la fonction t ∈ R 7→ f(ω + t~h) ∈ R existe. Nous la noterons

dfω(~h) = limt→0

f(ω + t~h)− f(ω)t

.

2. Nous avons l’égalité

dfω(~h) =< −−→gradfω,~h >= α∂f

∂x(ω) + β

∂f

∂y(ω).

3. L’application ~h ∈ R2 7→ dfω(~h) ∈ R est une forme linéaire sur R2.

Démonstration :

f(ω + t~h)− f(ω)t

= f(x0 + tα, y0 + tβ)− f(x0, y0)t

=tα∂f

∂x(ω) + tβ

∂f

∂y(ω) + o(‖t~h‖)

t

= α∂f

∂x(ω) + β

∂f

∂y(ω) + |t|‖

~h‖ε(‖t~h‖)t

= α∂f

∂x(ω) + β

∂f

∂y(ω)± ‖~h‖ε(‖t~h‖)

−−−→t→0

α∂f

∂x(ω) + β

∂f

∂y(ω).

156

Remarques :

B Vous avez déjà remarqué que , sous réserve d’existence,∂f

∂x(ω) = dfω(~i) et

∂f

∂y(ω) =

dfω(~j).B Notons aussi que pour alléger les notations, nous ne mettrons plus le point ω en indice.B On m’a interdit de le faire (cf le programme officiel), mais je transgresse : ce que

l’on note dfω s’appelle la différentielle de f en ω. Pour tout ω ∈ Ω, c’est donc uneforme linéaire, car elle mange des vecteurs ~h de R2, rend des réels, et l’expression ducorollaire nous prouve sa linéarité : dfω ∈ L (R2,R).Pour celles qui suivent encore, la différentielle d’une fonction f de classe C 1 sur unouvert Ω de R2 est donc une famille de formes linéaires indexée par les points de Ω :

df : ω ∈ Ω 7→ dfω ∈ L (R2,R), où dfω R2 −→ R

(α, β) 7−→ α∂f

∂x(ω) + β

∂f

∂y(ω)

.

Proposition II.5 (Dérivée le long d’une courbe)

Soit f : Ω −→ R une fonction de classe C 1.Soit γ I −→ Ω

t 7−→ γ(t) =(x(t), y(t)

) une courbe de classe C 1 définie sur un intervalle I, à

valeurs dans Ω. Pour tout réel t ∈ I, nous noterons ~γ′(t) son vecteur dérivée en t.La fonction f γ : I → R est de classe C 1 et

∀t ∈ I,(f γ

)′(t) =< −−→gradfγ(t), ~γ′(t) >= x′(t)∂f

∂x

(γ(t)

)+ y′(t)∂f

∂y

(γ(t)

).

Démonstration : Soit t0 ∈ R. Nous noterons ω0 = γ(t0) = (x0, y0). x et y étant dérivables en t0, elles

admettent un DL à l’ordre 1 en t0 :

x(t0 + α) = x0 + αx′(t0) + o(α),y(t0 + α) = y0 + αy′(t0) + o(α).

. Puisque γ(t) = x(t)~i+ y(t)~j

nous obtenons, quand α tend vers 0 :

f(γ(t0 + α)

)= f

(x(t0) + α, y(t0) + α

)= f

(x0 + x′(t0)α+ o(α), y0 + y′(t0)α+ o(α)

)= f(x0, y0) + αx′(t0)∂f

∂x(ω0) + αy′(t0)∂f

∂y(ω0) + o(α).

d’après le théorème II.3. Si bien que :

f(γ(t0 + α)

)− f(γ(t0)

= x′(t0)∂f∂x

(ω0) + y′(t0)∂f∂y

(ω0) + o(1) quand α→ 0.

Dériver f : (x, y) 7→ x2 +3y4 le long de la courbe γ : t ∈ I = R 7→ (3 cos(t), 6 sin(t)). Nous allonsen déduire une interpétation géométrique du gradient. Rappelons que si f : ω → R, nous appelons“courbe de niveaux de f” toute courbe γ sur la quelle f est constante, i.e toute courbe pour laquelleil existe λ ∈ R telle que ∀t ∈ I, f γ(t) = λ.

Propriétés II.6 (Gradient et courbe de niveau)

Soit f : Ω −→ R une fonction de classe C 1.Soit γ I −→ Ω

t 7−→ γ(t) =(x(t), y(t)

) une courbe de niveau de f de classe C 1 définie sur un

intervalle I. Alors, pour tout t ∈ I, le gradient−−→gradfγ(t) de f en γ(t) est orthogonal à

−→γ′ (t).

157

Démonstration : Il suffit de voir que la fonction t ∈ I 7→ f γ(t) est constante, si bien que sa dérivée estnulle. Et comme celle-ci est égale à <

−−→gradfγ(t), ~γ′(t) >,

Avant de passer aux applications, définissons les dérivées d’ordre supérieur :

II.3 Dérives partielles d’ordre 2Définition II.7

Soit f : Ω → R une fonction définie sur un ouvert Ω. Si∂f

∂xest définie et de classe C 1 sur Ω,

nous noterons pour tout ω ∈ Ω, :

B∂2f

∂x2 (ω) = ∂

∂x

(∂f

∂xΣ)(ω) et

B∂2f

∂y∂x(ω) = ∂

∂y

(∂f

∂xΣ)(ω) .

Si∂f

∂xet∂f

∂ysont de classe C 1 sur U , f sera dite de classe C 2 sur Ω.

Nous admettrons à nouveau que l’ensemble C 2(Ω,R) est stable par combinaison linéaire, parproduit, par quotient si le dénominateur ne s’annule pas, par composition. Ainsi, les polynômes enx, y sont C 2, les fractions rationnelles aussi sauf aux points que vous devinez, and so on...

Le théorème suivant sera admis :Théorème II.8 (de Schwarz)

Si f : Ω→ R est une fonction de classe C 2, alors pour tout ω ∈ Ω,

∂2f

∂x∂y(ω) = ∂2f

∂y∂x(ω).

Bien sûr, nous pourrons généraliser ces dérivées aux ordres p > 2.

II.4 Extrema locauxDéfinition II.9

Soit U une partie quelconque de R2 et ω0 ∈ U . Soit f : U → R. On dit que f admetB un maximum local en ω0 si il existe r > 0 tel que pour tout ω ∈ U , si ‖ω − ω0‖ < r, alorsf(ω) 6 f(ω0).

B un minimum local en ω0 si il existe r > 0 tel que pour tout ω ∈ U , si ‖ω − ω0‖ < r, alorsf(ω) 6 f(ω0).

B un extremum local en ω0 s’il y admet un maximum ou un minimum local.

Proposition II.10

Soit U un ouvert de R2 et ω0 ∈ U . Si f : U → R admet un extremum local en ω0, alors∂f

∂x(ω0) = ∂f

∂y(ω0) = 0.

Démonstration :∂f

∂x(ω0) est la dérivée en t = 0 de la fonction g : t ∈ R 7→ f(x0 + t, y0) ∈ R ; Or cette

dérivée est nulle puisque g est dérivable sur un intervalle ouvert centré en 0 et qu’elle admet toujoursen 0 un extremum local.

Lorsque le gardient de f s’anule en ω0 on dit que ω0 est un point critique de f .On remarquera que tous les points critiques ne sont pas des extrema locaux : considérer pour

cela la fonction (x, y) ∈ R2 7→ x2y ∈ R en (0, 0).Déterminer les extrema locaux des deux fonctions suivantes :

1. f : (x, y) ∈ R2 7→ (x− y)2 + x3 + y3 ∈ R.2. g : (x, y) ∈ R2 7→ (x− y)2 + x4 + y4 ∈ R.

158

II.5 Equations de plans tangents à une nappe

Définition II.11

Soit f : Ω→ R une fonction de classe C 1, et Nf = ł(x, y, f(x, y)) ∈ R3 où (x, y) ∈ ΩΣ la nappede f . Soit alors ω0 = (x0, y0) ∈ Ω. On appelle plan tangent à la nappe Nf au point ω0 le pland’équation

z − f(x0, y0) = α(x− x0) + β(y − y0),

où−−→gradfω = (α, β).

III Différentiation d’une composée

III.1 Fonctions vectorielles

Nous avons défini les notions de continuité, de classe C k sur un ouvert, les dérivées partiellespremières ets econdes pour une fonction à valeurs réelles. Nous en aurons besoin aussi pour lesfonctions à valeurs dans R2. Celles-ci s’étendent sans difficulté, il faut simplement prendre gardeau fait qu’il n’y a plus de gradient, et que celui-ci est remplacé par une matrice, que l’on appellematrice Jacobienne (mais nous nous en passerons) :

Si f : (x, y) ∈ Ω→(f1(x, y), f2(x, y)

)∈ R2, la Jacobienne de f en ω vaut

Jf (ω) =

∂f1

∂x(ω) ∂f1

∂y(ω)

∂f2

∂x(ω) ∂f2

∂y(ω)

∈M2(R).

III.2 Le théorème

Soient Ω et U deux ouverts de R2. Soient aussiB f : (x, y) ∈ Ω 7→ f(x, y) ∈ R une fonction de classe C 1.B g : (u, v) ∈ U 7→ g(u, v) =

(g1(u, v), g2(u, v)

)∈ Ω ⊂ R2 une fonction de classe C 1.

L’application (u, v) ∈ U 7→ f(g(u, v)

)∈ R est bien définie. Le théorème suivant nous donne

une expression de ses dérivées partielles en fonction de celles de f et de g, que nous noterons

respectivement∂f

∂x,∂f

∂y,∂g

∂u,∂g

∂v:

Théorème III.1 (de dérivation des fonctions composées)

Sous les hypothèses précédentes,

∂(f g

)∂u

(u, v) = ∂g1

∂u(u, v)∂f

∂x

(g(u, v)

)+ ∂g2

∂u(u, v)∂f

∂y

(g(u, v)

),

∂(f g

)∂v

(u, v) = ∂g1

∂v(u, v)∂f

∂x

(g(u, v)

)+ ∂g2

∂v(u, v)∂f

∂y

(g(u, v)

)

Démonstration : Notons γ : t ∈ R 7→ g(u0 + t, v0) =(g1(u0 + t, v0), g2(u0 + t, v0)

)=(x(t), y(t)

)∈ Ω. γ

est une courbe de classe C 1. Nous pouvons appliquer la proposition II.5

∂(f g

)∂u

(u0, v0) = d

dt |t=0

(f g)(u0 + t, v0) =

(f γ

)′(0)

= ł < −−→gradfγ(0), ~γ′(0)Σ> = x′(0)∂f

∂x

(γ(0)

)+ y′(0)∂f

∂y

(γ(0)

)= ∂g1

∂u(u0, v0)∂f

∂x

(g(u0, v0)

)+ ∂g2

∂u(u0, v0)∂f

∂y

(g(u0, v0)

)

159

Remarques :

Avant de nous lancer dans un exemple, faisons le lien avec les notations physiciennes.Pour plus de simplicité, puisque l’on compose g par f et que les variables de f sontx et y, ils ont l’habitude de noter g(u, v) =

(x(u, v), y(u, v)

), au lieu de g(u, v) =(

g1(u, v), g2(u, v)). Nous le ferons aussi, mais en prenant garde qu’alors on confond va-

riable et fonction, puisque x est à la fois une variable de f et une fonction de (u, v). Laformule devient alors :

∂(f g

)∂u

= ∂x

∂u

∂f

∂x+ ∂y

∂u

∂f

∂y,

∂(f g

)∂v

= ∂x

∂v

∂f

∂x+ ∂y

∂v

∂f

∂y.

Notez que l’on a omis aussi de préciser en quels points étaient évaluées ces dérivées

partielles, puisque les dérivées de g (i.e par exemple∂x

∂u), sont évaluées en (u, v) puisque

ce sont des dérivées de fonctions de (u, v), alors que les dérivées partielles de f sontévaluées en (x, y), que l’on exprime en fonction de (u, v).

Montrer que g : (r, θ) ∈ R∗+ × R 7→ (r cos θ, r sin θ) ∈ R2 est de classe C 1, puis exprimer les dé-rivées partielles de (r, θ) 7→ f(r cos θ, r sin θ) en fonction des dérivées partielles de (x, y) 7→ f(x, y),pour toute fonction f de classe C 1. En déduire une expression du Laplacien de f en coordonnéespolaires.

Nous noterons à l’avenir abusivement∂f

∂ret∂f

∂θles dérivées partielles de f g.

III.3 Quelques EDP de degré 1Soit D = (x, y) ∈ R2 x > 0. On cherche toutes les fonctions f : D → R de classe C 1 telles que

∀(x, y) ∈ D, x∂f

∂x+ y

∂f

∂y= 0 (E).

Calculer, pour toute fonction f de classe C 1, les fonctions∂f

∂ret

∂f

∂θen fonctiondes dérivées

partielles de f par rapport à x et y. Conclure.

IV Calcul intégral

160

Chapitre 13

Les Courbes paramétrées

Ici, P est le plan euclidien rapporté à un repère orthonormé R := (O,~i,~j).

ETUDE GÉNÉRALE

B Une courbe paramétrée est une application γ = M d’un intervalle I dans P. On appelle arc,ou trajectoire l’image de cette courbe. On le notera (Γ). On dit que γ est une représentation

paramétrique de (Γ). Tous les arcs seront de classe C 1. Nous noteronsd ~M

dtle vecteur dérivé

γ′(t).Interprétation cinématique : le point γ(t) peut être vu comme la position d’une particule à l’instant t. Le vecteur

dérivé γ′(t) est alors la vitesse, le vecteur γ′′(t) est l’accélération. Définitions de mouvements uniforme, circulaire,

rectiligne, à accélération centrale.

B En tout point régulier M(t0) (i.e où le vecteur-dérivé est non nul), (Γ) admet une tangentedirigée par le vecteur-dérivée. Si le point est singulier, on peut revenir à la définition de la

tangente, et chercher si limt→t0

y(t)− y(t0)x(t)− x(t0) existe, auquel cas c’est la pente de la tangente à (Γ)

en M(t0). Enfin, dernière possibilité : si limt→t0

dMdt∥∥dMdt

∥∥ existe, c’est un vecteur directeur de la

tangente à (Γ) en M(t0).B Pour une courbe définie en polaires ρ : I → R, γ est alors définie par

−→Oγ(θ) = ρ(θ)~uθ. Alors

d ~M

dθ= ρ′~uθ + ρ~vθ.

161

TROIS DÉFINITIONS DES CONIQUES

B Définition monofocale : Soient (∆) une droite et F un point situé à une distance d > 0 de(∆). On appelle conique (Γ) de foyer F , de directrice (∆) et d’excentricité e > 0 la courbede niveau e de l’application

f : M ∈ E2 7→MF

MH,

H étant pour tout M le projeté orthogonal de M sur (∆).On distingue trois cas :• Si 0 < e < 1, (Γ) est une ellipse , et il existe un r.o.n dans lequel (Γ) admet pour équation

cartésienne (elle est alors dite équation réduite)

x2

a2 + y2

b2= 1.

Ici, on a 0 < b < a. En notant c la distance de F à l’origine du nouveau repère, on aa2 − b2 = c2.

F

(−c0

)

M1

F′

FM1 =

x1F′ M1 = 2a−x1

H1

H1M1 =M1F1

e

a−a

b

−b(∆)

• Si e = 1, (Γ) est une parabole , et il existe un r.o.n dans lequel (Γ) admet pour équationcartésienne : y2 = 2dx.• Si 1 < e, (Γ) est une hyperbole , et il existe un r.o.n dans lequel (Γ) admet pour équation

cartésienne :x2

a2 −y2

b2= 1.

En notant c la distance de F à l’origine du nouveau repère, on a a2 + b2 = c2. Γ admetdeux asymptotes d’équation ay = bx et ay = −bx dans le nouveau repère. Si b = a, cequi équivaut à e =

√2 et à la perpendicularité des deux asymptotes, l’hyperbole est dite

équilatère.

162

FF′

(∆)

yb=

xa

B Les hyperboles et les ellipses sont appelées coniques à centres. Elles possèdent chacune deuxcouples (F,∆) de foyer - directrice. Les relations suivantes sont valables et peuvent êtreutiles : Soit d la distance entre le foyer et la directrice. p = ed est le paramètre de la conique.Alors

a = p

|1− e2|, b = p√

|1− e2|, e = c

a.

B On voit avec l’équation réduite que l’on peut considérer que les cercles sont des ellipses d’ex-centricité nulle (mais attention : la définition monofocale n’est plus valable). Toute ellipse estalors l’image d’un cercle par une affinité orthogonale dont l’axe est l’un des axes de symétriede l’ellipse, et de même toute hyperbole est l’image par une affinité orthogonale d’une hy-perbole équilatère. Rappelons qu’une affinité orthogonale d’axe (Ox) est une application dutype (x, y) ∈ R2 7→ (ax, by) ∈ R2.

B Définition bifocale : Soient F et F ′ deux points de P, et a > 0.

• M ∈P tels que MF+MF ′ = 2a est une ellipse de foyers F et F ′ et d’excentricitéFF ′

2a ,

si 2a > FF ′.• M ∈P tels que |MF −MF ′| = 2a est une hyperbole de foyers F et F ′ et d’excentricitéFF ′

2a , si 2a < FF ′.

B Les représentations paramétriques :

• La parabole d’équation y2 = 2dx admet pour représentationx(t) = t2/2d,y(t) = t,

où t ∈

R.

• L’ellipse d’équationx2

a2 + y2

b2= 1 admet pour représentation

x(t) = a cos t,y(t) = b sin t, où t ∈ R.

Ici, t n’est pas l’angle polaire. On peut aussi paramétrer le cosinus et le sinus par l’anglemoitié, ce qui parfois conduit à des calculs plus maitrisables.

• L’hyperbole d’équationx2

a2−y2

b2= 1 admet pour représentation

x(t) = a cosh t,y(t) = b sinh t, où t ∈

R.B Tangentes à une conique (Γ) : Les formules qui suivent sont dites de dédoublement.

Soit M0

∣∣∣∣ x0y0

un point de (Γ). Alors, en supposant que l’on se trouve dans une r.o.n où (Γ)

admet une équation réduite comme ci-dessus, la tangente à (Γ) en M0 admet pour équationcartésienne :• si e < 1,

xx0

a2 + yy0

b2= 1 ;

• si e > 1,xx0

a2 −yy0

b2= 1 ;

• si e = 1, yy0 = p(x0 + x).B Equation polaire dans un repère centré en l’un des foyers F : Soit (Γ) la conique de

163

foyer F , de directrice une droite (∆) ne passant pas par O, et d’excentricité e. Notons p = edle paramètre de l’ellipse, où d est la distance entre F et (∆), et ~uϕ un vecteur normal à (∆).Alors (Γ) admet pour équation polaire

ρ(θ) = p

1 + e cos(θ − ϕ) .

B Les coniques comme zéros de polynomes de degré 2 : Soient a, b, c, d, e, f 6 réels telsque (a, b, c) 6= (0, 0, 0). Alors l’ensemble (Γ) d’équation cartésienne F (x, y) = 0, où F (x, y) =ax2 + bxy + cy2 + dx + ey + f , est une conique (ou éventuellement l’ensemble vide ou unedroite ou une réunion de deux droites, dans ces cas on dit que la conique est dégénérée). Onla détermine et on la dessine en suivant le protocole :• Si δ := b2 − 4ac 6= 0, c’est une conique à centre (éventuellement dégénérée). Les coordon-

nées (x0, y0) de son centre Ω vérifient∂F

∂x(x0, y0) = 0 et

∂F

∂y(x0, y0) = 0.

Une fois Ω déterminé, on se place dans le repère (Ω,~i,~j) dans lequel l’équation cartésienneprend la forme ax′2 + bx′y′ + cy′2 = k, où k est réel.Enfin, on calcule l’équation cartésienne dans le repère (Ω, ~uθ, ~vθ) en utilisant les formulesde changement de repère vues dans le cours sur la géométrie plane. Si on note (u, v) lescoordonnées de M dans ce repère, on trouve alors qu’il existe trois réels α(θ), β(θ), γ(θ)tels que αu2 + βuv+ γv2 = k est l’équation cherchée. On choisit alors un réel θ qui annuleβ. L’équation prend enfin la forme réduite.• Si δ est nul, c’est une parabole, et le terme de degré 2 est un carré parfait ; i.e il existeλ, a′, b′ ∈ R tels que pour tout x, y réels , ax2 + bxy + cy2 = λ(a′x+ b′y)2 et a′2 + b′2 = 1.On pose alors X = a′x+b′y et Y = −b′x+a′x. Ce sont les coordonnées du nouveau repère,dont les axes ont pour équations X = 0 et Y = 0. Dans le nouveau repère, l’équation estréduite.

Une famille de coniques ayant toutes mêmes foyer et même directrice,l’excentricité variant de 0.1 a

10

164

B Intersection d’un cône et d’un plan. Les coniques sont aussi obtenues comme intersectiond’un cône de révolution (par exemple le cône d’équation z2 = x2 + y2) avec un plan del’espace. La courbe obtenue sera alors une ellipse si les vecteurs normaux du plan se situentà l’intérieur du cone (i.e si leurs composantes (a, b, c) vérifient c2 > a2 + b2), une paraboles’ils sont exactement sur le cône et une hyperbole sinon.

x y

z

x

y

z

xy

z

I L’étude générale

I.1 Les courbes en cartésiennes

I.2 Les courbes en polaire

II Les coniques

III L’approche géométrique

III.1 Longueur d’un arc

Définition III.1

Soit f une représentation paramétrique d’une courbe régulière (Γ), et s une abscisse curvilignesur I. La longueur de l’arc compris entre les points M(t0) et M(t1) est :

L =∫ t1

t0

‖f ′(t)‖dt = s(t1)− s(t0).

Remarques :

B L’égalité vient de ‖f ′(t)‖ = s′(t).B Pour qu’un minimum de cohérence soit assuré, montrons que cette définition ne dé-

pend pas du choix du paramétrage admissible. Pour cela, considérons ϕ un paramé-trage admissible de

−→f et posons−→g =

−→f ϕ−1. On suppose que ϕ croît (le cas contraire

se démontre aisément) :∫ t1

t0

‖f ′(t)‖dt =∫ t1

t0

‖g′(ϕ(t))ϕ′(t)‖dt =∫ ϕ(t1)

ϕ(t0)‖g′(u)‖du.

B Pour une représentation normale, L =∫ s1

s0

1ds = s1 − s0 est égal au temps écoulé en

parcourant la courbe à vitesse 1, donc sa longueur.

165

Proposition III.2

Soit (Γ) un arc paramétré régulier.B Si l’arc est paramétré en coordonnées cartésiennes par

−→f (t) = (x(t), y(t)), alors

L =∫ t1

t0

√x′(t)2 + y′(t)2dt

B Si l’arc admet une représentation polaire par la fonction ρ définie sur I, la longueur del’arc entre les points M(θ0) et M(θ1) est

L =∫ θ1

θ0

√ρ′(θ)2 + ρ(θ)2dθ

1. Montrer que la longueur de l’astroïde

x = a cos3 t,

y = a sin3 tsur [0, 2π] est 6a.

2. Montrer que la loongueur de la cardioïde ρ(θ) = a(1 + cos θ) est 8a.

III.2 Repère de Frenet

Définition III.3

Soit−→f : I → R2 un arc C k, où k > 1, régulier, paramétrant la courbe (Γ). On sait que la

tangente à (Γ) en M(t) est dirigée par−→f ′(t). On appelle vecteur unitaire tangent en M(t) :

−→T (t) =

−→f ′(t))‖−→f ′()‖

= 1s′(t)

−→f ′(t)

où s est une abscisse curviligne.

Propriétés III.4

1.−→T (t) est tangent à (Γ) en M(t).

2. ‖−→T ′(t)‖ = 1.

3.−→T ′(t) est orienté vers les t croissants.

4. ‖−→T (t)‖ ne change pas avec un changement de paramétrage croissant, et est changé en son

opposé si ce changement est décroissant.

Démonstration : du dernier point :

d−→f

dϕ= 1ϕ′(t)

−→f ′(t) et

∥∥∥∥d−→fdϕ∥∥∥∥ = s′(t)

ϕ′(t) ,

d’où1∥∥∥∥d−→fdϕ∥∥∥∥ ×

d−→f

dϕ= −→T .

Définition III.5

On note−→N (t) le vecteur unitaire directement orthogonal à

−→T ′(t).

−→N ne dépend que de

−→T , et est donc, tout comme lui, indépendant du paramétarge admissible

croissant choisi. Si−→T a pour composantes (a, b) dans une base orthonormée directe, alors

−→N a pour

composantes (−b, a).

166

Définition III.6

(M(t),−→T (t),−→N (t)) est appelé repère de Serret-Frenet.

C’est un repère mobile ne dépendant que de l’arc. Li faudra se méfier du fait que l’on dipose de troisrepères mobiles distincts dorénavant :B (M(t),−→i ,−→j )B (O,−→u θ,−→v θ) le repère polaire,B (M,

−→T ,−→N ) le repère de Frenet.

Nous nous dirigeaons maintenant vers un autre paramétrage lié à l’arc, et non à la représenta-tion. Le théorème suivant sera admis :Théorème III.7

Soit k ∈ N∗, et−→f : I → R2 un arc de classe C k, régulier. Alors

−→T : I → S1 est de classe C k−1

sur I et il existe une fonction α : I → R de classe C k−1 telle que ∀t ∈ I−→T (t) = cosα(t)−→i + sinα(t)−→j .

On peut donc écrire les composantes dans la base (−→i ,−→j )

−→T

∣∣∣∣ cosαsinα et

−→N

∣∣∣∣ − sinαcosα

Comme−→T = d

−→f

ds, on en déduit également

dx

ds= cosα dy

ds= sinα

Les expressions de ces quantités dans les coordonnées polaires sont les suivantes :

Propriétés III.8

1.−→T = 1√

ρ2 + ρ′2

∣∣∣∣ ρ′ρ et−→N = 1√

ρ2 + ρ′2

∣∣∣∣ −ρρ′2. B Si ρ′ 6= 0, alors tan(α− θ) = ρ(θ)

ρ′(θ) .

B Si ρ′(θ) = 0, alors α = θ plus ou moins π/2.

Etuider l’arc paramétré x = 3t2, y = t3 − 3t. Donner en particulier une détermination de α, etles tangentes aux points d’intersection avec (Ox).

III.3 Courbure et rayon de courbure

Définition III.9

Soit−→f un arc C 1 régulier. On appelle courbure au point M(t) le réel :

c(t) = α′(t)s′(t) , ∀t ∈ I.

Sur une droite, la courbure est nulle en tout point. Remmarquons aussi que le courbure est unequantité ne dépendant que de l’arc et non de la paramétrisation choisie, puisque c’est le cas pour α′

et s′.Proposition III.10

Les formules de Frenet

d−→T

ds= c−→N,

d−→N

ds= −c−→T

167

Démonstration :

d−→T

ds= d

ds

[cosα−→i + sinα−→j

]= dα

ds

[− sinα−→i + cosα−→j

].

Nous appellerons rayon de courbure au point M(t), lorsque la courbure est non nulle, le réel

R(t) = 1c(t) . La décomposition de l’accélération dans la base de Frenet est pertinente d’un point de

vue cinématique :

d2−→fdt2

= dv

dt

−→T + v2

R

−→N

Iic, la vitesse v est bien évidemment s′.

Démonstration : En effet, il suffit de remarquer qued

dt

−→T = ds

dt× d

ds

−→T = s′ × c

−→N . Alors,

−→f ′′(t) = d

−→f ′

dt= d

dt

(s′(t)−→T

)= s′′(t)−→T (t) + s′(t) d

dt

−→T = s′′(t)−→T (t) + s′(t)2c(t)−→N (t).

Cette formule appelle quelques remarques :

Remarques :

B L’accélération normale au point de paramètre t est donc identique à celle que l’onsubirait en parcourant un cercle de rayon R(t) à la vitesse v(t).

B Son signe traduit que l’accélération est toujours orientée vers la concavité de la courbe.

Lorsque qu’une expression de l’angle α en fonction du paramètre n’apparaît pas claire, il esttoujours possible de s’en sortir avec la formule suivante :

c(t) =det(−→f ′(t),

−→f ′′(t)

)‖−→f ′(t)‖3

(13.1)

Démonstration : Il suffit de remarquer que−→f ′(t) = s′(t)−→T (t),−→f ′′(t) = s′′(t)−→T + s′(t)c(t)−→N.

Il vient alors det(−→f ′(t),

−→f ′′(t)

)= s′3cdet(−→T ,−→N ) = s′3c.

Nous allons maintenant nous inétresser aux arcs qui peuvent être paramétrés par l’angle α ;nous verrons entre autres que ce sont précisément ceux qui ne chnagent pas de concavité.

Définition III.11

On dit que−→f est bi-régulier en t0 lorsque

−→f ′(t0) et

−→f ′′(t0) ne sont pas colinéaires.

L’arc est biréulier lorsqu’il l’est en tout point.

De la formule (7.1), nous déduisons que l’arc est birégulier lorsque la courbure ne s’annule pas.

Proposition III.12

Soit k > 2. Si−→f est un arc biregulier de clase C k, alors α est un paramétrage admisible de clsse

C k−1.Démonstration :

ds= α′

s′est non nul par hypothèse.

168

Propriétés III.13

Sous l’hypothèse de birégularité de l’arc,

d−→T

dα= −→N d

−→N

dα= −−→T

Le signe de la courbure traduit le sens dans lequel tourne l’arc : vers la gauche si la courbure estpositive, et vers la droite sinon.

III.4 Calculs d’aireThéorème III.14

Green-RiemannSoit−→f : [t0, t1]→ R2 un arc de clase C 1. On suppose queB−→f est fermé, i.e M(t0) = M(t1).

B−→f est simple, i.e

−→f est injective sur [t0, t1[.

B orienté dans le sens trigonométrique.Alors, l’aire du domaine borné délimité par l’arc est donné par

A =∫ t1

t0

x(t)y′(t)dt = −∫ t1

t0

x′(t)y(t)dt = 12

∫ t1

t0

x(t)y′(t)− y(t)x′(t)dt

.Lorsque la courbe est donnée en polaire, nous avons la formule

A =∫ θ1

θ0

ρ2(θ)dθ .

Remarquons que d’une manière condensée, A = 12 det(

−→f ,−→f ′).

Démonstration : L’idée ici n’est pas de donner une preuve exhaustive, mais de la donner à comprendre.B∫x′y est une quantité indépendante du choix de paramétrage.

B∫x′y = −

∫xy′.

B Dans le cas où l’aire est encadrée par deux courbes représentatives (Cg) et (Ch), i.e sur [t0, t1], y(t) =g(x(t)) et sur [t1, t2], y(t) = h(x(t)), l’aire de la boucle vaut

A =∫ b

a

g(x)dx−∫ b

a

h(x)dx

=∫ t0

t1

g(x(t))x′(t)dt−∫ t2

t1

h(x(t))x′(t)dt

= −∫ t1

t0

y(t)x′(t)dt−∫ t2

t1

y(t)x′(t)dt

169

Chapitre 7

L’aspect métrique des courbes planes

I Longueur d’un arc

Définition I.1

Soit f une représentation paramétrique d’une courbe régulière (Γ), et s une abscisse curvilignesur I. La longueur de l’arc compris entre les points M(t0) et M(t1) est :

L =∫ t1

t0

‖f ′(t)‖dt = s(t1)− s(t0).

Remarques :

B L’égalité vient de ‖f ′(t)‖ = s′(t).B Pour qu’un minimum de cohérence soit assuré, montrons que cette définition ne dé-

pend pas du choix du paramétrage admissible. Pour cela, considérons ϕ un paramé-trage admissible de

−→f et posons−→g =

−→f ϕ−1. On suppose que ϕ croît (le cas contraire

se démontre aisément) :∫ t1

t0

‖f ′(t)‖dt =∫ t1

t0

‖g′(ϕ(t))ϕ′(t)‖dt =∫ ϕ(t1)

ϕ(t0)‖g′(u)‖du.

B Pour une représentation normale, L =∫ s1

s0

1ds = s1 − s0 est égal au temps écoulé en

parcourant la courbe à vitesse 1, donc sa longueur.

Proposition I.2

Soit (Γ) un arc paramétré régulier.B Si l’arc est paramétré en coordonnées cartésiennes par

−→f (t) = (x(t), y(t)), alors

L =∫ t1

t0

√x′(t)2 + y′(t)2dt

B Si l’arc admet une représentation polaire par la fonction ρ définie sur I, la longueur del’arc entre les points M(θ0) et M(θ1) est

L =∫ θ1

θ0

√ρ′(θ)2 + ρ(θ)2dθ

170

1. Montrer que la longueur de l’astroïde

x = a cos3 t,

y = a sin3 tsur [0, 2π] est 6a.

2. Montrer que la loongueur de la cardioïde ρ(θ) = a(1 + cos θ) est 8a.

II Repère de Frenet

Définition II.1

Soit−→f : I → R2 un arc C k, où k > 1, régulier, paramétrant la courbe (Γ). On sait que la

tangente à (Γ) en M(t) est dirigée par−→f ′(t). On appelle vecteur unitaire tangent en M(t) :

−→T (t) =

−→f ′(t))‖−→f ′()‖

= 1s′(t)

−→f ′(t)

où s est une abscisse curviligne.

Propriétés II.2

1.−→T (t) est tangent à (Γ) en M(t).

2. ‖−→T ′(t)‖ = 1.

3.−→T ′(t) est orienté vers les t croissants.

4. ‖−→T (t)‖ ne change pas avec un changement de paramétrage croissant, et est changé en son

opposé si ce changement est décroissant.

Démonstration : du dernier point :

d−→f

dϕ= 1ϕ′(t)

−→f ′(t) et

∥∥∥∥d−→fdϕ∥∥∥∥ = s′(t)

ϕ′(t) ,

d’où1∥∥∥∥d−→fdϕ∥∥∥∥ ×

d−→f

dϕ= −→T .

Définition II.3

On note−→N (t) le vecteur unitaire directement orthogonal à

−→T ′(t).

−→N ne dépend que de

−→T , et est donc, tout comme lui, indépendant du paramétarge admissible

croissant choisi. Si−→T a pour composantes (a, b) dans une base orthonormée directe, alors

−→N a pour

composantes (−b, a).Définition II.4

(M(t),−→T (t),−→N (t)) est appelé repère de Serret-Frenet.

C’est un repère mobile ne dépendant que de l’arc. Li faudra se méfier du fait que l’on dipose de troisrepères mobiles distincts dorénavant :B (M(t),−→i ,−→j )B (O,−→u θ,−→v θ) le repère polaire,B (M,

−→T ,−→N ) le repère de Frenet.

Nous nous dirigeaons maintenant vers un autre paramétrage lié à l’arc, et non à la représenta-tion. Le théorème suivant sera admis :Théorème II.5

Soit k ∈ N∗, et−→f : I → R2 un arc de classe C k, régulier. Alors

−→T : I → S1 est de classe C k−1

sur I et il existe une fonction α : I → R de classe C k−1 telle que ∀t ∈ I−→T (t) = cosα(t)−→i + sinα(t)−→j .

171

On peut donc écrire les composantes dans la base (−→i ,−→j )

−→T

∣∣∣∣ cosαsinα et

−→N

∣∣∣∣ − sinαcosα

Comme−→T = d

−→f

ds, on en déduit également

dx

ds= cosα dy

ds= sinα

Les expressions de ces quantités dans les coordonnées polaires sont les suivantes :

Propriétés II.6

1.−→T = 1√

ρ2 + ρ′2

∣∣∣∣ ρ′ρ et−→N = 1√

ρ2 + ρ′2

∣∣∣∣ −ρρ′2. B Si ρ′ 6= 0, alors tan(α− θ) = ρ(θ)

ρ′(θ) .

B Si ρ′(θ) = 0, alors α = θ plus ou moins π/2.

Etuider l’arc paramétré x = 3t2, y = t3 − 3t. Donner en particulier une détermination de α, etles tangentes aux points d’intersection avec (Ox).

III Courbure et rayon de courbure

Définition III.1

Soit−→f un arc C 1 régulier. On appelle courbure au point M(t) le réel :

c(t) = α′(t)s′(t) , ∀t ∈ I.

Sur une droite, la courbure est nulle en tout point. Remmarquons aussi que le courbure est unequantité ne dépendant que de l’arc et non de la paramétrisation choisie, puisque c’est le cas pour α′

et s′.Proposition III.2

Les formules de Frenet

d−→T

ds= c−→N,

d−→N

ds= −c−→T

Démonstration :

d−→T

ds= d

ds

[cosα−→i + sinα−→j

]= dα

ds

[− sinα−→i + cosα−→j

].

Nous appellerons rayon de courbure au point M(t), lorsque la courbure est non nulle, le réel

R(t) = 1c(t) . La décomposition de l’accélération dans la base de Frenet est pertinente d’un point de

vue cinématique :

d2−→fdt2

= dv

dt

−→T + v2

R

−→N

Iic, la vitesse v est bien évidemment s′.

172

Démonstration : En effet, il suffit de remarquer qued

dt

−→T = ds

dt× d

ds

−→T = s′ × c

−→N . Alors,

−→f ′′(t) = d

−→f ′

dt= d

dt

(s′(t)−→T

)= s′′(t)−→T (t) + s′(t) d

dt

−→T = s′′(t)−→T (t) + s′(t)2c(t)−→N (t).

Cette formule appelle quelques remarques :

Remarques :

B L’accélération normale au point de paramètre t est donc identique à celle que l’onsubirait en parcourant un cercle de rayon R(t) à la vitesse v(t).

B Son signe traduit que l’accélération est toujours orientée vers la concavité de la courbe.

Lorsque qu’une expression de l’angle α en fonction du paramètre n’apparaît pas claire, il esttoujours possible de s’en sortir avec la formule suivante :

c(t) =det(−→f ′(t),

−→f ′′(t)

)‖−→f ′(t)‖3

(7.1)

Démonstration : Il suffit de remarquer que

−→f ′(t) = s′(t)−→T (t),−→f ′′(t) = s′′(t)−→T + s′(t)c(t)−→N.

Il vient alors det(−→f ′(t),

−→f ′′(t)

)= s′3cdet(−→T ,−→N ) = s′3c.

Nous allons maintenant nous inétresser aux arcs qui peuvent être paramétrés par l’angle α ;nous verrons entre autres que ce sont précisément ceux qui ne chnagent pas de concavité.

Définition III.3

On dit que−→f est bi-régulier en t0 lorsque

−→f ′(t0) et

−→f ′′(t0) ne sont pas colinéaires.

L’arc est biréulier lorsqu’il l’est en tout point.

De la formule (7.1), nous déduisons que l’arc est birégulier lorsque la courbure ne s’annule pas.

Proposition III.4

Soit k > 2. Si−→f est un arc biregulier de clase C k, alors α est un paramétrage admisible de clsse

C k−1.

Démonstration :dα

ds= α′

s′est non nul par hypothèse.

Propriétés III.5

Sous l’hypothèse de birégularité de l’arc,

d−→T

dα= −→N d

−→N

dα= −−→T

Le signe de la courbure traduit le sens dans lequel tourne l’arc : vers la gauche si la courbure estpositive, et vers la droite sinon.

173

IV Calculs d’aireThéorème IV.1

Green-RiemannSoit−→f : [t0, t1]→ R2 un arc de clase C 1. On suppose queB−→f est fermé, i.e M(t0) = M(t1).

B−→f est simple, i.e

−→f est injective sur [t0, t1[.

B orienté dans le sens trigonométrique.Alors, l’aire du domaine borné délimité par l’arc est donné par

A =∫ t1

t0

x(t)y′(t)dt = −∫ t1

t0

x′(t)y(t)dt = 12

∫ t1

t0

x(t)y′(t)− y(t)x′(t)dt

.Lorsque la courbe est donnée en polaire, nous avons la formule

A =∫ θ1

θ0

ρ2(θ)dθ .

Remarquons que d’une manière condensée, A = 12 det(

−→f ,−→f ′).

Démonstration : L’idée ici n’est pas de donner une preuve exhaustive, mais de la donner à comprendre.B∫x′y est une quantité indépendante du choix de paramétrage.

B∫x′y = −

∫xy′.

B Dans le cas où l’aire est encadrée par deux courbes représentatives (Cg) et (Ch), i.e sur [t0, t1], y(t) =g(x(t)) et sur [t1, t2], y(t) = h(x(t)), l’aire de la boucle vaut

A =∫ b

a

g(x)dx−∫ b

a

h(x)dx

=∫ t0

t1

g(x(t))x′(t)dt−∫ t2

t1

h(x(t))x′(t)dt

= −∫ t1

t0

y(t)x′(t)dt−∫ t2

t1

y(t)x′(t)dt

174