teorema di abel-ruffini · 2020. 1. 9. · teorema di abel-ruffini leonardo colzani dipartimento di...

60
TEOREMA DI ABEL-RUFFINI Leonardo Colzani Dipartimento di Matematica Universit` a di Milano - Bicocca Omar Khayyam (1048-1131) Niccol` o Fontana Tartaglia (1449-1557) Girolamo Cardano (1501-1576) Ren´ e Descartes (1596-1650) Giuseppe Luigi lagrangia (1736-1813) Paolo Ruffini (1765-1822) Carl Friedrich Gauß (1777-1855) Niels Henrik Abel (1802-1829) ´ Evariste Galois (1811-1832) Bernhard Riemann (1826-1866) Enrico Betti (1823-1892) Vladimir Arnold (1937-2010)

Upload: others

Post on 01-Feb-2021

7 views

Category:

Documents


0 download

TRANSCRIPT

  • TEOREMA DI ABEL-RUFFINILeonardo Colzani

    Dipartimento di MatematicaUniversità di Milano - Bicocca

    Omar Khayyam(1048-1131)

    Niccolò FontanaTartaglia

    (1449-1557)

    GirolamoCardano

    (1501-1576)

    René Descartes(1596-1650)

    Giuseppe Luigilagrangia

    (1736-1813)

    Paolo Ruffini(1765-1822)

    Carl FriedrichGauß

    (1777-1855)

    Niels HenrikAbel

    (1802-1829)

    Évariste Galois(1811-1832)

    BernhardRiemann

    (1826-1866)

    Enrico Betti(1823-1892)

    Vladimir Arnold(1937-2010)

  • ii

  • Introduzione

    Tra gli studenti italiani al nome di Ruffini è associata una regola per dividere

    un polinomio per un binomio di primo grado. Ma ci sono ben altre ragioni per

    ricordarsi di lui. Paolo Ruffini nasce a Valentano il 22 Settembre 1765. Nel

    1788 si laurea in medicina e chirurgia nell’Università di Modena, e subito do-

    po anche in matematica. Ancora studente, gli viene affidato il corso di analisi

    sublime e nel 1791 la cattedra di elementi di matematica. Nel 1796 viene elet-

    to nel Consiglio degli Juniori della nascente Repubblica Cisalpina. Nel 1798,

    chiamato a prestar giuramento alla repubblica, alla formula di rito vuole pre-

    mettere la clausola che intende ”rispettata e salva la nostra santa religione”

    e, non volendo transigere su questo punto, viene rimosso dall’insegnamento.

    Un altro medico ed accademico che per gli stessi motivi si rifiuta di giurare

    fedeltà alla repubblica e viene rimosso da ogni carica è Luigi Galvani, famoso

    per i suoi esperimenti sulla elettricità animale pubblicati nel 1792 nel ”De

    viribus electricitatis in motu muscolari”. Ruffini si dedica allora alla pratica

    medica, continuando nel tempo libero le sue ricerche matematiche. Dopo la

    sconfitta di Napoleone, nel 1814 viene reintegrato nell’università di Modena

    sulle cattedre di matematica applicata, medicina pratica, clinica medica, e

    ne diviene anche rettore. Nel 1817 durante un’epidemia di tifo si ammala

    curando i pazienti, poi raccoglie le sue esperienze di malato e medico nella

    ”Memoria sul tifo contagioso”. Non riuscendo a riprendersi completamente,

    iii

  • nel 1819 si dimette dall’università e muore a Modena il 10 Maggio 1822.

    Nel 1799 Carl Friedrich Gauß (1777-1855) presenta all’Accademia Giulia

    Carolina la dissertazione di laurea ”Demonstratio nova theorematis omnem

    functionem algebraicam rationalem integram unius variabilis in factores rea-

    les primi vel secundi gradus resolvi posse”. Nella dissertazione si identificano

    implicitamente i numeri complessi con i punti del piano, ma prima di dare

    una nuova dimostrazione dell’esistenza di queste radici, si criticano le presun-

    te dimostrazioni precedenti, sollevando dubbi sulla possibilità di risoluzioni

    algebriche: ”Dopo tanti sforzi di cos̀ı grandi geometri, rimane poca speranza

    di arrivare ad una soluzione generale di equazioni algebriche. Anzi, sem-

    bra più probabile che tale soluzione sia impossibile e contraddittoria. Questo

    non deve essere considerato paradossale, perché quella che comunemente si

    chiama soluzione di una equazione, altro non è se non la sua riduzione ad

    equazioni pure... m√H è la radice dell’equazione xm = H... Non è per nien-

    te dimostrato che le radici di una qualunque equazione si possano esprimere

    con addizioni, sottrazioni, moltiplicazioni, divisioni o elevamenti a poten-

    ze, a meno di non presupporre, tacitamente e senza una ragione sufficiente,

    che la soluzione di una qualunque equazione si possa ridurre ad equazioni

    pure. Forse non è neanche tanto difficile dimostrare rigorosamente questa

    impossibilità già per le equazioni di quinto grado”.

    Quasi in risposta a questa lucida analisi, nel 1799 Ruffini pubblica la

    ”Teoria generale delle equazioni in cui si dimostra impossibile la soluzione

    algebrica delle equazioni generali di grado superiore al quarto”. Cioè, non

    si possono risolvere le equazioni algebriche di grado superiore al quarto uti-

    lizzando solo le operazioni elementari, somme, sottrazioni, moltiplicazioni,

    divisioni ed estrazioni di radici. I due volumi, più di 500 pagine, sono accolti

    con freddezza e sospetto, con l’eccezione di un entusiasta Augustin Cauchy.

    iv

  • Il teorema di Ruffini viene riscoperto da Niels Henrik Abel (1802-1829), che

    nel 1824 pubblica a proprie spese la ”Mémoire sur les équations algébriques,

    ou l’on démonstre l’impossibilité de la résolution de l’équation générale du

    cinquième degrée”. Per risparmiare, il tutto è condensato in meno di 6 pa-

    gine. Infine, nel 1830 Évariste Galois (1811-1832) presenta senza successo

    all’Accademia la ”Mémoire sur les conditions de résolubilité des équations

    par radicaux”, pubblicata postuma nel 1846. Di solito il teorema di Abel-

    Ruffini è presentato come corollario della teoria di Galois, ma questo teorema

    ha anche una dimostrazione topologica: le superfici di Riemann associate ad

    equazioni di grado superiore al quarto sono intrinsecamente differenti dal-

    le superfici di funzioni radicali. Questa osservazione è dovuta a Vladimir

    I. Arnold (1937-2010), ed è contenuta nell’articolo di Henryk Zoladek ”The

    topological proof of the Abel-Ruffini Theorem”, Topological Methods in Non-

    linear Analysis 16 (2000), 253-265, nel libro di Valeri B. Alekseev ”Abel’s

    theorem in problems and solutions”, Kluwer 2004, e nel libro di Dmitry Fu-

    chs e Serge Tabachnikov ”Mathematical Omnibus: Thirty Lectures on Classic

    Mathematics”, American Mathematical Society 2007.

    v

  • vi

  • Capitolo 1

    Teorema fondamentale

    dell’algebra

    Peter Roth (1580-1617) nel 1608 e Albert Girard (1590-1633) nel 1629 enun-

    ciano il teorema fondamentale dell’algebra: ”Ogni equazione di grado n ha n

    radici, e nessuna di più”, ”Ogni equazione algebrica ha tante radici, quante

    indicate dall’esponente più alto”. Anche nella ”Geometria” di Cartesio si

    trova l’enunciato: ”Ogni equazione può avere tante radici distinte quanto la

    dimensione dell’incognita... Ma alcune di queste radici possono essere fal-

    se, cioè minori di zero”. I tentativi di dimostrare il teorema fondamentale

    dell’algebra sono diversi e, anche se non completamente rigorosa, particolar-

    mente significativa è una dimostrazione di D’Alembert nel 1746, poi ripresa e

    perfezionata da Argand nel 1814. Per dimostrare che un’equazione algebrica

    P (z) = 0 ha soluzioni, assumendo l’esistenza di un minimo per il modulo

    |P (a)|, basta mostrare che se P (a) 6= 0 allora in un qualche intorno di a

    esistono punti tali che |P (z)| < |P (a)|. Se infatti

    P (1)(a) = ... = P (k−1)(a) = 0 e P (k)(a) 6= 0

    1

  • allora

    P (a+ ρeiϑ) = P (a) + ρkeikϑP (k)(a)

    k!+ ...

    Se ρ è piccolo e eikϑP (k)(a) ha direzione opposta a P (a), allora P (a + ρeiϑ)

    risulta più vicino all’origine di P (a).

    Dopo aver criticato le dimostrazioni precedenti, nella sua dissertazione di

    dottorato del 1799,1 Gauß presenta una dimostrazione geometrica del teo-

    rema fondamentale dell’algebra, ”Una nuova dimostrazione del teorema che

    ogni funzione algebrica razionale intera di una variabile si può scomporre in

    fattori reali di primo o secondo grado”. La dimostrazione non utilizza esplici-

    tamente i numeri complessi, ma implicitamente si identificano questi numeri

    con punti in un piano. Le radici del polinomio

    (x+ iy)n + a(x+ iy)n−1 + ...+ b(x+ iy) + c = A(x, y) + iB(x, y)

    sono intersezioni tra le curve algebriche A(x, y) = 0 e B(x, y) = 0. La curva

    A(x, y) = 0 è l’intersezione della superficie z = A(x, y) col piano z = 0 e per

    passare da una regione (x, y) con A(x, y) < 0 ad una regione con A(x, y) > 0

    si deve necessariamente attraversare la curva A(x, y) = 0. I rami di questa

    curva non possono terminare bruscamente ed ogni ramo che viene dall’infinito

    deve essere collegato ad un altro ramo che va all’infinito. Altrimenti sarebbe

    possibile passare da A(x, y) > 0 ad A(x, y) < 0, senza passare da zero. In

    coordinate polari i rami

    A(ρ cos(ϑ), ρ sin(ϑ)) = ρn cos(nϑ) + ... = 0

    sono asintotici alle rette

    ϑ =

    (k +

    1

    2

    n

    1Gauß ne aveva già fatto un accenno nel suo diario nell’Ottobre del 1797

    2

  • ed i rami

    B(ρ cos(ϑ), ρ sin(ϑ)) = ρn sin(nϑ) + ... = 0

    sono asintotici a

    ϑ = kπ

    n

    con k = 0, 1, ..., 2n − 1. All’infinito i rami di A(x, y) = 0 e B(x, y) = 0 si

    alternano, e questo non è possibile senza che al finito si intersechino.

    z4 + z + i = 0 x4 − 6x2y2 + y4 + x = 04x3y − 4xy3 + y + 1 = 0

    Figura 1.1: Dimostrazione geometrica

    Oltre a questa geometrica, Gauß pubblica anche una dimostrazione alge-

    brica ed una analitica. Una versione semplificata è la seguente. Se P (z) è un

    polinomio, la funzione zP ′(z)/P (z) è armonica in ogni disco privo di zeri del

    denominatore ed il valor medio nel disco risulta uguale al valore nel centro.

    Ma questa funzione si annulla nell’origine e tende al grado del polinomio

    all’infinito. Quindi la funzione non può essere armonica dappertutto, cioè il

    denominatore ha degli zeri. Infine, una dimostrazione semplice ed intuitiva

    del teorema fondamentale dell’algebra utilizza l’indice di avvolgimento intor-

    no all’origine delle curve ϑ→ P (ρeiϑ), 0 ≤ ϑ < 2π. Se ρ→ 0 le curve girano

    intorno a P (0), e l’indice di avvolgimento intorno all’origine è 0 se P (0) 6= 0.

    Se ρ → +∞ le curve sono asintotiche a ρneinϑ e girano n volte intorno a 0,

    con n il grado del polinomio. Se ρ cresce da 0 a +∞, le curve si deformano in

    3

  • modo continuo e l’indice di avvolgimento rispetto all’origine rimane costante

    a tratti, con discontinuità solo quando le curve passano per l’origine.

    Il teorema fondamentale dell’algebra non vale nei quaternioni di W.R.Hamilton

    (1805-1865). Se Ω è un quaternione non reale, l’equazione ΩX−XΩ + 1 = 0

    non ha soluzioni. Infatti, se Ω = α + βi + γj + δk e X = ε + ζi + ηj + ϑk,

    un calcolo explicito mostra che ΩX −XΩ ha parte reale uguale a 0. Invece

    l’equazione X2 + 1 = 0 ha infinite soluzioni. Se β2i + γ2 + δ2 = 1, allora

    X = βi+ γj + δk è una soluzione.

    4

  • Capitolo 2

    Regola dei segni di Cartesio e

    teorema di Sturm

    Anche senza risolvere esplicitamente una equazione algebrica, è possibile de-

    terminare con un algoritmo elementare il numero di soluzioni in un intervallo

    dato.

    Nel 1637 R.Descartes (1596-1650) pubblica il ”Discours de la méthode”,

    con in appendice ”La Géométrie”. In quest’opera Cartesio enuncia, senza

    dimostrazione, la regola dei segni per il numero di radici positive in una

    equazione algebrica: ”Si possono avere tante radici vere quanti sono i cambi

    di segno + e - nell’equazione, e tante radici false quante sono le successioni

    di due + e due -”. La regola non è stata sempre intesa correttamente, e

    ha dato origine a diverse contestazioni. Comunque ne sono state date diver-

    se dimostrazioni e generalizzazioni, sia algebriche che analitiche. Nel 1883

    E.N.Laguerre (1834-1886) ha esteso la regola dei segni dai polinomi alle serie

    di potenze, con esponenti non necessariamente interi.

    Teorema (Cartesio-Laguerre): Se P (x) = a0xλ0 + a1x

    λ1 + a2xλ2 + ...

    è una serie finita o infinita che converge in 0 ≤ x < +∞, con coefficienti

    5

  • reali ed esponenti reali λ0 < λ1 < λ2 < ..., se la successione {a0, a1, a2, ...} ha

    un numero finito N di cambi di segno, allora la funzione P (x) ha un numero

    finito M di zeri positivi, e N −M è un numero pari non negativo. Se gli

    esponenti {λj} sono interi, la funzione P (x) è definita anche per x < 0, e le

    radici negative di P (x) sono le positive di P (−x) = (−)λ0a0xλ0+(−)λ1a1xλ1+

    (−)λ2a2xλ2 + ...

    Dimostrazione: Se la successione dei coefficienti di a0xλ0 + a1x

    λ1 +

    a2xλ2 + ... ha un numero finito di cambi di segno, per x → +∞ la funzione

    P (x) ha limite ±∞, quindi il numero di zeri è finito. Se a0 > 0 e an > 0

    per n grande, allora P (0) > 0 e P (+∞) > 0, sia il numero di zeri positivi

    M che i cambi di segno N sono pari. Se a0 < 0 e an > 0 allora P (0+) < 0

    e P (+∞) > 0, sia il numero di zeri positivi M che i cambi di segno N sono

    dispari. In entrambi i casi N −M è pari. Resta da provare che M ≤ N .

    L’enunciato è evidente se N = 0, se tutti i coefficienti hanno lo stesso segno

    non ci sono zeri positivi. Per induzione, si può assumere il teorema vero per

    N − 1. Se ajaj+1 < 0, la funzione Q(x) = x−λjP (x) ha gli stessi zeri di P (x)

    e, per il teorema di Rolle, tra due zeri di Q(x) c’è almeno uno zero della

    derivata

    dQ(x)

    dx=

    d

    dx

    {...aj−1x

    λj−1−λj + aj + aj+1xλj+1−λj + ...

    }=

    = ...+ (λj−1 − λj)aj−1xλj−1−λj−1 + (λj+1 − λj)aj+1xλj+1−λj−1 + ...

    Se la terna (aj−1, aj, aj+1) ha un cambio di segno (+,+,−), la coppia derivata

    (−,−) non ha cambi di segno. Se la terna (−,+,−) ha due cambi di segno,

    la coppia derivata (+,−) ha un cambio di segno. Se P (x) ha M zeri e N

    cambi di segno, Q(x) ha almeno M − 1 zeri ed esattamente N − 1 cambi di

    segno. Quindi, per l’ipotesi di induzione, M − 1 ≤ N − 1. �

    6

  • Nel 1807 F.Budan (1761-1840) e nel 1820 J.B.J.Fourier (1768-1830) pre-

    sentano una generalizzazione della regola dei segni di Cartesio. Se M(y) e

    N(y) sono il numero di zeri positivi ed il numero di cambi di segno del polino-

    mio P (x+y), e se y < z, allora (N(y)−N(z))− (M(y)−M(z)) è un numero

    non negativo pari. Ispirandosi a Fourier, nel 1829 J.C.F.Sturm (1803-1855)

    nella ”Mémoire sur la résolution des équations numériques” presenta un al-

    goritmo per la determinazione del numero di radici di un polinomio reale in

    un dato intervallo. Dividendo P (x) per il massimo comun divisore tra P (x) e

    dP (x)/dx, si ottiene un polinomio con gli stessi zeri di P (x), ma senza radici

    multiple.

    Teorema (Sturm):Ad ogni polinomio P (x) si può associare la succes-

    sione {P0(x), P1(x), P2(x), ...} definita dall’algoritmo di Euclide, con

    P0(x) = P (x), P1(x) =dP (x)

    dx, e

    P0(x) = Q0(x)P1(x)− P2(x),

    P1(x) = Q1(x)P2(x)− P3(x),

    P2(x) = Q2(x)P3(x)− P4(x), ...

    Se P (x) è un polinomio reale senza radici multiple, se N(x) è il numero di

    cambi di segno nella successione {P0(x), P1(x), P2(x), ...}, gli zeri non con-

    tano, e se a < b non sono zeri di P (x), il numero di zeri reali di P (x)

    nell’intervallo a ≤ x ≤ b è uguale a N(a)−N(b).

    Dimostrazione: L’ultimo termine non nullo nella successione {Pj(x)}

    è il massimo comun denominatore tra P (x) e dP (x)/dx. In particolare, se

    P (x) non ha radici multiple, l’ultimo termine non nullo è una costante. Due

    polinomi contigui Pj(x) e Pj+1(x) prima della costante non possono avere

    uno zero comune. Infatti, se Pj(x) = Pj+1(x) = 0, allora anche Pj+k(x) = 0

    7

  • per ogni k ≥ 0, contro l’ipotesi che il massimo comun divisore non ha ze-

    ri. Inoltre, per l’equazionePj−1(x) = Qj−1(x)Pj(x)− Pj+1(x), in uno zero di

    Pj(x) i polinomi contigui Pj−1(x) e Pj+1(x) hanno segni opposti. La funzio-

    ne N(x) può cambiare solo in corrispondenza di uno zero di una funzione

    Pj(x). In un intorno di uno zero di Pj(x) con j ≥ 1, gli estremi Pj−1(x)

    e Pj+1(x) non cambiano segno ed hanno segni opposti. Quindi se la terna

    (Pj−1(x), Pj(x), Pj+1(x)) cambia segno, passa da (+,+,−) a (+,−,−), o da

    (+,−,−) a (+,+,−), o da (−,+,+) a (−,−,+), o da (−,−,+) a (−,+,+).

    In tutti questi casi il numero di cambi di segno N(x) non cambia. Se P0(x)

    cambia segno e se P1(x) > 0, allora P0(x) cresce e la coppia (P0(x), P1(x))

    cambia segno da (−,+) a (+,+). Se P0(x) cambia di segno e se P1(x) < 0,

    allora P0(x) decresce e la coppia (P0(x), P1(x)) cambia segno da (+,−) a

    (−,−). In totale, il numero di cambi di segno N(x) diminuisce di uno solo

    in corrispondenza di ogni zero di P (x). �

    Per esempio, se t > 0 i coefficienti del polinomio P (x) = x5−x− t hanno

    un solo cambio di segno (+,−,−), ed i coefficienti di P (−x) = −x5 + x − t

    hanno due cambi di segno (+,−,−). Per la regola di Cartesio, P (x) ha zero

    o due radici negative ed una radice positiva. Per il criterio di Sturm, a meno

    di costanti moltiplicative positive,

    P0(x) = x5 − x− t, P1(x) = 5x4 − 1, P2(x) = 4x+ 5t, P3(x) = 44 − 55t4.

    Se 0 < t < 4 · 5−5/4, in x = −∞ si ha la successione di segni (−,+,−,+), in

    x = 0 si ha la successione di segni (−,−,+,+), in x = +∞ si ha la successione

    di segni (+,+,+,+). Quindi P (x) ha esattamente due radici negative ed

    una radice positiva. Se t > 4 · 5−5/4, in x = −∞ si ha la successione di segni

    (−,+,−,−), in x = 0 si ha la successione di segni (−,−,+,−), in x = +∞

    8

  • si ha la successione di segni (+,+,+,−). Quindi P (x) non ha radici reali

    negative ed ha una sola radice reale positiva.

    9

  • 10

  • Capitolo 3

    Equazioni e permutazioni

    Sommo superficie e lato del quadrato: 0.45...

    x2 + x = 45/60, x = 1/2.

    Sommo le superfici di due quadrati: 21.40.

    Incrocio i lati: 10... x2 + y2 = 21 + 40/60xy = 10 x =

    √15

    y =√

    20/3

    Figura 3.1: BM 13901 XVIII secolo a.C.

    Alcune tavolette di argilla babilonesi contengono problemi su lati ed aree

    di rettangoli, che nella nostra notazione si traducono in equazioni di secondo

    grado. E anche gli ”Elementi” di Euclide, che qui sotto proponiamo nella

    traduzione di Tartaglia, contengono implicitamente le soluzioni di equazioni

    di secondo grado:

    11

  • Libro II. Problema .1. Propositione .11.

    ”Puotemo segare una data retta linea si conditionatamente che il rettangolo

    che è contenuto sotto di tutta la linea, & di una parte, sia equale al quadrato

    che uien fatto dell’altra parte.”

    Se la linea è α, una parte è α−x e l’altra è x, l’equazione è α(α−x) = x2.

    Delle tavolette babilonesi contengono oltre che liste di quadrati, anche delle

    liste di cubi. Per risolvere il problema della duplicazione del cubo e della

    trisezione dell’angolo, Menecmo (IV secolo a.C.) introduce le sezioni coniche,

    ellissi, parabole, iperboli. Nel trattato su ”Cilindro e sfera” Archimede (287-

    212 a.C.) pone il problema di tagliare una sfera con un piano in modo tale

    che volumi delle due calotte sferiche siano in un dato rapporto. Il volume di

    una calotta di altezza h in una sfera di raggio r è π(rh2 − h3/3). Si ottiene

    quindi una equazione di terzo grado, che Archimede risolve intersecando due

    coniche. Il matematico e poeta persiano Omar Khayyam (1048-1131) nelle

    ”Dimostrazioni di problemi di algebra” classifica e risolve geometricamente

    tutte le equazioni di terzo grado intersecando delle coniche. Per esempio,

    la soluzione reale dell’equazione x3 + m2x = 2n si può trovare intersecando

    la parabola y = x2/m con il cerchio (x − n/m2)2 + y2 = n2/m4. Più in

    generale, le soluzioni di una equazione di terzo grado o quarto grado ax4 +

    bx3 + cx2 + dx+ e = 0 si possono ottenere geometricamente intersecando la

    parabola y = x2 con l’iperbole ay2 + bxy + cy + dx + e = 0. Nella ”Summa

    de Arithmetica” del 1494 Luca Pacioli (1445-1517) ritiene ”impossibile censo

    de censo e censo uguale a cosa.... impossibile censo de censo e cosa uguale a

    censo...”, cioè ritiene impossibile trovare una regola generale per risolvere le

    equazioni ax4 + bx2 = cx e ax4 + bx = cx2. La sfida è prontamente accettata.

    Il primo che risolve delle particolari equazioni cubiche ax3 + bx = c, ”cose e

    cubo eguale a numero”, è Scipione dal Ferro (1465-1526), che non divulga la

    12

  • soluzione ma la utilizza nelle pubbliche disfide matematiche che si tengono

    sotto il portico della Chiesa di Santa Maria dei Servi a Bologna. Anche grazie

    al prestigio guadagnato in queste disfide, il suo stipendio passa da 25 lire nel

    1496 a 150 lire nel 1510. Solo in punto di morte comunica la soluzione al suo

    allievo Antonio Maria Fior.

    ”Il capitolo di cose e cubo eguale a numero: Quando le cose e li cubi si

    eguagliano al numero (ax3 + bx = c), ridurai la equatione a 1 cubo partendo

    per la quantità delli cubi (x3 + px = q), poi cuba la terza parte delle cose

    ((p/3)3), poi quadra la metà dil numero ((q/2)2) e questo suma con il detto

    cubato ((p/3)3 + (q/2)2), et la radice di detta summa più la metà del numero

    fa un binomio (√p3/27 + q2/4 + q/2) et la radice cuba di tal binomio, men

    la radice cuba del suo residuo ( 3√√

    p3/27 + q2/4± q/2) val la cosa”

    Niccolò Fontana (1499-1557), soprannominato Tartaglia per una grave fe-

    rita al palato subita nel duomo di Brescia durante il sacco di Brescia da parte

    dei francesi il 19 febbraio 1512, nel 1535 trova a sua volta la soluzione. Nel

    1539, con lusinghe e promesse di denaro, Hieronimo Cardano (1501-1576)

    convince Tartaglia a rivelargli la scoperta con la garanzia di mantenere il

    segreto. Il sospettoso Tartaglia nasconde la scoperta in un sonetto piuttosto

    criptico, che Cardano riesce però a decifrare. Venuto poi a conoscenza delle

    ricerche di dal Ferro, Cardano si ritiene sciolto dal giuramento e pubblica

    la soluzione delle equazioni di terzo grado nell’”Ars magna” del 1545, at-

    tribuendola a dal Ferro ma dando il dovuto credito anche a Tartaglia. Nel

    libro, ” scritto in cinque anni, possa durarne altrettante migliaia”, compare

    anche la soluzione delle equazioni di quarto grado attribuita al suo discepo-

    lo Ludovico Ferraro (1522-1565). Tartaglia furioso nel vedersi imbrogliato

    accusa Cardano di plagio ed aggiunge una serie di improperi: ”Poverello,

    13

  • huomo che tien poco sugo e di poco discorso”. Cardano cerca di tirarsi fuori

    dalla polemica, ”credo... che stati uscito di cervello forsi per il vostro troppo

    studiare”, ma Ferrari, un orfano che a Cardano deve ”loco et foco”, prenden-

    do le sue difese accusa a sua volta Tartaglia di aver plagiato dal Ferro. I

    contendenti si scambiano sei pubblici ”Cartelli di matematica disfida”, e non

    si capisce bene chi vince. Nel diciassettesimo dei 31 problemi proposti nel

    secondo cartello, Ferrari chiede di scomporre 8 nella somma x+ y rendendo

    massimo il prodotto x · y · (x− y). Posto x = 4 + z e y = 4− z, si tratta di

    trovare il massimo del polinomio di terzo grado (4 + z)(4− z)2z = 32z− 2z3

    con 0 ≤ z ≤ 4. La risposta di Tartaglia è x, y = 4±√

    5 + 1/3.

    ”Fatemi di otto due tal parti, che’l prodotto dell’una nel altra moltiplicato

    nella loro differenza, faccia più che possibil sia, dimostrando il tutto.”

    ”Ve rispondo che la maggior parte fu 4 più R.(5+1/3) et la menore fu 4 men

    R.(5+1/3), el produtto è 10+2/3, qual moltiplicato nella differentia che è

    R.(21+1/3) fa R.2423+7/27, et questa è di frutto della nostra pianta con li

    quali pensavati farmi guerra, ma el vi ha fallato el pensiero.”

    Piegando un foglio con lati A e B lungo le linee

    tratteggiate si ottiene una scatola di altezza x.

    Il volume x(A−2x)(B−2x) è massimo quando

    x =A+B −

    √A2 +B2 − AB6

    Figura 3.2: Volume di una scatola

    Ma ecco la soluzione dell’equazione di terzo grado messa in rima da

    Tartaglia, con, tra parentesi, la traduzione in formule:

    14

  • ”Quando chel cubo con le cose appresso

    Se agguaglia à qualche numero discreto (x3 + px = q)

    Trovan dui altri differenti in esso. (u− v = q)

    Da poi terrai questo per consueto

    Che’l lor produtto sempre sia eguale

    Al terzo cubo delle cose neto, (u · v = (p/3)3)

    El residuo poi suo generale

    Delli lor lati cubi ben sottratti

    Varrà la tua cosa principale. ( 3√u− 3√v = x)

    In el secondo de cotesti atti

    Quando che’l cubo restasse lui solo (x3 = px+ q)

    Tu osservarai quest’altri contratti,

    Del numer farai due tal part’à volo (u+ v = q)

    Che l’una in l’altra si produca schietto

    El terzo cubo delle cose in stolo (u · v = (p/3)3)

    Delle qual poi, per commun precetto

    Torrai li lati cubi insieme gionti

    Et cotal somma sarà il tuo concetto. ( 3√u+ 3√v = x)

    El terzo poi de questi nostri conti (x3 + q = px)

    Se solve col secondo se ben guardi

    Che per natura son quasi congionti.

    Questi trovai et non con passi tardi

    Nel mille cinquecente, quatro e trenta

    Con fondamenti ben sald’è gagliardi

    Nella città dal mar’ intorno centa.”

    15

  • x = u+ v,

    (u+ v)3 = 3uv(u+ v) + (u3 + v3)

    u3v3 = a3/27, u3 + v3 = b

    u, v = 3√b/2±

    √b2/4− a3/27.

    Le Determinazioni delle radici cubiche

    devono dare 3uv = a

    Figura 3.3: La soluzione di Cardano dell’equazione x3 = ax+ b

    Cioè, se ω = (1 +√−3)/2, e se k = 0, 1, 2, le tre radici dell’equazione

    x3 + px+ q = 0 sono

    x = ωk3

    √−q/2 +

    √q2/4 + p3/27 + ω2k

    3

    √−q/2−

    √q2/4 + p3/27.

    La formula riserva delle sorprese. Nell’”Ars magna” Cardano applica la

    formula all’equazione x3 + 6x = 20 ed ottiene

    Rv : cub R108 p : 10 m : Rv : cub R108 m : 10.

    Cioè x =3√√

    108 + 10− 3√√

    108− 10. Cardano osserva che questa equa-

    zione ha una sola radice reale x = 2, ma non mostra come trasformare

    la prima espressione nella seconda. Infine, Cardano si imbatte nelle radici

    quadrate di numeri negativi. Per esempio, si verifica immediatamente che

    l’equazione x3 − 7x − 6 = 0 ha tre radici reali, x = −2,−1,+3, ma dalla

    formula si ricava

    3

    √3 +

    10√−3

    9− 3√−3 + 10

    √−3

    9.

    Se l’equazione ha tre radici reali, nella formula compaiono le radici qua-

    drate di numeri negativi. È il ”casus irreducibilis”. Negli esempi sopra le

    equazioni risultano riducibili nel campo razionale, ma se un polinomio con

    coefficienti interi, irriducibile, con tutte le radici reali, ha una radice radicale

    16

  • reale, allora il grado del polinomio è una potenza di 2, e tutte le radici sono

    in estensioni quadratiche iterate del campo dei razionali.

    Giuseppe Lodovico Lagrangia (1736-1813) nel 1770 pubblica le ”Riflessio-

    ni sulla risoluzione algebrica delle equazioni”.”In questa memoria mi propon-

    go di esaminare i differenti metodi fin qui trovati per la risoluzione algebrica

    delle equazioni, riducendoli a principi generali, mostrando a priori perché

    questi metodi funzionano per il terzo e quarto grado, ma sono in difetto per

    gradi maggiori... Tutti i metodi si riducono ad uno stesso principio: Trovare

    delle espressioni delle radici dell’equazione data che siano tali che: (1) L’e-

    quazione o le equazioni che queste espressioni soddisfano siano di un grado

    minore dell’equazione data, o decomponibili in equazioni di grado minore.

    (2) Che da queste espressioni si possa poi risalire alle radici cercate”.

    Lagrange osserva che se x1, x2, ..., xn sono le radici un polinomio P (x), e

    se un polinomio X(x1, x2, ..., xn) assume k valori distinti y1, y2, ..., yk quando

    queste radici vengono permutate, allora y1, y2, ..., yk sono radici di un poli-

    nomio (y − y1)(y − y2)...(y − yk) di grado k con coefficienti simmetrici in

    x1, x2, ..., xn, quindi funzioni razionali dei coefficienti P (x). In particolare,

    per risolvere una equazione di grado n si possono cercare delle espressioni

    razionali delle radici, i cosiddetti risolventi, che assumono meno di n valori

    quando queste radici vengono permutate negli n! modi possibili. Trovate le

    radici dei risolventi, si deve poi risalire alle radici del polinomio di partenza.

    Se x1 e x2 sono le radici dell’equazione x2 + ax+ b = 0, si definisce

    X = x1 − x2.

    Permutando le radici questa espressione prende 2 valori distinti, ma il

    quadrato X2 rimane invariato. Quindi X2 è una funzione razionale dei coef-

    ficienti, (x1 − x2)2 = (x1 + x2)2 − 4x1x2 = a2 − 4b. Infine, da x1 + x2 = −a e

    x1 − x2 = ±√a2 − 4b si possono ricavare x1 e x2.

    17

  • Se x1, x2, x3, sono le radici dell’equazione x3+ax2+bx+c = 0, si definisce

    X = x1 + exp

    (2πi

    3

    )x2 + exp

    (4πi

    3

    )x3.

    Permutando le radici questa espressione prende 6 valori distinti , ma il

    cubo X3 prende solo 2 valori. Il sottogruppo delle permutazioni pari fissano

    questa espressione, quelle dispari la cambiano,R =

    (x1 + exp

    (2πi

    3

    )x2 + exp

    (4πi

    3

    )x3

    )3,

    S =

    (x1 + exp

    (4πi

    3

    )x2 + exp

    (2πi

    3

    )x3

    )3.

    Le funzioni simmetriche R + S e R · S sono invarianti per permutazioni

    delle radici e sono funzioni razionali dei coefficienti a, b, c,(x1 + exp

    (2πi

    3

    )x2 + exp

    (4πi

    3

    )x3

    )3+

    (x1 + exp

    (4πi

    3

    )x2 + exp

    (2πi

    3

    )x3

    )3=

    = 2(x1 + x2 + x3)3 − 9(x1 + x2 + x3)(x1x2 + x2x3 + x3x1) + 27x1x2x3,

    (x1 + exp

    (2πi

    3

    )x2 + exp

    (4πi

    3

    )x3

    )3·(x1 + exp

    (4πi

    3

    )x2 + exp

    (2πi

    3

    )x3

    )3=

    =((x1 + x2 + x3)

    2 − 3(x1x2 + x2x3 + x3x1))3.

    Risolvendo un’equazione di secondo grado, si possono ricavare R e S, e

    risolvendo il sistema con x1 + x2 + x3 = −a, si possono ricavare x1, x2, x3,x1 + x2 + x3 = −a,

    x1 + exp

    (2πi

    3

    )x2 + exp

    (4πi

    3

    )x3 =

    3√R,

    x1 + exp

    (4πi

    3

    )x2 + exp

    (2πi

    3

    )x3 =

    3√S.

    Se x1, x2, x3, x4, sono le radici dell’equazione x4 + ax3 + bx2 + cx+ d = 0,

    in analogia a quanto sopra il polinomio da considerare sarebbe

    X = x1 + ix2 − x3 − ix4.

    18

  • Permutando le radici questa espressione prende 24 valori distinti, ma X4

    prende solo 3 valori. C’è però un’espressione più semplice. Permutando le

    radici l’espressione (x1+x2−x3−x4)2 prende solo 3 valori, R = (x1+x2−x3−

    x4)2, S = (x1−x2+x3−x4)2, T = (x1−x2−x3+x4)2. Le funzioni simmetriche

    R + S + T,RS + ST + TR,RST , sono invarianti per permutazioni e sono

    funzioni razionali dei coefficienti dell’equazione. Risolvendo una equazione

    di terzo grado, si possono ricavare R, S, T , e risolvendo il sistema con x1 +

    x2 + x3 + x4 = −a, si possono ricavare x1, x2, x3, x4.

    Infine, permutando le radici di una equazione di quinto grado, i risolventi

    di Lagrange prendono sei valori distinti. Da una equazione di quinto grado

    si arriva ad una di sesto. Il metodo di risoluzione delle equazioni di secondo,

    terzo, quarto grado non si applica a quelle di quinto.

    Con Lagrange ha inizio lo studio dei gruppi, in particolare i gruppi di

    permutazioni. Basandosi sulle ricerche di Lagrange, nel 1799 Ruffini dimostra

    la non risulubilità per radicali di una generica equazione di quinto grado. La

    dimostrazione di Ruffini è un po’ oscura ed ha delle lacune. Comunque il

    risultato è riscoperto da Abel nel 1824. Infine, nel 1830 Galois dimostra che

    una equazione è risolubile per radicali se e solo se le permutazioni delle radici

    che lasciano inalterati i coefficienti del polinomio sono un gruppo risolubile.

    Il commutatore di un gruppo G è il sottogruppo [G,G] generato dai com-

    mutatori [a, b] = aba−1b−1 con a, b ∈ G. Siccome [a, b]−1 = [b, a], gli elementi

    di questo sottogruppo sono i prodotti di commutatori [a, b][c, d]...[f, g]. G

    è commutativo se e solo se [G,G] = {e}. Il commutatore misura quanto

    un gruppo è commutativo, più grande è il commutatore, meno commuta-

    tivo è il gruppo. Il commutatore è un sottogruppo normale, a[b, c]a−1 =

    [aba−1, aca−1], e G/[G,G] è commutativo, ab = ba[a−1, b−1]. Per induzione

    si possono definire i sottogruppi derivati G(0) = G e G(k+1) = [G(k),G(k)]. Il

    19

  • gruppo è risolubile se la serie derivata G(0) ⊇ G(1) ⊇ G(2) ⊇ G(3) ⊇ ... ter-

    mina in {e}, cioè esiste k con G(k) = {e}. Una definizione equivalente è la

    seguente: G è risolubile se esiste una successione di sottogruppi inscatolati

    G = G0 ⊇ G1 ⊇ G2 ⊇ ... ⊇ Gk = {e}, con Gj+1 normale in Gj e Gj/Gj+1commutativo.

    Una permutazione è pari o dispa-

    ri se il numero di incroci è pari o

    dispari. Le permutazioni pari sono

    un sottogruppo normale.

    Figura 3.4: Permutazioni e incroci

    Teorema: Il gruppo simmetrico S(n) delle permutazioni di n elementi è

    risolubile se e solo se n ≤ 4.

    Dimostrazione: Un calcolo esplicito dei sottogruppi derivati mostra che

    S(n) è risolubile se n ≤ 4. Il gruppo S(2) è ciclico di ordine 2. Quindi S(2)

    è risolubile. Il commutatore di S(3) è il gruppo delle permutazioni pari,

    [S(3),S(3)] = A(3) = {e, (abc), (acb)}, che è commutativo. Quindi S(3) è

    risolubile. [S(4),S(4)] = A(4) sono le permutazioni pari, e [A(4),A(4)] =

    {e, (ab)(cd), (ac)(bd), (ad)(bc)} è commutativo. Quindi S(4) è risolubile. In-

    fine, S(n) non è risolubile se n ≥ 5. Se (ab) e (bc) sono trasposizioni con un

    elemento in comune, il commutatore è un 3 ciclo,

    (ab)(bc)(ab)(bc) = (abc).

    In particolare, [S(n),S(n)] contiene tutti i 3 cicli, ed i 3 cicli generano il

    20

  • Il più piccolo gruppo non risolubile è il gruppo A(5) delle simmetrie

    dirette di un dodecaedro o icosaedro.

    Figura 3.5: Dodecaedro e Icosaedro

    sottogruppo delle permutazioni pari A(n):

    (ac)(bc) = (abc),

    (ac)(bd) = (abc)(bcd).

    Se ci sono cinque elementi distinti, i commutatori dei 3 cicli contengono tutti

    i 3 cicli. (abc) è il commutatore di (abd) e (cbe),

    (abd)(cbe)(adb)(ceb) = (abc).

    In particolare, se n ≥ 5 i gruppi derivati contengono tutti i 3 cicli. Se n ≥ 5,

    il sottogruppo dei commutatori di S(n) è il gruppo A(n), e tutti i derivati di

    A(n) coincidono con A(n). �

    21

  • Teorema: (1) Un sottogruppo di un gruppo risolubile è risolubile.

    (2) Il prodotto diretto F × G di due gruppi risolubili F e G è risolubile.

    (3) Se G è risolubile e G H è un omomorfismo suriettivo, anche H è

    risolubile.

    (4) Se H è un sottogruppo normale in G e se H e G/H sono risolubili,

    anche G è risolubile.

    (5) Se F è risolubile e G F è un omomorfismo con nucleo risolubile

    H, anche G è risolubile.

    Dimostrazione: Se H ⊆ G, allora [H,H] ⊆ [G,G] ed iterando H(j) ⊆

    G(j). Se G(k) = {e}, anche H(k) = {e}. Questo prova (1). �

    [F × G,F × G] = [F ,F ] × [G,G], ed iterando (F × G)(j) = F (j) × G(j).

    Questo prova (2). �

    Da un omomorfismo suriettivo G H si ottiene un omomorfismo suriet-

    tivo [G,G] [H,H], ed iterando G(j) H(j). Questo prova (3). �

    Se ϕ è l’omomorfismo canonico di G su G/H, allora ϕ(G(j)) = (G/H)(j).

    Se (G/H)(i) = {e}, allora G(i) ⊆ H. Se H(j) = {e}, allora G(i+j) = {e}.

    Questo prova (4). �

    Infine, (5) segue dai punti precedenti: G/H è isomorfo ad un sottogruppo

    di F , quindi è risolubile, e se H e G/H sono risolubili, anche G è risolubile.

    I gruppi considerati nel seguito saranno gruppi di automorfismi di algebre.

    Un esempio è l’algebra dei polinomi in n variabili {x1, ..., xn} con coefficienti

    complessi, con il gruppo simmetrico che permuta queste variabili. Un ele-

    mento x di un’algebra è una radice m-esima di un elemento a se xm = a.

    22

  • Teorema: Sia A un’algebra e sia G un gruppo finito di automorfismi

    di A con ordine n. Si assuma che A sia anche uno spazio vettoriale su un

    campo K con caratteristica zero contenente le radici n-esime dell’unità, e si

    assuma che gli automorfismi siano anche trasformazioni lineari. Se il gruppo

    G è risolubile, ogni elemento dell’algebra A può essere ottenuto con somme

    ed estrazioni di radici iterate n-esime di elementi della sottoalgebra A(G)

    invariante per gli automorfismi di G.

    Dimostrazione: Facciamo la dimostrazione a pezzi.

    Se un gruppo commutativo con n elementi G agisce su un’algebra A, gli

    elementi dell’algebra possono essere scomposti in somme di radici n-esime di

    elementi della sottoalgebra invariante A(G).

    Trasformazioni lineari che commutano tra loro possono essere simultanea-

    mente diagonalizzate. Se ST = TS e se Tx = λx, allora T (Sx) = S(Tx) =

    S(λx) = λSx. In particolare, un gruppo commutativo di trasformazioni ha

    una diagonalizzazione comune. L’orbita di un elemento x in A genera un

    sottospazio lineare che si può decomporre in autospazi comuni a tutti gli

    operatori in G, {Gx} = L1 ⊕ L2 + .... In particolare, x = x1 + x2 + ..., con

    gxj = λxj. Da xj = gnxj = λ

    nxj si ricava che gli autovalori λ sono radici

    n-esime dell’unità, e siccome le trasformazioni g sono anche automorfismi

    dell’algebra, g(xnj ) = (gxj)n = λnxnj = x

    nj . Quindi gli elementi x

    nj = yj sono

    invarianti per gli automorfismi in G, e x = n√y1 + n

    √y2 + ... è somma di radici

    n-esime di elementi invarianti.

    Se H è un sottogruppo normale in G, l’insieme A(H) degli elementi del-

    l’algebra A che restano fissi sotto l’azione di H è invariante sotto l’azione di

    G. In particolare, c’è un’azione naturale di G/H sulla sottoalgebra invariante

    A(H).

    23

  • Se g ∈ G, h ∈ H, x ∈ A(H), allora g−1hg ∈ H e g−1hgx = x, quindi

    hgx = gx. Quindi, se x è H invariante, anche gx è H invariante. L’azione di

    G/H su A(H) è definita appunto da gx = hgx.

    Se G0 ⊇ G1 ⊇ G2 ⊇ ..., con Gj+1 normale in Gj e Gj/Gj+1 commutativo

    con ordine nj, e se A(G0) ⊆ A(G1) ⊆ A(G2) ⊆ ..., ogni elemento di A(Gj+1)

    può essere decomposto in somme di radici nj-esime di elementi in A(Gj).

    Questo segue immediatamente dai precedenti. Si osservi poi che l’ordine

    nj del guppo quoziente G(j)/G(j+1) deve dividere l’ordine del gruppo G(j), e

    quindi anche l’ordine n del gruppo di partenza. Infine una radice di ordine

    nj si può trasformare in una radice di ordine n. �

    Corollario (Dal Ferro, Tartaglia, Ferrari): Le equazioni algebriche di

    secondo, terzo e quarto grado possono essere risolte con somme, sottrazioni,

    prodotti, divisioni, estrazioni di radici.

    Dimostrazione: La generica equazione algebrica di grado n con radici

    {x1, ..., xn} è

    (x− x1) · (x− x2) · ... · (x− xn) =

    = xn −

    (∑j

    xj

    )xn−1 +

    (∑i

  • della sottoalgebra generata da {σ1, ..., σn}. In particolare, le radici di una

    equazione algebrica sono funzioni radicali dei coefficienti dell’equazione. �

    Questa presentata non è ovviamente la dimostrazione di Dal Ferro, Tarta-

    glia, Ferrari. Comunque, da questa dimostrazione si può ricavare una formula

    risolutiva.

    25

  • 26

  • Capitolo 4

    Superfici di Riemann

    y = n√x,

    y =

    ∫ x1

    dx

    x,

    y =

    ∫ x0

    dx√1− x2

    ,

    y =

    ∫ x0

    dx√1− x4

    ,

    x(x− 1)d2y

    dx2− ((a+ b+ 1)x− c)dy

    dx− aby = 0.

    Molte funzioni rivelano la loro vera natura solo nel campo complesso, e

    molte di queste funzioni ad una variabile x possono associare più valori di y.

    Per eliminare le ambiguità si può restringere opportunamente il dominio di

    definizione, ma per capire il comportamento globale e la vera natura di una

    funzione può essere opportuno non restringere ma ampliare il dominio. Se

    P (x, y) =∑

    ci,jxiyj è un polinomio con coefficienti complessi nelle variabili

    complesse x e y, l’equazione P (x, y) = 0 descrive una curva in C× C, cioè

    una superficie bidimensionale in R4. Può essere utile far variare x e y nel

    piano complesso con l’aggiunta del punto all’infinito, C∪{∞}. Una funzione

    algebrica y = y(x) è una soluzione di una equazione algebrica P (x, y) = 0.

    27

  • Questa funzione può prendere più valori. Se P (x, y) ha grado n in y, per

    un generico x si hanno n soluzioni {y1(x), ..., yn(x)}, ma per particolari x le

    y possono essere meno di n. Un polinomio ha una radice multipla se e solo

    è una radice anche della derivata. Se P (a, b) = 0 e ∂P (a, b)/∂y 6= 0, in un

    intorno di (a, b) c’è uno ed un solo ramo della funzione y = y(x). Ma se

    P (a, b) = 0 e ∂P (a, b)/∂y = 0, in (a, b) due rami della funzione si incollano,

    e se anche ∂2P (a, b)/∂2y = 0, i rami che si incollano sono tre... Inoltre, per

    particolari x l’equazione si può abbassare di grado e qualche soluzione y può

    scomparire all’infinito. In ogni regione di piano semplicemente connessa che

    non contiene punti di diramazione, cioè punti in cui le soluzioni sono meno

    di n, le soluzioni {y1(x), ..., yn(x)} sono analitiche, in particolare sviluppabili

    in serie di potenze. Se x percorre una curva semplice che gira intorno a un

    punto di diramazione p e non contiene altri punti critici, una soluzione ya(x)

    si trasforma in una soluzione yb(x), che si trasforma in una soluzione yc(x),...

    che si trasforma in una soluzione yd(x), che si ritrasforma in ya(x):

    ya(x) yb(x) yc(x) ... yd(x) ya(x).

    Se il ciclo (a, b, c, ..., d) ha lunghezza k, si può operare il cambio di variabili

    x = p+tk. Se t compie un giro intorno all’origine, p+tk compie k giri intorno

    a p, quindi ya(p + tk) ya(p + tk), la funzione è monodroma in un intorno

    di t = 0. Se ya(x) è limitata in un intorno di p, ya(p+ tk) ha uno sviluppo in

    serie di potenze di t,

    ya(p+ tk) = α + βt+ γt2 + δt3 + ...

    Quindi, ya(x) ha uno sviluppo in serie di potenze di k√x− p,

    ya(x) = α + β(x− p)1/k + γ(x− p)2/k + δ(x− p)3/k + ...

    28

  • Se ya(x) non è limitata in un intorno di p, lo sviluppo in serie ha anche

    potenze negative. Queste serie di potenze frazionarie sono state introdot-

    te da Isaac Newton (1642-1727), e riscoperte da Victor Alexandre Puiseux

    (1820-1883). Nei ”Fondamenti di una teorica generale delle funzioni di una

    variabile complessa” Bernhard Riemann (1826-1866) propone una possibile

    visualizzazione della superficie P (x, y) = 0: ”Nelle seguenti considerazioni

    limiteremo le variazioni di x ad un campo finito, riguardando come luogo

    dei punti non più il piano, ma una superficie distesa sul piano medesimo.

    Non farà difficoltà parlare di superfici sovrapposte, per rendere evidente la

    possibilità che il luogo dei punti si estenda più volte sopra la stessa parte di

    piano, però presupporremo che in questo caso le superfici sovrapposte non si

    attacchino lungo una linea, in guisa che non si abbiano né piegature delle su-

    perfici, né intersezioni di parti sovrapposte... Una variabile che in ogni punto

    della superficie prende un valore determinato che varia con continuità colla

    posizione dello stesso, può evidentemente riguardarsi come una funzione di

    x”.

    ...Una variabile che in ogni pun-

    to della superficie prende un valo-

    re determinato che varia con con-

    tinuità colla posizione dello stesso,

    può evidentemente riguardarsi come

    una funzione di x

    Figura 4.1: Bernhard Riemann 1851 ”Fondamenti di una teoria generale delle

    funzioni di una variabile complessa”

    Una funzione y della variabile x che è polidroma se x varia nel piano,

    29

  • torna ad essere monodroma quando x varia su una appropriata superficie.

    I punti della superficie sono in corrispondenza biunivoca con le soluzioni

    dell’equazione P (x, y) = 0. Una possibile costruzione della superficie è la

    seguente.

    Le funzioni {y1(x), ..., yn(x)} sono ben definite in ogni dominio semplice-

    mente connesso senza punti singolari. Se {p1, ..., pm} sono i punti di dirama-

    zione di P (x, y) = 0, i punti x in cui le soluzioni y sono meno di n, si taglia

    il piano complesso con delle semirette disgiunte da pk a ∞. Si sovrappon-

    gono poi n copie di questo piano tagliato e si assume che sul foglio j-esimo

    la funzione y = y(x) valga yj(x). Girando intorno ai punti di diramazione

    le soluzioni si scambiano, cioè sul bordo inferiore di un foglio una soluzione

    può prendere un valore differente dal valore sul bordo superiore. Se sui bordi

    inferiore e superiore di un taglio i valori dei rami yi(x) e yj(x) coincidono, si

    incolla il taglio inferiore del foglio i al taglio superiore del foglio j. Dopo che

    i fogli sono stati incollati, non c’è più traccia del taglio. Questi fogli tagliati

    ed incollati sono la superficie di Riemann dell’equazione P (x, y) = 0.

    Ricapitolando, sopra i punti non di diramazione ci sono n fogli distinti,

    e sopra i punti di diramazione, se m fogli si uniscono, si può visualizzare

    la superficie come spirale che compie m giri, e poi ritorna su se stessa. In

    questa costruzione tridimensionale la superficie ha delle autointersezioni, che

    scompaiono in dimensione quattro. La funzione algebrica nel piano comples-

    so è multivoca, 1 n, ma con x variabile sugli n fogli della superficie la

    funzione diviene univoca, 1 1. La superficie è il dominio della funzione

    algebrica. Ma torniamo al piano. Se x percorre con continuità una curva nel

    piano che non passa per i punti di diramazione di P (x, y) = 0, gli n valori

    {y1(x), ..., yn(x)} variano con continuità e, se la curva è chiusa, dopo un giro

    attorno ai punti di diramazione un ramo yi(x) si può trasformare in un altro

    30

  • ramo yj(x). Se x percorre la stessa curva in senso inverso, si torna al punto

    di partenza. Quindi, la trasformazione da un ramo all’altro è biunivoca, ad

    ogni curva chiusa che non passa per i punti di diramazione è associata una

    permutazione dei rami della superficie, e le curve omotope che possono essere

    deformate con continuità l’una nell’altra senza toccare i punti di diramazione

    danno le stesse permutazioni. In questo modo si ottiene un omomorfismo del

    gruppo fondamentale dei cammini π1(C−{p1, ..., pm}) nel gruppo di sostitu-

    zioni sugli n elementi {y1(x), ..., yn(x)}. L’immagine di questo omomorfismo

    è il gruppo di monodromia della funzione algebrica. Il gruppo fondamentale

    dei cammini è un gruppo libero generato da curve semplici intorno ai singoli

    punti di diramazione, ed il gruppo di monodromia è generato dalle permuta-

    zioni associate a questi giri intorno ai punti di diramazione. Se il gruppo di

    monodromia fissa le funzioni {y1(x), ..., yk(x)}, con k < n, si può definire

    (y − y1(x))(y − y2(x))...(y − ym(x)) = yk + A(x)yk−1 + ...+B(x)y + C(x).

    I coefficienti A(x), ..., B(x), C(x) sono funzioni monodrome ed hanno solo

    singolarità polari. Moltiplicando per il minimo comune denominatore si ot-

    tiene un polinomio che deve essere un fattore di P (x, y). Quindi, il polinomio

    P (x, y) è irriducibile se e solo se il gruppo di monodromia è transitivo, ogni

    soluzione può essere trasformata in un’altra. Questo argomento mostra anche

    che una funzione polidroma che prende un numero finito di valori ed ha un

    numero finito di punti singolari, che sono diramazioni o poli, è una funzione

    algebrica. Si può mostrare che se la curva P (x, y) = 0 è liscia, irriducibile, e

    se la proiezione (x, y) x ha solo punti critici non degeneri con valori critici

    differenti, ad ogni giro intorno ad un punto critico corrisponde una trasposi-

    zione tra due rami della superficie, e queste trasposizioni generano il gruppo

    di monodromia. Si può anche mostrare che il gruppo di monodromia è iso-

    morfo al gruppo di Galois dell’estensione algebrica del campo delle funzioni

    31

  • razionali C[x] con gli elementi {y1(x), ..., yn(x)}, il gruppo degli automorfismi

    del campo C[x, y1(x), ..., yn(x)] che fissano C[x].

    Infine, le superfici di Riemann di funzioni non algebriche, come y = log(x)

    o y = arcsin(x), possono avere infiniti fogli con gruppi di monodromia infiniti.

    L’esempio più elementare di equazione algebrica è yn − x = 0, con soluzione

    y = n√x. Questa funzione assume i valori yj(ρ exp(iϑ)) = ρ

    1/n exp(i(ϑ +

    2π(j − 1))/n), con j = 1, 2, ..., n. Per costruire la superficie di Riemann si

    prendono n copie del piano complesso tagliato lungo una semiretta da 0 a∞.

    Se x gira in senso antiorario intorno all’origine, ϑ cresce da 0 a 2π e dopo un

    giro yj(x) si trasforma in yj+1(x) se j = 1, 2, ..., n− 1, e yn(x) si trasforma in

    y1(x). Il gruppo di monodromia è ciclico di ordine n.

    Figura 4.2: Superfici di Riemann di 2√x e di 3

    √x

    Nel 1913 Hermann Weyl (1885-1955) propone una definizione assioma-

    tica di superfici di Riemann, senza riferimenti ad equazioni P (x, y) = 0 o

    immersioni delle superfici in spazi tridimensionali. Una superficie di Rie-

    mann X è una varietà topologica bidimensionale connessa, di Hausdorff, con

    base numerabile, con una struttura complessa data da un ricoprimento aper-

    to {Uj} di X , e omomorfismi ϕj(x) da Uj in aperti Vj di C, con ϕi(ϕ−1j (z))

    32

  • La superficie di Riemann della cur-

    va y2 = x(x+ 1)(x− 1) ha due fo-

    gli e quattro punti di diramazione

    x = −1, 0, +1, ∞. Incollando due

    sfere con due tagli da 0 a +1 e da

    −1 a ∞ si ottiene un toro.

    Figura 4.3: Superficie di Riemann di y2 = x(x+ 1)(x− 1)

    olomorfe quando definite. Una funzione f(x) è olomorfa in X se f(ϕ−1j (z))

    è olomorfa in Vj per ogni j. Similmente si possono definire le funzioni olo-

    morfe tra superfici di Riemann, e molti risultati dell’analisi complessa nel

    piano si estendono a queste superfici. Le superfici di Riemann associate ad

    equazioni algebriche P (x, y) = 0 sono superfici di Riemann anche secondo

    Weyl. Nella costruzione precedente, si possono identificare dei piccoli intor-

    ni di punti p sulla superficie di Riemann con intorni nel piano complesso

    con le seguenti regole. Se p non è un punto di diramazione, in un intor-

    no di p si può definire ϕ(x) = x. Se p è un punto di diramazione in cui

    si incollano m fogli, in un intorno di p si può trasformare il foglio j del-

    la superficie nell’angolo { m√ρeiϑ/m, 2π(j − 1)/m ≤ ϑ < 2πj/m} definendo

    ϕ(p + ρeiϑ) = p + m√ρeiϑ/m. Infine, un intorno del punto ∞ sulla superficie

    si può trasformare in 0, definendo ϕ(x) = 1/x, o ϕ(ρeiϑ) = ρ−1/me−iϑ/m se

    ∞ è un punto di diramazione.

    Una breve digressione: la monodromia e le superfici di Riemann giocano

    un ruolo importante anche negli integrali e nelle equazioni differenziali.

    L’integrale che definisce l’arcoseno

    y =

    ∫ x0

    dx√1− x2

    33

  • è una funzione polidroma con due punti di diramazione, x = ±1. La sua

    funzione inversa, il seno, è definita su tutto il piano complesso, ed è periodica

    con periodo 2π.

    L’integrale ellittico

    y =

    ∫ x0

    dx√(1− x2)(1− k2x2)

    è una funzione polidroma con quattro punti di diramazione, x = ±1,±k. La

    sua funzione inversa ha due periodi ω1 e ω2, con ω1/ω2 non reale, x(y+hω1 +

    kω2) = x(y).

    Una equazione differenziale lineare omogenea del second’ordine con coef-

    ficienti analitici ha soluzioni analitiche,

    A(x)d2y

    dx2+B(x)

    dy

    dx+ C(x)y = 0.

    Queste soluzioni sono ben definite in ogni aperto semplicemente connesso

    che non contiene zeri del coefficiente A(x) o poli di B(x) e C(x). Se la

    variabile x gira intorno ad uno zero di A(x) o un polo di B(x) o C(x), una

    variabile si trasforma in un’altra. Una base per le soluzioni {y1(x), y2(x)} si

    trasforma in un’altra base {Y1(x), Y2(x)}, Y1(x) = αy1(x) + βy2(x),Y2(x) = γy1(x) + δy2(x).In particolare, il rapporto z(x) = y1(x)/y2(x) si trasforma in

    Y1(x)

    Y2(x)=

    αy1(x)

    y2(x)+ β

    γy1(x)

    y2(x)+ δ

    .

    La funzione z(x) = y1(x)/y2(x) prende quindi più valori, e la funzione inversa

    x(z) è automorfa,

    x(z) = x

    (αz + β

    γz + δ

    ).

    34

  • Una funzione meromorfa ϕ(z) in un dominio D è automorfa rispetto ad

    un gruppo di trasformazioni Γ del dominio D se per ogni z in D ed ogni g in

    Γ si ha ϕ(z) = ϕ(gz). Una funzione automorfa è quindi una funzione sullo

    spazio quoziente D/Γ. Il teorema di uniformizzazione, una generalizzazione

    del teorema della mappa conforme di Riemann dimostrato da Henry Poincaré

    (1854-1912) e Felix Klein (1849-1925), afferma che ogni superficie di Riemann

    è conformemente equivalente ad uno spazio quoziente D/Γ, con D uguale

    al piano complesso C, o alla sfera di Riemann C∪{∞}, o al disco {|z| <

    1}, e con Γ un gruppo discontinuo di trasformazioni di D. Dal teorema di

    uniformizzazione segue che ogni curva algebrica può essere parametrizzata

    con funzioni univalenti. Se y = y(x) è la funzione definita implicitamente

    dall’equazione P (x, y) = 0, con x che varia sulla superficie di Riemann, e se

    x = ϕ(z) è una mappa conforme da D/Γ alla superficie, la curva algebrica

    risulta parametrizzata dalle funzioni x = ϕ(z) e y = y(x) = y (ϕ(z)).

    Una xilografia di M.C.

    Escher con il modello

    di Henri Poincaré della

    geometria non euclidea.

    Figura 4.4: Circle Limit III di Maurits Cornelis Escher, 1959

    Teorema: (1) L’equazione algebrica yn − ny + (n − 1)x = 0 ha una

    35

  • simmetria di ordine n−1: Se (x, y) è una soluzione e ωk = exp(2πik/(n−1)),

    k = 1, 2, ..., n− 1, anche (ωkx, ωky) è una soluzione.

    (2) L’equazione yn− ny+ (n− 1)x = 0 ha gli n− 1 punti di diramazione

    {(ωk, ωk)}n−1k=1, con ωk = exp(2πik/(n − 1)). In ognuno di questi punti si

    incollano due fogli della superficie di Riemann.

    (3) Nell’insieme semplicemente connesso Ω = C − ∪n−1k=1{tωk, 1 ≤ t <

    +∞} l’equazione yn − ny + (n − 1)x = 0 definisce n soluzioni distinte

    {y1(x), y2(x), ..., yn(x)}, con yk(0) = n−1√nωk se k = 1, 2, ..., n− 1, e yn(0) =

    0. La superficie di Riemann dell’equazione si ottiene incollando i bordi di n

    copie del foglio Ω.

    (4) Nel punto di diramazione x = ωk si incollano i due fogli della su-

    perficie di Riemann dove sono definite le funzioni yk(x) e ynleft(x). Giran-

    do intorno a ωk le soluzioni yk(x) e yn(x) si scambiano tra loro, e le altre

    soluzioni rimangono invariate.

    (5) L’equazione yn− ny+ (n− 1)x = 0 ha gruppo di monodromia S(n).

    Dimostrazione: (1) La simmetria dell’equazione ha una verifica diretta.

    (2) I punti di diramazione sono soluzioni del sistemayn − ny + (n− 1)x = 0,∂

    ∂y(yn − ny + (n− 1)x) = nyn−1 − n = 0.

    Le soluzioni sono (x, y) = (ωk, ωk) e queste radici sono doppie, infatti

    ∂2

    ∂y2(yn − ny + (n− 1)x) = n(n− 1)yn−2 6= 0 in (ωk, ωk).

    In particolare, nei punti di diramazione x = ωk si incollano solo due fogli

    della superficie di Riemann e gli altri n− 2 restano separati.

    (3) Il punto x = 0 non è una diramazione, se x = 0, allora y = 0

    oppure y = n−1√nωk con k = 1, 2, ..., n − 1. I fogli della superficie possono

    36

  • essere indicizzati assumendo y(0) = n−1√nωk sul k-esimo foglio e y(0) = 0

    sull’n-esimo.

    (4) Nel campo reale, esplicitando rispetto a y si ha

    x =y(n− yn−1)

    n− 1.

    Da dx/dy = (1−yn−1)n/(n−1) si ricava che se y cresce da 0 a 1, x cresce da

    0 a 1, e se y cresce da 1 a n−1√n, x decresce da 1 a 0. Nel campo complesso,

    posto x = 1 + u e y = 1 + v, l’equazione yn − ny + (n− 1)x = 0 diventa

    (1 + v)n − n(1 + v) + (n− 1)(1 + u) = 0,

    (n− 1)u+ n(n− 1)2

    v2 +n(n− 1)(n− 2

    6v3 + ...+ vn = 0.

    E per u e v piccoli si ha l’equazione approssimata v2 ≈ −2u/n. In particolare,

    ad un giro completo di u intorno all’origine corrisponde mezzo giro di v

    intorno all’origine. Se x = 1 + εeiϑ con ε piccolo e −π ≤ ϑ < π si ha

    y ≈ 1 +√

    2ε/nei(ϑ−π)/2. Se x parte da 0 e arriva a 1, poi gira intorno a

    1 e torna a 0, la soluzione y che parte da 0, arriva a 1 e prosegue fino a

    n−1√n. Similmente, la soluzione y che parte da n−1

    √n, arriva a 1 e prosegue

    fino a 0. Se x gira intorno a 1, c’è uno scambio tra le soluzioni y = 0 e

    y = n−1√n, mentre le altre soluzioni restano invariate. Similmente, per la

    simmetria y(ωkx) = ωky(x), girando intorno a x = ωk le soluzioni y = 0 e

    y = n−1√nωk si scambiano e le altre restano invariate.

    (5) Il gruppo di monodromia della superficie contiene quindi le trasposi-

    zioni (k, n). Infine, (hn)(kn)(hn) = (hk) e (abc...d) = (ab)(ac)...(ad), quindi

    il gruppo di monodromia contiene tutte le permutazioni. �

    Anche se non necessario per quanto segue, con le formule di Riemann Hur-

    wiz cerchiamo di determinare la topologia di una curva algebrica P (x, y) = 0.

    Aggiungendo al piano il punto all’infinito si ottiene la sfera di Riemann

    37

  • Figura 4.5: La superficie di Riemann di y3 − 3y + 2x = 0 ha tre fogli con

    due diramazioni in (1, 1) e (−1,−1). Se x cresce da 0 a 1 e poi torna a 0,

    la soluzione y che parte da 0 passa per 1 ed arriva in√

    3, la soluzione che

    parte da√

    3 arriva in 0, e la soluzione che parte da√

    3 torna in√

    3

    C∪{∞}. Ogni foglio della superficie di Riemann con un taglio da un pun-

    to di diramazione p a ∞ è una sfera con due vertici, un lato, una faccia,

    V −L+F = 2, e la caratteristica di Eulero di n sfere non incollate e discon-

    nesse è 2n. Incollandole si ottiene una superficie compatta con n facce, n lati,

    e 2n −∑

    (e(p) − 1) vertici, con e(p) il numero di fogli che si incontrano in

    un punto di diramazione. Quindi, la caratteristica di Eulero della superficie

    V − L+ F = 2n−∑

    (e(p)− 1)

    La caratteristica di Eulero è legata al genere, cioè al numero di buchi della

    superficie, dalla relazione χ(S) = 2− 2g. Quindi, il genere della superficie è

    g = 1− n+ 12

    ∑(e(p)− 1).

    38

  • Per esempio, la superficie di Riemann della curva yn − ny + (n− 1)x = 0 ha

    n fogli e n punti di diramazione. Negli n− 1 punti di diramazione al finito si

    incontrano 2 fogli, e nel punto di diramazione all’infinito si incontrano tutti

    gli n fogli. Quindi, V − L + F = 2, la superficie è omeomorfa ad una sfera.

    La superficie di Riemann della curva ellittica y2 = (x − a)(x − b)(x − c) ha

    due fogli, n = 2, con punti di diramazione p = a, b, c,∞, con e(p) = 2, quindi

    ha genere g = 1. La superficie è un toro. La superficie associata alla curva

    y2 = (x − a)(x − b)(x − c)...(x − d), con 2p + 1 o 2p + 2 radici distinte, ha

    genere p.

    Come esercizio per ricapitolare quanto visto, ci permettiamo di presentare

    una dimostrazione un po’ complicata, ma nello spirito dei teoremi precedenti,

    della formula di Cardano per le soluzioni di equazioni di terzo grado.

    Corollario (Del Ferro-Tartaglia): Le soluzioni dell’equazione di terzo

    grado y3 − 3y + 2x = 0 sono

    y =3

    √−x− 2

    √x2 − 1 + 3

    √−x+ 2

    √x2 − 1.

    In questa espressione le determinazioni delle radici quadrate sono le stesse e

    le determinazioni delle radici cubiche danno come prodotto 1.

    Dimostrazione: Un calcolo esplicito mostra che l’espressione radica-

    le è soluzione dell’equazione. Ma è anche possibile seguire una via più

    tortuosa, confrontando la superficie di Riemann della funzione algebrica

    3√−x− 2

    √x2 − 1+ 3

    √−x+ 2

    √x2 − 1 con quella dell’equazione y3−3y+2x = 0.

    La funzione z = −x −√x2 − 1 ha due rami e w = 3

    √−x− 2

    √x2 − 1 ne ha

    sei. Se ω = exp(2πi/3) e se A e B sono i rami di w che in x = 0 prendono i

    valori i e −i, i rami di w sono {A, ωA, ω2A,B, ωB, ω2B}. Se la variabile x

    percorre i segmenti da −1 a 0 o da 0 a 1, i rami di z descrivono un quadrante

    della circonferenza {z = 1}, quindi i rami di w percorrono archi in {w = 1}

    39

  • di ampiezza π/6. Il gruppo di monodromia di w è generato da curve che

    girano intorno ai punti di diramazione ±1. Se la curva σ parte da 0, percorre

    il segmento da 0 a ε−1, gira in senso antiorario intorno al punto −1, e torna

    a 0 lungo il segmento da ε − 1 a 0, allora σA = ωB e σB = ω2A. Se τ è

    una curva simile che gira intorno a 1, allora τA = ω2B e τB = ωA. I rami

    {A + B,ωA + ω2B,ω2A + ωB} rimangono invarianti rispetto all’azione del

    gruppo di monodromia generato da {σ, t} e questo gruppo è S(3),

    σ(A+B) = ωB + ω2A,

    σ(ωA+ ω2B) = ω2B + ωA,

    σ(ω2A+ ωB) = B + A,

    τ(A+B) = ω2B + ωA,

    τ(ωA+ ω2B) = B + A,

    τ(ω2A+ ωB) = ωB + ω2A.

    Quindi la funzione algebrica Y = {A + B,ωA + ω2B,ω2A + ωB} vive sulla

    stessa superficie di Riemann dell’equazione y3 − 3y + 2x = 0. Infine, Y e y

    hanno lo stesso comportamento all’infinito e nell’origine. Quindi Y = y. �

    40

  • Capitolo 5

    Il teorema di Abel Ruffini

    Diamo una definizione di soluzione radicale di una equazione algebrica:

    a, b, c,... sono interi. T (x), Z(x, t), W (x, t, z),... sono funzioni razio-

    nali delle variabili x, (x, t), (x, t, z),... Infine, ta = T (x), zb = Z(x, t),

    wc = W (x, t, z),... L’equazione algebrica P (x, y) = 0 ha una soluzione

    radicale se tutte le determinazioni della funzione algebrica y(x) sono con-

    tenute tra le determinazioni delle funzioni algebriche radicali t = a√T (x),

    z = b√Z(x, t(x)), w = c

    √W (x, t(x), z(x)),...

    Il seguente teorema descrive la monodromia di una funzione algebrica

    radicale. I commutatori uccidono la polidromia dei radicali.

    Teorema: (1) Se ta = T (x), con a intero positivo e T (x) funzione ra-

    zionale, se α e β sono curve nel piano della variabile x con origine in co-

    mune non passanti per i poli e gli zeri di T (x), la funzione algebrica t(x) ha

    variazione nulla lungo il commutatore αβα−1β−1.

    (2) Se ta = T (x) e zb = Z(x, t), con a e b interi positivi e T (x) e Z(x, t)

    funzioni razionali, se α e β sono prodotti di commutatori di curve nel piano

    della variabile x con origine in comune non passanti per i punti singolari

    41

  • delle funzioni t = a√T (x) e z = b

    √Z(x, t(x)), la funzione algebrica z(x) ha

    variazione nulla lungo il commutatore γ = αβα−1β−1.

    (3) Se l’equazione algebrica P (x, y) = 0 ha una soluzione radicale, esiste

    k tale che la funzione algebrica y(x) ha variazione nulla lungo ogni commu-

    tatore di ordine k. Cioè, il gruppo di monodromia di una funzione algebrica

    radicale è risolubile.

    Dimostrazione: (1) Le determinazioni di a√T (x) differiscono tra lo-

    ro per delle radici dell’unità a√

    1. Se t(x) è una particolare determinazio-

    ne di a√T (x) e ω = exp(2πi/a), tutte le determinazioni di a

    √T (x) sono

    {ωkt(x)}a−1k=0. Se girando intorno ad un punto di diramazione t(x) si tra-

    sforma in ωit(x), allora ωkt(x) si trasforma in ωi+kt(x), con addizioni degli

    indici modulo a. La costante ωk non si trasforma. Se ωkt(x) si trasforma

    in ωi+kt(x) lungo una curva α, e ωkt(x) si trasforma in ωj+kt(x) lungo una

    curva β, lungo il commutatore αβα−1β−1 la variazione è nulla,

    ωkt(x)α ωi+kt(x)

    β ωi+j+kt(x)

    α−1 ωj+kt(x)

    β−1

    ωkt(x).

    (2) Per il punto precedente, se le curve α e β sono prodotti di commu-

    tatori, le funzioni t(x) = a√T (x) e Z(x, t(x)) hanno variazione nulla lungo

    queste curve. Dal punto di partenza delle curve è possibile definire una deter-

    minazione z(x) di b√Z(x, t(x)), e tutte le altre possibili determinazioni sono

    {ωkz(x)}b−1k=0, con ω = exp(2πi/b). Percorrendo le curve α e β le funzioni

    t(x) e Z(x, t(x)) tornano su loro stesse, quindi z(x) si trasforma in un’altra

    determinazione di b√Z(x, t(x)). Quindi esistono i e j tali che ωkz(x) si tra-

    sforma in ωi+kz(x) lungo la curva α e ωkz(x) si trasforma in ωj+kz(x) lungo

    la curva β, e lungo il commutatore αβα−1β−1 la variazione di ωkz(x) è nulla.

    (3) Se t(x) = a√T (x), z(x) = b

    √Z(x, t(x)), w(x) = c

    √W (x, t(x), z(x)),

    con a, b, c,... interi e T (x), Z(x, t), W (x, t, z) funzioni razionali, t(x) e

    42

  • Z(x, t(x)) hanno variazione nulla lungo un commutatore, z(x) eW (x, t(x), z(x))

    hanno variazione nulla lungo un commutatore di prodotti di commutatori,

    w(x) ha variazione nulla lungo un commutatore di prodotti di commutatori

    di prodotti di commutatori,... �

    Teorema (Abel-Ruffini):Una generica equazione algebrica di grado mag-

    giore o uguale a 5 non può essere risolta con radicali. Cioè, non si può co-

    struire la funzione algebrica y = y(x) radice di un polinomio P (x, y) = 0

    componendo le costanti e la funzione x con le quattro operazioni elementari,

    +, −, ×, ÷, e le estrazioni di radici n√ .

    Dimostrazione: Per quanto visto sopra, le funzioni algebriche definite

    da formule esplicite, con somme, prodotti e radici, hanno gruppi di mono-

    dromia risolubili. Al contrario, il gruppo di monodromia di una generica

    funzione algebrica di grado n ≥ 5, per esempio yn − ny + (n − 1)x = 0, è il

    gruppo non risolubile S(n). �

    Si è appena mostrato che esistono funzioni algebriche non radicali, ma

    si può anche mostrare che funzioni algebriche non radicali per valori interi

    della variabile possono prendere valori algebrici non radicali. Esistono cioè

    delle equazioni algebriche con coefficienti numerici non risolubili per radicali

    numerici. In particolare, Leopold Kronecker (1823-1891) ha dimostrato che

    un polinomio irriducibile di grado primo dispari con coefficienti interi e ra-

    dici radicali ha una sola radice reale, oppure tutte le radici sono reali. Per

    esempio, l’equazione x5 − 4x − 2 = 0 ha tre radici reali e due complesse, e

    nessuna di queste è radicale. Più in generale, non è possibile risolvere una

    generica equazione di grado n ≥ 5 con radicali e con soluzioni di equazioni

    di grado n − 1. Ci sono comunque equazioni di quinto grado con soluzioni

    43

  • radicali:

    x5 + 330x− 4170 = 0,

    x = 5√

    12 + 5√

    54− 5√

    144 + 5√

    648.

    Gauss nelle ”Disquisitiones Arithmeticae” dimostra che le equazioni ci-

    clotomiche xn−1 + xn−2 + ...+ x+ 1 sono risolubili per radicali.

    La seguente dimostrazione alternativa della risolubilità del gruppo di mo-

    nodromia di funzioni algebriche radicali è un po’ più complicata, ma serve ad

    illustrare le relazioni tra le superfici di Riemann di due funzioni algebriche

    f(x) e g(x) e le superfici di f(x) + g(x), f(x)− g(x), f(x) · g(x), f(x)/g(x),

    e n√f(x).

    Teorema: (1) C’è un omomorfismo suriettivo di un sottogruppo del pro-

    dotto dei gruppi di monodromia di due funzioni algebriche f(x) e g(x) sui

    gruppi di monodromia di f(x) + g(x), f(x)− g(x), f(x) · g(x) e f(x)/g(x).

    (2) C’è un omomorfismo suriettivo con nucleo commutativo del gruppo di

    monodromia di n√f(x) sul gruppo di monodromia di f(x).

    (3) Le funzioni algebriche y = y(x) costruite componendo le costanti e la

    funzione x con le quattro operazioni elementari, +, −, ×, ÷, e le estrazioni

    di radici n√

    cioè le funzioni definite da esplicite formule algebriche radicali,

    hanno gruppi di monodromia risolubili.

    Dimostrazione: Mostriamo che c’è un omomorfismo suriettivo di un

    sottogruppo H del prodotto F × G dei gruppi di monodromia di f(x) e

    g(x) sul gruppo di monodromia K di f(x) + g(x). Se f(x) e g(x) hanno

    rispettivamente m e n rami {fi(x)} e {gj(x)}, con punti di diramazione {pk},

    per costruire la superficie di Riemann di f(x) + g(x) si prendono m · n copie

    del piano complesso, con tagli da pk a ∞. Si denotano i fogli con gli indici

    (i, j), 1 ≤ i ≤ m e 1 ≤ j ≤ n, e sul foglio (i, j) si assume che f(x) + g(x)

    valga fi(x) + gj(x). Se sui bordi inferiore e superiore di un taglio i valori

    44

  • di fi(x) + gj(x) e fh(x) + gk(x) coincidono, si incolla il taglio inferiore del

    foglio (i, j) al taglio superiore del foglio (h, k). Infine, se fi(x) + gj(x) =

    fh(x) + gk(x) per ogni x, si elimina un foglio incollando il foglio (i, j) sul

    foglio (h, k). Ad ogni cammino in C − {pk} è associata una permutazione

    dei rami {fi(x)} ed una permutazione dei rami {gj(x)}, quindi anche una

    permutazione di {fi(x) + gj(x)}. Se le funzioni f(x) e g(x) hanno punti di

    diramazione in comune, le permutazioni degli indici i e j possono non essere

    indipendenti. Se dei fogli sono stati incollati, alcune permutazioni non banali

    di {fi(x)} e {gj(x)} possono dare delle permutazioni banali di {fi(x)+gj(x)}.

    In ogni caso, c’è un omomorfismo suriettivo di un sottogruppo del prodotto

    dei gruppi di monodromia di f(x) e g(x) sul gruppo di monodromia di f(x)+

    g(x). La costruzione delle superfici di Riemann e dei gruppi di monodromia

    di f(x)− g(x), f(x) · g(x), e f(x)/g(x), è simile. Questo prova (1).

    Mostriamo che c’è un omomorfismo del gruppo di monodromia G din√f(x) sul gruppo di monodromia F di f(x), con un nucleo commutati-

    vo H. Se f(x) ha m rami {fi(x)}, allora n√f(x) ha m · n rami hi,j(x) =

    exp(2πij/n)hi(x), con hi(x) una particolare determinazione din√fi(x). I

    punti di diramazione di n√f(x) sono gli zeri, i poli, ed i punti di dirama-

    zione di f(x). Se girando intorno ad un punto di diramazione hi,j(x) si

    trasforma in hk,r(x), allora hi,j+s(x) = exp(2πis/n)hi,j(x) si trasforma in

    exp(2πis/n)hk,r(x) = hk,r+s(x), con addizioni degli indici modulo n. In par-

    ticolare, ad ogni permutazione dei rami {hi,j(x)} corrisponde una permuta-

    zione dei rami {fi(x)} ed è possibile definire un omomorfismo del gruppo di

    monodromia di n√f(x) sul gruppo di monodromia di f(x). Il nucleo di questo

    omomorfismo sono le permutazioni che fissano il primo indice di {hi,j(x)}, che

    sono delle moltiplicazioni per exp(2πis/n) per un qualche s. Se σ e τ sono due

    permutazioni nel nucleo tali che σ(i, j) = (i, j+ s) e τ(i, j) = (i, j+ t), allora

    45

  • στ(i, j) = τσ(i, j) = (i, j + s+ t). Quindi il nucleo di questo omomorfismo è

    commutativo. Questo prova (2).

    Infine, (3) è un corollario di (1) e (2). Somme prodotti e radici di funzioni

    algebriche con gruppi di monodromia risolubili hanno gruppi di monodromia

    risolubili. Componendo le costanti e la funzione x, che hanno monodromia

    banale, con somme prodotti e radici, si ottengono gruppi di monodromia

    risolubili. �

    Per esempio, la funzione y =√x +√x è soluzione dell’equazione (y −

    √x)2 = x, cioè y2(y2 − 4x) = 0. L’equazione si spezza in y = 0, y = 0,

    y2 − 4x = 0, e la superficie di Riemann è disconnessa in tre parti. Su due

    fogli la funzione prende il valore zero, sugli altri due fogli il valore ±2√x. Il

    gruppo di monodromia è S(2).

    Un altro esempio è la formula di Cardano per le soluzioni dell’equazione

    di terzo grado y3 − 3y + 2x = 0,

    y =3

    √−x− 2

    √x2 − 1 + 3

    √−x+ 2

    √x2 − 1.

    Questa è una formula radicale esplicita, quindi ha un gruppo di monodromia

    risolubile. La superficie di Riemann ed il suo gruppo di monodromia possono

    essere costruiti passo dopo passo seguendo la ricetta nel teorema, da x a

    2√x2 − 1, poi a 3

    √−x± 2

    √x2 − 1 ed a 3

    √−x− 2

    √x2 − 1 + 3

    √−x+ 2

    √x2 − 1,...

    Con opportune trasformazioni algebriche in una generica equazione di grado

    5 si possono eliminare i termini di grado 4, 3, 2. In particolare, l’equazione

    az5 + bz4 + cz3 + dz2 + ez + f = 0 si può ridurre a y5 + y + x = 0, con

    x funzione radicale di a, b, c, d, e, f . Il gruppo di monodromia di questa

    equazione è S(5), e questo gruppo non è risolubile.

    Dal teorema precedente segue immediatamente che se f(x) e g(x) sono

    funzioni algebriche con gruppi di monodromia commutativi, allora anche i

    46

  • gruppi di monodromia di f(x) + g(x), f(x) − g(x), f(x) · g(x), e f(x)/g(x)

    sono commutativi. Il gruppo di monodromia di n√x− α è ciclico di ordine n.

    Quindi il gruppo di monodromia di n√P (x)/Q(x) con P (x) e Q(x) polinomi è

    commutativo. Il gruppo di monodromia dell’equazione yn−ny+(n−1)x = 0 è

    il gruppo simmetrico S(n), che non è commutativo se n > 2. Questo implica

    che nella formula risolutiva delle equazioni di terzo e quarto grado non si

    possono eliminare i radicali inscatolati.

    47

  • 48

  • Capitolo 6

    Risoluzioni analitiche di

    equazioni algebriche

    La dimostrazione del teorema di Abel Ruffini suggerisce la possibilità di ri-

    solvere le equazioni algebriche sostituendo ai radicali delle altre funzioni con

    monodromie appropriate. François Viète (1540-1603) scopre una semplice

    relazione tra il caso irriducibile delle equazioni di terzo grado con tre radici

    reali e la trisezione dell’angolo. La sostituzione x = y − a/3 trasforma l’e-

    quazione x3 + ax2 + bx + c = 0 in y3 + dy + e = 0 e, se d < 0, l’ulteriore

    sostituzione y =√−4d/3z trasforma l’equazione in z3 − 3/4z − f/4 = 0.

    L’equazione ha tre radici reali se e solo se |f | < 1. Per l’identità trigo-

    nometrica cos3(ϑ) − 3/4 cos(ϑ) − 1/4 cos(3ϑ) = 0, posto cos(3ϑ) = f , si

    ottiene z = cos(ϑ) = cos(arccos(f)/3). La formula cosh3(ϑ)− 3/4 cosh(ϑ)−

    1/4 cosh(3ϑ) = 0 permette di risolvere le equazioni di terzo grado con una

    radice reale. Nel 1854 Enrico Betti (1823-1892) pubblica la memoria ”Un

    teorema sulla risoluzione analitica delle equazioni algebriche”.

    Teorema (Betti): Le radici di ogni equazione algebrica F (y) + xf(y) =

    0, se si riguardano i coefficienti di essa come funzioni lineari di una variabile

    49

  • x, soddisfano sempre una equazione differenziale della forma

    dx√ϕ(x)

    =ϑ(y)dy√ψ(y)

    ,

    dove ϕ(x) è la funzione che deve annullarsi affinché la proposta abbia ra-

    dici eguali, e ϑ(y) e ψ(y) sono funzioni razionali ed intere di y, che non

    contengono x.

    Dimostrazione: Per semplificare l’esposizione, presentiamo la dimostra-

    zione su degli esempi espliciti. Iniziamo con l’equazione di terzo grado

    4y3 − 3y + x = 0.

    I punti di diramazione sono soluzioni del sistema 4y3 − 3y + x = 0,12y2 − 3 = 0, {±(1, 12)}.Sviluppando l’equazione intorno a questi punti critici si ottiene

    1− x = 4y3 − 3y + 1 = (1 + y)(1− 2y)2,

    1 + x = −4y3 + 3y + 1 = (1− y)(1 + 2y)2,

    1− x2 = (1− y2)(1− 4y2)2.

    Inoltre, derivando l’equazione 4y3 − 3y + x = 0 si ottienedx

    dy= 3(1− 4y2),

    x(0) = 0.

    Ma 1− 4y2 =√

    1− x2/√

    1− y2. Quindi,∫ x0

    dx√1− x2

    =

    ∫ y0

    3dy√1− y2

    ,

    arcsin(x) = 3 arcsin(y),

    y = sin

    (arcsin(x)

    3

    ).

    50

  • In particolare, come osservato da Viète, le equazioni di terzo grado si

    possono risolvere con le funzioni trigonometriche.

    Consideriamo ora l’equazione di quinto grado

    4y5 − 5y4 + x = 0.

    I punti di diramazione sono soluzioni del sistema 4y5 − 5y4 + x = 020y4 − 20y3 = 0 {(0, 0), (0, 0), (0, 0), (1, 1)}.Sviluppando l’equazione intorno a questi punti critici, si ottiene

    x = 4y5 − 5y4 = y4(4y − 5),

    1− x = 4y5 − 5y4 + 1 = (y − 1)2(4y3 + 3y2 + 2y + 1),

    x(x− 1) = y4(y − 1)2(4y − 5)(4y3 + 3y2 + 2y + 1).

    y6(y − 1)2 = x(x− 1)y2

    (4y − 5)(4y3 + 3y2 + 2y + 1).

    Inoltre, derivando l’equazione 4y5 − 5y4 + x = 0, si ottienedx

    dy= −20y3(y − 1),

    x(a) = 5a4 − 4a5.

    Sostituendo a y3(y − 1) l’espressione sopra ottenuta, si arriva a∫ x5a4−4a5

    dx√x(x− 1)

    =

    ∫ ya

    −20ydy√(4y − 5)(4y3 + 3y2 + 2y + 1)

    .

    L’integrale con la x è un logaritmo e quello con la y è ellittico. Dalla

    polidromia degli integrali, segue la molteplicità delle soluzioni. Il polinomio

    di quarto grado in y può anche essere trasformato in uno di terzo con il

    cambio di variabile 4y − 5 = 1/z. Quindi le equazioni di quinto grado si

    possono risolvere con funzioni ellittiche a parametro logaritmico. �

    51

  • Un altro metodo per risolvere analiticamente una equazione algebrica è

    sviluppare in serie di potenze la soluzione. Nel 1757 Johann Heinrich Lambert

    (1728-1777) trova degli sviluppi in serie di potenze per soluzioni di equazioni

    trinomie zn − z + t = 0 e nel 1769 Lagrange trova gli sviluppi in serie di

    soluzioni di equazioni z = x + yϕ(z), con ϕ(0) = 0. Si tratta di trovare

    lo sviluppo di Taylor centrato in (x, 0) e valutato in (x, y) della soluzione

    z = z(x, y) di questa equazione. Derivando l’equazione si ottiene

    (1− yϕ′(z))∂z∂y

    = ϕ(z),

    (1− yϕ′(z))∂z∂x

    = 1.

    Da queste formule si ricava che per ogni Φ(z) e Ψ(z) con Φ(0) = Ψ(z) = 0,

    ∂x

    (Φ(z)

    ∂yΨ(z)

    )=

    ∂y

    (Φ(z)

    ∂xΨ(z)

    ).

    Poi, per induzione,

    ∂k

    ∂ykΨ(z) =

    ∂k−1

    ∂xk−1

    (ϕk(z)

    ∂xΨ(z)

    ).

    Poiché z = x se y = 0, sviluppando Ψ(z) in serie di potenze di y si ottiene

    Ψ(z(x, y)) = Ψ(x) ++∞∑k=1

    yk

    k!

    ∂k−1

    ∂xk−1

    (ϕk(x)

    ∂xΨ(x)

    ).

    Se ϕ(z) e Ψ(z) sono funzioni analitiche, le derivate che compaiono nella

    formula crescono al più come ckk!, quindi la serie converge almeno per y

    abbastanza piccolo. In particolare, una generica equazione algebrica azN +

    bzN−1 + ...+ cz+ d = 0 con dei cambi di variabili si può riportare alla forma

    z = 1 + (αz2 + ...+ βzN).

    Per il teorema della funzione implicita, in un intorno di α = ... = β = 0

    c’è una soluzione analitica z = z(α, .., β) con z(0, .., 0) = 1 e, per la formula

    52

  • di Lagrange con x = y = 1 e ϕ(z) = αz2 + ...+ βzN ,

    z = 1 ++∞∑n=1

    dn−1

    dxn−1

    ((αx2 + ...+ βxN)n

    n!

    ) ∣∣∣∣x=1

    .

    I termini ( ddx

    )n−1 (αx2+...+βxN )n

    n!

    ∣∣x=1

    sono polinomi omogenei di grado n in

    α, ..., β. In particolare, la soluzione dell’equazione trinomia z = 1 + tzN è

    z = 1 ++∞∑n=1

    dn−1

    dxn−1

    (tnxNn

    n!

    ) ∣∣∣∣x=1

    = 1 ++∞∑n=1

    Nn(Nn− 1)...(Nn− n+ 2)n!

    tn.

    Il rapporto tra i coefficienti di due potenze successive tn+1 e tn è una

    funzione razionale di n, quindi la serie è ipergeometrica. In particolare,

    una generica equazione di quinto grado si può ricondurre con trasformazioni

    algebriche alla forma z5 − z + t = 0 e lo sviluppo in serie della soluzione è

    z =+∞∑k=0

    (5k

    k

    )t4k+1

    4k + 1.

    Anche le equazioni trinomie zn + zm + t = 0 si possono risolvere in mo-

    do simile. Riassumendo, per risolvere le equazioni di primo grado bastano

    le quattro operazioni elementari, somme sottrazioni prodotti divisioni. Le

    equazioni di secondo, terzo e quarto grado si possono risolvere con le quattro

    operazioni elementari più le radici, che sono le funzioni z = ζ(t) definite dal-

    l’equazione zn − t = 0. Per risolvere le equazioni di quinto grado si possono

    utilizzare gli iper radicali definiti dalla funzione z = ϕ(t) con z5 + z + t = 0,

    per le equazioni di sesto grado la funzione di due variabili z = ψ(u, v) con

    z6 + z2 + uz + v = 0, e cos̀ı per le equazioni di grado sette, otto, nove,.... Il

    tredicesimo dei 23 problemi presentati al congresso internazionale dei mate-

    matici del 1900 da David Hilbert (1862-1943) chiede se sia possibile ottenere

    la soluzione z = ψ(u, v, w) dell’equazione z7 + z3 + uz2 + vz + w = 0 per

    superposizione di funzioni di due variabili.

    53

  • Figura 6.1: Il risolutore meccanico di equazioni algebriche di J. Segner (1704-

    1777), nella ”Enciclopedia” di Diderot e D’Alembert.

    54