edición digital para la biblioteca digital del...

2

Edición digital para la Biblioteca Digital del ILCE

Título original: An Introduction to Mathematics

© De la traducción: Emilio Méndez Pinto

Primera edición: Williams & Norgate, 1910

D. R. © Williams & Norgate, 1910

ISBN: B000L5WA8O

Prohibida su reproducción por cualquier medio mecánico o

eléctrico sin la autorización por escrito de los coeditores.

3

CAPÍTULO I

LA NATURALEZA ABSTRACTA DE LAS MATEMÁTICAS

El estudio de las matemáticas es propicio para comenzar en decepción. Las

importantes aplicaciones de la ciencia, el interés teórico de sus ideas, y el rigor lógico

de sus métodos, generan la expectativa de una rápida introducción a los procesos de

mayor interés. Se nos dice que con su ayuda se pesan las estrellas y se cuentan los

billones de moléculas en una gota de agua. Aun así, como el fantasma del padre de

Hamlet, esta gran ciencia elude los esfuerzos de nuestras armas mentales para

comprenderla - “está aquí, está aquí, se ha ido”* - y lo que vemos no nos sugiere la

misma excusa de ilusión que fue suficiente para el fantasma, a saber, que algo es

demasiado noble para nuestros primitivos o brutos métodos. “Una exposición de

violencia”, podría decirse, es lo que “ofrecen” los resultados triviales que ocupan las

páginas de algunos tratados de matemáticas elementales.

La razón de esta falla de la ciencia para hacer notar su reputación es que sus

ideas fundamentales no son explicadas al estudiante de forma separada a los

procedimientos técnicos que fueron inventados para facilitar su exacta presentación en

casos particulares. De acuerdo con esto, el desdichado estudiante se encuentra luchando

para adquirir el conocimiento de una masa de detalles que no son iluminados por

ninguna concepción general. Sin duda alguna, la facilidad técnica es un primer requisito

para una valiosa actividad mental: fracasaríamos al intentar apreciar el ritmo de Milton†,

o la pasión de Shelley‡, si consideráramos necesario deletrear las palabras sin estar

seguros de las formas de las letras individuales. En este sentido no hay un camino real

hacia el aprendizaje. Pero constituye igualmente un error el limitar la atención a los

procesos técnicos, excluyendo la consideración sobre las ideas generales. Aquí yace el

camino a la pedantería.

El objetivo de los siguientes capítulos no es enseñar matemáticas, sino permitir a

los alumnos, desde el principio de sus cursos, saber en qué consiste esta ciencia, y por

* Whitehead alude a las líneas 155-57 del acto 1, escena 1 de la obra de Shakespeare Hamlet. En esta parte de la obra, el fantasma aparece a algunos personajes (Horacio, Bernardo, Marcelo) y de pronto, igual de rápido que aparece, desaparece. Nota del Traductor. † John Milton (1608-1674) poeta inglés. Nota del Traductor ‡ Percy Bysshe Shelley (1792-1822) poeta y ensayista inglés. Nota del traductor.

4

qué son necesarios los fundamentos del pensamiento exacto cuando éste es aplicado a

los fenómenos naturales. Toda alusión en lo que sigue a deducciones detalladas sobre

cualquier parte de esta ciencia será introducida solamente para propósitos de

ejemplificar, y se tendrá cuidado para hacer que el argumento general sea comprensible,

incluso si algunos procesos técnicos y algunos símbolos que el lector no comprenda son

citados como tentativa de ilustración.

El primer conocimiento que la mayoría de las personas tienen con las

matemáticas se da a partir de la aritmética. Que dos y dos hacen cuatro es usualmente

tomado como una simple proposición matemática sobre la que cualquiera ha escuchado.

La aritmética, por lo tanto, es un buen tema a considerar para descubrir, si es posible, la

más obvia característica de esta ciencia. Ahora bien, el primer hecho notable sobre la

aritmética es que ésta se aplica a todo, a sabores y a sonidos, a manzanas y a ángeles, a

las ideas de la mente y a los huesos del cuerpo. La naturaleza de las cosas es

perfectamente indiferente, porque para todas las cosas es verdad que dos y dos hacen

cuatro. Así, debemos hacer notar que la principal característica de las matemáticas es

que trata con propiedades e ideas que son aplicables a las cosas sólo por el hecho de ser

cosas, e independientemente de cualquier sentimiento, emoción o sensación particular,

en cualquier modo conectado con ellas. Esto es lo que se entiende al llamar a las

matemáticas una ciencia abstracta.

El resultado al que hemos llegado requiere de atención. Es natural pensar que

una ciencia abstracta no puede ser de mucha importancia para los asuntos de la

existencia humana, porque ha omitido considerar todas las cosas de interés real. Debe

ser recordado que Swift, en su descripción del viaje de Gulliver a Laputa, tiene dos

perspectivas sobre este punto. Describe a los matemáticos de ese país como tontos e

inútiles soñadores, cuya atención debe ser continuamente despertada por las mujeres.

También, el sastre matemático mide su altura con un cuadrante, y deduce sus otras

dimensiones con una regla y un compás, produciendo trajes con ajustes defectuosos. Por

otra parte, los matemáticos de Laputa, debido a su magnífica invención de una isla

magnética flotando en el aire, gobiernan el país y mantienen el poder sobre los otros

pobladores. Swift, de hecho, vivió en una época completamente inadecuada para

burlarse de las matemáticas contemporáneas. Los Principios de Newton se acababan de

escribir, uno de los grandes impulsos que han transformado el mundo moderno. Swift

podría también haberse reído en un terremoto.

5

Pero una simple lista de los logros de las matemáticas no es suficiente para

entender su importancia. Vale la pena pensar en la razón principal de por qué las

matemáticas, debido a su carácter abstracto, deben ser siempre consideradas como una

de las más importantes cuestiones del pensamiento. Intentemos hacer evidente por qué

las explicaciones del orden de los eventos necesariamente tienden a ser matemáticas.

Consideremos cómo todos los eventos están interconectados. Cuando vemos el

relámpago, escuchamos el trueno; cuando escuchamos el viento, vemos las olas del mar;

en el frío otoño, vemos las hojas caer. En todos lados el orden reina, así que cuando

algunas circunstancias han sido notadas, podemos prever que otras también estarán

presentes. El progreso de la ciencia consiste en observar estas interconexiones y en

demostrar, con una ingenuidad paciente, que los eventos de este siempre cambiante

mundo no son sino ejemplos de unas pocas conexiones o relaciones generales llamadas

leyes. Observar qué es general en lo particular y qué es permanente en lo transitorio es

el objetivo del pensamiento científico. Bajo el ojo de la ciencia, la caída de una

manzana, el movimiento de un planeta alrededor del sol, y el aferre de la atmósfera a la

Tierra, son vistos como ejemplos de la ley de la gravedad. Esta posibilidad de

desenvolver las más complejas y evanescentes circunstancias en varios ejemplos de

leyes permanentes constituye la idea que rige al pensamiento moderno.

Ahora pensemos en el tipo de leyes que queremos a fin de que se realice este

ideal científico. Nuestro conocimiento de los hechos particulares del mundo lo

obtenemos de nuestras sensaciones. Nosotros vemos, y escuchamos, y probamos, y

olemos, y sentimos lo caliente y lo frío, y empujamos, y frotamos, y sentimos dolor y

comezón. Estas son sólo nuestras sensaciones personales: mi dolor de muelas no puede

ser tu dolor de muelas, y mi vista no puede ser tu vista. Pero nosotros atribuimos el

origen de estas sensaciones a relaciones entre las cosas que forman el mundo externo.

Así, el dentista no extrae el dolor de muela, sino la muela. Y no solamente eso, sino que

también nos empeñamos en imaginar al mundo como un conectado conjunto de cosas

que subyacen en todas las percepciones de todas las personas. No existe un mundo de

cosas para mis sensaciones y otro para las tuyas, sino un mundo en el que ambos

existimos. Es la misma muela para el paciente y para el dentista. También escuchamos y

tocamos el mismo mundo que ambos vemos.

Es fácil, por lo tanto, entender que queremos describir las conexiones entre estas

cosas externas en algún modo que no dependan de sensaciones particulares, ni de todas

las sensaciones de alguna persona en particular. Las leyes satisfechas por el curso de los

6

eventos en el mundo de las cosas externas deben ser descritas, si es posible, en una

forma neutral y universal, lo mismo para los ciegos que para los sordos, y lo mismo

para los seres con facultades mayores que las nuestras que para seres normales.

Pero cuando hemos dejado de lado nuestras sensaciones inmediatas, la parte más

útil - debido a su claridad, capacidad de definición y universalidad - que nos queda se

compone de nuestras ideas generales de las propiedades formales y abstractas de las

cosas; de hecho, de las ideas matemáticas abstractas mencionadas arriba. Así, ha

sucedido entonces que, paso por paso y sin darse cuenta del significado total del

proceso, la humanidad ha llevado a cabo la búsqueda de una descripción matemática de

las propiedades del universo, porque de este modo es como se puede tener una idea

general del curso de los eventos, libre de referencia a personas particulares o a tipos

particulares de sensación. Por ejemplo, podría preguntarse en una cena: “¿Qué es lo que

subyace en mi sensación de vista, en la tuya de tacto, y en la suya de gusto y olor?”,

siendo la respuesta “una manzana”. Pero en su análisis final, la ciencia busca describir

una manzana en términos de las posiciones y movimientos de las moléculas, una

descripción que nos ignora a mí, a ti y a cualquiera, y que también ignora a la vista, al

tacto, al sabor y al olor. De esta forma, las ideas matemáticas, debido a que son

abstractas, suministran lo que es querido por una descripción científica del curso de los

eventos.

Este punto ha sido usualmente mal comprendido, porque ha sido pensado de una

manera demasiado estricta. PITÁGORAS tuvo un vislumbre de él cuando proclamó que

el número era la fuente de todas las cosas. En los tiempos modernos la creencia de que

la explicación definitiva de todas las cosas se encuentra en la mecánica newtoniana fue

un presagio de la verdad de que toda ciencia que evoluciona hacia la perfección se

vuelve matemática en sus ideas.

7

CAPÍTULO II

VARIABLES

Las matemáticas comenzaron a ser ciencia cuando alguien, probablemente un

griego, probó proposiciones sobre cualquier o sobre algunas cosas, sin especificaciones

definidas de cosas particulares. Estas proposiciones fueron primeramente enunciadas

por los griegos para la geometría; y, de acuerdo con esto, la geometría fue la gran

ciencia matemática griega. Después del nacimiento de la geometría, pasaron siglos para

que el álgebra empezara a desenvolverse como rama fundamental de las matemáticas, a

pesar del hecho de que algunos matemáticos griegos hicieron algunas tenues

anticipaciones de la materia.

Las ideas de cualquier y algunos son introducidas en el álgebra usando letras, en

lugar de los números definidos de la aritmética. De esta forma, en lugar de decir que

2+3=3+2, en el álgebra generalizamos y decimos que, si x e y representan a cualesquiera

dos números, entonces x+y=y+x. De nuevo, en lugar de decir que 3>2, generalizamos y

decimos que si x es cualquier número, existe algún número (o números) y tal que y>x.

Podemos observar de paso que esta última suposición - cuando es presentada en su

forma final - es una suposición de vital importancia, tanto para la filosofía como para las

matemáticas, porque por ella la noción del infinito es introducida. Tal vez esta

suposición requirió de la introducción de los números arábigos, gracias a lo cual el uso

de letras como representantes de números definidos ha sido completamente descartado

en las matemáticas, a fin de que se muestre a los matemáticos la conveniencia técnica

del uso de letras para las ideas de cualquier número y de algún número. Los romanos

hubieran establecido el número del año en que esto fue escrito en la forma MDCCCCX,

mientras que nosotros lo escribimos como 1910, dejando las letras para otros usos. Pero

esto es simplemente una especulación. Después del nacimiento del álgebra, el cálculo

diferencial fue inventado por NEWTON y por LEIBNIZ, y después hubo una pausa en

el progreso de la filosofía del pensamiento matemático en lo que a estas nociones

concierne; y ha sido en los últimos años cuando se ha visto cuan fundamentales las

nociones de cualquier y alguno son para la naturaleza de las matemáticas, con el

consiguiente resultado de dar paso a nuevos temas para la exploración matemática.

8

Hagamos ahora algunas simples declaraciones algebraicas, con el objetivo de

comprender de manera exacta cómo es que estas ideas fundamentales tienen lugar.

(1) Para cualquier número x, x+2=2+x;

(2) Para algún número x, x+2=3;

(3) Para algún número x, x+2>3.

El primer punto a destacar es el de las posibilidades contenidas en el significado

de algún, como se usa aquí. Como x+2=2+x para cualquier número x, es verdad para

algún número x. Así, como usamos aquí, algún no excluye a cualquiera. De nuevo, en

el segundo ejemplo, existe, de hecho, solamente un número x, tal que x+2=3, a saber,

solamente el número 1. Así, algún puede ser solamente un número. Pero en el tercer

ejemplo, cualquier número x que sea más grande que 1 resulta en x+2>3. Por lo tanto

hay un número infinito de números que responden a algún número en este caso.

Entonces algún puede ser cualquier cosa entre cualquier y solamente uno, incluyendo a

estos dos limitados casos.

Es natural reemplazar las declaraciones (2) y (3) por las preguntas:

(2’) Para qué número x es x+2=3;

(3’) Para qué números x es x+2>3.

Considerando a (2’), 32 =+x es una ecuación, y es fácil ver que su solución es

123 =−=x . Cuando hemos hecho la pregunta implícita en la declaración de la

ecuación 32 =+x , x es llamada una incógnita. El objetivo de la solución de la ecuación

es la determinación de la incógnita. Las ecuaciones son de gran importancia para las

matemáticas, y parece como si (2’) ejemplificara una idea más completa y fundamental

que la idea de la declaración original (2). Esto, sin embargo, es un completo error. La

idea de la “variable” indeterminada, como ocurre con el uso de “algún” y “cualquier”,

es la realmente importante en las matemáticas; aquella idea de la “incógnita” en una

ecuación, que tiene que ser resuelta lo más rápido posible, es sólo para un uso

subordinado, aunque por supuesto es muy importante. Una de las causas de la aparente

trivialidad de gran parte del álgebra elemental es la preocupación de los libros de texto

por la solución de ecuaciones. La misma observación aplica a la solución de la

desigualdad (3’) en comparación con la declaración original (3).

Pero la mayoría de las fórmulas interesantes, especialmente cuando la idea de

algún está presente, involucran a más de una variable. Por ejemplo, la consideración de

los pares de números x e y (fraccionarios o integrales) que satisfacen x+y=1 implica la

idea de dos variables correlacionadas, x e y. Cuando dos variables están presentes,

9

ocurren los mismos dos tipos principales de declaración. Por ejemplo, (1) para

cualquier par de números, x e y, x+y=y+x, y (2) para algunos pares de números, x e y,

x+y=1.

El segundo tipo de declaración invita a la consideración sobre el agregado de los

pares de números que son unidos por alguna relación fija - en el caso dado, por la

relación x+y=1. Un uso de las fórmulas del primer tipo, verdadero para cualquier par de

números, es que por ellos (el uso de las fórmulas del primer tipo) las fórmulas del

segundo tipo pueden ser expuestas en un número indefinido de formas equivalentes. Por

ejemplo, la relación x+y=1 es equivalente a las relaciones

y+x=1, )( yx − +2y=1, 6x+6y=6,

etcétera. Así, un matemático hábil usa esa forma equivalente de relación que es la más

conveniente para su propósito inmediato.

No es en general verdadero que, cuando un par de términos satisface alguna

relación fija, si uno de los términos es dado, el otro es también definitivamente

determinado. Por ejemplo, cuando x e y satisfacen y2=x, si x=4, y puede ser ± 2, así,

para cualquier valor positivo de x existen valores alternativos para y. También en la

relación x+y>1, cuando o x o y son dadas, un número indefinido de valores permanece

abierto para el otro.

Hay otro punto importante que debe ser notado. Si nos restringimos a los

números positivos, ya sean integrales o fraccionales, al considerar la relación x+y=1,

entonces, si x o y son mayores a 1, no existe ningún número positivo que el otro pueda

asumir para satisfacer la relación. De esta forma, el “campo” de la relación para x está

restringido a números menores que 1, y similarmente para el “campo” abierto a y. De

nuevo, consideremos los números integrales solamente, ya sean positivos o negativos, y

tomemos la relación y2=x, satisfecha por pares de tales números. Entonces cualquier

valor integral que sea dado a y, x puede asumir un valor integral correspondiente. Así

que el “campo” para y es irrestricto entre estos enteros positivos o negativos. Pero el

“campo” para x está restringido en dos formas. En primer lugar, x tiene que ser positivo,

y, en segundo lugar, como y es un integral (o entero), x debe ser un cuadrado perfecto.

De acuerdo con esto, el “campo” para x está restringido al conjunto de enteros 12, 22, 32,

42, etcétera, por ejemplo, a 1, 4, 9, 16, etcétera.

El estudio de las propiedades generales de una relación entre pares de números

es sumamente facilitado por el uso de un diagrama construido así:

10

Fig. 1

Dibuja dos líneas 0X y 0Y en ángulos rectos; sea cualquier número x

representado por x unidades (en cualquier escala) de longitud a lo largo de 0X, cualquier

número y representado por y unidades (en cualquier escala) de longitud a lo largo de 0Y.

Así, si 0M, a lo largo de 0X, es x unidades en longitud, y 0N, a lo largo de 0Y, es y

unidades en longitud, al completar el paralelogramo 0MPN encontramos un punto P que

corresponde al par de números x e y. Para cada punto de ahí corresponde un par de

números, y para cada par de números de ahí corresponde un punto. El par de números

son llamados coordenadas del punto. Entonces los puntos cuyas coordenadas satisfacen

alguna relación fija pueden ser indicados en una forma conveniente, al dibujar una línea,

si todos ellos se encuentran en una línea, o al sombrear un área si todos ellos son puntos

en un área. Si la relación puede ser representada por una ecuación tal como x+y=1, o

y2=x, entonces los puntos se encuentran en una línea, que es recta en el primer caso y

curva en el último. Por ejemplo, considerando solamente números positivos, los puntos

cuyas coordenadas satisfacen x+y=1 se encuentran en la línea recta AB en la Fig. 1,

donde 0A=1 y 0B=1. Este segmento de la línea recta AB da una representación pictórica

de las propiedades de la relación bajo la restricción a los números positivos.

Otro ejemplo de una relación entre dos variables se consigue al considerar las

variaciones en la presión y en el volumen de una masa dada de alguna sustancia gaseosa

- tal como el aire, el gas-carbón, o el vapor - en una temperatura constante. Sea v el

11

número de pies cúbicos en su volumen y p su presión en libras de peso por pulgada

cuadrada. Entonces la ley, conocida como la ley de BOYLE, expresando la relación

entre p y v cuando ambas varían, es que el producto pv es constante, suponiendo

siempre que la temperatura no se altera. Supongamos, por ejemplo, que la cantidad de

gas y sus otras circunstancias son tales que podemos poner pv=1 (el número exacto en el

lado derecho de la ecuación no constituye una diferencia esencial).

Fig. 2 Entonces en la Fig. 2 tomamos dos líneas, 0V y 0P, en ángulos rectos y

dibujamos 0M a lo largo de 0V para representar v unidades de volumen, y 0N a lo largo

de 0P para representar p unidades de presión. Entonces el punto Q, que se obtiene al

completar el paralelogramo MONQ, representa el estado del gas cuando su volumen es

v pies cúbicos y su presión es p peso de libras por pulgada cuadrada. Si las

circunstancias de la porción de gas considerada son tales que pv=1, entonces todos estos

puntos Q que corresponden a cualquier estado posible de esta porción de gas deben

situarse en la línea curva ABC, que incluye todos los puntos para los cuales p y v son

positivos, y pv=1. Esta línea curva da una representación pictórica de la relación entre el

volumen y la presión. Cuando la presión es muy grande el correspondiente punto Q

debe estar cerca de C, o incluso más allá de C en la parte no dibujada de la curva;

entonces el volumen será muy pequeño. Cuando el volumen es grande Q estará cerca de

A, o más allá de A; y entonces la presión será pequeña. Nótese que un ingeniero o un

12

físico podrían querer saber la presión particular correspondiente a algún volumen

definitivo asignado. Entonces tenemos que determinar la incógnita p cuando v sea un

número conocido. Pero esto sólo sucede en casos particulares. Al considerar de manera

general las propiedades del gas y cómo se comportará, solamente tiene que tener en

mente la forma general de toda la curva ABC y sus propiedades generales. En otras

palabras, la idea realmente fundamental es la del par de variables que satisfacen la

relación pv=1. Este ejemplo ilustra cómo la idea de variables es fundamental, tanto en

las aplicaciones como en la teoría de las matemáticas.

13

CAPÍTULO III

MÉTODOS DE APLICACIÓN

Merece la pena pensar en la forma en la que la idea de las variables satisfaciendo

una relación ocurre en la aplicación de las matemáticas, y el dedicar un tiempo a esta

cuestión nos puede ayudar a aclarar nuestros pensamientos sobre el tema.

Empecemos con el ejemplo más simple posible:

Supongamos que los costos de construcción son 1s. por pie cúbico y que 20s.

son £1. En todas las circunstancias complejas que atañen a la construcción de una nueva

casa, entre las que se encuentran las sensaciones y emociones del dueño, del arquitecto,

del constructor, de los trabajadores, de los espectadores, mientras la casa es construida

hasta el final, esta fija correlación se da, por la ley asumida, entre el contenido cúbico y

el costo para el dueño, es decir, que si x es el número de pies cúbicos, y £y el costo,

entonces 20y=x. Esta correlación de x e y está supuesta para ser verdadera para la

construcción de cualquier casa por cualquier dueño. También el volumen de la casa y el

costo no están supuestos a ser percibidos o aprehendidos a partir de cualquier sensación

o facultad particular, ni por cualquier hombre particular. Están establecidos bajo una

forma general y abstracta, con completa indiferencia hacia el estado mental del dueño

cuando éste tiene que pagar la cuenta.

Ahora pensemos un poco más en todo lo que esto significa. La construcción de

una casa implica un complicado conjunto de circunstancias. Es imposible empezar a

aplicar la ley, o incluso probarla, a menos que en el curso general de los eventos sea

posible reconocer un conjunto definido de sucesos que constituyan un caso particular de

la construcción de la casa. En otras palabras, debemos reconocer una casa cuando la

vemos, y debemos reconocer los eventos que atañen a su construcción. Después, de

entre todos estos eventos, aislados en teoría del resto de la naturaleza, los dos elementos

del costo y del contenido cúbico deben ser determinables; y cuando ambos son

determinados, si la ley es cierta, deben de satisfacer la fórmula general

20y=x.

14

¿Pero es verdadera esta ley? Cualquiera que haya estado involucrado de alguna u otra

forma en la construcción de casas reconocerá que hemos puesto un costo demasiado

alto. Este precio solamente sería justo para un tipo muy caro de casa. Esto nos lleva a

considerar otra cuestión que debe ser aclarada. Cuando hacemos cálculos matemáticos

conectados con la fórmula 20y=x, nos es indiferente si la ley es verdadera o falsa. De

hecho, los significados asignados a x y a y, como un número de pies cúbicos y un

número de libras esterlinas, son indiferentes. Durante la investigación matemática

estamos simplemente considerando las propiedades de esta correlación entre un par de

números variables x e y. Nuestros resultados se aplicarán igualmente bien, si

interpretamos que y significa un número de pescadores y x el número de peces

capturados, de modo que la ley supuesta es que, en promedio, cada pescador captura

veinte peces. La certeza matemática de la investigación atañe solamente a los resultados

considerados al dar propiedades a la correlación 20y=x entre el par variable de números

x e y. No existe certeza matemática alguna acerca del costo de la construcción de

ninguna casa. La ley no es muy cierta y el resultado que da no es muy preciso. De

hecho, puede ser irremediablemente falso.

Ahora todo esto parece sin duda muy obvio. Pero en verdad, con casos más

complicados, no existe error más común que asumir que, debido a que se han hecho

prolongados y precisos cálculos matemáticos, la aplicación del resultado a algún hecho

de la naturaleza es absolutamente certera. La conclusión de ningún argumento puede ser

más certera que las suposiciones a partir de las cuales comienza. Todos los cálculos

matemáticos acerca del curso de la naturaleza deben partir de alguna ley asumida sobre

la naturaleza, parecida, por ejemplo, a la supuesta ley del costo de construcción

expresada arriba. De acuerdo con esto, por más que hayamos calculado de manera

precisa que algún evento debe ocurrir, la duda siempre queda: ¿Es verdadera esta ley?

Si la ley establece un resultado preciso, casi seguro que no es precisamente exacta; y

así, incluso en el mejor de los resultados, precisos según los cálculos, no es probable

que se produzca un resultado fiel. Pero esto significa que no tenemos una facultad capaz

de observar con una precisión ideal. Pero, después de todo, nuestras inexactas leyes

pueden ser suficientemente buenas.

Ahora pondremos nuestra atención en un caso real: NEWTON y la ley de la

gravedad. Esta ley establece que, cualesquiera dos cuerpos, se atraen entre sí con una

fuerza proporcional al producto de sus masas e inversamente proporcional al cuadrado

de la distancia entre ellos. Así, si m y M son las masas de los dos cuerpos, calculadas en

15

libras, por ejemplo, y d millas es la distancia entre ellos, la fuerza en uno u otro cuerpo,

debida a la atracción del otro dirigida hacia uno u otro, es proporcional a 2d

mM; en

consecuencia esta fuerza puede ser escrita como 2d

kmM, donde k es un número definido

dependiendo de la magnitud absoluta de esta atracción y también de la escala por la cual

escogemos medir las fuerzas. Es fácil ver que, si queremos calcular en términos de

fuerzas tales como el peso de una masa de 1 libra, el número que k representa debe ser

extremadamente pequeño; porque cuando m y M y d son cada una puestas igual a 1,

2d

kmM se convierte en la atracción gravitacional de dos masas iguales de 1 libra, a una

distancia de una milla, y esto es prácticamente inapreciable.

Sin embargo, hemos obtenido la fórmula para la fuerza de atracción. Si

llamamos a esta fuerza F, esto es F=k2d

mM, dada la correlación entre las variables F, m,

M y d. Todos conocemos la historia de cómo esto se descubrió. NEWTON, se dice,

estaba sentado en un huerto y observó la caída de una manzana, y entonces la ley de la

gravitación universal irrumpió en su mente. Puede ser que la formulación final de la ley

se le ocurrió en un huerto, así como también en otro lado - y tuvo que haber sido en otro

lado -. Pero para nuestros propósitos es más instructivo lidiar con la vasta cantidad de

pensamiento preparatorio, el producto de muchas mentes y muchos siglos, antes de que

esta exacta ley pudiera ser formulada. En primer lugar, el hábito matemático de la mente

y el procedimiento matemático explicado en los dos capítulos anteriores tuvo que haber

sido generado; de otra manera NEWTON nunca hubiera podido pensar en una fórmula

que representara la fuerza entre cualesquiera dos masas a cualquier distancia. Por otra

parte, ¿cuáles son los significados de los términos empleados: fuerza, masa, distancia?

Tomemos el más simple de estos términos, la distancia. Parece muy obvio para nosotros

el concebir todas las cosas materiales como formando un todo geométrico definido, tal

que las distancias de las distintas partes son medibles en términos de alguna medida de

longitud: una milla, una yarda, un metro. Este es prácticamente el primer aspecto de una

estructura material que nos está presente. Es el resultado gradual del estudio de la

geometría y de la teoría de la medición. Incluso ahora, en algunos casos, otros modos de

pensamiento son convenientes. En un país montañoso, por ejemplo, las distancias son

comúnmente medidas en horas. Pero dejando a un lado la distancia, los otros términos,

16

fuerza y masa, son mucho más oscuros. La exacta comprensión de las ideas que

NEWTON quería expresar y transmitir por estas palabras fue sumamente lenta y, en

realidad, NEWTON fue el primer hombre que dominó a fondo los principios generales

de la dinámica.

A lo largo de la Edad Media, bajo la influencia de ARISTÓTELES, la ciencia

era totalmente errónea. NEWTON tuvo la ventaja de aparecer después de una serie de

grandes hombres, especialmente GALILEO, en Italia, quien en los dos siglos anteriores

había reconstruido la ciencia y había inventado el modo correcto de pensar sobre ella.

NEWTON completó el trabajo de estos hombres. Después, finalmente, teniendo las

ideas de fuerza, masa y distancia de manera clara y distinta en su mente*, y consciente

de la importancia y relevancia de estas ideas a la caída de una manzana y a los

movimientos de los planetas, se le ocurrió la ley de la gravitación y probó que ésta era la

fórmula siempre satisfecha en estas distintas proposiciones.

El punto vital en la aplicación de las fórmulas matemáticas es tener ideas claras

y una estimación correcta de su relevancia a los fenómenos bajo observación. No menos

que nosotros, nuestros remotos ancestros estaban impresionados con la importancia de

los fenómenos naturales y con la atractiva posibilidad de tomar medidas enérgicas para

regular la secuencia de los eventos. Bajo la influencia de ideas irrelevantes elaboraron

ceremonias religiosas para ayudar al nacimiento de la nueva luna, y realizaron

sacrificios para salvar al sol durante la crisis de un eclipse. No existe ninguna razón para

pensar que ellos eran más estúpidos de lo que nosotros somos. Pero en esa época no

había oportunidad alguna para una lenta acumulación de ideas claras, distintas y

relevantes.

El tipo de camino por el cual las ciencias físicas se convierten en una forma

capaz de ser tratada por métodos matemáticos está ilustrado por la historia del

crecimiento gradual del electromagnetismo. Las tormentas eléctricas son eventos a gran

escala, que despiertan miedo en hombres y animales. Desde los primeros tiempos deben

haber sido objeto de locas y fantásticas hipótesis, aunque se puede dudar acerca de si

nuestros modernos descubrimientos científicos en conexión con la electricidad no son

más excéntricos que cualquiera de las explicaciones mágicas de los salvajes. Los

griegos sabían que el ámbar (en griego, electrón), cuando se frotaba, atraía luz y secaba

los cuerpos. En 1600 d. C., el Dr. GILBERT, de Colchester, publicó el primer trabajo

* Whitehead se refiere a la distinción cartesiana entre “ideas claras y distintas” e “ideas oscuras y confusas” en la mente. Nota del Traductor.

17

sobre el tema siguiendo el método científico. Hizo una lista de las sustancias que poseen

propiedades similares a aquellas del ámbar; tuvo también el crédito de haber conectado,

aunque sea de manera vaga, los fenómenos eléctricos y magnéticos. Al final del siglo

diecisiete y a lo largo del siglo dieciocho el conocimiento sobre este tema avanzó de

manera significativa. Se crearon máquinas eléctricas, de donde se obtenían chispas; y la

botella de Leyden* fue inventada, por lo que estos efectos fueron intensificados. Se

había llegado a un conocimiento organizado, pero todavía no habían sido descubiertas

ideas matemáticas relevantes sobre el tema. Franklin, en el año 1752, envió un cometa a

las nubes y probó que las tormentas eran eléctricas.

En el año 2634 a. C., los chinos utilizaban brújulas, pero nunca relacionaron su

uso con ideas teóricas. Los cambios realmente profundos en la vida humana han tenido

su origen en el conocimiento pensado como un fin en sí mismo. La brújula no fue

introducida en Europa hasta el final del siglo doce d. C., más de 3000 años después de

su primer uso en China. La importancia que la ciencia del electromagnetismo ha tenido

en cada rubro de la vida humana no se debe a una orientación práctica superior de los

europeos con respecto a los chinos, sino al hecho de que en occidente los fenómenos

eléctricos y magnéticos fueron estudiados por hombres dominados por intereses

abstractos y teóricos.

El descubrimiento de la corriente eléctrica se debe a dos italianos, GALVANI en

1780, y VOLTA en 1792. Este gran descubrimiento permitió estudiar bajo una nueva

perspectiva un número considerable de fenómenos. El mundo científico tenía ahora tres

separados, aunque relacionados, grupos de casos a la mano: los efectos de la

electricidad “estática” derivados de las máquinas eléctricas friccionales, el fenómeno

magnético, y los efectos causados por las corrientes eléctricas. Desde el final del siglo

dieciocho en adelante, estas tres líneas de investigación fueron rápidamente

interconectadas, y, de esta forma, la ciencia moderna del electromagnetismo fue

construida, e intenta ahora transformar la vida humana.

Aparecieron entonces las ideas matemáticas. Durante la década que va de 1780 a

1789, COULOMB†, en Francia, probó que los polos magnéticos se atraen o repelen

entre ellos en proporción al cuadrado inverso de sus distancias, y también que la misma

ley es válida para las cargas eléctricas - leyes curiosamente análogas a la de la

* Botella de vidrio que sirve como aparato para almacenar cargas eléctricas. Nota del Traductor. † Charles-Augustin de Coulomb (1736-1806). Físico e ingeniero francés. Nota del Traductor.

18

gravitación -. En 1820, OERSTED*, en Dinamarca, descubrió que las corrientes

eléctricas ejercen una fuerza sobre los imanes, casi inmediatamente después de que la

ley matemática de la fuerza fuera correctamente formulada por AMPÈRE, en Francia,

quien también probó que dos corrientes eléctricas ejercen fuerzas una sobre la otra. “La

investigación experimental por la cual AMPÈRE estableció la ley de la acción

mecánica entre las corrientes eléctricas es uno de los logros más brillantes de la

ciencia. Todo, teoría y experimento, parecen haber surgido, de manera completa y

armada, del cerebro del “Newton de la electricidad”. Es perfecta en forma, e

inatacable en precisión, y está expuesta en una fórmula a partir de la cual todos los

fenómenos pueden ser deducidos, y que debe siempre permanecer como la fórmula

principal de la electro-dinámica”.†

Las importantes leyes de inducción entre las corrientes y entre las corrientes y

los imanes fueron descubiertas por Michael FARADAY en 1831-32. A FARADAY se

le preguntó “¿Cuál es el uso de este descubrimiento?” y respondió “Cuál es el uso de un

niño: crecer para ser un hombre”. El niño de FARADAY creció y es ahora la base de

todas las aplicaciones modernas de la electricidad. FARADAY también reorganizó toda

la concepción teórica de esta ciencia. Sus ideas, que no han sido totalmente

comprendidas por el mundo científico, fueron extendidas y expresadas bajo una forma

matemática por CLERK MAXWELL en 1873. Como resultado de sus investigaciones

matemáticas, MAXWELL reconoció que, bajo ciertas condiciones, las vibraciones

eléctricas deben ser propagadas. Incluso una vez sugirió que las vibraciones que forman

la luz son eléctricas: esta sugerencia ha sido verificada, y ahora toda la teoría sobre la

luz es solamente una rama de la gran ciencia de la electricidad. También HERZ, en

Alemania, logró producir vibraciones eléctricas a partir de métodos eléctricos directos.

Sus experimentos son la base del telégrafo sin hilos.

En años más recientes, se han hecho nuevos descubrimientos fundamentales, y la

ciencia continúa creciendo en importancia teórica y en interés práctico. Este rápido

bosquejo de su progreso ilustra cómo, debido a la introducción gradual de ideas teóricas

relevantes, surgidas por experimentos y a su vez produciendo experimentos, hizo

posible que una masa de aislados e incluso triviales fenómenos estén ahora unidos en

una ciencia coherente, y en la cual los resultados de las abstractas deducciones

* Hans Christian Oersted (1777-1851). Físico y químico danés. Nota del Traductor. † Electricity and Magnetism, Clerk Maxwell, vol. II, cap. Iii.

19

matemáticas, comenzando desde una pocas leyes asumidas, suministraron la explicación

al complejo enredo del curso de los eventos.

Finalmente, yendo más allá de las ciencias particulares del electromagnetismo y

de la luz, podemos generalizar nuestro punto de vista aún más, y dirigir nuestra atención

al desarrollo de la física matemática, considerada como uno de los grandes hitos del

pensamiento científico. En primer lugar, ¿cuál es, en líneas generales, la historia de este

desarrollo?

La física matemática no comenzó como una ciencia, y tampoco fue el producto

de un grupo de hombres. Los pastores observaron los cielos, los burócratas del gobierno

en Mesopotamia y Egipto midieron las tierras, y los sacerdotes y los filósofos se

preguntaban acerca de la naturaleza de todas las cosas. La vasta masa de las operaciones

de la naturaleza aparecía como un conjunto de fuerzas misteriosas e indescifrables. “El

viento sopla cuando quiere soplar”* expresa la ignorancia sobre la existencia de reglas

estables surgidas de la sucesión de los fenómenos. Como ahora, la regularidad de los

eventos era patente. Pero no era posible establecer una interconexión entre ellos, y por

lo tanto no existía el conocimiento suficiente como para construir tal ciencia. Solamente

especulaciones separadas, algunos acercamientos a la naturaleza de las cosas,

constituyeron lo máximo que pudo haber sido producido.

Mientras tanto, las mediciones de la tierra habían producido la geometría, y las

observaciones de los cielos revelaron la regularidad exacta del sistema solar. Algunos

de los últimos sabios griegos, como ARQUÍMEDES, habían expresado puntos de vista

sobre los fenómenos elementales de la hidrostática y la óptica. De hecho,

ARQUÍMEDES, quien combinaba un genio para las matemáticas con una percepción

impresionante para la física, debe ser considerado - junto con NEWTON, quien vivió

dos mil años después - como uno de los fundadores de la física matemática. Vivió en

Siracusa, la gran ciudad griega de Sicilia. Se cuenta que cuando los romanos sitiaron el

lugar (en 210 a 212 d. C.), ARQUÍMEDES quemó sus barcos dirigiendo hacia ellos, a

través de espejos, los rayos del sol. La historia es altamente improbable, pero es sin

duda buena evidencia de la reputación que el genial griego se había ganado entre sus

contemporáneos gracias a sus conocimientos sobre la óptica. Al final de este cerco

romano, fue asesinado. De acuerdo con PLUTARCO, fue encontrado por un soldado

romano mientras estaba absorto en el estudio de un diagrama geométrico que había

* “The wind bloweth where it listeth” Whitehead se refiere al versículo 3:8 del evangelio según San Juan. Nota del Traductor.

20

trazado en el piso arenoso de su cuarto. Al no obedecer de inmediato las órdenes de su

captor, fue asesinado. Para dar crédito a los generales romanos, basta decir que habían

ordenado a los soldados perdonar la vida a ARQUÍMEDES. La evidencia sobre otra

historia de él es mucho más fuerte; porque el descubrimiento atribuido a él es propio de

un hombre con el talento matemático y la capacidad para la física de ARQUÍMEDES.

Por suerte, el descubrimiento es lo suficientemente simple como para ser explicado aquí

a detalle. Es uno de los mejores y más simples ejemplos del método de aplicación de las

ideas matemáticas a la física.

Hierón, rey de Siracusa, había enviado una cantidad de oro a un orfebre para que

formara el material de una corona. Sospechaba que los artesanos habían extraído algo

del oro y lo habían suplantado por otro metal menos valioso. Hierón envió la corona a

ARQUÍMEDES para que comprobara esta sospecha. En nuestros días, un número

indefinido de pruebas químicas hubieran resultado suficientes para estos propósitos.

Pero AQRQUÍMEDES tuvo que pensar sobre el tema sin estos instrumentos. La

solución le vino a la cabeza cuando estaba tomando un baño. Salió del baño y corrió por

las calles del palacio, gritando ¡Eureka! ¡Eureka! (¡Lo he encontrado! ¡Lo he

encontrado!). Este día, si supiéramos en qué fecha fue, debe de ser celebrado como el

día del nacimiento de la física matemática; la ciencia obtuvo su mayoría de edad cuando

NEWTON estaba sentado en la orquídea. ARQUÍMEDES había hecho un gran

descubrimiento. Observó que un cuerpo, cuando está inmerso en agua, es presionado

hacia arriba por el agua que lo rodea con una fuerza resultante igual al peso del agua

que desplaza. Esta ley puede ser teóricamente probada gracias a los principios

matemáticos de la hidrostática, y puede ser también verificada experimentalmente. Por

lo tanto, si W (libras) es el peso de la corona (como pesa en el aire), y w (libras) es el

peso del agua desplazada cuando la corona está completamente inmersa, wW − sería la

fuerza extra hacia arriba necesaria para mantener a la corona mientras se suspende en el

agua.

Ahora, esta fuerza hacia arriba puede ser fácilmente definida de manera precisa

si se pesa el cuerpo mientras se suspende en el agua, como se muestra en la figura tres.

Si

21

Fig. 3

los pesos en la escala de la derecha llegan a F (libras), entonces el peso aparente de la

corona en el agua es F (libras); y entonces tenemos

wWF −=

y entonces FWw −= ,

y w

W=

FW

W

− (A)

donde W y F son determinadas gracias a la fácil y bastante precisa operación de pesar.

Por lo tanto, gracias a la ecuación (A), w

W es conocida. Pero

w

W es la proporción del

peso de la corona al peso de un volumen igual de agua. Esta proporción es la misma

para cualquier pedazo de metal del mismo material: es ahora llamada la gravedad

específica del material, y depende solamente de la naturaleza intrínseca de la sustancia y

no de su forma o cantidad. De esta forma, para probar si la corona era de oro,

ARQUÍMEDES tuvo solamente que tomar un pedazo de oro puro (esta vez,

indiscutiblemente de oro puro) y encontrar su gravedad específica por el mismo

22

proceso. Si las dos gravedades específicas concuerdan, la corona es de oro puro; si no

concuerdan, significa que la corona del rey fue degradada.

Este argumento fue expuesto en toda su extensión, no solamente porque es el

primer ejemplo preciso de la aplicación de ideas matemáticas a la física, sino también

porque constituye un ejemplo perfecto y simple de cuál debe ser el método y el espíritu

científico de cualquier época. El descubrimiento de la teoría de gravedades específicas

es resultado de la mente de un genio de primer rango.

La muerte de ARQUÍMEDES a manos de un soldado romano representa

simbólicamente un cambio de orden mundial de primera magnitud: los teóricos griegos,

con su amor por la ciencia abstracta, fueron sustituidos en el liderazgo del mundo

europeo por los pragmáticos romanos. Benjamin Disraeli*, en una de sus novelas, ha

definido al hombre práctico como el hombre que practica los errores de sus antepasados.

Los romanos fueron una gran civilización, pero estuvieron maldecidos con la esterilidad

que se obtiene del pragmatismo. No mejoraron ni aumentaron el conocimiento de sus

ancestros, y todos sus avances estuvieron confinados a los menores detalles técnicos de

la ingeniería. No fueron lo suficientemente soñadores como para llegar a nuevos puntos

de vista que pudieran haber proporcionado un mayor control sobre las fuerzas de la

naturaleza. Ningún romano perdió su vida por haber estado absorto en la contemplación

de un diagrama matemático.

* También conocido como Lord Beaconsfield (1804-1881), fue un político y escritor británico. Nota del Traductor.

23

CAPÍTULO IV

DINÁMICA

El mundo tuvo que esperar dieciocho siglos para que los físicos matemáticos

griegos encontraran sucesores. En los siglos dieciséis y diecisiete de nuestra era, dos

grandes italianos, LEONARDO DA VINCI (1452-1519) y GALILEO (1564-1642)

redescubrieron el secreto, sabido por ARQUÍMEDES, de relacionar ideas matemáticas

abstractas con la investigación experimental de los fenómenos naturales. Mientras tanto,

el avance lento de las matemáticas y la acumulación de un conocimiento astronómico

exacto y preciso puso a los filósofos naturales en una posición mucho más ventajosa

para la investigación. También la muy egoísta búsqueda de autoafirmación de las

personas, característica de esa época, junto con una codicia por las experiencias

personales, llevó a los pensadores a querer ver, por ellos mismos, lo que sucedía; y el

secreto de la relación entre la teoría matemática y el experimento por razonamiento

inductivo fue descubierto. Fue un suceso eminentemente característico de esa época que

GALILEO, un filósofo, arrojara desde la torre de Pisa los pesos con los que

experimentó. Siempre han existido hombres de pensamiento y hombres de acción; la

física matemática es el producto de una época que combinó, en los mismos hombres,

impulsos hacia el pensamiento e impulsos hacia la acción.

Este hecho de arrojar pesos desde una torre marca pictóricamente un paso

esencial en el conocimiento, no siendo un paso menor a las primeras ideas correctas y

certeras sobre la ciencia de la dinámica, la ciencia básica de todo este tema. El punto

particular de disputa era saber si cuerpos de diferentes pesos caerían, desde la misma

altura, al mismo tiempo. De acuerdo con una sentencia de ARISTÓTELES,

universalmente seguida en esa época, el peso más pesado caería más rápido. GALILEO

afirmó que caerían al mismo tiempo, y probó esto arrojando pesos desde la parte

superior de la torre inclinada. Las aparentes excepciones a la regla surgen cuando, por

alguna razón (ligereza extrema o gran velocidad), la resistencia del aire es importante.

Pero quitando al aire, la ley es exacta.

El exitoso experimento de GALILEO no fue el resultado de meras suposiciones

con un poco de suerte. Fue el resultado, más bien, de sus ideas correctas en relación con

la inercia y la masa. La primera ley del movimiento - la enunciaremos siguiendo a

24

NEWTON - es: cada cuerpo continúa en estado de reposo o de movimiento uniforme en

una línea recta, excepto cuando se ve obligado, por una fuerza impresa sobre él, a

cambiar de estado. Esta ley es más que una simple fórmula: es también un himno al

triunfo sobre los herejes derrotados. El punto en cuestión puede ser mejor entendido si

borramos de la ley la frase: “o de movimiento uniforme en una línea recta”. Entonces

podríamos obtener lo que quiere decir la contraria fórmula aristotélica: “Cada cuerpo

continúa en su estado de reposo, excepto cuando se ve obligado, por una fuerza impresa

sobre él, a cambiar de estado”.

En esta última fórmula falsa se asegura que, sin tomar en cuenta la fuerza, un

cuerpo continúa en un estado de reposo; de acuerdo con esto, si un cuerpo está en

movimiento, es porque una fuerza está manteniendo ese movimiento, de manera que,

cuando la fuerza cesa, el movimiento también. La verdadera y certera ley newtoniana

tiene un punto de vista diametralmente opuesto. El estado de un cuerpo no afectado por

una fuerza es el de un movimiento uniforme en una línea recta, y la causa de este

movimiento no se debe a ninguna fuerza o influencia externa o, si se prefiere poner así,

a ningún acompañante invariable. El reposo es simplemente un caso particular de este

movimiento, cuando la velocidad es y se mantiene cero. De esta forma, cuando un

cuerpo se está moviendo, no debemos buscar ninguna fuerza externa, excepto para

explicar cambios en la velocidad o en la dirección. Siempre y cuando el cuerpo se

mueva a la misma velocidad y en la misma dirección, no es necesario recurrir a la ayuda

de ningún tipo de fuerza.

La diferencia entre los dos puntos de vista se aprecia mejor si hacemos

referencia a la teoría del movimiento de los planetas. COPÉRNICO (1473-1543)

demostró que era mucho más simple

25

Fig. 4

concebir a los planetas, incluida la Tierra, girando alrededor del sol en órbitas que son

casi circulares; tiempo después KEPLER, en el año 1609, demostró que, de hecho, las

órbitas son prácticamente elipses, esto es, un tipo especial de curvas ovaladas que

consideraremos más tarde con más detalle. Inmediatamente surgió la cuestión de saber

cuáles eran las fuerzas que preservaban a los planetas en este movimiento. De acuerdo

con la vieja y falsa idea, sostenida por KEPLER, la velocidad real en sí misma requería

de la fuerza para su preservación. Entonces buscó la existencia de fuerzas tangenciales,

como demuestra la figura 4. Pero de acuerdo con la ley newtoniana, si no hubiera fuerza

alguna, el planeta se movería por siempre, con su velocidad existente, en una línea recta,

apartándose así del sol. NEWTON, por lo tanto, tuvo que buscar una fuerza que hiciera

que el movimiento

26

Fig. 5

se hiciera curvo y siguiera una órbita elíptica. Demostró que tenía que ser una fuerza

dirigida hacia el sol (figura 5). De hecho, la fuerza es la atracción gravitacional del sol

actuando de acuerdo a la ley del cuadrado inverso de la distancia, como ya vimos más

arriba.

La ciencia de la mecánica surgió entre los griegos a partir de considerar la

ventaja mecánica de usar palancas, y también de tomar en cuenta varios problemas

relacionados con los pesos de los cuerpos. Fue finalmente expuesta de manera

verdadera en los siglos dieciséis y diecisiete, gracias en parte a querer explicar la teoría

de la caída de los cuerpos, pero principalmente gracias a querer desarrollar una teoría

científica del movimiento de los planetas. Pero desde esos días la dinámica se ha

dirigido a tareas más ambiciosas, y parece que, hoy en día, es la ciencia definitiva,

siendo las demás solamente ramas de ésta. La pretensión de ciencia definitiva se refiere

más o menos a esto: las distintas cualidades de las cosas perceptibles a los sentidos son

solamente nuestro peculiar modo de apreciar cambios en la posición de las cosas

existentes en el espacio. Supongamos, por ejemplo, que estamos viendo la Abadía de

Westminster. Ha estado ahí, gris e inamovible, desde hace siglos. Pero, de acuerdo con

la moderna teoría científica, ese gris, que aumenta tanto nuestra sensación de

inmovilidad del edificio, no es otra cosa sino nuestro modo de apreciar los rápidos

movimientos de las moléculas fundamentales, que forman la superficie externa del

27

edificio y otorgan vibraciones a una sustancia llamada éter. Si colocamos nuestras

manos sobre sus piedras notaremos que están frías. Pero esta sensación de temperatura

es simplemente una sensación de la transferencia de calor de la mano a la piedra, o de la

piedra a la mano; y, de acuerdo con la ciencia moderna, el calor no es nada más que la

agitación de las moléculas de un cuerpo. Si escuchamos un órgano, el sonido no es nada

más que el resultado de movimientos del aire que golpean al tímpano del oído.

Así que el esfuerzo para dar una explicación dinámica a los fenómenos consiste

en explicarlos a partir de declaraciones generales, como “tal y tal sustancia o cuerpo

estuvo en este lugar y está ahora en aquel lugar”. Entonces llegamos a la idea

fundamental de la ciencia moderna, a saber, que todas nuestras sensaciones son el

resultado de comparar las cambiantes configuraciones de las cosas en el espacio en

distintos tiempos. Se sigue, por lo tanto, que las leyes del movimiento, esto es, las leyes

de los cambios de las configuraciones de las cosas, son las leyes fundamentales de la

ciencia física.

En la aplicación de las matemáticas a la investigación de la filosofía natural, la

ciencia hace de manera sistemática lo que el pensamiento ordinario hace de manera

casual. Cuando hablamos de una silla, normalmente nos referimos a algo que hemos

visto o sentido en alguna forma; aunque la mayor parte de nuestro lenguaje presupone

que hay algo que existe independientemente de nuestra vista o de nuestra sensación. En

la física matemática, se sigue el rumbo contrario. La silla es concebida sin referencia

alguna a alguien en particular, o a modos especiales de percepción. El resultado de esto

es que la silla se convierte en el pensamiento científico en un conjunto de moléculas en

el espacio, o en un grupo de electrones, o en una porción de éter en movimiento, o

cualquier cosa que la ciencia moderna intente describir. Pero el punto es que la ciencia

reduce la silla a cosas moviéndose en el espacio que influyen en los movimientos de

otras cosas. Entonces los distintos elementos o factores que entran en un conjunto de

circunstancias, así concebidas, son simplemente cosas, tales como longitudes de líneas,

tamaños de ángulos, áreas y volúmenes, por las cuales las posiciones de los cuerpos en

el espacio pueden ser establecidas. Desde luego, adicionalmente a estos elementos

geométricos, las nociones de movimiento y cambio necesitan la introducción de algún

tipo de razón o proporción de cambios en tales elementos, a saber, velocidades,

velocidades angulares, aceleraciones, y cosas por el estilo. De acuerdo con esto, la física

matemática se ocupa de las correlaciones entre los números variables que están

supuestos para representar las correlaciones que existen en la naturaleza entre las

28

medidas de estos elementos geométricos y su proporción o razón de cambio. Pero las

leyes matemáticas siempre se tratan con variables, y es solamente en pruebas

ocasionales de las leyes en experimentos, o en el uso de las leyes para predicciones

específicas, que los números definidos son sustituidos.

El punto interesante sobre el mundo concebido de esta manera abstracta a lo

largo del estudio de la física matemática, donde solamente las posiciones y formas de

las cosas con consideradas conjuntamente con sus cambios, es que los eventos de tal

mundo abstracto son suficientes para “explicar” nuestras sensaciones. Cuando

escuchamos un sonido, las moléculas del aire han sido agitadas de cierta forma: dada la

agitación - u ondas de aire, como son llamadas - cualquier persona normal escucha un

sonido; y si no hay ondas de aire, no hay sonido. Y, de manera similar, una causa u

origen físico, o un evento paralelo (de acuerdo a cómo las personas prefieran

nombrarlo), subyace en nuestras demás sensaciones. Incluso nuestros pensamientos

parecen corresponder a conformaciones y movimientos del cerebro; si se lesiona al

cerebro, se “lesionan” los pensamientos. Mientras tanto, los eventos de este universo

físico se suceden unos a otros de acuerdo con las leyes matemáticas que ignoran toda

sensación, pensamiento o emoción particular o especial.

Sin duda alguna, este es el aspecto general de la relación del mundo de la física

matemática con nuestras sensaciones, pensamientos y emociones; y este tipo especial de

relación ha suscitado una gran controversia. Necesitamos solamente hacer una

observación. Toda la situación ha surgido, como hemos visto, del empeño por describir

un mundo externo que sea capaz de explicar nuestras diferentes sensaciones y

emociones individuales; pero un mundo no esencialmente dependiente de cualesquiera

sensaciones o individuos particulares. ¿Es tal mundo solamente un gran cuento de

hadas? Los cuentos de hadas son fantásticos y arbitrarios: si realmente existiera un

mundo capaz de ser explicado así, tendría que ser uno en donde éste tendría que

someterse a descripciones exactas, que determinen de forma precisa a sus partes y su

relación mutua. Ahora bien, en mayor medida, este mundo científico sí se somete a esta

prueba y permite que sus eventos sean explorados y previstos por el aparato de las ideas

matemáticas abstractas. Parece ser que tenemos aquí una verificación inductiva de

nuestra presunción inicial. Debe ser admitido que ninguna prueba inductiva es

concluyente, pero si toda nuestra idea sobre un mundo que tiene una existencia

independiente de nuestras percepciones particulares fuera errónea, tendría entonces que

29

explicarse por qué el intento de caracterizarlo - en términos de aquel residuo

matemático de nuestras ideas que se aplican a él - produce un éxito tan notable.

Nos llevaría mucho tiempo y esfuerzo el explicar a detalle las otras leyes del

movimiento. Lo que resta de este capítulo será dedicado a dos valiosas ideas que son

fundamentales, tanto para la física matemática como para las matemáticas puras: son las

ideas de las cantidades vectoriales y de la ley del paralelogramo para la suma de

vectores. Hemos visto que la esencia del movimiento es que un cuerpo que estaba en A

está ahora en C. Esta transferencia de A a C requiere de dos elementos distintos para ser

establecida antes de ser completamente determinada, a saber, su magnitud (por ejemplo,

la longitud AC) y su dirección. Ahora cualquier cosa, como esta transferencia, que esté

completamente dada por la determinación de una

Fig. 6

magnitud y una dirección será llamada vector. Por ejemplo, para poder definir una

velocidad, necesitamos asignarle una magnitud y una dirección. Debe ser de tantas

millas por hora en tal y tal dirección. La existencia e independencia de estos dos

elementos en la determinación de una velocidad son bien ejemplificadas si pensamos en

la tarea del capitán de un barco, que comunica a subordinados con diferentes tareas las

acciones a seguir respecto a estos dos elementos: ordena al ingeniero principal en

número de nudos a los que se debe navegar, y al timonel el camino que debe de seguir.

De nuevo el cambio en la velocidad, que es velocidad añadida por unidad de tiempo, es

30

también una cantidad vectorial, y es llamada aceleración. Similar a una fuerza en el

sentido dinámico es otra cantidad vectorial. En realidad, la naturaleza vectorial de las

fuerzas sigue a la vez a los principios dinámicos de la velocidad y la aceleración; pero

este es un punto en el que no entraremos. Es suficiente con decir que una fuerza actúa

sobre un cuerpo con una cierta magnitud en una cierta dirección.

Todos los vectores pueden ser representados gráficamente por medio de líneas

rectas. Todo lo que se tiene que hacer es lo siguiente: (i) una escala según la cual las

unidades de longitud correspondan a unidades de magnitud del vector (por ejemplo, una

pulgada a una velocidad de 10 millas por hora en el caso de velocidades, y una pulgada

a una fuerza de 10 toneladas de peso en el caso de las fuerzas) y (ii) una dirección de la

línea en el diagrama correspondiente a la dirección del vector. Entonces, una línea

trazada con los números correctos de pulgadas de longitud en la dirección correcta

representa el vector requerido en la escala arbitrariamente asignada para la magnitud.

Esta representación esquemática de los vectores es de primera importancia. Gracias a

ella podemos enunciar la famosa “ley del paralelogramo” para la suma de vectores del

mismo tipo pero en distintas direcciones.

Consideremos el vector AC en la figura 6 como representativo del cambio de

posición de un cuerpo de A a C: lo llamaremos el vector de transportación. Debe notarse

que, si la reducción de los fenómenos físicos a simples cambios en posiciones, como ya

fue explicado arriba, es correcta, todos los demás tipos de vectores físicos son

reducibles, de alguna u otra manera, a este único tipo. La transportación final de A a C

es igualmente bien lograda por una transportación de A a B y una transportación de B a

C o, completando el paralelogramo ABCD, por una transportación de A a D y una

transportación de D a C. Estas transportaciones que son así aplicadas de manera

sucesiva se dice que son sumadas conjuntamente. Esta es simplemente una definición de

lo que entendemos por la suma de transportaciones. Nótese también que, si

consideramos las líneas paralelas como líneas trazadas en la misma dirección, las

transportaciones B a C y A a D pueden ser concebidas como la misma transportación

aplicada a cuerpos en las dos posiciones iniciales B y A. Con esta concepción podemos

pensar en la transportación A a D como aplicada a un cuerpo en cualquier posición, por

ejemplo en B. Entonces podemos decir que la transportación A a C puede ser concebida

como la suma de las los transportaciones A a B y A a D aplicadas en cualquier orden.

Tenemos entonces la ley del paralelogramo para la suma de transportaciones: si las

31

transportaciones son A a B y A a D, complétese el paralelogramo ABCD, y entonces la

suma de las dos es la diagonal AC.

Todo esto puede parecer a primera vista muy artificial. Pero debe tenerse en

cuenta que la misma naturaleza nos presenta la idea. Por ejemplo, un buque de vapor se

mueve en la dirección AD (Cf. fig. 6) y un hombre camina a través de su cubierta. Si el

buque de vapor estuviese quieto, en un minuto el hombre llegaría al punto B; pero

durante ese minuto su punto de partida A se ha movido a D, y su camino en la cubierta

se ha movido de AB a DC. Así que, en realidad, su transportación ha sido desde A hasta

C sobre la superficie del mar. Se ha presentado a nuestro análisis, sin embargo, como la

suma de dos transportaciones: una de A a B, relativa al buque de vapor, y otra de A a D,

que es la transportación del buque de vapor.

Si tomamos en cuenta el elemento del tiempo, digamos un minuto, este diagrama

de la transportación del hombre AC representa su velocidad. Porque si AC representaba

tantos pies de transportación, ahora representa una transportación de tantos pies por

minuto o, lo que es lo mismo, representa la velocidad del hombre. Entonces AB y AD

representan dos velocidades, a saber, la velocidad del hombre relativa al buque de

vapor, y la velocidad del buque de vapor, cuya “suma” es la velocidad total del hombre.

Es evidente que los diagramas y las definiciones concernientes a las transportaciones

son convertidos en diagramas y definiciones concernientes a las velocidades al concebir

a los diagramas como representando transportaciones por unidad de tiempo. De nuevo,

los diagramas y las definiciones concernientes a las velocidades son convertidas en

32

Fig. 7

diagramas y definiciones concernientes a la aceleración al concebir a los diagramas

como representando velocidades añadidas por unidad de tiempo.

Entonces, por la suma o adición de velocidades de vectores y de aceleraciones

de vectores, entendemos la suma o adición de acuerdo con la ley del paralelogramo.

También, de acuerdo con las leyes del movimiento, una fuerza está representada

por la aceleración vectorial que produce en un cuerpo de alguna masa dada. De acuerdo

con esto, se dice que las fuerzas son sumadas cuando su efecto conjunto es pensado de

acuerdo con la ley del paralelogramo.

Por consiguiente, para los vectores fundamentales de la ciencia, sean

transportaciones, velocidades, o fuerzas, la suma de cualesquiera dos tipos de vectores

del mismo tipo es la producción de un vector “resultante” de acuerdo con la ley del

paralelogramo.

El tipo más simple de paralelogramo es un rectángulo, y en las matemáticas

puras, es la relación entre el simple vector AC con los dos vectores componentes, AB y

AD, en ángulos rectos (Cf. fig. 7), lo que es continuamente recurrente. Aquí, las

unidades x, y, r representan las longitudes de AB, AD y AC, y las unidades de ángulo m

representan la magnitud del ángulo BAC. Entonces las relaciones entre x, y, r, m, en

todos sus muchos aspectos, son el tema continuamente recurrente de las matemáticas

puras; y los resultados son del tipo requerido para la aplicación de los vectores

33

fundamentales a la física matemática. Este diagrama es el puente principal sobre el cual

los resultados de las matemáticas puras se usan con el fin de obtener aplicaciones a los

hechos de la naturaleza.

34

CAPÍTULO V

EL SIMBOLISMO DE LAS MATEMÁTICAS

Regresemos ahora a las matemáticas puras, y consideremos de manera más

cercana el aparato de ideas sobre el cual esta ciencia está construida. Nuestro primer

contenido tiene que ver con el simbolismo de esta ciencia, y empezaremos con los

símbolos conocidos más simples y universales, a saber, los de la aritmética.

Asumamos que tenemos ideas lo suficientemente claras sobre los números

enteros, representados en la notación arábiga por 0, 1, 2,…, 9, 10, 11,…, 100,101,

etcétera. Esta notación fue introducida en Europa a través de los árabes, pero, a su vez,

parece ser que éstos la obtuvieron de fuentes hindúes. El primer trabajo conocido*en el

que esto está sistemáticamente explicado es un trabajo del matemático hindú

BHASKARA (nacido en 1114 d. C.). Pero los números reales se encontraban ya en el

siglo séptimo de nuestra era, y fueron probablemente inventados en el Tíbet. Para

nuestros propósitos presentes, no obstante, la historia de la notación es solamente un

referente. El punto interesante a notar es la admirable ilustración que este sistema

numeral ofrece para conseguir una buena notación. Al alejar al cerebro de todo trabajo

innecesario, una buena notación permite concentrarse en problemas más avanzados.

Antes de la introducción de la notación arábiga, la multiplicación era mucho más difícil

y la división, incluso de números enteros, planteaba serias dificultades matemáticas.

Probablemente nada hubiera asombrado más a un griego que saber que, gracias a la

educación universal, toda la población de Europa occidental, sin importar clases

sociales, puede realizar operaciones divisionales con números grandes. Este hecho le

hubiera parecido simplemente imposible. La consecuente extensión de la notación a

fracciones decimales se hizo hasta el siglo diecisiete. Nuestra capacidad moderna para

calcular de una manera sencilla con fracciones decimales se debe en buena parte al

descubrimiento gradual de esta notación.

Las matemáticas son a menudo consideradas una ciencia difícil y misteriosa, en

parte también debido a los numerosos símbolos que emplea. Nada resulta más

incomprensible que una serie de símbolos que no entendemos. Pero también resulta

* Para los hechos históricos detallados relacionados a las matemáticas puras, estoy en deuda con el libro A Short History of Mathematics, de W. W. R. Ball.

35

sumamente difícil de entender un simbolismo que solamente entendemos parcialmente

y al que no estamos acostumbrados. Sucede exactamente lo mismo con los términos

técnicos de cualquier profesión: son incomprensibles a aquellos que no están habituados

a usarlos y manipularlos. Pero esto no se debe a que ellos sean difíciles en sí mismos.

Por el contrario, fueron introducidos para facilitar las cosas. Así que en las matemáticas,

el simbolismo representa invariablemente simplificación, y no solamente para un nivel

práctico: representa también un análisis de las ideas del tema y una representación casi

pictórica de las relaciones entre éstas. Si alguien duda de la utilidad de los símbolos,

habría que dejar que escriba de forma completa, sin utilizar ningún símbolo, el

significado de las siguientes ecuaciones que representan algunas de las leyes

fundamentales del álgebra:

x+y=y+x (1)

(x+y)+z=x+(y+z) (2)

x×y=y×x (3)

(x×y)×z=x× (y×z) (4)

x× (y+z)=(x×y)+(x×z) (5)

Aquí, (1) y (2) son llamadas leyes conmutativas y asociativas para la adición, (3) y (4)

son las leyes conmutativas y asociativas para la multiplicación, y (5) es la ley

distributiva de la adición y la multiplicación. Por ejemplo, sin el uso de símbolos, (1)

sería: si un segundo número es añadido a cualquier número dado el resultado es el

mismo a si el primer número dado es añadido al segundo número.

Este ejemplo demuestra que, gracias a los símbolos, podemos hacer operaciones

casi de manera mecánica y visual, y que de otra forma implicarían el uso continuo de las

más altas facultades cerebrales.

Es un principio totalmente erróneo y, desafortunadamente repetido en libros y

por personas, el suponer que se debe cultivar el hábito de pensar lo que hacemos. Se

debe hacer precisamente lo contrario. Una civilización avanza al extender el número de

operaciones importantes que se pueden realizar sin tener que pensar en ellas. Las

operaciones del pensamiento son como los batallones de caballería en una batalla: son

estrictamente limitados en número, requieren de caballos hábiles, y debe ser usada

solamente en momentos decisivos.

36

Una propiedad muy importante que el simbolismo debe poseer es que debe ser

conciso, para poder ser rápidamente escrito y reconocible a la vista. La mejor manera de

lograr consistencia simbólica es poniendo los símbolos en una yuxtaposición inmediata.

Un simbolismo efectivo implica, por lo tanto, que la yuxtaposición de los símbolos

importantes tenga un significado importante. Este es uno de los méritos de la notación

arábiga para los números: por medio de diez símbolos, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, y por

simple yuxtaposición es capaz de simbolizar cualquier número. En álgebra, cuando

tenemos dos números variables x e y, debemos escoger qué debe ser denotado por su

yuxtaposición xy. Las dos ideas más importantes a la mano son las de la suma y la

multiplicación. Los matemáticos han decidido hacer su simbolismo más conciso al

definir xy como x×y. De esta forma, las leyes generales (3), (4) y (5) de arriba pueden

ser escritas como:

xy=yx, (xy)z=x(yz), x(y+z)=xy+xz,

logrando un significativo avance en cuanto a consistencia se refiere.

La misma regla de simbolismo se aplica a la yuxtaposición de un número definido y una

variable: escribimos 3x para 3×x, y 30x para 30×x.

Es evidente que al restaurar la “× ” tenemos que tener cuidado al sustituir

números definidos por variables, de tal manera que no tengamos conflicto con la

notación arábiga. Así, cuando sustituimos 2 por x y 3 por y en xy, debemos escribir 2×3

para xy, y no 23, que significa 20+3.

Es interesante observar cuán importante resulta un símbolo de apariencia

modesta para el desarrollo de la ciencia. Puede estar representando la presentación

enfática de una idea, a menudo una idea muy sutil, y gracias a su existencia hacer

mucho más fácil exhibir la relación de esta idea con todo el complejo entramado de

ideas en la que ocurre. Por ejemplo, tomemos el más modesto de todos lo símbolos, a

saber, 0, que representa al número cero. La notación romana para los números no tenía

un símbolo para el cero, y probablemente la mayoría de los matemáticos del mundo

antiguo hubieran estado perplejos ante la idea del número cero. Porque, después de

todo, es una idea muy sutil y nada obvia. Una gran cantidad de discusiones sobre el

significado del cero referido a cantidad puede ser encontrada en tratados filosóficos. El

cero no es, en realidad, una idea más difícil o sutil que la de cualquier número cardinal.

¿Qué queremos decir por 1, o por 2, o por 3? Lo que sucede es que estamos

37

familiarizados con el uso de estas ideas, aunque nos costaría mucho trabajo hacer un

análisis claro de las ideas y principios más simples que forman estas notaciones. La

cuestión sobre el cero es que no necesitamos usarlo para las operaciones de la vida

diaria. Nadie compra en un mercado cero pescados. Es, en un sentido, el más civilizado

de los números cardinales, y su uso se da en nosotros por la necesidad de cultivar modos

de pensamiento. Se consiguen logros muy importantes gracias al símbolo 0, que

representa al número cero.

El símbolo se desarrolló en conexión con la notación arábiga para los números,

de la cual es una parte esencial. Porque en esa notación el valor de un dígito depende de

la posición en la que se encuentre. Consideremos, por ejemplo, el número 5, como caso

en los números 25, 51, 3512, 5213. En el primer número 5 representa cinco, en el

segundo número 5 representa cincuenta, en el tercer número quinientos, y en el cuarto

número cinco mil. Ahora bien, cuando escribimos el número cincuenta y uno en la

forma simbólica 51, el dígito 1 “empuja” al dígito 5 al segundo puesto (de derecha a

izquierda) y así le da el valor de cincuenta. Pero cuando queremos simbolizar cincuenta

por sí mismo, no podemos hacer que el dígito 1 logre esto; queremos un dígito que

pueda ser puesto sin añadir nada al total pero que “empuje” a 5 al segundo lugar. Esto lo

consigue el 0, símbolo de cero. Es altamente probable que los primeros hombres que

introdujeron el 0 para este propósito no hayan tenido una concepción definida sobre el

número cero. Ellos simplemente querían una marca que simbolizara que nada ha sido

añadido por el dígito que toma un determinado lugar. La idea del cero tomó forma de

manera gradual por el deseo de asimilar el significado de esta marca con el de las

marcas 1, 2,…9, que representan números cardinales. Este no es el único caso en donde

una idea sutil ha sido introducida en las matemáticas por un simbolismo que en sus

orígenes fue ideado por conveniencia práctica.

Entonces está claro que el primer uso del 0 fue para hacer la notación arábiga

posible, sin más. Podemos imaginar que cuando fue introducido para este propósito, los

hombres prácticos, del tipo a los que no gustan de ideas fantasiosas, despreciaron el

absurdo hábito de identificarlo con un número cero. Pero ellos estaban equivocados,

como tales hombres siempre lo están cuando suelen abandonar su propia función de

masticar la comida que otros han preparado. Porque la siguiente función del símbolo 0

depende esencialmente de representar al número cero.

Este segundo uso simbólico es a primera vista tan simple, que resulta difícil

hacer comprender a un principiante su importancia. Empecemos con un ejemplo simple.

38

En el Capítulo II mencionamos la correlación entre dos números variables x e y

representados por la ecuación x+y=1. Esto puede ser representado en un número

indefinido de formas; por ejemplo, 1−= yx , xy −=1 , yxyx 2132 +=−+ , etcétera.

Pero la forma importante de representarlo es

01=−+ yx

De manera similar, la forma importante de escribir la ecuación 1=x es 01=−x , y de

escribir la ecuación 2223 xx =− es 0232 2 =+− xx . El punto es que todos los símbolos

que representan variables, por ejemplo x e y, y los números que representan algún

número definido que no sea cero, tales como 1 ó 2 en los ejemplos anteriores, son

escritos en la parte izquierda, para que toda la parte derecha sea el número cero. Se dice

que el primer hombre que hizo esto fue Thomas HARRIOT, nacido en Oxford en 1560

y muerto en 1621. ¿Pero cuál es la importancia de este simple procedimiento simbólico?

Es que hizo posible el desarrollo de la concepción moderna de forma algebraica.

Esta es una idea a la que tendremos que recurrir continuamente; se podría decir

que ninguna parte de las matemáticas modernas puede ser propiamente entendida sin

una constante recurrencia a este principio. La concepción de forma es tan general que

resulta difícil caracterizarla en términos abstractos. Será mejor que utilicemos ejemplos

para su exposición. Las ecuaciones 032 =−x , 01=−x , 065 =−x , son todas

ecuaciones de la misma forma, a saber, ecuaciones que involucran una incógnita x, que

no es multiplicada por sí misma, de manera que x2, x3, etc., no aparecen. En cambio,

0123 2 =+− xx , 0232 =+= xx , 042 =−x , son todas ecuaciones de la misma forma, a

saber, ecuaciones que involucran una incógnita x en donde x×x, esto es x2, aparece.

Estas ecuaciones son llamadas ecuaciones cuadráticas. De manera similar, las

ecuaciones cúbicas, en donde x3 aparece, producen otra forma, etcétera. De entre las tres

ecuaciones cuadráticas dadas arriba existe una diferencia menor entre la última

ecuación, 042 =−x , y las dos ecuaciones precedentes, debido al hecho de que x (como

distinta de x2) no aparece en la última ecuación y sí en las otras dos. Esta distinción no

tiene importancia alguna en comparación con el hecho de que las tres son ecuaciones

cuadráticas.

Existen también formas de ecuaciones que representan correlaciones entre dos

variables; por ejemplo, 01=−+ yx , 0832 =−+ yx , etcétera. Estos son ejemplos de lo

39

que se llama la forma lineal de ecuación. La razón de este nombre “lineal” es que el

método gráfico de representación, explicado al final del capítulo II, siempre representa

tales ecuaciones por una línea recta. También existen otras formas para dos variables,

por ejemplo, la forma cuadrática, la forma cúbica, etcétera. Pero el punto sobre el que

queremos insistir es que este estudio de forma es facilitado y, en realidad, hecho

posible, gracias al método estándar de escribir ecuaciones con el símbolo 0 en la parte

derecha.

Existe todavía una función más realizada por 0 en relación con el estudio de la

forma. Cualquier número que x sea, 0×x=0, y x+0=x. Las diferencias menores de forma

pueden ser asimiladas por medio de estas propiedades. Así, la diferencia mencionada

arriba entre las ecuaciones cuadráticas 0232 =+= xx , y 042 =−x , puede ser

eliminada al escribir la última ecuación en la forma 04)0(2 =−×+ xx . Porque, debido

a las leyes establecidas arriba, 4404)0( 222 −=−+=−×+ xxxx . Por lo tanto, la

ecuación 042 =−x , es simplemente representativa de una clase particular de

ecuaciones cuadráticas, y pertenece a la misma forma general que 0232 =+− xx .

Por estas tres razones el símbolo 0, representando al número cero, es esencial

para las matemáticas modernas. Ha permitido tipos específicos de investigación que

hubieran sido imposibles sin él.

El simbolismo de las matemáticas es en verdad el resultado de las ideas

generales que dominaron a la ciencia. Tenemos entonces dos ideas generales ante

nosotros, la de la variable y la de la forma algebraica. La unión de estos conceptos ha

impuesto a las matemáticas otro tipo de simbolismo muy extraño en su naturaleza, pero

igualmente efectivo. Hemos visto que una ecuación con dos variables, x e y, representa

una correlación particular entre el par de variables. Así, 01=−+ yx representa una

correlación definida, y 0523 =−+ yx representa otra correlación definida entre las

variables x e y; y ambas correlaciones tienen la forma de lo que hemos llamado

correlaciones lineales. Pero ahora surge la pregunta, ¿cómo podemos representar

cualquier correlación lineal entre los números variables x e y? Lo que queremos hacer

es simbolizar cualquier correlación lineal, así como x simboliza cualquier número. Esto

se logra convirtiendo los números que aparecen en la correlación definida

0523 =−+ yx en letras. Obtenemos 0=−+ cbyax . Aquí, a, b, c representan números

variables tal como lo hacen x e y; pero existe una diferencia en el uso de los dos

conjuntos de variables. Estudiamos las propiedades generales de la relación entre x e y

40

mientras a, b, y c tengan valores sin cambios. No determinamos cuáles son los valores

de a, b, y c; pero cualesquiera que ellos sean, se mantienen fijos mientras estudiamos la

relación entre las variables x e y para todo el grupo de posibles valores de x e y. Pero

cuando hemos obtenido las propiedades de esta correlación, notamos que, debido a que

a, b, y c no han sido de hecho determinadas, hemos probado propiedades que deben

pertenecer a cualquiera tal relación. Así, al modificar la idea sobre a, b, y c, llegamos al

concepto de que 0=−+ cbyax representa una correlación lineal variable entre x e y. En

comparación con x e y, las tres variables a, b, y c son llamadas constantes. Las variables

usadas de este modo también pueden ser llamadas parámetros.

Los matemáticos habitualmente se ahorran el problema de explicar cuáles de sus

variables serán tratadas como “constantes”, y cuáles como variables, consideradas como

correlacionadas en sus ecuaciones, usando las letras del final del alfabeto como

variables “variables”, y las letras al principio del alfabeto como variables “constantes”,

o parámetros. Los dos sistemas se encuentran de manera natural en la mitad del

alfabeto. A veces una explicación es necesaria para evitar confusiones, pero, en

realidad, la costumbre y el sentido común son comúnmente suficientes para evitarlas, y

sorprendentemente éstas no son causadas por un procedimiento que a primera vista

parece tan laxo.

El resultado de esta continua eliminación de números definidos por sucesivas

capas de parámetros es que la cantidad de conocimiento aritmético desarrollado por los

matemáticos es extremadamente pequeña. A muchos matemáticos no les agrada la

computación numérica y no suelen ser expertos en ella. El territorio de la aritmética

termina donde el imperio de las dos ideas de “variables” y “formas algebraicas”

comienza.

41

CAPÍTULO VI

GENERALIZACIONES DE LOS NÚMEROS

Una gran peculiaridad de las matemáticas es el conjunto de ideas relacionadas

que ha sido inventado en conexión con los números enteros. Estas ideas pueden ser

llamadas extensiones o generalizaciones de los números. En primer lugar, está la idea de

las fracciones. El primer tratado sobre aritmética del que tenemos conocimiento fue

escrito por un sacerdote egipcio, llamado AHMES, entre los años 1700 a. C. y 1100 a.

C., y es probablemente una copia de un trabajo mucho más antiguo. Trata, en gran parte,

de las propiedades de las fracciones. Parece ser, por lo tanto, que este concepto fue

desarrollado muy temprano en la historia de las matemáticas. En realidad, el tema es

muy obvio. Dividir un campo en tres partes iguales, y luego tomar dos de las partes,

debió haber sido un tipo de operación muy común y recurrente. De acuerdo con esto, no

debe sorprendernos el que los hombres de civilizaciones remotas estuvieran

familiarizados con la idea de dos tercios y de nociones parecidas. Entonces

consideraremos al concepto de fracciones como la primera generalización del número.

Los griegos pensaron en este tema más bien en la forma de proporciones, de manera que

un griego diría de manera natural que una línea de dos pies de longitud tiene, a una línea

de tres pies de longitud, la proporción de 2 a 3. Bajo la influencia de nuestra notación

algebraica, diríamos más bien que una línea es dos tercios de la otra en longitud, y

pensaríamos en dos tercios como un multiplicador numérico.

En relación con la teoría de la proporción, o de las fracciones, los griegos

hicieron un gran descubrimiento, que ha dado lugar a una gran cantidad de pensamiento,

tanto filosófico como matemático. Encontraron la existencia de proporciones

“inconmensurables”. Lograron probar, de hecho, a partir de sus investigaciones

geométricas que, comenzando con una línea de cualquier longitud, deben existir otras

líneas cuyas longitudes no llevan a la longitud original la proporción de ningún par de

números enteros o, en otras palabras, que existen líneas que no son ninguna fracción

exacta de la línea original.

Por ejemplo, la diagonal de un cuadrado no puede ser expresada como ninguna

fracción del lado del mismo cuadrado; en nuestra notación moderna la longitud de la

diagonal es 2 veces la longitud del lado. Pero no hay ninguna fracción que represente

42

de manera exacta a 2 . Nos podemos aproximar a 2 tanto como queramos, pero

nunca alcanzaremos su valor exacto. Por ejemplo, 25

49 es un poco menos que 2, y

4

9 es

mayor que 2, de manera que 2 se encuentra entre 5

7 y

2

3. Pero la mejor forma

sistemática de aproximarse a 2 al obtener una serie de fracciones decimales, cada una

mayor que la última, es por el método ordinario de extraer la raíz cuadrada, así, la serie

es 1, 10

14,

100

141,

1000

1414, etcétera.

Las proporciones de este tipo fueron llamadas por los griegos inconmensurables.

Han dado lugar a una gran cantidad de discusiones filosóficas, y las dificultades

relacionadas con ellas sólo han sido aclaradas recientemente.

Pondremos a las proporciones inconmensurables con las fracciones, y

consideraremos todo el conjunto de números enteros, números fraccionales, y números

inconmensurables como integrantes de una clase de números que llamaremos “números

reales”. Siempre pensamos en los números reales como ordenados o arreglados en

cuanto a su magnitud, empezando desde cero y yendo hacia arriba, y convirtiéndose

indefinidamente en más grandes y en más grandes a medida que avanzamos. Los

números reales son convenientemente representados por puntos en una línea.

0 2

1 1

2

3 2

2

5 3

2

7 4

0 M A N B P C Q D X

Sea 0X cualquier línea limitada a 0 y extendiéndose indefinidamente en la dirección 0X.

Tomemos cualquier punto conveniente, A, en ella, de tal forma que 0A represente la

unidad de longitud; y dividamos longitudes AB, BC, CD, etc., cada una igual a 0A. El

punto 0 representa el número 0, A el número 1, B el número 2, etc. De hecho, el número

representado por cualquier punto es la medida de su distancia desde 0, en términos de la

unidad de longitud 0A. Los puntos entre 0 y A representan las fracciones propias y los

números inconmensurables menores a 1; el punto medio de 0A representa 2

1, el de AB

43

representa 2

3, el de BC representa

2

5, etc. De esta forma, cada punto en 0X representa

algún número real, y cada número real es representado por algún punto en 0X.

La serie (o fila) de puntos a lo largo de 0X, empezando desde 0 y moviéndose de

manera regular en la dirección de 0 a X, representa a los números reales como

ordenados o arreglados en un orden de tamaño ascendente, empezando desde cero e

incrementándose continuamente.

Todo esto parece demasiado simple, pero hay algunas ideas interesantes que

debemos tomar en cuenta al tratar estos hechos tan obvios. Consideremos la serie de

puntos que representan los números enteros solamente, a saber, los puntos 0, A, B, C,

D, etc. Aquí hay un primer punto 0, un siguiente punto definido A, y cada punto, sea A

o B, tiene inmediatamente un predecesor definido y un sucesor definido, con la

excepción de 0, que no tiene predecesor; también hay que observar que la serie sigue de

manera indefinida y sin fin. Este tipo de orden es llamado el tipo de orden de los

enteros; su esencia es la posesión de “vecinos de al lado” en uno y otro lado con la

excepción del número 1 en la fila. Consideremos de nuevo a los enteros y a las

fracciones de manera conjunta, omitiendo las cuestiones que corresponden a las

proporciones inconmensurables. El tipo de orden serial que obtenemos ahora es

sumamente distinto. Hay un primer término 0; pero ningún término tiene algún

predecesor o sucesor inmediato. Esto se puede ver fácilmente, si pensamos en que, entre

cualesquiera dos fracciones, siempre podemos encontrar otra fracción intermedia en

valor. Un modo muy simple de hacer esto es sumando las fracciones y dividiendo el

resultado. Por ejemplo, entre 3

2 y

4

3, se encuentra la fracción

2

1

+4

3

3

2, esto es

24

17;

y entre 3

2 y

24

17 se encuentra la fracción

2

1

+24

17

3

2, esto es

48

33, etc., de manera

indefinida. Debido a esta propiedad, se dice que la serie es “compacta”. No existe un

punto final en la serie, que se incrementa de manera indefinida sin ningún límite a lo

largo de la línea 0X. Parecería a primera vista como si el tipo de serie obtenida de este

modo desde las fracciones, incluyendo siempre a los números enteros, pudiera ser la

misma como si fuese obtenida desde todos los números reales, enteros, fracciones e

inconmensurables en su conjunto, esto es, desde todos los puntos en la línea 0X. Todo

lo que hemos dicho hasta ahora sobre la serie de las fracciones se aplica igualmente a la

44

serie de todos los números reales. Pero existen diferencias importantes que ahora

consideraremos.

La ausencia de inconmensurables en la serie de las fracciones deja una ausencia

de puntos finales para ciertas clases. Consideremos al inconmensurable 2 . En la serie

de los números reales esto está entre todos los números cuyos cuadrados sean menores

que 2, y entre todos los números cuyos cuadrados sean mayores a 2. Pero si pensamos

en la serie de las fracciones sin considerar a los inconmensurables, esto es, sin

considerar a 2 , no hay fracción alguna que tenga la propiedad de dividir la serie en

dos partes de este modo, es decir, que todos los miembros de un lado tengan cuadrados

menores que 2, y en el otro lado mayores que 2. Por lo tanto, en la serie de las

fracciones existe un cuasi-vacío en donde 2 debería estar. Esta presencia de cuasi-

vacíos en la serie de las fracciones podría parecer algo sin importancia; pero cualquier

matemático que leyera esto, sabe que la posible ausencia de límites o de máximos en

una clase de números, que aún no se ha propagado sobre toda la serie de los números,

no es un tema sin importancia. Para evitar esta dificultad y que no haya vacíos, se

recurre a los inconmensurables.

Existe otra diferencia incluso más fundamental entre las dos series. Podemos

reordenar las fracciones en una serie como la de los enteros, esto es, con un primer

término, y que cada término tenga un sucesor inmediato (excepto el primer término) y

un predecesor inmediato. Veamos cómo se puede hacer. Cada término en la serie de

fracciones y enteros es escrito en forma fraccional, esto es, 1

1 para 1,

1

2para 2, y así

para todos los enteros, con excepción del 0. Además, por el momento, consideraremos

fracciones que son iguales en valor, pero no reducidas a sus términos más bajos, como

distintas; para que, por ejemplo, hasta nuevo aviso, 3

2,

6

4,

9

6,

12

8, etc., sean

reconocidas como distintas. Ahora agrupamos las fracciones en clases al sumar

conjuntamente el numerador y el denominador de cada término. Por el bien de la

brevedad, llamemos a esta suma del numerador y del denominador de una fracción su

índice. Así, 7 es el índice de 3

4, y también de

4

3 y de

5

2. Las fracciones en cada clase

serán fracciones que tienen algún índice específico, y que llamaremos la clase del

índice. Ahora arreglamos estas clases en el orden de magnitud de sus índices. La

45

primera clase tiene el índice 2, y su único miembro es 1

1; la segunda clase tiene el índice

3, y sus miembros son 2

1 y

1

2; la tercera clase tiene el índice 4, y sus miembros son

3

1,

2

2,

1

3; la cuarta clase tiene el índice 5, y sus miembros son

4

1,

3

2,

2

3,

1

4; etc. Es fácil

observar que el número de miembros (todavía incluyendo fracciones no consideradas en

sus términos más bajos) pertenecientes a cualquier clase es uno menos que su índice.

Además, los miembros de cualquier clase pueden ser ordenados en orden al tomar al

primer miembro para que sea la fracción con numerador 1, el segundo miembro que

tenga el numerador 2, etc., hasta )1( −n donde n es el índice. Así, para la clase de índice

n, los miembros aparecen en el orden:

1

1

−n,

2

2

−n,

3

3

−n,…,

1

1−n. Los miembros de las primeras cuatro clases han sido, de

hecho, mencionados en este orden. De esta forma, todo el conjunto de fracciones ha

sido arreglado en un orden como el de los enteros:

1

1,

2

1,

1

2,

3

1,

2

2,

1

3,

4

1,

3

2,2

3,

1

4,…,

1

2−n,

1

1

−n,

2

2

−n,

3

3

−n,…,

1

1−n,

n

1, etc.

Ahora podemos deshacernos de todas las repeticiones de fracciones del mismo

valor simplemente sacándolas de la serie cada vez que surjan después de su primera

aparición. En los pocos términos iniciales escritos arriba, 2

2, que está encerrada en

corchetes, es la única fracción que no está en sus términos más bajos. Además, ya había

aparecido antes como 1

1, por lo tanto, debe ser sacada de la serie. Pero la serie todavía

conserva las mismas propiedades, a saber, (a) hay un primer término, (b) cada término

tiene vecinos de al lado, (c) la serie sigue sin fin.

Puede ser probado que no es posible arreglar toda la serie de números reales bajo

esta forma. Este hecho fue descubierto por Georg CANTOR, un eminente matemático

46

alemán; y esto es de mayor importancia para la filosofía de las ideas matemáticas.

Estamos de hecho tocando la franja de los grandes problemas del significado de la

continuidad y del infinito.

Otra extensión del número proviene de la introducción de la idea de lo que ha

sido llamado una operación o un paso, nombres que son respectivamente apropiados

desde puntos de vista ligeramente distintos. Empezaremos con un caso en particular.

Consideremos la declaración 2+3=5. Añadimos 3 a 2 y obtenemos 5. Pensemos en la

operación de sumar 3: denotemos esto como +3. De nuevo, 134 =− . Pensemos en la

operación de restar 3: denotemos esto como 3− . De esta forma, en lugar de considerar

a los números reales en sí mismos, consideraremos las operaciones de sumarlos o

restarlos: en lugar de 2 , consideraremos +2 y 2− , a saber, las operaciones de

sumar 2 y de restar 2 . Entonces, podemos sumar estas operaciones, por supuesto

en un sentido distinto de sumar a aquel en el que sumamos números. La suma de dos

operaciones es la simple operación que tiene el mismo efecto al de si las dos

operaciones fueran aplicadas sucesivamente. ¿En qué orden deben ser aplicadas las dos

operaciones? La respuesta es que es indiferente, porque, por ejemplo,

2+3+1=2+1+3;

de modo que la suma de los pasos +3 y +1 es conmutativa.

Los matemáticos tienen el hábito, que suele ser desconcertante para aquellos

interesados en rastrear los significados, pero que es muy conveniente en la práctica, de

usar el mismo símbolo en sentidos diferentes aunque relacionados. El único requisito

esencial para un símbolo es que, cualquiera que sea su posible variedad de significado,

las leyes formales de su uso sean siempre las mismas. En concordancia con este hábito,

la suma de operaciones es denotada por +, así como lo es la suma de los números.

Entonces podemos escribir

(+3)+(+1)=+4;

donde el + de la mitad en la parte izquierda denota la adición de las operaciones +3 y

+1. Pero no necesitamos ser tan pedantes en nuestro simbolismo, excepto en casos raros

en donde tengamos que rastrear el significado; de manera que siempre sacamos el

47

primer + y los paréntesis de una línea, y nunca escribimos dos + seguidos. Así que la

ecuación de arriba se convierte en:

3+1=4

que interpretamos como simple adición o suma numérica, o como la más elaborada

adición o suma de operaciones que está expresada en la forma previa de escribir la

ecuación, o, por último, como expresión del resultado de aplicar la operación +1 al

número 3 y obtener el número 4. Cualquiera de estas interpretaciones es correcta. Pero

la única interpretación que es siempre posible, bajo ciertas condiciones, es aquella de las

operaciones. Las otras interpretaciones producen, a menudo, resultados sin sentido.

Esto nos conduce a una pregunta, que seguramente surgió en la mente del lector:

¿Cuál es el uso de toda esta elaboración? En este punto nuestro amigo, el hombre

práctico, seguramente insistiría en barrer todas estas telarañas del cerebro. La respuesta

es que lo que está buscando el matemático es generalidad. Esta es una idea digna de ser

puesta al lado de la variable y la forma, porque concierne a una parte fundamental del

procedimiento matemático. Cualquier limitación a la generalidad de los teoremas, de las

pruebas o de la interpretación, resulta odiosa al instinto matemático. Estas tres nociones,

la variable, la forma, y la generalidad, componen una especie de trinidad matemática

que preside a todos los temas relacionados con la materia. Todas ellas surgen de la

misma raíz, a saber, la naturaleza abstracta de la ciencia matemática.

Veamos cómo se logra la generalidad por la introducción de esta idea de las

operaciones. Tomemos la ecuación x+1=3; la solución es x=2. Aquí podemos

interpretar nuestros símbolos como simples números, y el recurso a las “operaciones” es

completamente innecesario. Pero, si x es un simple número, la ecuación x+3=1 no tiene

sentido. Porque x debe ser el número de cosas que permanecen cuando hemos quitado 3

cosas de 1 cosa; y tal procedimiento no es posible. En este momento, nuestra idea de

forma algebraica aparece, formando la generalización bajo otro aspecto. Consideremos,

por lo tanto, la ecuación general de la misma forma que x+1=3. Esta ecuación es x+a=b,

y su solución es abx −= . Aquí nuestras dificultades se agravan; porque esta forma

solamente puede ser usada para la interpretación numérica siempre y cuando b sea

mayor que a, y no podemos decir, sin alguna evaluación, que a y b puedan ser

cualesquiera constantes. En otras palabras, hemos introducido una limitación en la

variabilidad de las “constantes” a y b, que tendremos que arrastrar, como una cadena, a

48

lo largo de todo nuestro razonamiento. Bajo tales condiciones, las investigaciones

matemáticas realmente prolongadas serían imposibles. Cada ecuación estaría enterrada

bajo un montón de limitaciones. Pero si ahora interpretamos nuestros símbolos como

“operaciones”, toda limitación desaparece como por arte de magia. La ecuación x+1=3

da x=+2, la ecuación x+3=1 da 2−=x , la ecuación x+a=b da abx −= , que es una

operación de suma o resta según sea el caso. No necesitamos nunca decidir si ab−

representa la operación de suma o de resta, porque las reglas de procedimiento con los

símbolos son las mismas en cualquier caso.

El objetivo de este trabajo no es escribir un capítulo detallado de álgebra

elemental, sino simplemente el de hacer claras las ideas fundamentales que guían la

formación de la ciencia. De acuerdo con esto, no iremos más allá para explicar las

sutiles reglas por las cuales los “números positivos y negativos” son multiplicados y de

otra manera combinados. Hemos explicado arriba que los números positivos y negativos

son operaciones. También se les ha llamado “pasos”. Así, +3 es el paso por el cual

vamos de 2 a 5, y 3− es el paso hacia atrás por el cual vamos de 5 a 2. Consideremos la

línea 0X dividida bajo la forma explicada en la primera parte del capítulo, de tal manera

que sus puntos representen números.

D’ C’ B’ A’ +1 +2 +3

X’ X

-3 -2 -1 0 A B C D E

Entonces, +2 es el paso de 0 a B, o de A a C, o (si las divisiones son tomadas hacia atrás

a lo largo de 0X’) de C’ a A’, o de D’ a B’, etc. De manera similar, 2− es el paso de 0 a

B’ o de B’ a D’, o de B a 0, o de C a A.

Podemos considerar el punto que es alcanzado por un paso desde 0, como

representativo de ese paso. Así, A representa +1, B representa +2, A’ representa 1− , B’

representa 2− , etc. Debe ser notado que, mientras que previamente con los números

reales “no asignados”, los puntos de un lado de 0 eran (a lo largo de 0X) solamente

representativos de números, ahora, con los pasos, cada punto en toda la línea que se

extiende a ambos lados de 0 es representativo de un paso. Esta es una representación

pictórica de la generalidad superior introducida por los números positivos y negativos, a

saber, las operaciones o los pasos. Estos números “asignados” son también casos

49

particulares de lo que se ha llamado vectores (del latín veho, “Yo saco” o “Yo llevo”).

Porque podemos pensar en una partícula que es llevada de 0 a A, o de A a B.

Al sugerir en páginas anteriores que el hombre práctico tendría objeciones a las

sutilezas relacionadas con la introducción de los números positivos y negativos,

estábamos difamando a ese excelente individuo. Porque en verdad estamos ante uno de

sus más grandes triunfos. Si la verdad debe ser dicha, fue el hombre práctico el primero

un utilizar los símbolos −+ y . Su origen no es muy claro, pero parece probable que

surgieron de las marcas hechas en los bienes de los almacenes alemanes, para denotar

exceso o defecto de algunos pesos estándar. La primera referencia a ellos está en un

libro publicado en Leipzig en 1489. La primera vez que fueron utilizados en las

matemáticas, fue en un libro publicado en Nuremberg en 1544, obra de un hombre

llamado STIFEL. Pero es solamente en los años recientes cuando a los alemanes se les

ha considerado un pueblo práctico. Existe un viejo epigrama que asigna el imperio del

mar a los ingleses, el de la tierra a los franceses, y el de las nubes a los alemanes.

Seguramente fue en las nubes en donde los alemanes buscaron los símbolos −+ y ; las

ideas que estos símbolos han generado son tan importantes para el bienestar de la

humanidad, que no pudieron haber surgido del mar o de la tierra.

Las posibilidades de aplicación de los números positivos y negativos resultan

muy obvias. Si las longitudes en una dirección son representadas por un número

positivo, las de la dirección opuesta son representadas por números negativos. Si una

velocidad en una dirección es positiva, la de la dirección opuesta es negativa. Si la

rotación alrededor de una esfera en dirección opuesta a las manecillas del reloj es

positiva, aquella siguiendo las manecillas del reloj es negativa. Si un balance en el

banco es positivo, un sobregiro es negativo. Si la electrificación vítrea es positiva, la

electrificación resinosa es negativa. De hecho, en este último caso, los términos

electrificación positiva y electrificación negativa, considerados como simples nombres,

han prácticamente dejado en desuso a los otros términos. Una serie sin fin de ejemplos

podría ser dada. La idea de números positivos y negativos ha sido la más exitosa de las

sutilezas matemáticas.

50

CAPÍTULO VII

NÚMEROS IMAGINARIOS

Si las ideas matemáticas tratadas en el último capítulo han tenido un cierto éxito

en general, las del presente capítulo han logrado despertar una atención e interés muy

parecidos. Pero el éxito de estas últimas ha sido de un tipo distinto, ha sido lo que los

franceses llaman un succès de scandale. No solamente el hombre práctico, sino también

los hombres de letras y los filósofos han expresado su desconcierto ante la devoción de

algunos matemáticos por las misteriosas entidades que, por su nombre, declaran ser

imaginarias. En este punto cabe aclarar que un cierto tipo de intelecto menor está

siempre preocupando a sí mismo y a los demás con discusiones como la aplicabilidad

de términos técnicos. ¿Son los números inconmensurables propiamente llamados

números? ¿Son los números positivos y negativos realmente números? ¿Son los

números imaginarios realmente imaginarios y números?, son algunos ejemplos de estas

preguntas estériles. Ahora bien, es difícil de entender que en la ciencia, los nombres de

los términos técnicos sean asignados de manera arbitraria, como son asignados los

nombres a los niños. Es imposible responder sobre si los nombres son correctos o

incorrectos. Más bien, podrían responder a un juicio o a otro, al ser asignados de tal o

cual manera para ser fácilmente recordados, o para sugerir ideas relevantes o

importantes. Pero el principio esencial involucrado fue claramente enunciado en El País

de las Maravillas a Alicia por Humpty Dumpty cuando le dijo que, a propósito de su uso

de las palabras, “Yo les pago extra y hago que signifiquen lo que yo quiero”. De manera

que no nos preocuparemos en cuanto a si los números imaginarios son imaginarios, o si

son números, sino tomaremos la frase como el nombre arbitrario de cierta idea

matemática, de la que nos ocuparemos ahora.

El origen de la concepción es muy similar a aquella de los números positivos y

negativos: se debe también a las tres grandes ideas matemáticas, a saber, la variable, la

forma algebraica, y la generalización. Los números positivos y negativos surgieron de la

consideración de ecuaciones como x+1=3, x+3=1, y de la forma general x+a=b. De

manera similar, el origen de los números imaginarios se debe a ecuaciones como

x2+1=3, x2+3=1, y x2+a=b. Se sigue exactamente el mismo proceso. La ecuación x2+1=3

se vuelve x2=2, y esto tiene dos soluciones, o x= + 2 , o 2−=x . La declaración que

51

indica que existen estas soluciones alternativas, se escribe usualmente como x= ± 2 .

Hasta ahora todo es fácil, como lo fue en el caso anterior. Pero ahora surge una

dificultad análoga. Porque la ecuación x2+3=1 da x2= 2− , y no existe algún número

positivo o negativo que, cuando sea multiplicado por sí mismo, sea un cuadrado

negativo. Por lo tanto, si nuestros símbolos tienen el sentido de los números positivos y

negativos ordinarios, no existe solución para x2= 2− , y la ecuación no tiene sentido.

Así, si tomamos la forma general x2+a=b, encontramos el par de soluciones

)( abx −±= , si y sólo si b no es menor que a. De acuerdo con esto, no podemos decir

que las “constantes” a y b sean cualesquiera números, esto es, las “constantes” a y b no

son, como deberían ser, “variables” independientes e irrestrictas; y de nuevo surgen los

problemas de las limitaciones y las restricciones.

La misma labor de antes nos espera nuevamente: debemos dar una nueva

interpretación a nuestros símbolos, para que las soluciones ± )( ab− para la ecuación

x2+a=b siempre tengan sentido. En otras palabras, necesitamos una interpretación de los

símbolos para que a siempre tenga sentido si a es positivo o negativo. Desde luego,

la interpretación debe ser tal que todas las leyes ordinarias formales de la adición

(suma), sustracción (resta), multiplicación y división se mantengan; y tampoco debe

interferir con la generalidad hemos alcanzado con el uso de los números positivos y

negativos: de hecho, debe en un sentido incluirlos como casos especiales. Cuando a es

negativa, podemos escribir 2c− por ella, de modo que c2 sea positiva. Entonces

a = )( 2c− = 2)1( c×−

= )1(− 2c = c )1(−

Por lo tanto, si podemos interpretar nuestros símbolos de tal manera que )1(− tenga

un significado, hemos alcanzado nuestro objetivo. Así, )1(− ha venido a ser

considerada como la más importante de todas las cantidades imaginarias.

Esta tarea de encontrar una interpretación para )1(− es mucho más difícil que

la tarea análoga de interpretar 1− . De hecho, mientras que el más fácil de los problemas

era solucionado casi instintivamente tan pronto como aparecía, no ocurrió lo mismo en

un primer momento, ni siquiera para los más grandes matemáticos, con otro tipo de

52

problemas. Ecuaciones como 32 −=x , cuando surgieron, fueron simplemente

consideradas como sinsentido.

Sin embargo, fue siendo percibida gradualmente, a lo largo del siglo dieciocho, e

incluso antes, la conveniencia de que una interpretación pudiera ser asignada a estos

símbolos sinsentido. Se había hecho ya un razonamiento formal de estos símbolos,

simplemente asumiendo que obedecían a las leyes algebraicas ordinarias de

transformación; y se vio que un importante cúmulo de resultados interesantes surgiría si

estos símbolos pudieran ser usados legítimamente. Muchos matemáticos no tenían muy

claro el principio de la lógica de su procedimiento, y ganó terreno la idea de que, de un

modo misterioso, los símbolos que no significaran nada podían ser adecuadamente

manipulados para producir pruebas válidas de proposiciones. Nada puede ser más falso.

Un símbolo que no tiene un significado propiamente definido no es un símbolo. Es

solamente una mancha de tinta con una forma fácilmente reconocible sobre un papel.

No se puede probar nada a partir de la sucesión de manchas de tinta, excepto la

existencia de una pluma defectuosa o de un escritor descuidado. Fue durante esta época

que el epíteto “imaginario” fue aplicado a )1(− . Lo que estos matemáticos habían

conseguido probar fue una serie de proposiciones hipotéticas, de la cual esta es la forma

en blanco: Si las interpretaciones existen para )1(− y para la adición (suma),

sustracción (resta), multiplicación y división de )1(− que satisfacen las reglas

ordinarias del álgebra (por ejemplo, x+y=y+x, etc.), entonces tales y tales resultados se

conseguirán. Fue natural que los matemáticos no siempre apreciaran el gran “Si”, que

debió haber precedido las declaraciones de sus resultados.

Como puede esperarse, la interpretación - cuando fue encontrada - fue un asunto

mucho más elaborado que aquel de los números negativos, y se requiere la atención del

lector para que se pueda dar una explicación preliminar. Ya hemos visto la

representación de un punto por dos números. Con la ayuda de los números positivos y

negativos podemos ahora representar la posición de cualquier punto en un plano por un

par de tales números.

53

Fig. 8

Entonces tomemos el par de líneas rectas X0X’ y Y0Y’, en ángulos rectos, como los

“ejes” desde los cuales empezaremos todas nuestras mediciones. Las longitudes

medidas a lo largo de 0X y 0Y son positivas, y las medidas hechas hacia atrás a lo largo

de 0X’ y 0Y’ son negativas. Supongamos que un par de números escritos en orden (por

ejemplo, +3, +1) - de modo que haya un primer número (+3 en el ejemplo de arriba), y

un segundo número (+1 en el ejemplo de arriba) - representa mediciones desde 0 a lo

largo de X0X’ para el primer número, y a lo largo de Y0Y’ para el segundo número.

Así, (Cf. fig. 9), en (+3, +1) una longitud de 3 unidades debe ser medida a lo largo de

X0X’ en la dirección positiva, esto es, desde 0 hacia X, y una longitud +1 debe ser

medida a lo largo de Y0Y’ en la dirección positiva, esto es, desde 0 hacia Y. De manera

similar, en )1,3( +− la longitud de 3 unidades debe ser medida desde 0 hacia X’, y de 1

unidad desde 0 hacia Y’. También en )1,3( −− las dos longitudes deben ser medidas a lo

largo de 0X’ y 0Y’, respectivamente, y en )1,3( −+ a lo largo de 0X y 0Y’,

respectivamente. Llamemos por el momento a tal par de números una “pareja

ordenada”. Entonces, pueden ser generadas ocho parejas ordenadas de los dos números

1 y 3, a saber

(+1, +3), )3,1( +− , )3,1( −− , )3,1( −+

(+3, +1), )1,3( +− , )1,3( −− , )1,3( −+

54

Cada una de estas ocho “parejas ordenadas” dirige un proceso de medición a lo

largo de X0X’ y Y0Y’ que es diferente de aquel dirigido por cualquier otra de las

parejas.

Los procesos de medición representados por las últimas cuatro parejas

ordenadas, son dados de manera pictórica en la figura. Las longitudes 0M y 0N

corresponden conjuntamente a (+3, +1), las longitudes 0M’ y 0N a )1,3( +− , 0M’ y 0N’

a )1,3( −− y 0M y 0N’ a )1,3( −+ .

Fig. 9

Pero al completar los distintos rectángulos, es fácil observar que el punto P determina

completamente y es a la vez determinado por la pareja ordenada (+3, +1), el punto P’

por )1,3( +− , el punto P’’ por )1,3( −− y el punto P’’’ por )1,3( −+ . De manera más

general, en la figura previa (8) el punto P corresponde a la pareja ordenada (x,y), donde

x e y son ambas asumidas como positivas, el punto P’ corresponde a (x’,y), donde x’ es

asumida como negativa, P’’ a (x’,y’), y P’’’ a (x,y’). Entonces tenemos una pareja

ordenada (x,y), donde x e y son cualesquiera números positivos o negativos, y el punto

correspondiente determina recíprocamente unos a otros. Es conveniente introducir

algunos nombres para esta coyuntura. En la pareja ordenada (x,y) el primer número x es

llamado la “abscisa” del punto correspondiente, y el segundo número y es llamado la

“ordenada” del punto, y los dos números juntos son llamados las “coordenadas” del

55

punto. La idea de determinar la posición de un punto por sus “coordenadas” no fue de

ninguna manera nueva en el momento en que la teoría de los “imaginarios” se estaba

formando. Esta idea se debe a DESCARTES, el gran matemático y filósofo francés, y

aparece en su Discurso, publicado en Leyden en 1637. La idea de la pareja ordenada

considerada en sí misma es el resultado de los esfuerzos para interpretar a los

imaginarios en la forma más abstracta posible.

Debe ser notado como una ilustración más de esta idea de la pareja ordenada,

que el punto M en la fig. 9 es la pareja (+3, 0), el punto N es la pareja (0, +1), el punto

M’ la pareja )0,3(− , el punto N’ la pareja )1,0(− , y el punto 0 la pareja (0, 0).

Otra forma de representar la pareja ordenada (x,y) es pensando en ella como

representando la línea punteada 0P (Cf. fig. 8), en vez del punto P. De esta forma, la

pareja ordenada representa una línea trazada desde un “origen”, 0, de una cierta longitud

y en una cierta dirección. La línea 0P puede ser llamada la línea vectorial de 0 a P, o el

paso de 0 a P. Podemos ver, por lo tanto, que en este capítulo solamente hemos

extendido la interpretación formal que dimos de los números positivos y negativos. Este

método de representación por vectores es muy útil cuando consideramos el significado

que debe ser asignado a las operaciones de adición (suma) y multiplicación de las

parejas ordenadas.

Entraremos ahora en esta cuestión, y preguntaremos qué significado

encontramos conveniente para asignar a la adición (suma) de las dos parejas ordenadas

(x,y) y (x’,y’). La interpretación debe (a) hacer que el resultado de la adición (suma) sea

otra pareja ordenada, (b) hacer la operación conmutativa, de tal forma que (x,y) +

(x’,y’)=(x’,y’), (x,y), (c) hacer la operación asociativa para que

{( x,y)+(x’,y’)}+( u,v)=(x,y)+{(x’,y’)+(u,v)},

(d) hacer el resultado de la sustracción (resta) único, para que cuando busquemos

determinar la pareja ordenada incógnita (x,y) para satisfacer la ecuación

(x,y)+(a,b)=(c,d),

solamente hay una y una única respuesta que podamos representar por

),(),(),( badcyx −= .

Todos estos requisitos son satisfechos si tomamos (x,y)+(x’,y’) para significar la pareja

ordenada (x+x’, y+y’). De acuerdo con esto, por definición ponemos

(x,y)+(x’,y’)= (x+x’, y+y’).

56

Nótese que aquí hemos adoptado el hábito matemático de usar el mismo símbolo + en

sentidos diferentes. El símbolo + en la parte izquierda de la ecuación tiene el nuevo

significado de + que estamos definiendo ahora; mientras que los dos símbolos + en la

parte derecha tienen el significado de la adición (suma) de números positivos y

negativos (operaciones), que fue definido en el último capítulo. Ninguna confusión

práctica surge de este doble uso.

Como ejemplos de adición tenemos

(+3, +1) + (+2, +6) = (+5, +7),

)1,3( −+ + )6,2( −− = )7,1( −+ ,

(+3, +1) + )1,3( −− = (0, 0).

Queda entonces establecido para nosotros el significado de sustracción.

Encontramos que

),(),(),( vyuxvuyx −−=− .

Así

(+3, +2) - (+1, +1) = (+2, +1),

y

)2,1()4,2()2,1( +−=−+−−+ ,

y

)5,3()3,2()2,1( −−=++−−− .

Es fácil ver que

),(),(),(),( vuyxvuyx −−+=− .

También

(x,y) - (x,y) = (0, 0).

Por lo tanto, (0, 0) debe ser visto como la pareja ordenada cero. Por ejemplo

(x,y) + (0, 0) = (x,y).

La representación pictórica de la adición de parejas ordenadas es sorprendentemente

fácil.

57

Fig. 10

Dejemos que 0P represente (x,y) de modo que 0M=x y PM=y; dejemos que 0Q

represente (x1,y1) de modo que 0M1=x1 y QM1=y1. Completemos el paralelogramo 0PRQ

por las líneas punteadas PR y QR, entonces la diagonal 0R es la pareja ordenada (x+x1,

y+y1). La línea PS es paralela a 0X; entonces, evidentemente, los triángulos 0QM1 y

PRS son en todos los aspectos iguales. Por lo tanto, MM’=PS=x1, y RS=QM1; y

entonces

0M’=0M+MM’= x+x1,

RM’=SM’+RS=y+y1

Así, 0R representa la pareja ordenada como es requerido. Esta figura puede ser

también trazada con 0P y 0Q en otros cuadrantes.

Es obvio que aquí hemos vuelto a la ley del paralelogramo, que fue mencionada

en el capítulo VI, sobre las leyes del movimiento siendo aplicadas a velocidades y

fuerzas. Debe ser recordado que, si 0P y 0Q representan dos velocidades, se dice que

una partícula se está moviendo con una velocidad igual a las dos velocidades sumadas si

se está moviendo con la velocidad 0R. En otras palabras, se dice que 0R es el resultante

de las dos velocidades 0P y 0Q. Las fuerzas actuando en un punto de un cuerpo pueden

ser representadas por líneas de igual forma que las velocidades; y la misma ley del

paralelogramo sigue siendo válida, a saber, que el resultante de las dos fuerzas 0P y 0Q

58

es la fuerza representada por la diagonal 0R. De esto se sigue que podemos considerar a

las parejas ordenadas como representando una velocidad o una fuerza, y la regla que

acabamos de dar para la adición de parejas ordenadas representa las leyes

fundamentales de la mecánica para la adición de fuerzas y velocidades. Una de las

características más fascinantes de las matemáticas es el modo en que las ideas y

resultados de diferentes partes de la materia encajan unos con otros. Durante las

discusiones de este y de los capítulos precedentes hemos sido guiados simplemente por

las consideraciones más abstractas de las matemáticas puras; y sin embargo, al final de

ellos, hemos llegado de nuevo a las leyes más fundamentales de la naturaleza, leyes que

deben estar en la mente de cualquier ingeniero cuando diseña un motor, y de cualquier

arquitecto naval cuando calcula la estabilidad de un barco. No es ninguna paradoja decir

que en nuestros estados de ánimo más teóricos podemos estar más cerca que nunca de

nuestras más prácticas aplicaciones.

59

CAPÍTULO VIII

NÚMEROS IMAGINARIOS (Continuación)

La definición de la multiplicación de parejas ordenadas es guiada por

exactamente las mismas consideraciones que las de la adición. La interpretación de la

multiplicación debe ser tal que

(α) el resultado sea otra pareja ordenada,

(β) la operación sea conmutativa, a fin de que

(x,y)× (x’,y’) = (x’,y’) × (x,y),

(γ) la operación sea asociativa, a fin de que

{(x,y)× (x’,y’)} × (u,v)=(x,y)× {( x’,y’) × (u,v)},

(δ) debe hacer el resultado de la división único [con una excepción para el caso

de la pareja del cero (0, 0)], para que cuando busquemos determinar la pareja incógnita

(x,y) para satisfacer la ecuación

(x,y)× (a,b) = (c,d),

haya una y solamente una respuesta, que podamos representar por

(x,y) = (c,d) ÷ (a,b), o por (x,y) = ),(

),(

ba

dc.

(ε) Además, la ley que involucra a la adición y a la multiplicación, llamada ley

distributiva, debe ser satisfecha, a saber

(x,y)× {( a,b)+(c,d)} = {( x,y)× (a,b)}+{( x,y)× (c,d)}.

Todas estas condiciones (α), (β), (γ), (δ), (ε) pueden ser satisfechas por una

interpretación que, aunque parece complicada al principio, es capaz de una simple

interpretación geométrica.

Por definición ponemos

(x,y)× )','( yx = { )''( yyxx− , )''( yxxy+ } (A)

Esta es la definición del significado del símbolo × cuando está escrito entre dos

parejas ordenadas. Se sigue evidentemente de esta definición que el resultado de la

multiplicación es otra pareja ordenada, y que el valor de la parte derecha de la ecuación

(A) no se ve alterado por intercambiar simultáneamente x con x’, e y con y’. Por lo

tanto, las condiciones (α) y (β) están satisfechas. La prueba de la satisfacción de (γ), (δ)

y (ε) es igualmente fácil cuando hemos dado una interpretación geométrica, que

60

haremos en un momento. Pero antes de hacer esto, sería interesante hacer una pausa y

ver si hemos alcanzado el objetivo por el que toda esta elaboración empezó.

Llegamos a ecuaciones de la forma x2 = 3− , para las cuales no existía solución

en términos de números reales positivos y negativos. Después vimos que todas nuestras

dificultades desaparecían si podíamos interpretar la ecuación x2 = 1− , por ejemplo, si

podíamos definir )1(− para que )1(− × )1(− = 1− .

Ahora consideremos las tres parejas ordenadas especiales* (0,0), (1,0) y (0,1).

Ya hemos probado que

(x,y)+(0,0) = (x,y)

Además, ahora tenemos

(x,y)× (0,0) = (0,0).

Por consiguiente, tanto para la adición como para la multiplicación, la pareja

(0,0) juega el papel del cero en la aritmética y en el álgebra elementales; compárense las

ecuaciones de arriba con x+0=x, y con x×0=0.

De nuevo consideremos (1,0): esto juega el papel del 1 en la aritmética y álgebra

elementales. En estas ciencias elementales, la característica especial de 1 es que x×1=x,

para todos los valores de x. Ahora, de acuerdo con nuestra ley de multiplicación

(x,y)× (1,0) = { )0( −x , (y+0)} = (x,y).

Así, (1,0) es la unidad de pareja.

Consideremos finalmente (0,1): esto interpretará para nosotros el símbolo

)1(− . El símbolo debe entonces poseer la propiedad característica de que

)1(− × )1(− = 1− . Ahora, por la ley de multiplicación de parejas ordenadas tenemos

(0,1)× (0,1) = { )10( − , (0+0)} = )0,1(− .

Pero (1,0) es la unidad de pareja, y )0,1(− es la unidad de pareja negativa; de

modo que (0,1) tiene la propiedad deseada. Existen, sin embargo, dos raíces previstas de

1− , a saber, ± )1(− . Consideremos )1,0(− ; de nuevo recordando aquí que 1)1( 2 =− ,

encontramos, )1,0(− × )1,0( − = )0,1(− .

De esta forma, )1,0(− es la otra raíz cuadrada de )1(− . De acuerdo con esto,

las parejas ordenadas (0,1) y )1,0(− son las interpretaciones de ± )1(− en términos de

* En lo siguiente, seguiremos la costumbre de omitir el signo + en lo posible; así, (1, 0) es (+1, 0) y (0, 1) es (0, +1).

61

parejas ordenadas. ¿Pero cuál corresponde a cuál? ¿(0,1) corresponde a + )1(− y

)1,0( − a )1(−− , o (0,1) a )1(−− y )1,0( − a + )1(− ? La respuesta es que es

perfectamente indiferente que simbolismo adoptemos.

Las parejas ordenadas pueden ser divididas en tres tipos, (i) el tipo “imaginario

complejo” (x,y), en donde ni x ni y son cero; (ii) el tipo “real” (x,0); (iii) el tipo

“imaginario puro” (0,y). Consideremos las relaciones que estos tipos tienen unos con

otros. Primero multipliquemos la pareja del tipo “imaginario complejo” (x,y) con la

pareja del tipo “real” (a,0), y obtenemos

(a,0)× (x,y) = (ax,ay).

Así, el efecto es simplemente multiplicar cada término de la pareja (x,y) por el

número real - positivo o negativo - a.

Segundo, multipliquemos la pareja del tipo “imaginario complejo” (x,y) con la

pareja del tipo “imaginario puro” (0,b), y obtenemos

(0,b)× (x,y) = ),( bxby− .

Aquí el efecto es más complicado, y será mejor comprendido en la interpretación

geométrica a la que procederemos después de estudiar otros tres casos especiales.

Tercero, multipliquemos la pareja “real” (a,0) con la imaginaria (0,b), y

obtenemos

(a,0)× (0,b) = (0,ab).

Cuarto, multipliquemos las dos parejas “reales”, (a,0) y (a’,0), y obtenemos

(a,0)× (a’,0) = (aa’,0).

Quinto, multipliquemos las dos “parejas imaginarias”, (0,b) y (0,b’), y

obtenemos

)0,'()',0(),0( bbbb −=× .

Ahora centremos nuestra atención en la interpretación geométrica, comenzando

con unos casos especiales. Tomemos las parejas (1,3) y (2,0) y consideremos la

ecuación

(2,0)× (1,3) = (2,6)

62

En el diagrama (fig. 11), el vector 0P representa (1,3), el vector 0N representa

(2,0) y el vector 0Q representa (2,6). Así, el producto (2,0)× (1,3) es encontrado

geométricamente al tomar la longitud del vector 0Q como el producto de las longitudes

de los vectores 0P y 0N, y (en este caso) al producir que 0P a Q sea de la longitud

requerida. De nuevo, consideremos el producto (0,2)× (1,3), tenemos

(0,2)× (1,3) = )2,6(− .

El vector 0N corresponde a (0,2) y el vector 0R a )2,6(− . De esta forma, 0R -

que representa el nuevo producto - está en ángulos rectos a 0Q, además de poseer la

misma longitud. Nótese que tenemos a la misma ley regulando la longitud de 0Q como

en el caso previo, a saber, que su longitud es el producto de las longitudes de los dos

vectores que son multiplicados; pero ahora que tenemos a 0N1 a lo largo del eje “de

ordenadas” 0Y, en lugar de 0N a lo largo del eje “de abscisas” 0X, la dirección de 0P se

ha convertido a través de un ángulo recto.

Hasta ahora, en estos ejemplos de multiplicación, hemos visto al vector 0P como

modificado por los vectores 0N y 0N1. Debemos obtener una pista para la ley general de

la dirección al invertir el modo de pensar sobre esto, y pensar en los vectores 0N y 0N1

como modificados por el vector 0P. La ley de la longitud se mantiene intacta; la

longitud resultante es la longitud del producto de los dos vectores. La nueva dirección

de la ampliada 0N (es decir, 0Q) es encontrada al rotarla en la dirección (opuesta a las

manecillas del reloj) de rotación desde 0X hasta 0Y a través de un ángulo igual al

63

ángulo P0X: es un accidente de este caso particular que esta rotación haga que 0Q se

extienda a lo largo de la línea 0P. De nuevo, consideremos el producto de 0N1 y 0P; la

nueva dirección de la ampliada 0N1 (es decir, 0R), es encontrada al rotar 0N en la

dirección (opuesta a las manecillas del reloj) de rotación a través de un ángulo igual al

ángulo P0X, a saber, el ángulo N10R es igual al ángulo P0X.

La regla general para la representación geométrica de la multiplicación puede ser

enunciada así:

El producto de los dos vectores 0P y 0Q es un vector 0R, cuya longitud es el

producto de las longitudes de 0P y 0Q y cuya dirección 0R es tal que el ángulo R0X es

igual a la suma de los ángulos P0X y Q0X.

Por lo tanto, podemos concebir al vector 0P como haciendo rotar al vector 0Q a

través de un ángulo P0X (es decir, el ángulo R0Q = al ángulo P0X), o al vector 0Q

haciendo rotar al vector 0P a través de un ángulo Q0X (es decir, el ángulo R0P = al

ángulo Q0X).

No probaremos esta ley general, porque ello implicaría entrar en procedimientos

matemáticos más técnicos que exceden los fines de este libro. Pero ahora podemos ver,

de manera inmediata, que la ley asociativa [señalada con (γ) arriba] para la

multiplicación está satisfecha. Consideremos primero la longitud del vector resultante;

64

ésta se obtiene por medio del proceso ordinario de multiplicación para números reales; y

así, la ley asociativa es suficiente para ella.

Por otra parte, la dirección del vector resultante se obtiene por medio de la

simple adición (suma) de los ángulos, y la ley asociativa es suficiente para la dirección

también.

Se ha dicho lo necesario sobre la multiplicación. Hemos indicado de manera

rápida, al considerar la multiplicación y la adición, cómo puede ser construida, sobre un

plano, un álgebra o un “cálculo” de vectores, que es tal que cualesquiera dos vectores en

el plano pueden ser sumados, o restados, y pueden ser multiplicados o divididos uno por

otro.

No hemos considerado los detalles técnicos de todos estos procesos porque nos

llevaría demasiado lejos en detalles matemáticos; pero hemos mostrado el modo general

de proceder. Cuando interpretamos nuestros símbolos algebraicos de esta forma,

estamos empleando “cantidades imaginarias” o “cantidades complejas”. Estos términos

son solamente referencias, y tenemos demasiado sobre qué pensar como para detenernos

a preguntar si son términos bien escogidos o no.

El resultado neto de nuestras investigaciones es que cualesquiera ecuaciones

como x+3 = 2 o (x+3)2 = 2− pueden siempre ser interpretadas en términos de vectores,

y encontrar soluciones para ellas. Al buscar por tales interpretaciones debe tenerse en

cuenta que 3 se convierte en (3,0), 2− se convierte en )0,2(− , y x es la pareja

“incógnita” (u,v): así que las dos ecuaciones se convierten, respectivamente, en

(u,v)+(3,0) = (2,0) y en {(u,v)+(3,0)}2 = )0,2(− .

Hemos resuelto completamente las dificultades iniciales que atrajeron nuestra

atención tan pronto como consideramos los elementos del álgebra. La ciencia como tal

es mucho más compleja en ideas que aquella con la que nosotros empezamos. En

realidad, hemos creado una ciencia diferente y totalmente nueva que servirá a todos los

propósitos por los cuales la vieja ciencia fue inventada, e incluso más. Pero, antes de

felicitarnos a nosotros mismos por los resultados de nuestra labor, debemos mitigar una

sospecha que para este tiempo debió haber surgido en la mente del estudiante. La

pregunta que el lector debe estar haciéndose es: ¿Dónde va a parar toda esta invención

de nuevas interpretaciones? Es verdad que hemos conseguido interpretar al álgebra de

tal suerte que siempre seamos capaces de resolver una ecuación cuadrática como

0422 =+− xx ; pero existen un sin fin de otras ecuaciones, por ejemplo,

65

0423 =+− xx , x4+x3+2 = 0, etc., sin ningún límite. ¿Tenemos que hacer una nueva

ciencia cada vez que una nueva ecuación aparece?

Si este fuese el caso, todas nuestras investigaciones precedentes - aunque para

algunas mentes puedan parecer divertidas - tendrían una importancia insignificante.

Pero el gran hecho que ha hecho el análisis moderno posible, es que, con la ayuda de

este cálculo de vectores, cada fórmula que surge puede recibir su interpretación propia;

y la cantidad “incógnita” en cada ecuación puede ser demostrada para indicar algún

vector. De este modo, la ciencia está completa en sí misma, por lo menos en lo que a sus

ideas fundamentales concierne. Recibió su forma definitiva al mismo tiempo que la

máquina de vapor estaba siendo perfeccionada, y seguirá siendo una gran y poderosa

arma para que el pensamiento consiga la victoria sobre las cosas cuando los curiosos

especímenes de esa máquina se muestren en los museos junto con los cascos y las

corazas de épocas más antiguas.

66

CAPÍTULO IX

GEOMETRÍA DE COORDENADAS

Los métodos y las ideas de la geometría de coordenadas han sido ya empleados

en los capítulos anteriores. Es tiempo de que los consideremos en sí mismos más de

cerca; y, al hacerlo, debemos fortalecer nuestros lazos con otras ideas que ya hemos

alcanzado. En el presente capítulo, así como en los siguientes, regresaremos a la idea de

los números reales positivos y negativos, e ignoraremos a los números imaginarios,

introducidos en los dos últimos capítulos.

Hemos estado usando continuamente la idea de que, al considerar dos ejes en un

plano, X0X’ e Y0Y’, cualquier punto P en ese plano puede ser determinado en posición

por un par de números positivos o negativos x e y, donde (Cf. fig. 13) x es la longitud

0M e y es la longitud PM. Esta concepción, tan simple como parece, es la idea principal

de la geometría de coordenadas. Su descubrimiento marca una gran época en la historia

del pensamiento matemático. Se debe al filósofo DESCARTES (como ya ha se ha

dicho), y se le ocurrió que podría constituir un importante método matemático mientras

estaba acostado en su cama.

67

Los filósofos, cuando han poseído un conocimiento matemático preciso y exhaustivo,

han enriquecido a la ciencia con muchas de sus mejores ideas. Por otra parte, debe

decirse que, con muy pocas excepciones, todas las observaciones sobre las matemáticas

hechas por aquellos filósofos que han poseído un escaso o precipitado conocimiento

sobre las matemáticas han resultado inútiles, siendo siempre triviales o incorrectas. El

hecho es ciertamente curioso; debido a que las ideas fundamentales de las matemáticas

parecen ser, después de todo, muy simples, incluso casi infantiles, parecen

desenvolverse bien en la esfera del pensamiento filosófico. Es probablemente su misma

simplicidad la causa del error; no estamos acostumbrados a pensar en cosas abstractas

tan sencillas, y es necesario un largo entrenamiento para asegurarnos una inmunidad

parcial ante el error tan pronto como nos desviamos del agotado camino del

pensamiento.

El descubrimiento de la geometría de coordenadas, y también el de la geometría

proyectiva, casi al mismo tiempo, ilustra otro hecho que se ha presentado de manera

continua en la historia del pensamiento, a saber, que algunos de los más grandes

descubrimientos se deben hacer de entre los temas mejor y más conocidos. En el siglo

diecisiete, la geometría había sido ya estudiada por más de dos mil años, aún cuando

instauremos su fecha de nacimiento con los griegos. EUCLIDES (n. 330 a. C.), quien

enseñó en la Universidad de Alejandría, sistematizó y extendió el trabajo de una larga

serie de predecesores, algunos de ellos de gran genio. Después de él, generaciones y

generaciones de matemáticos trabajaron en el mejoramiento de la materia.

Afortunadamente, la geometría no sufrió de aquella fatal barrera al progreso, a saber,

que su estudio estuviera confinado o reducido a un pequeño grupo de hombres de origen

y puntos de vista similares, sino todo lo contrario. En el siglo diecisiete, la geometría

había pasado por las mentes de los egipcios, de los griegos, de los árabes y de los

alemanes. Y, aún después de todo el trabajo dedicado a esta ciencia durante tantas

épocas y por tantos hombres de mentes tan diversas, sus secretos más importantes aún

no se habían descubierto. Nadie pudo haber estudiado los principios elementales de la

geometría sin haber percibido la falta de un método que sirviera como guía. Cada

proposición tiene que ser probada por una exhibición de ingenuidad; y, a una ciencia

para la que esto es cierto, le falta el gran requisito del pensamiento científico: el método.

Las remotas deducciones de una ciencia matemática no son muy importantes

teóricamente. La ciencia no ha sido perfeccionada, hasta que consista, en esencia, en la

exposición de métodos propios relacionados unos con otros por los que la información,

68

sobre cualquier tema que tenga que ver con la materia, pueda ser fácilmente obtenida. El

crecimiento de una ciencia no se debe a su aumento, sino a sus ideas; cuanto más crecen

las ideas, menos son las deducciones que valen la pena hacer constar.

Desafortunadamente, las matemáticas están siempre estorbadas por la repetición, en los

libros de texto, de innumerables proposiciones subsidiarias, cuya importancia se ha

perdido por su absorción en casos particulares de verdades más generales y - como ha

hemos insistido - la generalidad es el alma de las matemáticas.

La geometría de coordenadas ilustra también otra característica de las

matemáticas a la que ya hemos aludido, a saber, que las ciencias matemáticas, mientras

se desarrollan, encajan unas con otras y comparten las mismas ideas en común. No es

exagerado decir que las distintas ramas de las matemáticas experimentan un perpetuo

proceso de generalización y que, a medida que se generalizan, se unen. Aquí de nuevo

la razón de esto se encuentra en la misma naturaleza de la ciencia, su generalidad, es

decir, del hecho de que la ciencia trata con verdades generales que se aplican a todas las

cosas en virtud de su propia existencia como cosas. En esta conexión, el interés de la

geometría de coordenadas se encuentra en el hecho de que relaciona conjuntamente a la

geometría - que empezó siendo la ciencia del espacio - con el álgebra - que tuvo sus

orígenes en la ciencia del número -.

Recordemos ahora las principales ideas de las dos ciencias, y veamos después

cómo se relacionan gracias al método de coordenadas de DESCARTES. Tomemos al

álgebra en primer lugar. No nos complicaremos la existencia al recurrir a los

imaginarios, y sólo pensaremos en los números reales con signos positivos o negativos.

La idea fundamental es la de un número cualquiera, el número variable, que es denotado

por una letra y no por cualquier número definido. Después procedemos a la

consideración de las correlaciones entre las variables. Por ejemplo, si x e y son dos

variables, podemos concebirlas como correlacionadas por las ecuaciones x+y = 1, o por

1=− yx , o en cualquier otra forma. Esto a la vez nos conduce a la aplicación de la idea

de la forma algebraica. Pensamos, de hecho, en cualquier correlación interesante de

cualquier tipo, yendo desde la concepción inicial de los números variables a la

concepción secundaria correlaciones variables de los números. De esta forma,

generalizamos la correlación x+y = 1, en la correlación ax+by = c. Aquí a, b, y c, siendo

letras, representan cualesquiera números y son de hecho variables ellas mismas. Pero

son las variables que determinan la correlación variable; y la correlación, cuando es

determinada, correlaciona los números variables x e y. Las variables del tipo a, b, y c de

69

arriba, que son usadas para determinar la correlación, son llamadas “constantes” o

parámetros. El uso del término “constante” en esta conexión para lo que es realmente

una variable puede parecer extraño al principio, pero realmente es muy natural. Y esto

es porque la investigación matemática tiene que ver con la relación entre las variables x

e y, después de que a, b, c hayan sido determinadas. Así que en un sentido, relativo a x e

y, las “constantes” a, b, y c son constantes. En consecuencia, ax+by = c representa el

ejemplo general de una cierta forma algebraica, a saber, el de una correlación variable

perteneciente a cierta clase.

Entonces generalizamos x2+y2 = 1 en ax2+by2 = c, o, aún más, en ax2+2hxy+by2

= c, o, aún más, en ax2+hxy+by2+2gx+2fy = c. Aquí de nuevo nos vemos llevados a

correlaciones variables que están indicadas por sus distintas formas algebraicas.

Ahora pasemos a la geometría. El nombre de la ciencia nos recuerda a figuras y

diagramas exhibiendo triángulos, rectángulos, cuadrados y círculos, todos ellos en

relaciones especiales unos con otros. El estudio de las simples propiedades de estas

figuras es la materia principal de la geometría elemental, tal como es normalmente

introducida al principiante. A pesar de eso, un pensamiento menos superficial sobre el

tema demuestra que esa no es la verdadera concepción de la materia. Es conveniente

para un niño que comience sus razonamientos geométricos sobre las formas, como los

triángulos y los cuadrados, que ha recortado con unas tijeras. ¿Pero qué es, no obstante,

un triángulo? Es una figura marcada y limitada por tres trozos de tres líneas rectas.

Ahora bien, la limitación de espacios por trozos de líneas es una idea muy

complicada, y de ninguna manera una idea que dé alguna esperanza para poder exhibir

las simples concepciones generales que deberían formar la columna vertebral de la

materia. Buscamos algo más simple y más general. Fue esta obsesión con las ideas

iniciales erróneas- por cierto, sumamente naturales y buenas para la creación de los

primeros pensamientos sobre el tema - la causa de esterilidad del estudio de la ciencia

durante tantos siglos. La geometría de coordenadas, y DESCARTES su inventor, deben

tener el crédito de divulgar los objetos simples y verdaderos del pensamiento

geométrico.

En lugar de pensar en un trozo de una línea recta, pensemos en el todo de una

línea recta a lo largo de su interminable longitud en ambas direcciones. Este es el tipo

de idea general desde la cual debemos empezar nuestras investigaciones geométricas.

Parece ser que los griegos nunca encontraron algún uso para esta concepción, que es

fundamental para todo el pensamiento geométrico moderno. EUCLIDES siempre

70

contempla una línea recta como trazada entre dos puntos definidos, y es muy cuidadoso

al mencionar cuándo la línea debe ser producida más allá de estos segmentos. Nunca

piensa en la línea como una entidad dada de una vez por todas como un todo. Esta

cuidadosa definición y limitación, para excluir un infinito no inmediatamente aparente a

los sentidos, fue muy característica de los griegos en todas sus distintas actividades.

Está manifestada en la diferencia entre la arquitectura griega y la gótica, y entre la

religión griega y la moderna. La torre en una catedral gótica y la importancia de una

línea recta ilimitada en la geometría moderna son características emblemáticas de la

transformación del mundo moderno.

La línea recta, considerada como un todo, es la idea principal desde la que parte

la geometría moderna. Pero también otros tipos de líneas se nos ocurren, y así llegamos

a la concepción de la curva completa, que en cada punto exhibe alguna característica

uniforme, así como la línea recta exhibe en todos los puntos la característica de rectitud.

Por ejemplo, el círculo exhibe, en todos los puntos, la característica de estar a una

distancia dada desde su centro; y también está la elipse, que es una curva ovalada, tal

que la suma de las dos distancias de cualquier punto en ella desde dos puntos fijos,

llamados focos, es constante para todos los puntos en la curva. Es evidente que un

círculo es simplemente un caso particular de una elipse cuando los dos focos están

superpuestos en el mismo punto; porque entonces la suma de las dos distancias es

meramente el doble del radio del círculo. Los antiguos conocían las propiedades de la

elipse y del círculo y, desde luego, los consideraban, a cada una, como un todo. Por

ejemplo, EUCLIDES nunca empieza con simples segmentos (es decir, trozos) de

círculos, que luego se prolongarían, sino que siempre considera al círculo como un todo,

tal como fue descrito. Es ciertamente desafortunado que el círculo no sea la línea

fundamental en la geometría, a fin de que su consideración deficiente sobre la línea

recta pudiera haber tenido menores consecuencias.

Esta idea general de una curva que en cualquier punto de ella exhibe alguna

propiedad uniforme es llamada en geometría “lugar geométrico”. Un lugar geométrico

es la curva (o superficie, si no queremos confinarnos al plano) formada por puntos,

todos de los cuales poseen alguna propiedad dada. A cada propiedad en relación unas

con otras que los puntos puedan tener, corresponde algún lugar geométrico, que consiste

en todos los puntos que posean la propiedad. Al investigar las propiedades de un lugar

geométrico considerado como un todo, consideramos cualquier punto o puntos en el

lugar geométrico. De manera que en la geometría nos encontramos de nuevo con la idea

71

fundamental de la variable. Además, al clasificar a los lugares geométricos con títulos

como líneas rectas, círculos, elipses, etc., encontramos de nuevo la idea de la forma.

De acuerdo con esto, así como en el álgebra nos ocupamos de números

variables, correlaciones entre los números variables, y de la clasificación de las

correlaciones en tipos bajo la idea de la forma algebraica; así en la geometría nos

ocupamos de los puntos variables, de los puntos variables satisfaciendo alguna

condición para formar un lugar geométrico, y de la clasificación de lugares geométricos

en tipos bajo la idea de las condiciones de la misma forma.

La esencia de la geometría de coordenadas es la identificación de la correlación

algebraica con el lugar geométrico. El punto en un plano es representado en el álgebra

por sus dos coordenadas, x e y, y la condición satisfecha por cualquier punto en el lugar

geométrico es representada por la correspondiente correlación entre x e y. Finalmente, a

las correlaciones expresables en alguna forma algebraica general, tal como ax+by = c,

les corresponden lugares geométricos de algún tipo general, cuyas condiciones

geométricas son todas de la misma forma. Hemos llegado a un punto en donde podemos

efectuar un intercambio completo de ideas y resultados entre las dos ciencias. Cada una

de ellas arroja luz sobre la otra, y cada una gana un poder inconmensurable. Es

imposible no sentirse agitado al pensar en las emociones de hombres de ciertos

momentos históricos de aventura y descubrimiento: Colón cuando vio por vez primera

la costa occidental, Pizarro cuando observó el Océano Pacífico, Franklin cuando apreció

la chispa eléctrica que venía del lazo de su cometa, GALILEO cuando giró por vez

primera su telescopio hacia los cielos. Tales momentos se les conceden también a los

estudiantes en las regiones abstractas del pensamiento, y muy arriba de entre todos ellos

debe estar la mañana cuando DESCARTES estaba costado en la cama e inventó el

método de la geometría de coordenadas.

Cuando uno ha comprendido la idea de la geometría de coordenadas, la cuestión

inmediata que le viene a la mente es ¿qué tipos de lugares geométricos corresponden a

las bien conocidas formas algebraicas? Por ejemplo, la más simple de entre los tipos

generales de formas algebraicas es ax+by = c. El tipo de lugar geométrico que

corresponde a esto es una línea recta, y a la inversa de cada línea recta corresponde una

ecuación de esta forma. Es una fortuna que lo más simple de entre los lugares

geométricos corresponda a lo más simple de entre las formas algebraicas. En realidad,

es esta correspondencia general de simplicidad geométrica y algebraica lo que otorga a

este tema su poder. Surge del hecho de que la conexión entre geometría y álgebra no es

72

casual ni artificial, sino profunda y esencial. La ecuación que corresponde a un lugar

geométrico es llamada la ecuación del (o “al”) lugar geométrico. Algunos ejemplos de

ecuaciones de líneas rectas nos ayudarán a comprender mejor el tema.

Consideremos 0=− xy ; aquí a, b, y c de la forma general han sido

reemplazados por 1, 1− , y 0 respectivamente. Esta línea pasa a través del “origen”, 0,

en el diagrama y forma una bisectriz* del ángulo X0Y. Esta es la línea L’0L del

diagrama. El hecho de que pase por el origen, 0, es fácil de ver al observar que la

ecuación es satisfecha al poner x = 0 e y = 0 simultáneamente, y 0 y 0 son las

coordenadas de 0. En realidad, es también fácil generalizar y ver por el mismo método

que la ecuación de cualquier línea a través del origen es de la forma ax+by = 0. El lugar

geométrico de la ecuación y+x = 0 también pasa a través del origen y divide al ángulo

X’0Y en dos partes iguales: es la línea L10L1’ del diagrama.

Consideremos ahora 1=− xy : el lugar geométrico correspondiente no pasa a través del

origen. Por lo tanto tenemos que buscar dónde corta los ejes. Debe cortar al eje de x en

algún punto de las coordenadas x y 0. Al poner y = 0 en la ecuación, obtenemos x = 1− ;

así que las coordenadas de este punto (A) son 1− y 0. De manera similar, para el punto

(B) donde la línea corta el eje 0Y las coordenadas son 0 y 1. El lugar geométrico es la

línea AB en la figura y es paralela a L0L’. De manera similar, y+x = 1 es la ecuación de * Es decir, divide en dos partes iguales al ángulo. Nota del Traductor.

73

la línea A1B de la figura; y el lugar geométrico es paralelo a L10L1’. Es fácil probar el

teorema general de que dos líneas representadas por ecuaciones de las formas ax+by = 0

y ax+by = 0 son paralelas.

El grupo de lugares geométricos a los que nos referiremos ahora es lo

suficientemente importante como pare que ocupe otro capítulo. Pero antes de eso,

pensaremos un poco más sobre las principales ideas de este tema.

La posición de cualquier punto P es determinada al escoger arbitrariamente un

origen, 0, dos ejes, 0X y 0Y en ángulos rectos, y después al señalar sus coordenadas x e

y, es decir, 0M y PM. También, como vimos en el último capítulo, P puede ser

determinada por el “vector” 0P, donde la idea del vector incluye una dirección y una

longitud determinadas. Desde un punto de vista matemáticamente abstracto, la idea de

un origen arbitrario podría parecer artificial y tosca, y similarmente para los ejes 0X y

0Y trazados arbitrariamente. Pero en relación con la aplicación de las matemáticas a los

eventos del Universo, estamos simbolizando con franca simplicidad el hecho más

fundamental respecto al punto de vista del mundo que nos ofrecen nuestros sentidos.

Cada uno de nosotros dirige nuestras percepciones sensibles de las cosas a un origen

que llamamos “aquí”: nuestra ubicación en una parte especial del espacio alrededor de

la cual agrupamos a todo el Universo es el hecho específico de nuestra existencia

corporal. Podemos imaginar seres que observan todos los fenómenos en todo el espacio

con un mismo ojo, siendo imparciales a favor de cualquier parte. Con nosotros sucede

lo contrario, un cato en nuestros pies reclama más atención que un terremoto en Cabo de

Hornos, o que la destrucción de un mundo en la Vía Láctea. Es verdad que al construir

un conocimiento común con los otros humanos tenemos que renunciar a algo del

egoísmo de nuestro “aquí” individual. Sustituimos “cerca de aquí” por “aquí”; así,

medimos millas desde el ayuntamiento de la ciudad más cercana, o desde la capital del

país. En la medición de la Tierra, los hombres de ciencia pondrían el origen en el centro

de aquella; de la misma manera que los astrónomos ponen su origen en el centro del

Sol. Pero, por más lejos que este último origen pueda estar, e incluso si vamos más allá

y lo ponemos en el centro de las estrellas fijas más cercanas, comparado con los

inconmensurables infinitos del espacio, es cierto que nuestro primer procedimiento al

explorar el Universo es fijar un origen “cerca de aquí”.

De nuevo la relación de las coordenadas 0M y MP (es decir, x e y) al vector 0P

es un caso de la famosa ley del paralelogramo, como puede verse fácilmente (Cf.

diagrama) al completar el paralelogramo 0MPN. La idea del “vector” 0P, esto es, de una

74

magnitud dirigida, es la idea principal de la ciencia física. Cualquier cuerpo en

movimiento tiene una cierta magnitud de velocidad en una cierta dirección o, lo que es

lo mismo, su velocidad es una magnitud dirigida, un vector. Una fuerza tiene una cierta

magnitud y una dirección definida. Así, cuando son introducidas las ideas de “origen”,

“coordenadas”, y “vectores” en la geometría analítica, estamos estudiando las

concepciones abstractas que corresponden a los hechos fundamentales del mundo físico.

75

CAPÍTULO X

SECCIONES CÓNICAS

Cuando los geómetras griegos estaban exhaustos, como ellos pensaban, de las

más obvias e interesantes propiedades de figuras hechas de líneas rectas y círculos,

dirigieron su atención al estudio de otras curvas; y, con su casi infalible instinto para

acertar en las cosas sobre las que vale la pena pensar, se dedicaron a las secciones

cónicas, es decir, a las curvas en las que los planos cortan las superficies de los conos

circulares. El hombre que tiene el crédito de inventar este estudio es MENECMO (375-

325 a. C.), alumno de PLATÓN y uno de los tutores de Alejandro Magno. Este último,

por cierto, es un gran ejemplo de las ventajas de la buena instrucción, porque otro de sus

tutores fue el filósofo ARISTÓTELES. Podemos suponer que Alejandro encontraba a

MENECMO un profesor aburrido, porque se sabe que alguna vez le pidió que hiciera

las pruebas más cortas, a lo que MENECMO respondió: “En el país hay caminos

privados e incluso reales, pero en la geometría hay un mismo camino para todos”. Esta

respuesta fue lo suficientemente verdadera en el sentido de que fue entendida

inmediatamente por Alejandro. Pero si MENECMO pensaba que sus pruebas no podían

ser más cortas, estaba gravemente equivocado; y la mayoría de los matemáticos

modernos estarían terriblemente aburridos si fueran obligados a estudiar las pruebas

griegas para las propiedades de las secciones cónicas. Nada ilustra mejor el aumento de

poder que es obtenido por la introducción de ideas relevantes en una ciencia que el

observar la progresiva reducción de las pruebas que acompaña al crecimiento de la

abundancia de ideas. Existe un cierto tipo de matemático que siempre está impaciente al

tratar con las ideas de una materia: está siempre ansioso por obtener las pruebas de los

problemas “importantes”. La historia de la ciencia está totalmente en contra de él. Sin

duda existen caminos reales* en la ciencia; pero aquellos que primero los pisan son

hombres de genio, y no reyes.

La forma en la que las secciones cónicas se presentaron por primera vez en las

mentes de los matemáticos fue como sigue: pensemos en un cono (Cf. fig. 15), cuyo

* Whitehead utiliza la palabra “royal” para referirse a “reales”. La palabra de Whitehead (“royal”) se refiere a real en un sentido político-social, a saber, “los caminos de la monarquía o de los reyes”. Lo mismo para el ejemplo de Alejandro Magno y la respuesta de Menecmo. Nota del Traductor.

76

vértice (o punto) es V, de pie sobre una base circular STU. Por ejemplo, la sombra

cónica de una luz eléctrica es un tipo de tal superficie. Ahora dejemos que todas las

generatrices* que pasan a través de V y yacen en la superficie sean producidas al revés;

el resultado es un doble cono, y PQR es otra sección circular en el lado opuesto de V a

la sección circular STU. El eje del cono CVC’ pasa a través de todos los centros de

estos círculos y es perpendicular a sus planos, que son paralelos el uno al otro. En el

diagrama las partes de las curvas que se supone yacen detrás del plano del papel son

líneas punteadas, y las partes en el plano o enfrente de él son líneas continuas. Ahora

supongamos que este doble cono es cortado por un plano no perpendicular al eje CVC’

o, por lo menos, no necesariamente perpendicular. Entonces surgen tres casos:

(1) El plano puede cortar al cono en una curva oval cerrada, tal como ABA’B’,

que se encuentra en uno de los dos medio-conos. En este caso el plano no se encontrará

con el otro medio-cono de ninguna manera. Tal curva es llamada elipse; es una curva

ovalada. Un caso particular de tal sección del cono es cuando el plano es perpendicular

al eje CVC’, entonces la sección, tal como STU o PQR, es un círculo. Por lo tanto, el

círculo es un caso particular de elipse.

(2) El plano puede ser paralelo a una de las generatrices del cono, como por

ejemplo el plano de la curva D1A1D1 en el diagrama es paralelo a la generatriz VS; la

curva está todavía confinada a uno de los medio-conos, pero ahora no es una curva oval

cerrada, sino que sigue sin fin siempre y cuando la generatriz del medio-cono sea

producida lejos del vértice. Tal sección cónica se llama parábola.

(3) El plano puede cortar ambos medio-conos, de tal manera que la curva

completa consiste en dos porciones separadas, o “ramas” como son llamadas; este caso

está ilustrado por las dos ramas G2A2G2 y L2A2L2, que conjuntamente conforman la

curva. Ninguna rama está cerrada, cada una de ellas se extiende sin fin mientras los dos

medio-conos estén prolongados lejos del vértice. Tal sección cónica se llama hipérbola.

Existen, por lo tanto, tres tipos de secciones cónicas, a saber, las elipses, las

parábolas y las hipérbolas. Es fácil reconocer que, en un sentido, las parábolas son casos

límite que se encuentran entre las elipses y las hipérbolas. Ellas forman un tipo más

especial y tienen que satisfacer una condición más particular. Estos tres nombres se

deben aparentemente a APOLONIO DE PERGA (n. alrededor de 260 a. C. - alrededor

* Líneas que conforman una figura geométrica. Nota del Traductor.

77

de 200 a. C.), quien escribió un tratado sistemático sobre secciones cónicas que se

mantuvo como el trabajo estándar hasta el siglo dieciséis.

Debe ser evidente a la vez cuán incómoda y difícil debió haber sido para los

geómetras griegos la investigación de las propiedades de estas curvas.

Las curvas son curvas planas, y aún así su investigación requiere trazar en perspectiva

una figura sólida. Así que en el diagrama de arriba prácticamente no tenemos trazadas

líneas subsidiarias y con todo eso la figura es lo suficientemente complicada.

78

Las curvas son curvas planas, y parece obvio que podríamos ser capaces de definirlas

sin ir más allá del plano, esto es, sin tener que recurrir a una figura sólida.

Al mismo tiempo, así como en la definición “sólida” hay un método uniforme de

definición - a saber, la sección de un cono por un plano - que produce tres casos, así

también en la definición “plana” debe haber un método uniforme de proceder que

79

produzca tres casos. Sus formas, cuando son trazadas en sus planos, son aquellas de las

líneas curvas en las tres figuras 16, 17 y 18.

Los puntos A y A’ en la figura son llamados los vértices y la línea AA’ el eje mayor.

Debe ser notado que una parábola (Cf. fig. 17) tiene solamente un vértice. APOLONIO

probó* que la proporción de PM a AM.MA’, esto es,

MAAM

PM

.

2

se mantiene constante

tanto para la elipse como para la hipérbola (figs. 16 y 18), y que la proporción de PM2 a

AM es constante para la parábola de la fig. 17; y basó la mayor parte de su trabajo en

este hecho. Estamos evidentemente avanzando hacia la deseada definición uniforme que

no va más allá del plano; pero aún no hemos alcanzado la suficiente uniformidad.

En los diagramas 16 y 18, dos puntos, S y S’, están marcados, y en el diagrama

17, un punto, S. Estos son los focos de las curvas, y son puntos de la mayor

importancia. APOLONIO sabía que para una elipse la suma de SP y S’P (es decir,

SP+S’P) es constante, mientras P se mueva en la curva y es igual a AA’. Similarmente

para una hipérbola la diferencia SPPS −' es constante, e igual a AA’ cuando P está en

una rama, y la diferencia, ''' PSSP− , es constante e igual a AA’ cuando P esté en la otra

rama. Pero ningún punto correspondiente parecía existir para la parábola.

* Cf. Ball, loc. cit., para este aporte de Apolonio y Pappus.

80

Finalmente, 500 años después, el último gran geómetra griego, PAPPUS DE

ALEJANDRÍA, descubrió el secreto final que completó esta línea de pensamiento. En

los diagramas 16 y 18 hay dos líneas, XN y X’N’, y en el diagrama 17 la única línea

XN. Estas son las directrices de las curvas, dos para la elipse, dos para la hipérbola, y

una para la parábola. Cada directriz corresponde a su foco más cercano. La propiedad

característica de un foco, S, y su correspondiente directriz, XN, para cualquiera de los

tres tipos de curva, es que la proporción SP a PN, es decir, PN

SP, es constante, donde PN

es la perpendicular en la directriz de P, y P es cualquier punto en la curva. Hemos por

fin encontrado la deseada propiedad de las curvas que no requiere que nos vayamos del

plano, y está fijada uniformemente para las tres curvas. Para las elipses, la proporción

PN

SP es menor a 1, para las parábolas es igual a 1, y para las hipérbolas es mayor a 1.

Cuando PAPPUS terminó sus investigaciones, debió sentir que, aparte de

extensiones menores, el tema estaba prácticamente agotado; y si hubiera podido prever

el transcurso de la historia de la ciencia por más de mil años, hubiera confirmado sus

creencias. Aunque en verdad las ideas más fructíferas en conexión con esta rama de las

matemáticas no habían sido ni siquiera tocadas, y nadie hubiera pensado acerca de sus

sumamente importantes aplicaciones en la naturaleza. Ninguna advertencia más

impresionante puede darse a aquellos que confinan el conocimiento y la investigación a

lo que es aparentemente útil, que la reflexión de que las secciones cónicas fueron

estudiadas como simple ciencia abstracta por más de dieciocho siglos, sin más utilidad

que la de satisfacer el anhelo de conocimiento de los matemáticos, y que, después de

este largo periodo de estudio abstracto, se encontró que esta ciencia constituía la llave

necesaria con la que se podía alcanzar el conocimiento de una de las más importantes

leyes de la naturaleza.

Mientras tanto, el estudio de la astronomía, ajeno a las secciones cónicas, había

seguido evolucionando. El gran astrónomo griego PTOLOMEO (muerto en 168 d. C.),

publicó su tratado estándar sobre la materia en la Universidad de Alejandría, explicando

los movimientos aparentes entre las estrellas fijas del Sol y los planetas por la

concepción de que la Tierra estaba en reposo y el Sol y los planetas dando vueltas

alrededor. Durante los siguientes trece siglos el número y la exactitud de las

observaciones astronómicas creció, con el resultado de que la descripción de los

movimientos de los planetas dada por PTOLOMEO se volvió cada vez más y más

81

complicada. COPÉRNICO (1473-1543) señaló que los movimientos de estos cuerpos

celestes podría ser explicado de una manera más simple si se supusiera que el Sol está

en reposo, y la Tierra y los planetas fueron concebidos como moviéndose alrededor de

él. Sin embargo, todavía pensó en estos movimientos como esencialmente circulares,

aunque modificados por un conjunto de pequeñas correcciones superpuestas

arbitrariamente a los movimientos circulares primarios. Así quedó el asunto cuando

KEPLER nació en 1571 en Stuttgart, Alemania. Había dos ciencias, una era la

geometría de las secciones cónicas y la otra era la astronomía; ambas habían sido

estudiadas desde tiempos remotos sin la menor sospecha de ninguna conexión entre

ellas. KEPLER era un astrónomo, pero era también un geómetra muy capaz, y en lo que

a secciones cónicas se refiere, había llegado a ideas avanzadas para su época. Él es uno

de los muchos ejemplos que refutan la falsedad de la idea de que el éxito en la

investigación científica demanda una exclusiva absorción en una única y estrecha línea

de estudio. Las nuevas ideas son más aptas para surgir de mentes con una inusual

variedad de conocimiento - no necesariamente conocimiento vasto - y con una

concepción de los métodos e ideas de las distintas líneas del pensamiento. Debe

recordarse que Charles Darwin llegó a su concepción de la ley de la evolución al leer el

famoso Ensayo sobre la población de Malthus, un tema que trataba de un tema diferente

o, por lo menos, así se pensaba.

KEPLER enunció tres leyes del movimiento planetario, las primeras dos en

1609, y la tercera diez años después. Son las siguientes:

(1) Las órbitas de los planetas son elipses, el Sol siendo el foco.

(2) Mientras un planeta se mueve en su órbita, el radio vector del Sol al planeta

barre áreas iguales en tiempos iguales.

(3) Los cuadrados de los tiempos periódicos de los distintos planetas son

proporcionales a los cubos de sus ejes mayores.

Estas leyes probaron ser sólo un paso hacia el desarrollo de una teoría más fundamental

de estas ideas. NEWTON (1642-1727) concibió la idea de la gravitación universal, a

saber, que cualesquiera dos piezas de materia se atraen entre ellas con una fuerza

proporcional al producto de sus masas e inversamente proporcional al cuadrado de sus

distancias. Esta majestuosa ley general, acoplada con las tres leyes generales del

movimiento que puso en la forma general final, probó ser adecuada para explicar todos

los fenómenos astronómicos, incluyendo las leyes de KEPLER, y ha sido la base de la

física moderna. Entre otras cosas, probó que los cometas se pueden mover en elipses

82

muy alargadas, o en parábolas, o en hipérbolas, que son casi parábolas. Los cometas que

regresan - como el cometa de Halley - se deben mover, desde luego, en elipses. Pero el

paso esencial en la prueba de la ley de la gravitación - e incluso en la sugestión de su

concepción inicial - fue la verificación de las leyes de KEPLER conectando los

movimientos de los planetas con la teoría de las secciones cónicas.

Desde el siglo diecisiete en adelante, la teoría abstracta de las curvas ha

colaborado con el doble renacimiento de la geometría debido a la introducción de la

geometría de coordenadas y de la geometría proyectiva. En la geometría proyectiva las

ideas fundamentales se agrupan alrededor de la consideración de conjuntos (o haces,

como son llamados) de líneas pasando a través de un punto común (el vértice del

“haz”).

Ahora bien, (Cf. fig. 19) si A, B, C, D, son cualesquiera cuatro puntos fijos en una

sección cónica y P es un punto variable en la curva, el haz de líneas PA, PB, PC, y PD,

tiene una propiedad especial, conocida como la constancia de su proporción doble. Será

suficiente decir aquí que la proporción doble es una idea fundamental en la geometría

proyectiva. Para la geometría proyectiva esta es realmente la definición de las curvas, o

alguna propiedad análoga que es equivalente a ella. Se verá qué tan lejos, en el curso de

siglos de estudio, nos hemos alejado de la vieja idea original de las secciones de un

cono circular. Ahora sabemos que los griegos se habían aferrado a una propiedad menor

83

de relativamente pequeña importancia; aunque por alguna fortuna divina las curvas en sí

mismas merecieron toda la atención que se les dio. Este elemento no importante de la

idea de “sección” está ahora eliminado en la ordinaria fraseología matemática, que

simplemente dice “cónicas” en lugar de “secciones cónicas”.

Finalmente, regresamos al punto en el que dejamos a la geometría de

coordenadas en el último capítulo. Habíamos preguntado cuál era el tipo de lugares

geométricos correspondiente a la forma algebraica general ax+by = c, y encontramos

que era la clase de líneas rectas en un plano. Vimos también que cada línea recta posee

una ecuación de esta forma, y que cada ecuación de esta forma corresponde a una línea

recta. Ahora queremos ir al siguiente tipo general de formas algebraicas. Esto se

consigue evidentemente al introducir términos que involucren a x2, xy, e y2. Así, la

nueva forma general debe ser escrita como sigue:

ax2+2hxy+by2+2gx+2fy+c = 0

¿Qué representa esto? La respuesta es que siempre representa una sección cónica, y,

además, que la ecuación de cada sección cónica puede siempre ser puesta en esta forma.

La discriminación de los tipos particulares de cónicas dados por esta forma de ecuación

es muy fácil. Depende enteramente de la consideración de 2hab− , donde a, b, y h son

las “constantes”, como está escrito arriba. Si 2hab− es un número positivo, la curva es

una elipse; si 02 =− hab , la curva es una parábola; y si 2hab− es un número negativo,

la curva es una hipérbola.

Por ejemplo, pongamos a = b = 1, h = g = f = 0, c = 4− . Entonces tenemos la

ecuación x2+y2 4− = 0. Es fácil probar que esta es la ecuación de un círculo, cuyo

centro está en el origen, y el radio es 2 unidades de longitud. Ahora, 2hab− se vuelve

2011 −× , esto es, 1, y es por lo tanto positivo. Por consiguiente, el círculo es un caso

particular de la elipse, como debe ser. Generalizando, la ecuación de cualquier círculo

puede ser puesta en la forma a(x2+y2)+2gx+2fy+c = 0. Por tanto, 2hab− se vuelve

02 −a , esto es, a2, que es necesariamente positivo. De acuerdo con esto, todos los

círculos satisfacen la ecuación de las elipses.

La forma general de la ecuación de una parábola es

(dx+ey)2+2gx+2fy+c = 0,

de tal forma que los términos del segundo grado, como son llamados, pueden escribirse

como un cuadrado perfecto. Para hacerlo, tenemos

d2x2+2dexy+e2y2+2gx+2fy+c;

84

de tal forma que por comparación a = d2, h = de, b = e2, y entonces

0)( 2222 =−=− deedhab . Por consiguiente, la condición necesaria está

automáticamente satisfecha. La ecuación 042 =−xy , donde a = b = g = f = 0, h = 1,

4−=c , representa una hipérbola, porque la condición 2hab− se vuelve 210− , esto es,

1− , que es negativo.

Algunos casos excepcionales que son incluidos en la forma general de la

ecuación pueden no ser inmediatamente reconocidos como secciones cónicas. Al

escoger debidamente las constantes la ecuación puede ser hecha para representar dos

líneas rectas. Se puede decir que dos líneas rectas que se intersectan encajan en la idea

griega de una sección cónica. Porque, al referirnos al dibujo del doble cono de arriba, se

puede ver que algunos planos a lo largo del vértice, V, cortan el cono en un par de líneas

rectas que intersectan en V. El caso de dos líneas rectas paralelas puede ser incluido al

considerar un cilindro circular como un caso particular de un cono. Entonces un plano,

que lo corte y que sea paralelo a su eje, lo cortará en dos líneas rectas paralelas. De

cualquier manera, hayan permitido o no los griegos que estos casos especiales sean

llamados secciones cónicas, éstos están incluidos entre las curvas representadas por la

forma algebraica general del segundo grado. Vale la pena señalar este hecho, porque es

característico de las matemáticas modernas el incluir, entre sus formas generales, todo

tipo de casos particulares que antaño hubieran recibido un tratamiento especial. Esto se

debe a la búsqueda de generalidad.

85

CAPÍTULO XI

FUNCIONES

El uso matemático del término función ha sido adoptado de igual manera en la

vida diaria. Por ejemplo, en la frase “Su humor es una función de su digestión”, el

término es utilizado exactamente en este sentido matemático. Significa que puede ser

asignada una regla por la cual sabremos cuál será su humor si sabemos cómo está

trabajando su digestión. Es claro que la idea de “función” es demasiado simple, y

solamente nos queda ver cómo es aplicada en las matemáticas a números variables.

Pensemos primero en algunos ejemplos concretos: si un tren ha estado viajando a razón

de veinte millas por hora, la distancia (s millas) recorrida después de cualesquiera

número de horas t, está dada por s = 20× t, siendo s una función de t. También 20× t es

la función de t con la que s es idéntica. Si John es un año mayor que Thomas, entonces,

cuando Thomas tenga cualquier edad en x años, la edad de John (en y años) está dada

por y = x+1, e y es una función de x, a saber, es la función x+1.

En estos ejemplos, t y x son llamados los “argumentos” de las funciones en las

que aparecen. Así, t es el argumento de la función 20× t, y x es el argumento de la

función x+1. Si s = 20× t, e y = x+1, entonces s e y son llamados los “valores” de las

funciones 20× t y x+1, respectivamente.

Volviendo al caso general, podemos definir una función matemática como una

correlación entre dos números variables, llamados respectivamente el argumento y el

valor de la función, de tal forma que cualquier valor que es asignado al “argumento de

la función”, el valor del “valor de la función” está definitivamente (es decir,

únicamente) determinado. Lo contrario no es necesariamente verdadero, a saber, que

cuando el valor de la función esté determinado, el argumento estará también únicamente

determinado. Otra funciones del argumento x son y = x2, y = 2x2+3x+1, y = x, y = log x,

y = sen x. Las últimas dos funciones de este grupo serán inmediatamente reconocidas

por aquellos que sepan un poco de álgebra y de trigonometría. No es necesario

explicarlas, ya que solamente fueron escritas a modo de ejemplo.

Hasta este punto, aunque hemos definido lo que queremos decir cuando

hablamos de una función en general, únicamente hemos mencionado una serie de

funciones especiales. Pero las matemáticas, fieles a sus métodos generales de proceder,

86

simbolizan la idea general de cualquier función. Y lo hacen al escribir F(x), f(x), g(x),

φ(x), etc., para cualquier función de x, donde el argumento x es puesto entre paréntesis y

alguna letra como F, f, g, φ, etc., es prefijada al paréntesis para que represente la

función. Sin embargo, esta notación tiene sus defectos, porque obviamente se enfrenta a

la convención de que las letras particulares deben representar números variables; porque

aquí F, f, g, φ, etc., prefijadas a un paréntesis, representan funciones variables. Es fácil

dar ejemplos en donde tengamos que confiar en nuestro sentido común y en el contexto

para saber qué es lo que se pretende decir si se usa este tipo de notación. Una forma de

evadir la confusión es usar letras griegas (por ejemplo, φ de arriba) para las funciones;

otra forma es mantener para f y F (las letras iniciales de la palabra función) la letra de la

función y, si otras funciones variables tienen que ser simbolizadas, tomar una letra

adyacente como g.

Con estas explicaciones y precauciones, escribimos y = f(x) para denotar que y es

el valor de alguna función indeterminada del argumento x, donde f(x) puede ser

cualquier cosa tal como x+1, x2 2− x+1, sen x, log x, o simplemente x en sí misma. El

punto esencial es que cuando x es dada, entonces y es de este modo definitivamente

determinada. Es importante tener muy clara la generalidad de esta idea. Así, en y = f(x),

podemos determinar, si queremos, que f(x) signifique que cuando x es un número

entero, f(x) sea cero, y que cuando x tenga cualquier otro valor, f(x) sea 1. De acuerdo

con esto, al poner y = f(x), con esta elección para el significado de f, y es ó 0 ó 1, de

acuerdo a si el valor de x es entero o no. Así, f(1) = 0, f(2) = 0, f

3

2= 1, f ( )2 = 1,

etc. Esta elección para el significado de f(x) da una función muy buena del argumento x

de acuerdo con la definición general de una función.

Una función, que después de todo no es más que una especie de correlación

entre dos variables, está representada, como otras correlaciones, por una gráfica, que

está en vigor por los métodos de la geometría de coordenadas. Por ejemplo, la fig. 2 del

capítulo II es la gráfica de la función v

1 , donde v es el argumento y p el valor de la

función. En este caso la gráfica está trazada solamente para valores positivos de v, que

son los únicos valores que poseen algún significado para la aplicación física considerada

en ese capítulo. De nuevo, en la fig. 14 del capítulo IX, la longitud total de la línea AB,

ilimitada en ambas direcciones, es la gráfica de la función x+1, donde x es el argumento

e y es el valor de la función; y en la misma figura, la línea ilimitada A1B es la gráfica de

87

la función 1 x− , y la línea L0L’ es la gráfica de la función x, siendo x el argumento e y

el valor de la función.

Estas funciones, que pueden ser expresadas por las simples fórmulas

algebraicas, son adaptadas para ser representadas por gráficas. Pero para algunas

funciones esta representación puede ser engañosa sin una explicación detallada, o puede

resultar incluso imposible. Así, consideremos la función mencionada arriba, que tiene el

valor 1 para todos los valores de su argumento x, excepto para aquellos que sean

enteros, por ejemplo, para x = 0, x = 1, x = 2, etc., en cuyo caso tendrá el valor 0.

Fig. 20

Su aspecto en una gráfica sería el de una línea recta ABA’ trazada paralelamente

al eje X0X’ a una distancia de éste de 1 unidad de longitud. Pero los puntos C1, C2, C3,

C4, etc., correspondientes a los valores 1, 2, 3, 4, etc., del argumento x, se omiten, y en

lugar de ellos debemos considerar a los puntos B1, B2, B3, B4, etc., en el eje 0X. Es fácil

encontrar funciones para las cuales la representación gráfica sea no sólo inconveniente

sino imposible. Las funciones que no se prestan a gráficas son importantes en las

matemáticas más elevadas, pero no necesitamos preocuparnos más de ellas aquí.

La división de funciones más importante es aquella que las divide en funciones

continuas y discontinuas. Una función es continua cuando su valor solamente se altera

de forma gradual por las alteraciones graduales del argumento, y es discontinua cuando

el valor se puede alterar por “saltos bruscos” o “repentinos”. De esta forma, las dos

88

funciones x+1 y x 1− , cuyas gráficas están representadas como líneas rectas en la Fig.

14 del capítulo IX, son funciones continuas, y también lo es la función v

1 , representada

en el capítulo II, si solamente pensamos en valores positivos para v. Pero la función

representada en la Fig. 20 de este capítulo es discontinua, ya que en los valores x = 1, x

= 2, etc., de su argumento, su valor da “saltos bruscos”.

Pensemos en algunos ejemplos de funciones presentes en la naturaleza, a fin de

que entre en nuestra cabeza el sentido real de continuidad y discontinuidad.

Consideremos un tren en su viaje a lo largo de la línea férrea, digamos desde la estación

de Euston hacia Londres. A lo largo de la línea aparecen, en orden, las estaciones de

Bletchley y Rugby. Sea t el número de horas que el tren ha recorrido desde Euston, y s

el número de millas que ha recorrido. Entonces s es una función de t, es decir, es el

valor variable correspondiente al argumento variable t. Si conocemos las circunstancias

de la trayectoria del tren, sabremos s tan pronto como cualquier valor especial de t nos

sea dado. Ahora bien, milagros aparte, podemos asumir naturalmente que s es una

función continua de t. Es imposible concebir al tren como llegando continuamente

desde Euston hasta Bletchley y que de pronto, sin ningún tiempo que intervenga y por

más corto que sea, el tren aparezca en Rugby. La idea es demasiado fantástica como

para que entre en nuestro cálculo: contempla posibilidades que no se encuentran fuera

de Las mil y una noches; e incluso en esos cuentos la discontinuidad pura del

movimiento difícilmente puede ser imaginada; no se atreven a desafiar a nuestra

credulidad con algo más que velocidades anormales. Pero las velocidades anormales no

son ninguna contradicción para la gran ley de la continuidad del movimiento que

aparentemente existe en la naturaleza. Tan es así, que la luz se mueve a una razón de

aproximadamente 190,000 millas por segundo* y viene a nosotros desde el Sol en siete

u ocho segundos; pero, a pesar de esta velocidad, su distancia recorrida es siempre una

función continua del tiempo.

No resulta tan obvio para nosotros que la velocidad de un cuerpo sea

invariablemente una función continua del tiempo. Consideremos al tren en cualquier

tiempo t, moviéndose a alguna velocidad definida, digamos v millas por hora, donde v

es cero cuando el tren está en reposo en una estación y es negativa cuando el tren está

avanzando en reversa. Ahora estamos dispuestos a admitir que v no puede de repente

cambiar su valor por causa de un gran y pesado tren. Ciertamente, el tren no puede estar * Aproximadamente 305,000 kilómetros por segundo. Nota del traductor.

89

avanzando a cuarenta millas por hora de las 11.45 AM hasta el mediodía y, de pronto,

sin ningún lapso o intervalo de tiempo, empezar a avanzar a 50 millas por hora.

Tenemos que admitir que el cambio de velocidad será un proceso gradual. ¿Pero qué

sucede con los golpes repentinos con una magnitud adecuada? Supongamos que dos

trenes chocan; o, para tomar objetos más pequeños, supongamos que un hombre patea

un balón de fútbol. Ciertamente parecería a nuestros sentidos como si el balón

comenzara de pronto a moverse. Así, en el caso de la velocidad, nuestros sentidos no se

perturban con la idea de que aquella sea una función discontinua del tiempo, como sí lo

hicieron con la idea del tren siendo instantáneamente transportado desde Bletchley hasta

Rugby. De hecho, si las leyes del movimiento - con su concepción de masa - son

verdaderas, no existe tal cosa como la velocidad discontinua en la naturaleza. Cualquier

cosa que parezca a nuestros sentidos como un cambio discontinuo de velocidad debe ser

considerado, de acuerdo con estas leyes, como un caso de cambio gradual que es muy

rápido como para ser percibido por nosotros. Sería imprudente, sin embargo,

apresurarse a la generalización de que no hay funciones discontinuas presentes en la

naturaleza. Un hombre que, confiado en que la altura media de la tierra sobre el nivel

del mar entre Londres y París es una función continua de la distancia desde Londres,

camine de noche sobre el acantilado de Shakespeare en Dover contemplando la Vía

Láctea, acabaría muerto antes de que tuviera el tiempo para reorganizar sus ideas sobre

la necesidad de precaución con las conclusiones científicas.

90

Es sumamente fácil encontrar una función discontinua, incluso si nos limitamos a las

más simples de las fórmulas algebraicas. Por ejemplo, tomemos la función y = x

1 , que

ya hemos considerado bajo la forma p = v

1, donde v estuvo confinado a valores

positivos. Pero ahora dejemos que x tenga cualquier valor, positivo o negativo. La

gráfica de la función se muestra en la Fig. 21. Supongamos que x cambia continuamente

desde un valor negativo grande a través de un conjunto numéricamente decreciente de

valores negativos hasta el 0, y de ahí incrementándose a través de la serie de valores

positivos. De acuerdo con esto, si un punto que se esté moviendo, M, representa x en

X0X’, M empieza en el extremo izquierdo del eje X0X’ y se mueve sucesivamente a lo

largo de M1, M2, M3, M4, etc. Los puntos correspondientes en la función son P1, P2, P3,

P4, etc. Es fácil ver que hay un punto de discontinuidad en x = 0, esto es, en el origen 0.

Y esto es así porque el valor de la función en el lado negativo (izquierdo) del origen se

vuelve interminablemente grande, pero negativo, y la función reaparece en el lado

positivo (derecho) como interminablemente grande pero positiva. Por lo tanto, no

importa qué tan pequeños sean M2, M3, hay un salto finito entre los valores de la

función en M2 y M3. En realidad, este caso tiene la peculiaridad de que mientras más

pequeños sean M2, M3 (siempre y cuando “encierren” al origen), más grande es el salto

en valor de la función entre ellos. En esta gráfica se pone de manifiesto lo que es

también aparente en la Fig. 20 de este capítulo, esto es, que para muchas funciones lo

discontinuo solamente ocurre en puntos aislados, de modo que si restringimos los

valores del argumento obtenemos una función continua para estos valores restantes. Es

por lo tanto evidente que si en la Fig. 21 en y = x

1, nos restringimos solamente a valores

positivos y excluimos el origen, obtenemos una función continua. Similarmente para la

misma función, si nos restringimos solamente a los valores negativos, excluyendo el

origen, es continua. De nuevo la función graficada en la Fig. 20 es continua entre B y

C1, y entre C1 y C2, y entre C2 y C3, etc., excluyendo siempre en cada caso a los puntos

finales. Sin embargo, es fácil encontrar funciones en donde lo discontinuo ocurre en

todos los puntos. Por ejemplo, consideremos una función f(x), tal que cuando x es

cualquier número fraccionario f(x) = 1, y que cuando x sea cualquier número irreal o

inconmensurable, f(x) = 2. Esta función es discontinua en todos los puntos.

91

Finalmente, volveremos a pensar en la definición de continuidad que dimos

arriba. Hemos dicho que una función es continua cuando su valor solamente se altera

gradualmente por alteraciones graduales del argumento, y es discontinua cuando éste

puede alterar al valor por saltos bruscos o repentinos. Esta es exactamente el tipo de

definición que satisfizo a nuestros antepasados matemáticos y que ya no satisface a los

matemáticos modernos. Vale la pena dedicarle un tiempo, porque cuando hayamos

entendido las objeciones hechas a esta definición, habremos avanzado un largo trecho

en la comprensión del espíritu de las matemáticas modernas. La diferencia más grande

entre las matemáticas viejas y las nuevas es que los términos vagos y un poco

metafóricos como “gradualmente” ya no son tolerados en sus declaraciones. Las

matemáticas modernas solamente admiten declaraciones, definiciones y argumentos que

empleen exclusivamente las pocas y simples ideas acerca del número, magnitud y

variables sobre los que la ciencia está fundada. Entre dos números, uno puede ser mayor

o menor que el otro, y uno puede ser tal y tal un múltiplo del otro, pero no existe una

relación de “gradualidad” entre dos números, y, por lo tanto, el término es inadmisible.

Esto podría parecer a primera vista una gran pedantería. Para esta acusación hay dos

respuestas. En primer lugar, durante la primera mitad del siglo diecinueve, grandes

matemáticos, especialmente ABEL y WEIERSTRASS, descubrieron que grandes partes

de las matemáticas enunciadas bajo las viejas formas eran simplemente incorrectas.

Thomas Macaulay*, en su ensayo sobre BACON, contrasta la certeza de las

matemáticas con la incertidumbre de la filosofía; y por medio de un ejemplo retórico

afirma: “No ha habido reacción en contra del teorema de Taylor†”. No pudo haber

escogido un peor ejemplo. Porque, sin haber hecho una revisión de los libros de texto

ingleses sobre matemáticas de la época en la que se escribió el ensayo, la suposición

ignora que el teorema de Taylor fue enunciado y probado como erróneo cada vez. El

ansia de precisión de las matemáticas modernas es necesaria para la precisión. En

segundo lugar, es necesaria para la investigación. Es buena para la claridad y audacia

del pensamiento, y también para la fertilidad mental al intentar nuevas combinaciones

de ideas. Cuando las declaraciones iniciales son vagas y poco correctas, en cada paso

subsecuente del pensamiento el sentido común tiene que intervenir para limitar las

aplicaciones y para explicar los significados. En el pensamiento creativo el sentido

común es un mal maestro. Su único criterio para juzgar dicta que las nuevas ideas tienen

* Thomas Babington Macaulay (1800-1859), político, historiador y poeta británico. Nota del Traductor. † Brook Taylor (1685-1731), matemático británico. Nota del Traductor.

92

que parecerse a las viejas. En otras palabras, solamente puede actuar suprimiendo la

originalidad.

Al avanzar hacia una definición precisa de la continuidad (aplicada a las

funciones), debemos considerar más de cerca la declaración que afirma que no hay

relación de “gradualidad” entre los números. Se puede preguntar, ¿no puede un número

ser levemente más grande que otro número o, en otras palabras, no puede ser pequeña la

diferencia entre dos números? El punto central es que en un sentido abstracto - aparte de

alguna aplicación arbitraria - no existe tal cosa como un número grande o pequeño. Un

millón de millas es un número pequeño de millas para un astrónomo que investiga las

estrellas fijas, pero un millón de libras esterlinas es una gran sueldo anual. De nuevo, un

cuarto del sueldo de una persona es una fracción grande para ser donada a la caridad,

pero es una pequeña fracción si se piensa como lo único que va a usar esa persona para

sus cosas privadas. Se pueden enumerar interminables ejemplos para demostrar que

grande o pequeño no tienen, en ningún sentido, una aplicación abstracta en los números.

Podemos decir de dos números que uno es mayor o menor que el otro, pero no sin antes

especificar las circunstancias particulares que hacen que un número sea grande o

pequeño. Nuestra tarea es, por lo tanto, definir la continuidad sin hacer mención alguna

a conceptos como “pequeño” o cambio “gradual” en el valor de la función.

Para hacer esto, daremos nombres a ideas que también nos serán útiles cuando

más adelante consideremos los límites y el cálculo diferencial.

Un “intervalo” de valores del argumento x de una función f(x) es todos los

valores que están entre dos valores del argumento. Por ejemplo, el intervalo entre x=1 y

x=2 consiste en todos los valores que x puede tomar entre 1 y 2, es decir, consiste en

todos los números reales entre 1 y 2. Pero estos números no necesariamente tienen que

ser enteros. Un intervalo de valores del argumento contiene un número a, cuando a es

un miembro del intervalo. Por ejemplo, el intervalo entre 1 y 2 contiene 2

3,

3

5,

4

7, etc.

Un conjunto de números se aproxima a un número a dentro de una k estándar,

cuando la diferencia numérica entre a y cualquier número del conjunto es menor que k.

Aquí k es el “estándar de aproximación”. De esta forma, el conjunto de números 3, 4, 6,

8, se aproxima al número 5 dentro del estándar 4. En este caso el estándar 4 no es el más

pequeño que pudimos haber escogido; el conjunto también se aproxima a 5 dentro de

cualquiera de los estándares 3.1 o 3.01 o 3.001. De nuevo, los números 3.1, 3.141,

93

3.1415, 3.14159, se aproximan a 3.13102 dentro del estándar .032, y también dentro del

estándar más pequeño .03103.

Estas dos ideas de intervalo y aproximación a un número dentro de un estándar

son lo suficientemente sencillas; su única dificultad es que pueden parecer triviales.

Pero cuando son combinadas con nuestra siguiente idea, la de la “proximidad” de un

número, forman el fundamento del razonamiento matemático moderno. ¿Qué queremos

expresar cuando decimos que algo es verdadero para una función f(x) en la proximidad

del valor a del argumento x? Tenemos que hacer más precisa esta noción.

Los valores de una función f(x) poseen una característica en la “proximidad de

a” cuando algún intervalo pueda ser encontrado tal que, (i) contenga al número a no

como un punto final, y (ii) sea tal que cada valor de la función para los argumentos, que

no sean a y que esté dentro del intervalo, posea la característica. El valor f(a) de la

función para el argumento a puede o no poseer la característica. Nada está decidido en

este punto por declaraciones acerca de la proximidad de a.

Por ejemplo, supongamos que tomamos la función particular x2. En la

proximidad de 2, los valores de x2 son menores que 5. Porque podemos encontrar un

intervalo, por ejemplo desde 1 a 2.1, que (i) contenga a 2 no como punto final, y que (ii)

sea tal que, para valores de x estando dentro del intervalo, x2 sea menor que 5.

Ahora, combinando las ideas precedentes, sabemos qué es lo que se expresar

cuando decimos que en la proximidad de a la función f(x) se aproxima a c dentro del

estándar k. Esto significa que puede ser encontrado algún intervalo tal que (i) incluya a

a no como un punto final, y (ii) sea tal que todos los valores de f(x), donde x se

encuentra en el intervalo y no es a, difieren de c por menos de k. Por ejemplo, en la

proximidad de 2, la función x se aproxima a 1.41425 dentro del estándar .0001. Esto

es verdad porque la raíz cuadrada de 1.99996164 es 1.4142, y la raíz cuadrada de

2.00024449 es 1.4143; por lo tanto, para los valores de x que se encuentran en el

intervalo de 1.99996164 a 2.00024449, que contiene a 2 no como punto final, todos los

valores de la función x yacen entre 1.4142 y 1.4143, y, por lo tanto, todos difieren de

1.41425 por menos de .0001. En este caso podríamos, si queremos, fijar un estándar

más pequeño de aproximación, por ejemplo, .000051 o .0000501. De nuevo, para tomar

otro ejemplo, en la proximidad de 2, la función x2 se aproxima a 4 dentro del estándar

.5. Porque (1.9)2 = 3.61 y (2.1)2 = 4.41., y, de esta forma, ha sido encontrado el intervalo

requerido entre 1.9 y 2.1 que contenga a 2 no como punto final. Este ejemplo pone de

94

manifiesto el hecho de que las declaraciones sobre una función f(x) en la proximidad de

un número a son distintas de las declaraciones sobre el valor de f(x) cuando x=a. Es

requerida la producción de un intervalo, a través del cual la declaración sea verdadera.

Así, el simple hecho de que 22=4, no justifica por sí mismo el decir que en la

proximidad de 2 la función x2 es igual a 4. Esta declaración puede ser falsa, porque no

se puede producir ningún intervalo con la propiedad requerida. También, el hecho de

que 22=4, no justifica por sí mismo el decir que en la proximidad de 2 la función x2 se

aproxima a 4 dentro del estándar .5; aunque, en realidad, se haya probado la veracidad

de esta declaración.

Si entendemos las ideas precedentes, comprenderemos los fundamentos de las

matemáticas modernas. Recurriremos a ideas análogas en los capítulos sobre las series y

sobre el cálculo diferencial. Mientras tanto, estamos ya preparados para definir a las

“funciones continuas”. Una función f(x) es “continua” en un valor a de su argumento,

cuando en la proximidad de a sus valores se aproximan a f(a) (es decir, a su valor en a

dentro de cada estándar de aproximación).

Esto significa que, cualquier estándar k que escojamos, en la proximidad de a,

f(x) se aproxima a f(a) dentro del estándar k. Por ejemplo, x2 es continua en el valor 2 de

su argumento, x, porque con cualquier k escogido siempre podemos encontrar un

intervalo que (i) contenga a 2 no como un punto final, y (ii) sea tal que los valores de x2

para valores que se encuentren en el intervalo, se aproximen a 4 (es decir, 22) dentro del

estándar k. Así, supongamos que escogemos el estándar .1; (1.999)2=3.996001, y

(2.01)2=4.0401, y ambos difieren de 4 por menos de .1. Por consiguiente, dentro del

intervalo que va de 1.999 a 2.01, los valores de x2 se aproximan a 4 dentro de un

estándar .1. De manera similar, puede ser producido un intervalo para cualquier otro

estándar que queramos intentar.

Tomemos de nuevo el ejemplo del tren. Su velocidad es continua mientras pasa

por el puesto de cambio de agujas, si para cualquier velocidad que se quiera asignar

(digamos un millón de millas por hora), puede ser encontrado un intervalo de tiempo

que se extienda antes y después del instante en el que el tren pasa por este punto, tal que

en todos los instantes dentro del intervalo, la velocidad del tren difiera de aquella con la

que el tren pasó por el puesto de cambio por menos de un millón de millas por hora; y lo

mismo es verdad para cualquier otra velocidad que sea mencionada en lugar de la de un

millón de millas por hora.

95

CAPÍTULO XII

PERIODICIDAD EN LA NATURALEZA

Toda la vida de la naturaleza está dominada por la existencia de eventos

periódicos, esto es, por la existencia de eventos sucesivos tan análogos unos con otros

que, sin forzar demasiado al lenguaje, podríamos denominarlos como recurrencias del

mismo evento. La rotación de la Tierra produce la sucesión de los días. Es verdad que

cada día es diferente de los días precedentes, no importa qué tan abstracto sea nuestro

significado de día, como para poder excluir fenómenos casuales. Pero con una

definición del día lo suficientemente abstracta, la distinción en lo que a propiedades se

refiere entre dos días se vuelve tenue y remota de intereses prácticos; y cada día puede

ser concebido como una recurrencia del fenómeno de rotación de la Tierra. La

trayectoria de la Tierra alrededor del Sol conduce a la recurrencia anual de las

estaciones, e impone otra periodicidad sobre todas las operaciones de la naturaleza. Otro

tipo de periodicidad, aunque menos fundamental, es la derivada de las fases de la Luna.

En la vida moderna civilizada, donde la luz artificial es posible, estas fases son de poca

importancia, pero en los tiempos antiguos, en climas en donde los días quemaban y los

cielos aclaraban, la vida humana estuvo fuertemente determinada por la luz lunar. De

acuerdo con esto, nuestras divisiones en semanas y meses - con sus asociaciones

religiosas - se han propagado sobre los pueblos europeos desde Siria y Mesopotamia, a

pesar de que observaciones independientes sobre las fases de la Luna se encuentran en

prácticamente todas las naciones. Es, sin embargo, a través de las mareas, y no de sus

fases de luz y oscuridad, que la periodicidad lunar ha influido en la historia de la Tierra.

Nuestra vida corporal es esencialmente periódica. Está dominada por los latidos

del corazón, y por la recurrencia de la respiración. En realidad, la presuposición de

periodicidad es fundamental para nuestra concepción de la vida. Nos es imposible

imaginar un curso de la naturaleza en el que, a medida que los eventos ocurren, no

podamos decir: “Esto ha pasado antes”. Toda la concepción de la experiencia como guía

de conducta estaría ausente. Los hombres se encontrarían siempre en nuevas situaciones

sin poseer algún sustrato de identidad con cualquier cosa en la historia pasada. Los

96

mismos medios para medir el tiempo como una cantidad estarían ausentes. Los eventos

podrían todavía ser reconocidos como ocurriendo en una serie, de tal forma que algunos

fueran anteriores y otros posteriores, pero ahora vamos más allá de este reconocimiento

descubierto. No solamente podemos decir que tres eventos, A, B, C, ocurrieron en este

orden, de tal forma que A ocurrió antes que B, y B antes que C; sino que también

podemos decir que la longitud de tiempo entre los casos de A y B fue el doble de larga

que entre B y C. La cantidad del tiempo depende esencialmente de observar el número

de recurrencias naturales que han intervenido. Podemos decir que la longitud de tiempo

entre A y B fue de tantos días, o de tantos meses, o de tantos años, de acuerdo con el

tipo de recurrencia al que queramos apelar. De hecho, en el comienzo de la civilización,

estos tres modos de medir el tiempo eran muy distintos. Ha constituido una de las

primeras y principales tareas de la ciencia entre las naciones civilizadas y semi-

civilizadas el intentar fusionar estos modos en una única medida coherente, y el grado

de extensión de esta tarea debe ser realmente comprendido. Es necesario determinar, no

solamente qué número de días (por ejemplo, 365.25) van en algún año, sino determinar

previamente que el mismo número de días vayan en los años sucesivos. Podemos

imaginar un mundo en el que las periodicidades existen, pero no uno en donde dos

sistemas distintos sean coherentes. En algunos años podría haber 200 días y en otros

350. La determinación del ámbito general de consistencia de las periodicidades más

importantes fue el primer paso de la ciencia natural. Esta consistencia no surge de

alguna ley intuitiva del pensamiento abstracto, sino que es simplemente un hecho

observado de la naturaleza garantizado por la experiencia. De hecho, está tan lejos de

ser una ley necesaria, que no es ni siquiera exactamente verdadera. Existen divergencias

en cada caso. Para algunos casos, estas diferencias son fácilmente reconocibles, y, por

lo tanto, inmediatamente evidentes. En otros casos, se requiere de las más refinadas

observaciones y de una precisa exactitud astronómica para hacerlas evidentes. Hablando

en general, todas las recurrencias dependientes de seres vivos, tales como los latidos del

corazón, están sujetas, en comparación con otras recurrencias, a variaciones rápidas. Las

grandes recurrencias que son estables - en el sentido de que concuerdan mutuamente

con gran precisión - son aquellas dependientes del movimiento de la Tierra como un

todo, y de movimientos similares de los cuerpos celestes.

Es entonces cuando asumimos que estas recurrencias astronómicas señalan

intervalos iguales de tiempo. ¿Pero cómo podemos lidiar con las discrepancias que las

refinadas observaciones astronómicas detectan? Aparentemente, estamos aceptando la

97

presunción arbitraria de que uno u otro de estos conjuntos de fenómenos señalan

tiempos iguales - por ejemplo, que todos los días son de igual longitud, o que todos los

años son de igual longitud -. Esto no es así: algunas presunciones o suposiciones deben

ser hechas, pero la presunción que subyace en todo el procedimiento de los astrónomos

al determinar la medición del tiempo es que las leyes del movimiento están verificadas

de manera exacta. Antes de explicar cómo se hace esto, es interesante observar que esta

relegación de determinar la medida del tiempo a los astrónomos surge (como ya se ha

dicho) de la consistencia estable de las recurrencias con las que se ellos tratan. Si tal

consistencia superior hubiera sido observada entre las recurrencias características del

cuerpo humano, hubiéramos acudido naturalmente a los doctores de la medicina para

que regularan nuestros relojes.

Al considerar el asunto de las leyes del movimiento, piénsese en cómo dos

modos inconsistentes de medir el tiempo producirían diferentes variaciones de

velocidad al mismo cuerpo. Por ejemplo, supongamos que definimos una hora como

1/24 de un día, y tomemos el caso de un tren avanzando uniformemente durante dos

horas a razón de veinte millas por hora. Ahora consideremos una medida del tiempo

sumamente inconsistente, y supongamos que ésta hace que la primera hora sea el doble

de larga que la segunda. Entonces, de acuerdo con esta otra medida de duración, el

tiempo de trayectoria del tren está dividido en dos partes, durante cada una de las cuales

el tren ha recorrido la misma distancia, a saber, veinte millas; pero la duración de la

primera parte es el doble de larga que la de la segunda. Por lo tanto, la velocidad del

tren no ha sido uniforme, y, en promedio, la velocidad durante el segundo periodo es el

doble que durante el primer periodo. De esta forma, la cuestión acerca de si el tren ha

realizado un trayecto uniforme o no, depende del estándar de tiempo que adoptemos.

Para todos los propósitos ordinarios de la vida en la Tierra, las distintas

recurrencias astronómicas pueden ser vistas como absolutamente consistentes; y,

además de asumir su consistencia, y asumir, por lo tanto, las velocidades y cambios de

velocidades poseídas por estos cuerpos, encontramos que las leyes del movimiento, que

han sido consideradas arriba, son casi exactas. Pero solamente casi exactas cuando se

trata de algunos fenómenos astronómicos. Encontramos, sin embargo, que al asumir

velocidades ligeramente diferentes para las rotaciones y movimientos de los planetas y

de las estrellas, las leyes pueden ser verificadas de manera exacta. Se hace entonces esta

presunción; y hemos adoptado, de este modo, una medida del tiempo que está de hecho

definida por la referencia a los fenómenos astronómicos, pero no tanto como para ser

98

consistente con la uniformidad de cualquiera de ellos. Pero el principal hecho sigue

siendo que el flujo uniforme del tiempo en el que tantas cosas están basadas, es

dependiente de la observación de los eventos periódicos.

Incluso los fenómenos que a primera vista puedan parecer casuales y

excepcionales o que, por otra parte, se mantengan con una persistencia uniforme, se

pueden deber a la remota influencia de la periodicidad. Tomemos, por ejemplo, el

principio de la resonancia. La resonancia surge cuando dos conjuntos de circunstancias

conectadas tienen las mismas periodicidades. Una ley dinámica es que las pequeñas

vibraciones de todos los cuerpos, abandonados a sí mismos, tienen lugar en tiempos

definidos característicos del cuerpo. Así, un péndulo con una oscilación pequeña

siempre vibra en algún tiempo definido, característico de su forma y distribución de

peso y longitud. Un cuerpo más complicado puede tener muchas formas de vibrar, pero

cada una de estas formas de vibración tendrá sus “periodos” característicos.

Aquellos periodos de vibración de un cuerpo son llamados sus periodos “libres”. De

esta forma, un péndulo tiene un periodo de vibración, mientras que un puente

suspendido tendrá varios. Obtenemos un instrumento musical, como una cuerda de

violín, cuando los periodos de vibración son todos simples submúltiplos del más largo;

es decir, si t segundos son el periodo más largo, los otros son 2

1t,

3

1t, etc., donde

cualquiera de estos periodos más pequeños puede estar ausente. Ahora, supongamos que

excitamos las vibraciones de un cuerpo por una causa que es en sí misma periódica;

entonces, si el periodo de la causa es muy cercano a los periodos del cuerpo, el modo de

vibración del cuerpo será violentamente excitado, incluso si la magnitud de la causa

excitante es pequeña. Este fenómeno es conocido como “resonancia”. La razón general

es fácil de entender. Cualquiera que quiera perturbar a una piedra la empujará “en

sintonía” con las oscilaciones de la piedra, para poder siempre asegurar un momento

favorable para empujar. Si los empujes están fuera de sintonía, algunos incrementarán

las oscilaciones, pero otros las frenarán. Pero cuando están en sintonía, después de un

tiempo, todos los empujes son favorables. La palabra “resonancia” proviene de

consideraciones sobre el sonido; pero el fenómeno se extiende mucho más allá de la

región del aquel. Las leyes de absorción y emisión de la luz dependen de ella, así como

la “sintonización” de los receptores en la telegrafía sin cables, la importancia

comparativa de las influencias de los planetas en los movimientos de cada uno, el

peligro de un puente en suspensión mientras marcha por encima de él una tropa del

99

ejército, y la vibración excesiva de algunos barcos debido al ritmo de su maquinaria a

ciertas velocidades. Esta coincidencia de periodicidades puede producir fenómenos

estables cuando existe una asociación constante de los dos eventos periódicos, o puede

producir arrebatos violentos y repentinos cuando la asociación es fortuita y temporal.

De nuevo, los periodos característicos y constantes de vibración mencionados

arriba, son las causas subyacentes de lo que a nosotros aparece como excitaciones

estables de nuestros sentidos. Trabajamos por horas bajo una luz estable, o podemos

escuchar a un sonido estable e invariable. Pero, si la ciencia moderna está en lo cierto,

esta estabilidad no tiene contraparte en la naturaleza. La luz estable se debe al impacto

en el ojo de un sinnúmero de ondas periódicas en un éter vibrante, y el sonido estable se

debe a ondas similares en un aire vibrante. No es nuestro propósito explicar la teoría de

la luz o la teoría del sonido. Hemos dicho lo suficiente para hacer evidente que uno de

los primeros pasos necesarios para hacer de las matemáticas un instrumento adecuado

para la investigación de la naturaleza es que debe ser capaz de explicar la periodicidad

esencial de las cosas. Si hemos comprendido esto, podemos entender la importancia de

las concepciones matemáticas que vamos a considerar ahora, a saber, las funciones

periódicas.

100

CAPÍTULO XIII

TRIGONOMETRÍA

La trigonometría no surgió de la consideración general de la periodicidad en la

naturaleza. En este aspecto, su historia es análoga a la de las secciones cónicas, que tuvo

también su origen en ideas muy particulares. De hecho, una comparación de las

historias de las dos ciencias produce analogías y contrastes sumamente instructivos. La

trigonometría, al igual que las secciones cónicas, tuvo su origen entre los griegos. Su

inventor fue HIPARCO*, e hizo sus observaciones en la isla de Rodas. Sus servicios a la

astronomía fueron muy grandes, e hizo de ésta un tema verdaderamente científico,

estableciendo resultados e indicando los métodos a seguir para progresar en esta ciencia.

Probablemente la invención de la trigonometría no fue el menor de sus servicios

prestados a la ciencia. El siguiente hombre que extendió la trigonometría fue

PTOLOMEO, el gran astrónomo de Alejandría, y al que ya hemos mencionado. Ahora

consideraremos cuál es el gran contraste entre la trigonometría y las secciones cónicas.

El origen de la trigonometría fue práctico; fue inventada porque resultó necesaria para el

estudio astronómico. En cambio, el origen de las secciones cónicas fue puramente

teórico. La única razón para su estudio inicial fue el interés abstracto que producían sus

principales ideas. Es sumamente característico que el estudio de las secciones cónicas se

haya desarrollado alrededor de 150 años antes que el estudio de la trigonometría,

durante el mejor periodo del pensamiento griego. Pero la importancia de la

trigonometría, tanto en la teoría como en la aplicación de las matemáticas, es solamente

uno de los innumerables casos de ideas fructíferas que esta ciencia ha obtenido de las

aplicaciones prácticas.

Intentaremos dejar en claro qué es la trigonometría y por qué se generó del

estudio científico de la astronomía. En primer lugar, ¿cuáles son las mediciones que

puede hacer un astrónomo? Hay mediciones de tiempo y mediciones de ángulos. El

astrónomo puede ajustar un telescopio (ya que es más fácil discutir el instrumento

familiar de los astrónomos modernos) de manera que pueda girar solamente sobre un eje

fijo apuntando hacia el este y el oeste; el resultado es que el telescopio puede solamente

* Hiparco de Nicea (190 a. C. - 120 a. C.). Astrónomo, matemático y geógrafo griego. Nota del Traductor.

101

apuntar al sur, con una mayor o menor elevación de dirección, o, si se gira más allá de

la cima, puede apuntar hacia el norte. Este es el instrumento de tránsito, el gran

instrumento para la medición exacta de los tiempos en los que las estrellas se deben al

sur o se deben al norte. Pero, de manera indirecta, este instrumento mide ángulos.

Porque cuando se ha observado el tiempo transcurrido entre los tránsitos de dos

estrellas, por la suposición de la rotación uniforme de la Tierra, obtenemos el ángulo a

través del cual la Tierra ha girado en ese periodo de tiempo. El ángulo entre dos

estrellas puede ser directamente medido usando otros instrumentos.

Porque si E es el ojo del astrónomo, y EA y EB son las direcciones en las que las

estrellas son observadas, es fácil desarrollar los instrumentos necesarios para medir el

ángulo AEB. Por lo tanto, cuando el astrónomo está estudiando los cielos, en realidad

está midiendo ángulos para fijar las direcciones relativas de las estrellas y planetas en

cada instante. De nuevo, en el problema análogo de la agrimensura*, los ángulos son el

tema principal de las mediciones. Al medir la longitud, es muy probable que no se haga

con exactitud; ríos, casas, bosques, montañas e irregularidades del suelo en general se

suelen entrometer en la medición. La medición completa de un país dependerá

solamente de una o dos mediciones de longitud directas, hechas con sumo cuidado en

* Medición de superficies y áreas terrestres. Nota del Traductor.

102

lugares selectos como la llanura de Salisbury*. La principal tarea de un reconocimiento

de este tipo es la medición de ángulos.

Por ejemplo, A, B, y C serán puntos cumbre en cualquier distrito estudiado, digamos

que son la parte superior de las torres de las iglesias. Estos puntos son visibles cada uno

desde los otros. Entonces, es sumamente sencillo, desde A, medir el ángulo BAC, desde

B, medir el ángulo ABC, y desde C, medir el ángulo BCA. Teóricamente, solamente es

necesario medir dos de estos ángulos; porque, debido a una célebre proposición

geométrica, la suma de los tres ángulos de un triángulo equivale a dos ángulos rectos, de

manera que cuando dos de los ángulos son conocidos, el tercero puede ser deducido. Es

mejor, sin embargo, medir en la práctica a los tres, para que cualquier pequeño error de

observación pueda ser controlado. En el proceso de elaboración de mapas de un país, se

utilizan los triángulos de esta manera. Este proceso es llamado triangulación, y es el

proceso fundamental de un estudio de este tipo.

Ahora bien, cuando todos los ángulos del triángulo son conocidos, la forma del

triángulo también lo es, esto es, la forma como distinguida del tamaño. Hemos llegado

al gran principio de la similitud geométrica. La idea es muy familiar a nosotros en sus

aplicaciones prácticas. Todos tenemos una idea de un plano dibujado a escala. Así, si la

* La llanura de Salisbury es una meseta rocosa que se encuentra en la parte central del sur de Inglaterra. Nota del Traductor.

103

escala de un plano es de una pulgada a una yarda, una longitud de tres pulgadas en el

plano significa una longitud de tres yardas en el original. También las formas

representadas en el plano son las formas del original, de manera que un ángulo recto en

el original aparece como un ángulo recto en el plano. De manera similar en un mapa,

que es solamente un plano de un país, las proporciones de las longitudes en el mapa son

las proporciones de las distancias entre los lugares indicados, y las direcciones en el

mapa son las direcciones en el país. Por ejemplo, si en el mapa un lugar está hacia el

norte-noroeste de otro lugar, así es en la realidad; dicho de otro modo, en un mapa los

ángulos son los mismos que en la realidad.

La similitud geométrica puede ser definida como sigue: dos figuras son similares

si (i) a cualquier punto de una figura corresponde un punto en la otra figura, de modo

que para cada línea haya una línea correspondiente, y a cada ángulo un ángulo

correspondiente, y (ii) las longitudes de las líneas correspondientes están en una

proporción fija, y las magnitudes de los ángulos correspondientes son las mismas. La

proporción fija de las longitudes de líneas correspondientes en un mapa (o plano) y en el

original es llamada la escala de un mapa. La escala debe indicarse siempre en el margen

de cualquier mapa o plano. Ya se ha dicho que dos triángulos cuyos ángulos son

respectivamente iguales son similares.

De esta forma, si los dos triángulos ABC y DEF tienen ángulos iguales en A y en D, y

en B y en E, y en C y en F, entonces DE es a AB en la misma proporción que EF es a

104

BC y que FD es a CA. Sin embargo, no es verdad que otras figuras tengan

necesariamente similitud por el simple hecho de la igualdad de sus ángulos. Tomemos,

por ejemplo, los casos de un rectángulo y de un cuadrado.

Sea ABCD un cuadrado, y ABEF un rectángulo. Mientras que el lado AB del cuadrado

es igual al lado AB del rectángulo, el lado BC del cuadrado es aproximadamente la

mitad del lado BE del rectángulo. Por lo tanto, no es verdad que el cuadrado ABCD sea

similar al rectángulo ABEF. Esta propiedad particular del triángulo, que no es

compartida por otras figuras rectilíneas, hace que sea la figura fundamental en la teoría

de la similitud. Por consiguiente, la triangulación es el proceso fundamental para las

mediciones de tierra. La palabra “trigonometría” se deriva de dos palabras griegas,

trigonon, triángulo, y metria, medida. La cuestión fundamental por la que surgió la

trigonometría es esta: dadas las magnitudes de los ángulos de un triángulo, qué se puede

afirmar sobre las magnitudes relativas de los lados. Nótese que decimos “magnitudes

relativas de los lados” porque en la teoría de la similitud solamente se conocen las

proporciones de los lados. Para responder a esta cuestión, deben ser introducidas ciertas

funciones de las magnitudes de un ángulo, considerado como el argumento. En su

origen, estas funciones fueron obtenidas al considerar un triángulo con ángulos rectos, y

la magnitud del ángulo era definida por la longitud del arco de un círculo. En los libros

modernos de matemáticas elementales, la posición fundamental del arco del círculo que

define la magnitud del ángulo ha sido relegada a un segundo plano, sin haber

105

conseguido con esto avances teóricos o pedagógicos significativos. Primero, debe ser

notado que, en relación con la similitud, el círculo tiene la misma posición fundamental

entre las figuras curvilíneas que el triángulo entre las rectilíneas. Cualesquiera dos

círculos son figuras similares; solamente difieren en su escala. Las longitudes de las

circunferencias de dos círculos, tales como APA’ y A1P1A1’ en la Fig. 26, están en

proporción con las longitudes de sus radios. Además, si los dos círculos tienen el mismo

centro 0, como lo tienen los dos círculos de la Fig. 26, entonces los arcos AP y A1P1,

interceptados por cualquier ángulo A0P, están también en proporción a sus radios.

Por lo tanto, la proporción de la longitud del arco AP a la longitud del radio 0P, esto es

Pradio

arcoAP

0, es un número completamente independiente de la longitud 0P, y es el mismo

que la fracción1

11

0Pradio

ParcoA. Esta fracción de “arco dividido por radio” representa el

camino teórico adecuado para medir la magnitud de un ángulo, ya que no depende de

ninguna unidad arbitraria de longitud, ni de ninguna forma arbitraria de dividir

cualquier ángulo asumido, tal como puede ser un ángulo recto. De esta forma, la

fracción A

AP

0 representa la magnitud del ángulo A0P. Ahora tracemos PM

perpendicularmente a 0A. Los matemáticos griegos llamaron a la línea PM el seno del

106

arco AP, y a la línea 0M el coseno del arco AP. Eran muy conscientes de que la

importancia de las relaciones de estas distintas líneas entre sí dependía de la teoría de

similitud que hemos expuesto. Pero sus definiciones no expresaban las propiedades que

surgen de esta teoría. Tampoco tenían presentes las ideas generales modernas con

respecto a las funciones como pares correlacionados de números variables, ni cualquier

concepción moderna del álgebra y del análisis algebraico. Por consiguiente, era natural

en ellos pensar simplemente en las relaciones entre ciertas líneas en un diagrama. Para

nosotros el caso es distinto: deseamos incorporar nuestras más poderosas ideas.

Por lo tanto, en las matemáticas modernas, en lugar de considerar al arco AP,

consideramos la fracción P

AP

0, que es un número igual para todas las longitudes de 0P;

y, en lugar de considerar a las líneas PM y 0M, consideramos las fracciones P

PM

0 y

P

M

0

0 que, de nuevo, son números no dependientes de la longitud de 0P, es decir, no

dependientes de la escala de nuestros diagramas. Entonces definimos al número P

PM

0

como el seno del número P

PA

0, y al número

P

M

0

0 como el coseno del número

P

M

0

0.

Estas formas fraccionales son toscas para imprimir*, así que pongamos u para la

fracción P

AP

0, que representa la magnitud del ángulo A0P, y v para la fracción

P

PM

0, y

w para la fracción P

M

0

0. Entonces u, v, y w son números y, como estamos hablando de

cualquier ángulo A0P, son números variables. Pero existe una correlación entre sus

magnitudes, de tal forma que cuando u (es decir, el ángulo A0P) está dada, las

magnitudes de v y w están definitivamente determinadas. Por lo tanto, v y w son

funciones del argumento u. Hemos llamado a v el seno de u, y a w el coseno de u.

Queremos ahora adaptar la notación funcional general y=f(x) a estos casos especiales:

así que, en las matemáticas modernas, escribimos “sen” para “f” cuando queremos

indicar la función especial de “seno”, y “cos” para “f” cuando queremos indicar la

función especial de “coseno”. Así, con los significados de arriba para u, v, y w,

obtenemos

v=sen u, y w=cos u, * Este libro está escrito en 1910. Nota del Traductor.

107

donde los paréntesis que suelen rodear a x en f(x) son omitidos para las funciones

especiales. El significado de estas funciones sen y cos como correlacionando los pares

de números u y v, y u y w, es que las relaciones funcionales deben ser encontradas al

construir (Cf. Fig. 26) un ángulo A0P, cuya medida “AP dividido por 0P” sea igual a u,

y que entonces v sea el número dado por “PM dividido por 0P”, y w sea el número dado

por “0M dividido por 0P”.

Es evidente que sin más definiciones, tendríamos dificultades cuando el número

u sea demasiado grande, porque entonces el arco AP puede ser mayor que una cuarta

parte de la circunferencia del círculo, y el punto M (Cf. Fig. 26) podría estar entre 0 y

A’, y no entre 0 y A. También P podría estar por debajo de la línea A0A’, y no sobre

ella, como en la Fig. 26. A fin de que evitemos esta dificultad, podemos recurrir a las

ideas y convenciones de la geometría de coordenadas para definir al seno y al coseno.

Dejemos que la parte 0A del ángulo sea el eje 0X, y que se produzca al eje hacia atrás

para obtener su parte negativa 0X’. Tracemos el otro eje Y0Y’ perpendicular a él.

Dejemos que cualquier punto P a una distancia r desde 0 tenga coordenadas x e y. Estas

coordenadas son ambas positivas en el primer “cuadrante” del plano, por ejemplo, las

coordenadas x e y de P en la Fig. 27.

En los otros cuadrantes, o una o ambas de las coordenadas son negativas, por ejemplo,

x’ e y para P’, y x’ e y’ para P’’, y x e y’’ para P’’’ en la Fig. 27, donde x’ e y’ son ambas

108

números negativos. El ángulo positivo P0A es el arco AP dividido por r, su seno es r

y y

su coseno es r

x; el ángulo positivo P’0A es el arco ABP’ dividido por r, su seno es

r

y y

su coseno es r

x'; el ángulo positivo P’’0A es el arco ABA’P’’ dividido por r, su seno es

r

y', y su coseno es

r

x'; y el ángulo positivo P’’’0A es el arco ABA’B’P’’’ dividido por

r, su seno es r

y' y su coseno es

r

x.

Pero, incluso ahora, no hemos ido lo suficientemente lejos.

Porque supongamos que escogemos que u sea un número mayor que la proporción de

toda la circunferencia del círculo a su radio. Debido a la similitud de todos los círculos,

esta proporción es la misma para todos los círculos. Esto siempre se denota en las

matemáticas con el símbolo 2π, donde π es la forma griega de la letra p, y su nombre en

el alfabeto griego es “pi”. Se puede probar que π es un número inconmensurable, y que,

por lo tanto, su valor no puede ser expresado por ninguna fracción, ni por ninguna

terminación o decimal periódico. Su valor para pocos lugares decimales es 3.14159;

para muchos propósitos, una aproximación lo suficientemente exacta es 7

22. Los

matemáticos pueden fácilmente calcular el valor de π a cualquier grado de exactitud

requerida, así como pueden calcular 2 . A su valor se le han dado hasta 707 lugares

decimales. Tal cálculo, no obstante, es simplemente una curiosidad, y carece de interés

práctico o teórico. La determinación exacta de π es sólo una de las dos partes del

famoso problema de la cuadratura del círculo. La otra parte del problema es, a partir de

los métodos teóricos de la geometría pura, describir una línea recta que sea igual en

longitud a la circunferencia. Se sabe que las dos partes del problema son imposibles de

resolver; y este insoluble problema ha perdido todo interés práctico o teórico, y ha sido

absorbido en ideas más amplias.

Después de esta divagación sobre el valor de π, regresamos ahora a la cuestión

de la definición general de la magnitud de un ángulo, para poder ser capaces de producir

un ángulo correspondiente a cualquier valor u. Supongamos un punto que se mueve, Q,

empezando desde A en 0X (Cf. Fig. 27), y que rota en la dirección positiva (dirección

contraria al movimiento de las manecillas del reloj en la figura considerada) alrededor

de la circunferencia del círculo por cualquier número de veces, descansando finalmente

109

en cualquier punto, por ejemplo, en P, P’, P’’, o P’’’. Entonces, la longitud total del

camino curvilíneo circular recorrido, dividida por el radio del círculo, r, es la definición

generalizada de un ángulo positivo de cualquier tamaño. Dejemos que x, y sean las

coordenadas del punto en el que el punto Q descansa, es decir, en una de las cuatro

posiciones alternativas mencionadas en la Fig. 27; x e y (como se usan aquí), serán o x e

y, o x’ e y, o x’ e y’, o x e y’’. Entonces el signo de este ángulo generalizado es r

y , y su

coseno es r

x. Con estas definiciones, las relaciones funcionales v=sen u y w=cos u,

están finalmente definidas para todos los valores reales positivos de u. Para los valores

negativos de u, simplemente tomamos la rotación de Q en el sentido opuesto (en

dirección a las manecillas del reloj); pero no merece la pena seguir insistiendo sobre

este punto, ahora que ya hemos explicado el método general de proceder.

Estas funciones de seno y coseno, así definidas, nos permiten enfrentarnos a los

problemas concernientes al triángulo desde el cual la trigonometría surge. Pero ahora

estamos en posición de relacionar la trigonometría con la más extensa idea de

periodicidad, sobre la cual ya hablamos en el último capítulo. Es fácil observar que las

funciones sen u y cos u son funciones periódicas de u. Porque, consideremos la

posición, P, (en la Fig. 27) de un punto en movimiento, Q, que ha empezado en A y ha

girado alrededor del círculo. Esta posición, P, marca los ángulos r

arcoAP, y 2 π +

r

arcoAP, y 4 π +

r

arcoAP, y 6 π +

r

arcoAP, y así indefinidamente. Ahora, todos estos

ángulos tienen el mismo seno y coseno, a saber, r

y y

r

x. Por lo tanto, es fácil ver que, si

se escoge cualquier valor para u, los argumentos u, 2 π + u, y 4 π + u, y 6 π + u, y 8 π +

u, y así indefinidamente, tienen todos los mismos valores para los senos y cosenos

correspondientes. En otras palabras,

sen u = sen(2 π + u) = sen(4 π + u) = sen (6 π + u) = etc.;

cos u = cos(2 π + u) = cos (4 π + u) = cos(6 π + u) = etc.

Este hecho es expresado al decir que sen u y cos u son funciones periódicas con periodo

igual a 2 π.

La gráfica de la función y = sen x (nótese que ahora hemos abandonado v y u por

las más familiares y y x), se muestra en la Fig. 28. Tomamos para el eje de x cualquier

longitud arbitraria para representar al número π, y en el eje de y cualquier longitud

110

arbitraria para representar al número 1. Los valores numéricos del seno y del coseno no

pueden nunca exceder la unidad. La recurrencia de la figura después de los períodos de

2 π es notable. Esta gráfica representa el estilo más sencillo de función periódica, y

desde la cual todas las demás son construidas. El coseno no ofrece nada

fundamentalmente diferente al seno. Así, es fácil probar que cos x = sen

+2

πx ; se

puede observar, entonces, que la gráfica de cos x es simplemente la Fig. 28 modificada

al trazar el eje de 0Y a lo largo del punto en 0X marcado como 2

π, en lugar de trazarlo

en su posición actual en la figura.

Es fácil construir una función de “seno” en la cual el periodo tenga cualquier valor

asignado a, porque solamente tenemos que escribir

y = sen a

xπ2,

y después

sena

ax )(2 +π = sen

+ ππ

22

a

x = sen

a

xπ2.

Así, el periodo de esta nueva función es ahora a. Demos ahora una definición general de

lo que queremos decir cuando hablamos de una función periódica. La función f(x) es

periódica, con el periodo a, si (i) para cualquier valor de x tenemos f(x) = f(x+a), y (ii)

no hay un número b menor que a tal que para cualquier valor de x, f(x) = f(x+b).

111

La segunda cláusula se pone en la definición porque cuando tenemos sena

xπ2,

no es solamente periódica en el periodo a, sino también en los periodos 2a, 3a, etc.; esto

surge porque

sena

ax )3(2 +π = sen

+ ππ6

2

a

x = sen

a

xπ2.

Así que es el periodo más pequeño del que queremos depender y es el periodo de la

función. La mayor parte de la teoría abstracta de las funciones periódicas y de todas las

aplicaciones de la teoría a la ciencia física, están dominadas por un importante teorema

llamado el teorema de FOURIER; a saber, que si f(x) es una función periódica con el

periodo a y si f(x) también satisface ciertas condiciones, que prácticamente están

siempre presupuestas en las funciones sugeridas por los fenómenos naturales, entonces

f(x) puede ser escrita como la suma de un conjunto de términos en la forma

c0+c1sen

+ 1

2e

a

xπ+c2sen

+ 2

4e

a

xπ+c3sen

+ 3

6e

a

xπ+ etc.

En esta fórmula, c0, c1, c2, c3, etc., y también e1, e2, e3, etc., son constantes, escogidas así

para ajustarse a la función particular. De nuevo tenemos que preguntarnos, ¿cuántos

términos deben ser escogidos? Y aquí surge una nueva dificultad: porque podemos

probar que, aunque para algunos casos particulares un número definido bastará, en

general, todo lo que podemos hacer es aproximarnos tan cerca como queramos al valor

de la función al escoger más y más términos. Este proceso de aproximación gradual nos

lleva a la consideración de la teoría de las series infinitas, una parte esencial de la teoría

matemática que será considerada en el siguiente capítulo.

El método mostrado arriba consistente en expresar una función periódica como

una suma de senos es llamado el “análisis armónico” de la función. Por ejemplo, en

cualquier punto de la costa del mar, las mareas suben y bajan periódicamente. Así, en un

punto cerca del Estrecho de Dover habrá dos mareas diarias debidas a la rotación de la

Tierra. La subida y la bajada diarias de las mareas son complicadas por el hecho de que

hay dos maremotos, uno viniendo del Canal Inglés, y otro que se ha extendido alrededor

del norte de Escocia, y ha venido hacia el sur bajando por el Mar del Norte. De nuevo,

algunas mareas altas son más altas que otras: esto se debe al hecho de que el Sol genera

una influencia sobre las mareas, así como lo hace la Luna. En este sentido, se introducen

los periodos mensuales y otro tipo de periodos. Dejamos sin tomar en cuenta la

importante influencia de los vientos, que no puede ser prevista. El problema general del

112

análisis armónico de las mareas es encontrar conjuntos de términos, como aquellos

usados unas pocas líneas arriba, de tal forma que cada conjunto muestre - de manera

aproximadamente cierta - la contribución de las influencias que generan las mareas de

un “periodo” a la altura de la marea en cualquier instante. El argumento x será, por lo

tanto, el tiempo contado desde cualquier comienzo que se considere conveniente.

De nuevo, el movimiento de vibración de una cuerda de violín está sujeto a un

análisis armónico similar, y también lo están las vibraciones del éter y del aire,

correspondientes a ondas de luz y a ondas de sonido, respectivamente. Estamos aquí

ante la presencia de uno de los procesos fundamentales de la física matemática, a saber,

el método general de tratar con el gran hecho natural de la periodicidad.

113

CAPÍTULO XIV

SERIES

Ninguna parte de las matemáticas sufre más de la trivialidad de su presentación

inicial a los principiantes que el tema de las series. Son considerados dos ejemplos

menores de las series, a saber, las series aritmética y geométrica; estos ejemplos son

importantes porque son los más simples dentro de la teoría general. Pero las ideas

generales nunca son reveladas y, de esta forma, los ejemplos, que no consiguen

ejemplificar nada, son reducidos a trivialidades absurdas.

La idea matemática general de una serie es la de un conjunto de cosas arreglada

en orden, esto es, en una secuencia. Este significado está exactamente representado en el

uso común del término. Consideremos, por ejemplo, la serie de los Primeros Ministros

ingleses durante el siglo diecinueve, arreglada en el orden del primer ocupante de esa

oficina en el siglo. La serie comienza con William Pitt, y termina con Lord Rosebery

quien, curiosamente, es el biógrafo del primer miembro. Pudimos haber considerado

otro orden serial para el arreglo de estos hombres, por ejemplo, de acuerdo con su

estatura, o con su peso. Estos otros órdenes sugeridos parecen ser triviales en conexión

con los Primeros Ministros, y no se encuentran de manera natural en la mente; pero,

abstractamente, son tan buenos órdenes como cualesquiera otros. Cuando un orden entre

los términos es mucho más importante o más obvio que los otros órdenes, se dice que es

el orden de aquellos términos. Así, el orden de los números enteros será siempre

entendido como un orden arreglado de acuerdo con la magnitud, aunque haya un

número indefinido de maneras de arreglarlos. Cuando el número de cosas consideradas

es finito, el número de maneras o formas de arreglar estas cosas en orden es llamado el

número de sus permutaciones. El número de permutaciones de un conjunto de n cosas,

donde n es algún entero finito, es

n× (n 1− ) 1234...)3()2( ×××××−×−× nn

esto es, es el producto de los primeros enteros n; este producto es tan importante en las

matemáticas, que se usa un símbolo especial para representarlo, y es siempre escrito

como “n!”. Así, 2! = 2 1× = 2, y 3! = 3 12×× = 6, y 4! = 4 123 ××× = 24, y 5! =

5 1234 ×××× = 120. Mientras n incrementa, el valor de n! incrementa muy rápido; de

esta forma, 100! es cien veces la longitud de 99!.

114

Es fácil constatar que, en el caso de los valores pequeños de n, n! es el número

de formas de arreglar n cosas en orden. Consideremos dos cosas a y b; éstas se pueden

arreglar en dos órdenes, ab y ba, y 2! = 2. De nuevo, tomemos tres cosas, a, b, y c; éstas

se pueden arreglar en seis órdenes, abc, acb, bac, bca, cab, y cba, y 3! = 6. De manera

similar sucede con los veinticuatro órdenes en las que cuatro cosas, a, b, c, y d, pueden

ser arregladas.

Cuando llegamos a los conjuntos infinitos de cosas - como los conjuntos de

todos los enteros, o todas las fracciones, o todos los números reales -, llegamos a las

complicaciones de la teoría de los tipos de orden. Este tema fue tratado en el capítulo VI

cuando consideramos los posibles órdenes de los enteros, de las fracciones, y de los

números reales. Toda la cuestión de los tipos de orden constituye una nueva rama de las

matemáticas de gran importancia. No vamos a considerarla más allá. Todas las series

infinitas que consideraremos ahora son del mismo tipo de orden que el de los enteros

arreglados en orden ascendente de acuerdo con su magnitud, esto es, con un primer

término, y de manera tal que cada término tenga una pareja de vecinos, uno de cada

lado, con la excepción del primer término que tiene, obviamente, solamente un vecino.

De esta forma, si m es cualquier entero (que no sea cero), habrá siempre un término a la

m. Una serie con un número finito de términos (digamos, n términos), tiene las mismas

características que las series infinitas en lo que a vecinos puestos unos junto con otros se

refiere; solamente difiere de las series infinitas en tener un último término, a saber, el

término a la n.

Lo importante a hacer con una serie de números - usando el término “serie” en el

sentido restringido en el que se ha usado - es añadir juntos sus términos sucesivos.

Así, si u1, u2, u3, … , un … son respectivamente el 1er, 2do, 3er, 4to, … , n, …

términos de la serie de números, formamos sucesivamente la series u1, u1 + u2, u1 + u2 +

u3, u1 + u2 + u3 + u4, etc.; así, la suma de los primeros n términos puede ser escrita como

u1 + u2 + u3 + … un

Si la serie tiene solamente un número finito de términos, llegamos por fin de esta

manera a la suma de toda la serie de términos. Pero, si la serie tiene un número infinito

de términos, este proceso de formar sucesivamente las sumas de los términos nunca

termina; y en este sentido, no hay tal cosa como la suma de una serie infinita.

¿Pero por qué es importante añadir de manera sucesiva los términos de una serie

en esta forma? La respuesta es que estamos simbolizando el fundamental proceso

mental de la aproximación. Este es un proceso que tiene una importancia que trasciende

115

las regiones de las matemáticas. Nuestro limitado intelecto no puede lidiar con todo el

complicado material del mundo de una sola vez, y nuestro método de ordenar es aquel

de la aproximación. El estadista, al elaborar un discurso, pone los temas importantes

primero, y los detalles en lugares subordinados. También está el inverso método

artístico que consiste en preparar a la imaginación a partir de la presentación de detalles

subordinados o especiales, y después llegar gradualmente a una crisis. En cualquiera de

los casos, el proceso es el de la adición o suma gradual de efectos; y esto es exactamente

lo que se hace con la suma sucesiva de los términos de una serie. Nuestro método

ordinario de representar a los números es un proceso de adición gradual, al menos para

los casos de los números grandes. Así, 568,213 se presenta en la mente como

500,000 + 60,000 + 8,000 + 200 + 10 + 3.

En el caso de las fracciones decimales, esto es mucho más notorio. Así, 3.14159

es 3 + 100000

9

10000

5

1000

1

100

4

10

1 ++++ .

También, 3 y 3 + 10

1, y 3 +

100

4

10

1 + , y 3 + 1000

1

100

4

10

1 ++ , y 3 +

10000

5

1000

1

100

4

10

1 +++ son aproximaciones sucesivas del resultado completo

3.14159. Si leemos 568,213 al revés, esto es, de derecha a izquierda, empezando con las

3 unidades, lo estamos leyendo en la forma artística, preparando gradualmente a la

mente para la crisis de 500,000.

El proceso ordinario de la multiplicación numérica sucede por medio de la

adición de una serie.

Consideremos el cálculo

342

658

2736

1710

2052

225036

116

Por consiguiente, las tres líneas a ser añadidas forman una serie de la cual el primer

término es la línea superior. Esta serie sigue el método artístico de presentar el término

más importante al final, y no por algún sentimiento artístico, sino por la conveniencia

obtenida al mantener un control firme sobre el lugar de la unidad, permitiéndonos omitir

algunos 0s, formalmente necesarios.

Pero cuando nos aproximamos a algo al añadir gradualmente los términos

sucesivos de una serie infinita, ¿a qué nos estamos aproximando? La dificultad es que la

serie no tiene una “suma” en el sentido estricto de la palabra, porque la operación de

añadir conjuntamente sus términos nunca puede ser completada. La respuesta es que nos

estamos aproximando al límite de la suma de la serie, y debemos ahora proceder a

explicar qué es el “límite” de una serie.

La suma de una serie se aproxima a un límite cuando la suma de cualquier

número de sus términos, siempre que el número sea lo suficientemente grande, es

cercana al límite al que se pretende aproximar. Pero esta descripción del significado de

“aproximarse a un límite” no puede soportar el escrutinio de las matemáticas modernas.

¿Qué se quiere decir con lo suficientemente grande, y con cercano al límite, y con

pretender aproximarse? Todas estas frases imprecisas deben ser explicadas en términos

de las simples ideas abstractas que son admitidas en las matemáticas puras.

Dejemos que los términos sucesivos de la serie sean u1, u2, u3, u4, …, un, etc., de

tal forma que un es el término a la n de la serie. También, dejemos que sn sea la suma de

los primeros n términos, sea lo que sea n, de modo que

s1 = u1, s2 = u1 + u2, s3 = u1 + u2 + u3, y sn = u1 + u2 + u3 + … +un.

Entonces, los términos s1, s2, s3, … sn, … forman una nueva serie, y la formación

de esta serie es el proceso de adición de la serie original. La “aproximación” de la

adición o suma de la serie original a un “límite” significa “la aproximación de los

términos de esta nueva serie a un límite”. Y tenemos ahora que explicar qué queremos

decir con la aproximación a un límite de los términos de la serie.

Ahora bien, recordando la definición (dada en el capítulo XII) de un estándar de

aproximación, la idea del límite significa esto: l es el límite de los términos de la serie

s1, s2, s3, … sn, …, si, correspondiendo a cada número real k, tomada como el estándar

de aproximación, puede ser encontrado un término sn de la serie de modo que todos los

términos sucesivos (es decir, sn+1, sn+2, etc.) se aproximen a l dentro de ese estándar de

aproximación. Si se escoge otro estándar k1 más pequeño, el término sn puede estar muy

117

pronto en la serie, y un término posterior sm, con las propiedades de arriba, será

encontrado.

Si esta propiedad se mantiene, es evidente que mientras se recorre la serie s1, s2,

s3, …, sn, … de izquierda a derecha, después de un tiempo llegaremos a términos todos

de los cuales son más cercanos a l que cualquier número que se quiera asignar. En otras

palabras, se puede aproximar a l tanto como se quiera. La íntima conexión de esta

definición del límite de una serie con la definición de una función continua dada en el

capítulo XI se percibe de inmediato.

Volviendo a la serie original u1, u2, u3, …, un, …, el límite de los términos de la

serie s1, s2, s3, …, sn, …, es llamado “la suma al infinito” de la serie original. Pero es

evidente que este uso de la palabra “suma” es muy artificial, y no debemos asumir las

propiedades análogas a aquellas de la suma ordinaria de un número finito de términos

sin antes hacer una investigación especial.

Consideremos un ejemplo de una “suma al infinito”. Pensemos en el decimal

periódico .1111…. Este decimal es simplemente la forma de simbolizar la “suma al

infinito” de la serie .1, .01, .001, .0001, etc. La serie correspondiente encontrada por la

suma es s1 = .1, s2 = .11, s3 = .111, s4 = .1111, etc. El límite de los términos de esta serie

es 9

1; esto es fácil de ver por simple división, ya que

.9000

1111.

900

111.

90

11.

9

1etc=+=+=+=

Por lo tanto, si 17

3 es dada (k de la definición), .1 y todos los términos sucesivos

defieren de 9

1 por menos de

17

3; si

1000

1 es dada (otra opción para k de la definición),

.111 y todos los términos sucesivos difieren de 9

1 por menos de

1000

1; etc., cualquiera

sea la opción escogida para k.

Es evidente que nada de lo que se ha dicho da la menor idea de cómo la “suma al

infinito” de una serie debe ser encontrada. Simplemente hemos indicado las condiciones

que tal número debe satisfacer. De hecho, un método general para encontrar, en todos

los casos, la suma al infinito de una serie, no sería posible en modo alguno, por la

simple razón de que tal “suma”, como ha sido definida aquí, no siempre existe. las

series que poseen una suma al infinito son llamadas convergentes, y aquellas que no lo

poseen son llamadas divergentes.

118

Un ejemplo obvio de una serie divergente es 1, 2, 3, …, n, …, es decir, la serie

de los enteros de acuerdo con su orden de magnitud. Porque, cualquier número l que

queramos asignar como su suma al infinito, y cualquier estándar de aproximación k que

escojamos, al tomar los suficientes términos de la serie, siempre se puede conseguir que

la suma difiera de l por más que k. Otro ejemplo de una serie divergente es 1, 1, 1, etc.,

esto es, la serie en la que cada término es igual a 1. Porque entonces la suma de n

términos es n, y esta suma crece sin límite mientras n se incrementa. De nuevo, otro

ejemplo de una serie divergente es 1, 1− , 1, 1− , 1, 1− , etc., es decir, la serie en la que

los términos son alternativamente 1 y 1− . La suma de un número impar de términos es

1, y la de un número par de términos es 0. Por lo tanto, los términos de la serie s1, s2, s3,

…, sn, … no se aproximan a un límite, aún cuando no se incrementen sin límite.

Es tentador suponer que la condición para que u1, u2, … un, … tenga una suma al

infinito sea que un disminuya indefinidamente mientras n aumenta. Si este fuera el caso,

las matemáticas serían una ciencia mucho más fácil de lo que son. Desafortunadamente,

la suposición no es verdadera.

Por ejemplo, la serie

1, ,...1

,...,4

1,

3

1,

2

1

n

es divergente, y es fácil ver que este es el caso. Consideremos la suma de n términos

empezando en el término (n+1). Estos n términos son :2

1,...

3

1,

2

1,

1

1

nnnn +++ hay n de

ellos y n2

1 es el último. Por lo tanto, su suma es mayor que n veces

n2

1, es decir, es

mayor que 2

1. Ahora, sin alterar la suma al infinito, si es que existe, podemos añadir

términos vecinos de manera conjunta, y obtener la serie

1, .,,8

1

7

1

6

1

5

1,

4

1

3

1,

2

1etc++++

esto es, por lo que se ha dicho arriba, una serie cuyos términos después del 2do término

sean mayores que aquellos de la serie

1, .,,2

1,

2

1,

2

1etc

donde todos los términos después del 1er término son iguales. Pero esta serie es

divergente. Por consiguiente, la serie original también lo es.

119

Esta cuestión de la divergencia muestra qué tan cuidadosos debemos ser en la

discusión sobre las propiedades de la suma de un número finito de términos en la suma

de una serie infinita. Porque la propiedad más elemental de un número finito de

términos es que éstos poseen una suma, pero incluso esta propiedad fundamental no es

necesariamente poseída por una serie infinita. Esta precaución se limita a afirmar que no

debemos dejarnos engañar por la sugerencia del término técnico “suma de una serie

infinita”. Es común indicar la suma de una serie infinita

u1, u2, u3, …un, …por

u1+u2+u3+…+un+…

Ahora pasamos a la generalización de la idea de una serie, que las matemáticas,

fieles a su método, hacen por medio de la variable. Hasta ahora, solamente hemos

contemplado series en las que cada término definido era un número definido. Pero

igualmente bien, podemos generalizar, y hacer que cada término sea alguna expresión

matemática que contenga una variable x. Así, podemos considerar a la serie 1, x, x2, x3,

…, xn, …, y a la serie x, ,...,...,3

,2

32

n

xxx n

. Con el fin de simbolizar la idea general de

cualquier función de este tipo, concibamos una función de x, digamos ƒn(x), que

involucra en su formación una variable entera n, entonces, al dar a n los valores 1, 2, 3,

etc., en sucesión, obtenemos la serie ƒ1(x), ƒ2(x), ƒ3(x), …, ƒn(x),… .

Tal tipo de serie puede ser convergente para algunos valores de x, y divergente para

otros. Es, de hecho, más bien raro encontrar una serie que involucre una variable x que

sea convergente para todos los valores de x - por lo menos, en cualquier caso particular,

es muy arriesgado asumir que este es el caso -. Por ejemplo, examinemos el más simple

de todos los casos, a saber, la serie “geométrica”

1, x, x2, x3, …, xn, … .

La suma de n términos es dada por

sn = 1+x+x2+x3+ … +xn.

Ahora multipliquemos ambos lados por x y obtenemos

xsn = x+x2+x3+x4+ … +xn+xn+1.

Ahora substraemos la última línea de la línea de arriba, y obtenemos

sn(1 x− ) = sn-xsn = 1-xn+1,

y, por lo tanto (si x no es igual a 1),

sn = .11

1

1

1 11

x

x

xx

x nn

−−

−=

−− ++

120

Ahora, si x es numéricamente menor que 1, para valores lo suficientemente grandes de

n, x

xn

−1 será siempre menor que k, sin importar cuál k* escojamos. Así, si x es menor

que 1, la serie 1, x, x2, …xn, … es convergente, y x−1

1 es su límite. Esta declaración se

simboliza como

x−1

1= 1+x+x2+ … +xn+ …, (x<1).

Pero si x es numéricamente mayor que 1, o numéricamente igual a 1, la serie es

divergente. En otras palabras, si x está entre 1− y +1, la serie es convergente; pero si x

es igual a 1− o a +1, o si x está fuera del intervalo 1− a +1, entonces la serie es

divergente. Así, la serie es convergente en todos los “puntos” dentro del intervalo 1− a

+1, excluyendo los puntos finales†.

En este punto de nuestra investigación surge otra cuestión. Supongamos que la

serie

ƒ1(x)+ ƒ2(x)+ ƒ3(x)+ … + ƒn(x)+…

es convergente para todos los valores de x que se encuentran en el intervalo a a b, es

decir, ƒ(x) es convergente para cualquier valor de x que sea mayor que a y menor que b.

También, supongamos que queremos estar seguros de que al aproximarnos al límite

podamos añadir conjuntamente los suficientes términos que resulten aplicables a algún

estándar de aproximación k. ¿Podemos siempre expresar algún número de términos,

digamos n, tales que, si tomamos n o más términos para formar la suma, habremos

satisfecho para cualquier valor que x tenga dentro del intervalo el deseado estándar de

aproximación?

La respuesta es que a veces podemos y a veces no podemos hacer esto para cada

valor de k. Cuando podemos, la serie se llama uniformemente convergente a lo largo del

intervalo, y cuando no podemos, se llama no uniformemente convergente a lo largo del

intervalo. Es una gran diferencia para las propiedades de la serie si es o no

uniformemente convergente a lo largo del intervalo. Ilustremos esto con el ejemplo y

con los números más simples.

Consideremos la serie geométrica

1+x+x2+x3+ … +xn+ … .

* Recordemos que k es el estándar de aproximación. Nota del Traductor. † Es decir, -1 ó +1. Nota del Traductor.

121

Es convergente a lo largo del intervalo 1− a +1, excluyendo los valores finales x = .1±

Pero no es uniformemente convergente a lo largo de este intervalo. Porque si

sn(x) es la suma de n términos, hemos probado que la diferencia entre sn(x) y el límite

x−1

1 es .

1

1

x

xn

−

+

Ahora supongamos que n es cualquier número dado de términos, digamos 20, y dejemos

que k sea cualquier estándar de aproximación asignado, digamos .001. Entonces, al

tomar a x lo suficientemente cerca de +1 o lo suficientemente cerca de 1− , podemos

hacer que el valor numérico de x

x

−1

21

sea mayor que .001. De esta forma, 20 términos no

van a satisfacer cualquier valor de x a lo largo de todo el intervalo, aunque sean más que

suficientes para algunas partes de él.

El mismo razonamiento puede ser aplicado sin importar qué otro número

escojamos en lugar de 20, y sin importar qué estándar de aproximación escojamos en

lugar de .001. Por lo tanto, la serie geométrica 1+x+x2+x3+… +xn+…, no es

uniformemente convergente a lo largo de todo el intervalo de convergencia 1− a +1.

Pero si tomamos cualquier intervalo más pequeño que se encuentre en ambos extremos

dentro del intervalo 1− a +1, la serie geométrica es uniformemente convergente dentro

de él. Por ejemplo, tomemos el intervalo 0 a 10

1. Entonces, cualquier valor para n que

haga que x

xn

−

+

1

1

sea numéricamente menor que k en estos límites para x, también servirá

para todos los valores de x entre estos límites, ya que sucede que x

xn

−

+

1

1

disminuye en

valor numérico mientras x disminuye en valor numérico. Por ejemplo, si k = .001.

Entonces, poniendo x = 10

1, encontramos que:

para n = 1, ...,0111.90

1

10

11

10

1

1

2

1

==−

=−

+

x

xn

para n = 2, ...,00111.900

1

10

11

10

1

1

3

1

==−

=−

+

x

xn

122

para n = 3, ....000111.9000

1

10

11

10

1

1

4

1

==−

=−

+

x

xn

Así, tres términos serán suficientes para todo el intervalo, aunque, por supuesto, para

algunas partes de éste, es más de lo que es necesario. Nótese que, debido a que

1+x+x2+…+xn+…, es convergente (aunque no uniformemente) a lo largo del intervalo

1− a +1, para cada valor de x en el intervalo, algún número de términos n que satisfaga

un deseado estándar de aproximación puede ser encontrado; pero, mientras tomamos a x

cada vez más cerca de cualquiera de los dos valores finales +1 o 1− , tienen que ser

empleados valores de n cada vez más grandes.

Es curioso que esta importante distinción entre convergencia uniforme y no

uniforme fuera descubierta hasta 1847 por STOKES - más tarde, Sir George STOKES -,

y después en 1850, de manera independiente, por SEIDEL, un matemático alemán.

Los puntos críticos, donde viene la convergencia no uniforme, no están

necesariamente en los límites del intervalo a lo largo del cual la convergencia se

mantiene. Esta es una característica especial que pertenece a las series geométricas.

En el caso de la serie geométrica 1+x+x2+…+xn+…, una simple expresión

algebraica x−1

1 puede ser dada para ser el límite en su intervalo de convergencia. Pero

este no es siempre el caso. A menudo, podemos probar que una serie es convergente

dentro de un cierto intervalo, aunque no sepamos nada acerca de su límite excepto que

es el límite de la serie. Pero esta es una muy buena forma de definir una función, a

saber, como el límite de una serie convergente infinita, y es, de hecho, la forma en la

que la mayoría de las funciones son, o por lo menos, debería, ser definidas.

De esta manera, la serie más importante en el análisis elemental, es

1+x+ ...,!

...!3!2

32

++++n

xxx n

donde n! tiene el significado que le otorgamos anteriormente en este capítulo. Se puede

probar que esta serie es convergente para todos los valores de x, y que es uniformemente

convergente dentro de cualquier intervalo que escojamos. Por lo tanto, tiene todas las

propiedades matemáticas suficientes que una serie puede tener, y es llamada la serie

exponencial. Su suma al infinito se denota como expx. Así, por definición tenemos

123

expx = 1+x+ ...,!

...!3!2

32

++++n

xxx n

donde a expx se le llama la función exponencial.

Es sumamente fácil probar, incluso con un conocimiento escaso de matemáticas

elementales, que (expx)× (expy) = exp(x+y)…(A). En otras palabras, que

(expx)× (expy) = 1+(x+y)+( ) ( ) ( )

....!

...!3!2

32

+++++++n

yxyxyx n

Esta propiedad (A), es un ejemplo de lo que se llama teorema de adición.

Cuando cualquier función [digamos, ƒ(x)] ha sido definida, lo primero que se tiene que

hacer es tratar de expresar ƒ(x+y) en términos de funciones conocidas de x solamente, y

en funciones conocidas de y solamente. Si podemos lograr esto, el resultado se llama

teorema de adición. Los teoremas de adición desempeñan un papel muy importante en

el análisis matemático. Así, el teorema de adición para el seno es dado por

sen(x+y) = sen x cos y + cos x sen y,

y para el coseno por

cos(x+y) = cos x cos y sen− x sen y.

En realidad, las mejores formas de definir sen x y cos x no son a partir de los

elaborados métodos geométricos del capítulo previo, sino como los límites respectivos

de las series

−x ....,!7!5!3

753

etcxxx +−+

y

....,!6!4!2

1642

etcxxx +−+−

de manera que ponemos

sen x = ....,!7!5!3

753

etcxxx

x +−+−

cos x = .....!6!4!2

1642

etcxxx +−+−

124

Estas definiciones son equivalentes a las definiciones geométricas, y ambas

series pueden ser probadas como convergentes para todos los valores de x, y

uniformemente convergentes a lo largo de cualquier intervalo. Estas series de seno y

coseno tienen un parecido general con la serie exponencial de arriba. De hecho, aquellas

están íntimamente conectadas con ésta por medio de la teoría de los números

imaginarios explicada en los capítulos VII y VIII.

La gráfica de la función exponencial se encuentra en la Fig. 29. Corta al eje 0Y

en el punto y = 1, como evidentemente debe hacerlo, porque cuando x = 0, cada término

de la serie, excepto el primero, es 0. La importancia de la función exponencial es que

representa cualquier cantidad física cambiante cuya tasa de aumento en cualquier

instante sea un porcentaje uniforme de su valor en ese instante. Por ejemplo, la gráfica

de arriba representa el tamaño de una población, en cualquier momento, con una tasa de

nacimiento uniforme, donde x corresponde al tiempo considerado desde cualquier día, e

y representa la población de la escala apropiada. La escala debe ser tal, que 0A

represente la población en la fecha que sea tomada como el origen. Hemos llegado

ahora a la idea de “tasas de crecimiento”, que es el tema de nuestro siguiente capítulo.

Una función importante, y que guarda una cercana relación con la función

exponencial, se encuentra al poner 2x− por x como el argumento en la función

125

exponencial. Entonces tenemos exp. (2x− ). La gráfica y = exp. ( 2x− ) se encuentra en

la figura 30.

La curva, que es algo parecido a un sombrero, es llamada la curva del error

normal. Su función correspondiente es sumamente importante para la teoría estadística,

y nos dice, en muchos casos, cuál es el tipo de desviaciones de los resultados promedios

que debemos esperar.

Otra función importante se encuentra al combinar la función exponencial con el

seno, de esta forma:

126

p

xsencxy

π2)exp( ×−=

Esta gráfica se muestra en la figura 31. Los puntos A, B, 0, C, D, E, F, son

puestos en intervalos iguales a ,2

1p y se debe trazar una serie sin final de ellos, tanto

hacia delante como hacia atrás. Esta función representa la “agonía” de las vibraciones

bajo la influencia de la fricción o de fuerzas de “amortiguación”. Aparte de la fricción,

las vibraciones serían periódicas, con un periodo p; pero la influencia de la fricción hace

que la extensión de cada vibración sea más pequeña que la de su predecesora, por un

porcentaje constante de esa extensión. Esta combinación de las ideas de “periodicidad”

(que requiere al seno o al coseno para ser simbolizada), y de “porcentaje constante”

(que requiere a la función exponencial para ser simbolizada), es la razón para la

formación de esta función, a saber, su formación es el producto de una función de seno

en una función exponencial.

127

CAPÍTULO XV

CÁLCULO DIFERENCIAL

La invención del cálculo diferencial marca una crisis en la historia de las

matemáticas. El progreso de la ciencia se divide en periodos caracterizados por una

lenta acumulación de ideas y en periodos en donde, debido al nuevo material para el

pensamiento obtenido pacientemente, algún genio - gracias a la invención de algún

método nuevo o de algún punto de vista novedoso -, repentinamente transforma

cualquier tema y lo lleva a un siguiente nivel. Estos periodos en contraste en el progreso

de la historia del pensamiento son comparados por Shelley con la formación de una

avalancha.

¡El Sol despierta una avalancha!, cuya masa,

Tres veces cernida por la tormenta, ha reunido ahí

Copo tras copo, - en el cielo - mentes desafiantes

Mientras pensamiento tras pensamiento se amontona,

Hasta que una gran verdad es desatada,

Y las naciones se hacen eco de ella*

La comparación, no obstante, puede soportar algunas críticas. La explosión final de la

luz del Sol que despierta la avalancha no está necesariamente más allá de toda

comparación - en cuanto a magnitud se refiere -, con los otros poderes de la naturaleza

que han presidido su lenta formación. Lo mismo es verdad en la ciencia. El genio que

tiene la fortuna de producir la idea final que transforma una región entera del

pensamiento, no necesariamente supera a todos los predecesores que han trabajado en la

formación preliminar de las ideas. Al considerar la historia de la ciencia, es ridículo e

ingrato limitar nuestra admiración a aquellos hombres que han hecho los avances finales

en alguna época.

En el caso particular que ahora nos ocupa, a saber, el cálculo, el tema tuvo una

larga historia antes de adoptar su forma final de las manos de sus dos inventores.

* Traducción mía. Nota del Traductor.

128

Existen algunos rastros de esta cuestión incluso entre los matemáticos griegos y,

finalmente, justo antes de constituirse en su forma actual, FERMAT (1601-1665), un

distinguido matemático francés, había mejorado tanto las ideas previas, que el cálculo

fue casi inventado por él. También se podría considerar a FERMAT como el inventor,

de manera conjunta con DESCARTES, de la geometría de coordenadas. En realidad, es

a DESCARTES a quien el mundo de la ciencia le debe las ideas nuevas, pero

FERMAT, sin duda alguna, llegó a ellas de manera independiente.

No es necesario, sin embargo, limitar nuestra admiración o a NEWTON, o a

LEIBNIZ. NEWTON fue un matemático y un estudioso de la ciencia física, y LEIBNIZ

fue un matemático y un filósofo, y cada uno de ellos, en su área de pensamiento, fue

uno de los más grandes hombres de genio que el mundo haya conocido. La invención

conjunta del cálculo fue la ocasión de una desafortunada y no siempre loable disputa.

NEWTON aplicaba los métodos de las fluxiones, como él llamo al tema, en 1666, y los

empleó en la composición de su Principa, aunque en el trabajo impreso se evita

cualquier notación algebraica especial. Pero no imprimió alguna declaración directa de

su método hasta 1693. LEIBNIZ publicó su primera declaración en 1684. Fue acusado

por los amigos de NEWTON de haber obtenido las ideas de un escrito de éste que le fue

mostrado de forma privada. LEIBNIZ también acusó a NEWTON de haberlo plagiado.

Hoy en día, no existen muchas dudas acerca de que ambos deben tener el crédito de ser

los descubridores independientes del cálculo. El tema había llegado a una etapa propicia

para este tipo de descubrimientos, y no hay nada sorprendente en el hecho de que dos

hombres tan capaces hayan llegado de manera independiente a él.

En la ciencia, este tipo de descubrimientos conjuntos son muy comunes. Éstos,

en general, no son hechos antes de que hayan sido llevados por tendencias previas del

pensamiento y, en ese momento, muchas mentes están en la búsqueda de las ideas

fundamentales del tema. Si nos atenemos a los descubrimientos hechos por los hombres

ingleses, veremos cómo la enunciación simultánea de la ley de la selección natural

hecha por Darwin y por Wallace, y el descubrimiento simultáneo de Neptuno, hecho por

Adams y por el astrónomo francés Leverrier, ocurrieron, a la vez, en las mentes de estos

hombres. Las disputas sobre a quién debe darse el crédito por haber descubierto o

inventado algo, están con frecuencia influidas por un indigno espíritu nacionalista. La

reflexión realmente inspiradora sugerida por la historia de las matemáticas es la unidad

de pensamiento y el interés por esta ciencia entre los hombres de tantas épocas,

naciones, y razas. Los indios, egipcios, asirios, griegos, árabes, italianos, franceses,

129

alemanes, ingleses, y rusos, han hecho contribuciones esenciales al progreso de la

ciencia. Ciertamente, la exaltación celosa de una nación en particular por las

contribuciones hechas, no es característica de un espíritu grande.

La importancia del cálculo diferencial surge de la misma naturaleza del tema,

que es la consideración sistemática de las velocidades de crecimiento de las funciones.

Esta idea se presenta de manera inmediata al estudiar la naturaleza; la velocidad es la

tasa de crecimiento de la distancia viajada, y la aceleración es la tasa de crecimiento de

la velocidad. Así, la idea fundamental del cambio, que se encuentra en la base de toda

nuestra percepción sobre los fenómenos, sugiere inmediatamente la indagación sobre la

velocidad del mismo. Los términos familiares de “rápidamente” y “lentamente”,

obtienen su significado de una referencia tácita a las velocidades del cambio. De esta

forma, el cálculo diferencial se ocupa de la posición clave desde la cual las matemáticas

pueden ser satisfactoriamente aplicadas a la explicación del curso de la naturaleza.

Esta idea de la velocidad del cambio estaba en la mente de NEWTON, y fue

plasmada en el lenguaje en el que éste escribió sobre el tema.

Se puede dudar, sin embargo, sobre si este punto de vista, derivado de los fenómenos

naturales, se encontraba en las mentes de los matemáticos anteriores que hicieron

posible que este asunto surgiera. Ellos se encontraban más bien interesados en los

problemas más abstractos de trazar tangentes a curvas, de encontrar las longitudes de

curvas, y de encontrar las áreas encerradas o limitadas por las curvas. Estos últimos dos

problemas, de la rectificación de las curvas y de la cuadratura de las curvas, pertenecen

130

al cálculo integral, que está, no obstante, implicado en el mismo tema general que el

cálculo diferencial.

La introducción de la geometría de coordenadas hace que los dos puntos de vista

se unan. Porque (Cf. Fig. 32) dejemos que AQP sea cualquier línea curva y que PT sea

la tangente en el punto P en ella. Dejemos que los ejes de las coordenadas sean 0X y 0Y,

y que y = ƒ(x) sea la ecuación de la curva, de tal manera que 0M = x, y PM = y. Ahora,

dejemos que Q sea cualquier punto que se mueve en la curva, con coordenadas x1; y1;

entonces, y1 = ƒ(x1). Y dejemos que Q’ sea el punto en la tangente con la misma abscisa

x1; suponiendo que las coordenadas de Q’ sean x1 y y’. Ahora imaginemos que N se

mueve a lo largo del eje 0X de izquierda a derecha con una velocidad uniforme;

entonces es fácil ver que la ordenada y’ del punto Q’ en la tangente TP también se

incrementa uniformemente mientras Q’ se mueve a lo largo de la tangente en una forma

correspondiente. En realidad, es fácil ver que la proporción de la velocidad de

incremento de Q’N a la velocidad de incremento de 0N es en la proporción de Q’N a

TN, que es la misma en todos los puntos de la línea recta. Pero la velocidad de

incremento de QN, que es la velocidad de incremento de ƒ(x1), varía de punto a punto en

la curva siempre y cuando ésta no sea recta. Mientras Q pasa a través del punto P, la

velocidad de incremento de ƒ(x1) - donde x1 coincide con x por el momento - es la

misma que la velocidad de incremento de y’ en la tangente en P. Por lo tanto, si tenemos

un método general de determinar la velocidad de incremento de una función ƒ(x) de una

variable x, entonces podemos determinar la pendiente de una tangente en cualquier

punto (x, y) en una curva, y desde allí, podemos trazarla. Así, los problemas de trazar

tangentes a una curva, y de determinar las velocidades de incremento de una función,

son realmente idénticos.

Debe notarse que, como en los casos de las secciones cónicas y de la

trigonometría, el más artificial de los dos puntos de vista constituye la base sobre la cual

el tema a tratar surge verdaderamente. El aspecto realmente fundamental de la ciencia

suele florecer en épocas comparativamente tardías con el desarrollo de sus ideas

iniciales. Constituye una generalización histórica bien estudiada y definida, que la

última cosa a ser descubierta en cualquier ciencia es aquello de lo que se trata la ciencia.

Los hombres van a tientas durante los siglos, guiados solamente por un sombrío instinto

y una desconcertante curiosidad, hasta que, por fin, “una gran verdad es desatada”.

Tomemos algunos casos especiales para familiarizarnos con el tipo de ideas que

queremos hacer precisas. Un tren está en movimiento, ¿cómo podemos determinar su

131

velocidad en algún instante, digamos, al mediodía? Podemos tomar un intervalo de

cinco minutos que incluya al mediodía, y medir qué tanto viajó el tren en ese periodo.

Supongamos que encontramos que recorrió 5 millas, entonces podemos concluir que el

tren viajaba a una velocidad de 60 millas por hora. Pero cinco millas es una distancia

larga, y no podemos estar seguros de que el tren se movía a este paso al mediodía. Al

mediodía pudo haber estado viajando a 70 millas por hora, y después haber frenado un

poco. Sería más seguro trabajar con un intervalo más pequeño, digamos un minuto que

incluya al mediodía, y medir el espacio recorrido en ese periodo. Pero para algunos

propósitos es necesaria una mayor precisión, y un minuto puede ser demasiado largo.

En la práctica, la necesaria inexactitud de nuestras mediciones hace que sea inútil el

considerar periodos demasiado pequeños de medición. Pero en teoría, mientras más

pequeño sea el periodo, mejor, y estamos tentados a decir que, para una precisión ideal,

se requiere un periodo infinitamente pequeño. Los matemáticos más viejos, en

particular LEIBNIZ, no solamente estaban tentados, sino entregados a la tentación, y así

lo dijeron. Incluso ahora es una forma de expresión útil, siempre que sepamos

interpretarla en el lenguaje del sentido común. Es curioso que, en su exposición de los

fundamentos del cálculo, NEWTON, el científico natural, sea mucho más filosófico que

LEIBNIZ, el filósofo, y que, por otra parte, LEIBNIZ proporcionara la admirable

notación que ha sido tan esencial al progreso de la materia.

Ahora tomemos otro ejemplo dentro de la región de las matemáticas puras.

Procedamos a encontrar la tasa de incremento de la función x2 para cualquier valor x de

su argumento. Todavía no hemos definido lo que queremos decir por tasa de

crecimiento*. Intentaremos hacerlo y además comprender su significado en relación con

este caso particular. Cuando x aumenta a x + h, la función x2 aumenta a (x + h)2; de

modo que el aumento total ha sido 22)( xhx −+ , debido a un aumento h en el

argumento. Por lo tanto, a lo largo del intervalo x a (x + h), el aumento promedio de la

función por el aumento de la unidad del argumento es ( )

.22

h

xhx −+ Pero (x + h)2 = x2 +

2hx + h2, y entonces ( )

.22 222

hxh

hhx

h

xhx +=+=−+ Así, 2x + h es el aumento

promedio de la función x2 por el aumento de la unidad del argumento, siendo el

promedio asumido por el intervalo x a x + h. Pero 2x + h depende de h, el tamaño del

* O velocidad de crecimiento. Utilizo ambos términos como sinónimos ya que, para los propósitos de esta exposición, no hay diferencia entre ellos. Nota del Traductor.

132

intervalo. Evidentemente debemos de obtener lo que deseamos, esto es, la tasa de

incremento en el valor x del argumento, al hacer disminuir a h cada vez más. Por

consiguiente, en el límite, cuando h ha disminuido indefinidamente, decimos que 2x es

la tasa de incremento de x2 en el valor x del argumento.

Parece que en este punto estamos siendo conducidos, de nuevo, en contra de la

idea de cantidades infinitamente pequeñas en el uso de las palabras “en el límite, cuando

h ha disminuido indefinidamente”. LEIBNIZ sostuvo que, por más misterioso que

pueda sonar, realmente existen tales cosas como cantidades infinitamente pequeñas, y,

por supuesto, números infinitamente pequeños correspondientes a ellas. El lenguaje y

las ideas de NEWTON estaban más en concordancia con las líneas modernas, pero no

tuvo éxito en exponer este tema de manera más explícita como para que fuera lo

suficientemente evidente, sino que, más bien, explicó las ideas de LEIBNIZ en un

lenguaje indirecto. La explicación real del tema que nos ocupa fue primeramente dada

por WEIERSTRASS y por la Escuela de matemáticos de Berlín, a mediados del siglo

diecinueve. Pero entre LEIBNIZ y WEIERSTRASS, había surgido una abundante

literatura, tanto matemática como filosófica, alrededor de estas cantidades infinitamente

pequeñas y misteriosas que los matemáticos habían descubierto, y que los filósofos

procedieron a explicar. Algunos filósofos, el Obispo BERKELEY por ejemplo, negaron

correctamente la validez de toda esta idea, aunque por razones distintas de las indicadas

aquí. Pero el hecho curioso siguió siendo que, a pesar de todas las críticas a los

fundamentos de este tema, no había duda de que el procedimiento matemático era

correcto. En realidad, el tema era correcto, aunque las explicaciones no lo fueran. Es

esta posibilidad de estar en lo correcto, aunque con explicaciones totalmente erróneas de

lo que se está haciendo, lo que hace que las críticas externas - esto es, en lo que se

refiere a intentar detener la búsqueda de un método - , sean singularmente estériles e

insignificantes en el progreso de la ciencia. El instinto de los observadores capaces, y su

sentido de la curiosidad, debido al hecho de que obviamente se están acercando a algo,

son guías lo suficientemente seguras. De cualquier manera, el efecto general del éxito

del cálculo diferencial fue generar una gran cantidad de mala filosofía, centrada

alrededor de la idea de lo infinitamente pequeño. Las reliquias de esta verborrea se

pueden encontrar todavía en muchos libros de texto de matemáticas elementales que

tratan sobre cálculo diferencial. Es muy cierto el decir que, cuando un matemático o un

filósofo escriben con una profanidad oscura, están hablando cosas sinsentido.

133

NEWTON hubiera enunciado la cuestión al decir que, mientras h se acerca a

cero, en el límite 2x + h, se convierte en 2x. Nuestra tarea es ahora explicar esta

declaración para demostrar que en realidad no asume la existencia de las cantidades

infinitamente pequeñas de LEIBNIZ. Al leer el método newtoniano de la declaración, es

sumamente tentador el buscar simplicidad al decir que 2x + h es 2x cuando h es cero.

Pero esto no se va a hacer, porque de este modo se suprimiría el intervalo de x a x + h,

sobre el cual se calculó el incremento promedio. El problema es, cómo podemos

mantener un intervalo de longitud h sobre el cual podamos calcular el incremento

promedio, y, al mismo tiempo, tratar o considerar a h como si fuese cero. NEWTON

consiguió esto a partir del concepto del límite, y ahora procederemos a explicar su

significado real según WEIERSTRASS.

En primer lugar, debemos notar que, al discutir 2x + h, hemos pensado a x como

fija en valor y a h como variable. En otras palabras, x ha sido tratada como una variable

“constante”, o parámetro, como explicamos en el capítulo IX; y realmente hemos

considerado a 2x + h como una función del argumento h. Por consiguiente, podemos

generalizar la cuestión, y preguntarnos qué estamos queriendo decir con que la función

ƒ(h) tiende al límite l, esto es, mientras su argumento h tiende al valor cero. Pero

debemos ver, de nuevo, que el valor especial cero para el argumento, no pertenece a la

esencia de la cuestión; y entonces generalizamos aún más, y nos preguntamos qué

queremos decir con que la función ƒ(h) tiende al límite l mientras h tiende al valor a.

Ahora bien, de acuerdo con la explicación de WEIERSTRASS, toda la idea de h

tendiendo al valor a, aunque proporciona una especie de ilustración metafórica de cómo

nos estamos conduciendo, no es idónea en sí misma. De hecho, es sumamente obvio

que, mientras conservemos algo como “h tendiendo a a” como una idea fundamental,

estaremos en el ámbito de lo infinitamente pequeño, porque esto implica la noción de h

siendo infinitamente cercana a a. Y esto es justamente de lo que nos queremos deshacer.

De acuerdo con esto, debemos replantear nuestra frase a ser explicada, y

preguntarnos qué queremos decir con que el límite de la función ƒ(h) en a es l.

El límite de ƒ(h) en a es una propiedad de la vecindad de a, donde “vecindad” es

usada en el sentido definido en el capítulo XI durante la discusión de la continuidad de

las funciones. El valor de la función ƒ(h) en a es ƒ(a); pero el límite es distinto en idea

del valor, y puede ser diferente a él, e incluso puede existir cuando el valor no haya sido

aún definido. También debemos usar el término “estándar de aproximación” en el

sentido en el que fue definido en el capítulo XI. De hecho, en la definición de

134

“continuidad” dada al final de ese capítulo, hemos prácticamente definido un límite. La

definición de un límite es:

Una función ƒ(x) tiene el límite l en el valor a de su argumento x, cuando en la

vecindad (cercanía)* de a sus valores se aproximan a l dentro de cada estándar de

aproximación.

Comparemos esta definición con la dada para la continuidad, a saber:

Una función ƒ(x) es continua en un valor a de su argumento, cuando en la

vecindad (cercanía) de a, sus valores se aproximan a su valor en a dentro de cada

estándar de aproximación.

Es evidente que una función es continua en a cuando (i) posee un límite en a, y

(ii) ese límite es igual a su valor en a. Así, los ejemplos de continuidad que hemos dado

al final del capítulo XI, son ejemplos de la idea de un límite, a saber, todos ellos estaban

dirigidos a probar que ƒ(a) era el límite de ƒ(x) en a para las funciones consideradas y

para el valor de a considerado. En realidad, es más instructivo considerar el límite en un

punto donde una función no sea continua. Por ejemplo, consideremos la función

graficada en la fig. 20 del capítulo XI. Esta función ƒ(x) está definida para tener el valor

1 para todos los valores del argumento excepto para los enteros 1, 2, 3, etc., teniendo

para estos valores integrales el valor 0. Pensemos en su límite cuando x = 3. Hemos

notado que en la definición de límite, el valor de la función en a (en este caso, a = 3),

está excluido. Pero, excluyendo a ƒ(3), los valores de ƒ(x), cuando x se encuentra dentro

de cualquier intervalo que (i) contenga a 3 no como un punto-final, y (ii) no se extienda

hasta 2 y 4, serán todos iguales a 1; y, por lo tanto, estos valores se aproximarán a 1

dentro de cada estándar de aproximación. Por consiguiente, 1 es el límite de ƒ(x) en el

valor 3 del argumento x, pero, por definición, ƒ(3) = 0.

Este es un caso de una función que posee tanto un valor como un límite en el

valor 3 del argumento, pero el valor no es igual al límite. Al final del capítulo XI, se

consideró a la función x2 en el valor 2 del argumento. Su valor en 2 es 22, esto es, 4, y se

probó que su límite también era 4. Entonces, tenemos una función con un valor y un

límite que son iguales.

Finalmente, llegamos al caso que es esencialmente importante para nuestros

propósitos, a saber, a una función que posee un límite, pero ningún valor definido en un

cierto valor de su argumento. No necesitamos ir muy lejos para encontrar tal función,

* La palabra dentro de los paréntesis es mía. Nota del Traductor.

135

x

x2 servirá para nuestros propósitos. Ahora bien, en cualquier libro sobre matemáticas,

podemos encontrar la ecuación 22 =x

x, escrita sin más. Pero existe una dificultad en

esto; porque cuando x es cero, ;0

02 =x

x y

0

0 no tiene un significado definido. Así, el

valor de la función x

x2 en x = 0, no tiene significado definido. Pero para cualquier otro

valor de x, el valor de la función x

x2 es 2. De esta forma, el límite de

x

x2 en x = 0 es 2,

y no tiene un valor en x = 0. De manera similar, el límite de x

x2

en x = a es a sea lo que

pueda ser a, de tal forma que el límite de x

x2

en x = 0 es 0. Pero el valor de x

x2

en x = 0

toma la forma 0

0, que no tiene un significado definido. Así, la función

x

x2

tiene un

límite, pero no un valor en 0.

Volvemos ahora al problema con el cual empezamos nuestra discusión acerca de

la naturaleza del límite. ¿Cómo vamos a definir la tasa de incremento de la función x2 en

cualquier valor x de su argumento? Nuestra respuesta es que esta tasa de incremento es

el límite de la función ( )

h

xhx 22 −+ en el valor cero de su argumento h. (Nótese que x

es aquí una “constante”). Veamos cómo funciona esta respuesta bajo la luz de nuestra

definición de límite. Tenemos que

( ) ( ).

22 222

h

hxh

h

hhx

h

xhx +=+=−+

Ahora, al encontrar el límite de ( )

h

hxh +2 en el valor 0 del argumento h, el valor

(si lo hay) de la función en h = 0 está excluido. Pero para todos los valores de h, excepto

h = 0, podemos dividir por medio de h. Así, el límite de ( )

h

hxh +2 en h = 0 es el mismo

que el de 2x + h en h = 0. Ahora, con cualquier estándar de aproximación que

escojamos, al considerar el intervalo de k2

1− a k2

1+ , vemos que, para valores de h que

136

caen o están dentro de él, 2x + h difiere de 2x por menos de k2

1, esto es, por menos de

k. Esto es cierto para cualquier estándar k. Por lo tanto, en la vecindad (cercanía) del

valor 0 para h, 2x + h se aproxima a 2x dentro de cada estándar de aproximación, y, por

esto, 2x es el límite de 2x + h en h = 0. Por lo tanto, por lo que se ha dicho arriba, 2x es

el límite de ( )

h

xhx −+ 2

en el valor 0 para h. Se sigue, por esto, que 2x es lo que hemos

estado llamando la tasa de incremento de x2 en el valor x del argumento. Este método

nos conduce a la misma tasa o velocidad de incremento para x2, igual que lo hacía el

método de LEIBNIZ, consistente en hacer que h tienda hacia lo “infinitamente

pequeño”.

A partir de ahora, se usan términos mucho más abstractos para lo que hasta

ahora hemos llamado la “tasa de incremento” de una función, como “coeficiente

diferencial”, o “función derivada”. La definición general es como sigue: el coeficiente

diferencial de la función ƒ(x) es el límite, si existe, de la función ( ) ( )

h

xfhxf −+ del

argumento h en el valor 0 de su argumento.

¿Cómo es que hemos, a partir de esta definición y de la definición subsidiaria de

lo que es un límite, evitado la noción de “números infinitamente pequeños”, que tanto

preocupaba a nuestros antepasados matemáticos? Para ellos, la dificultad surgió porque,

por una parte, tuvieron que usar un intervalo x a x + h sobre el cual pudieran calcular el

incremento promedio y, por otra parte, finalmente quisieron poner h = 0. El resultado

fue que parecían haber llegado a la noción de un intervalo existente de tamaño 0.

¿Cómo hemos evitado nosotros esa dificultad? Es muy simple: usamos la noción de que

se puede encontrar algún intervalo, con tales y cuales propiedades, correspondiente a

cualquier estándar de aproximación. La diferencia es que nosotros hemos tenido en

cuenta la importancia de la noción de la “variable”, y ellos no. Así, al final de nuestra

exposición de las nociones esenciales del análisis matemático, volvemos a las ideas con

las que empezamos nuestra investigación en el capítulo II, esto es, que en las

matemáticas, las ideas fundamentalmente importantes son aquellas de “algunas cosas” y

“cualesquiera cosas”.

137

CAPÍTULO XVI

GEOMETRÍA

La geometría, al igual que el resto de las matemáticas, es abstracta. En ella, se

estudian las propiedades de las formas y de las posiciones relativas de las cosas. Pero no

necesitamos considerar quién observa las cosas, o si está familiarizado con ellas por la

vista, el tacto, o el oído. En pocas palabras, ignoramos todas las sensaciones

particulares. Más aún, las cosas particulares, como el recinto del Parlamento, o el globo

terrestre, también son ignoradas. Cada proposición se refiere a cualesquiera cosas con

tales y cuales propiedades geométricas. Desde luego, el observar ejemplos particulares

de esferas, conos, triángulos y cuadrados ayuda a nuestra imaginación. Pero las

proposiciones no se aplican solamente a las figuras representadas en este libro, sino a

cualesquiera figuras de ese tipo.

Así, la geometría, lo mismo que el álgebra, está dominada por las ideas de

“cualesquiera” y “algunas” cosas. Pero también estudia las interrelaciones existentes

entre los conjuntos de las cosas. Por ejemplo, consideremos cualesquiera dos triángulos

ABC y DEF.

¿Qué relaciones deben existir entre algunas de las partes de estos triángulos, a

fin de que los triángulos sean iguales en todos los aspectos? Esta es una de las primeras

investigaciones que se deben llevar a cabo en todas las geometrías elementales.

138

Es el estudio de un cierto conjunto de correlaciones posibles entre los dos triángulos. La

respuesta es que los triángulos son iguales en todos los aspectos si: o bien (a) dos lados

de uno y su ángulo comprendido* son iguales respectivamente a dos lados del otro y a

su ángulo comprendido; o (b) dos ángulos de uno y el lado que los une son iguales

respectivamente a dos ángulos del otro y al lado que los une; o (c) tres lados de uno son

iguales respectivamente a tres lados del otro.

Esta respuesta sugiere una investigación posterior. ¿Cuál es la naturaleza de la

correlación entre los triángulos, cuando los tres ángulos de uno son iguales

respectivamente a los tres ángulos del otro? Esta investigación posterior nos conduce

naturalmente a la teoría de la similitud (Cf. Cap. XIII), que constituye otro tipo de

correlación.

Tomemos otro ejemplo, y consideremos la estructura interna del triángulo ABC.

Sus lados y ángulos están interrelacionados, ya que el ángulo mayor es opuesto al lado

mayor, y los ángulos de la base de un triángulo isósceles son iguales. Si procedemos a

la trigonometría, esta correlación recibe una determinación más exacta, bajo la forma

,c

senC

b

senB

a

senA == ,cos2222 Abccba −+= con dos fórmulas similares. También

existe la todavía más simple correlación entre los ángulos del triángulo, a saber, que su

suma es igual a dos ángulos rectos; y entre los tres lados, a saber, que la suma de las

longitudes de cualesquiera dos lados es mayor que la longitud del tercero.

Así, el método verdadero para estudiar geometría es pensar en figuras simples,

tales como el triángulo, el paralelogramo, y el círculo, e investigar las correlaciones

entre sus diversas partes. El geómetra no debe tener en mente una proposición aislada,

sino una figura en la que sus distintas partes son mutuamente interdependientes. Así

como en el álgebra, debe generalizar el triángulo en el polígono, y el lado en la sección

cónica. O, siguiendo el camino inverso, debe clasificar a los triángulos de acuerdo con

si son equiláteros, isósceles, o escalenos, y a los polígonos de acuerdo con si el número

de sus lados, y a las secciones cónicas de acuerdo con si son hipérbolas, elipses, o

parábolas.

Los ejemplos precedentes demuestran cómo las ideas fundamentales de la

geometría son exactamente las mismas que aquellas del álgebra; excepto en que el

álgebra trata con números, y la geometría con líneas, ángulos, áreas, y con otras * O ángulo incluido. En inglés “included angle”. Nota del Traductor.

139

entidades geométricas. Esta identidad es una de las razones por las cuales tantas

verdades geométricas pueden ser puestas bajo un arreglo algebraico. De esta forma, si

A, B, y C son los números de grados respectivos a los ángulos del triángulo ABC, la

correlación entre los ángulos se puede representar por la ecuación A + B + C = 180°; y

si a, b, c son los números de pies* respectivos a los tres lados, la correlación entre los

lados se puede representar por a < b + c, b < c + a, c < a + b. También las fórmulas

trigonométricas escritas arriba son otros ejemplos del mismo hecho. En otras palabras,

la noción de la variable y de la correlación entre las variables es tan esencial en la

geometría como lo es en el álgebra.

Pero el paralelismo entre la geometría y el álgebra puede ser desarrollado

todavía más, debido al hecho de que las longitudes, áreas, volúmenes, y ángulos, son

todos medibles; entonces, por ejemplo, el tamaño de cualquier longitud puede ser

determinado por el número (no necesariamente entero) de veces que ésta contiene

arbitrariamente alguna unidad conocida, y de manera similar para las áreas, volúmenes,

y ángulos. Las fórmulas trigonométricas dadas arriba son ejemplos de este hecho. Pero

recibe su aplicación triunfal en la geometría analítica. A este gran tema se le da

comúnmente el mal nombre de secciones cónicas analíticas, poniendo atención así

solamente a una de sus subdivisiones. Es como si a la gran ciencia de la antropología, se

le llamará el estudio de las narices, debido al hecho de que las narices son una parte

prominente del cuerpo humano.

Aunque los procedimientos matemáticos en la geometría y en el álgebra son, en

esencia, idénticos y están entrelazados en su desarrollo, existe necesariamente una

distinción fundamental entre las propiedades del espacio y las propiedades del número;

de hecho, entre toda la diferencia esencial entre el espacio y el número. La

“espaciosidad” del espacio y la “numerosidad” del número son cosas esencialmente

distintas, y deben ser aprehendidas directamente. Ninguna de las aplicaciones del

álgebra en la geometría, o de la geometría en el álgebra, avanza ningún paso en el

camino para eliminar esta distinción vital.

Una diferencia muy marcada entre el espacio y el número es que el primero

parece ser mucho menos abstracto y fundamental que el último. El número de los

arcángeles puede ser contado simplemente porque son cosas. Cuando sabemos que sus

nombres son Rafael, Gabriel, y Miguel, y que estos distintos nombres representan

* Pies entendidos como medida de longitud. Nota del Traductor.

140

distintos seres, sabemos, sin tener que preguntarnos más cosas, que son tres. Todas las

sutilezas en el mundo sobre la naturaleza de las existencias angelicales no pueden

alterar este hecho, dada la concesión de las premisas.

Pero aún no sabemos cuál es su relación con el espacio. ¿Existen, en absoluto, en

el espacio? Probablemente es igualmente sinsentido el decir que están aquí, o allá, o en

cualquier parte, o en todas partes. Su existencia puede simplemente no tener relación

alguna con las localidades en el espacio. De acuerdo con esto, mientras los números se

deben aplicar a todas las cosas, el espacio no necesariamente debe hacerlo.

La percepción de la localidad de las cosas podría parecer estar acompañada, o

por lo menos estar involucrada, con muchas, o todas, de nuestras sensaciones. Es

independiente de cualquier sensación particular, en el sentido de que acompaña muchas

de éstas. Pero es una peculiaridad especial de las cosas que aprehendemos por las

mismas. La aprehensión directa de lo que entendemos por las posiciones de las cosas

con respecto unas con otras es una cosa sui generis, así como también lo son las

aprehensiones de los sonidos, colores, sabores, y olores. A primera vista, parecería por

lo tanto que las matemáticas, en la medida en que incluyen a la geometría, no son

abstractas en el sentido en el que definimos la abstracción en el capítulo I.

Esto, sin embargo, es un error; porque la “espaciosidad” del espacio no tiene

cabida en nuestro razonamiento geométrico. Aunque sí tiene cabida en las intuiciones

geométricas de los matemáticos, en formas peculiares y personales para cada individuo.

Pero lo que entra en el razonamiento son simplemente ciertas propiedades de las cosas

en el espacio, o de cosas que forman el espacio, y cuyas propiedades son completamente

abstractas, en el sentido en el que definimos la abstracción en el capítulo I; estas

propiedades no involucran ninguna aprehensión, intuición, o sensación espacial

peculiar. Tienen exactamente la misma base que las propiedades matemáticas del

número. Así, la intuición espacial - que es tan esencial al estudio de la geometría - es

lógicamente irrelevante: no tiene cabida en las premisas cuando éstas están propiamente

declaradas, ni tampoco en algún paso del razonamiento. Tiene la importancia práctica

de constituir un ejemplo, que es esencial para la estimulación de nuestros pensamientos.

Los ejemplos son igualmente necesarios para estimular nuestros pensamientos sobre el

número. Cuando pensamos en “dos” y en “tres”, vemos trazos en una fila, o pelotas

apiladas, o cualquier otro agregado físico de cosas particulares. La peculiaridad de la

geometría es la fijeza y la abrumadora importancia de un ejemplo particular que ocurre

en nuestras mentes. Cuando esto se expone, la forma lógica abstracta que adopta es: “Si

141

cualesquiera colecciones de cosas tienen tales y cuales propiedades abstractas, también

tienen tales y cuales otras propiedades abstractas”. Pero lo que aparece ante la mente es

una colección de puntos, líneas, superficies, y volúmenes en el espacio: este ejemplo

inevitablemente aparece, y es el ejemplo por sí mismo lo que da a la proposición su

interés. Sin embargo, incluso con toda su abrumadora importancia, no es más que un

ejemplo.

La geometría, vista como una ciencia matemática, es una división de la más

general ciencia del orden. Puede ser llamada la ciencia del orden dimensional; el título

de “dimensional” ha sido introducido debido a las limitaciones, que la reducen a sólo

una parte de la ciencia general del orden, que son tales como para producir las

relaciones regulares de las líneas rectas en planos, y de los planos en la totalidad del

espacio.

Es fácil entender la importancia práctica del espacio en la formación de la

concepción científica de un mundo físico externo. Por un lado, nuestras percepciones

espaciales están entrelazadas con nuestras distintas sensaciones, además de que las

primeras conectan a las últimas. Normalmente, juzgamos que tocamos un objeto en el

mismo lugar en el que lo vemos; e incluso en caso anormales lo tocamos en el mismo

espacio en el que lo vemos, y este es el hecho real y fundamental que ata nuestras

distintas sensaciones. De acuerdo con esto último, las percepciones espaciales son, en

un sentido, la parte común de nuestras sensaciones. Sucede que las propiedades

abstractas del espacio forman una gran parte de lo que sea que constituya algo de interés

espacial. No es demasiado decir, que a cada propiedad del espacio le corresponde una

declaración o principio matemático abstracto. Para tomar el más desfavorable de los

casos, una curva puede tener una belleza especial en su forma: pero a esta forma le

corresponderán algunas propiedades matemáticas abstractas, que son propias de esta

forma, y no de otras.

Para recapitular: (1) las propiedades del espacio que son investigadas en la

geometría, como las del número, son propiedades que pertenecen a cosas como cosas, y

sin ninguna referencia especial a algún modo particular de aprehensión; (2) la

percepción espacial acompaña a nuestras sensaciones, probablemente a todas ellas,

ciertamente a muchas; pero no parece haber una cualidad necesaria en las cosas, como

para que deban existir todas en un espacio o en cualquier espacio.

142

CAPÍTULO XVII

CANTIDAD

En el capítulo anterior, señalamos que las longitudes son medibles en términos

de alguna unidad de longitud, las áreas en términos de una unidad de área, y los

volúmenes en términos de una unidad de volumen.

Cuando tenemos un conjunto de cosas, tales como longitudes medibles en

términos de cualquiera de las unidades descritas, decimos que son cantidades del mismo

tipo. Así, las longitudes son cantidades del mismo tipo, como también lo son las áreas y

los volúmenes. Pero un área no es una cantidad del mismo tipo que una longitud, ni del

mismo tipo que un volumen. Pensemos un poco más en lo que quiere decir que algo es

medible, tomando a las longitudes como ejemplo.

Las longitudes son medibles por la regla del pie*. Al transportar la regla del pie

de un lugar a otro, podemos hacer un juicio acerca de la igualdad de las longitudes. De

nuevo, tres longitudes adyacentes, cada una de un pie, forman una longitud total de tres

pies. Así, para medir longitudes, debemos determinar la igualdad de las longitudes y la

adición (suma) de las longitudes. Cuando se ha hecho un examen de este tipo, tal como

transportar la regla del pie, decimos que las longitudes son iguales; y cuando se ha

aplicado algún proceso, para asegurarnos de que las longitudes son contiguas y no

superpuestas, decimos que las longitudes han sido añadidas (o sumadas) para formar

una longitud total. Pero no podemos tomar arbitrariamente cualquier examen como el

examen de igualdad, ni tampoco cualquier proceso como el proceso de adición. Los

resultados de las operaciones de adición y de los juicios sobre la igualdad deben estar de

acuerdo con ciertas condiciones preconcebidas. Por ejemplo, la adición de dos

cantidades más grandes, debe producir una longitud mayor que aquella producida por la

adición de dos cantidades más pequeñas. Estas condiciones preconcebidas, cuando son

formuladas de manera precisa, pueden ser llamadas axiomas de cantidad. La única

cuestión que puede surgir acerca de su veracidad o falsedad es si, cuando los axiomas

están satisfechos, necesariamente debemos obtener lo que la gente ordinaria entiende

* O del metro, yarda, etc. Nota del Traductor.

143

por cantidades. Si no lo obtenemos, entonces quiere decir que el nombre “axiomas de

cantidad” es imprudente, eso es todo.

Estos axiomas de cantidad son completamente abstractos, de igual forma que lo

son las propiedades matemáticas del espacio. Son los mismos para todas las cantidades,

y no presuponen algún modo especial de percepción. Las ideas asociadas con la noción

de cantidad son los medios por los cuales un continuo como una línea, un área, o un

volumen, pueden ser divididos en partes definidas. Entonces se procede a contar estas

partes, de modo que los números puedan ser usados para determinar las propiedades

exactas de un todo continuo.

Nuestra percepción sobre el flujo del tiempo y sobre la sucesión de los eventos

es un muy buen ejemplo de la aplicación de estas ideas de cantidad. Nosotros medimos

el tiempo (como ya se ha dicho al considerar la periodicidad) por la repetición de

eventos similares: la quema de las pulgadas sucesivas de una vela, la rotación de la

Tierra con relación a las estrellas fijas, la rotación de las manecillas de un reloj, son

todos ejemplos de tales repeticiones. Los eventos de este tipo toman el lugar de la regla

del pie en relación con las longitudes. No es necesario asumir que los eventos de

cualquiera de estos tipos son exactamente iguales en duración en cada recurrencia (o

repetición). Lo que sí es necesario es que una regla nos permita expresar las duraciones

relativas de, digamos, dos ejemplos de este tipo. Por ejemplo, podemos suponer que la

velocidad de la rotación de la Tierra está disminuyendo, de manera que cada día es más

largo que el día precedente por alguna fracción de segundo. Tal regla nos permite

comparar la longitud de cualquier día con la longitud de cualquier otro día. Pero lo que

es esencial, es que una serie de repeticiones, tal como la sucesión de los días, debe ser

tomada como la serie estándar; y, si los distintos eventos de esta serie no son tomados a

partir de duraciones iguales, esa regla debe regular la duración a ser asignada a cada día

en términos de la duración de cualquier otro día.

¿Cuáles son, entonces, los requisitos que tal regla debe tener? En primer lugar,

debe conducirnos a poder asignar duraciones casi cercanas a los eventos que el sentido

común juzga como poseedores de duraciones iguales. Una regla que haga que las

longitudes de los días sean sumamente distintas, y que haga que las velocidades de

operaciones aparentemente similares varíen absolutamente fuera de la proporción de la

aparente minuciosidad de sus diferencias, nunca podría tener este requisito. Por lo tanto,

el primer requisito es el acuerdo general con el sentido común. Pero esto no es lo

suficientemente necesario como para determinar la regla, porque el sentido común es un

144

observador tosco y que se satisface fácilmente. El siguiente requisito es que los ajustes

minuciosos de la regla deben ser hechos para permitir las declaraciones más simples de

las leyes de la naturaleza. Por ejemplo, los astrónomos nos dicen que la rotación de la

Tierra está desacelerando, de manera que cada día es más grande en longitud por una

inconcebible fracción de segundo. La única razón que tienen para su afirmación (como

fue indicada de manera más completa en la discusión sobre la periodicidad), es que, sin

ella, se tendrían que abandonar las leyes newtonianas sobre el movimiento. A fin de que

las leyes del movimiento se mantengan simples, se altera la medición del tiempo. Este

es un procedimiento perfectamente legítimo, siempre y cuando sea completamente

entendido.

Lo que se ha dicho arriba acerca de la naturaleza abstracta de las propiedades

matemáticas del espacio, es aplicable - con algunos cambios en el lenguaje - a las

propiedades matemáticas del tiempo. Una sensación sobre el flujo del tiempo acompaña

todas nuestras sensaciones y percepciones, y se puede hacer un paralelismo con

prácticamente todo lo que nos interesa con respecto al tiempo, debido a las propiedades

matemáticas abstractas que le atribuimos. De manera inversa, todo lo que se ha dicho

acerca de los dos requisitos para la regla por la cual determinamos la longitud del día,

también se aplica a la regla para determinar la longitud de una medida de yarda*, esto

es, parece que la medida de la yarda conserva la misma longitud a medida que se

mueve. De acuerdo con esto, cualquier regla debe hacer resaltar que, aparte de cambios

minuciosos, mantiene longitudes invariables. De nuevo, el segundo requisito es este:

debe establecerse una regla para los cambios minuciosos que nos permita expresar las

leyes de la naturaleza más simples. Por ejemplo, de acuerdo con el segundo requisito,

las medidas de la yarda están supuestas a expandirse y a contraerse por los cambios en

la temperatura, de acuerdo con las sustancia son las que fueron fabricadas.

Aparte de los hechos de que nuestras sensaciones están acompañadas por

percepciones de localidad y de duración, y de que las líneas, áreas, volúmenes, y

duraciones, son cada una de ellas cantidades, el uso de la teoría de números será muy

secundario en la exploración de las leyes del Universo. Tal como es, la ciencia física

reposa sobre las principales ideas del número, de la cantidad, del espacio, y del tiempo.

Las ciencias matemáticas asociadas con estas ideas no conforman el todo de las

* O metro, pie, etc. Nota del Traductor.

145

matemáticas, pero son el sustrato de la física matemática tal como ésta existe en la

actualidad.

BIBLIOGRAFÍA

NOTA SOBRE EL ESTUDIO DE LAS MATEMÁTICAS

La dificultad que los principiantes encuentran al estudiar esta ciencia se debe a la gran cantidad

de detalles técnicos que se han ido acumulando en los libros de texto elementales, y que oscurecen las

ideas realmente importantes.

Los primeros temas de estudio, aparte de un conocimiento sobre la aritmética, que se da

presupuesto, deben ser la geometría elemental y el álgebra elemental. Los cursos para ambos temas deben

ser cortos, proporcionando solamente las ideas necesarias; el álgebra debe ser estudiada gráficamente, a

fin de que, en la práctica, las ideas elementales de la geometría de coordenadas sean también asimiladas.

El siguiente par de temas deben ser la trigonometría elemental y la geometría de coordenadas de la línea

recta y del círculo. El último de estos temas dichos es realmente corto, porque se fusiona con el álgebra.

Siguiendo estos lineamientos, el estudiante estará preparado para entrar en el tema de las secciones

cónicas, estudiando un curso muy corto de secciones cónicas geométricas, y uno más largo de cónicas

analíticas. Pero, en todos estos cursos, se debe tener mucho cuidado para no sobrecargar la mente con más

detalles de los necesarios para la ejemplificación de las ideas fundamentales.

El cálculo diferencial, y después el cálculo integral, deben seguir el mismo sistema de enseñanza.

Un buen maestro los habrá ejemplificado o ilustrado al considerar casos especiales en el curso sobre el

álgebra y sobre la geometría de coordenadas. Se debe leer también algún libro pequeño sobre geometría

tridimensional.

Este curso elemental de matemáticas es suficiente para algunos tipos de carrera profesional. Es

también lo necesariamente preliminar para cualquiera que desee estudiar el tema por un interés intrínseco,

y debería estar preparado para un curso más extendido. No debe esperar, sin embargo, dominar a las

matemáticas en su totalidad. Esta ciencia ha crecido a proporciones tan vastas, que probablemente ningún

matemático vivo sea capaz de dominar todos los temas.

Pasando a los tratados serios sobre este tema que deben ser leídos después de este curso

preliminar, se puede mencionar a los siguientes: Pure Geometry de Cremona (Traducción al inglés,

Clarendon Press, Oxford), Treatise on Trigonometry de Hobson, Treatise on Algebra de Chrystal (2

volúmenes), Conic Sections de Salmon, Differential Calculus de Lamb, y algún libro sobre Ecuaciones

diferenciales. Probablemente el estudiante no desee dirigir una atención igual a todos estos temas, pero

puede estudiar uno o más de ellos, dependiendo de lo que dicte su interés. Estará entonces preparado para

seleccionar trabajos más avanzados, y sumergirse en partes más desarrolladas del tema. Si su interés es el

análisis, debe entonces dominar algún tratado elemental sobre la teoría de las fracciones o sobre las

146

variables complejas; si prefiere especializarse en geometría, debe proceder a los tratados estándares sobre

la geometría analítica de tres dimensiones. Pero en esta etapa de su carrera, probablemente no requiera del

asesoramiento de esta nota.

Me he abstenido deliberadamente de mencionar cualquier trabajo o tratado elemental. Son muy

numerosos, y de distintos méritos, pero ninguno tan sobresaliente como para que requiera una mención

especial, con la consiguiente exclusión de todos los demás.

edición digital para la biblioteca digital del...

Documents