utorial-00t : instalación del software y primeros pasos ... · abrir ese chero, para instalar el...

25

Upload: vutuyen

Post on 19-Sep-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • PostData Curso de Introduccin a la Estadstica

    Tutorial-00: Instalacin del software y primeros pasos.

    Este documento pdf lleva adjuntos algunos de los cheros de datos necesarios. Y est pensadopara trabajar con l directamente en tu ordenador. Al usarlo en la pantalla, si es necesario,puedes aumentar alguna de las guras para ver los detalles. Antes de imprimirlo, piensa sies necesario. Los rboles y nosotros te lo agradeceremos.

    Fecha: 20 de enero de 2017. Si este chero tiene ms de un ao, puede resultar obsoleto.Busca si existe una versin ms reciente.

    ndice

    1. Lectores de documentos en formato pdf. 1

    2. Navegador de internet. 3

    3. Instalacin de la hoja de clculo Calc. 4

    4. Editores de texto. 8

    5. Ficheros csv con Calc. 9

    6. Instalacin de R y RStudio. 17

    7. Instalacin de GeoGebra. 20

    8. Siguiente paso. Dnde vamos ahora? 25

    En este primer tutorial vamos a limitarnos a preparar las herramientas que necesitamos para eltrabajo del curso, que comenzar realmente a partir del Tutorial-01. Instalaremos casi todos losprogramas que vamos a utilizar, y repasaremos algunas cuestiones de ndole prctica que convienediscutir al principio, antes de que nos causen problemas ms adelante. Es posible que, dependiendode tu experiencia previa con ordenadores, todas o algunas de esas cuestiones te resulten muyfciles. Las incluimos aqu porque, en nuestra experiencia, inicialmente causan problemas a muchosestudiantes del curso.Vamos a describir paso a paso, y con capturas de pantalla, la instalacin de varios programas. Teaconsejamos que vayas un paso por delante en la lectura, en lugar de ir ejecutando las cosas a lavez que lees las instrucciones, para evitarte sorpresas o errores.

    1. Lectores de documentos en formato pdf.

    Si ests leyendo este tutorial en la versin pdf, en la pantalla de tu ordenador (que es la formaque recomendamos), eso signica que ya tienes instalado un lector de cheros pdf. En sistemasWindows, el ms extendido de estos programas es el Adobe Reader. Si usas este programa, terecomendamos que veriques que tienes la ltima versin (esto es una buena idea, hablando engeneral, para cualquier programa que uses). Puedes usar el enlace:

    http://get.adobe.com/es/reader/

    De hecho, las ltimas versiones para Windows, desde la 10.1, incluyen la opcin de autoactualiza-cin del programa. Si tu versin es ms antigua, actualzala ahora mismo!La mayora de los cheros pdf del curso, como este, incluirn:

    Enlaces a pginas web.

    Ficheros adjuntos, de los tipos que vamos a usar en el curso: hojas de clculo, cheros csvcon datos, cheros con cdigo R, cheros de GeoGebra, etc. Es decir, el chero pdf contieneesos documentos, y no es preciso descargarlos de internet por separado.

    1

    http://www.postdata-statistics.com/http://get.adobe.com/es/reader/

  • El lector pdf que utilices puede inuir de forma importante en la facilidad de uso de esos documentosadjuntos. Nuestro favorito, para el sistema Windows, es el programa gratuito y de cdigo abiertollamado SumatraPDF, que puedes descargar desde este enlace:

    http://blog.kowalczyk.info/software/sumatrapdf/free-pdf-reader-es.html

    Una primera advertencia:

    Enlaces y descarga de programas.

    Suponemos que el usario de este curso es consciente de que tiene que velar por su propiaseguridad. Usa slo los enlaces que te proporcionamos para descargar los programas. Hay unacantidad ingente de pginas de descarga de programas en la red. Y como nos explic nuestramadre sobre los extraos que te encuentras en la calle, no todos son bien intencionados...En caso de duda, antes de instalar nada, consulta con alguien de conanza. Mantn tuordenador actualizado, usa un buen antivirus, etc.

    SumatraPDF no es el lector de PDF ms conocido, ni el que ms posibilidades ofrece, pero es muyrpido y ligero (en trminos de consumo de recursos, si tu ordenador no es muy potente). Y selleva bastante bien con los enlaces y cheros adjuntos que incluiremos. Un simple clic con el botnizquierdo del ratn basta para:

    Abrir un enlace en el navegador.

    Abrir un cuadro de dilogo para guardar un chero adjunto.

    La instalacin de SumatraPDF es extremadamente sencilla, as que no creemos necesario entraren detalles.

    1.0.1. Programas predeterminados y usuarios de gatillo fcil.

    Queremos extendernos un poco ms sobre este ltimo punto. Nuestra experiencia indica que losusuarios, con demasiada frecuencia, somos de gatillo fcil con el ratn: nos hemos acostumbrado ahacer clic, o doble clic, con el botn izquierdo del ratn con demasiada facilidad. En muchos casos,eso conduce a que el sistema trate de abrir el chero adjunto con el programa predeterminado delsistema operativo para ese tipo de archivos. En la mayora de los sistemas, el nombre de los archivosse compone de dos partes, separadas por un punto, como en este ejemplo:

    cheroDatos identicador

    . csv extensin

    La extensin, como seguramente sabes, es el cdigo (muchas veces, pero no siempre) de tres letrasque sigue al punto, y que nos permite identicar el tipo de chero. Pero, adems, el tipo de chero(la extensin), sirve para determinar cul es el programa que se utiliza por defecto cuando abrimosel chero, por ejemplo haciendo doble clic sobre l con el ratn. De esa forma, al hacer doble clicsobre un chero de tipo csv , nos podemos encontrar con la sorpresa de que el sistema intentaabrirlo con la hoja de clculo Microsoft Excel, si est instalada, porque el sistema tiene una listade asociaciones de cheros con programas que dice cosas como

    los cheros csv (cuya extensin es .csv) se abren con Excel.

    Es decir, Excel es el programa predeterminado (o programa por defecto) del sistema para cherosde tipo csv. En general, este comportamiento del sistema es cmodo y nos ahorra tiempo. Pero,en ocasiones, eso no es lo que queremos que suceda. En particular, en este curso, nunca vamosa usar Excel para abrir cheros csv (entre otras cosas, no asumimos que el usuario tenga Excelinstalado). Para evitar eso, sigue este consejo:

    Procedimiento para abrir cheros adjuntos:

    1. Acostmbrate a usar el botn derecho del ratn y busca opciones como Guardararchivo... Si eso no funciona, entonces y slo entonces, prueba a hacer clic odoble clic con el botn izquierdo.

    2. Una vez que hayas guardado el chero en una carpeta de tu ordenador, tienesque abrirlo. Y aqu, de nuevo, hay que acostumbrarse a usar el botn derecho,y buscar opciones como Abrir con...

    2

    http://blog.kowalczyk.info/software/sumatrapdf/free-pdf-reader-es.html

  • Si no hay disponible una opcin como Abrir con..., se debe a que tu ordenador no tiene asignadoun programa por defecto con el que abrir ese tipo de cheros. Por ejemplo, en mi Escritorio deWindows (versin 7) tengo un chero que se llama bicho.raro. Usando el botn derecho no aparecela opcin abrir con, solo la opcin Abrir. Usando esta opcin (o si, directamente, hago doble clicsobre el chero) aparece esta ventana:

    Lo mejor, en la inmensa mayor parte de los casos, es seleccionar la opcin Seleccionar unprograma de la lista de programas instalados y pulsar en Aceptar. En la ventana de dilo-go que aparece a continuacin, puedes seleccionar el programa que deseas utilizar. Pero tienes queprestar especial atencin a los dos elementos que hemos indicado con echas rojas en la gura.

    La casilla Usar siempre el programa... es especialmente importante, porque puede cambiar elcomportamiento de tu equipo, y tal vez no desees ese cambio. As que ve con cuidado! Si esacasilla est marcada, y seleccionas el programa A (el que quieras) para abrir un chero de tipo B,Windows modicar la lista a la que aludamos antes, y escribir en ella una lnea

    los cheros de tipo B se abren por defecto con el programa A.

    Si no quieres que pase eso, debes desmarcar esta casilla. Por lo dems, si el programa que deseasutilizar aparece en la ventana de la parte superior del cuadro de dilogo, basta con seleccionarlo ypulsar Aceptar. Cuando no es as, hay que usar el botn Examinar, para localizar el programa quequeremos usar. Esta parte puede ser ms o menos fcil, dependiendo del programa que se trate,y de tu versin de Windows. Si tienes problemas para encontrar el programa, busca en internet,o pide ayuda a alguien que sepa ms que t. En general ese consejo sirve no slo para este paso,sino para cualquiera de los siguientes. Siempre conviene tener un ninja informtico a mano.

    2. Navegador de internet.

    Para muchas de las tareas asociadas a este curso, la eleccin de uno u otro navegador de Internetes irrelevante, siempre que se trate de versiones recientes. Pero para algunos temas concretos delcurso es recomendable que utilices el navegador Firefox, que puedes descargar desde este enlace:

    3

  • http://www.mozilla.org/es-ES/refox/new/

    Hay versiones disponibles para Windows, Mac y Linux. La razn por la que te recomendamos Fire-fox es porque este navegador permite visualizar correctamente las frmulas matemticas, mientrasque otros navegadores nos han causado ms problemas al hacer esto En cualquier caso, apare-cen nuevas versiones de los navegadores muy a menudo. Y esas nuevas versiones pueden corregiralgunos de esos problemas (desdichadamente, hemos tenido tambin experiencia con el procesocontrario, en el qu enua nueva versin estropeaba algo que ya estaba funcionando). As que siquieres comprobar si tu navegador funciona correctamente puedes visitar esta pagina web:

    https://www.tuhh.de/MathJax/test/sample.html

    Espera unos segundos y asegrate de que en tu navegador aparecen las frmulas matemticas comoen esta gura:

    3. Instalacin de la hoja de clculo Calc.

    El siguiente paso es instalar, si no dispones ya de ella, la suite omtica OpenOce, que incluye lahoja de clculo Calc1, que vamos a utilizar, especialmente al principio del curso. Para ello dirgetea

    http://www.openoce.org/es/

    y usa el enlace Quiero descargar OpenOce:

    1Si tienes instalado o preeres instalar LibreOce, no encontrars apenas diferencia con OpenOce, en lo que

    se reere a este curso.

    4

    http://www.mozilla.org/es-ES/firefox/new/https://www.tuhh.de/MathJax/test/sample.htmlhttp://www.openoffice.org/es/http://es.libreoffice.org/

  • Usando ese enlace, se abrir la ventana que aparece en la siguiente gura, en la que debes hacerclic en el enlace indicado por la echa. Asegurate de que seleccionas tu sistema operativo y elidoma espaol! El nmero de versin habr cambiado, desde luego. En la Figura aparece la versin4.1.2, pero en el momento en que t la descargues, posiblemente habr avanzado:

    Con eso llegamos a la pgina de descarga (alojada en el dominio sourceforge.net a fecha de hoy) yen pocos segundos, segn la conguracin del navegador, se descargar el archivo automticamente,o debe abrirse un cuadro de dilogo para guardar el chero en alguna carpeta de tu ordenador(por ejemplo, Descargas en mquinas Windows). Lo ms importante en este paso es que sepas enqu carpeta se guarda ese chero, pero eso depende de tu conguracin particular.

    El chero que has descargado se llamar (en Windows) algo parecido a:

    Apache_OpenOffice_incubating_4.1.2_Winx_86_install_es.exe

    (aunque puede que no veas la extensin .exe en el Explorador de Windows). Ahora tienes queabrir ese chero, para instalar el programa (usa el botn derecho otra vez). Para este paso, esnecesario disponer de permisos de administracin en el ordenador (de nuevo, si te pierdes, buscaal ninja...). En las ltimas versiones de Windows, al hacer esto la pantalla se oscurece y apareceun cuadro de dilogo que pregunta Desea permitir que este programa realice cambios...?. Debespulsar en S para continuar la instalacin (insistimos, en las prximas guras el nmero de versinque aparecer ser otro, pero el proceso ser esencialmente el mismo).

    5

  • Empieza la instalacin:

    La siguiente ventana te preguntar dnde quieres guardar una carpeta con los cheros temporalesde instalacin. Es importante, de nuevo, que recuerdes donde los guardas. Cuando termine lainstalacin puedes borrar esa carpeta, slo es necesaria durante la instalacin.

    A continuacin el programa va pasando por pantallas similares a estas (son de una versin anterior),en las que puedes, sin riesgos, aceptar todas las opciones por defecto (en la segunda, si escribes tunombre de usuario, se incorporar a todos los documentos que crees con OpenOce; puedes omitiresa informacin sin problemas):

    6

  • Al llegar a esta ltima ventana pulsa en Finalizar, y la instalacin habr acabado. Ahora, paracomprobar que todo ha ido bien, deberas buscar en la lista de programas del men Inicio (de nuevohablamos de Windows, aunque en otras plataformas es similar) el grupo de programas OpenOce,y abrir el que se llama OpenOce.org Calc. Tras una ventana de presentacin y unos momentos, teencontrars con esta pantalla (puedes verlo ms o menos grande, segn tu resolucin de pantalla):

    que indica que todo ha ido bien. Ya estamos listos para pasar al segundo apartado de este tutorial.

    7

  • 4. Editores de texto.

    Nuestro objetivo, en esta seccin, es localizar un editor de texto, como el Bloc de Notas en Windows,y aprender a usarlo para abrir cheros csv (no te preocupes, enseguida aprenderemos qu son estoscheros). En segundo lugar, vamos a aprender a abrir cheros de tipo csv con Calc, eligiendo lasopciones correctas en el men de importacin.Empecemos por los editores de texto. En Windows, como ya hemos dicho, dispones del Bloc deNotas. Si no lo localizas fcilmente, pulsa simultneamente las teclas Windows y R, y en el cuadrode dilogo que se abrir escribe Notepad. Tras pulsar en Aceptar se abrir el Bloc de Notas que,inicialmente tiene este aspecto:

    En un Mac te recomendamos usar el programa gratuito textwrangler, que se descarga desde elenlace:

    http://www.barebones.com/products/textwrangler/

    TextEdit viene instalado en los Macs, pero no es exactamente un editor de texto, en el sentidoque aqu le damos a esa expresin (ver ms abajo). Y si eres usuario de Linux, a buen seguro yaconocers algn editor de texto (kate, gedit, leafpad, elige tu favorito).Es importante que entiendas la diferencia entre los procesadores de texto y los editores de texto.Un procesador de texto es un programa diseado para la elaboracin de textos, con un enfoqueesencialmente visual. El texto se puede formatear, cambiando el tipo y tamao de letra, la tipografa(negrita, cursiva, subrayado), insertando imgenes, etc. El ejemplo ms conocido es el programaWord de Microsoft. Al instalar OpenOce en la seccin anterior hemos instalado otro procesadorde texto, llamado Writer. En la siguiente gura puedes ver el aspecto inicial de Writer, al abrir elprograma, y compararlo con el del Bloc de Notas, que hemos visto antes.

    8

    http://www.barebones.com/products/textwrangler/

  • El contraste entre el procesador de texto, lleno de herramientas de formato, y el aspecto casi vacodel editor de texto, debera ser evidente. Naturalmente, hay editores de texto ms sosticados que elBloc de Notas (por ejemplo, en Windows, Notepad++), pero lo ms importante es que comprendasque los procesadores de texto no son adecuados para el trabajo con los cheros que vamos a usaren este curso, que son cheros de texto plano. Los cheros de texto plano ms conocidos son losde extensin txt, pero hay muchos otros tipos. Por ejemplo, los cheros de datos de tipo csv quevamos a ver a continuacin. Pero tambin son cheros de texto plano los cheros de cdigo fuente(en ingls, source code) de la mayora de lenguajes de programacin. Nosotros, en este curso, vamosa usar cheros de cdigo para el programa R, que sern cheros de texto plano, con la extensin.R.

    5. Ficheros csv con Calc.

    Un chero csv es un chero de texto plano que contiene una tabla de datos. El nombre proviene delingls, comma separated values (valores separados por comas, aunque ya veremos que no hay quetomarse el nombre al pie de la letra). Para empezar, vamos a trabajar con el chero (que tambinusaremos en el Tutorial-01)

    .

    Te aconsejamos que guardes el chero, en lugar de abrirlo directamente (y no olvides dnde lo hasguardado; el Escritorio puede servir, para empezar). Recuerda lo que hemos visto en la Seccin7: el chero de datos va adjunto a este documento pdf y, para guardar los datos en tu ordenador,debes hacer clic (aqu mismo, en el documento pdf) sobre el nombre del chero. Clic derecho oizquierdo? Depende del lector de pdfs que ests usando. Recuerda que en muchos casos es mejorusar primero el botn derecho del ratn! Si no sabes bien lo que haces, este es otro paso en el quees posible que te pierdas. Si eso sucede, ser un buen momento para acudir a nuestro amigo. Y, encualquier caso, recuerda que tambin puedes descargar todos los cheros adjuntos del curso (teorao tutoriales) desde la pgina web del curso, a la que se llega mediante este enlace:

    http://www.postdata-statistics.com/.

    Los cheros csv se usan para guardar datos de una forma sencilla, en cheros de texto, facilitandoas el intercambio de datos entre programas. El chero Tut01-PracticaConCalc.csv es un ejemplotpico: contiene una tabla de datos con tres columnas, y 1300 las. Es una buena idea que empieces

    9

    var1 var2 var3A 54,717 4E 52,676 8A 7,278 4E 1,253 4C 24,436 5B 82,398 5F 94,411 3E 17,865 6D 27,52 6F 14,274 2A 61,88 4A 22,722 4C 95,965 3B 39,324 3D 7,697 3C 90,413 2C 27,803 6E 3,667 4B 82,971 5D 12,873 2C 24,736 5F 90,227 6E 57,626 5D 43,317 2D 48,753 6E 85,698 4C 67,137 5C 40,335 3C 5,114 4F 66,487 4C 64,502 4F 68,473 10C 93,551 6B 99,958 8B 6,545 4D 68,5 5B 12,324 7C 46,934 3B 39,819 5F 53,643 8D 96,927 6F 1,565 7C 69,73 5B 71,935 4F 49,702 7D 91,794 5B 49,464 6C 50,237 8D 41,296 7A 46,791 4E 4,851 3D 97,207 5E 62,763 5B 100,349 4D 27,802 1C 16,836 5C 8,743 7E 35,278 3B 25,879 3F 92,638 7F 43,749 6F 44,623 5D 59,452 5D 14,801 2B 26,214 8D 7,949 5B 12,229 5D 56,527 5C 18,989 6D 61,798 5F 8,907 3B 60,841 11C 40,645 6D 30,4 10C 98,595 4C 40,558 1D 72,253 3B 66,126 8E 21,192 9A 80,592 5B 35,933 4F 11,506 10D 57,848 4D 53,967 4A 79,924 7F 92,49 5D 98,402 4C 93,414 3F 29,211 2D 44,215 5B 52,775 2D 98,147 6E 88,266 5D 59,841 4D 71,893 3F 51,115 9D 38,691 6A 67,342 5E 69,227 4F 68,253 5F 79,154 2D 91,234 2F 34,506 8D 68,738 4C 7,917 3C 96,253 6C 19,45 8F 48,193 4C 95,277 4E 76,456 4C 94,542 8C 17,533 4A 40,77 2C 18,345 5A 71,732 10C 48,668 6D 46,761 12E 96,568 5C 15,239 9B 99,274 5B 25,902 8C 54,578 8B 40,935 5C 30,435 2B 63,727 5B 85,225 10D 89,316 6F 12,601 5C 64,213 6C 78,69 5D 6,86 5E 68,31 7C 58,265 4C 51,88 3D 39,496 4F 42,379 3C 65,308 3E 40,479 4C 20,392 3F 91,987 3C 75,58 3E 53,995 3F 46,912 7D 11,601 8D 53,498 5A 12,312 4F 84,374 5B 10,752 4E 21,281 5F 4,434 7C 69,858 5B 56,57 3F 9,735 4E 37,737 4D 95,199 7B 20,118 3B 25,384 2B 68,571 5D 18,761 7B 23,102 5D 19,311 4C 65,462 6F 16,211 2C 88,886 5C 97,148 2F 77,416 6C 52,652 10C 1,734 4C 93,299 2D 96,328 9D 80,561 4F 9,134 6F 24,226 6F 52,678 2D 66,32 7C 31,217 4B 85,788 8F 41,76 5D 72,808 5E 14,275 4C 97,445 4D 58,417 7E 6,678 4B 98,155 6A 52,52 6B 90,673 5A 26,192 4B 16,134 3C 99,61 5C 100,662 3F 55,904 3B 4,906 6D 53,294 2F 12,372 3F 67,867 4D 6,286 8D 90,909 8D 79,896 7D 27,355 7B 80,882 6D 53,908 5F 64,34 10C 24,842 4C 40,544 4B 7,733 4F 15,617 8D 99,492 6C 44,234 4E 74,481 6C 70,239 7E 43,994 5A 69,537 5C 94,595 6F 43,671 8A 69,737 4B 51,975 8D 78,18 4E 98,173 5C 1,828 7B 92,679 6C 4,124 4D 94,626 7C 41,388 7A 50,674 5F 23,935 7D 3,956 2B 62,153 6A 32,17 5D 6,342 3F 66,874 5D 84,337 6C 46,859 0A 13,616 3A 17,157 5C 19,994 5B 82,204 7F 85,893 4C 51,931 7C 18,299 1D 53,544 5B 96,498 6D 65,507 5F 21,126 8D 55,456 2E 69,244 4C 77,31 6E 95,97 9E 19,228 7B 27,972 10D 51,857 4C 38,114 5D 47,467 6B 10,792 2A 52,238 5D 42,413 5D 35,732 5E 79,647 13F 54,173 3B 2,611 6B 87,971 3B 75,281 6F 53,787 5A 11,799 0B 94,461 10D 100,965 4D 54,558 6B 63,115 6E 13,7 4B 28,575 1C 62,207 3B 27,12 5D 73,389 7F 66,668 6F 42,994 3D 90,628 5B 43,553 3D 16,542 4E 36,49 2B 53,358 2D 98,472 8C 86,154 8B 25,204 4D 98,791 6A 5,821 5E 33,737 5D 90,318 4F 36,746 3F 71,768 9D 71,264 4A 79,271 9C 81,547 6E 47,52 11C 66,2 3A 3,582 2B 84,822 2A 70,498 6A 65,171 8C 85,992 10A 25,488 3A 13,101 7F 8,441 3C 91,833 4A 93,905 5E 45,889 9C 64,423 3F 55,697 5B 97,742 3E 69,934 4E 39,652 8D 62,281 9D 12,478 2C 35,229 8D 81,602 3B 31,485 3F 78,873 7C 55,537 8A 97,403 6D 25,97 3D 74,126 5E 26,987 4A 8,542 2D 51,86 11A 87,246 7A 54,974 7F 95,434 6A 20,719 4B 96,279 3B 39,732 5D 29,57 10B 3,645 5C 79,355 4D 59,228 5A 2,67 3F 97,456 5E 50,701 6D 2,815 5B 23,93 9A 23,245 5B 77,917 4F 24,724 5B 16,675 5C 37,473 4C 78,413 3B 17,751 7D 60,569 4D 49,502 10D 58,672 5C 35,132 4C 45,758 2B 65,932 9E 95,704 4C 30,926 7C 94,318 3B 59,251 5C 61,969 4C 22,855 1C 79,528 6D 23,928 5F 95,7 6D 56,754 4F 100,75 8D 98,323 5F 72,57 5B 93,389 8A 92,666 8C 96,86 4B 72,912 2C 58,667 5E 37,954 3F 21,135 4C 17,512 8C 85,711 8E 29,101 5C 91,738 8F 12,465 2E 75,438 11D 49,92 5F 85,732 4C 54,708 4E 65,291 6D 22,113 9A 6,379 10F 24,436 7D 54,989 4A 5,886 7D 91,379 2C 59,709 3D 72,826 5C 51,551 10C 38,433 5A 73,137 5F 72,897 3E 27,737 5A 25,936 6F 92,748 4B 98,342 4F 48,367 6E 35,433 5A 92,269 7E 58,207 6C 8,372 6F 45,113 4B 92,759 3A 88,397 4F 99,805 5B 35,752 2F 52,984 4D 31,942 6B 32,354 9E 64,858 3C 6,43 5D 42,855 3B 85,989 6C 85,912 3B 97,375 3D 6,871 5B 49,826 4F 52,454 4A 71,33 4B 79,177 7B 52,877 5F 24,565 9C 5,155 10E 71,734 3A 100,875 4D 63,854 6E 95,665 1C 44,256 7C 92,324 8D 80,213 5C 24,926 3D 40,486 3B 14,205 5A 77,979 3D 42,492 3C 84,964 7C 5,676 6A 92,768 5D 97,412 5B 31,505 8D 36,516 4C 59,908 9B 62,393 6A 26,837 5F 10,883 5B 43,791 8C 58,215 4D 64,895 0C 44,975 3A 34,303 7C 19,346 3F 62,859 4B 84,784 11B 33,419 2C 71,633 7C 61,95 3F 42,382 6F 19,13 5E 25,935 3E 28,546 4D 6,8 3C 90,431 3C 15,521 2B 90,96 8E 28,574 3D 93,736 4F 22,938 4F 7,93 4F 68,1 4B 93,795 8F 32,661 8B 95,429 7B 93,669 6B 57,885 2C 16,581 2F 83,948 7C 76,395 5D 6,628 3F 22,704 5D 88,655 8C 34,386 5E 84,72 4B 98,197 5B 87,784 4D 16,254 5D 87,545 4B 67,264 12F 85,998 3B 78,22 5D 15,98 3E 40,734 3A 48,727 3B 34,422 2D 61,665 4C 8,665 1A 23,698 9D 24,817 5B 7,467 5B 82,553 5A 90,473 8F 26,909 8D 74,851 5A 46,415 8D 8,857 3C 23,699 4C 75,583 3C 31,858 6C 54,639 6D 43,315 5C 13,31 4E 34,689 3A 50,834 3C 20,338 5A 19,172 3C 12,408 7C 27,826 5D 15,662 2A 31,827 3D 71,336 3B 75,422 2D 43,317 1E 49,442 2D 65,568 6B 52,549 7A 46,363 0D 28,898 6F 10,811 3D 46,3 4F 86,388 10B 14,745 2B 16,655 6B 82,459 7F 86,706 4D 24,169 3B 64,87 2D 87,962 8B 37,673 3D 5,111 5F 23,375 3B 49,112 5B 15,715 6F 6,343 2F 35,122 4C 41,577 4D 75,12 3C 31,106 5E 46,396 5D 59,486 5D 20,973 4F 30,278 4B 83,401 6D 51,171 3B 68,202 2B 94,989 8C 80,999 10B 5,584 5D 67,544 5B 99,717 2C 77,512 2B 93,161 7B 64,294 6F 40,719 4C 34,943 5D 59,51 4C 7,798 4B 33,453 6E 92,433 4F 98,539 6E 84,975 5B 38,919 3B 59,698 7B 54,338 7C 44,154 6B 18,833 7D 100,659 4C 29,623 4B 43,895 7A 64,953 3C 92,707 0B 81,357 4A 69,194 6D 60,417 5A 36,77 7E 89,39 6C 96,448 6C 47,461 5B 80,418 7E 18,354 4C 81,452 4E 14,441 5C 86,912 6E 100,137 6B 75,51 5D 97,492 6B 39,831 2C 61,174 4D 28,842 3B 68,678 9F 10,58 5D 95,374 3C 43,806 7C 70,83 5D 76,662 6D 72,865 7F 84,503 6C 98,706 6F 15,793 6C 95,61 4F 32,38 5D 34,942 7F 83,349 7D 84,985 3E 6,238 4B 23,123 7C 5,403 7B 90,846 6F 80,8 3B 33,724 4F 71,755 7A 39,116 1F 59,956 5C 55,351 6D 10,883 3C 64,933 7A 4,459 3B 59,833 5C 31,384 3C 87,221 7D 18,191 8C 2,368 3B 19,72 7A 86,661 2A 78,214 5B 21,686 4F 64,637 3C 92,767 2E 79,791 5C 25,979 4D 93,736 4E 24,461 5B 87,833 3C 26,65 4F 47,743 9F 83,417 5C 62,493 4D 4,914 9C 42,779 7D 68,264 3D 79,767 2B 58,984 3B 98,869 4F 56,914 3A 96,67 4C 86,266 5D 34,807 5E 8,278 8D 86,69 4E 94,179 5F 83,607 4D 38,26 5A 80,738 9A 9,491 7C 19,363 3B 54,479 3A 42,97 2E 15,637 6F 29,862 2B 8,244 8D 5,34 5D 16,624 2F 85,598 7B 11,837 4D 30,2 5F 38,447 6C 56,145 2D 69,399 4C 44,277 5C 66,532 5A 93,597 3C 95,328 5C 68,905 6D 23,19 7E 71,615 5B 64,753 8B 62,305 2F 25,295 1C 97,488 7D 54,381 5C 28,172 5A 67,3 8C 49,344 4C 50,154 7C 68,561 6B 99,889 9A 94,829 10D 71,694 7F 28,204 4C 83,741 1B 50,804 6C 70,781 2C 23,851 6B 81,366 7B 2,567 3F 77,866 5B 67,454 7D 45,501 5C 59,891 2F 54,475 5F 40,491 5D 69,826 3D 45,746 3C 38,391 7B 69,65 4B 65,382 3F 31,151 3F 29,106 1A 44,286 8C 31,588 9D 49,713 2B 77,737 4B 3,893 8A 28,881 5C 90,689 6E 6,997 8A 99,866 7C 91,928 10C 17,374 8D 31,26 3F 57,878 4D 41,16 4C 44,986 5F 51,445 4B 55,188 4F 17,399 5A 29,363 6B 62,639 5F 14,454 4D 20,421 4B 100,899 5D 86,435 3B 33,331 6C 15,708 5C 23,801 7C 24,287 2B 14,955 3B 4,201 9A 12,814 2C 46,343 3C 29,703 7E 84,365 6B 65,425 4B 16,776 7B 71,85 1C 43,259 5B 2,134 4B 63,766 2D 68,761 4D 76,945 8D 21,173 5D 8,682 4A 30,743 1D 76,82 2D 52,774 4D 53,323 5C 34,512 6B 26,735 3D 22,898 4B 87,907 8D 39,64 4B 24,465 2C 41,129 5D 59,154 4C 9,9 2D 76,139 4E 61,696 3C 61,801 6A 47,332 5F 90,21 8A 85,219 3E 69,243 9C 25,855 10D 42,305 4E 5,676 3D 34,888 3C 36,919 7B 34,709 7F 27,59 6F 24,724 7E 60,154 3B 60,224 3D 37,525 3D 73,863 5B 50,762 9C 3,227 6C 71,503 6E 56,811 7B 39,784 6B 9,244 5C 52,192 2D 40,725 2D 36,65 9C 68,769 6E 76,303 2D 60,655 9E 35,929 2B 20,151 7C 34,661 5E 6,665 3B 23,621 8D 31,612 7E 2,845 5A 40,459 4B 75,397 6A 43,939 1D 91,723 3D 49,638 5C 36,166 3B 33,46 4F 100,741 7D 8,301 5C 41,469 4A 92,331 2C 96,262 6B 23,972 6F 13,772 6D 10,397 7E 24,947 3B 27,592 2E 72,399 5B 47,243 4A 57,274 5A 15,237 4D 91,795 7F 41,943 4E 60,177 3E 17,409 3D 55,162 4C 93,865 2C 25,709 4A 70,97 5C 57,815 4E 94,173 4B 11,646 6C 62,679 4D 75,42 5D 2,767 8F 3,466 3D 61,44 5F 100,152 5B 5,467 8C 26,836 3C 38,877 5F 42,215 4F 14,455 5D 28,433 5B 66,412 8D 84,399 11E 31,141 2F 36,935 4A 53,312 4C 68,937 6C 78,67 3F 91,77 5B 1,899 3F 13,574 6D 85,285 2C 94,29 1B 14,762 6B 64,355 4F 98,897 6D 22,176 2C 80,661 6B 69,345 6C 58,346 6C 13,896 6B 43,168 0D 23,257 6C 67,28 4C 48,486 4C 57,969 1C 65,605 8D 66,18 1A 30,333 10D 60,194 5A 58,1 9B 43,692 6D 72,426 2C 2,759 6C 52,838 8C 95,579 5F 95,325 8C 3,491 4C 14,718 2D 59,855 4B 27,744 3F 75,951 6D 20,297 7C 78,276 3D 82,926 3F 89,759 3D 74,668 3E 20,398 7F 43,312 6D 89,376 5B 16,449 3D 58,432 9E 21,349 3C 62,936 2B 65,345 5F 32,426 6F 86,148 6E 97,466 4D 73,546 2E 87,185 2B 93,175 5B 27,776 7C 82,695 6C 62,494 6A 40,143 6C 19,29 8A 50,425 7D 58,664 7D 54,387 5F 83,251 5E 91,459 1D 49,139 6D 69,63 3A 24,636 6D 31,845 5D 11,62 3C 98,274 4C 82,441 0B 39,949 3C 89,398 5B 47,304 6B 36,558 7A 83,431 8A 63,255 6B 33,6 4D 76,366 5D 27,265 2E 97,144 7F 85,891 2B 2,435 7C 74,314 2C 100,921 3A 63,938 4C 71,543 5D 66,513 8C 40,19 4F 98,492 6B 57,15 3A 19,12 5B 84,218 5F 22,194 9D 62,144 4A 94,415 4C 18,908 6E 37,764 4B 43,747 4B 80,253 4C 45,446 5F 91,915 4D 1,249 3F 14,519 5C 19,822 5F 65,987 8C 90,772 3F 98,399 6D 100,795 6F 99,287 4D 19,416 5C 56,174 4C 81,217 4E 20,901 8D 68,895 6B 96,118 3C 78,132 7B 16,523 2D 95,816 4B 7,916 7B 11,978 6F 76,386 5C 24,838 3F 79,61 4D 56,384 3E 36,13 5F 53,772 4E 78,872 4E 34,889 6B 87,248 4D 12,316 3C 66,182 7C 96,464 3C 41,765 5D 91,612 5B 9,816 6B 24,611 5C 20,134 8F 41,54 4B 29,64 6F 51,677 2D 45,148 7E 97,889 6D 10,837 8C 86,591 4A 23,67 6F 36,102 6D 22,112 7D 27,927 6C 58,306 6C 73,485 5F 12,143 6E 37,265 10F 18,704 8E 19,938 3F 39,778 7F 19,417 5B 23,128 6C 99,251 7D 86,375 4A 88,562 6F 57,936 3B 20,451 4D 74,806 3B 7,724 2B 64,723 2C 87,351 4C 12,963 7C 87,794 2E 45,631 2D 55,694 3F 44,37 2E 91,483 8F 66,911 4B 68,23 4C 15,716 5B 88,743 5C 73,228 9C 19,486 5D 7,594 4B 56,801 2F 47,998 4C 2,133 5A 94,961 4D 80,595 9C 4,785 7A 48,13 3B 70,229 4B 10,313 4B 30,484 5C 43,441 3E 53,186 3E 91,971 7B 3,565 8D 20,178 5B 83,299 9B 7,989 3C 3,843 8E 96,251 6C 86,428 6E 49,943 4D 24,238 3D 4,652 6D 83,28 5E 1,714 14C 28,612 7C 28,293 3B 40,446 7D 10,376 5A 59,441 6B 15,794 4C 98,893 4F 62,428 6B 31,363 3E 72,69 5C 80,114 4E 94,996 5B 41,231 6B 43,805 6D 72,814 5D 46,398 3D 38,16 5D 49,388 1A 40,254 5B 68,481 7D 64,129 5E 40,45 6B 64,157 3E 77,368 7F 54,453 5B 13,651 4D 85,641 3F 96,504 4C 60,532 4B 30,969 4B 83,225 4B 30,39 4F 20,205 6D 8,91 2C 22,856 4F 4,463 6B 21,67 6E 53,471 7C 31,744 9D 88,858 4C 36,23 8F 42,176 3C 77,757 3D 6,747 2B 9,681 5C 64,36 1D 68,677 4C 43,655 3D 60,902 7B 35,174 3D 75,888 3C 17,127 4F 88,933 9C 93,248 8F 95,441 4D 19,404 4B 50,934 7D 98,185 7F 19,927 5D 52,945 6B 15,734 4B 65,425 9B 92,556 7E 75,863 8B 36,848 4F 77,22 3E 69,421 4F 63,786 4C 23,323 5B 37,665 7E 78,505 4F 23,751 5B 80,305 8C 44,959 3D 33,998 2C 75,77 4F 37,718 10C 70,585 3C 91,769 5F 26,663 4B 54,306 2D 56,708 8C 68,506 7E 1,711 6B 66,41 5C 50,897 8B 82,283 14D 47,431 9E 75,108 5B 58,22 5D 54,781 1E 49,74 4C 92,966 5B 25,666 4C 61,271 5D 23,858 5B 5,688 5B 98,47 3D 38,153 6D 15,77 5B 11,615 5F 1,475 2D 30,869 6C 3,959 9D 75,652 3A 40,42 3B 74,596 6D 17,505 4D 94,795 2D 16,297 2C 27,803 7F 18,758 6A 16,884 1B 91,232 7B 19,77 5C 95,833 5D 49,903 4C 31,566 13F 99,473 10D 31,51 2F 17,89 4A 30,143 4E 61,822 3D 33,607 8D 53,937 5C 50,579 4B 41,288 3C 16,367 6C 16,506 6F 6,195 6B 10,481 10B 3,627 4C 27,207 7D 16,568 6B 65,801 8A 37,607 9A 33,928 7C 60,858 5C 59,111 4B 40,751 4A 28,354 7B 6,28 7E 37,187 8C 66,327 3E 23,683 4B 7,985 5C 69,567 7D 84,42 5E 48,659 6B 42,894 10F 77,768 6E 14,307 6A 57,561 8D 64,834 3B 40,323 6C 39,269 3C 88,67 4C 99,198 5D 40,384 5F 77,672 4B 80,5 6B 49,226 3F 6,683 6A 21,167 6A 50,646 7E 77,703 4E 75,696 5E 22,809 16C 38,83 6D 41,103 6D 67,549 2E 92,368 6F 57,214 6C 3,827 3B 15,601 4C 82,357 3D 81,817 7E 46,298 4C 72,383 5D 71,231 4C 66,491 3F 45,424 8A 56,312 4B 69,365 10C 40,727 6E 85,951 6E 87,916 6A 99,641 7D 31,495 4E 81,311 6E 32,445 7B 25,988 2D 88,551 8D 36,381 6C 53,814 1A 78,466 2B 92,223 4F 52,31 5F 58,604 0C 37,76 4F 48,866 5C 94,767 5B 56,266 7E 63,77 0C 22,735 6A 99,678 5D 15,688 1C 12,54 6E 45,981 7C 68,883 3B 87,636 7F 18,858 5D 92,658 9A 88,251 8C 37,692 5E 64,647 9F 42,479 3C 26,824 7B 59,969 9B 88,236 3E 84,594 6B 29,573 7D 94,423 6B 55,709 8C 42,48 4C 86,429 10C 24,151 6A 75,564 4E 55,378 3B 21,69 9F 4,268 6F 84,404 7A 70,8 3F 62,526 7

    http://notepad-plus-plus.org/http://www.postdata-statistics.com/

  • por abrirlo con un editor de texto (el Bloc de Notas en Windows, o similar) para hacerte una ideadel aspecto que tienen los datos, pero no hagas ningn cambio en el chero. En la siguiente gurapuedes ver el aspecto de ese chero cuando se abre con el Bloc de Notas de Windows.

    En este chero en particular, hay guardada una tabla de tres columnas. Cada la de la tabla secorresponde con una lnea del chero, y los elementos de las distintas columnas estn separados porespacios. La primera lnea es especial, porque contiene los nombres de las variables que correspondena cada columna, y que son var1, var2 y var3. Usando el editor de texto podemos ver los datosque contiene el chero, e incluso hacer algunas modicaciones muy interesantes. Por ejemplo,podemos reemplazar todas las comas por puntos o viceversa. Pero el procesador de texto no sirvepara analizar los datos desde el punto de vista estadstico. Para eso necesitamos herramientas msespecializadas, como la hoja de clculo, que vamos a ver a continuacin; o programas especcosde Estadstica, como R, que veremos en prximos tutoriales.Es una excelente idea echarle un vistazo al chero csv con un editor de texto antes de lanzarnosa hacer otras operaciones. Considralo el primer paso de la descripcin estadstica de los datos,llamada tambin Anlisis Exploratorio de Datos.

    5.1. Abriendo el chero con Calc.

    Si no lo has hecho, cierra el editor de texto en el que hemos abierto el chero csv. Para seguir avan-zado, vamos a abrirlo con la hoja de clculo Calc. Una vez iniciado Calc, usa el men Archivo Abrir y navega hasta la carpeta en la que has guardado el chero Tut01-PracticaConCalc.csv.Cuando lo selecciones para abrir se debera abrir un cuadro de dilogo como el de la siguientegura, que vamos a analizar:

    10

  • Hemos indicado con una echa roja la primera zona en la que debes jarte. Calc te muestra unavista previa de su interpretacin del chero de datos. En el caso que se muestra en la gura,esa interpretacin no coincide con lo que nosotros queremos obtener. Ten en cuenta que en tuordenador las cosas pueden ser distintas, porque la interpretacin de Calc depende de las opcionesque se hayan seleccionado en la zona del cuadro de dilogo que hemos destacado en esta gura:

    Aunque los cheros csv deban su nombre a las comas, en realidad, se pueden usar (y se usan)distintos smbolos como separadores entre las distintas columnas de la tabla de datos que contieneel chero. En los pases que, como Espaa, usan la coma como separador del punto decimal, eshabitual usar un espacio, o un punto y coma, o un tabulador para separar entre s las columnas. Esaparte del cuadro de dilogo nos deja seleccionar cul (o cules, a veces son varios) de los smbolosposibles se deben interpretar como smbolos de separacin entre columnas. En este ejemplo, lascolumnas estn separadas por un espacio. As que marcamos la casilla de la opcin Espacio, nosaseguramos de que no haya seleccionada ninguna otra opcin, y, como en esta gura, vemos en lavista previa que ahora Calc est interpretando los datos como queremos que lo haga.

    11

  • Ahora podemos pulsar en Aceptar, y veremos como Calc nos muestra los datos, colocando correc-tamente las columnas de nuestra tabla de datos.

    En el prximo tutorial empezaremos a trabajar con estos datos. Pero, antes de abandonar estaseccin, queremos inaugurar una costumbre que nos va a acompaar en todos los tutoriales delcurso. De vez en cuando te propondremos un ejercicio, para que puedas practicar lo que acabamosde aprender.

    Ejercicio 1:

    1. Trata de repetir los pasos anteriores, para abrir en Calc el chero adjunto:

    Es recomendable empezar explorando el chero con un editor de texto.

    2. De qu tipo crees que son las variables de cada una de las columnas?

    12

    "valor" "medidas" "tipo"43 8,7684 "C5"25 -9,876 "C6"94 0,46818 "C1"46 0,40087 "C7"83 -4,3824 "C2"12 1,9344 "C3"137 -4,5419 "C5"90 -4,7231 "C8"14 -9,8396 "C7"23 6,2293 "C1"94 1,8064 "C8"7 6,3892 "C6"91 8,8721 "C6"88 -5,0858 "C4"98 2,3532 "C2"61 -9,2833 "C4"102 -5,8757 "C1"8 2,5154 "C4"148 3,4106 "C5"31 -2,0604 "C2"130 -9,8528 "C5"101 6,6866 "C8"77 7,0499 "C3"124 4,1762 "C4"98 2,7039 "C4"147 3,6384 "C8"66 -8,5434 "C3"74 -7,8681 "C2"35 7,5973 "C3"150 -8,6635 "C5"123 -1,6492 "C8"55 -4,2299 "C8"65 -2,5578 "C3"5 5,3904 "C7"146 0,50329 "C3"100 4,9894 "C5"83 1,6074 "C3"111 -7,3415 "C2"112 6,9515 "C8"107 -0,15516 "C2"81 2,6682 "C7"32 -0,80705 "C8"129 -6,7367 "C5"32 4,0412 "C5"139 5,6649 "C7"97 -8,0876 "C3"57 9,1169 "C5"125 -6,8715 "C6"80 -7,9905 "C3"125 9,4101 "C4"150 1,1067 "C2"106 -7,4164 "C3"148 2,529 "C1"28 -4,9938 "C7"95 8,5633 "C8"15 -2,6652 "C6"15 -5,5983 "C1"92 -3,5282 "C6"137 -3,7884 "C7"28 -0,17165 "C7"118 2,8953 "C4"63 2,2812 "C3"89 -2,7351 "C8"142 1,7389 "C2"104 9,9101 "C8"111 5,1235 "C6"11 -8,3733 "C2"36 -6,3127 "C8"66 -5,063 "C7"86 5,6078 "C5"85 -9,3599 "C5"111 -1,8988 "C3"121 7,7607 "C6"50 0,45521 "C3"104 9,3322 "C4"101 -9,849 "C4"58 -1,0897 "C5"17 1,9959 "C6"20 2,5359 "C5"31 7,0769 "C4"21 4,6579 "C5"57 8,4215 "C6"126 1,6545 "C3"143 -9,2509 "C4"70 -0,22627 "C7"34 -3,569 "C2"57 0,48709 "C3"60 -4,8803 "C6"34 -0,17009 "C6"70 -2,8357 "C5"88 6,7769 "C4"126 -4,8493 "C5"5 -4,6857 "C7"29 -4,0915 "C2"77 8,023 "C8"89 -6,6827 "C1"70 3,8294 "C3"45 -7,0428 "C4"29 -0,073387 "C3"14 8,8831 "C4"102 -0,44416 "C4"13 -2,3415 "C2"95 5,3176 "C5"122 4,3347 "C8"29 6,8515 "C8"59 9,7885 "C6"133 0,91945 "C4"82 -0,1924 "C7"63 2,0799 "C6"150 -6,4858 "C8"120 6,736 "C7"115 2,8647 "C7"118 -9,8434 "C4"136 -6,0912 "C2"78 4,5357 "C8"56 6,8513 "C6"81 -0,78588 "C3"67 1,3456 "C6"82 3,4445 "C7"76 8,1364 "C5"91 -6,9944 "C5"147 8,0706 "C7"28 -9,56 "C1"53 -4,5994 "C4"12 -5,9558 "C1"137 0,48776 "C1"84 6,7592 "C4"129 -0,2651 "C1"88 2,7307 "C8"93 -0,38471 "C4"150 3,6381 "C1"44 -0,67908 "C1"24 0,81121 "C6"16 3,7155 "C6"27 0,80849 "C2"74 9,5228 "C5"141 -0,39651 "C1"129 2,3166 "C2"15 -1,7663 "C8"117 -1,5684 "C4"7 -0,92384 "C2"82 -8,5922 "C4"84 5,7712 "C4"126 4,753 "C6"80 -5,0345 "C5"119 -2,4965 "C8"4 -8,3976 "C3"104 0,16675 "C4"84 -1,5295 "C7"11 5,514 "C6"150 -3,5831 "C1"81 4,9487 "C7"84 -8,5596 "C1"84 0,98432 "C7"141 8,0103 "C1"82 7,4399 "C1"112 -7,5804 "C6"149 -3,4335 "C2"93 7,0122 "C1"132 -1,6437 "C1"1 -9,5453 "C8"66 6,1965 "C6"128 -9,1508 "C7"2 -3,2386 "C7"34 -5,0367 "C2"107 7,7823 "C7"1 -1,0525 "C3"53 0,51496 "C6"36 3,0536 "C2"55 -2,8625 "C1"119 2,3975 "C7"110 -7,9474 "C5"105 0,81193 "C8"30 2,3761 "C2"122 2,5721 "C7"79 5,5399 "C2"61 3,6633 "C6"51 -8,9413 "C8"0 9,236 "C8"10 7,5186 "C3"35 -4,7332 "C1"2 8,2606 "C1"114 -6,61 "C2"150 1,5277 "C2"125 -5,0309 "C3"76 -1,6609 "C1"129 9,5623 "C1"112 -7,6419 "C5"118 9,5534 "C5"59 -1,897 "C6"22 8,4734 "C7"28 -0,6791 "C2"106 0,67672 "C2"50 3,8969 "C3"148 -2,1389 "C5"89 -4,0019 "C3"134 -5,6339 "C1"82 -9,9441 "C3"49 -2,6392 "C8"147 9,0747 "C4"

  • 3. El juego de las diferencias: Trata de repetir los pasos anteriores para abrir en Calc el cheroadjunto:

    que contiene exactamente los mismos datos, pero con algunas modicaciones en la forma enla que se han codicado en el chero. Qu diferencias son esas?

    5.2. Esquila de datos. Modicando cheros csv con un editor de texto.

    El chero Tut00-Ejercicio01b.csv del Ejercicio 1 contiene una columna (la segunda, de nombremedidas), en la que se ha usado el punto, en lugar de la coma, como separador decimal. Esopuede suponer un problema para nosotros, porque algunos programas de ordenador usan la comacomo separador decimal (por ejemplo, Calc en la versin en espaol), mientras que otros usan elpunto (por ejemplo, R). Es frecuente, por tanto, encontrarse en la situacin de tener que modicarun chero de datos para cambiar puntos por comas, o viceversa. Esta es una operacin tpica (ysencilla) de lo que vamos a denominar Esquila de Datos. Es nuestra traduccin del ingls DataWrangling. Otra gente dira que estn domando o domesticando datos, pero nosotros somos msde oveja, qu se le va a hacer.Lo que tenemos que hacer, entonces, es cambiar los puntos por comas. Esta tarea, que en generalconsiste en reemplazar una cadena de texto por otra, la podemos acometer con un editor de textosencillo como el Bloc de Notas de Windows. Vamos a dar los detalles para el Bloc de Notas, perono deberas tener problemas en reproducirlos usando sus anlogos en otros sistemas.Al abrir el chero Tut00-Ejercicio01b.csv con el Bloc de Notas veremos esto (slo una partedel chero resulta visible, dependiendo del tamao de la ventana del editor en tu pantalla):

    En el men Edicin, seleccionamos Reemplazar... (o pulsa Ctrl+ R):

    13

    "valor";"medidas";"tipo"43;8.7684;"C5"25;-9.876;"C6"94;0.46818;"C1"46;0.40087;"C7"83;-4.3824;"C2"12;1.9344;"C3"137;-4.5419;"C5"90;-4.7231;"C8"14;-9.8396;"C7"23;6.2293;"C1"94;1.8064;"C8"7;6.3892;"C6"91;8.8721;"C6"88;-5.0858;"C4"98;2.3532;"C2"61;-9.2833;"C4"102;-5.8757;"C1"8;2.5154;"C4"148;3.4106;"C5"31;-2.0604;"C2"130;-9.8528;"C5"101;6.6866;"C8"77;7.0499;"C3"124;4.1762;"C4"98;2.7039;"C4"147;3.6384;"C8"66;-8.5434;"C3"74;-7.8681;"C2"35;7.5973;"C3"150;-8.6635;"C5"123;-1.6492;"C8"55;-4.2299;"C8"65;-2.5578;"C3"5;5.3904;"C7"146;0.50329;"C3"100;4.9894;"C5"83;1.6074;"C3"111;-7.3415;"C2"112;6.9515;"C8"107;-0.15516;"C2"81;2.6682;"C7"32;-0.80705;"C8"129;-6.7367;"C5"32;4.0412;"C5"139;5.6649;"C7"97;-8.0876;"C3"57;9.1169;"C5"125;-6.8715;"C6"80;-7.9905;"C3"125;9.4101;"C4"150;1.1067;"C2"106;-7.4164;"C3"148;2.529;"C1"28;-4.9938;"C7"95;8.5633;"C8"15;-2.6652;"C6"15;-5.5983;"C1"92;-3.5282;"C6"137;-3.7884;"C7"28;-0.17165;"C7"118;2.8953;"C4"63;2.2812;"C3"89;-2.7351;"C8"142;1.7389;"C2"104;9.9101;"C8"111;5.1235;"C6"11;-8.3733;"C2"36;-6.3127;"C8"66;-5.063;"C7"86;5.6078;"C5"85;-9.3599;"C5"111;-1.8988;"C3"121;7.7607;"C6"50;0.45521;"C3"104;9.3322;"C4"101;-9.849;"C4"58;-1.0897;"C5"17;1.9959;"C6"20;2.5359;"C5"31;7.0769;"C4"21;4.6579;"C5"57;8.4215;"C6"126;1.6545;"C3"143;-9.2509;"C4"70;-0.22627;"C7"34;-3.569;"C2"57;0.48709;"C3"60;-4.8803;"C6"34;-0.17009;"C6"70;-2.8357;"C5"88;6.7769;"C4"126;-4.8493;"C5"5;-4.6857;"C7"29;-4.0915;"C2"77;8.023;"C8"89;-6.6827;"C1"70;3.8294;"C3"45;-7.0428;"C4"29;-0.073387;"C3"14;8.8831;"C4"102;-0.44416;"C4"13;-2.3415;"C2"95;5.3176;"C5"122;4.3347;"C8"29;6.8515;"C8"59;9.7885;"C6"133;0.91945;"C4"82;-0.1924;"C7"63;2.0799;"C6"150;-6.4858;"C8"120;6.736;"C7"115;2.8647;"C7"118;-9.8434;"C4"136;-6.0912;"C2"78;4.5357;"C8"56;6.8513;"C6"81;-0.78588;"C3"67;1.3456;"C6"82;3.4445;"C7"76;8.1364;"C5"91;-6.9944;"C5"147;8.0706;"C7"28;-9.56;"C1"53;-4.5994;"C4"12;-5.9558;"C1"137;0.48776;"C1"84;6.7592;"C4"129;-0.2651;"C1"88;2.7307;"C8"93;-0.38471;"C4"150;3.6381;"C1"44;-0.67908;"C1"24;0.81121;"C6"16;3.7155;"C6"27;0.80849;"C2"74;9.5228;"C5"141;-0.39651;"C1"129;2.3166;"C2"15;-1.7663;"C8"117;-1.5684;"C4"7;-0.92384;"C2"82;-8.5922;"C4"84;5.7712;"C4"126;4.753;"C6"80;-5.0345;"C5"119;-2.4965;"C8"4;-8.3976;"C3"104;0.16675;"C4"84;-1.5295;"C7"11;5.514;"C6"150;-3.5831;"C1"81;4.9487;"C7"84;-8.5596;"C1"84;0.98432;"C7"141;8.0103;"C1"82;7.4399;"C1"112;-7.5804;"C6"149;-3.4335;"C2"93;7.0122;"C1"132;-1.6437;"C1"1;-9.5453;"C8"66;6.1965;"C6"128;-9.1508;"C7"2;-3.2386;"C7"34;-5.0367;"C2"107;7.7823;"C7"1;-1.0525;"C3"53;0.51496;"C6"36;3.0536;"C2"55;-2.8625;"C1"119;2.3975;"C7"110;-7.9474;"C5"105;0.81193;"C8"30;2.3761;"C2"122;2.5721;"C7"79;5.5399;"C2"61;3.6633;"C6"51;-8.9413;"C8"0;9.236;"C8"10;7.5186;"C3"35;-4.7332;"C1"2;8.2606;"C1"114;-6.61;"C2"150;1.5277;"C2"125;-5.0309;"C3"76;-1.6609;"C1"129;9.5623;"C1"112;-7.6419;"C5"118;9.5534;"C5"59;-1.897;"C6"22;8.4734;"C7"28;-0.6791;"C2"106;0.67672;"C2"50;3.8969;"C3"148;-2.1389;"C5"89;-4.0019;"C3"134;-5.6339;"C1"82;-9.9441;"C3"49;-2.6392;"C8"147;9.0747;"C4"

  • En el cuadro de dilogo que aparece escribe un punto en Buscar y una coma en Reemplazar por,como indica la gura:

    Luego pulsa Reemplazar todo. Aunque el cuadro de dilogo no se cierra, los cambios ya se hanhecho. Puedes cerrar ese cuadro de dilogo para verlo:

    Ejercicio 1:

    Usando ese mismo chero,

    1. Reemplaza el separador de columnas (punto y coma) por el smbolo #.

    2. Guarda el chero modicado con el nombre Tut00-Ejercicio01c.csv, y brelo en Calc.Cuidado con las opciones de importacin de cheros csv en Calc, tendrs que usar la opcinOtros para indicar el separador que estamos usando.

    3. Para practicar un poco ms el tema de los separadores y la importacin de cheros csv, aqutienes el chero adjunto:

    que puedes ver en la gura:

    Las columnas son ms fciles de reconocer a simple vista porque se han usado tabuladorescomo separadores entre columnas. Prueba a importar este chero en Calc. Cuando lo hayashecho, prueba a reemplazar los tabuladores por espacios (brelo en el Bloc de Notas y se-lecciona un tabulador con el ratn, para poder copiarlo y pegarlo en el cuadro de dilogoReemplazar). Despus, importa ese chero modicado con Calc. Y, nalmente, cambia losseparadores por comas, y repite el proceso de importacin en Calc. Hay algn problema?

    14

    valormedidastipo210,2583C7134-8,967C81166,141C785,197C3104-1,432C3147-6,055C3128-1,018C288-4,107C81497,074C3840,5444C8142-2,369C5115-9,708C31451,439C7122-6,816C574-8,427C5810,9687C61204,014C4860,569C341-5,754C674-3,754C345-8,747C3915,008C61398,611C6148-9,124C4145-0,7483C4133-2,066C28-1,104C1200,7847C464-5,235C322-2,75C873,635C8875,958C4975,468C756-0,2476C195-3,571C81150,9265C123-7,094C2564,846C5964,612C7145-7,574C31295,296C7129,475C51375,142C7141-4,49C226-7,27C4100-7,285C2597,182C3779,715C24-8,128C650-6,547C268-2,523C306,489C11480,5111C5144-0,8199C61418,874C1708,324C8132-2,867C7410,7661C4103-1,376C4131-5,091C21427,732C1101-9,612C8384,678C7615,415C646-5,704C475-6,665C1126-7,6C2966,083C6658,53C4143-0,671C5759,103C3103-4,232C391-1,467C51054,106C16-4,006C631-7,849C720-8,726C71340,6387C6124-2,794C218-1,708C2133-7,467C31030,1665C8491,37C61394,269C7542,194C41085,233C1894,581C1122-6,575C5737,4C2384,33C11022,985C6113-6,809C470-4,811C149,207C3104-5,79C1552,353C149-5,182C61442,82C5439,345C3874,502C1723,763C890-6,999C81096,276C132-1,773C31370,0143C151,529C7127,571C4119-2,991C4115-3,316C8121-6,095C651-6,148C726-5,746C243-4,033C685-2,288C11000,2527C51030,5914C4975,896C615,416C338-3,521C276-0,9042C51423,242C570-6,164C733-3,884C6271,404C192-9,422C81451,471C4356,673C3750,7008C2113-1,623C118-0,5215C743-8,028C59-4,216C71080,8911C5953,293C432-7,576C5748,387C1100,6823C21230,3258C324-9,844C853-8,606C4643,712C5112-3,21C468-4,18C7531,76C7243,125C5104-8,341C442-6,068C490-1,004C5460,9223C8268,541C81270,5029C526,067C11197,741C435-4,26C3696,333C71009,611C36-6,048C886-0,3213C847-1,557C81284,137C21312,079C524-7,673C8149-2,769C6771,421C81134,479C531-2,961C41203,51C61236,157C5140-5,126C227-0,4277C3573,794C81176,115C6931,169C6138-0,8034C6170,08508C840-4,488C286-0,2964C744-6,583C5400,5297C8177,913C1810,07336C11092,315C4129-2,282C672-2,988C8118-4,698C76-7,694C211-9,851C6129-9,373C7142-2,086C31054,924C41091,242C21087,929C188-0,7097C21421,87C215-0,6269C51413,544C7793,102C691-4,425C778-1,031C2150-7,137C2

  • 5.2.1. Trasponer datos.

    En bastantes ocasiones nos encontramos con tablas de datos en las que tenemos que intercambiarlas por columnas. Esa operacin se denomina trasponer la tabla. Por ejemplo, en la siguiente gurapuedes ver una tabla de datos, abierta en Calc (en este caso es la versin Linux de LibreOceCalc), que contiene alguna informacin sobre los satlites galileanos de Jpiter (nombre, dimetroen km, densidad en gr/cm3).

    Como vermeos ms adelante, para trabajar con tablas de datos es preferible que cada una de lasvariables ocupe una columna de la tabla, mientras que cada observacin aparezca en una la. Justoal revs de lo que tenemos en este ejemplo. Para remediarlo vamos a usar el ratn para seleccionartodos los datos de la tabla (incluida la primera columna, que contiene los nombres de las variables):

    A continuacin copiamos los datos de la tabla (puedes usar el ratn o Ctrl+V). Elegimos la posicinde la hoja de clculo donde vamos a pegar la tabla traspuesta (con las y columnas intercambiadas).Ten cuidado al hacer esto para que los datos que vas a pegar no se solapen con otros datos yapresentes. Yo, por ejemplo, voy a pegar la tabla traspuesta tomando como origen la celda A6. Paraeso hago click en esa celda con el botn derecho del ratn y selecciono la opcin Pegado Especial,como se ve en la gura:

    15

  • Al hacer esto aparece un cuadro de dilogo con muchas opciones que permiten controlar la formaen la que los datos de la tabla se transforman al pegarlos. En nuestro caso la nica opcin que nosinteresa es Trasponer, que hemos destacado con una echa roja en la siguiente gura.

    Asegrate de que esa opcin est seleccionada y pulsa Aceptar. Vers aparecer una nueva tablaque contiene los mismos datos, pero traspuestos, intercambiando las y columnas.

    Naturalmente, en lugar de copiar los datos en la misma hoja de clculo puedes abrir otra hojaen blanco y copiar all la tabla traspuesta, para poder grabarla con otro nombre de chero ypreservar as la tabla original. Recuerda que es muy importante tratar de conservar siempre losdatos originales sin modicarlos. Cada vez que hagamos una modicacin debemos guardar elresultado en un chero distinto y documentar de alguna manera lo que hicimos y cmo lo hicimos.De otra manera en el futuro ser muy difcil, o imposible, que otras personas o nosotros mismospodamos repetir los pasos que conducen desde los datos de prtida al resultado de nuestro anlisis.Te aconsejamos que practiques esta operacin con varias tablas de datos, porque es uno de esosrecursos que te pueden sacar de un apuro ms adelante.

    16

  • 6. Instalacin de R y RStudio.

    En los tutoriales del curso vamos a utilizar, de forma prioritaria, el programa R. La hoja declculo Calc seguir acompandonos, y aprenderemos a hacer con ella muchas otras cosas, peroel protagonista ser R. Por esa razn, vamos a presentar aqu las instrucciones de instalacin deR, en su versin 3.3.0. Las instalaciones se reeren a una mquina en la que R no est instalado.Si ya tienes una versin anterior de R instalado, al nal de esta seccin encontrars informacinsobre la forma de actualizar tu versin de R.La pgina principal de R (ocialmente R-project), es www.r-project.org.

    Busca el enlace download R (lo he sealado con una echa roja en la gura, pero puede habercambiado de ubicacin cuando leas esto). Se abrir una pgina en la que debes elegir el repositorio(mirror) desde el que vas a descargar. En general, conviene elegir uno geogrcamente cercano,para que la conexin sea rpida. El que est situado en Espaa (cran.rediris.es) suele funcionarbien. Al hacer clic sobre el enlace del repositorio llegamos a una pgina en la que debes decidirsegn cual sea tu sistema operativo. Aqu veremos las instrucciones para Windows. Haz clic sobreel enlace Download R for Windows y llegars a:

    Seguimos el enlace para instalar Windows por primera vez (recuadrado en rojo).

    17

    http://www.r-project.org/https://cran.rediris.es/

  • Finalmente, llegamos a la pgina desde la que descargaremos el instalador de la ltima versin,la 3.3.0 en el momento de escribir esto. El instalador es el mismo, con independencia de que usesWindows Xp/Windows 7/Windows 8/ Windows 10 (de 32 o 64 bits). Descrgalo, y ejecuta elinstalador. Puedes aceptar todas las opciones por defecto. La nica que te puede hacer dudar esuna en la que se pregunta Desea utilizar las opciones de configuracin?. Responde queno, y pulsa en Siguiente. Una vez acabada la instalacin, en el Escritorio o en el men Iniciode Windows, busca un icono como este:

    Puedes tener varios de ellos agrupados en un grupo de programas si, por ejemplo, trabajas enWindows de 64 bits. Haz clic en uno cuyo nombre empiece por R i386 o por R x64. En cualquiercaso, si todo va bien, te encontrars con una ventana muy parecida a esta:

    En el futuro, como veremos a continuacin, usaremos otra forma, ms cmoda, de arrancar R. Usael men Archivo para salir de R (y responde No a la pregunta sobre guardar la imagen del rea detrabajo).

    18

  • Actualizar una versin anterior de R

    Puedes consultar este enlace

    http://fernandosansegundo.wordpress.com/2013/03/22/actualizar-r-en-windows/

    6.1. Instalacin de RStudio.

    Un usuario experto de R puede empezar a trabajar con el programa desde esta misma ventana.Pero nosotros necesitaremos algo ms de ayuda (y los expertos tampoco sufren innecesariamente,si pueden evitarlo). As que vamos a instalar otro programa que har nuestro trabajo con R mssencillo. Ese programa se llama RStudio. Antes de instalarlo, cierra la ventana titulada RGui.Cuando lo hagas te preguntar Save workspace image? y puedes responder tranquilamente queno.Para instalar RStudio nos dirigimos a su pgina web ocial, en www.rstudio.com.

    y hacemos clic en el enlace que indica la echa roja. En el siguiente paso elegimos Download bajola columna RStudio Desktop

    y, nalmente, ms abajo en la ventana debemos elegir el instalador adecuado para nuestro sistema

    19

    http://fernandosansegundo.wordpress.com/2013/03/22/actualizar-r-en-windows/http://www.rstudio.com/

  • Descarga el instalador que corresponda, y ejectalo. La instalacin no presenta ninguna dicultad,y una vez terminada, puedes iniciar el programa desde el menu Inicio. El programa, al arrancar,tiene un aspecto similar a este:

    Puedes cerrar el programa en este punto. Pronto aprenderemos a usarlo.

    7. Instalacin de GeoGebra.

    GeoGebra es un programa gratuito y de cdigo abierto, que, segn sus creadores, permite lainteraccin dinmica de geometra, lgebra, estadsticas y recursos de anlisis y clculo. GeoGebrase dise para servir de apoyo visual a la enseanza de las matemticas, y en cada nueva versinha ido aumentando sus capacidades. En particular, para lo que aqu nos interesa, GeoGebra ofrecebastantes herramientas para trabajar con distribuciones de probabilidad, y algunas operacionesbsicas de la Estadstica. En este curso vamos a usar GeoGebra sobre todo para mostrar algunas

    20

  • construcciones dinmicas, en las que podrs interactuar con algunos elementos de la construccin,para experimentar lo que sucede cuando se modican.La pgina principal del proyecto GeoGebra, en la que puedes encontrar mucha informacin sobreel programa es:

    www.geogebra.org

    En esa pgina, pulsa sobre el enlace Descargas que hemos destacado en la anterior gura.

    y elige tu sistema en la ventana que se abre. La descarga del instalado debera comenzar en esemomento. A partir de aqu, las instrucciones de instalacin que incluimos son para el sistemaWindows. Tras ejecutar el instalador pasars por estas pantallas:

    21

    http://www.geogebra.org

  • Pulsamos en Siguiente

    Pulsamos en Acepto

    22

  • Puedes dejar la instalacin Standard seleccionada, y pulsar en Instalar:

    Esperamos unos momentos mientras se instala el programa . . .

    23

  • . . . y la instalacin concluye correctamente. Para comprobar que ha sido as, deja marcada lacasilla Ejecutar GeoGebra y pulsa en Terminar. Al cabo de unos instantes aparecer la interfazde GeoGebra, que se muestra en esta gura:

    Como ves, la mayor parte la ocupa la Vista Grfica, en la que aparecen los ejes de un planode coordenadas cartesianas. Justo debajo aparece la Lnea de Entrada, que usaremos para teclearcomandos. En este curso no vamos a profundizar en el uso de GeoGebra. Vamos a usarlo para vi-sualizar construcciones que te entregaremos adjuntas en los captulos de teora o en los tutoriales.As que podrs usarlas directamente, y ya vers que resultan muy intuitivas. Tambin usaremos la

    24

  • Calculadora de Probabilidades y la Ventana de Clculo Simblico, dos herramientas de GeoGebraque facilitarn mucho nuestro trabajo. Pero no vamos a explorar, ni mucho menos, todas las posi-bilidades que ofrece el programa. En cualquier caso, si quieres aprender ms sobre GeoGebra (quees un gran programa para la enseanza y la visualizacin de las Matemticas), te recomendamosque explores su pgina web.

    8. Siguiente paso. Dnde vamos ahora?

    Tras instalar todo este software, hay que ponerlo a trabajar. En general, como hemos dicho en laIntroduccin del libro, cada captulo del libro se corresponde con un tutorial, y la numeracin decaptulos y tutoriales coincide. Sin embargo, los Tutoriales 1 y 2, que corresponden a la Parte I delcurso, son especiales. Cada uno de ellos cubre el contenido conjunto de los Captulos 1 y 2 de esaparte del curso. Pero en el Tutorial01 se utiliza la hoja de clculo Calc de OpenOce, mientrasque en el Tutorial02 se usa R.En el resto del curso, cada pareja Captulo/Tutorial vendr acompaada de una Gua de Trabajo,un documento breve que esencialmente explica como se coordina el trabajo terico del captulocon los contenidos prcticos del tutorial. De nuevo, los dos primeros captulos y tutoriales son uncaso especial, porque en este caso existe una nica Gua de Trabajo conjunta para ambos. Y esees el siguiente paso: debes abrir ese documento y seguir sus instrucciones. El documento estardisponible en la pgina web del libro, o de la forma que te indique tu profesor. Las Guas de Trabajoconstituirn el guin que ordene nuestro trabajo en el curso.

    Fin del Tutorial-00. Gracias por la atencin!

    25

    Lectores de documentos en formato pdf.Navegador de internet.Instalacin de la hoja de clculo Calc.Editores de texto.Ficheros csv con Calc.Instalacin de R y RStudio.Instalacin de GeoGebra.Siguiente paso. Dnde vamos ahora?