lingüística computacional - lingüística de corpus...

61
Lingüística computacional Lingüística de corpus (Historia y fundamentos) Jorge Mauricio MOLINA MEJIA Facultad de Comunicaciones – Pregrado en letras: Filología hispánica 16 de febrero de 2016 Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 1 / 18

Upload: dinhkien

Post on 14-Oct-2018

234 views

Category:

Documents


0 download

TRANSCRIPT

Lingüística computacionalLingüística de corpus (Historia y fundamentos)

Jorge Mauricio MOLINA MEJIAFacultad de Comunicaciones – Pregrado en letras: Filología hispánica

16 de febrero de 2016

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 1 / 18

Plan

1 Lingüística de corpus

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 2 / 18

Plan

1 Lingüística de corpusLingüística de corpus ¿Disciplina ometodología ?¿Qué es la lingüística de corpus ?

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 3 / 18

Lingüística de corpus ¿Disciplina o metodología ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 4 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Algunos términos alrededor del tema : Diccionario de la RAE

lingüístico, ca : Del fr. linguistique, y este der. de linguiste ‘lingüista’.1. adj. Perteneciente o relativo a la lingüística.2. adj. Perteneciente o relativo al lenguaje.3. f. Ciencia del lenguaje.

lingüística aplicada1. f. Rama de los estudios lingüísticos que se ocupa de los problemas que el lenguajeplantea como medio de relación social, especialmente de los que se refieren a la enseñanzade idiomas.

lingüística comparada1. f. gramática comparada.

lingüística computacional1. f. Inform. Aplicación de los métodos de la inteligencia artificial al tratamiento de cues-tiones lingüísticas.

lingüística evolutiva1. f. lingüística diacrónica.

lingüística general1. f. Estudio teórico del lenguaje que se ocupa de métodos de investigación y de cues-tiones comunes a las diversas lenguas.

¿lingüística de corpus ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 5 / 18

Lingüística de corpus

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 6 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de corpus

“Un corpus es una colección de datos del lenguaje que han sido seleccionados y organizadossiguiendo unos criterios lingüísticos explícitos, con el fin de que estos puedan usarse comouna muestra de la lengua” (Sinclair, 1996).

“Tradicionalmente los lingüistas han utilizado el término corpus para designar una masa deocurrencias naturales (es decir, auténticas) de datos lingüísticos que pueden ser utilizadoscomo una base para la investigación científica” (Leech, 1997).

“Esta masa de datos puede estar conformada por textos escritos, discursos del habla, omuestras del lenguaje hablado y/o escrito” (Leech, 1997).

“Se trata en grosso modo, de grandes colecciones textuales monolingües o bilingües quedeben ser etiquetadas, analizadas o alineadas” (Daille & Romary, 2001).

“Un corpus es una colección regulada por principios, de datos del lenguaje empírico, de tex-tos (o fragmentos de textos, que se transforman en muestras de un discurso dado, dotadospor consecuencia de un valor representativo” (Teubert, 2009).

“El valor de representatividad viene dado por la calidad de la muestra y por la variedad delos textos y no por su talla” (Souque, 2014 ; Molina Mejia, 2015).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 7 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de lingüística de corpus

“La lingüística de corpus fue desarrollada para extraer de un corpus los conocimientoslingüísticos necesarios para la enseñanza de lenguas ; un corpus consiste en un conjuntocoleccionado y ordendo de datos lingüísticos reales” (Teubert, 2009).

“la LC no se entiende como una rama o un área de la lingüística tal como son la fonología, lasemántica, la sintaxis, sino que como un método de investigación que puede ser empleadoen todas las ramas o áreas de la lingüística, en todos los niveles de la lengua y desdeenfoques teóricos diferentes.” (Parodi, 2008).

“Es, definitivamente, algo muy diferente de la mayoría de los otros temas que se puedenestudiar en lingüística, ya que no se trata directamente de ningún aspecto en particular dellenguaje. Más bien, se trata de un área que se focaliza en una serie de procedimientos, o demétodos, que tienen como finalidad el estudio del lenguaje” (McEnery & Hardie, 2012).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 8 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de lingüística de corpus

“La lingüística de corpus fue desarrollada para extraer de un corpus los conocimientoslingüísticos necesarios para la enseñanza de lenguas ; un corpus consiste en un conjuntocoleccionado y ordendo de datos lingüísticos reales” (Teubert, 2009).

“la LC no se entiende como una rama o un área de la lingüística tal como son la fonología, lasemántica, la sintaxis, sino que como un método de investigación que puede ser empleadoen todas las ramas o áreas de la lingüística, en todos los niveles de la lengua y desdeenfoques teóricos diferentes.” (Parodi, 2008).

“Es, definitivamente, algo muy diferente de la mayoría de los otros temas que se puedenestudiar en lingüística, ya que no se trata directamente de ningún aspecto en particular dellenguaje. Más bien, se trata de un área que se focaliza en una serie de procedimientos, o demétodos, que tienen como finalidad el estudio del lenguaje” (McEnery & Hardie, 2012).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 8 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de lingüística de corpus

“La lingüística de corpus fue desarrollada para extraer de un corpus los conocimientoslingüísticos necesarios para la enseñanza de lenguas ; un corpus consiste en un conjuntocoleccionado y ordendo de datos lingüísticos reales” (Teubert, 2009).

“la LC no se entiende como una rama o un área de la lingüística tal como son la fonología, lasemántica, la sintaxis, sino que como un método de investigación que puede ser empleadoen todas las ramas o áreas de la lingüística, en todos los niveles de la lengua y desdeenfoques teóricos diferentes.” (Parodi, 2008).

“Es, definitivamente, algo muy diferente de la mayoría de los otros temas que se puedenestudiar en lingüística, ya que no se trata directamente de ningún aspecto en particular dellenguaje. Más bien, se trata de un área que se focaliza en una serie de procedimientos, o demétodos, que tienen como finalidad el estudio del lenguaje” (McEnery & Hardie, 2012).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 8 / 18

¿Qué es la lingüística de corpus ?Hacia una definición

La noción de lingüística de corpus

“La lingüística de corpus fue desarrollada para extraer de un corpus los conocimientoslingüísticos necesarios para la enseñanza de lenguas ; un corpus consiste en un conjuntocoleccionado y ordendo de datos lingüísticos reales” (Teubert, 2009).

“la LC no se entiende como una rama o un área de la lingüística tal como son la fonología, lasemántica, la sintaxis, sino que como un método de investigación que puede ser empleadoen todas las ramas o áreas de la lingüística, en todos los niveles de la lengua y desdeenfoques teóricos diferentes.” (Parodi, 2008).

“Es, definitivamente, algo muy diferente de la mayoría de los otros temas que se puedenestudiar en lingüística, ya que no se trata directamente de ningún aspecto en particular dellenguaje. Más bien, se trata de un área que se focaliza en una serie de procedimientos, o demétodos, que tienen como finalidad el estudio del lenguaje” (McEnery & Hardie, 2012).

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 8 / 18

Plan

1 Lingüística de corpus

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 9 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Algo de historia

Los primeros pasos en la lingüística de corpus

El uso de collecciones de textos con fines lingüísticos no es nuevo. Ya desde la Edad Media,algunas personas se interesaron en realizar listados de todas las palabras en textos particu-lares (estudio de concordancias). Estudios lexicográficos, Diccionario de Jhonson (1755).

En los años 60 aparece el primer corpus electrónico que puede ser leído, el “Brown Corpusof Standard American English”. Un millón de palabras del inglés de EEUU recopiladas en1961.

Más tarde aparece el LOB “Lancaster-Oslo/Bergen Corpus”, dedicado al inglés británico. Unmillón de palabras recopiladas en 1961.

El “London-Lund Corpus of Spoken English (LLC)” es el primer corpus recopilado para lalengua hablada. Contiene 500.000 palabras del inglés británico que fueron grabadas de 1953a 1987.

La lingüística de corpus hace aparición

“El término de lingüística de corpus comienza a utilizarse a partir de los años 90 en unacorriente llamada ‘corpus linguistics’, que tiene su origen en la literatura anglófona” (Souque,2014).

Hoy en día los estudios que utilizan un análisis hecho a través de corpus (orales o escritos)pueden ser considerados como haciendo parte de la “lingüística de corpus”.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 10 / 18

Plan

1 Lingüística de corpus

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 11 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Aplicaciones de la lingüística de corpus

Algunos usos de la LdC

Ayudar a los traductores automáticos (el corpus puede ser bilingüe o monolingüe).

Enseñar a los sistemas de traducción automática (el corpus de la ONU fue utilizado paradesarrollar Google translator).

Servir para el estudio de los traductores automáticos (como estos traductores traducen).

Servir para el estudio de los cambios del lenguaje en cualquier tiempo.

Ayudar a las personas en el aprendizaje de una lengua.

Analizar el discurso (el sentir lingüístico de una determinada comunidad y la manera en queel sentido es construido).

Estudiar el uso de las palabras (diccionarios en linea).

Servir para los sistemas de corrección ortográfica y gramatical.

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 12 / 18

Plan

1 Lingüística de corpus

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 13 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Ejemplos de corpus lingüísticos

Algunos de los corpus más importantes consultables en Internet

El “British National Corpus (BNP)”http://www.natcorp.ox.ac.uk/

El “Corpus of Contemporary American English (COCA)”http://corpus.byu.edu/coca/

“Centre National de Ressources Textuelles et Lexicales (CNRTL)”http://www.cnrtl.fr/corpus/

“Corpus de la RAE” (CORPES XXI, CDH, CREA, CORDE)http://www.rae.es/recursos/banco-de-datos

“Corpus del español de Marc Davies”http://www.corpusdelespanol.org/x.asp

“Corpus Scientext”http://scientext.msh-alpes.fr/scientext-site/spip.php?article9

“Corpus Europarl”http://corpora.linguistik.uni-erlangen.de/demos/CQP/Europarl/index.html

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 14 / 18

Plan

1 Lingüística de corpus

2 Algo de historia

3 Aplicaciones de la lingüística de corpus

4 Ejemplos de corpus lingüísticos

5 Conclusión y perspectivas

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 15 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Conclusión y perspectivas

Conclusión

Es difícil de saber si la lingüística de corpus es una disciplina o una metodología. Lo que esimportante es saber que se trata de un enfoque que en estos últimos años ha ido ganandogran presencia, como lo comprueba la creciente cantidad de artículos y de libros publicadossobre este tema.

La lingüística de corpus se ha ido convertiendo de forma paulatina en una valiosa herra-mienta para estudiar el lenguaje. De tal forma el lingüísta moderno posee un enfoque que lepermite estudiar la lengua de una manera diferente a como se había hecho anteriormente.

Perspectivas

¿Qué podemos pensar de la LdC ?¿Podemos considerarla como una simple herramienta,como un enfoque metodológico o como una disciplina ?

¿Que elementos de análisis del lenguaje podemos realizar basados en la lingüística de cor-pus ?

¿Cómo consideran ustedes que puede utilizarse le LdC dentro de la formación de futurosfilologos ?

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 16 / 18

Bibliografía

Daille, B. & Romary, L. (2001). Linguistique de Corpus : Éditorial. En Traitement Automatiquedes Langues. Volumen 42, pp. 343-346. Hermes : París.

Leech, G. (1997). Introducing Corpus Annotation. En : Garside, R. ; Leech, G. & McEnery, A.(editores) : Corpus Annotation : Linguistic Information from Computer Text Corpora. Capítulo1, pp. 1-18. Longman : New York.

McEnery, T. & Hardie, A. (2012). Corpus Linguistics : Method, Theory and Parctice. Cam-bridge University Press : New York.

Molina Mejia, J. M. (2015). ELiTe-[FLE]2 : Un environnement d’ALAO fondé sur la linguistiquetextuelle, pour la formation linguistique des futurs enseignants de FLE en Colombie. Thèsede Doctorat. Université Grenoble Alpes : Grenoble.

Parodi, G. (2008). "Lingüística de corpus : Una introducción al ámbito". En : RLA, Revista delingüística teórica y aplicada. Vol 6, Número 1, pp. 93-119.

Sinclair, J. (1996). Preliminary Recommendations on Corpus Typology. En : Document Tech-nique EAGLES (Expert Advisory on Language Engineering Standards).

Souque, A. (2014). Modèle de vérification grammaticale automatique gauche-droite. Thèsede Doctorat. Université Grenoble Alpes : Grenoble.

Teubert, W. (2009). La linguistique de corpus : une alternative [version abrégée]. En : SE-MEN : Revue de sémio-linguistique des textes et discours. Número 27, pp. 185-211. Enlínea : http://semen.revues.org/8914

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 17 / 18

Lingüística computacionalLingüística de corpus (Historia y fundamentos)

Jorge Mauricio MOLINA MEJIAFacultad de Comunicaciones – Pregrado en letras: Filología hispánica

16 de febrero de 2016

Facultad de Comunicaciones – UdeA Lingüística computacional 16/02/2016 18 / 18