la lingüística forense - udg · la lingüística forense jordi cicres – forensiclab –...

16
14/11/2013 1 La lingüística forense Jordi Cicres ForensicLab Laboratori de lingüística forense Institut Universitari de Linguística Aplicada Universitat Pompeu Fabra Índex Introducció (definició, epistemologia, història, àmbits d’actuació) Exemples de casos reals Identificació de parlants Autenticació de gravacions Anàlisi del plagi Determinació de l’autoria de textos escrits Una mirada al futur Introducció Lingüística general: - Models descriptius Lingüística forense: - Especialitzada. - Aplicada (problem-based). - De suport per a una millor administració de la justícia La lingüística forense L’anàlisi del llenguatge jurídic i judicial (the language of the law) L’estudi del llenguatge del procediment judicial (the language of the court) L’anàlisi del llenguatge amb l’objectiu d’aportar proves en un procediment judicial (forensic linguistic evidence) Lingüística forense Lingüística teòrica i descriptiva Lingüística computacional Estadística Informàtica Enginyeria Dret Variació lingüística individual Variació entre individus Variació entre els grups (sociolingüística)

Upload: others

Post on 29-Sep-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

1

La lingüística forense

Jordi Cicres

ForensicLab – Laboratori de lingüística forense

Institut Universitari de Linguística Aplicada

Universitat Pompeu Fabra

Índex

• Introducció (definició, epistemologia, història, àmbits d’actuació)

• Exemples de casos reals

– Identificació de parlants

– Autenticació de gravacions

– Anàlisi del plagi

– Determinació de l’autoria de textos escrits

• Una mirada al futur

Introducció •Lingüística general:

- Models descriptius

•Lingüística forense:

- Especialitzada.

- Aplicada (problem-based).

- De suport per a una millor administració de la justícia

La lingüística forense

L’anàlisi del llenguatge jurídic i judicial (the language of the law)

L’estudi del llenguatge del procediment judicial (the language of the court)

L’anàlisi del llenguatge amb l’objectiu d’aportar proves en un procediment judicial (forensic linguistic evidence)

Lingüística forense

Lingüística teòrica i

descriptiva

Lingüística computacional

Estadística Informàtica

Enginyeria

Dret

Variació lingüística individual

Variació entre individus

Variació entre els grups

(sociolingüística)

Page 2: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

2

Variació lingüística individual

< Variació entre individus

< Variació entre els grups

(sociolingüística)

IDIOLECTE

'uniqueness of utterance principle'

(Chomsky 1965; Halliday 1975)

• Nolan (1994: 331): “even within a narrowly defined dialect community, individuals will have their own preferred detailed pronunciations of particular words. The combination of number of such preferred alternative pronunciations yields an overall pronunciation which is idiosyncratic, [and] that is, an individual’s idiolect”

• (Burridge y Mulder, 1998: 302): “variation within a language that is associated with individual speakers”

• Brown (1982: 16): “An idiosyncratic feature is one which cannot be correlated with group factors such as sex, age, regional origin, social status, health, etc.”.

HISTÒRIA

• 1968. Jan Svartvik: Cas de Timothy John Evans.

• Anàlisi de les suposades declaracions del sospitós fetes davant la policia. Mitjançant anàlisi descriptiva i estadística, es va demostrar que les declaracions havien estat manipulades per la policia.

• Apareix per primer cop el terme “Lingüística Forense”.

Comparació forense de veus (Identificació de parlants)

• La variació intraparlant (within-speaker) i interparlant (between-speaker)

Page 3: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

3

• Les dimensions més importants són les que presenten una variació intraparlant petita i una variació interparlant gran.

• Cal calcular la ràtio de variació entre parlants respecte de la variació dins del parlant.

• Aquesta ràtio és la F-ratio, i es calcula mitjançant l’anàlisi de variància (ANOVA)

• En variables no quantitatives s’utilitzen altres tècniques estadístiques

Page 4: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

4

• Reducció de la quantitat de dades disponibles

–Transmissió telefònica

–Soroll de fons

–Mitjà de gravació (qualitat pèssima)

–Durada de les mostres

• Material de treball:

– Número de mostres

– Número de dimensions

– Mida de les dimensions

Quins paràmetres es

poden comparar

per discriminar veus

en fonètica forense?

INFORMACIÓ

EN LA PARLA

QUALITAT VOCAL

COMPONENT

ORGÀNIC

COMPONENT

(O AJUSTAMENT)

ARTICULATORI

QUALITAT

FONÈTICA

LINGÜÍSTIQUES NO LINGÜÍSTIQUES

AUDITIVES AUDITIVES-

LINGÜÍSTIQUES

AUDITIVES-NO LINGÜÍSTIQUES

ACÚSTIQUES ACÚSTIQUES-

LINGÜÍSTIQUES

ACÚSTIQUES-NO LINGÜÍSTIQUES

Page 5: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

5

Variables

Fonètiques

(no lingüístiques)

Segmentals

Propietats acústiques dels segments

Vocals, nasals, laterals, oclusives, fricatives,

ròtiques...

Suprasegmentals

Freqüència fonamental, ritme, entonació, alineació tonal, velocitat de la parla,

qualitat de la veu

Lingüístiques

Fonologia, morfologia, sintaxi, etc.

Dialecte, sociolecte, L1/L2, accent estranger, fonotaxi...

Referents a la “manera de parlar”

Hàbits verbals (pauses omplertes), hàbits no

verbals (clics, riures, tos), comportament respiratori

Frequency (Hz)500 16000

-40

-20

0

Frequency (Hz)500 16000

-40

-20

0

Frequency (Hz)

500 16000

-40

-20

0

Frequency (Hz)

500 16000

-40

-20

0

Frequency (Hz)

500 16000

-40

-20

0

Frequency (Hz)

500 16000

-40

-20

0

F3

F2

F1

Page 6: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

6

Page 7: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

7

VARIABILITAT

SOCIOLINGÜÍSTICA INDIVIDUAL

• Accent regional (dialecte)

• Accent regional (dialecte)

• Accent social (sociolecte)

• Accent regional (dialecte)

• Accent social (sociolecte)

• Influència d’altres llengües

• Cas Prinzivalli:

– la veu de Prinzivalli (indubitada) i la veu

dubitada coincidien amb un F0 molt

més baix que la mitjana

• Cas Prinzivalli:

– diferències dialectals entre l’accent de

Nova York (origen de Prinzivalli) i de

Nova Anglaterra

Page 8: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

8

• Cas Prinzivalli:

– diferències dialectals entre l’accent de

Nova York (origen de Prinzivalli) i de

Nova Anglaterra

– indetectable pels policies de Los

Angeles

• Cas Prinzivalli:

– diferències dialectals entre l’accent de

Nova York (origen de Prinzivalli) i de

Nova Anglaterra

– indetectable pels policies de Los

Angeles

– -r (no es pronuncia a Nova York)

• Variació sociolingüística:

• Variació sociolingüística:

– sexe

• Variació sociolingüística:

– sexe

– edat

• Variació sociolingüística:

– sexe

– edat

– classe social (factor socioeconòmic)

– nivell educatiu

Page 9: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

9

• Variació sociolingüística:

– sexe

– edat

– classe social (factor socioeconòmic)

– nivell educatiu

– ètnia

– camp/ciutat

• Exemple: -/r/ en anglès

– [r]

–Ø

car, hear, November, flower

Parlant Parla

espontània

Parla

acurada

Lectura

d’un

passatge

Lectura

d’una llista

de paraules

Lectura de

parells

mínims

BN 0 0 13 33 33

JP 0 3 23 53 50

SK 0 6 8 38 100

DH 0 31 44 69 100

AG 12 15 46 100 100

ML 32 47 39 56 100

Percentatge de realitzacions plenes [r] en diferents contexts lingüístics de

formalitat en 6 parlants de Nova York

• En anglès nord americà, a major formalitat major presència de [r]

• En anglès britànic, a major formalitat,

major ocurrència Ø

ELS LÍMITS

ADN

• Invariable (en el temps, en mostres diferents)

• Jurídicament inqüestionable

• Ràtio d’error baixa

MOSTRES DE VEU

• Variables (en el temps, en mostres diferents)

• Reticències judicials

• Ràtio d’error més gran

Autenticació de gravacions

Page 10: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

10

Page 11: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

11

• La importància d’una bona transcripció:

http://elpais.com/diario/2007/06/05/espana/1180994413_850215.html

Determinació d’autoria de textos escrits

Tècniques amb base sintàctica

BÍGRAMS / TRÍGRAMS

CORPUS ANOTATS

MORFOLÒGICAMENT

A PARTIR DE LES FORMES SUPERFICIALS

Bígram Text 1 Text 2 ...

no me 5 0 ...

, que 4 6 ...

el hombre 3 2 ...

. y 3 4 ...

a su 3 4 ...

su señora 2 0 ...

, como 2 3 ...

me he 2 3 ...

no me 5 0 ...

Morpho-syntactically Annotated Tag Sequences (MATS)

Page 12: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

12

Un exemple d’atribució d’autoria

Una empresa del sector turístic de Catalunya és acusada d’acomiadament improcedent per part d’un empleat que suposadament l’havia intentat extorsionar.

L’extorsió apareix en una sèrie d’e-mails,. L’empleat diu que no els ha enviat ell.

L’empleat reconeix haver enviat una sèrie de faxos durant aquells dies.

S’utilitza com a corpus indubitat els faxos, i els e-mails com a corpus dubitat.

TD@

Doc01 Doc02 Doc03 Doc04

TIFax

Doc05 Doc06 Doc07 Doc08

• Temporalitat i cronologia

• 1. doc01 (TD@)

‘(…) y más de 6.000 litros de gasoil de

calefacción’.

(22 de setembre de 2003).

• 2. doc05 (TIfax)

‘(…) llegando a consumir 6.000 litros de gasoil’ (…)’.

(28 de setembre de 2003)

• Errors ortogràfics

• 3. doc06 (TIfax)

‘(…) una de las personas que más a

trabajado para la XXX’.

• 4. doc03 (TD@)

‘(…) el cual siempre me a demostrado su

interés (…)’.

Page 13: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

13

• Errors gramaticals

• 5. doc07 (TIfax)

(…) ‘al cual la empresa le han pagado’.

• 6. doc01 (TD@)

(…) ‘no creo que hayan muchas

personas’).

• Contacte de llengües

• i) La caiguda de la preposició ‘de’ en contextos en els quals el seu ús és obligatori en castellà estàndard. Ex.: ‘en el caso ^ que’ (doc05 TIfax), ‘se dio cuenta ^ que tenía en sus manos’ (doc02 TD@).

• ii) La caiguda de la preposició ‘a’, en contextos en els quals el seu ús és obligatori en castellà estàndard per indicar el complement directe: ‘para atender ^ los clientes’ (doc08 TIfax).

L’ús dels corpus de referència per A/D d’autoria

Danielle Jones nena desapareguda

David Hodgson oncle

Page 14: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

14

Plagi

SISTEMA LEGAL

COMMON LAW CIVIL LAW

Gran tradició de litigi

per temes de plagi. Els

lingüistes actuen

de pèrits

- “Intertextualitat”

- Reticències per acceptar

evidències lingüístiques

Unitat, globalitat, coherència/cohesió

Estil Descontextualització

Page 15: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

15

Gradació dels elements estructurals Nivell de similitud

Vocabulari coincident

– En textos sobre una mateixa temàtica

– En traduccions

Un exemple de plagi en la traducció

• Cas jutjat

• El 1993, Vázquez Montalbán va ser declarat culpable (sentència 1268 del Tribunal Suprem, Madrid, 29 de desembre del 1993) d’haver plagiat la traducció al castellà de Pujante del Julius Caesar de Shakespeare (Espasa Calpe, 1987)

Corpus

• Astrana Marín (1961)

• Valverde (1968)

• Pujante (1987)

– la traducció plagiada

• Vázquez Montalbán (1988)

– la traducción qüestionada

Copycatch

Anàlisi quantitativa

% de vocabulari comú

Núm. de paraules únicas compartides

Page 16: La lingüística forense - UdG · La lingüística forense Jordi Cicres – ForensicLab – Laboratoride lingüística forense InstitutUniversitari de Linguística Aplicada Universitat

14/11/2013

16

Número de sintagmes compartits d’aparició única (longitud dels sintagmes: 3 elements) Anàlisi qualitativa

I CANNOT DRINK TOO MUCH OF BRUTUS’ LOVE.

A. Jamás beberé lo bastante por el afecto de Bruto.

V. No puedo beber suficiente del cariño de Bruto.

P. Jamás podré apurar la amistad de Bruto.

VM. Jamás podré apurar la amistad de Bruto.

GOOD MORROW, BRUTUS

A. Buenos días, Bruto.

V. Buenos días, Bruto.

P. Buenas noches, Bruto.

VM. Buenas noches, Bruto.

HAVE WISHED THAT NOBLE BRUTUS HAS HIS EYES.

A. suspirar por que el noble Bruto abriese los ojos.

V. han deseado que el noble Bruto tuviera sus ojos.

P. y quisieran que Bruto no fuese tan ciego.

VM. y quisieran que Bruto no fuese tan ciego.

A TRADE, SIR, THAT I HOPE I MAY USE WITH A SAFE CONSCIENCE

A. Un oficio, señor, que espero podré ejercer con la conciencia tranquila,

V. De un oficio, señor, que espero se me agradezca con buen consuelo:

P. Señor, un oficio que siempre hace el bien.

VM. Señor, un oficio que siempre hace el bien.