a gépi fordítás kiértékelése -...
TRANSCRIPT
![Page 1: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/1.jpg)
PÁZMÁNY PÉTER KATOLIKUS EGYETEM – KIEMELT FELSŐOKTATÁSI INTÉZMÉNY
INFORMÁCIÓS TECHNOLÓGIAI ÉS BIONIKAI KAR
A gépi fordítás kiértékelése
Yang Zijian Győző
Témavezető:
Dr. Prószéky Gábor
Pázmány Péter Katolikus Egyetem, Információs Technológiai és Bionikai Kar
Roska Tamás Műszaki és Természettudományi Doktori Iskola
2017. 10. 05. 1
![Page 2: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/2.jpg)
Összefoglaló
• Bevezető
• Gépi fordítás
• Gépi fordítás kiértékelése
• Összegzés
2017. 10. 05. 2
![Page 3: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/3.jpg)
Bevezető
2017. 10. 05. 3
![Page 4: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/4.jpg)
Bevezető
2017. 10. 05. 4
![Page 5: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/5.jpg)
Gépi fordítás
• Cél: megértés, információkinyerés, nem a tökéletes fordítás
• Főbb módszerek: • Példa alapú / fordítómemórián alapuló gépi fordítás
• Szabály alapú gépi fordítás
• a felnőtt: szabályok megtanulása és szótár
2017. 10. 05. 5
![Page 6: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/6.jpg)
Gépi fordítás
• Cél: megértés, információkinyerés, nem a tökéletes fordítás
• Főbb módszerek: • Példa alapú / fordítómemórián alapuló gépi fordítás
• Szabály alapú gépi fordítás
• a felnőtt: szabályok megtanulása és szótár
2017. 10. 05. 6
![Page 7: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/7.jpg)
Gépi fordítás
• Cél: megértés, információkinyerés, nem a tökéletes fordítás
• Főbb módszerek: • Példa alapú / fordítómemórián alapuló gépi fordítás
• Szabály alapú gépi fordítás
• a felnőtt: szabályok megtanulása és szótár
2017. 10. 05. 7
![Page 8: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/8.jpg)
Gépi fordítás
• Cél: megértés, információkinyerés, nem a tökéletes fordítás
• Főbb módszerek: • Példa alapú / fordítómemórián alapuló gépi fordítás
• Szabály alapú gépi fordítás
• a felnőtt: szabályok megtanulása és szótár
2017. 10. 05. 8
![Page 9: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/9.jpg)
Gépi fordítás
• Cél: megértés, információkinyerés, nem a tökéletes fordítás
• Főbb módszerek: • Példa alapú / fordítómemórián alapuló gépi fordítás
• Szabály alapú gépi fordítás
• a felnőtt: szabályok megtanulása és szótár
2017. 10. 05. 9
![Page 10: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/10.jpg)
Gépi fordítás
• Főbb módszerek: • Statisztikai gépi fordítás
• a gyerek: példák megfigyelése
• párhuzamos korpusz
• Neurális gépi fordítás
2017. 10. 05. 10
![Page 11: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/11.jpg)
Gépi fordítás
• Főbb módszerek: • Statisztikai gépi fordítás
• a gyerek: példák megfigyelése
• párhuzamos korpusz
• Neurális gépi fordítás
2017. 10. 05. 11
![Page 12: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/12.jpg)
Gépi fordítás
• Főbb módszerek: • Statisztikai gépi fordítás
• a gyerek: példák megfigyelése
• párhuzamos korpusz
• Neurális gépi fordítás
• mesterséges neurális hálózat
2017. 10. 05. 12
![Page 13: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/13.jpg)
Gépi fordítás
• Főbb módszerek: • Statisztikai gépi fordítás
• a gyerek: példák megfigyelése
• párhuzamos korpusz
• Neurális gépi fordítás
• mesterséges neurális hálózat
2017. 10. 05. 13
![Page 14: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/14.jpg)
Gépi fordítás kiértékelése
• Gépi fordítás utómunkát végző szakemberek számára.
• Gépi fordító rendszerek kimenetének vegyítése.
• Gépi fordítást kiértékelő szakemberek számára.
• Kiszűrni a használhatatlan fordításokat.
• Figyelmeztetni a felhasználót a hibás szövegrészletekre.
2017. 10. 05. 14
![Page 15: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/15.jpg)
Kiértékelési módszerek
• Emberi kiértékelés • Legpontosabb.
• Drága, lassú.
• Gépi kiértékelés • Referenciafordítással történő kiértékelés
• Drága, nem valós idejű kiértékelés.
• Minőségbecslés (Quality Estimation)
• Nem használ referenciafordítást.
• Valós idejű kiértékelés.
• Magas korreláció az emberi kiértékeléssel.
2017. 10. 05. 15
![Page 16: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/16.jpg)
Gépi fordítás értékelésének szempontjai
• Tartalomhűség (adequacy) • jelentésben mennyire jó
• Gördülékenység, nyelvhelyesség (fluency) • a célnyelvi mondat nyelvtanilag mennyire helyes
• Elfogadhatóság
2017. 10. 05. 16
![Page 17: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/17.jpg)
Kiértékelés mérőszámai
• Pontosság • pontosság = | metszet | / | eredmény |
• Fedés • fedés = | metszet | / | cél |
• F-mérték • pontosság és fedés harmonikus közepe, átlaga
• Utószerkesztés (post-editing effort)
• Használhatóság • OK / BAD
2017. 10. 05. 17
![Page 18: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/18.jpg)
• Forrás: Ez egy útmutató, amely biztosítja, hogy a hadsereg mindig betartsa a párt utasításait.
• Gépi fordítás: It is a guide to action which ensures that the military always obeys the commands of the party.
• 1. referencia: It is a guide to action that ensures that the military will forever heed Party commands.
• 2. referencia: It is the guiding principle which guarantees the military forces always being under the command of the Party.
• 3. referencia: It is the practical guide for the army always to heed the directions of the party.
2017. 10. 05. 18
Referenciafordítással történő kiértékelés
![Page 19: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/19.jpg)
Referenciafordítással történő kiértékelés
• Automatikus kiértékelő módszerek.
• Nincsen szükség emberi beavatkozásra.
• Nem kell ismerni a két nyelvet.
• Hasonlóságot és eltérést mér a fordítás és a referenciafordítás között.
• Módszerek: • BLEU, NIST, METEOR, LEPOR, ROGUE, RIBES
• WER, TER, HTER
2017. 10. 05. 19
![Page 20: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/20.jpg)
BLEU
• BiLingual Evaluation Understudy
• pontosság: a lefordított mondatokban lévő szavak és kifejezések mennyire illeszkednek pontosan a referenciafordításhoz.
• 1. fordítás: It is a guide to action which ensures that the military always obeys the
commands of the party
• 2. fordítás: It is to insure the troops forever hearing the activity guidebook that party direct
• 1. referencia: It is a guide to action that ensures that the military will forever heed Party commands
• 2. referencia: It is the guiding principle which guarantees the military forces always being under the command of the Party
• 3. referencia: It is the practical guide for the army always to heed the directions of the party
2017. 10. 05. 20
![Page 21: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/21.jpg)
BLEU
• Tartalomhűség: unigram pontosság
• Gördülékenység: n-gram (n>1) pontosság
• Az algoritmus az n-gramokból számolt értékek súlyozott átlagát (mértani átlag) adja eredményül
• Előnyök: • Gyors, olcsó, automatikus.
• Hátrányok: • Kevésbé érzékeny a szórendi átalakításra.
• Különböző toldalék esetén eltérő BLEU érték.
2017. 10. 05. 21
![Page 22: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/22.jpg)
OrthoBleu
• Karakterszintű n-gramok
• Ragozó nyelvek esetén előnyös
• F-mérték számolása
• Emberi utómunka számára nyújthat segítséget (post-edit)
2017. 10. 05. 22
![Page 23: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/23.jpg)
BLEU-n alapuló módszerek
• NIST • információtartalom
• ROGUE • Fedést számol
• METEOR
• Szótövesítő, szinonimák kezelése
• LEPOR
• Pozíció, F-mérték
• RIBES
• Szórendhasonlóság korrelációval
2017. 10. 05. 23
![Page 24: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/24.jpg)
TER
• Translation Edit/Error Rate
𝑇𝐸𝑅 = 𝑗𝑎𝑣í𝑡á𝑠𝑜𝑘 𝑠𝑧á𝑚𝑎
𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑓𝑜𝑟𝑑í𝑡á𝑠 𝑠𝑧𝑎𝑣𝑎𝑖𝑛𝑎𝑘 á𝑡𝑙𝑎𝑔𝑜𝑠 𝑠𝑧á𝑚𝑎
• Javítások: • beszúrás, törlés, csere, eltolás
• Nem kezeli a szemantikai problémákat.
• Kevesebb javítással létrehozható hasonló jelentésű mondat.
2017. 10. 05. 24
![Page 25: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/25.jpg)
HTER
• Human-targeted Translation Edit/Error Rate
• Emberek a gépi fordító által lefordított mondatot minimális számú lépéssel kijavítják úgy, hogy a jelentés megegyezzen a referenciamondatéval.
• Az így létrejött új referenciamondatra számolunk TER-t.
2017. 10. 05. 25
![Page 26: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/26.jpg)
Minőségbecslés
• Referenciafordítás nélküli módszer
• Valós időben tud kiértékelni
• Gépi tanuláson alapuló minőségbecslő modell • Regressziós / osztályzási feladat
2017. 10. 05. 26
![Page 27: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/27.jpg)
Minőségbecslés
2017. 10. 05. 27
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Minőségbecslő modell felépítése
Minőségbecslő modell
![Page 28: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/28.jpg)
Minőségbecslés
2017. 10. 05. 28
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Minőségbecslő modell felépítése
Minőségbecslő modell
![Page 29: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/29.jpg)
Minőségbecslés
2017. 10. 05. 29
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Minőségbecslő modell felépítése
Minőségbecslő modell
![Page 30: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/30.jpg)
Minőségbecslés
2017. 10. 05. 30
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Minőségbecslő modell felépítése
Minőségbecslő modell
![Page 31: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/31.jpg)
Minőségbecslés
2017. 10. 05. 31
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Minőségbecslő modell felépítése
Minőségbecslő modell
![Page 32: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/32.jpg)
Minőségbecslés
2017. 10. 05. 32
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Gépi tanuló algoritmus
Minőségbecslő modell
![Page 33: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/33.jpg)
Minőségbecslés
2017. 10. 05. 33
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Gépi tanuló algoritmus
Minőségbecslő modell
![Page 34: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/34.jpg)
Minőségbecslés
2017. 10. 05. 34
Jegyek kinyerése
Minőségi mutatók
Forrásnyelvi és fordított mondatok
Emberi kiértékelések
Gépi tanuló algoritmus
Minőségbecslő modell
![Page 35: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/35.jpg)
Gépi tanulás
2017. 10. 05. 35
Forrásnyelvi mondat Célnyelvi (lefordított)
mondat Minőségi mutató Becslés
Emberi kiértékelés
She shot herself. Lelőtte magát. 4.0 3.0 1.33 0.75 0.25 = ? 3.943
Now, as i have never known any …
Most, ahogy még sohasem ismert …
26.0 19.0 1.37 0.73 0.26 = ? 2.914
No work, no dinner. Nincs munka, nincs vacsora. 8.0 8.0 1.00 1.00 0.00 = ? 3.596
But there seemed no place to go …
De nem volt hová mennem …
8.0 6.0 1.33 0.75 0.25 = ? 2.500
We tramped through the dim corridors …
Mi órákon át a sötét folyosókon, kanyargós …
34.0 29.0 1.17 0.85 0.14 = ? 2.627
Then he jumped like a cat … Aztán felugrott, mint egy macska, …
28.0 26.0 1.08 0.93 0.07 = ? 3.275
![Page 36: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/36.jpg)
Jegyek kinyerése
2017. 10. 05. 36
![Page 37: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/37.jpg)
Jegyek
Igék aránya a forrásmondatban.
Igék aránya a célmondatban.
2017. 10. 05. 37
![Page 38: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/38.jpg)
Jegyek
Igék aránya a forrásmondatban.
Igék aránya a célmondatban.
Főnevek aránya a forrásmondatban.
Főnevek aránya a célmondatban.
Melléknevek aránya a forrásmondatban.
Melléknevek aránya a célmondatban.
2017. 10. 05. 38
![Page 39: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/39.jpg)
Jegyek
Igék aránya a forrásmondatban.
Igék aránya a célmondatban.
Főnevek aránya a forrásmondatban.
Főnevek aránya a célmondatban.
Melléknevek aránya a forrásmondatban.
Melléknevek aránya a célmondatban.
A forrás- és a célnyelvi mondatban a tokenek aránya.
Célmondatban a tokenek száma / forrásmondatban a tokenek száma.
Tokenek száma és forrás és forrás hossz által normalizált cél abszolút értékben vett különbsége.
2017. 10. 05. 39
![Page 40: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/40.jpg)
Jegyek
Igék aránya a forrásmondatban.
Igék aránya a célmondatban.
Főnevek aránya a forrásmondatban.
Főnevek aránya a célmondatban.
Melléknevek aránya a forrásmondatban.
Melléknevek aránya a célmondatban.
A forrás- és a célnyelvi mondatban a tokenek aránya.
Célmondatban a tokenek száma / forrásmondatban a tokenek száma.
Tokenek száma és forrás és forrás hossz által normalizált cél abszolút értékben vett különbsége.
Hibás zárójelek száma.
Hibás idézőjelek száma.
2017. 10. 05. 40
![Page 41: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/41.jpg)
Jegyek
Igék aránya a forrásmondatban.
Igék aránya a célmondatban.
Főnevek aránya a forrásmondatban.
Főnevek aránya a célmondatban.
Melléknevek aránya a forrásmondatban.
Melléknevek aránya a célmondatban.
A forrás- és a célnyelvi mondatban a tokenek aránya.
Célmondatban a tokenek száma / forrásmondatban a tokenek száma.
Tokenek száma és forrás és forrás hossz által normalizált cél abszolút értékben vett különbsége.
Hibás zárójelek száma.
Hibás idézőjelek száma.
Számok aránya százalékban, a forrásmondatban.
Számok aránya százalékban, a célmondatban.
A forrás- és a célmondatban lévő számok számosságának különbsége abszolút értékben, forrásmondat hosszával normalizálva.
Tokenek száma a forrásmondatban, amelyek nem csak a-z betűt tartalmaznak.
Tokenek százaléka a célmondatban, amelyek nem csak a-z betűt tartalmazzák.
Forrásmondat perplexitása.
Forrásmondat perplexitása mondatvégi jelzés nélkül.
Célmondat perplexitása.
célmondat perplexitása mondatvégi jelzés nélkül.
2017. 10. 05. 41
![Page 42: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/42.jpg)
Jegyek
2017. 10. 05. 42
Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,01). Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,05). Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,1). Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,5). Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,01). forráskorpuszban lévő minden szó gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,5). forráskorpuszban lévő minden szó gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,1). forráskorpuszban lévő minden szó gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,2). forráskorpuszban lévő minden szó gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,5). forráskorpuszban lévő minden szó gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,05). forráskorpuszban lévő minden szó inverz gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,1). forráskorpuszban lévő minden szó inverz gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,2). forráskorpuszban lévő minden szó inverz gyakoriságával súlyozva. Átlagos száma minden forrásszó fordításának a mondatban (giza1 küszöb: valószínűség > 0,5). forráskorpuszban lévő minden szó inverz gyakoriságával súlyozva. Átlagos unigram gyakoriság a második kvartilisben lévő gyakorisága (kis gyakoriságú szavak) a forrásnyelvi korpuszban. Átlagos unigram gyakoriság a harmadik kvartilisben lévő gyakorisága (kis gyakoriságú szavak) a forrásnyelvi korpuszban. Átlagos bigram gyakoriság a második kvartilisben lévő gyakoriság (kis gyakoriságú szavak) a forrásnyelvi korpuszban. Átlagos bigram gyakoriság a harmadik kvartilisben lévő gyakorisága (kis gyakoriságú szavak) a forrásnyelvi korpuszban. Átlagos trigram gyakoriság a második kvartilisben lévő gyakorisága (kis gyakoriságú szavak) a forrásnyelvi korpuszban. Átlagos trigram gyakoriság a harmadik kvartilisben lévő gyakorisága (kis gyakoriságú szavak) a forrásnyelvi korpuszban. A korpuszban előforduló különböző bigramok százaléka (minden kvartilisben). A korpuszban előforduló különböző trigramok százaléka (minden kvartilisben).
![Page 43: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/43.jpg)
Jegyek
2017. 10. 05. 43
A forrásmondatban és a célmondatban lévő vesszők számának különbsége abszolút értékben. A forrásmondatban és a célmondatban lévő vesszők számának különbsége abszolút értékben, célmondat hosszával normalizálva. A forrásmondatban és a célmondatban lévő kettőspontok számának különbsége abszolút értékben. A forrásmondatban és a célmondatban lévő kettőspontok számának különbsége abszolút értékben, célmondat hosszával normalizálva. A forrásmondatban és a célmondatban lévő pontosvesszők számának különbsége abszolút értékben. A forrásmondatban és a célmondatban lévő pontosvesszők számának különbsége abszolút értékben, célmondat hosszával normalizálva. A forrásmondatban és a célmondatban lévő kérdőjelek számának különbsége abszolút értékben. A forrásmondatban és a célmondatban lévő kérdőjelek számának különbsége abszolút értékben, célmondat hosszával normalizálva. A forrásmondatban és a célmondatban lévő felkiáltójelek számának különbsége abszolút értékben. A forrásmondatban és a célmondatban lévő felkiáltójelek számának különbsége abszolút értékben, célmondat hosszával normalizálva. A forrás- és a célmondatban lévő írásjegyek számának különbsége abszolút értékben, célmondat hosszával normalizálva. A célszó előfordulásának száma a célhipotézisben. Fordítások átlaga minden forrásszóra a mondatban (IBM 1 táblázatból kinyerhető adat, ahol p(t|s) > 0,2). Fordítások átlaga minden forrásszóra a mondatban, súlyozva a forrásnyelvi korpuszban lévő minden szó inverz gyakoriságával (IBM 1 táblázatból kinyerhető adat, ahol p(t|s) > 0,01). Forrásnyelvi korpuszban lévő negyedik kvartilisben lévő forrásszó unigramjának gyakorisága (kis gyakoriságú szavak) százalékban. Forrásnyelvi korpuszban lévő negyedik kvartilisben lévő forrásszó unigramjának gyakorisága (nagy gyakoriságú szavak) százalékban. Forrásnyelvi korpuszban lévő első kvartilisben lévő forrásszó bigramjának gyakorisága százalékban. Forrásnyelvi korpuszban lévő negyedik kvartilisben lévő forrásszó bigramjának gyakorisága százalékban. Forrásnyelvi korpuszban lévő első kvartilisben lévő forrásszó trigramjának gyakorisága százalékban. Forrásnyelvi korpuszban lévő negyedik kvartilisben lévő forrásszó trigramjának gyakorisága százalékban. Forrásmondat unigramjainak előfordulási százaléka a korpuszban (SMT tanító korpusz alapján)..
![Page 44: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/44.jpg)
Minőségbecslés
2017. 10. 05. 44
Jegyek kinyerése
Emberi kiértékelések
![Page 45: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/45.jpg)
Összegzés
• Gépi fordítás célja: megértés, információkinyerés, NEM a tökéletes fordítás
• Gépi fordítás kiértékelése: • Minden esetben az emberi kiértékelésen / fordításon
alapszik
• Referenciafordítással történő kiértékelés
• Minőségbecslés
• Nem használ referenciafordítást.
• Egyik módszer sem éri el az elvárt eredményt.
2017. 10. 05. 45
![Page 46: A gépi fordítás kiértékelése - tfk.bme.hutfk.bme.hu/wp-content/uploads/2017/10/BME_yang_zijian_2017.pdf · • 1. fordítás: It is a guide to action which ensures that the](https://reader031.vdocuments.site/reader031/viewer/2022041318/5e16694db8bb2d70322ae9b0/html5/thumbnails/46.jpg)
Köszönöm a figyelmet
2017. 10. 05. 46
ध्यान देने के लिए आपका धन्यवाद
आप अपना ध्यान के लिए धन्यवाद थैंक यू फॉर योर अटेंशन
Thank you for your attention
Thank you for your attention
Thank you for the attention
感谢您的关注
谢谢你的关注
谢谢您的注意
Merci de votre attention
Je vous remercie pour votre attention
Merci pour l'attention