funkcjonowanie systemu antyplagiatowego (osa) na...
TRANSCRIPT
Funkcjonowanie
systemu antyplagiatowego (OSA)
na Uniwersytecie Jagiellońskim
dr Agnieszka Kowalska
Pełnomocnik Rektora ds. wprowadzenia systemu
antyplagiatowego w Uniwersytecie Jagiellońskim
Otwarty System Antyplagiatowyhttp://osaweb.pl/
„Oprogramowanie Otwartego Systemu Antyplagiatowego mieści się z formule open-source. Jeśli uczelnia należąca do Międzyuniwersyteckiego Centrum Informatyzacji lub będąca jego członkiem stowarzyszonym chce modyfikować kod źródłowy, zgłasza opis i cel tej modyfikacji do dyrekcji MUCI a po uzyskaniu akceptacji stosuje się do obowiązujących w tym zakresie procedur zapewniających systemowi nieustającą skuteczność.
Główne atuty
• Baza stron internetowych licząca ponad 750 milionów rekordów (zaindeksowanych stron).
• Bezpieczne porównania z zasobami internetowymi (bez pośrednictwa podmiotów trzecich takich jak Microsoft, Google, etc...).
• Efektywne sprawdzanie z całą bazą stron internetowych, a nie tylko z pierwszymi wynikami zwróconymi przez wyszukiwarki takie jak Google czy Bing.
• Możliwość indeksacji wielkich baz prac referencyjnych (np. ORPPD) poprzez skróty nieodwracalne (np. wektory częstości). Skróty wystarczają do prowadzenia porównań, a są bezużyteczne dla potencjalnego złodzieja.
• Nowatorskie, efektywne algorytmy detekcji podobieństw w bazie prac studenckich i w zasobach internetowych opracowane przez zespół polskich naukowców.
• Efektywny algorytm szczegółowego porównywania tekstów.
• Detekcja kamuflażu nieuprawnionych zapożyczeń, także niewerbalnych.
• Interaktywny podgląd porównywanych dokumentów.
• Obsługa wzajemnego porównywania prac między sobą (np. prac domowych grupy studentów) z opcją dodatkowego porównania ich z bazą prac studenckich i zasobami internetowymi.
• Obsługa masowego ładowania plików do bazy.
• Współpraca z PCSS (Poznańskie Centrum Superkomputerowo-Sieciowe)”
http://wiki.osaweb.pl
Otwarty System Antyplagiatowy
Zalety:
• Czas sprawdzania
• Integracja z APD
• Zgodność prawna
• Sprawdzanie kolekcji
Wady:
• Polskojęzyczny zasób• ….
• Obsługa OSY poprzez APD
• Analiza raportu skróconego
• Obsługa OSY w wersji webowej www.osa.uj.edu.pl
• Analiza raportu rozszerzonego
Integracja APD i OSAwww.apd.uj.edu.pl / http://usosownia.uj.edu.pl/apd
www.osa.uj.edu.pl
Raport skrócony
Tabela statystyk wyrazów
• Statystyki wyrazów mogą dać wgląd w próby oszustwa ze strony osoby piszącej pracę. Dla sprawdzającego pracę podejrzanie powinny budzić następujące sytuacje:
• Bardzo mała liczba słów w całym dokumencie - podejrzenie, że autor pracy stosował białe znaki zamiast spacji, by oszukać system (w skrajnym przypadku praca może składać się z jednego bardzo długiego słowa)
• Bardzo mała liczba słów rozpoznanych jako słownikowe - podejrzenie o stosowanie liter wyglądających jak polskie (np. z alfabetu greckiego), białych znaków, np. minispacji. Minispacje to zwykłe spacje odpowiadające bardzo małym rozmiarom czcionki (np. 1). Jeśli zostaną wstawione między litery jakiegoś wyrazu na wydruku będą niezauważalne, ale w wersji elektronicznej w miejscu tego wyrazu ujrzymy oddzielne ciągi liter, które zwykle nie występują w słowniku.
• Bardzo mała liczba unikatowych rozpoznanych słów - ubogie słownictwo, podejrzenie o wybiórcze stosowanie minispacji lub podmiany czcionek.
• Niezerowa liczba słów z podstawionymi czcionkami.
• Duży stosunek liczby nierozpoznanych słów do słów rozpoznanych bądź liczby unikatowych nierozpoznanych słów do rozpoznanych słów unikatowych (wykresy kołowe).
• Często jest tak, że próby oszustwa na czcionkach bądź podstawienia białych znaków przystankowych powoduje, że pozostałe moduły antyplagiatowe nie są w stanie znaleźć zapożyczeń. No bo jak znaleźć w bazie referencyjnej podobieństwo pracy, w której jest jeden bardzo długi ciąg znaków? Stąd statystyka wyrazów jest bardzo ważną informacją, która może być jedynym śladem prowadzącym do ujawnienia nieuprawnionych działań. Jeśli dokument jest w taki sposób spreparowany - polecamy skorzystać z narzędzia "Treść pracy", gdzie uwidocznione są słowa nierozpoznane.
„„
http://wiki.osaweb.pl/Interpretacja_wynik%C3%B3w
Analiza raportu
Wysoki PRWC (procentowy rozmiar wspólnej części)
Mała liczba rozpoznanych słów
Duża liczba nierozpoznanych słów
Duża liczba słów w najdłuższej frazie
Liczba słów z podstawionymi czcionkami
Zawsze należy zapoznać się z rozszerzoną wersją raportu.
Obsługa Osy w wersji webowejwww.osa.uj.edu.pl
Raport rozszerzony1. Metryka pracy
2. Statystyki dokumentu
3. Wynik sprawdzania antyplagiatowego
4. Treść pracy
Podobieństwo semantyczne
Tworzenie kolekcji prac
Materiały
• www.osa.uj.edu.pl
• http://wiki.osaweb.pl
• www.apd.uj.edu.pl -> http://usosownia.uj.edu.pl/apd
Kontakt
dr Agnieszka KowalskaPełnomocnik Rektora ds. wprowadzania systemu antyplagiatowego w Uniwersytecie Jagiellońskim
tel. 798423543
ul. Gołębia 24, p. 16
tel. 12 633 1076
dziękuję