historia rozwoju technik znakowania tekstu -...

47
Historia rozwoju technik znakowania tekstu Patryk Czarnik Instytut Informatyki UW XML i nowoczesne technologie zarz ˛ adzania tre´ sci ˛ a – 2007/08 Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 1 / 35

Upload: ledung

Post on 29-Apr-2019

228 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia rozwoju technik znakowania tekstu

Patryk Czarnik

Instytut Informatyki UW

XML i nowoczesne technologie zarzadzania trescia – 2007/08

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 1 / 35

Page 2: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Plan

1 Idea znakowaniaPrehistoriaKategorie znakowan

2 HistoriaHistoryczne pomysłyDroga do SGMLDroga do XML

3 Idee SGML i XMLSGMLXML

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 2 / 35

Page 3: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Plan

To jest XML (1)

<wykład tytuł="Historia technik znakowania tekstu"><slajd tytuł="To jest XML (1)"><par>

XML jest standardem do zapisywania danychtekstowych <wazne>wraz z ich struktura</wazne>.

</par></slajd>

</wykład>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 3 / 35

Page 4: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Plan

To jest XML (2)

<?xml version="1.0" encoding="iso-8859-2"?><!-- Komentarz --><element_glowny><podelement atrybut=’Wartosc atrybutu’inny-atrybut="123">Zawartosc tekstowa <elem>i zanurzony element</elem>.<element_pusty moze_miec="atrybut"/>

</podelement>Zawartosc tekstowa &encja; &#502;<![CDATA[x &lt; 5 & x > -5]]>

</element_glowny>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 4 / 35

Page 5: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania

Plan

1 Idea znakowaniaPrehistoriaKategorie znakowan

2 HistoriaHistoryczne pomysłyDroga do SGMLDroga do XML

3 Idee SGML i XMLSGMLXML

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 5 / 35

Page 6: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Prehistoria

Znakowanie tekstu – zródła

Markup – znakowanie.Zródła: reczne znakowanie tekstu przeznaczonego do druku.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 6 / 35

Page 7: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Prehistoria

Znakowanie tekstu – zródła

Markup – znakowanie.Zródła: reczne znakowanie tekstu przeznaczonego do druku.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 6 / 35

Page 8: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Znakowanie tekstu – kategorie

Znakowanie interpunkcyjne i prezentacyjne.Znakowanie proceduralne.Znakowanie opisowe.Znakowanie referencji.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 7 / 35

Page 9: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Znakowanie interpunkcyjne i prezentacyjne

Nawet piszac „płaski tekst” (np. nieformatowany email) uzywamyznaczników:

znaki interpunkcyjne,wielkosc liter,odstepy w poziomie i pionie,„reczne” wypunktowania, numeracje itp.

Informacja ta moze byc wykorzystana do odtworzenia (takzeautomatycznego) struktury tekstu.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 8 / 35

Page 10: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Znakowanie proceduralne

Znaczniki powoduja okreslone zachowanie programu czytajacego,zazwyczaj zastosowanie okreslonego formatowania.Przykłady:

Postscript, TeX,czesciowo LaTeX, np. \tt, \center,bezposrednie formatowanie w Wordzie,znaczniki HTML takie jak <B> czy <BR>.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 9 / 35

Page 11: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Wady bezposredniego formatowania

Dokument w danej chwili posiada tylko jedno formatowanie,zmiana formatowania wymaga zmian w dokumencie.Brak pewnego sposobu na automatyczne rozróznienie róznychznaczeniowo fragmentów tekstu o tym samym formatowaniu.

Przykład: zarówno cytaty jak i wyróznienia oznaczamy kursywa,nastepnie chcemy wszystkie wyróznienia oznaczyc pogrubieniem.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 10 / 35

Page 12: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Znakowanie opisowe (strukturalne, semantyczne)

Znaczniki opisuja role fragmentów tekstu:struktura dokumentu (rozdział, paragraf, lista),znaczenie fragmentów tekstu (definicja, cytat, osoba).

Przykłady:czesciowo LaTeX, np. \section, \theorem,style w Wordzie,znaczniki HTML takie jak <H1>, <P>, <Q>, <DFN>.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 11 / 35

Page 13: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Zalety znakowania opisowego

Znajomosc struktury znacznie ułatwia analize i wyszukiwanie(mozliwe wyszukiwanie kontekstowe).Mozliwosc stosowania wielu formatowan do tego samegodokumentu.Mozliwosc wykorzystania danego formatowania do wieludokumentów.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 12 / 35

Page 14: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idea znakowania Kategorie znakowan

Znakowanie referencji

Zastosowania:wstawianie znaków i fragmentów tekstu,właczanie fragmentów z zewnetrznych zródeł bez kopiowania,odnosniki do dokumentów i miejsc w dokumentach.

Zalety:mozliwa zmiana wstawianych znaków i tekstów w zaleznosci odkontekstu czy wybranego formatowania,uaktualnianie fragmentów z zewnetrznych zródeł.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 13 / 35

Page 15: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia

Plan

1 Idea znakowaniaPrehistoriaKategorie znakowan

2 HistoriaHistoryczne pomysłyDroga do SGMLDroga do XML

3 Idee SGML i XMLSGMLXML

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 14 / 35

Page 16: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia

Historia komputerowego znakowania tekstu

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 15 / 35

Page 17: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia

Znakowanie zorientowane na wyglad

Program RUNOFF (1964), nastepnie nroff i troff w pierwszychsystemach UNIXowych.Edytory typu WYSWIG (tekstowe – koniec lat 60-tych,graficzne – lata 80-te).TeX (Donald Knuth, koniec lat 70-tych),LaTeX (poczatek lat 80-tych).Postscript (połowa lat 80-tych).RTF (1987).

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 16 / 35

Page 18: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Historyczne pomysły

W.Tunnicliffe i GenCodePierwsze głosy dot. znakowania opisowego

1967 – William Tunnicliffe, prezes Graphic CommunicationsAssociation, podczas spotkania w Canadian Government PrintingOffice przedstawia idee oddzielenia zawartosci informacyjnejdokumentów od ich formatu,Stanley Rice proponuje uzycie uniwersalnych znaczników doznakowania struktury tekstu.Projekt GenCode definiuje sposób oznaczania tekstuukierunkowany na jego strukture.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 17 / 35

Page 19: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Historyczne pomysły

B.Reid i ScribeAlternatywna droga

Brian Reid, pod koniec lat 70-tych opracowuje, a w 1981 przedstawiaScribe:

jezyk znaczników i system przetwarzania tekstu,wyrazne oddzielenie tresci od formatu,idea arkusza stylu,podobno pomysły wziete pod uwage przy projektowaniu SGML.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 18 / 35

Page 20: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do SGML

INTIMEINteractive Textual Information Management Experiment

Projekt badawczy Charlesa Goldfarba(IBM, koniec lat 60-tych XX wieku),Prototyp zintegrowanego systemu przetwarzania tekstu:

edycja tekstu,repozytorium dokumentów,wyszukiwanie.

(Oczywiscie) obsługa za pomoca konsoli tekstowej i reczniewpisywanych polecen.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 19 / 35

Page 21: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do SGML

Wnioski z projektu INTIME

Wyszukiwanie jest efektywniejsze gdy znana jest struktura(znaczenie poszczególnych fragmentów) tekstu.Opracowano heurystyke odgadujaca strukture tekstu,ale zauwazono potrzebe oznaczania struktury w zródle.Istniejace (wówczas) jezyki znakowania tekstu koncentruja sie nawygladzie, a nie strukturze czy znaczeniu.Charles Goldfarb bierze udział w pracach nad standardem GMLa pózniej SGML.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 20 / 35

Page 22: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do SGML

GML – Generalized Markup Language

Poczatki: 1969; Charles Goldfarb, Edward Mosher,Raymond Lorie.Powstał jako jezyk makr do edytora IBM SCRIPT:

opisujacych strukture dokumentu,zamienianych na znaczniki formatujace.

Mozliwe było rozszerzanie poczatkowego zbioru znaczników.Narzedzie pozwalało na definiowanie wielu „profili”wizualizujacych dokument.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 21 / 35

Page 23: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do SGML

SGML – Standard Generalized Markup Language

Pierwsze wersje robocze w 1980.Standard ISO w 1986.Rozwiniety potomek GML.Domyslnie w SGML znaczniki z trójkatnymi nawiasami.Dopuszczalne takze znaczniki jak w GML::ol:li.Ordered lists (like this one),:li.Unordered lists, and:li.Definition lists

:eol.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 22 / 35

Page 24: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do SGML

SGML – Wazne zastosowania

Pierwsze szerzej znane zastosowania:Electronic Manuscript Project,Association of American Publishers, 1987,CALS – Computer-Aided Acquisition and Logistic Support,US Department of Defense, 1988.

HTML 2.0 zdefiniowany jako zastosowanie SGML w 1991.DocBook (poczatki – 1991).Standardy zwiazane z SGML:

DSSSL – Document Style Semantics and Specification Language,HyTime – meta-notacja dla linków oraz opis strukturmultimedialnych rozciagnietych w czasie.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 23 / 35

Page 25: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do XML

Ewolucja internetu

1 człowiek↔ człowiek,2 człowiek↔ aplikacja,3 aplikacja↔ aplikacja.

Elektroniczna wymiana danych wymaga dobrze okreslonego,uniwersalnego i taniego w obsłudze standardu.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 24 / 35

Page 26: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do XML

Ewolucja internetu

1 człowiek↔ człowiek,2 człowiek↔ aplikacja,3 aplikacja↔ aplikacja.

Elektroniczna wymiana danych wymaga dobrze okreslonego,uniwersalnego i taniego w obsłudze standardu.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 24 / 35

Page 27: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do XML

Dlaczego nie SGML?

Spodziewane uzycie SGML:duze scentralizowane systemy przetwarzajace dokumenty,przetwarzanie tekstu i publikacje,człowiek recznie edytujacy dokumenty.

Nowe wyzwania (XML):architektura rozproszona, „lekkie” komponenty,sposób reprezentacji danych

elektroniczna wymiana danych,bazy danych,

dokumenty przetwarzane wyłacznie automatycznie.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 25 / 35

Page 28: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do XML

Dlaczego nie SGML?

Spodziewane uzycie SGML:duze scentralizowane systemy przetwarzajace dokumenty,przetwarzanie tekstu i publikacje,człowiek recznie edytujacy dokumenty.

Nowe wyzwania (XML):architektura rozproszona, „lekkie” komponenty,sposób reprezentacji danych

elektroniczna wymiana danych,bazy danych,

dokumenty przetwarzane wyłacznie automatycznie.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 25 / 35

Page 29: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Historia Droga do XML

World Wide Web Consortium (W3C)

Kuznia standardów internetowych, np.:HTML – Hyper Text Markup Language,HTTP – Hyper Text Transfer Protocol,CSS – Cascading StyleSheets,

XML – Extensible Markup Language:najwazniejsza rekomendacja ostatnich lat,twórcy: Tim Bray (Netscape), Jean Paoli (Microsoft),C.M. Sperberg-McQueen (University of Illinois).

Obecnie głównie prace nad standardami zwiazanymi z XML.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 26 / 35

Page 30: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML

Plan

1 Idea znakowaniaPrehistoriaKategorie znakowan

2 HistoriaHistoryczne pomysłyDroga do SGMLDroga do XML

3 Idee SGML i XMLSGMLXML

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 27 / 35

Page 31: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – znaczniki opisowe

Znaczniki mówia o znaczeniu a nie wygladzie tekstu.Znaczniki otwierajace i zamykajace.

<OSOBA MÓWIACA>Hamlet</OSOBA MÓWIACA><WYPOWIEDZ>Byc albo nie byc.

Oto jest pytanie.</WYPOWIEDZ>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 28 / 35

Page 32: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – znaczniki opisowe

Znaczniki mówia o znaczeniu a nie wygladzie tekstu.Znaczniki otwierajace i zamykajace.

<OSOBA MÓWIACA>Hamlet</OSOBA MÓWIACA><WYPOWIEDZ>Byc albo nie byc.

Oto jest pytanie.</WYPOWIEDZ>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 28 / 35

Page 33: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – formatowanie

Informacja o wygladzie poza trescia dokumentu.OSOBA MÓWIACA – Arial 14 pogrubiony,WYPOWIEDZ – Times 12 normaly, wciecie 1.5 cm.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 29 / 35

Page 34: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – formatowanie

Informacja o wygladzie poza trescia dokumentu.OSOBA MÓWIACA – Arial 14 pogrubiony,WYPOWIEDZ – Times 12 normaly, wciecie 1.5 cm.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 29 / 35

Page 35: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – model

Mozna i nalezy dostosowac zestaw znaczników do problemu.Model definiuje słownik pojec i zaleznosci miedzy nimi(analogia: klasy w UML).SGML i XML pozwala na ograniczenie struktury dokumentuzgodnie z opracowanym modelem (Definicja Typu Dokumentu).

<OSOBA MÓWIACA>Hamlet</OSOBA MÓWIACA><WYPOWIEDZ><NUDA>Byc albo nie byc.

Oto jest pytanie.<NUDA></WYPOWIEDZ>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 30 / 35

Page 36: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Idea SGML i XML – model

Mozna i nalezy dostosowac zestaw znaczników do problemu.Model definiuje słownik pojec i zaleznosci miedzy nimi(analogia: klasy w UML).SGML i XML pozwala na ograniczenie struktury dokumentuzgodnie z opracowanym modelem (Definicja Typu Dokumentu).

<OSOBA MÓWIACA>Hamlet</OSOBA MÓWIACA><WYPOWIEDZ><NUDA>Byc albo nie byc.

Oto jest pytanie.<NUDA></WYPOWIEDZ>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 30 / 35

Page 37: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Najodpowiedniejszy model

encyklopedia: <nazwisko>, <imie>, <ur>, <zm>, <wymowa>,<etymologia>, <liczba-mieszk>prawo: <promulgator>, <rocznik>, <poz>, <art>, <sad>,<sygn-wyroku>, <teza>dokument techniczny: <part-number>, <function-name>patenty: <wynalazca>, <nr-zgłoszenia>

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 31 / 35

Page 38: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

Jezyk – metajezyk

Stan wyjsciowy: Wieza Babel (brak wspólnego jezyka).Wspólny metajezyk:

znana gramatyka,jednolita metodologia,takie same narzedzia.

Dowolnie wiele jezyków specyficznych dla zastosowan.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 32 / 35

Page 39: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

SGML/XML a HTML

HTML

Zestaw znaczników okreslonyprzez standard i zamkniety.

Znaczenie znacznikówokreslone przez standard.

Wyglad znaczników okreslonyprzez standard lubprzegladarki.

Poprawnosc w praktyceweryfikowana przezprzegladarki (ile stron siewaliduje?...).

XML/SGML

Mozliwosc definiowanianowych znaczników.

Ta sama nazwa znacznikamoze miec rózne znaczenie wróznych zastosowaniach, np.kod – kod zródłowyprogramu, kod pocztowy.

Mozna przypisac dowolnywyglad do okreslonychznaczników (jesli w ogólepotrzeba).

Poprawnosc scisle okreslonaprzez standard.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 33 / 35

Page 40: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

SGML/XML a HTML

HTML

Zestaw znaczników okreslonyprzez standard i zamkniety.

Znaczenie znacznikówokreslone przez standard.

Wyglad znaczników okreslonyprzez standard lubprzegladarki.

Poprawnosc w praktyceweryfikowana przezprzegladarki (ile stron siewaliduje?...).

XML/SGML

Mozliwosc definiowanianowych znaczników.

Ta sama nazwa znacznikamoze miec rózne znaczenie wróznych zastosowaniach, np.kod – kod zródłowyprogramu, kod pocztowy.

Mozna przypisac dowolnywyglad do okreslonychznaczników (jesli w ogólepotrzeba).

Poprawnosc scisle okreslonaprzez standard.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 33 / 35

Page 41: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

SGML/XML a HTML

HTML

Zestaw znaczników okreslonyprzez standard i zamkniety.

Znaczenie znacznikówokreslone przez standard.

Wyglad znaczników okreslonyprzez standard lubprzegladarki.

Poprawnosc w praktyceweryfikowana przezprzegladarki (ile stron siewaliduje?...).

XML/SGML

Mozliwosc definiowanianowych znaczników.

Ta sama nazwa znacznikamoze miec rózne znaczenie wróznych zastosowaniach, np.kod – kod zródłowyprogramu, kod pocztowy.

Mozna przypisac dowolnywyglad do okreslonychznaczników (jesli w ogólepotrzeba).

Poprawnosc scisle okreslonaprzez standard.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 33 / 35

Page 42: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML SGML

SGML/XML a HTML

HTML

Zestaw znaczników okreslonyprzez standard i zamkniety.

Znaczenie znacznikówokreslone przez standard.

Wyglad znaczników okreslonyprzez standard lubprzegladarki.

Poprawnosc w praktyceweryfikowana przezprzegladarki (ile stron siewaliduje?...).

XML/SGML

Mozliwosc definiowanianowych znaczników.

Ta sama nazwa znacznikamoze miec rózne znaczenie wróznych zastosowaniach, np.kod – kod zródłowyprogramu, kod pocztowy.

Mozna przypisac dowolnywyglad do okreslonychznaczników (jesli w ogólepotrzeba).

Poprawnosc scisle okreslonaprzez standard.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 33 / 35

Page 43: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML XML

XML – uproszczenie SGML

Kazdy poprawny strukturalnie dokument XML jest tezdokumentem SGML.Uproszczenie składni i uproszczenie procesu parsowania.Nie sa dopuszczalne pewne konstrukcje ułatwiajace recznetworzenie dokumentów w SGML.Ten sam dokument zapisany w składni XML moze zajmowacwiecej miejsca niz w składni SGML.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 34 / 35

Page 44: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML XML

Dwie twarze XML

Dokumenty, publikacje...

Pierwotne zastosowanieSGML.

Człowiek tworzy i czytadokument.

Typowy mieszany modelzawartosci z wieloma opcjami.

Dokumenty przechowywaneprzez dłuzszy czas.

Elektroniczna wymiana danych

Nowe zastosowanie XML.

Dokumenty przetwarzaneautomatycznie.

Precyzyjna „bazodanowa”struktura.

Dokumenty tworzone na czaskomunikacji.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 35 / 35

Page 45: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML XML

Dwie twarze XML

Dokumenty, publikacje...

Pierwotne zastosowanieSGML.

Człowiek tworzy i czytadokument.

Typowy mieszany modelzawartosci z wieloma opcjami.

Dokumenty przechowywaneprzez dłuzszy czas.

Elektroniczna wymiana danych

Nowe zastosowanie XML.

Dokumenty przetwarzaneautomatycznie.

Precyzyjna „bazodanowa”struktura.

Dokumenty tworzone na czaskomunikacji.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 35 / 35

Page 46: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML XML

Dwie twarze XML

Dokumenty, publikacje...

Pierwotne zastosowanieSGML.

Człowiek tworzy i czytadokument.

Typowy mieszany modelzawartosci z wieloma opcjami.

Dokumenty przechowywaneprzez dłuzszy czas.

Elektroniczna wymiana danych

Nowe zastosowanie XML.

Dokumenty przetwarzaneautomatycznie.

Precyzyjna „bazodanowa”struktura.

Dokumenty tworzone na czaskomunikacji.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 35 / 35

Page 47: Historia rozwoju technik znakowania tekstu - mimuw.edu.plczarnik/zajecia/xml07/W01-historia.pdfstruktura dokumentu (rozdział, paragraf, lista), znaczenie fragmentów tekstu (definicja,

Idee SGML i XML XML

Dwie twarze XML

Dokumenty, publikacje...

Pierwotne zastosowanieSGML.

Człowiek tworzy i czytadokument.

Typowy mieszany modelzawartosci z wieloma opcjami.

Dokumenty przechowywaneprzez dłuzszy czas.

Elektroniczna wymiana danych

Nowe zastosowanie XML.

Dokumenty przetwarzaneautomatycznie.

Precyzyjna „bazodanowa”struktura.

Dokumenty tworzone na czaskomunikacji.

Patryk Czarnik (MIMUW) 01 – Historia XML 2007/08 35 / 35