recap - bgu · 2015-06-11 · ונרביד םהילע םיאשונ)הפש הרוצ ןכות(...
TRANSCRIPT
recap
http://www.centrefordigitalhumanities.nl/files/2014/06/CrashCourseBiographyNet.pdf
?מה רוצים
איזה , dataאיזה כלים נדרשים לו כדי לעבוד על נתונים : מהצד של מדעי הרוח?dataאיך נראה ה ? שאלות יכולות להשאל
כיצד ניתן לנתח טקסטים באופן שיפיק את המידע : בלשנות חישוביתמדויק /מקיף/רלוונטי/הנכון
תצוגה של הנתונים באופן שמאפשרת לחוקרת לנתח ממצאים אבל : מדעי המחשבלא לצמצם את צורת המחשבה שלה
תיוג
סיווג
ייצוג
נושאים עליהם דיברנו
(שפה-צורה, תוכן)רמות שונות של תיוג , הצורך בתיוג
(שפה-צורה, תוכן)סיווג
תיוג חלקי דיבר ולימוד מכונה
(topic modeling)ייצוג של תוכן , (ייצוג מסמכים, ידע עולם, ידע לקסיקלי)ייצוג של ידע
חיפוש
dataשלבים בהכנת ה
..(סריקה, "הורדה", איתור מקורות)איסוף המידע -
זיהוי ותיוג הרכיבים במידע- parseניתוח -
(לפי קריטריון)הסרה או שליפה של מידע –סינון -
..הסתברויות, מציאת תבניות–" כריה"-
ייצוג ויזואלי -
עידון התצוגה, עידון הנתונים-
(הערות, בקרה, הוספה, שינוי)כלים לאינטראקציה -
חמשת הכללים–data/ נתונים
פתוח ונגיש לכולם•
; structuredמובנה •
פורמט שאינו מחויב לתוכנה•
URIשימוש ב •
•Linked RDF
•http://data.dws.informatik.uni-mannheim.de/lodcloud/2014/
•http://inkdroid.org/lod-graph/
data/ נתונים
ארכיון הקשרים: דוגמא•
?מה הבעיות•
עיתונות דיגיטלית היסטורית, פרויקט הספריה הלאומית של האפמרה: דוגמא•
?מה הבעיות•
הנחת העולם הפתוח The open world assumption
.לא קיים, אם לא נמצא–בבסיסי נתונים
Linked data-ניתן להוסיף או ניתן להקיש, המידע תמיד חלקי.
תכנון סכמה חדשה
שימוש במה שקיים•
התאמה למידע של אחרים•
מבנה לוגי•
•Self explained (as much as possible)
(לאורך זמן)יציבות והתקיימות •
מאפשר קישור וחיבור של משאבים•
named entity recognitionזיהוי שמות פרטיים
'שונות'מוסדות ו, מקומות, זיהוי שמות אנשים
איך עושים סגמנטציה
http://nlp.stanford.edu/software/CRF-NER.shtml
זיהוי תאריכים
זיהוי ביטויי זמן •
( 7/5/2014== 5.7.2014== 2014ביולי 5)' נירמול'•
תאריכים עבריים •
Word sense disambiguation
Semantic role labeling
http://sappingattention.blogspot.co.il/2012/11/reading-digital-sources-case-study-in.html
http://sappingattention.blogspot.de/2012/11/when-you-have-mallet-everything-looks.html