linkspam: erkennung und unterdrückung

Link- Spam Erkennung und Unterdrückung Florian Holzhauer [email protected]

Upload: florian-holzhauer

Post on 29-Nov-2014

388 views

Category:

Technology

1 download

Report

Download

Embed Size (px):

DESCRIPTION

12. 02. 2007: Linkspam: Erkennung und Unterdrückung – Seminar “Maschinelles Lernen“, Arbeitsgruppe Wissensmanagement, HU Berlin

TRANSCRIPT

Link- SpamErkennung und Unterdrückung

Florian [email protected]

Spam?

„Kommerziell motivierter Datenmüll“Mail, Telefon, Post, Web, ..Hier: Linkspam

Ziel: Suchmaschinenranking verbessernMaschinenoptimiert

Page 3: Linkspam: Erkennung und Unterdrückung

Warum Linkspam?

Gutes Suchranking = $$$Höhere BesucherzahlenPopulärer als die Konkurrenz

Viele Links auf beworbene SeitePageRankHITS

Zusätzlich „Queryoptimierung“

Page 4: Linkspam: Erkennung und Unterdrückung

PageRank

„Google-Algorithmus“Oft Verlinkt = Hoher PageRank

PageRank der verlinkenden Seiten wichtigd = Damping factor (meist 0.85)

Page 5: Linkspam: Erkennung und Unterdrückung

HITS

Hub-Rank, Authority-RankRekursiv

Page 6: Linkspam: Erkennung und Unterdrückung

Wie Spam?

Häufig verlinktVerlinkt durch hoch bewertete SeitenSpamseite selbst will nicht unbedingt

hoch bewertet werdenAutomatisiert

Selten manuelle Ansätze

Page 7: Linkspam: Erkennung und Unterdrückung

Blogspam

TrackbacksKommentareCaptchas/ RechenaufgabenAuch Wikis, Gästebücher, Foren

Page 8: Linkspam: Erkennung und Unterdrückung

Linkfarm

Automatisch generiertGegenseitig verlinktDynamische Inhalte

Erkennung

Soziale Probleme, technische LösungNeuer Algorithmus -> neuer SpamFalse PositivesDefinition?

Quantitative Eigenschaften

Domain/URLWorthäufigkeitenSeiteneigenschaften

MetatagsServereigenschaften „nearby duplicates“Änderungsfrequenz

Page 11: Linkspam: Erkennung und Unterdrückung

Sprachmodell

Sprachliche UnterschiedeBlogspamBlogbeitragKommentareVerlinkte Seiten

Kullback Leibler Divergenz„Wahrscheinlichkeitsunterschiede“

Page 12: Linkspam: Erkennung und Unterdrückung

SVM

Support Vector MachineTrainierbarer SeparationsalgorithmusGruppiert in zwei Teile

Nicht linear separierbar: „Möglichst“ gut

Page 13: Linkspam: Erkennung und Unterdrückung

Graphen

Links = Gerichteter GraphVerlinkungsanomalienGood CoreKombinierbar

Page 14: Linkspam: Erkennung und Unterdrückung

Good Core

Manuell erstelltKleinUnzuverlässigSubjektivTeuer

Page 15: Linkspam: Erkennung und Unterdrückung

TrustRank

Good Core Enfernung = Score 1*β

Dämpfungsfaktor(1/Linkzahl)*β

Basiert auf „gewollten Links“? Veraltete LinksSpam!

Page 16: Linkspam: Erkennung und Unterdrückung

BadRank

„Umgedrehter Pagerank“E(A) durch Spamfilter

Nicht unbedingt nötig

Page 17: Linkspam: Erkennung und Unterdrückung

ParentPenalty

Schnittmenge eingehender undAusgehender Links einer DomainGross = Vermutlich SpamMatrix (A) = 1 wenn Anzahl > Treshold, sonst 0

Page 18: Linkspam: Erkennung und Unterdrückung

ParentPenalty

Iterieren durch AAnzahl eingehender Seiten mit An=1

> Treshold? -> An=1Mehrfache IterationProblem: Treshold-Wahl?

Page 19: Linkspam: Erkennung und Unterdrückung

Ausblick

Idee: Kein absoluter Pagerank?Unterschiedliche Benutzer wollen

unterschiedliche SeitenTechnischer WettkampfSemantic Web?

SPEZIFISCHE ERKENNUNG VON KONTAMINATIONENSPEZIFISCHE ERKENNUNG VON KONTAMINATIONEN Die Online-Überwachung der Trinkwasserqualität stellt hohe Anforderungen an die Messsysteme und

comstop - ortung und Unterdrückung von Mobilfunktelefonen und … · 2016-01-15 · Ortung und Unterdrückung von Mobiltelefonen und anderen Funkdiensten-2-Unser Konzept : comstop®

Intrusion Detection - TU Braunschweig · Intrusion Detection Systeme dienen der Erkennung von Angriffen und System-Missbrauch

Gegen Unterdrückung im Namen der Ehre. Für ......Wir sind junge Männer, die keine Ausnahme der Gesellschaft sind. ... die Erfahrungen mit Ehre, Unterdrückung und Ausgrenzung haben,

Unterdrückung und Verfolgung individueller und freier ... · Unterdrückung und Verfolgung individueller und freier Unterrichtsformen Wie ein altes deutsches Schulsystem bis heute

Merkmale zur Erkennung von Chara, – Lamprothamium, – Lychnothamnus und Nitellopsisarten über Oosporen aus Sedimenten oder von Pflanzen

Automatische Erzeugung und Bewertung virtueller Duplexsysteme zur Erkennung von Betriebsfehlern in Mikroprozessoren Markus Jochim

2.10.20051 Erkennung von Produktionsfehlern und akustikrelevante Bewertung Rotas-TorAcc: Einflankenwälzprüfung mit Drehbeschleunigungsmessung

Vorlesung: Motivation und Emotion Angst. Vorlesung: Motivation und Emotion Freuds Frühe Angsttheorie (1895) Sexueller Impuls Unterdrückung (Blockierung)

1 Manuelle Segmentierung von Sprachkorpora: das Phon und die akustische Realität Transkription in Sprachsynthese und -erkennung Hauptseminar im Sommersemester

Enantioselektive Erkennung von Kationen und ... · Enantioselektive Erkennung von Kationen und Monosacchariden mit synthetischen Cyclopeptiden aus Prolin und 3-Aminobenzoesäurederivaten

Verhaltens-basierte Computerwurm-Erkennung

Erkennung von Nichtlinearit¨aten und wechselseitigen Abh ...webdoc.sub.gwdg.de/ebook/rd/2002/schmitz/schmitz.pdf · 6.28 Transfer–Entropie T zwischen SOI und TADI . . . . . .

Entwicklungsstand humanoider Roboter und potentielle ... · Innovationskongress IGES Institut 14 23.10.2008, Berlin Objekterkennung und -lageschätzung •Erkennung einfarbiger Objekte

(Muster-)Kursbuch Sportmedizin€¦ · sowie der Vorbeugung, Erkennung, Behandlung und Rehabilitation von Sportverletzungen und Sportschäden. Dabei bündelt die Sportmedizin das

Lymphatisches System - Startseite · 2015-04-21 · (Thymozyten) eine positive und negative Selektion (Prägung) durch. Positive Selektion auf HLA- Erkennung (MHC- Erkennung) Die

Erkennung von Produktionsfehlern und akustikrelevante Bewertung

Hinweise zu Erkennung, Diagnostik und Therapie von

Weitere Von der Ausstellungseröffnung Veranstaltungen ......Rassismus und Unterdrückung im Alltag zu erkennen – und entschlos-sen entgegenzutreten. Gleichzeitig wird die historische

Version 2.0 Robust, benutzerfreundlich, erschwinglich: Ihr ... … · Ihr System › Technik und Details ... Anatomie, Pathologie, Hämatologie und Zoologie zur Erkennung von typischen

Erkennung und Klassifizierung von Verkehrszeichen€¦ · 4 Rahmen des Referates Übersicht über Verfahren zur Detektion und Klassifizierung Echtzeit-Aspekte berücksichtigen Tracking

Das historische Kulturerbe der Hugenotten und Waldenser im ...€¦ · Das historische Kulturerbe der Hugenotten und Waldenser 2 J. Lips Refuge Nordhessen Die Unterdrückung der Reformierten

DYSKALKULIEFORSCHUNG 2000-2008 Herzlich willkommen! Rechenschwäche/Dyskalkulie Wahrnehmungen, Fakten und Diagnostik Ausgangspunkt: Frühzeitige Erkennung

Verfahren zum Refactoring und zur Erkennung von ... · Ansätze für objektorientierte Programmiersprachen wie Java und C# und für funktionale Programmiersprachen wie Haskell und

Der Missionsbefehl & Selbst-Unterdrückung

Möglichkeiten und Grenzen bei der Erkennung und ......77% der antwortenden Verkaufsstellen verkaufen Swiss Lotto und Euro Millions, Lose und Sportwetten. 17% bieten zusätzlich das

Faserunabhängiges Dispersionsmanagement zur Unterdrückung ... · Faserunabhängiges Dispersionsmanagement zur Unterdrückung von SPM und XPM in 10 Gb/s NRZ-modulierten WDM-Übertragungssystemen

Diagnostik Systeme - bluemedic.de · Kariesdiagnostik und Composite-Darstellung mit einem System Schmelzriss - Erkennung Composite - Darstellung Approximalkaries - Diagnose

Zwischen Erfolg und Unterdrückung: Der Aufstieg der Zivilgesellschaft im Ostseeraum 1760-1810

HS Transkription in Sprachsynthese und - erkennung Analogiebildung II Yavuz Tüzün

Erkennung des RME-Betriebes mittels eines Biodiesel ... · Sonderheft 257 Special Issue Erkennung des RME-Betriebes mittels eines Biodiesel-Kraftstoffsensors Axel Munack und Jürgen

Entwicklung einer Android-App zur Erkennung und ... · Fachbereich 4: Informatik Entwicklung einer Android-App zur Erkennung und Übersetzung von Worten in Kamerabildern Bachelorarbeit

Affiliate Fraud Erkennung

Modulare Strömungsüberwachung für den Feldeinsatz ... · Modulare Strömungsüberwachung product news Positions-sensorik und Objekt-erkennung Bus-, Identifikations-und Steuerungssysteme

Vorlesung "Intelligente Systeme" 1 0. Intelligente Systeme – Beispiele und Fähigkeiten Benötigte Technologien Analysator Erkennung Kategorisierung,