|
Inhalt |
6 |
|
|
Vorwort |
12 |
|
|
1 Suchen im Web |
14 |
|
|
1.1 Webkataloge |
16 |
|
|
1.1.1 Auswahl der Rubrik |
18 |
|
|
1.1.2 Die Titelwahl |
18 |
|
|
1.1.3 Vorsicht beim Beschreibungstext |
20 |
|
|
1.1.4 Stichwörter mit Sorgfalt wählen |
21 |
|
|
1.1.5 Häufige Fehler |
21 |
|
|
1.1.6 Submit- Tools |
21 |
|
|
1.2 Suchmaschinen |
22 |
|
|
1.2.1 User-Interface |
23 |
|
|
1.2.2 Hürden |
24 |
|
|
1.2.3 Funktionen und Komponenten |
25 |
|
|
1.3 Metasuchmaschinen |
27 |
|
|
1.3.1 Formale Kriterien |
28 |
|
|
1.3.2 Einsatzgebiet |
29 |
|
|
1.3.3 Operatoren |
30 |
|
|
1.3.4 Präsentation der Suchergebnisse |
30 |
|
|
2 Die Anatomie des World Wide Web |
34 |
|
|
2.1 Exkurs in HTML |
35 |
|
|
2.1.1 HTML-Dokumentstruktur |
36 |
|
|
2.1.2 Tags |
37 |
|
|
2.1.3 Meta- Tags |
39 |
|
|
2.1.4 Sonstige Meta- Tags |
46 |
|
|
2.1.5 Cascading Style Sheets |
48 |
|
|
2.2 Trägermedium Internet |
50 |
|
|
2.2.1 Das Client-Server-Prinzip |
51 |
|
|
2.2.2 TCP/IP |
53 |
|
|
2.2.3 Adressierung der Hosts |
54 |
|
|
2.2.4 Funktion und Aufbau eines URL |
54 |
|
|
2.3 HTTP |
56 |
|
|
2.3.1 Request |
59 |
|
|
2.3.2 Response |
62 |
|
|
2.3.3 HTTP live erleben |
64 |
|
|
3 Architektur von Suchmaschinen |
66 |
|
|
3.1 Dokumentgewinnung mit dem Webcrawler- System |
67 |
|
|
3.1.1 Dokumentenindex |
68 |
|
|
3.1.2 Scheduler |
69 |
|
|
3.1.3 Crawler |
71 |
|
|
3.1.4 Storeserver |
73 |
|
|
3.1.5 Repository |
78 |
|
|
3.2 Datenaufbereitung und Dokumentanalyse |
79 |
|
|
3.2.1 Datenaufbereitung durch den Parser |
83 |
|
|
3.2.2 Datennormalisierung |
85 |
|
|
3.2.3 Wortidentifikation durch den Tokenizer |
86 |
|
|
3.2.4 Identifikation der natürlichen Sprache |
88 |
|
|
3.2.5 Grundformreduzierung durch Word Stemming |
91 |
|
|
3.2.6 Mehrwortgruppenidentifikation |
95 |
|
|
3.2.7 Stoppwörter |
96 |
|
|
3.2.8 Keyword-Extrahierung |
98 |
|
|
3.2.9 URL- Verarbeitung |
102 |
|
|
3.3 Datenstruktur |
102 |
|
|
3.3.1 Hitlist |
103 |
|
|
3.3.2 Direkter Index |
106 |
|
|
3.3.3 Invertierter Index |
108 |
|
|
3.3.4 Verteilte Datenstruktur |
109 |
|
|
4 Gewichtung und Relevanz |
112 |
|
|
4.1 Statistische Modelle |
114 |
|
|
4.1.1 Boolesches Retrieval |
114 |
|
|
4.1.2 Fuzzy-Logik |
115 |
|
|
4.1.3 Vektorraummodell |
116 |
|
|
4.1.4 Relative Worthäufigkeit ( TF) |
119 |
|
|
4.1.5 Inverse Dokumenthäufigkeit (IDF) |
120 |
|
|
4.1.6 Bedeutung der Lage und Auszeichnung eines Terms |
121 |
|
|
4.1.7 Betrachtung des URL |
122 |
|
|
4.2 Page-Rank |
122 |
|
|
4.2.1 Link-Popularity |
123 |
|
|
4.2.2 Das Page-Rank-Konzept und der Random Surfer |
124 |
|
|
4.2.3 Page-Rank-Formel |
125 |
|
|
4.2.4 Ein Beispiel zur Page-Rank-Berechnung |
126 |
|
|
4.2.5 Effekte des Page-Rank |
128 |
|
|
4.2.6 Der intelligente Surfer und weitere Einflussfaktoren |
130 |
|
|
4.2.7 Bad-Rank |
132 |
|
|
4.3 Click-Popularity |
134 |
|
|
4.4 Cluster- Verfahren |
137 |
|
|
4.4.1 Cluster- Verfahren im Einsatz |
138 |
|
|
4.4.2 Vivisimo – ein Pionier |
139 |
|
|
4.4.3 Single-Pass-Methode |
140 |
|
|
5 Suchprozess |
142 |
|
|
5.1 Arbeitsschritte des Query-Prozessors |
143 |
|
|
5.1.1 Tokenizing |
143 |
|
|
5.1.2 Parsing |
143 |
|
|
5.1.3 Stoppwörter und Stemming |
144 |
|
|
5.1.4 Erzeugung der Query |
144 |
|
|
5.1.5 Verwendung eines Thesaurus |
145 |
|
|
5.1.6 Matching und Gewichtung |
145 |
|
|
5.1.7 Darstellung der Trefferliste |
146 |
|
|
5.2 Suchoperatoren |
147 |
|
|
5.2.1 Boolesche Ausdrücke |
147 |
|
|
5.2.2 Phrasen |
149 |
|
|
5.2.3 Wortabstand |
149 |
|
|
5.2.4 Trunkierung |
150 |
|
|
5.3 Erweiterte Suchmöglichkeiten |
150 |
|
|
5.3.1 Sprachfilter |
152 |
|
|
5.3.2 Positionierung |
153 |
|
|
5.3.3 Aktualität |
153 |
|
|
5.3.4 Domainfilter |
153 |
|
|
5.3.5 Dateityp |
154 |
|
|
5.3.6 Sonstige Suchmöglichkeiten |
154 |
|
|
5.4 Nutzerverhalten im Web |
155 |
|
|
5.4.1 Suchaktivitäten |
156 |
|
|
5.4.2 Suchmodi |
158 |
|
|
5.4.3 Welche Suchmaschine wird genutzt? |
160 |
|
|
5.4.4 Was wird gesucht? |
163 |
|
|
6 Onpage-Optimierung |
168 |
|
|
6.1 Entwicklung eines Konzepts als erster Schritt |
169 |
|
|
6.1.1 Zielgruppe und Zielsetzung |
170 |
|
|
6.1.2 Durchführung |
171 |
|
|
6.1.3 Spezielle Situation bei einem Relaunch |
171 |
|
|
6.2 Strukturelle Vorbereitungen |
173 |
|
|
6.2.1 Gültiges HTML |
173 |
|
|
6.2.2 Einsatz von CSS |
176 |
|
|
6.2.3 Seitenstruktur |
177 |
|
|
6.2.4 Navigation |
181 |
|
|
6.2.5 Frames |
183 |
|
|
6.2.6 Die Startseite |
190 |
|
|
6.2.7 Dateityp und dynamische Seiten |
192 |
|
|
6.3 Schlüsselwort- Strategien |
197 |
|
|
6.3.1 Erstes Brainstorming |
200 |
|
|
6.3.2 Logbücher nutzen |
201 |
|
|
6.3.3 Mitbewerber analysieren |
201 |
|
|
6.3.4 Das Umfeld: Freunde, Kollegen und Bekannte |
203 |
|
|
6.3.5 IDF überprüfen |
204 |
|
|
6.3.6 Erste Bereinigung |
205 |
|
|
6.3.7 Liste erweitern |
206 |
|
|
6.3.8 Eigenschaften der Schlüsselwörter |
209 |
|
|
6.3.9 Falsche orthografische Schreibweise |
211 |
|
|
6.3.10 Getrennt oder zusammen? |
212 |
|
|
6.3.11 Wortkombinationen und Wortnähe |
213 |
|
|
6.3.12 Liste bereinigen |
215 |
|
|
6.3.13 Finale Auswahl |
216 |
|
|
6.4 Optimierung durch Tags |
217 |
|
|
6.4.1 Title |
217 |
|
|
6.4.2 Fließtext und die Keyword-Dichte |
220 |
|
|
6.4.3 Aufzählungen |
223 |
|
|
6.4.4 Texthervorhebungen |
224 |
|
|
6.4.5 Überschriften |
226 |
|
|
6.4.6 Links und Anchor- Text |
227 |
|
|
6.4.7 Tabellen |
230 |
|
|
6.4.8 Bilder und Image-Maps |
232 |
|
|
6.4.9 Phantom-Pixel |
233 |
|
|
6.4.10 Comment |
234 |
|
|
6.4.11 Form und Input |
235 |
|
|
6.4.12 Noscript |
235 |
|
|
6.4.13 Iframe |
236 |
|
|
6.5 PDF-Dokumente optimieren |
238 |
|
|
7 Offpage-Optimierung |
240 |
|
|
7.1 Webserver und Restriktionen |
240 |
|
|
7.1.1 Webhosting |
240 |
|
|
7.1.2 Restriktionen |
242 |
|
|
7.2 Domainname und Verzeichnisse |
243 |
|
|
7.2.1 Domainname |
243 |
|
|
7.2.2 Verzeichnis- und Dateinamen |
245 |
|
|
7.2.3 Verzeichnistiefe und Aktualität |
247 |
|
|
7.3 Sitestruktur |
250 |
|
|
7.3.1 Redirects korrekt umsetzen |
251 |
|
|
7.3.2 Deep Web |
253 |
|
|
7.3.3 Seiten ausschließen (robots.txt) |
256 |
|
|
7.4 Link-Popularity erhöhen |
258 |
|
|
7.4.1 Interne Verlinkung optimieren |
259 |
|
|
7.4.2 Das KAKADU-Prinzip |
259 |
|
|
7.4.3 Qualitätskriterien potenzieller Linkpartner |
261 |
|
|
7.4.4 An andere Webautoren herantreten |
262 |
|
|
7.4.5 Eingehende Links erzielen |
263 |
|
|
7.4.6 Link-Farmen und Google-Bomben |
266 |
|
|
7.5 Click-Popularity erhöhen |
267 |
|
|
8 Spam |
270 |
|
|
8.1 Keyword- Stuffing |
271 |
|
|
8.2 Unsichtbare und kleine Texte |
273 |
|
|
8.3 Hidden-Links |
279 |
|
|
8.4 Meta- Spam |
280 |
|
|
8.5 Doorway-Pages |
281 |
|
|
8.6 Cloaking |
284 |
|
|
8.7 Bait-And- Switch |
286 |
|
|
8.8 Domain-Dubletten |
287 |
|
|
8.9 Page- Jacking |
289 |
|
|
8.10 Sonstige Spammethoden |
290 |
|
|
9 Aufnahme in die Suchmaschine |
292 |
|
|
9.1 Suchmaschinen-Kooperationen |
292 |
|
|
9.2 Die Anmeldung |
294 |
|
|
9.2.1 Manuelle Anmeldung |
296 |
|
|
9.2.2 Automatische Anmeldung |
299 |
|
|
9.2.3 Aufnahmedauer |
300 |
|
|
9.3 Kostenpflichtige Leistungen |
302 |
|
|
9.3.1 Payed-Inclusion-Programme |
303 |
|
|
9.3.2 Pay-Per-Click (PPC) |
305 |
|
|
10 Monitoring und Controlling |
310 |
|
|
10.1 Server-Monitoring |
311 |
|
|
10.2 Logfile-Analyse |
314 |
|
|
10.2.1 Anfragen pro Tag und Monat |
316 |
|
|
10.2.2 Herkunftsland der Besucher |
318 |
|
|
10.2.3 Seitenbesuche |
318 |
|
|
10.2.4 Herkunft der Besucher |
319 |
|
|
10.2.5 Besuche über Suchmaschinen |
320 |
|
|
10.2.6 Suchbegriffe |
321 |
|
|
10.2.7 Sonstige Informationen |
322 |
|
|
10.3 Rank-Monitoring |
323 |
|
|
A Literaturverzeichnis |
326 |
|
|
B Quellen |
328 |
|
|
C Abbildungsverzeichnis |
332 |
|
|
Index |
334 |
|