![]() |
![]() |
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Suchmaschinen im NetzEinführungWie schon im vorhergehenden Abschnitt festgestellt, gibt es neben Katalogen Suchmaschinen (engl.: search engines) als Mittel zur Informationsfindung im im World Wide Web. Suchmaschinen haben eine grundsätzlich andere Herangehensweise im Vergleich zu Katalogen. Informationen und Links werden nicht individuell ausgesucht und bereitgestellt, sondern sie halten eine theoretisch unbegrenzte Menge an Links vor, die anhand von Schlagwörtern individuell durchsucht werden können. Diese Abfrage geschieht über ein Formular auf der Homepage der jeweiligen Suchmaschine.
Wie aus dem Schema hervorgeht erhält die Suchmaschine ihre Daten von so genannten Robots. Dabei handelt es sich um Agentenprogramme der jeweiligen Suchmaschine, die das WWW durchsuchen und die so gewonnen Informationen an die Suchmaschine weitergeben. Robots verstehen die besuchten Texte nicht, sondern gewichten Dokumente nach Worthäufigkeiten (Indizierung) sowie einigen anderen Kriterien, die das jeweilige Geheimnis der Suchmaschine ausmachen. Daraus wird innerhalb der Suchmaschine ein Index generiert, auf den der Benutzer dann über ein Formular zugreifen kann. Wann benutze ich Suchmaschinen?Folgende Eignungskriterien für Suchmaschinen werden vom KMMT und dem RRZN referiert:
SuchstrategieWie ungezielt und ungeübt und damit ineffizient die meisten ihre Suche in einer Suchmaschine gestalten kann man sogar bei Fireball Live beobachten. Häufigstes Problem ist die große Anzahl an Treffern durch zu ungenaue Abgrenzung der Suchbegriffe. Aus diesem Grund ist es sich zu Beginn eine Suchstrategie zu überlegen. Welche Suchmaschinen benutze ich? (Metasuche mit anschließender Auswahl einer oder mehrerer Suchmaschinen) Welche Schlüsselwörter sind die richtigen (und in welcher Verknüpfung)? Beginne mit zwei bis drei Schlagworten Ziehe gegebenenfalls Synonyme heran Verwende gegebenenfalls die englischen Begriffe Berücksichtige auch Begriffe aus den dem Thema inhaltlich benachbarten Bereichen Muss ich bestimmte Wörter explizit ausschließen? Welcher Zeitraum ist relevant? Wie viele Treffer möchte ich mir anschauen? Benötige ich eine spezielle Sortierung? Leistung der SuchmaschinenVon vorne herein muss man feststellen, dass Suchmaschinen nur Inhalte auf statischen Seiten finden können. Damit sind sämtliche Datenbanken sowie dynamische Webseiten, die aus Datenbanken generiert werden, von vorne herein von der Suche ausgeschlossen. Die schon mal angesprochenen Studie von BrightPlanet sowie ähnliche Untersuchungen von OCLC gehen davon aus, dass dieser unerfasste Teil der weitaus größere Teil der 7500 Terrybyte Daten des WWW darstellt. Im diesem Zusammenhang redet man heute schon vom "deep web" oder "invisible web". Zudem haben verschieden Untersuchungen ergeben, dass Suchmaschinen nur einen geringen Teil des statischen Webs abdecken. In einer Untersuchung des NEC vom April 1998 lag die Suchmaschine HotBot mit 34% an der Spitze. Neuere Untersuchungen gehen davon aus, dass sich angesichts des rasanten Wachstums des Webs innerhalb der letzten Jahre noch verschlechtert haben. Zwar geht Google, zur Zeit Marktführer davon aus, das sie selbst ungefähr 2 Mrd. Seiten indiziert haben. Interessant ist in diesem Zusammenhang auch die Untersuchung der NPD über die Benutzerzufriedenheit von Suchmaschinen sowie zwei Test der Stiftung Warentest im Jahr 2000 (bei Heise) und 2001 (bei ZDnet). Einen guten Überblick bietet die Seite Suchdienste auf der Homepage der Universität Mannheim. Liste erwähnenswerter (internationaler) Suchmaschinen: Altavista - http://www.altavista.com HotBot - http://www.hotbot.com NorthernLight - http://www.nlsearch.com Google - http://www.google.com Liste erwähnenswerter (auf deutschsprachige Inhalte spezialisierte) Suchmaschinen: Fireball - http://www.fireball.de Crawler.de - http://www.crawler.de Alle vorgestellten Suchmaschinen arbeiten mit leicht abweichenden Formen der Booleschen Operatoren sowie weiteren Sondermöglichkeiten. Da es zu umfangreich wäre diese alle darzustellen werden hier im folgenden nur die zwei deutschen Versionen der großen Suchmaschinen Google und AltaVista vorgestellt. MetasuchmaschinenUm die Problematik der unzureichenden Abdeckung zu lösen, kam man schon recht früh dazu so genannte Metasuchmaschinen zu bilden. Kennzeichnend für diese Suchmaschinen ist, dass sie mit einer Anfrage mehre Suchmaschinen abfragen und die Ergebnisse aufbereiten. Dadurch soll eine höhere Abdeckung erzielt werden. Der Nachteil ist, dass durch das parallele ansteuern von mehreren Suchmaschinen, die Verwendung der Operatoren kaum oder gar nicht mehr möglich ist. Beispiele Highway 61 - http://www.highway61.com/ MetaCrawler - http://www.metacrawler.com/ MetaGer - http://meta.rrzn.uni-hannover.de/ Aber auch Metasuchmaschinen garantieren keine bessere Abdeckung. So haben Studien gezeigt, dass bei speziellen Anfragen Metasuchmaschinen teilweise weniger Treffer anzeigten als bei einer Suche direkt bei einer Suchmaschine. Neueste EntwicklungenEinen neuen Ansatz diese Problematik zu lösen stellt das Open Source
Projekt GRUB dar. Hierbei
soll, ähnlich wie bei SETI@home die ungenutzte Rechen- und Onlinezeit
freiwilliger Privatanwender genutzt werden. Inwieweit dieser Versuch Erfolg
hat wird sich noch beweisen müssen. So kann man im allgemeinen feststellen, dass auch das Geschäft der Suchmaschinen ähnlichen Veränderungszyklen unterliegt wie die meisten anderen Webtechnologien. Um als Benutzer immer auf dem laufenden zu bleiben, empfiehlt sich regelmäßig einen Blick auf Suchmaschinenbeobachtung spezialisierte Webseiten wie Searchenginewatch, @-Web oder Suchfibel.de zu werfen. Abschließend ist es schwer zu sagen, dass es genau die eine Vorgehensweise bei der Nutzung von Suchmaschinen gibt. Es gilt immer wieder aufs neue auszuprobieren was einem liegt oder ob man lieber Metasuchmaschinen, normale Suchmaschinen oder spezielle themenbezogene Suchmaschinen verwendet. Jeder Nutzer muss da eine persönliche Abwägung von Aufwand und Ertrag treffen. Weiterführende Links:Bager, Jo: Weniger ist mehr. Internet Suchmaschinen richtig einsetzen, in: c't 15/98, S. 110ff. http://www.heise.de/ct/98/15/110/ Karzauninkat, Stefan: Zielfahndung. Suchmaschinen, Kataloge, Spezialisten und kommerzielle Datenbanken richtig einsetzen, in: c't 23/99, S. 172ff. http://www.heise.de/ct/99/23/172/default.shtml Neth, Hansjörg: WWW-Wissen - Nachschlagen im Netz, in: c't 01/00, S. 84ff. http://www.heise.de/ct/00/01/084/default.shtml Sander-Beuermann, Wolfgang: Schatzsucher. Die Internet-Suchmaschinen der Zukunft, in: c't 13/98, S. 178ff. http://www.heise.de/ct/98/13/178/ Weiterführende Literatur:Regionales Rechenzentrum für Niedersachsen / Universität Hannover (RRZN): Suchen & Finden im Internet oder: "Die Nadel im Heuhaufen", Hannover, 1998, S. 7 - 18 und 25 - 90. Schüler, Peter: Schatzsucher. Aus den Tiefen des Web, in: c't 9/2002, S. 174ff.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||