www.wikidata.de-de.nina.az
YaCy von Yet another Cyberspace homophon zu englisch ya see ist eine Suchmaschine die nach dem Peer to Peer Prinzip kurz P2P arbeitet Dabei gibt es keinen zentralen Server sondern alle Teilnehmer sind gleichwertig YaCyBasisdatenEntwickler Michael Christen 1 Erscheinungsjahr 2004Aktuelle Version 1 924 2 9 Februar 2021 Betriebssystem Linux Windows und macOS Java Programmiersprache Java 3 Kategorie Suchmaschine ProxyLizenz GPL Freie Software deutschsprachig jawww yacy net deDurch die Installation von YaCy wird ein lokaler YaCy Proxy bereitgestellt Alle uber diesen Proxy abgerufenen Webseiten sowie durch mitgelieferte Plugins auch andere Daten werden lokal indexiert und konnen durch den Nutzer mittels des YaCy Webinterface durchsucht werden Dieser Index wird nun optional redundant auf anderen Peers des globalen YaCy Netzwerkes verteilt so dass ein globaler Index entsteht Eine globale Suche fragt den globalen Index ab der aus den Peers besteht die gerade online sind Durch dieses dezentrale Prinzip ist YaCy resistent gegen Ausfalle Der eigene Index und somit indirekt der globale lasst sich durch das Losschicken eines eigenen Webcrawlers erweitern Es konnen alternativ eigene YaCy basierte Netzwerke zur Bildung eines gemeinsamen Index konfiguriert werden als Beispiel sei hier das Sciencenet 4 genannt Das Projekt YaCy wurde von Michael Christen im Jahr 2003 gegrundet 5 Inhaltsverzeichnis 1 Vorteile und Nachteile 1 1 Vorteile 1 2 Nachteile 2 Das Programm 3 Weitere Funktionen 4 Technik 4 1 Indexverteilung 4 2 Peertypen 4 3 Protokoll 4 4 Bootstrapping 5 Literatur 6 Weblinks 7 EinzelnachweiseVorteile und Nachteile BearbeitenVorteile Bearbeiten Die mit YaCy aufgebaute globale Suchmaschine ware praktisch ausfallsicher da immer ein Teil des Netzwerks erreichbar sein wird Die Internetnutzer sind durch YaCy als Suchmaschine unabhangig von Unternehmen deren Ranking das diese sich evtl bezahlen lassen und deren Zensur Die Software ist Open Source wurde unter der GNU General Public License veroffentlicht und ist kostenlos Da die Indexierung uber den Proxy am jeweiligen Client stattfindet lassen sich somit Seiten aus dem Deep Web oder nicht offentlichen Netzen z B i2p indexieren die ein Crawler einer offentlichen Suchmaschine wie z B Google nicht erschliessen kann YaCy ist nicht zwingend an die Teilnahme am offentlichen YaCy Cluster gebunden und kann so z B als Suchmaschine in privaten Netzen z B Unternehmen Intranet oder als private Suchmaschine uber besuchte und damit indexierte Seiten genutzt werden Nachteile Bearbeiten Da YaCy fur eine Suchanfrage andere Peers kontaktieren und Suchergebnisse zum Vermeiden von Spam durch Nachladen der Trefferseite verifizieren muss dauert die Suche langer als bei herkommlichen Suchmaschinen Sind nur wenige Peers vorhanden konnen weniger Ergebnisse gefunden werden als bei grossen Suchmaschinen Auch kann es durch den Ausfall oder die Abschaltung einzelner grosser Peers zu weiteren Beeintrachtigungen kommen Mit Freigabe der Version 1 0 Ende November 2011 stieg jedoch durch den steigenden Bekanntheitsgrad die Anzahl der Peers auf ca 1000 so dass dieser Nachteil aktuell vernachlassigt werden kann Das YaCy Protokoll funktioniert uber einzelne HTTP Requests wodurch es eine hohere Latenz aufweist als UDP oder TCP mit dauerhaften Verbindungen Die Suchanfragen werden im durchsuchten Peer zwecks Caching ausschliesslich temporar im RAM gespeichert Die verwendete Hashfunktion fur die Codierung der Suchworter dient vorrangig der Ansteuerung der verteilten Hashtabelle DHT und Suchworter konnen mit einem Worterbuch teilweise aufgedeckt werden um die Suchanfragen im Klartext zu zeigen Die Daten werden nicht verschlusselt gespeichert oder ubertragen Theoretisch konnten Spammer eigene Peers betreiben die Spam als Ergebnis zuruckliefern Falsche Suchergebnisse werden aber dadurch nicht moglich da ein Peer durch Nachladen der Ergebnisseiten vor der Anzeige die Treffer verifiziert Das Programm BearbeitenDas Herzstuck der Suchmaschine ist anders als bei anderen Suchmaschinen nicht eine zentrale Seite sondern ein Computerprogramm das auf fast allen Betriebssystemen lauft Die Suche verlauft uber eine lokale Webseite die vom installierten Programm ausgeliefert wird Die Anzeige der Ergebnisse erfolgt hier wie gewohnt als HTML Seite Gekoppelt mit dem P2P System lauft ein optional verwendbarer Proxyserver der automatisch die besuchten Seiten indiziert Dies findet nicht bei Seiten statt denen via GET oder POST weitere Daten ubergeben werden oder die Cookies oder HTTP Authentifizierung verwenden z B Seiten in einem Login Bereich 6 Somit ist sichergestellt dass auch wirklich nur offentlich zugangliche Daten indiziert werden Weitere Funktionen BearbeitenYaCy bietet allen Nutzern der Proxyfunktion die Moglichkeit Peers uber die Domain PEERNAME yacy bzw PEERHASH yacy zu erreichen Unter www PEERNAME yacy kann der Nutzer eine Homepage hinterlegen unter share PEERNAME yacy liegt ein Fileshare und unter PEERNAME yacy ist die normale Schnittstelle erreichbar Weitere Subdomains kann der Benutzer selber anlegen indem er einen Ordner mit dem Subdomain Namen erstellt Es handelt sich also um eine Art dynamisches DNS Unabhangig von der yacy Domain bietet YaCy Platz fur eine Homepage und einen Fileshare den man mit der aktuellen IP oder einem dynamischen DNS Namen verlinken kann auch fur Nutzer die YaCy nicht verwenden YaCy hat eine eingebaute Nachrichtenfunktion mit der man Textnachrichten mit Wikicode zur Formatierung und je nach Einstellung des Empfangers auch Dateien versenden kann YaCy hat ein Wiki und einen Blog integriert Es gibt eine Lesezeichenverwaltung in dem offentlich einsehbare und private Lesezeichen angelegt werden konnen Es gibt die Moglichkeit fur einzelne Bereiche definierte Blacklists anzulegen Es existiert ein OpenSearch Interface Jeder Peer stellt diesen unter http lt peer address gt lt peer port gt opensearchdescription xml zur Verfugung beispielsweise http search yacy net opensearchdescription xmlTechnik BearbeitenDas Programm basiert auf einem Webserver der zugleich ein Caching Proxy ist Uber den Webserver kann man auf die Benutzerschnittstelle zugreifen um zu suchen oder den eigenen Peer zu verwalten Der Proxy teilt seinen Code mit dem Crawler das heisst alle besuchten Seiten die nicht personalisiert sind werden automatisch im Index erfasst YaCy verwendet ab Version 1 04 9097 Apache Solr Weiterhin bietet das YaCy Netz eigene YaCy Domains die uber den Proxy verfugbar sind Indexverteilung Bearbeiten Anders als bei Datei Tauschborsen muss das Ergebnis bei einer P2P Suchmaschine sofort verfugbar sein Um das zu gewahrleisten nutzt YaCy eine verteilte Hashtabelle DHT von engl distributed hash table Das heisst dass alle erfassten URLs und Worter an die Peers geschickt werden deren Peerhash zum entsprechenden Wordhash oder Urlhash passt Bei einer Suche funktioniert es genau andersherum Es wird nur auf Peers gesucht die ihrem Hash nach URLs fur das Wort kennen konnen Dadurch muss nur ein Bruchteil der Peers bei der Suche kontaktiert werden um trotzdem gute Ergebnisse zu bekommen Peertypen Bearbeiten YaCy unterscheidet vier verschiedene Arten von Peers Virgin Diese Peers kann man nicht finden da ein Virgin Peer keinerlei Kontakt zum Netz hat Daher sieht man nur selber wenn der Peer Virgin ist Junior Der Peer ist hinter einer Firewall Andere konnen ihn als Junior oder potentiellen Peer sehen sie erkennen allerdings nur wann er sich das letzte Mal gemeldet hat und haben keinerlei Moglichkeiten festzustellen ob er noch online ist Senior Ein Senior kann von aussen erreicht werden und ist ein vollwertiges Mitglied des YaCy Netzes Principal Wie Senior nur wird zusatzlich eine Seedlist hochgeladen die andere Peers zum Bootstrapping benutzen konnen Protokoll Bearbeiten Das Protokoll von YaCy besteht aus Text Servlets die der eingebaute Webserver unter yacy servletname html bereitstellt Andere Peers ubermitteln via GET Parametern Daten und bekommen einen einfachen Text als Antwort das genaue Format ist bei den Servlets unterschiedlich Bootstrapping Bearbeiten Beim Bootstrapping versucht YaCy das Netz mit den anderen Peers zu finden Dazu wird zunachst nach einer Seedliste gesucht In superseed txt wird zunachst die URL einer Seedliste die ein YaCy Peer regelmassig hochladt ausgesucht und diese dann heruntergeladen In der seeds txt stehen die Referenzen anderer Peers sodass Kontakt zum YaCy Netz aufgenommen werden kann Beim nachsten Start kann aus den bekannten Seeds gebootstrapt werden und die Seedlisten sind nur notig wenn viele Referenzen nicht mehr gultig sind Literatur BearbeitenPeter Schuler Web Erkundung per PC Eigener Webindex mit YaCy In c t Nr 21 September 2008 ISSN 0724 8679 S 180 185 M Christen Peer to Peer Eigenes Suchportal mit Yacy einrichten In iX 02 2008 S 102 ff M Schlenker Gemeinsam gegen Google In OpenSource 01 2007 November 2006 S 94 97 J Bager Europaische Gegenstromung Memento vom 13 Juni 2006 im Internet Archive In c t 2006 10 2 Mai 2006 S 172 174 R Sietmann Wider die Monokultur P2P Strategien gegen die Suchmaschinen Monopolisierung Memento vom 24 Juli 2005 im Internet Archive In c t 2005 16 25 Juli 2005 S 52 53 M Schwarze Jedermanns Suchmaschine In HAZ yacy net PDF 775 kB Michael Christen YaCy Peer to Peer Web Suchmaschine in Die Datenschleuder 86 2005 S 54 57 gesamtes Heft PDF 1 7 MB Weblinks BearbeitenProjektseite weiterer YaCy BlogEinzelnachweise Bearbeiten yacy net yacy net abgerufen am 11 April 2023 The yacy Open Source Project on Open Hub Languages Page In Open Hub abgerufen am 18 Oktober 2018 sciencenet kit edu Memento des Originals vom 5 Januar 2011 im Internet Archive nbsp Info Der Archivlink wurde automatisch eingesetzt und noch nicht gepruft Bitte prufe Original und Archivlink gemass Anleitung und entferne dann diesen Hinweis 1 2 Vorlage Webachiv IABot sciencenet kit edu heise de yacy websearch net Abgerufen von https de wikipedia org w index php title YaCy amp oldid 239037600