Kilobyte: Das Ubuntu Handbuch mit Anleitungen

Freie Suchmaschine - YaCy im Test

Ist Ih­nen ei­gent­lich be­wusst, wie ab­hän­gig wir In­ter­net­be­nut­zer von Such­ma­schi­nen sind? Klar, wer sich nur via Ap­pli­ka­ti­on auf Face­book, You­Tube und Twit­ter be­wegt, der muss sich erst ein­mal über an­de­re Din­ge be­wusst wer­den. Für alle an­de­ren Be­nut­zer, vor al­lem die­je­ni­gen, die mit dem In­ter­net ar­bei­ten und ler­nen, stel­len Such­ma­schi­nen oft­mals die ers­te An­lauf­sta­ti­on dar. Such­ma­schi­nen wie Goog­le, Bing und Ya­hoo! sind An­ge­bo­te von ge­winn­ori­en­tier­ten Un­ter­neh­men und neh­men ak­tiv Ein­fluss auf die Such­ergeb­nis­se.

Ge­ra­de Goog­le ge­rät hier im­mer wie­der in die Kri­tik. An­ge­fan­gen als Such­ma­schi­ne bie­tet das Un­ter­neh­men im Prin­zip die kom­plet­te Pa­let­te an Web-Diensten an. Ziel des Un­ter­neh­mens ist es, den Be­su­cher so lan­ge wie mög­lich auf den ei­ge­nen und be­wor­be­nen Diens­ten zu be­hal­ten.

Nor is it true to say that we are pro­mo­ting our own pro­ducts at the ex­pen­se of the com­pe­ti­ti­on. We show the re­sults at the top that ans­wer the user’s que­ries di­rect­ly (af­ter all we built Goog­le for users, not web­sites).

Schmidt, Eric: We built Goog­le for users, not web­sites. googlepolicyeurope.blogspot.be (10/2014).

Wer nicht mit den Richt­li­ni­en die­ser Such­ma­schi­nen kon­form geht, ver­liert schnell an Sicht­bar­keit, so­mit ei­nen Groß­teil sei­ner Be­su­cher und da­durch am Ende Geld. Im Fal­le des Leis­tungs­schutz­rechts ließ Goog­le die Mus­keln spie­len:

Goog­le kas­triert die Such­ergeb­nis­se von News­sei­ten, die in der VG Me­dia or­ga­ni­siert sind, dazu zäh­len Ti­tel von Axel Sprin­ger und Bur­da. Dar­un­ter die Reichweiten- und Mainstream-Bomber bild.de und bunte.de.

Mül­ler, Mi­cha­el: Goog­le setzt die LSR-Schere an. basicthinking.de (10/2014).

Auch in Sa­chen der Mo­ne­ta­ri­sie­rung ei­ner Web­sei­te, le­gen die­se Such­ma­schi­nen die Spiel­re­geln fest. Wer bei­spiels­wei­se Hy­per­links ver­kauft muss dar­auf ge­fasst sein, von Goog­le ge­sühnt zu wer­den.

In mei­nem Fall sind vom Au­gen­blick der Ab­stra­fung bis hin zur Auf­he­bung die­ser Maß­nah­me ins­ge­samt 2 Wo­chen ver­gan­gen in de­nen mein Pa­ge­rank auf Null ge­setzt wur­de.

Liedl, Tho­mas: Backlinksel­ler und die Goog­le Ab­stra­fung. nicht-spurlos.de (10/2014).

Zu­sam­men­fas­send lässt sich also sa­gen, dass die be­kann­ten Such­ma­schi­nen be­stim­men, wel­che In­for­ma­tio­nen wir Be­nut­zer im In­ter­net se­hen dür­fen und wel­che nicht. Ganz ne­ben­bei wird das Be­nut­zer­ver­hal­ten mit­hil­fe von Coo­kies auf­ge­zeich­net und aus­ge­wer­tet. Das al­les ist je­doch das gute Recht von Goog­le und Co. Schließ­lich sind das kei­ne frei­en Such­ma­schi­nen.

Freie Suchmaschinen - was ist das?

Mit der Ver­öf­fent­li­chung der NSA-Skandale sind wir In­ter­net­be­nut­zer be­wuss­ter in Sa­chen Da­ten­schutz ge­wor­den. Vie­le wol­len nicht mehr, dass ihr Be­nut­zer­ver­hal­ten ge­spei­chert wird und be­nut­zen für die Su­che al­ter­na­ti­ve Such­ma­schi­nen wie Duck­Duck­Go.

Im Ge­gen­satz zu Goog­le, wo jede Such­an­fra­ge neun Mo­na­te lang mit an­fra­gen­der Internet-Adresse ge­spei­chert wird, um dann schließ­lich nur teil­an­ony­mi­siert zu wer­den, si­chert Duck­Duck­Go schlicht nichts - we­der die an­fra­gen­de IP-Adresse noch die Such­ge­schich­te.

Schwan, Ben: Von Nul­len und Ein­sen: Duck­Duck­Go im Test. wiwo.de (10/2014).

Wer „frei” im Sin­ne von „nicht ver­folgt” ver­steht, kann Duck­Duck­Go durch­aus als freie Such­ma­schi­ne ver­ste­hen. Die Such­ergeb­nis­se wer­den je­doch größ­ten­teils von den kom­mer­zi­el­len Such­ma­schi­nen, haupt­säch­lich von Ya­hoo!, über­nom­men.

Asia­ti­sche Hoch­kul­tu­ren wie Chi­na und Nord-Korea se­hen, nicht un­be­dingt des­halb, Duck­Duck­Go als west­li­ches und ka­pi­ta­lis­ti­sches Teu­fels­zeug an und setz­ten die­se Such­ma­schi­ne ne­ben Goog­le, Ya­hoo! und Bing auf die Zen­s­ur­lis­te.

Trau­rig, aber wahr. Die Such­ma­schi­ne Duck­Duck­Go, die ih­ren Fo­kus vor al­lem auf Da­ten­schutz und Pri­vat­sphä­re des Nut­zers legt, wird in Chi­na blo­ckiert.

Piontek, Chris­to­pher: Chi­na blo­ckiert Duck­Duck­Go. bitpage.de (10/2014).

Eine freie Such­ma­schi­ne kann also nur sein, wel­che:

  1. Den In­halt des In­ter­nets voll­stän­dig wie­der­gibt.
  2. Kei­ne zen­tra­len Ser­ver­stand­or­te hat, wel­che mit­tels Re­gie­rungs­sper­ren oder von Ge­heim­diens­ten ab­ge­schnit­ten wer­den kön­nen.
  3. Nicht Mit­tel zum Zweck ist, um Geld zu ver­die­nen oder Be­nut­zer­da­ten zu er­he­ben.

Was nach Uto­pie klingt gibt es be­reits. Die freie Such­ma­schi­ne YaCy ist eine deut­sche Ent­wick­lung, ba­siert auf peer-to-peer-Technik und funk­tio­niert mit al­len Platt­for­men.

YaCy und Ubuntu

Ich tes­te­te YaCy mit Ubun­tu. Im Ge­gen­satz zu an­de­ren Such­ma­schi­nen, muss YaCy zu­nächst lo­kal in­stal­liert wer­den. Dazu habe ich mir zu­erst die Linux-Datei her­un­ter­ge­la­den.

Screenshot von OpenJDK im Ubuntu Software Center

YaCy ba­siert auf Java, des­halb in­stal­lier­te ich OpenJDK-Java über das Ubun­tu Software-Center. Für die In­stal­la­ti­on von YaCy ge­hen Sie dann wie folgt vor:

  1. Öff­nen Sie ein Terminal-Fenster.
  2. Na­vi­gie­ren Sie in den Ord­ner, in­dem sich die YaCy-Datei be­fin­det. Also zum Bei­spiel cd Downloads.
  3. Ent­pa­cken Sie die Da­tei mit tar xfz yacy_v1.8_[Versionsnummer].
  4. Na­vi­gie­ren Sie in den ent­pack­ten Ord­ner, also bei­spiels­wei­se cd Downloads/yacy.
  5. Star­ten Sie die Such­ma­schi­ne mit ./startYACY.sh.
  6. Öff­nen Sie jetzt Ih­ren Web­brow­ser und sur­fen Sie fol­gen­de Adres­sen an: localhost:8090/index.html. Es öff­net sich das YaCy-Suchmenü.

Screenshot vom YaCy Suchfenster
Ge­nau wie bei je­der an­de­ren Such­ma­schi­ne kön­nen Sie nun di­rekt mit der Su­che be­gin­nen oder Sie kli­cken rechts oben auf „Ad­mi­nis­tra­ti­on”.

Funktionsweise und Konfiguration von YaCy

Die freie Such­ma­schi­ne YaCy ist de­zen­tral, d. h. je­der Be­nut­zer ist gleich­zei­tig Su­chen­der und Such­ma­schi­ne. Da­ten­sät­ze von ge­crawl­ten Web­sei­ten wer­den un­ter den Be­nut­zern aus­ge­tauscht und lo­kal in ei­ner Da­ten­bank ge­spei­chert. Sie ha­ben des Wei­te­ren die Mög­lich­keit die glo­ba­le Da­ten­bank zu er­gän­zen, in­dem Sie ei­nen YaCy-Crawler von Ih­rem PC aus auf die Rei­se schi­cken. Ge­ben Sie ei­nen Such­be­griff ins Such­fens­ter ein, schi­cken Sie Ihre An­fra­ge zu Ih­rem nächs­ten Peer und die­ser wie­der zu sei­nem nächs­ten usw. Am Ende er­hal­ten Sie pas­sen­de Such­ergeb­nis­se zu Ih­rem Such­be­griff.

Ein sol­ches Sys­tem funk­tio­niert also nur, wenn je­der Be­nut­zer et­was in Form von Band­brei­te und Fest­plat­ten­spei­cher bei­steu­ert. Als Ers­tes soll­ten Sie also nach der In­stal­la­ti­on, die Res­sour­cen an Ih­ren PC an­pas­sen.

Screenshot von YaCy RessourcenUn­ter dem Me­nü­punkt „RAM/Disk Usa­ge & Up­dates” kön­nen Sie be­stim­men, wie viel Leis­tung Sie YaCy zur Ver­fü­gung stel­len möch­ten.

Im nächs­ten Schritt soll­ten Sie YaCy ab­schlie­ßend kon­fi­gu­rie­ren. Wich­tigs­ter An­lauf­punkt ist das Menü „An­wen­dungs­fall & Zu­gangs­da­ten”. Scrol­len Sie in die­sem Menü ganz nach un­ten, sagt Ih­nen die Soft­ware was Sie als nächs­te tun soll­ten.

Suchergebnisse und Filter

Als ich mei­nen Test vor­nahm be­fan­den sich 1,9 Mil­li­ar­den Adres­sen von Web­sei­ten im glo­ba­len In­dex. Mit dem Such­be­griff „Ubun­tu” be­kam ich in­ner­halb 1,9 Se­kun­den, 10.019 Such­ergeb­nis­se, da­von le­dig­lich 373 in deut­scher Spra­che, an­ge­zeigt. Dies ist nicht ver­wun­der­lich, sehe ich mir die Na­men der Peers an.

Screenshot von YaCy Peers
Die meis­ten Be­nut­zer von YaCy sind eng­lisch­spra­chig und neh­men des­halb größ­ten­teils eng­lisch­spra­chi­ge Web­sei­ten mit in den In­dex auf. Dies ist in­so­fern kein Pro­blem, da sich Er­geb­nis­se sehr gut mit ei­nem Klick nach An­bie­ter, Da­tei­typ, Au­tor und Spra­che fil­tern las­sen.

Deut­lich bes­ser wer­den die Such­ergeb­nis­se, wenn die­se nä­her ein­ge­grenzt wer­den. Mit der Phra­se „Leis­tungs­schutz­recht Goog­le” be­kam ich zwar nur 55 Er­geb­nis­se, die­se je­doch äu­ßerst hoch­wer­tig. Ne­ben heise.de, wa­ren es vor al­lem klei­ne Blogs die sich dem The­ma in al­ler Aus­führ­lich­keit an­nah­men und bei Goog­le kei­ne Chan­ce hät­ten. Hier be­kommt man bei glei­cher Phra­se aus­schließ­lich die gro­ßen Fi­sche á la zeit.de, spiegel.de und faz.net an­ge­zeigt.

Eine freie Such­ma­schi­ne ohne Zen­sur? Das öff­net doch Tür und Tor für Pä­do­phi­le und Tier­quä­ler! Könn­te man mei­nen, dem ist je­doch nicht so. Die Su­che „blon­de anal” brach­te im Gro­ßen und Gan­zen die glei­chen Such­ergeb­nis­se wie bei Goog­le. Ich war eben­falls so mu­tig und habe „child porn” in bei­den Such­ma­schi­nen ge­tes­tet. So­wohl bei Goog­le, als auch bei YaCy kom­men aus­schließ­lich Sei­ten für Op­fer und zur Prä­ven­ti­on. Dies lässt also dar­auf schlies­sen, dass in YaCy die Frei­heit nicht aus­ge­nutzt wird, um kri­mi­nel­le Web­sei­ten zu in­de­xie­ren.

Fazit

Ja YaCy ist eine freie Such­ma­schi­ne je­doch nicht für je­der­mann. Die In­stal­la­ti­on, Kon­fi­gu­ra­ti­on und Funk­ti­ons­wei­se setzt schon ein ge­wis­ses Maß an In­ter­net­ver­ständ­nis vor­aus.

Die Such­ergeb­nis­se sind mei­ner Mei­nung nach be­son­ders für Web­wor­ker, Blog­ger, Re­dak­teu­re und Stu­den­ten ge­eig­net. Also für die Leu­te, die, wenn sie auf der Su­che nach der Her­stel­lung von Schu­hen sind, nicht erst 20 Sei­ten von Schuh­shops über­sprin­gen möch­ten.

Größ­tes Man­ko sind je­doch die viel zu we­ni­gen Be­nut­zer. In mei­nem Test wa­ren im Durch­schnitt 312 YaCy-Benutzer on­line. Das ist na­tür­lich lä­cher­lich we­nig, umso mehr wun­de­re ich mich über die gu­ten Such­ergeb­nis­se.

Ich wer­de in Zu­kunft zur Re­cher­che YaCy als Senior-User ver­wen­den und hin und wie­der im Hin­ter­grund lau­fen las­sen. Der Res­sour­cen­ver­brauch hält sich in Gren­zen und da­für be­kommt man wirk­lich ei­nen an­de­ren Blick­win­kel auf das In­ter­net.

Ver­wand­te The­men:

Mit Ubun­tu ins Tor-Netzwerk
Wer­bung trotz Ad­block Plus?

(Screen­shots: Ubun­tu 14.04 LTS und YaCy 1.8 im Mo­zil­la Fire­fox)

Mein Name ist Sa­scha, das In­ter­net und ich sind seit 1997 gute Freun­de. Es gibt mir En­ter­tain­ment, Mo­ne­ten und Lie­be, da­für gebe ich ihm seit 2009 viel­sei­ti­ge, mul­ti­me­dia­le An­lei­tun­gen auf den ver­schie­dens­ten Prä­sen­zen. Wäre ich nicht Web­wor­ker, wür­de ich wahr­schein­lich für die Ca­mor­ra das Heim­netz­werk auf De­bi­an um­stel­len und ver­wal­ten. Als Fa­mi­li­en­mensch lie­be ich näm­lich Süd­ita­li­en, das dor­ti­ge Es­sen und die spät­abend­li­chen Ar­beits­zei­ten.


Kategorie: Blog
  • MoSch sagt:

    Hal­lo Sa­scha su­per Ar­ti­kel zu YaCy, hat mir sehr beim Ein­rich­ten ge­hol­fen. Ich habe von die­ser Such­ma­schi­ne erst vor zwei Wo­chen ge­hört und be­nutz­te seit­her ei­nen Mix aus Google/Duck/Bing und woll­te YaCy zum Re­cher­chie­ren von The­men mit rein neh­men. Das Haupt­pro­blem sind wirk­lich die we­ni­gen Be­nut­zer. Vor al­lem zu deutsch­spra­chi­gen, so­zia­len The­men gibt es noch sehr we­nig zu fin­den. Bei mir wa­ren es im Schnitt 500 User, was für eine Such­ma­schi­ne wirk­lich gar nichts ist. Ich bin jetzt ziem­lich skep­tisch ob ich YaCy ein­fach mal lau­fen las­se oder ob die Ge­schich­te wie­der de­instal­lie­re. Trotz­dem dan­ke fürs Be­leuch­ten der Hin­ter­grün­de - grüß­le MoSch

Deine E-Mail-Adresse wird nicht veröffentlicht. Pflichtfelder sind markiert *

*