- second edition 2018
- first edition 2008
- Polity Press. Cambridge
Suchmaschinen in den verschiedensten Varianten spielen eine zentrale Rolle für die Gesellschaft, sie sind heute der Zugang zu vielem Wissen, Geschäften, Kontakten etc. und sammeln gleichzeitig sehr viel persönliche Daten. Eine Auslegeordnung. Geschichte, Risiken, Chancen
Introduction
Angela Merkel. 2016. Algorithms, when they are not transparent, can lead to a distortion of our perception, they can shrink our expanse of information.
Search Engines müssen einen Bias haben, sonst wären sie nutzlos. Wir wollen ja auf das uns interessierende hingeführt werden.
1. The Engines
Heute Allgegenwärtig und in den verschiedensten Formen, nicht nur Stichworte, offenes Netz, etc.. Z.B. Spezialisiert auf vertikales Suche innerhalt einer Firma oder Fachgebiet. Lokalisierte oder zeitliche schnell ändernde Daten. Uebernimmt immer mehr mit AI und BigData Techniken.
Funktionieren 3 stufig
- Crawlers oder Robots surfen durch das Netz via Hyperlinks, beginnend von einer SeedListe von URLs (mit dynamischem, Ortsabhängigen usw. Content und verschiedenen Medien wirds komplizierter ...)
- teilweises abspeichern der Seiten und extraktion von Schlüssel Ausdrücken (aber nur schon Wörter zu isolieren ist nicht einfach, v.a. mit vielen Sprachen) und referenzieren durch DB
- User Interface
Regionale Search Engines für bessere Resultate. Innerhalb von socialNetworkingPlattforms etc.
Search produziert einen grossen Teil des Internetverkehrts und ist ein grosses Geschäft, für SearchEngines und für SEO
2. Searching
meist iterative. Bool'sche Operanden sind oft Aufwand nicht Wert. Ganze Fragen verstehen (semantic search), nicht nur Schlüsselworte.
Tracking Searches and Searchers ==> welche Links werden geklickt usw.. Logs. Google Analytics.
Serendipity
3. Sociable Search
Links aus SozialNetzwerken benutzen
Collaborative Filtering: CrowdSourcing um relevante Inhalte zu finden, z.B. mit öffentlichenn Bookmarks.
(Re-)finding community: this suggests a move from goal-oriented searching to build explicit and tacit connections between people.
4. Attention
Das internet ermöglicht zwar fast jedem Inhalte zu erstellen, die Beachtung ist allerdings pro User eine begrenzte Ressource (darum brauchen wir ja SearchEngines) und sehr ungleich verteilt. Die Expolosionsartige Beachtung von wenigen einzelnen Beiträgen, wird oft mit der Ausbreitung einer Epidemie verglichen
PageRank von Google zählt nicht nur die Anzahl der Backlinks, sondern bewertet sie auch nach der Wichtigkeit des Sites. Spam versucht das auszunutzen und Google wiederum versucht das zu durchkreuzen.
Search Engines zu Werbung finanzieren schien mit der Glaubwürdigkeit unverträglich - ist aber heute dominant. Eine Vielfalt von SearchEngines scheint nicht realistisch, wegen natürlichen MonopolEffekten.
Die grösste Aenderung in Search im letzten Jahrzehnt ist die Tendenz zu collaborative Recommender systems
5. Knowledge and Democracy
Search Engine sind keine totalisierende Technik, sie erlauben Arbeit an den Rändern zu finden, je fähiger der Benutzer, umso weniger sein Bias zu globaler Konsumkultur. Aber amerikanische Inhalte dominieren und diese Bias ist real.
Danke dem weltweiten Markt finden auch sehr exzentrische Bücher einen Markt - viele Nischen
6. Control
Während Staaten wie China versuchen SearchEngines zu zensurieren oder ganz auszuschliessen - zensuriert auch Google, z.B. gegen Firmen die versuchen ihren pageRank missbräuchlich zu erhöhen. Natürlich spiegeln die Suchresultate auch die sozialen Machtverhältnisse wider.
Vor allem die Vorschau von Suchresultaten, kann geistiges EigentumsRechte verletzen.
Promotin search diversity: Staaten können nicht nur Ueberwachung und Zensur verlangen, sondern auch faire Repräsentation verschiedener Meinungen, wie bei den alten Pressegesetzen. Wir müssen zumindest wissen, wie die Algorithmen etwas für uns aussuchen bzw. vor uns verbergen
7. Privacy
Recht auf Vergessen im digitalen Zeitalter, z.B. für neuen Start. Identitäts Klau (wird einfacher durch vieles Wissen über einzelnen) und Verwechslung. NichtAnstellung wegen (alten) Einträgen in Suchmaschinen/sozialen Medien. Sehr intime Sachen werden durch Vernetzung von digitalen Medien öffentlich
8.Future Finding
Die grossen Internet Firmen haben eine grosse Macht, die Staaten können auf vielen Gebieten kaum konkurrieren. Ob die digitalen Archive wirklich sicher sind ist zweifelhaft, wenn eine Firma aufgekauft wird, werden ihre Archive of unzugänglich.