Zemsta gate-keeperów I
Na początku było słowo, i słowo zostało puszczone w eter. Ale kto je autoryzował?
Informacja zawsze była selekcjonowana. Gdy tylko przekaz przekroczył granice zagrody nadawcy, ktoś zaczął decydować, czy dana informacja może być rozpowszechniana. Czasem decydowaly względy polityczne (tylko błaznowi wolno publicznie mówić, że Król jest głupi), czasem merytoryczne (teksty kłamliwe i błędne nie powinny być publikowane), zawsze jednak ktoś podejmował decyzję, i stosownie do niej działał. Oto strażnicy bram do upowszechniania wiedzy. Przybierają różne role: bibliotekarze decydujący o tym, które teksty są dostępne, a które są "w opracowaniu"; średniowieczni skrybowie decydujący o tym, który tekst zostanie przepisany; drukarze decydujący o tym, który tekst wrzucić na maszyny; redaktorzy programowi decydujący o tym, który program znajdzie się na antenie. Mieli sporą władzę i korzystali z niej.
W czasach mediów o stożkowej strukturze hierarchicznej (nadajnik i wiele odbiorników) technologia im sprzyjała. Łatwo było pilnować dostępu do jedynej drukarni czy jedynego nadajnika. Pojawienie się globalnej, rozproszonej sieci komputerowej zmieniło wiele. Struktura upowszechniania informacji również się przekształciła. Każdy mógł publikować, każdy mógł rozpowszechniać, gate-keeperzy stali się "przestarzali" i zbędni. Miała oto nadejść wreszcie wymarzona wolność i demokracja dla świata informacji i wiedzy.
Powszechność przeszła w ilość. Niezliczone źródła informacji stały się błogosławieństwem i przekleństwem zarazem. Różnorodność źródeł i inspiracji okupiona została utratą wiarygodności i kłopotami z odnalezieniem tej jednej, pożądanej informacji. Pozornie pajęczyna jest niewielka. Mimo miliardów stron, odległość między dwiema dowolnymi witrynami pokonać można przy użyciu zadziwiająco niewielu kliknięć (według badań Alberta i innych z 1999 roku było to około 19 kliknięć). Jednak odnalezienie tej właściwej ścieżki nie zawsze jest łatwe, zwłaszcza jeśli cel podróży znamy tylko w przybliżeniu. Korzystamy więc z technologicznego i ludzkiego wsparcia.
Technologia to przede wszystkim wyszukiwarki, wraz ze swymi sekretnymi algorytmami i niezliczonymi robotami, pająkami i crawlerami, nieustannie przeczesującymi Pajęczynę. Pajączki odwiedzają strony internetowe, gromadzą informacje na temat ich treści, a następnie wędrują dalej po kolejnych linkach. Uzyskane w ten sposób dane są gromadzone w stosownych bazach i udostępniane poprzez interfejs wyszukiwarki. System usiłuje jednak dostarczyć nam jak najbardziej trafne i wartościowe wyniki, selekcjonując zawartość bazy danych na wiele rozmaitych (i zwykle tajnych) sposobów. (O niektórych czynnikach mających wpływ na pozycję strony w wynikach wyszukiwania Googla można przeczytać na stronie midei. Więcej o sekretach Googla na stronie Wszystko o Google.)
Algorytmy, póki co, są tępe. Nawet te najbardziej wyrafinowane można oszukać. I nawet te najbardziej wyrafinowane premiują strony najbardziej popularne, a nie te najlepsze. Strona znajdująca się wysoko w wynikach wyszukiwania, częściej jest znajdowana, odwiedzana i linkowana, a dzięki temu znajduje się wyżej w wynikach wyszukiwania. To swoiste sprzężenie sprawia, że sieć przestaje być jednorodna i zdecentralizowana. W sieci pojawiają się węzły nieproporcjonalnie często odwiedzane. Tę cechę sieci oddaje model "muszki" prezentowany w artykule Brodera i innych z roku 2000. Zgodnie z tym modelem stosunkowo niewielkie centrum sieci pochłania bardzo dużo sieciowego ruchu. Strony centralne powiązane są wyjątkowo gęstą siecią odnośników, co w połączeniu z mechanicznym, wyszukiwarkowym sprzężeniem prowadzi do tego, że ściągają one widzów jak czarna dziura. Gdzieś na obrzeżach znajdują się obszary IN i OUT, które jednokierunkowo linkują do centrum, lub też są z centrum linkowane. Centrum to około 30% Pajęczyny, obszary IN i OUT to jakieś 20% każdy. Korzystając z wyszukiwarek z bardzo dużym prawdopodobieństwem trafimy na stronę z centrum. Na dalszych miejscach mogą znaleźć się strony z pozostałych dwóch obszarów. Reszta -- rubieże zewnętrzne, stanowiące jakieś 30% Pajęczyny -- pozostaje niezwykle trudno dostępna.
Niegdyś mówiło się o tzw. Głębokim Internecie, obszarze niedostępnym dla wyszukiwarek, ze względu na niedoskonałość mechanizmów. Miały to być głównie strony w zamkniętych obszarach Sieci oraz te generowane dynamicznie. Dziś robociki wyszukiwarek coraz lepiej radzą sobie z indeksowaniem treści zamkniętych w bazach danych, dzięki temu "dynamizm" stron przestał być problemem. Nie znaczy to jednak, że ukryty Internet się kurczy. Trafiają tam po prostu strony nisko oceniane przez wyszukiwarki, zalgorytmizowanych gate-keeperów naszych czasów. Tu nie ludzie, lecz algorytmy dokonują selekcji. Nie na wejściu, lecz na bramce dostępowej użytkownika -- efekty pozostają te same. Tak wychwalana decentralizacja rynku treści okazuje się tylko kolejnym sieciowym mitem. W efekcie i tak najłatwiej nam znaleźć treści najbardziej popularne, co nie musi oznaczać, że najlepsze. (Więcej o tym, jak wyszukiwarki przejmują funkcję gate-keeperów można przeczytać w artykule Wyszukiwarki i ich rola w kształtowaniu Internetu (pdf) Justyny Hofmokl i Alka Tarkowskiego.)
Tabloidyzacja rozmaitych obszarów sieci jest naturalną konsekwencją działania takich mechanizmów. Niejako jesteśmy na nią skazani. Bo podobnie sytuacja wygląda wówczas, gdy w poszukiwaniach wspierają nas ludzie, a nie maszyny. Ale o tym w następnym odcinku.

December 7th, 2005 - 19:27
Zgadzam się z Tobą. Ale jednocześnie musimy pamiętać, że wyszukiwarki to nie wszystko i można korzystać z innych filtrów informacji, jak chociażby z blogów, które kierują do innych stron, czy też czytników rss, gdzie sami wrzucamy interesujące nas kanały. Oczywiście, tu też możemy natrafiać głównie na najbardziej popularne źródła, ale może się to zdarzać rzadziej niż w przypadku wyszukiwarek. A poza tym, chyba często tak jest, że funkcjonują jakieś popularne wytwory- kanały radiowe, telewizyjne, książki, czasopisma, które kierują do innych popularnych miejsc, co jeszcze na szczęście nie oznacza, że nie istnieją inne miejsca. Po prostu prościej jest korzystać z czegoś, co łatwo podane, zwłaszcza w świecie nadmiaru informacji, kiedy skraca nam to czas poszukiwań, niż tracić energię na wyszukiwanie. Zatem dużo zależy od samego użytkownika. Dodatkowo, jakoś tak już jesteśmy skonstruowani, że jeżeli gapi się na coś kilka osób, to zaraz pojawi się tam ciekawski tłum, ale wcale to jeszcze nie oznacza, że najbardziej popularne treści są najgorszej jakości. Prawdopodobnie są przeciętne, jak większość ludzi, ale być może niektóre kierują do rzeczy wartościowych. Podsumowując- niezbędne jest krytyczne podejście do źródeł i selekcja informacji opierająca się na więcej niż jednym filtrze.
December 7th, 2005 - 20:15
//—–
Ale jednocześnie musimy pamiętać, że wyszukiwarki to nie wszystko i można korzystać z innych filtrów informacji, jak chociażby z blogów, które kierują do innych stron, czy też czytników rss, gdzie sami wrzucamy interesujące nas kanały.
\\—–
Tak. O tym będzie w drugim odcinku. :) Ale ludzkie wsparcie też nie do końca chroni nas przed centralizacją. Nie twierdzę, że to źle. Ale warto pamiętać, że to co najłatwiej dostępne, nie jest jedynym co dostępne. A gate-keeperzy są niezbędni, ale zarazem musimy rozumieć jak działają i wiedzieć, jak ich omijać.
A potrzeba krytycznego podejścia do źródeł jest rzeczywiście niezmiernie istotna.
December 8th, 2005 - 13:50
Fajny wpis :) Ja jednak do fragmentu z komentarza nade mną:
“A gate-keeperzy są niezbędni, ale zarazem musimy rozumieć jak działają i wiedzieć, jak ich omijać.”
…dodałbym tylko, że niestety wielu osobom wcale nie zależy ani na takim rozumieniu, ani na wiedzy nt. omijania gate-keeperów. Powiedziałbym wręcz, że takich osób jest w obecnej Sieci większość. “Poprowadź mnie za rękę, zaufam ci, bo przyjaźnie wyglądasz i oferujesz coś za darmo”, czyż nie?
Mechanizmów działania programów (lub ich ukrytych funkcji) laik nie zna i poznać raczej nie ma ochoty, niestety… Ĺťenująca, a słynna już wypowiedź Hessego z Sony nt. rootkitu, ma przede wszystkim smutne drugie dno. Oto wylazł z obrotnego człowieka sukcesu po prostu pragmatyk, którego jego biznesowe realia doprowadziły do utraty resztek poczucia obciachu; w efekcie dyrektor publicznie powiedział to, co jemu podobni uznają za pożądany dla koncernu stan naturalny.
Dygresja stop, konkluzja mode on -> “musimy rozumieć” zgoda, ale w innej skali. My, wszyscy internauci, jakkolwiek górnolotnie to brzmi. Metoda – pisać, linkować. Linkować, pisać. Sprawa rootkitu jest tu dla mnie w pewnym sensie wzorcowa. Ale owo pisanie-linkowanie w ww. rozumieniu wpisuje się pewnikiem w drugi, przygotowywany odcinek :)
December 8th, 2005 - 15:44
Masz rację – zdecydowania większość ludzi nie jest zainteresowana zrozumieniem _jak_. Dotyczy to zwłaszcza tych, którzy z Sieci korzystają bardzo okazjonalnie, niesieni stereotypem Internetu jako wiarygodnego medium i doskonałego źródła informacji. Przedstawiałem ostatnio to zagadnienie swoim studentom i naprawdę tylko nieliczni dostrzegli tu w ogóle jakiś problem.
Ogólnie mówiąc ufamy, że techniczne wynalazki nie zrobią nam krzywdy. I pozwalamy sobą manipulować. Maszyny są przecież niegroźne, robią tylko to, co im kazaliśmy.
Pisanie-linkowanie z pewnością jest jakimś rozwiązaniem. Gdy rozumiemy system, możemy wykorzystać go po swojemu, albo ominąć jego ograniczenia. Sam się tego uczę i staram się tym dzielić. Tyle mogę zrobić. Za “nas internautów” wolałbym się nie wypowiadać. :)
December 11th, 2005 - 14:08
Z informacji wyszukanych w sieci trzeba korzystać z dużą dozą ostrożności. Właściwie nie mamy kontroli nad tym, czy zamieszczone wiadomości są rzetelne. Czasem można zacytować coś, co jest totalnym farmazonem. Nawet ja mogłabym załozyć swoją stronę i pisać na niej, że Słońce krąży wokół Ziemii i podpisać się Kopernik. Nikt mi nie zabroni… Odnalezienie tego, co nas interesuje wymaga przede wszystkim czasu, czasu no i czasu ale również wrodzonej dociekliwości. Przechodząc od witryny do witryny można trafić na swego rodzaju “perełki”. Ja własnie tak tu traiłam…
December 12th, 2005 - 02:10
Na początku było Słowo – to nie ulega wątpliwości. Ale potem pojawiła się plotka i to właśnie w celu zwalczenia jej ruszyła machina selekcji, autoryzacji, cenzury, itp. :)
Plotka miewa się świetnie. Stwierdzam to, odkąd mam mało czasu. Coraz rzadziej szukam czegoś sama, a mimo to nie mam poczucia utraty kontaktu z sieciową rzeczywistością. W szczególności zbędne okazuje się czytanie legiona różnych forów – nie ma obawy, jeśli na którymkolwiek z nich pojawi się wiadomość, która mnie dotyczy, mogłoby zainteresować, lub na którą powinnam odpisać – zostanę o tym poinformowana, zanim jeszcze większość stałych użytkowników w/w forum zdąży tę wiadomość przeczytać w ,,naturalnym” czasie.
Podobnie jest z wiadomościami ,,branżowymi” – bez względu na to, w jak egzotycznym miejscu by się ukazały, dotrą do mnie nieuchronnie i to raczej prędzej, niż później. Z tego, czego uczyłam się na studiach, ładnych parę lat przed upowszechnieniem się Internetu, wynikało, że już od dawna podobnie wyglądało to w kręgach naukowych. Dlaczego? ,,Niezliczone źródła informacji stały się błogosławieństwem i przekleństwem zarazem. Różnorodność źródeł i inspiracji okupiona została utratą wiarygodności i kłopotami z odnalezieniem tej jednej, pożądanej informacji” – Marcinie, toczka w toczkę to samo słyszałam na zajęciach wprowadzających do przedmiotu źródła informacji; było to uzasadnienie potrzeby powstania abstraktów tematycznych i interdyscyplinarnych, a w kwestii wiarygodności – Science Citation Index. Rzecz jasna wszystkie te wydawnictwa informacyjne dotyczyły publikacji i były w stosunku do nich opóźnione o co najmniej kilka miesięcy, toteż naukowcy bazowali na preprintach i kontaktach interpersonalnych w swoich wąskich branżach. Plotka rulez :)
I jeszcze mały komentarz odnośnie do wątpliwej rzetelności informacji znalezionych w Sieci – po prostu nie mogę się powstrzymać – chciałabym zobaczyć takie medium, któremu można ufać bez zastrzeżeń ;-> Wszędzie trafiają się bzdury, zamieszczane albo świadomie, w celu wprowadzenia odbiorców w błąd, albo nieświadomie, z powodu ignorancji, niedbałości, naiwności autorów: w encyklopediach, w pracach naukowych, w książkach, czasopismach, gazetach, w radiu, telewizji… czemu w Internecie miałoby ich nie być?
I jeszcze refleksja ,,historyczna”: za komuny wiadomo było, że telewizja, radio i gazety kłamią ZAWSZE. Po czym można poznać, że polityk kłamie? Po tym, że porusza ustami. Te klimaty :) Wiadomo było, że prawo służy do represjonowania ludzi. Poniekąd była to sytuacja o wiele bardziej klarowna, niż teraz, kiedy wprawdzie jest tak samo, ale nie wiedzieć skąd namnożyło się ludzi żywiących jakieś przedziwne złudzenia co do prawdomówności, wiarygodności i innych fantastycznych cech różnych elementów otaczającego nas świata :) Zmierzam do tego, że nie ma co ubolewać nad złymi wyszukiwarkami, złymi ludźmi i nad tym, jak trudno jest dotrzeć do czegoś ciekawego, niebanalnego i wiarygodnego. Tak zawsze było (nawet w Raju Drzewo Wiadomości było zakazane), tak jest i tak będzie. Po prostu, kiedy już do czegoś takiego się dotrze, należy się cieszyć. I tym optymistycznym… :)
December 13th, 2005 - 12:38
->etag
Problem wiarygodności istnieje w każdym medium. Różnorodność źródeł daje przynajmniej możliwość konfrotowania różnych wersji.
Co do odnalezienia konkretnej informacji — rzeczywiście wymaga to czasu. Ale cały problem w tym, że obecnie czas jest jednym z najcenniejszych posiadanych przez nas dóbr. Dlatego szukamy metod, które zwiększą szybkość/prawdopodobieństwo odnalezienia tego, czego szukamy. I tu znów machają do nas gate-keeperzy.
December 13th, 2005 - 12:48
->Nina
Przede wszystkim ja nie mam nic przeciwko wyszukiwarkom, gate-keeperom i tym podobnym. Nie uważam, że są źli. Nie są natomiast neutralni. Nigdy. I zdrowy rozsądek podpowiada tu, że warto o tym wiedzieć. Istnieją pewne mechanizmy, które warto rozumieć, bo to pozwoli je wykorzystać. Sam codziennie korzystam z googla, oglądam wiadomości (zwykle 2,5 wieczornego serwisu), ufam kilku autorom blogów czy książek. Ale wiem, czego nie pokaże mi google, czego nie pokaże mi TVN, Polsat czy TVP itd. I dzięki temu jestem odrobinkę bliżej prawdy o świecie. ;)
Co do plotki — sieci kontaktów, wspieranych różnymi stopniami zaufania, to naprawdę dobre i wszechstronne źródło wiedzy. Ale i ono nie jest doskonałe. Brak mu pewnej stabilności. I pozostaje tu duża podatność na zakłócenia — dlatego plotki szybko przestają być wiarygodne i natychmiast pojawia się potrzeba weryfikacji. Czyli zazwyczaj takie sieci bardziej przydają się do tego, by poinformować o tym, _że_ coś się dzieje, niż o tym _co_ się dzieje.