Ewelina_Dziwak_Wielkie_bazy_danych_jako_nowe_ ród a_informacji.pdf

(1210 KB) Pobierz
„Acta Humana” 9 (2018)
Mgr
E
welina
D
ziwak
Uniwersytet Śląski
e-mail: dziwak1987ewelina@gmail.com
Wielkie bazy danych jako nowe źródła informacji.
Big data
przyszłością dziennikarstwa?
Wprowadzenie
XXI wiek przez wielu badaczy – przedstawicieli zarówno nauk społecznych,
jak i innych dyscyplin – nazywany jest trafnie epoką nadmiaru. Współczesny czło-
wiek nie może skonsumować wszystkiego, co ślepo gromadzi, kierując się rekla-
mą, a także nie potrafi skupić uwagi na wszelkich informacjach, które udostępnia/
przechowuje sieć. Jednostka egzystuje więc w „cyfrowym buszu”, żyjąc już nie
w zgodzie z naturą, lecz z technologią.
W obliczu wielu źródeł informacji – począwszy od mediów tradycyjnych,
a skończywszy na komentarzach i postach internautów w sieciach społeczno-
ściowych, kiedy sama informacja może być wielokrotnie filtrowana, oceniana,
komentowana i przetwarzana – dziennikarze stają przed nowym wyzwaniem. Mu-
szą znaleźć taką historię, do której trudno jest dotrzeć, która nie jest powszechnie
dostępna. Dodatkowo, aby wzbudzić zainteresowanie publiczności treścią, muszą
przedstawić ją w nieszablonowy, jak najbardziej atrakcyjny dla konsumentów
sposób. Prezentowany artykuł dotyczy nowej praktyki dziennikarskiej, jaką jest
data journalism.
Autorka dokonuje jej charakterystyki, wskazując na rosnące zna-
czenie wizualizacji informacji w obliczu przeciążenia informacyjnego. Głównym
celem artykułu jest ukazanie dziennikarstwa danych jako remedium na problemy
percepcyjne jednostek. Autorka swoje rozważania rozpoczyna od charakterystyki
big data,
następnie przechodzi do zagadnienia rafinacji informacji. Kolejnym
elementem, któremu poświęca uwagę, jest wizualizacja przekazów. W tym frag-
mencie pracy podaje argumenty przemawiające za traktowaniem dziennikarstwa
danych jako środka zaradczego na przeciążenie informacyjne. Autorka przedsta-
wia podstawowe ustalenia na temat
data journalism,
opierając założenia głów-
Ewelina Dziwak
nie na dostępnych studiach teoretycznych podejmujących tę wciąż mało znaną
problematykę.
Big data
jako nieocenione źródło informacji
Założone w Stanach Zjednoczonych przedsiębiorstwo analityczno-doradcze
Gartner szacuje, że do 2020 roku liczba urządzeń podłączonych do sieci interneto-
wej wyniesie dwadzieścia sześć miliardów. Według ABI Research liczba ta będzie
oscylować wokół trzydziestu miliardów. Cisco Internet Business Solutions Group
w swoich prognozach wskazuje na pięćdziesiąt miliardów (Mayer-Schönberger,
Cukier 2014, 24). Każde z urządzeń działających i komunikujących się ze sobą
przy wykorzystaniu internetu wytwarza ogromne wolumeny danych. Codziennie
różne źródła generują masowy przyrost danych w postaci cyfrowej. Powoduje to,
że konwencjonalne techniki przechowywania i przetwarzania danych zaczynają
stawać się nieadekwatne do obecnych potrzeb (Tabakow, Korczak, Franczyk 2014,
138). W czasach cyfrowej rewolucji wszechobecność informacji zaczyna odgry-
wać kluczową rolę w egzystencji człowieka współczesnego. Człowiek – pojmo-
wany do niedawna przez socjologów jako istota niepotrafiąca żyć w separacji od
społeczeństwa – okazuje się jednostką, która podobnie jak za drugim człowiekiem,
tęskni za informacją. Informacja (choć ogólnie dostępna) staje się jednak zarazem
wszystkim i niczym.
Coraz bardziej powszechny dostęp do internetu oraz upowszechnienie się umie-
jętności obsługi urządzeń typu
smart
sprawiają, że wgląd do danych i informacji
jest łatwiejszy. Użytkownik zostaje uwikłany w niezliczone sieci. Wykorzystuje do
nich dostęp, ale równocześnie staje się autorem informacji oraz uczestniczy w ich
rozpowszechnianiu. Według Martina Hilberta ilość cyfrowych informacji podwaja
się co trzy lata (Mayer-Schönberger, Cukier 2014, 23). Miliony zdjęć, plików mu-
zycznych, plików wideo, dokumentów tekstowych itp. z każdą sekundą zalewają
sieć. Dane te, dotyczące niemalże każdej sfery życia, zaczęto określać przymiotni-
kiem
big,
a całe ich zbiory otrzymały nazwę
big data
(Mach-Król 2015, 41). Nie
istnieje jedna, uniwersalna definicja tego terminu. Określenie
big data
odnosi się do
zbiorów danych, których rozmiar przekracza możliwości pozyskiwania, przecho-
wywania, zarządzania i analizy oferowane przez typowe narzędzia oprogramowania
bazodanowego. Bezpośrednią przyczyną rozwoju
big data
jest proces datafikacji,
czyli tendencji do wytwarzania danych dotyczących zjawisk, które uprzednio nie
były traktowane jako interesujące źródła informacji. W wielu przypadkach dane te
są gromadzone bez konkretnego powodu, poza ogólnym przekonaniem, że w nie-
dalekiej przyszłości będzie można dzięki nim usprawnić jakiś proces lub uzyskać
korzyści ekonomiczne. Warto zaznaczyć, że źródłem
big data
jest nie tylko internet,
ale są nim także wszelkiego rodzaju wielkie zbiory danych, m.in. archiwa państwo-
186
Wielkie bazy danych jako nowe źródła informacji.
Big data
przyszłością dziennikarstwa?
we, samorządowe, korporacyjne, firmowe oraz wszystkie te, w których rejestrowane
są przejawy ludzkiej działalności (Brosz, Bryda, Siuda 2017, 7).
Zasoby internetu stanowią bez wątpienia znaczącą częścią
big data.
Dane pocho-
dzące z nieustrukturyzowanych źródeł, takich jak: sieci społecznościowe, strumień
kliknięć w WWW, blogi, portale, posty, maile, profesjonalne publikacje, zasoby
ukryte czy dane produkowane przez urządzenia typu
smart,
tworzą olbrzymie zbio-
ry informacji, których analiza pozwala na uzyskanie nowej wiedzy.
Big data
daje
możliwość przewidywania przyszłości i odkrywania nowych wartości na podstawie
bieżącej analizy nieustannie zwiększających się zasobów informacji (Graczyk-
-Kucharska 2015, 267). Analizy danych wykorzystywane są w celu wychwycenia
korelacji, wzorców i trendów pomocnych zarówno w prognozowaniu zjawisk oraz
tendencji, jak i ludzkich preferencji, zachowań czy nawyków (Stępnik 2015, 150).
Ciągle wzrastająca ilość danych, a także doskonalenie technik ich pozyskiwania,
przechowywania i analizowania umniejszają rolę teorii w odkrywaniu praw rządzą-
cych społeczeństwami ludzkimi.
Big data
same wytwarzają zdolność do poznania
wiedzy dotyczącej skomplikowanych zjawisk. Analizy dokonywane w ramach tego
paradygmatu nie wymagają stosowania się do procedur procesu badawczego. Uzy-
skane dane mają „mówić” same za siebie (Brosz, Bryda, Siuda 2017, 9).
Bardzo istotnym pożytkiem wynikającym z
big data
jest możliwość przewidy-
wania kryzysów społecznych i gospodarczych dzięki wykorzystaniu danych pozy-
skiwanych z serwisów społecznościowych. Bezbłędnie zastosowane wobec dużych
zbiorów danych algorytmy mogą wskazywać na kierunki w myśleniu i postrzega-
niu określonych zagadnień, polaryzację poglądów politycznych, gospodarczych,
społecznych i religijnych (Polańska, Wassilew 2015, 122). Wnioskowanie z anali-
zy danych zebranych na portalach społecznościowych pozwala poznać najnowsze
trendy, preferencje oraz cyfrowe nawyki członków internetowych społeczności.
Bazując na zasobach dostępnych w profilach użytkowników, można uzyskać na
ich temat zarówno dane demograficzne, jak i informacje pochodzące ze śladów
pozostawianych przez nich w rzeczywistości wirtualnej i pozawirtualnej.
Rafinacja informacji w przestrzeni
big data
Rzeczywistość sieciowa dawno już przestała być uważana za alternatywę dla
tradycyjnie rejestrowanej rzeczywistości. Coraz częściej dostrzega się jej imma-
nentny wymiar i traktuje na równi z rzeczywistością realną. Prowadząc badania
społeczne w internecie, należało wypracować nowe kategorie opisu, nowe narzę-
dzia oraz nowe paradygmaty – adekwatne do nieszablonowego, „stechnologizowa-
nego” społeczeństwa. To, o co walczyli zwolennicy teorii zakładających całkowite
oderwanie nauk społecznych od nauk przyrodniczych, w obecnych czasach staje
się całkowicie bezzasadne. Technologia wymusiła poniekąd na „humanistach” się-
187
Ewelina Dziwak
gnięcie do nauk ścisłych. Digitalny wymiar życia mający totalizujący charakter
zawłaszcza wszystkie, nawet nieusieciowione wymiary życia społecznego (Szpu-
nar 2016, 355–356). Informacje w internecie zostają pozbawione linearnego cha-
rakteru, zostają zredukowane do formatu cyfry i przekształcają się w dane.
Dane w społeczeństwie informacyjnym pełnią kluczową funkcję. Wszystko za
sprawą kultury algorytmów, która wymusza imperatyw policzalności wszystkiego.
Kultura nastawiona na zysk redukuje całą rzeczywistość społeczną do formatu
cyfry. Bardziej niż jakość zaczyna liczyć się ilość posiadanych rzeczy, znajomych
w sieciach społecznościowych, „lajków” czy wygenerowanych i skonsumowanych
informacji. Towarzyszący społeczeństwu informacyjnemu proces makdonaldyzacji
sprawia, że najważniejszy okazuje się krótki i zwięzły przekaz, a słowa poboczne,
będące wyrazem kunsztu zawodowego dziennikarza, często okazują się zbędne dla
przeciętnego czytelnika. Internet jest tym medium, które w największym stopniu
sprzyja tworzeniu krótkich, łatwych w odbiorze treści. Tradycyjne dziennikar-
stwo, oparte na dłuższej narracji, w internecie powoli zanika. Ustępuje miejsca
dziennikarstwu danych, które przemawia do czytelnika bardziej niż najlepiej na-
wet napisany tekst. Dziennikarstwo danych nie ma jednej, formalnej definicji.
Pojmowane jest jako umiejętne wykorzystywanie dostępnych w sieci terabajtów
do tworzenia prostych i zwięzłych treści opatrzonych wizualizacją. Obok trady-
cyjnego dziennikarstwa pojawia się dziennikarstwo danych, a obok dziennikarza
humanisty wyłania się dziennikarz biegle władający nie tylko „piórem”, lecz także
językiem programowania.
Informacje pochodzące z różnych źródeł, poddane digitalizacji, a następnie
zewidencjonowane w
big data,
stają się fundamentem do tworzenia nowych treści.
Proces ten – nazywany rafinacją informacji – jest wynikiem korelacji oraz analiz
danych źródłowych (Gogołek 2012). Podstawą rafinacji jest
Culturomics
– narzę-
dzie, dzięki któremu można monitorować media na całym świecie. Prototyp tego
narzędzia narodził się jako owoc współpracy harwardzkich badaczy z pracownika-
mi
Google Books.
W założeniu swoich twórców istotą działania
Culturomicsu
było
odzwierciedlenie popularności danego słowa w odniesieniu do częstotliwości po-
jawiania się go w książkach pochodzących z konkretnego okresu. Koncepcja tego
narzędzia została „zapożyczona” i wykorzystana przez
Institute for Computing in
Humanities, Arts, and Social Sciences
jako próba użycia codziennych wiadomości
i spojrzenie na ich geograficzny rozkład, tak aby można było sprawdzić, w jaki
sposób odpowiednie dane się ze sobą łączą (Leetarau 2011). Innym przykładem
tego typu projektu jest
The Migrants’ Files
skupiający interdyscyplinarne zespo-
ły dziennikarzy, programistów i projektantów mających narzędzia analityczne,
które umożliwiają prowadzenie statystycznych śledztw dziennikarskich. Program
powstał po tragedii, jaka rozegrała się u wybrzeży włoskiej wyspy Lampedusa
i pochłonęła ponad trzysta sześćdziesiąt ofiar wśród uchodźców wojennych z Afry-
188
Wielkie bazy danych jako nowe źródła informacji.
Big data
przyszłością dziennikarstwa?
ki, Bliskiego Wschodu oraz innych regionów. Po tym wydarzeniu konsorcjum
europejskich dziennikarzy zobowiązało się do systematycznego gromadzenia
i analizowania danych na temat śmierci potencjalnych migrantów. Pozyskując,
przetwarzając i analizując zestawy danych pochodzących z różnych źródeł,
The
Migrants’ Files
tworzy kompleksową i wiarygodną bazę danych na temat śmierci
migrantów. Głównymi źródłami pozyskiwania danych do bazy są:
UNITED for
Intercultural Action
– organizacja non profit, której sieć obejmuje ponad pięćset
pięćdziesiąt organizacji z całej Europy,
Fortress Europe
– blog założony przez
dziennikarza Gabriele’a del Grandego, który monitoruje również zgony i zaginię-
cia migrantów w Europie, a także
Puls
– projekt prowadzony przez Uniwersytet
Helsiński w Finlandii i Wspólne Centrum Badawcze Komisji Europejskiej.
Do analiz wszystkich zewidencjonowanych w bazie danych stosowana jest me-
todologia oparta na programie OSINT, stworzonym przez służby wywiadowcze, któ-
ry zbiera dane z publicznie dostępnych źródeł takich jak raporty medialne, publikacje
rządowe, a dodatkowo analizuje treści milionów użytkowników sieci, którzy bardzo
często okazują się naocznymi świadkami wydarzeń. Liczba migrantów ponoszących
śmierć w trakcie poszukiwania schronienia uzyskiwana jest z globalnych informacji
pozyskiwanych w czasie rzeczywistym (The
Migrants’ Files).
Wizualizacja informacji
Przykład
The Migrants’ Files
pokazuje, jak ważne w epoce nadmiaru informacji
jest wejście pod powierzchnię nieuporządkowanego strumienia treści i poszukiwanie
w nich wzajemnych zależności, które pozwolą odkryć niedostrzegane wcześniej
zjawiska i problemy. Istotne staje się także pozyskiwanie cennych informacji ze
źródeł nieustrukturyzowanych, np. portali społecznościowych, blogów itp. Oprócz
bazowania na zewidencjonowanych źródłach charakterystyczne dla dziennikarstwa
danych jest przedstawianie informacji przy zminimalizowaniu języka pisanego na
rzecz języka wizualnego (Piekarski 2017, 207). Istotą dziennikarstwa danych jest
zatem synteza słowa pisanego, języka komputerowego oraz obrazu. Obrazy, którymi
operują dziennikarze danych, nie odwzorowują bezpośrednio rzeczywistości, ale
przynależą do świata obrazów technicznych (Piekarski 2017, 211). Nie są owocem
prac fotoreporterów, lecz wytworem interdyscyplinarnych zespołów składających się
z dziennikarzy, analityków, programistów i grafików komputerowych.
Otaczający nas świat jest niezwykle złożony, a w warunkach „eksplozji infor-
matycznej i przeciążenia naszego układu zmysłów konieczne jest lepsze przyswa-
janie, organizowanie i wykorzystywanie płynących z zewnątrz sygnałów” (Vetula-
ni 1998, 37). Ewolucyjnie nasz system zmysłów oraz układ przetwarzania danych
są przystosowane do takiego środowiska, które znamy z zeszłego wieku. Nasza
psychika „z trudem daje sobie radę z obecnym tempem życia” (Vetulani 1998, 38)
189
Zgłoś jeśli naruszono regulamin