Ewelina_Dziwak_Wielkie_bazy_danych_jako_nowe_ ród a_informacji.pdf

(1210 KB) Pobierz

„Acta Humana” 9 (2018)

Mgr

welina

ziwak

Uniwersytet Śląski

e-mail: dziwak1987ewelina@gmail.com

Wielkie bazy danych jako nowe źródła informacji.

Big data

przyszłością dziennikarstwa?

Wprowadzenie

XXI wiek przez wielu badaczy – przedstawicieli zarówno nauk społecznych,

jak i innych dyscyplin – nazywany jest trafnie epoką nadmiaru. Współczesny czło-

wiek nie może skonsumować wszystkiego, co ślepo gromadzi, kierując się rekla-

mą, a także nie potrafi skupić uwagi na wszelkich informacjach, które udostępnia/

przechowuje sieć. Jednostka egzystuje więc w „cyfrowym buszu”, żyjąc już nie

w zgodzie z naturą, lecz z technologią.

W obliczu wielu źródeł informacji – począwszy od mediów tradycyjnych,

a skończywszy na komentarzach i postach internautów w sieciach społeczno-

ściowych, kiedy sama informacja może być wielokrotnie filtrowana, oceniana,

komentowana i przetwarzana – dziennikarze stają przed nowym wyzwaniem. Mu-

szą znaleźć taką historię, do której trudno jest dotrzeć, która nie jest powszechnie

dostępna. Dodatkowo, aby wzbudzić zainteresowanie publiczności treścią, muszą

przedstawić ją w nieszablonowy, jak najbardziej atrakcyjny dla konsumentów

sposób. Prezentowany artykuł dotyczy nowej praktyki dziennikarskiej, jaką jest

data journalism.

Autorka dokonuje jej charakterystyki, wskazując na rosnące zna-

czenie wizualizacji informacji w obliczu przeciążenia informacyjnego. Głównym

celem artykułu jest ukazanie dziennikarstwa danych jako remedium na problemy

percepcyjne jednostek. Autorka swoje rozważania rozpoczyna od charakterystyki

big data,

następnie przechodzi do zagadnienia rafinacji informacji. Kolejnym

elementem, któremu poświęca uwagę, jest wizualizacja przekazów. W tym frag-

mencie pracy podaje argumenty przemawiające za traktowaniem dziennikarstwa

danych jako środka zaradczego na przeciążenie informacyjne. Autorka przedsta-

wia podstawowe ustalenia na temat

data journalism,

opierając założenia głów-

Ewelina Dziwak

nie na dostępnych studiach teoretycznych podejmujących tę wciąż mało znaną

problematykę.

Big data

jako nieocenione źródło informacji

Założone w Stanach Zjednoczonych przedsiębiorstwo analityczno-doradcze

Gartner szacuje, że do 2020 roku liczba urządzeń podłączonych do sieci interneto-

wej wyniesie dwadzieścia sześć miliardów. Według ABI Research liczba ta będzie

oscylować wokół trzydziestu miliardów. Cisco Internet Business Solutions Group

w swoich prognozach wskazuje na pięćdziesiąt miliardów (Mayer-Schönberger,

Cukier 2014, 24). Każde z urządzeń działających i komunikujących się ze sobą

przy wykorzystaniu internetu wytwarza ogromne wolumeny danych. Codziennie

różne źródła generują masowy przyrost danych w postaci cyfrowej. Powoduje to,

że konwencjonalne techniki przechowywania i przetwarzania danych zaczynają

stawać się nieadekwatne do obecnych potrzeb (Tabakow, Korczak, Franczyk 2014,

138). W czasach cyfrowej rewolucji wszechobecność informacji zaczyna odgry-

wać kluczową rolę w egzystencji człowieka współczesnego. Człowiek – pojmo-

wany do niedawna przez socjologów jako istota niepotrafiąca żyć w separacji od

społeczeństwa – okazuje się jednostką, która podobnie jak za drugim człowiekiem,

tęskni za informacją. Informacja (choć ogólnie dostępna) staje się jednak zarazem

wszystkim i niczym.

Coraz bardziej powszechny dostęp do internetu oraz upowszechnienie się umie-

jętności obsługi urządzeń typu

smart

sprawiają, że wgląd do danych i informacji

jest łatwiejszy. Użytkownik zostaje uwikłany w niezliczone sieci. Wykorzystuje do

nich dostęp, ale równocześnie staje się autorem informacji oraz uczestniczy w ich

rozpowszechnianiu. Według Martina Hilberta ilość cyfrowych informacji podwaja

się co trzy lata (Mayer-Schönberger, Cukier 2014, 23). Miliony zdjęć, plików mu-

zycznych, plików wideo, dokumentów tekstowych itp. z każdą sekundą zalewają

sieć. Dane te, dotyczące niemalże każdej sfery życia, zaczęto określać przymiotni-

kiem

big,

a całe ich zbiory otrzymały nazwę

big data

(Mach-Król 2015, 41). Nie

istnieje jedna, uniwersalna definicja tego terminu. Określenie

big data

odnosi się do

zbiorów danych, których rozmiar przekracza możliwości pozyskiwania, przecho-

wywania, zarządzania i analizy oferowane przez typowe narzędzia oprogramowania

bazodanowego. Bezpośrednią przyczyną rozwoju

big data

jest proces datafikacji,

czyli tendencji do wytwarzania danych dotyczących zjawisk, które uprzednio nie

były traktowane jako interesujące źródła informacji. W wielu przypadkach dane te

są gromadzone bez konkretnego powodu, poza ogólnym przekonaniem, że w nie-

dalekiej przyszłości będzie można dzięki nim usprawnić jakiś proces lub uzyskać

korzyści ekonomiczne. Warto zaznaczyć, że źródłem

big data

jest nie tylko internet,

ale są nim także wszelkiego rodzaju wielkie zbiory danych, m.in. archiwa państwo-

186

Wielkie bazy danych jako nowe źródła informacji.

Big data

przyszłością dziennikarstwa?

we, samorządowe, korporacyjne, firmowe oraz wszystkie te, w których rejestrowane

są przejawy ludzkiej działalności (Brosz, Bryda, Siuda 2017, 7).

Zasoby internetu stanowią bez wątpienia znaczącą częścią

big data.

Dane pocho-

dzące z nieustrukturyzowanych źródeł, takich jak: sieci społecznościowe, strumień

kliknięć w WWW, blogi, portale, posty, maile, profesjonalne publikacje, zasoby

ukryte czy dane produkowane przez urządzenia typu

smart,

tworzą olbrzymie zbio-

ry informacji, których analiza pozwala na uzyskanie nowej wiedzy.

Big data

daje

możliwość przewidywania przyszłości i odkrywania nowych wartości na podstawie

bieżącej analizy nieustannie zwiększających się zasobów informacji (Graczyk-

-Kucharska 2015, 267). Analizy danych wykorzystywane są w celu wychwycenia

korelacji, wzorców i trendów pomocnych zarówno w prognozowaniu zjawisk oraz

tendencji, jak i ludzkich preferencji, zachowań czy nawyków (Stępnik 2015, 150).

Ciągle wzrastająca ilość danych, a także doskonalenie technik ich pozyskiwania,

przechowywania i analizowania umniejszają rolę teorii w odkrywaniu praw rządzą-

cych społeczeństwami ludzkimi.

Big data

same wytwarzają zdolność do poznania

wiedzy dotyczącej skomplikowanych zjawisk. Analizy dokonywane w ramach tego

paradygmatu nie wymagają stosowania się do procedur procesu badawczego. Uzy-

skane dane mają „mówić” same za siebie (Brosz, Bryda, Siuda 2017, 9).

Bardzo istotnym pożytkiem wynikającym z

big data

jest możliwość przewidy-

wania kryzysów społecznych i gospodarczych dzięki wykorzystaniu danych pozy-

skiwanych z serwisów społecznościowych. Bezbłędnie zastosowane wobec dużych

zbiorów danych algorytmy mogą wskazywać na kierunki w myśleniu i postrzega-

niu określonych zagadnień, polaryzację poglądów politycznych, gospodarczych,

społecznych i religijnych (Polańska, Wassilew 2015, 122). Wnioskowanie z anali-

zy danych zebranych na portalach społecznościowych pozwala poznać najnowsze

trendy, preferencje oraz cyfrowe nawyki członków internetowych społeczności.

Bazując na zasobach dostępnych w profilach użytkowników, można uzyskać na

ich temat zarówno dane demograficzne, jak i informacje pochodzące ze śladów

pozostawianych przez nich w rzeczywistości wirtualnej i pozawirtualnej.

Rafinacja informacji w przestrzeni

big data

Rzeczywistość sieciowa dawno już przestała być uważana za alternatywę dla

tradycyjnie rejestrowanej rzeczywistości. Coraz częściej dostrzega się jej imma-

nentny wymiar i traktuje na równi z rzeczywistością realną. Prowadząc badania

społeczne w internecie, należało wypracować nowe kategorie opisu, nowe narzę-

dzia oraz nowe paradygmaty – adekwatne do nieszablonowego, „stechnologizowa-

nego” społeczeństwa. To, o co walczyli zwolennicy teorii zakładających całkowite

oderwanie nauk społecznych od nauk przyrodniczych, w obecnych czasach staje

się całkowicie bezzasadne. Technologia wymusiła poniekąd na „humanistach” się-

187

Ewelina Dziwak

gnięcie do nauk ścisłych. Digitalny wymiar życia mający totalizujący charakter

zawłaszcza wszystkie, nawet nieusieciowione wymiary życia społecznego (Szpu-

nar 2016, 355–356). Informacje w internecie zostają pozbawione linearnego cha-

rakteru, zostają zredukowane do formatu cyfry i przekształcają się w dane.

Dane w społeczeństwie informacyjnym pełnią kluczową funkcję. Wszystko za

sprawą kultury algorytmów, która wymusza imperatyw policzalności wszystkiego.

Kultura nastawiona na zysk redukuje całą rzeczywistość społeczną do formatu

cyfry. Bardziej niż jakość zaczyna liczyć się ilość posiadanych rzeczy, znajomych

w sieciach społecznościowych, „lajków” czy wygenerowanych i skonsumowanych

informacji. Towarzyszący społeczeństwu informacyjnemu proces makdonaldyzacji

sprawia, że najważniejszy okazuje się krótki i zwięzły przekaz, a słowa poboczne,

będące wyrazem kunsztu zawodowego dziennikarza, często okazują się zbędne dla

przeciętnego czytelnika. Internet jest tym medium, które w największym stopniu

sprzyja tworzeniu krótkich, łatwych w odbiorze treści. Tradycyjne dziennikar-

stwo, oparte na dłuższej narracji, w internecie powoli zanika. Ustępuje miejsca

dziennikarstwu danych, które przemawia do czytelnika bardziej niż najlepiej na-

wet napisany tekst. Dziennikarstwo danych nie ma jednej, formalnej definicji.

Pojmowane jest jako umiejętne wykorzystywanie dostępnych w sieci terabajtów

do tworzenia prostych i zwięzłych treści opatrzonych wizualizacją. Obok trady-

cyjnego dziennikarstwa pojawia się dziennikarstwo danych, a obok dziennikarza

humanisty wyłania się dziennikarz biegle władający nie tylko „piórem”, lecz także

językiem programowania.

Informacje pochodzące z różnych źródeł, poddane digitalizacji, a następnie

zewidencjonowane w

big data,

stają się fundamentem do tworzenia nowych treści.

Proces ten – nazywany rafinacją informacji – jest wynikiem korelacji oraz analiz

danych źródłowych (Gogołek 2012). Podstawą rafinacji jest

Culturomics

– narzę-

dzie, dzięki któremu można monitorować media na całym świecie. Prototyp tego

narzędzia narodził się jako owoc współpracy harwardzkich badaczy z pracownika-

Google Books.

W założeniu swoich twórców istotą działania

Culturomicsu

było

odzwierciedlenie popularności danego słowa w odniesieniu do częstotliwości po-

jawiania się go w książkach pochodzących z konkretnego okresu. Koncepcja tego

narzędzia została „zapożyczona” i wykorzystana przez

Institute for Computing in

Humanities, Arts, and Social Sciences

jako próba użycia codziennych wiadomości

i spojrzenie na ich geograficzny rozkład, tak aby można było sprawdzić, w jaki

sposób odpowiednie dane się ze sobą łączą (Leetarau 2011). Innym przykładem

tego typu projektu jest

The Migrants’ Files

skupiający interdyscyplinarne zespo-

ły dziennikarzy, programistów i projektantów mających narzędzia analityczne,

które umożliwiają prowadzenie statystycznych śledztw dziennikarskich. Program

powstał po tragedii, jaka rozegrała się u wybrzeży włoskiej wyspy Lampedusa

i pochłonęła ponad trzysta sześćdziesiąt ofiar wśród uchodźców wojennych z Afry-

188

Wielkie bazy danych jako nowe źródła informacji.

Big data

przyszłością dziennikarstwa?

ki, Bliskiego Wschodu oraz innych regionów. Po tym wydarzeniu konsorcjum

europejskich dziennikarzy zobowiązało się do systematycznego gromadzenia

i analizowania danych na temat śmierci potencjalnych migrantów. Pozyskując,

przetwarzając i analizując zestawy danych pochodzących z różnych źródeł,

The

Migrants’ Files

tworzy kompleksową i wiarygodną bazę danych na temat śmierci

migrantów. Głównymi źródłami pozyskiwania danych do bazy są:

UNITED for

Intercultural Action

– organizacja non profit, której sieć obejmuje ponad pięćset

pięćdziesiąt organizacji z całej Europy,

Fortress Europe

– blog założony przez

dziennikarza Gabriele’a del Grandego, który monitoruje również zgony i zaginię-

cia migrantów w Europie, a także

Puls

– projekt prowadzony przez Uniwersytet

Helsiński w Finlandii i Wspólne Centrum Badawcze Komisji Europejskiej.

Do analiz wszystkich zewidencjonowanych w bazie danych stosowana jest me-

todologia oparta na programie OSINT, stworzonym przez służby wywiadowcze, któ-

ry zbiera dane z publicznie dostępnych źródeł takich jak raporty medialne, publikacje

rządowe, a dodatkowo analizuje treści milionów użytkowników sieci, którzy bardzo

często okazują się naocznymi świadkami wydarzeń. Liczba migrantów ponoszących

śmierć w trakcie poszukiwania schronienia uzyskiwana jest z globalnych informacji

pozyskiwanych w czasie rzeczywistym (The

Migrants’ Files).

Wizualizacja informacji

Przykład

The Migrants’ Files

pokazuje, jak ważne w epoce nadmiaru informacji

jest wejście pod powierzchnię nieuporządkowanego strumienia treści i poszukiwanie

w nich wzajemnych zależności, które pozwolą odkryć niedostrzegane wcześniej

zjawiska i problemy. Istotne staje się także pozyskiwanie cennych informacji ze

źródeł nieustrukturyzowanych, np. portali społecznościowych, blogów itp. Oprócz

bazowania na zewidencjonowanych źródłach charakterystyczne dla dziennikarstwa

danych jest przedstawianie informacji przy zminimalizowaniu języka pisanego na

rzecz języka wizualnego (Piekarski 2017, 207). Istotą dziennikarstwa danych jest

zatem synteza słowa pisanego, języka komputerowego oraz obrazu. Obrazy, którymi

operują dziennikarze danych, nie odwzorowują bezpośrednio rzeczywistości, ale

przynależą do świata obrazów technicznych (Piekarski 2017, 211). Nie są owocem

prac fotoreporterów, lecz wytworem interdyscyplinarnych zespołów składających się

z dziennikarzy, analityków, programistów i grafików komputerowych.

Otaczający nas świat jest niezwykle złożony, a w warunkach „eksplozji infor-

matycznej i przeciążenia naszego układu zmysłów konieczne jest lepsze przyswa-

janie, organizowanie i wykorzystywanie płynących z zewnątrz sygnałów” (Vetula-

ni 1998, 37). Ewolucyjnie nasz system zmysłów oraz układ przetwarzania danych

są przystosowane do takiego środowiska, które znamy z zeszłego wieku. Nasza

psychika „z trudem daje sobie radę z obecnym tempem życia” (Vetulani 1998, 38)

Ewelina_Dziwak_Wielkie_bazy_danych_jako_nowe_ ród a_informacji.pdf

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: