Hurtownie danych Od przetwarzania analitycznego do raportowania Wydanie II.pdf
(
2534 KB
)
Pobierz
Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej
publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną,
fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym
powoduje naruszenie praw autorskich niniejszej publikacji.
Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich
właścicieli.
Autor oraz Helion SA dołożyli wszelkich starań, by zawarte w tej książce informacje były kompletne
i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane
z tym ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Helion SA nie ponoszą
również żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji
zawartych w książce.
Redaktor prowadzący: Grzegorz Krzystek
Projekt okładki: Studio Gravite
Bazę danych wykorzystaną w zapytaniach analitycznych zamieszczonych w książce
można znaleźć pod adresem:
ftp://ftp.helion.pl/przyklady/hurda2.zip
Helion SA
ul. Kościuszki 1c, 44-100 Gliwice
tel. 32 231 22 19, 32 230 98 63
e-mail:
helion@helion.pl
WWW:
http://helion.pl
(księgarnia internetowa, katalog książek)
Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/hurda2
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.
ISBN: 978-83-283-7411-9
Copyright © Helion SA 2021
Printed in Poland.
•
Kup książkę
•
Poleć książkę
•
Oceń książkę
•
Księgarnia internetowa
•
Lubię to! » Nasza społeczność
Spis treści
Od autora ................................................................................................................ 5
Od autora do wydania drugiego, uzupełnionego ........................................................ 7
Rozdział 1. Wstęp ..................................................................................................... 9
Rozdział 2. Zapytania analityczne .............................................................................17
Podstawy składni .............................................................................................................................17
Grupowanie w SQL .........................................................................................................................23
Grupowanie nad oknem logicznym ..............................................................................................34
Funkcje agregujące zdefiniowane przez użytkownika ................................................................40
Rozdział 3. Struktura hurtowni danych .....................................................................49
Rola hurtowni danych w procesie przetwarzania .......................................................................49
Proces integracji danych .................................................................................................................52
Elementy hurtowni danych ............................................................................................................54
Rozdział 4. Integracja danych ...................................................................................65
Wprowadzenie do Integration Services ........................................................................................65
Prosta migracja danych ...................................................................................................................68
Kontener FOR LOOP .....................................................................................................................83
Kontener FOREACH LOOP ..........................................................................................................97
Sprawdzanie zgodności danych ze słownikiem .........................................................................110
Uruchamianie pakietów integracyjnych ....................................................................................124
Wykorzystywanie zapytań SQL do migracji danych ................................................................129
Rozdział 5. Wizualne tworzenie elementów hurtowni danych ..................................139
Wstęp do Analysis Services ..........................................................................................................139
Tworzenie podstawowej struktury hurtowni danych ..............................................................154
Kup książkę
Poleć książkę
4
Hurtownie danych. Od przetwarzania analitycznego do raportowania
Modyfikacja struktury hurtowni danych ...................................................................................173
Kostka o strukturze płatka śniegu ...............................................................................................195
Tworzenie hurtowni danych z zastosowaniem tabel pośrednich ...........................................198
Definiowanie zaawansowanych elementów kostki ...................................................................218
Struktura uprawnień do korzystania z hurtowni danych ........................................................244
Dodatkowe funkcjonalności Analysis Services .........................................................................249
Rozdział 6. Analiza danych z wykorzystaniem rozszerzenia MDX ...............................273
Podstawy składni zapytań MDX .................................................................................................273
Operacje na zbiorach atrybutów .................................................................................................283
Definiowanie miar ad hoc ............................................................................................................291
Definiowanie ad hoc zbiorów atrybutów ...................................................................................298
Zastosowanie wskazania poziomu hierarchii do wyznaczania miar ......................................305
Wyświetlanie wielu poziomów hierarchii ..................................................................................309
Wyznaczanie miar jako wyrażeń dla różnych elementów i poziomów hierarchii ...............311
Filtrowanie w zapytaniach MDX .................................................................................................321
Wyznaczanie przedziałów i zakresów dla wymiarów ...............................................................326
Zastosowanie instrukcji warunkowych ......................................................................................336
Zastosowanie funkcji agregujących w zapytaniach MDX ........................................................339
Definiowanie złożonej struktury dla wymiaru czasu ...............................................................344
Definiowanie operacji na zbiorach atrybutów ..........................................................................347
Funkcje analityczne i statystyczne w MDX ................................................................................350
Podsumowanie wiadomości o zapytaniach wybierających MDX ..........................................356
Tworzenie i testowanie nietrwałych struktur wielowymiarowych .........................................366
Rozdział 7. Raportowanie ......................................................................................405
Zastosowanie MS Excel do tworzenia raportów dla hurtowni danych ..................................405
Zastosowanie języków wyższego rzędu do tworzenia raportów .............................................419
Zastosowanie Reporting Services — podstawy .........................................................................429
Konfigurowanie serwera http dla potrzeb Reporting Services ................................................440
Synchronizowanie raportów ........................................................................................................453
Raporty o strukturze macierzowej ..............................................................................................465
Definiowanie akcji dla raportów .................................................................................................475
Definiowanie grup hierarchicznych ............................................................................................480
Raportowanie dla danych pochodzących z hurtowni ..............................................................485
Rozdział 8. Podsumowanie. Co dalej z analitycznym przetwarzaniem danych? ...........503
O autorze ..............................................................................................................507
Kup książkę
Poleć książkę
Rozdział 3.
Struktura hurtowni danych
Rola hurtowni danych w procesie przetwarzania
Po rozważaniach przeprowadzonych w poprzednim rozdziale pojawia się wątpliwość, czy
potrzebne nam są jeszcze jakieś dodatkowe narzędzia do prowadzenia analizy danych. Przecież
zakres funkcji proponowany po stronie transakcyjnej jest tak duży. Niestety, nie wyczerpuje
to oczekiwań, jakie przed analizami relacyjnych modeli baz danych stawia współczesność.
Przede wszystkim należy odrzucić założenie, przyjmowane dotąd niejawnie, że mamy
niewyczerpane zasoby sprzętowe. Duża ilość danych z reguły pociąga za sobą dużą ilość żą-
dań dostępu. Dla dużych wolumenów przetwarzanie złożonych zapytań analitycznych wiąże się
z dużym zapotrzebowaniem na pamięć. Powoduje to znaczące obciążenie systemu, co może pro-
wadzić do problemów z wydajnością bieżącego przetwarzania operacji transakcyjnych. Pro-
stym rozwiązaniem wydaje się przeniesienie wykonywania zapytań analitycznych na okres
najmniejszego obciążenia bazy danych — zwykle pomiędzy 3 a 5 w nocy (nocne marki już śpią,
a ranne ptaszki jeszcze nie wstały). Dodatkowe zamknięcie przetwarzania w ramach trans-
akcji z adekwatnie wysokim poziomem izolacji transakcji (read only) powoduje, że wszystkie
analizy prowadzone będą dla tego samego zestawu rekordów, np. z godziny 0:00, kiedy
przestawiono poziom izolacji transakcji i rozpoczęto transakcję „analityczną”. Silnik serwera od-
ciążony, zestaw danych ustalony, liczba funkcji analitycznych wystarczająca — można powie-
dzieć, że wszystkie warunki zostały spełnione. Niestety, wraz ze wzrostem liczby danych rośnie
zarówno zapotrzebowanie na liczbę wykonywanych analiz, jak i czas realizacji każdej z nich
i proste zabiegi odciążające serwer mogą być niedostateczne. Ponadto założono dość wyidealizo-
wany zestaw danych wyjściowych. Przede wszystkim przyjęto, że wszystkie dane zgroma-
dzone w systemie transakcyjnym są przydatne w analizie. W praktyce przetwarzaniu
analitycznemu podlega tylko niewielka liczba kolumn wyjściowych tabel. Pomijane są najbardziej
szczegółowe informacje zawarte w rekordach. Drugim uproszczeniem jest założenie, że wszystkie
informacje są wprowadzone poprawnie. Niestety, jakże często w praktyce nie są stosowane
słowniki wartości, a istotne wartości atrybutów są wpisywane ręcznie, np. nazwy miast. W prze-
twarzaniu transakcyjnym powstaje również sporo „śmieci” będących efektem niefrasobliwych
działań operatorów: zapisywanie pustych lub niepełnych rekordów, etc. Te dane powinny
zostać odfiltrowane i ujednolicone. Najważniejszym jednak problemem pozostaje to, że
w przypadku prowadzenia analiz dla dużych przedsiębiorstw rzadko kiedy mamy do czynienia
Kup książkę
Poleć książkę
Plik z chomika:
PDFator
Inne pliki z tego folderu:
Analiza danych w zarzadzaniu projektami.pdf
(3336 KB)
Access Analiza danych Receptury.pdf
(655 KB)
Analiza biznesowa Praktyczne modelowanie organizacji.pdf
(833 KB)
Badanie danych Raport z pierwszej linii dzialan.pdf
(1789 KB)
Analiza i prezentacja danych w Microsoft Excel Vademecum Walkenbacha.pdf
(780 KB)
Inne foldery tego chomika:
3ds max
50 zadań i zagadek szachowych
Access
Acrobat
Administracja
Zgłoś jeśli
naruszono regulamin