Inteligentna siec Algorytmy przyszlosci Wydanie II.pdf

(1247 KB) Pobierz
Tytuł oryginału: Algorithms of the Intelligent Web, 2nd Edition
Tłumaczenie: Tomasz Walczak
Projekt okładki: Studio Gravite / Olsztyn; Obarek, Pokoński, Pazdrijowski, Zaprucki
Materiały graficzne na okładce zostały wykorzystane za zgodą Shutterstock Images LLC.
ISBN: 978-83-283-3250-8
Original edition copyright © 2016 by Manning Publications Co. All rights reserved.
Polish edition copyright © 2017 by HELION SA. All rights reserved.
All rights reserved. No part of this book may be reproduced or transmitted in any
form or by any means, electronic or mechanical, including photocopying, recording
or by any information storage retrieval system, without permission from the Publisher.
Wszelkie prawa zastrzeżone. Nieautoryzowane rozpowszechnianie całości lub fragmentu niniejszej
publikacji w jakiejkolwiek postaci jest zabronione. Wykonywanie kopii metodą kserograficzną,
fotograficzną, a także kopiowanie książki na nośniku filmowym, magnetycznym lub innym powoduje
naruszenie praw autorskich niniejszej publikacji.
Wszystkie znaki występujące w tekście są zastrzeżonymi znakami firmowymi bądź towarowymi ich
właścicieli.
Autor oraz Wydawnictwo HELION dołożyli wszelkich starań, by zawarte w tej książce informacje były
kompletne i rzetelne. Nie biorą jednak żadnej odpowiedzialności ani za ich wykorzystanie, ani za związane
z tym ewentualne naruszenie praw patentowych lub autorskich. Autor oraz Wydawnictwo HELION
nie ponoszą również żadnej odpowiedzialności za ewentualne szkody wynikłe z wykorzystania informacji
zawartych w książce.
Wydawnictwo HELION
ul. Kościuszki 1c, 44-100 GLIWICE
tel. 32 231 22 19, 32 230 98 63
e-mail:
helion@helion.pl
WWW:
http://helion.pl
(księgarnia internetowa, katalog książek)
Drogi Czytelniku!
Jeżeli chcesz ocenić tę książkę, zajrzyj pod adres
http://helion.pl/user/opinie/intsi2
Możesz tam wpisać swoje uwagi, spostrzeżenia, recenzję.
Pliki z przykładami omawianymi w książce można znaleźć pod adresem:
ftp://ftp.helion.pl/przyklady/intsi2.zip
Printed in Poland.
Kup książkę
Poleć książkę
Oceń książkę
Księgarnia internetowa
Lubię to! » Nasza społeczność
Spis treści
Przedmowa 9
Wprowadzenie 11
Podziękowania 13
O książce 15
Rozdział 1. Budowanie aplikacji na potrzeby inteligentnej sieci
1.1.
1.2.
1.3.
1.4.
19
1.5.
1.6.
1.7.
1.8.
Inteligentny algorytm w akcji — Google Now 21
Cykl
życia
inteligentnych algorytmów 23
Inne przykłady inteligentnych algorytmów 24
Czym inteligentne aplikacje nie są 25
1.4.1. Inteligentne algorytmy nie są myślącymi maszynami
do uniwersalnych zastosowań 25
1.4.2. Inteligentne algorytmy nie zastąpią ludzi 25
1.4.3. Inteligentne algorytmy nie są odkrywane przez przypadek 26
Klasy inteligentnych algorytmów 26
1.5.1. Sztuczna inteligencja 27
1.5.2. Uczenie maszynowe 28
1.5.3. Analityka predykcyjna 29
Ocena działania inteligentnych algorytmów 30
1.6.1. Ocena inteligencji 30
1.6.2. Ocena predykcji 31
Ważne uwagi na temat inteligentnych algorytmów 33
1.7.1. Dane nie są wiarygodne 34
1.7.2. Wnioskowanie wymaga czasu 34
1.7.3. Wielkość ma znaczenie! 34
1.7.4. Różne algorytmy skalują się w odmienny sposób 35
1.7.5. Nie wszystko jest gwoździem! 35
1.7.6. Dane to nie wszystko 35
1.7.7. Czas treningu może się zmieniać 36
1.7.8. Celem jest generalizacja 36
1.7.9. Ludzka intuicja nie zawsze się sprawdza 36
1.7.10. Pomyśl o zaprojektowaniu nowych cech 36
1.7.11. Poznaj wiele różnych modeli 36
1.7.12. Korelacja nie oznacza związku przyczynowo-skutkowego 37
Podsumowanie 37
Kup książkę
Poleć książkę
6
Spis treści
Rozdział 2. Wydobywanie struktury z danych
— klastrowanie i transformacja danych
39
2.1. Dane, struktura, błąd systematyczny i szum 41
2.2. „Przekleństwo wymiarów” 44
2.3. Algorytm k-średnich 45
2.3.1. K-średnie w praktyce 49
2.4. Gaussowski model mieszany 52
2.4.1. Czym jest rozkład Gaussa? 52
2.4.2. Maksymalizacja wartości oczekiwanej i rozkład Gaussa 55
2.4.3. Gaussowski model mieszany 55
2.4.4. Przykład uczenia z użyciem gaussowskiego modelu mieszanego
2.5. Zależności między k-średnimi i algorytmem GMM 59
2.6. Transformacje osi danych 60
2.6.1. Wektory własne i wartości własne 61
2.6.2. Analiza głównych składowych 61
2.6.3. Przykład zastosowania analizy głównych składowych 63
2.7. Podsumowanie 65
57
Rozdział 3. Rekomendowanie odpowiednich treści
67
3.1. Wprowadzenie — internetowy sklep z filmami 68
3.2. Odległość i podobieństwo 69
3.2.1. Więcej o odległości i podobieństwie 73
3.2.2. Który wzór na podobieństwo jest najlepszy? 75
3.3. Jak działają systemy rekomendacji? 76
3.4. Filtrowanie kolaboratywne według użytkowników 77
3.5. Rekomendacje według modelu z wykorzystaniem rozkładu SVD 82
3.5.1. Rozkład SVD 83
3.5.2. Rekomendacje z użyciem rozkładu SVD — wybór filmów
dla danego użytkownika 84
3.5.3. Rekomendacje z wykorzystaniem rozkładu SVD — określanie użytkowników,
których może zainteresować dany film 90
3.6. Konkurs Netflix Prize 93
3.7. Ocenianie systemu rekomendacji 94
3.8. Podsumowanie 96
Rozdział 4. Klasyfikowanie — umieszczanie elementów tam,
gdzie ich miejsce 97
4.1. Do czego potrzebna jest klasyfikacja? 98
4.2. Przegląd klasyfikatorów 101
4.2.1. Strukturalne algorytmy klasyfikacji 102
4.2.2. Statystyczne algorytmy klasyfikacji 104
4.2.3. Cykl
życia
klasyfikatora 105
4.3. Wykrywanie oszustw za pomocą regresji logistycznej
4.3.1. Wprowadzenie do regresji liniowej 106
4.3.2. Od regresji liniowej do logistycznej 108
4.3.3. Implementowanie wykrywania oszustw 111
106
Kup książkę
Poleć książkę
Spis treści
4.4. Czy wyniki są wiarygodne? 119
4.5. Klasyfikowanie w bardzo dużych zbiorach danych
4.6. Podsumowanie 124
7
122
Rozdział 5. Studium przypadku — prognozowanie kliknięć
w reklamie internetowej 127
5.1. Historia i informacje wstępne 128
5.2. Giełda 130
5.2.1. Dopasowywanie plików cookie 130
5.2.2. Oferty 131
5.2.3. Powiadomienie o wygranej (lub przegranej) w licytacji 132
5.2.4. Umieszczanie reklamy 132
5.2.5. Monitorowanie reklam 132
5.3. Czym jest agent? 133
5.3.1. Wymagania stawiane agentowi 133
5.4. Czym jest system podejmowania decyzji? 134
5.4.1. Informacje o użytkowniku 135
5.4.2. Informacje o przestrzeni reklamowej 135
5.4.3. Informacje o kontekście 135
5.4.4. Przygotowywanie danych 135
5.4.5. Model dla systemu podejmowania decyzji 136
5.4.6. Odwzorowywanie prognozowanego współczynnika kliknięć
na oferowaną kwotę 136
5.4.7. Inżynieria cech 137
5.4.8. Trening modelu 137
5.5. Predykcja kliknięć za pomocą biblioteki Vowpal Wabbit 138
5.5.1. Format danych używany w VW 138
5.5.2. Przygotowywanie zbioru danych 141
5.5.3. Testowanie modelu 146
5.5.4. Kalibrowanie modelu 148
5.6. Komplikacje związane z budowaniem systemu podejmowania decyzji
5.7. Przyszłość prognozowania zdarzeń w czasie rzeczywistym 150
5.8. Podsumowanie 151
150
Rozdział 6. Uczenie głębokie i sieci neuronowe
153
6.1. Intuicyjne omówienie uczenia głębokiego 154
6.2. Sieci neuronowe 155
6.3. Perceptron 156
6.3.1. Trening 158
6.3.2. Trening perceptronu z użyciem pakietu scikit-learn 160
6.3.3. Geometryczna interpretacja działania perceptronu dla dwóch wejść
6.4. Perceptrony wielowarstwowe 164
6.4.1. Trening z wykorzystaniem propagacji wstecznej 167
6.4.2. Funkcje aktywacji 168
6.4.3. Intuicyjne wyjaśnienie propagacji wstecznej 169
6.4.4. Teoria propagacji wstecznej 170
6.4.5. Wielowarstwowe sieci neuronowe w pakiecie scikit-learn 172
6.4.6. Perceptron wielowarstwowy po zakończeniu nauki 174
162
Kup książkę
Poleć książkę
Zgłoś jeśli naruszono regulamin