Miejsko-Gminna Biblioteka Publiczna

w Grójcu

book
book

Python w analizie danych : przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter

"Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter "
Tytuł oryginału: "Python for data analysis : data wrangling with pandas, NumPy, and Jupyter, 3rd edition,".

Autor: McKinney, Wes.




Wprawny analityk danych potrafi z nich uzyskać wiedzę ułatwiającą podejmowanie trafnych decyzji. Od kilku lat można do tego używać nowoczesnych narzędzi Pythona, które zbudowano specjalnie do tego celu. Praca z nimi nie wymaga głębokiej znajomości statystyki czy algebry. Aby cieszyć się uzyskanymi rezultatami, wystarczy się wprawić w stosowaniu kilku pakietów i środowisk Pythona.
Ta książka

jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych przypadków i fragmentami kodu. W trakcie lektury nauczysz się korzystać z możliwości oferowanych przez pakiety pandas i NumPy, a także środowiska IPython i Jupyter. Nie zabrakło wskazówek dotyczących używania uniwersalnych narzędzi przeznaczonych do ładowania, czyszczenia, przekształcania i łączenia zbiorów danych. Pozycję docenią analitycy zamierzający zacząć pracę w Pythonie, jak również programiści Pythona, którzy chcą się zająć analizą danych i obliczeniami naukowymi.
Dzięki książce nauczysz się:
- eksplorować dane za pomocą powłoki IPython i środowiska Jupyter
- korzystać z funkcji pakietów NumPy i pandas
- używać pakietu matplotlib do tworzenia czytelnych wizualizacji
- analizować i przetwarzać dane regularnych i nieregularne szeregi czasowe
- rozwiązywać rzeczywiste problemy analityczne

Opis pochodzi od wydawcy

Zobacz pełny opis
Odpowiedzialność:Wes McKinney ; przekład: Andrzej Watrak.
Hasła:Analiza danych
Programowanie (informatyka)
Przetwarzanie danych
Python (język programowania)
Podręcznik
Adres wydawniczy:Gliwice : Helion, copyright 2023.
Wydanie:Wydanie III.
Opis fizyczny:500, [4] strony : ilustracje, wykresy ; 24 cm.
Uwagi:Wydanie 3. odnosi się do oryginału. Na stronie tytułowej i okładce także nazwa wydawcy oryginału: O`Reilly. W książce także ISBN oryginału.
Forma gatunek:Książki. Publikacje dydaktyczne. Publikacje fachowe.
Dziedzina:Informatyka i technologie informacyjne
Powstanie dzieła:2022 r.
Przeznaczenie:Dla analityków zamierzających zacząć pracę w Pythonie oraz programistów Pythona chcących zająć się analizą danych i obliczeniami naukowymi.
Odbiorcy:Analitycy danych. Programiści.
Skocz do:Dodaj recenzje, komentarz
Spis treści:

  1. Przedmowa
  2. 1. Wstęp
  3. 1.1. O czym jest ta książka?
  4. Jakie rodzaje danych?
  5. 1.2. Dlaczego warto korzystać z Pythona w celu przeprowadzenia analizy danych?
  6. Python jako spoiwo
  7. Rozwiązywanie problemu "dwujęzyczności"
  8. Dlaczego nie Python?
  9. 1.3. Podstawowe biblioteki Pythona
  10. NumPy
  11. pandas
  12. Matplotlib
  13. IPython i Jupyter
  14. SciPy
  15. Scikit-learn
  16. statsmodels
  17. Inne pakiety
  18. 1.4. Instalacja i konfiguracja
  19. Windows
  20. GNU, Linux
  21. macOS
  22. Instalacja niezbędnych pakietów
  23. Zintegrowane środowiska programistyczne i edytory tekstowe
  24. 1.5. Społeczność i konferencje
  25. 1.6. Nawigacja po książce
  26. Przykłady kodu
  27. Przykładowe dane
  28. Konwencje importowania
  29. 2. Podstawy Pythona oraz obsługi narzędzi IPython i Jupyter
  30. 2.1. Interpreter Pythona
  31. 2.2. Podstawy interpretera IPython
  32. Uruchamianie powłoki IPython
  33. Uruchamianie notatnika Jupyter Notebook
  34. Uzupełnianie poleceń
  35. Introspekcja
  36. 2.3. Podstawy Pythona
  37. Semantyka języka Python
  38. Skalarne typy danych
  39. Przepływ sterowania
  40. 2.4. Podsumowanie
  41. 3. Wbudowane struktury danych, funkcje i pliki
  42. 3.1. Struktury danych i sekwencje
  43. Krotka
  44. Lista
  45. Słownik
  46. Zbiór
  47. Wbudowane funkcje obsługujące sekwencje
  48. Lista, słownik i zbiór - składanie
  49. 3.2. Funkcje
  50. Przestrzenie nazw, zakres i funkcje lokalne
  51. Zwracanie wielu wartości
  52. Funkcje są obiektami
  53. Funkcje anonimowe (lambda)
  54. Generatory
  55. Błędy i obsługa wyjątków
  56. 3.3. Pliki i system operacyjny
  57. Bajty i kodowanie Unicode w plikach
  58. 3.4. Podsumowanie
  59. 4. Podstawy biblioteki NumPy: obsługa tablic i wektorów
  60. 4.1. NumPy ndarray - wielowymiarowy obiekt tablicowy
  61. Tworzenie tablic ndarray
  62. Typ danych tablic ndarray
  63. Działania matematyczne z tablicami NumPy
  64. Podstawy indeksowania i przechwytywania części
  65. Indeksowanie i wartości logiczne
  66. Indeksowanie specjalne
  67. Transponowanie tablic i zamiana osi
  68. 4.2. Generowanie liczb pseudolosowych
  69. 4.3. Funkcje uniwersalne - szybkie funkcje wykonywane na poszczególnych elementach tablicy
  70. 4.4. Programowanie z użyciem tablic
  71. Logiczne operacje warunkowe jako operacje tablicowe
  72. Metody matematyczne i statystyczne
  73. Metody tablic logicznych
  74. Sortowanie
  75. Wartości unikalne i operacje logiczne
  76. 4.5. Tablice i operacje na plikach
  77. 4.6. Algebra liniowa
  78. 4.7. Przykład: błądzenie losowe
  79. Jednoczesne symulowanie wielu błądzeń losowych
  80. 4.8. Podsumowanie
  81. 5. Rozpoczynamy pracę z biblioteką pandas
  82. 5.1. Wprowadzenie do struktur danych biblioteki pandas
  83. Obiekt Series
  84. Obiekt DataFrame
  85. Obiekty index
  86. 5.2. Podstawowe funkcjonalności
  87. Uaktualnianie indeksu
  88. Odrzucanie elementów osi
  89. Indeksowanie, wybieranie i filtrowanie
  90. Działania arytmetyczne i wyrównywanie danych
  91. Funkcje apply i map
  92. Sortowanie i tworzenie rankingów
  93. Indeksy osi ze zduplikowanymi etykietami
  94. 5.3. Podsumowywanie i generowanie statystyk opisowych
  95. Współczynnik korelacji i kowariancja
  96. Unikalne wartości, ich liczba i przynależność
  97. 5.4. Podsumowanie
  98. 6. Odczyt i zapis danych, formaty plików
  99. 6.1. Odczyt i zapis danych w formacie tekstowym
  100. Wczytywanie części pliku tekstowego
  101. Zapis danych w formacie tekstowym
  102. Praca z plikami danych rozgraniczonych
  103. Dane w formacie JSON
  104. XML i HTML - web scraping
  105. 6.2. Formaty danych binarnych
  106. Wczytywanie plików programu Microsoft Excel
  107. Obsługa formatu HDF5
  108. 6.3. Obsługa interfejsów sieciowych
  109. 6.4. Obsługa baz danych
  110. 6.5. Podsumowanie
  111. 7. Czyszczenie i przygotowywanie danych
  112. 7.1. Obsługa brakujących danych
  113. Filtrowanie brakujących danych
  114. Wypełnianie brakujących danych
  115. 7.2. Przekształcanie danych
  116. Usuwanie duplikatów
  117. Przekształcanie danych przy użyciu funkcji lub mapowania
  118. Zastępowanie wartości
  119. Zmiana nazw indeksów osi
  120. Dyskretyzacja i podział na koszyki
  121. Wykrywanie i filtrowanie elementów odstających
  122. Permutacje i próbkowanie losowe
  123. Przetwarzanie wskaźników i zmiennych zastępczych
  124. 7.3. Rozszerzone typy danych
  125. 7.4. Operacje przeprowadzane na łańcuchach
  126. Metody obiektu typu string
  127. Wyrażenia regularne
  128. Funkcje tekstowe w pakiecie pandas
  129. 7.5. Dane kategoryczne
  130. Kontekst i motywacja
  131. Rozszerzony typ Categorical w bibliotece pandas
  132. Obliczenia na obiektach typu Categorical
  133. Metody obiektu kategorycznego
  134. 7.6. Podsumowanie
  135. 8. Przetwarzanie danych - operacje łączenia, wiązania i przekształcania
  136. 8.1. Indeksowanie hierarchiczne
  137. Zmiana kolejności i sortowanie poziomów
  138. Parametry statystyki opisowej z uwzględnieniem poziomu
  139. Indeksowanie z kolumnami ramki danych
  140. 8.2. Łączenie zbiorów danych
  141. Łączenie ramek danych w stylu łączenia elementów baz danych
  142. Łączenie przy użyciu indeksu
  143. Konkatenacja wzdłuż osi
  144. Łączenie częściowo nakładających się danych
  145. 8.3. Zmiana kształtu i operacje osiowe
  146. Przekształcenia z indeksowaniem hierarchicznym
  147. Przekształcanie z formatu "długiego" na "szeroki"
  148. Przekształcanie z formatu "szerokiego" na "długi"
  149. 8.4. Podsumowanie
  150. 9. Wykresy i wizualizacja danych
  151. 9.1. Podstawy obsługi interfejsu pakietu matplotlib
  152. Obiekty figure i wykresy składowe
  153. Kolory, oznaczenia i style linii
  154. Punkty, etykiety i legendy
  155. Adnotacje i rysunki
  156. Zapisywanie wykresów w postaci plików
  157. Konfiguracja pakietu matplotlib
  158. 9.2. Generowanie wykresów za pomocą pakietów pandas i seaborn
  159. Wykresy liniowe
  160. Wykresy słupkowe
  161. Histogramy i wykresy gęstości
  162. Wykresy punktowe
  163. Wykresy panelowe i dane kategoryczne
  164. 9.3. Inne narzędzia przeznaczone do wizualizacji danych w Pythonie
  165. 9.4. Podsumowanie
  166. 10. Agregacja danych i operacje wykonywane na grupach
  167. 10.1. Mechanika interfejsu groupby
  168. Iteracja po grupach
  169. Wybieranie kolumny lub podzbioru kolumn
  170. Grupowanie przy użyciu słowników i serii
  171. Grupowanie przy użyciu funkcji
  172. Grupowanie przy użyciu poziomów indeksu
  173. 10.2. Agregacja danych
  174. Przetwarzanie kolumna po kolumnie i stosowanie wielu funkcji
  175. Zwracanie zagregowanych danych bez indeksów wierszy
  176. 10.3. Metoda apply - ogólne zastosowanie techniki dziel-zastosuj-połącz
  177. Usuwanie kluczy grup
  178. Kwantyle i analiza koszykowa
  179. Przykład: wypełnianie brakujących wartości przy użyciu wartości charakterystycznych dla grupy
  180. Przykład: losowe generowanie próbek i permutacja
  181. Przykład: średnie ważone grup i współczynnik korelacji
  182. Przykład: regresja liniowa grup
  183. 10.4. Transformacje grup i "nieobudowane" operacje grupowania
  184. 10.5. Tabele przestawne i krzyżowe
  185. Tabele krzyżowe
  186. 10.6. Podsumowanie
  187. 11. Szeregi czasowe
  188. 11.1. Typy danych i narzędzia przeznaczone do obsługi daty i czasu
  189. Konwersja pomiędzy obiektami string i datetime
  190. 11.2. Podstawy szeregów czasowych
  191. Indeksowanie i wybieranie
  192. Szeregi czasowe z duplikatami indeksów
  193. 11.3. Zakresy dat, częstotliwości i przesunięcia
  194. Generowanie zakresów dat
  195. Częstotliwości i przesunięcia daty
  196. Przesuwanie daty
  197. 11.4. Obsługa strefy czasowej
  198. Lokalizacja i konwersja stref czasowych
  199. Operacje z udziałem obiektów Timestamp o wyznaczonej strefie czasowej
  200. Operacje pomiędzy różnymi strefami czasowymi
  201. 11.5. Okresy i przeprowadzanie na nich operacji matematycznych
  202. Konwersja częstotliwości łańcuchów
  203. Kwartalne częstotliwości okresów
  204. Konwersja znaczników czasu na okresy (i z powrotem)
  205. Tworzenie obiektów PeriodIndex na podstawie tablic
  206. 11.6. Zmiana rozdzielczości i konwersja częstotliwości
  207. Zmniejszanie częstotliwości
  208. Zwiększanie rozdzielczości i interpolacja
  209. Zmiana rozdzielczości z okresami
  210. Grupowa zmiana częstotliwości
  211. 11.7. Funkcje ruchomego okna
  212. Funkcje ważone wykładniczo
  213. Binarne funkcje ruchomego okna
  214. Funkcje ruchomego okna definiowane przez użytkownika
  215. 11.8. Podsumowanie
  216. 12. Wprowadzenie do bibliotek modelujących
  217. 12.1. Łączenie pandas z kodem modelu
  218. 12.2. Tworzenie opisów modeli przy użyciu biblioteki Patsy
  219. Przekształcenia danych za pomocą formuł Patsy
  220. Patsy i dane kategoryczne
  221. 12.3. Wprowadzenie do biblioteki statsmodels
  222. Szacowanie modeli liniowych
  223. Szacowanie procesów szeregów czasowych
  224. 12.4. Wprowadzenie do pakietu scikit-learn
  225. 12.5. Podsumowanie
  226. 13. Przykłady analizy danych
  227. 13.1. Dane USA.gov serwisu Bitly
  228. Liczenie stref czasowych w czystym Pythonie
  229. Liczenie stref czasowych przy użyciu pakietu pandas
  230. 13.2. Zbiór danych MovieLens 1M
  231. Wyznaczenie rozbieżności ocen
  232. 13.3. Imiona nadawane dzieciom w USA w latach 1880 - 2010
  233. Analiza trendów imion
  234. 13.4. Baza danych USDA Food
  235. 13.5. Baza danych 2012 Federal Election Commission
  236. Statystyki datków z podziałem na wykonywany zawód i pracodawcę
  237. Podział kwot datków na koszyki
  238. Statystyki datków z podziałem na poszczególne stany
  239. 13.6. Podsumowanie
  240. A. Zaawansowane zagadnienia związane z biblioteką NumPy
  241. A.1. Szczegóły budowy obiektu ndarray
  242. Hierarchia typów danych NumPy
  243. A.2. Zaawansowane operacje tablicowe
  244. Zmiana wymiarów tablic
  245. Kolejności charakterystyczne dla języków C i Fortran
  246. Łączenie i dzielenie tablic
  247. Powtarzanie elementów - funkcje tile i repeat
  248. Alternatywy indeksowania specjalnego - metody take i put
  249. A.3. Rozgłaszanie
  250. Rozgłaszanie wzdłuż innych osi
  251. Przypisywanie wartości elementom tablicy poprzez rozgłaszanie
  252. A.4. Zaawansowane zastosowania funkcji uniwersalnych
  253. Metody instancji funkcji uniwersalnych
  254. Pisanie nowych funkcji uniwersalnych w Pythonie
  255. A.5. Tablice o złożonej strukturze
  256. Zagnieżdżone typy danych i pola wielowymiarowe
  257. Do czego przydają się tablice o złożonej strukturze?
  258. A.6. Jeszcze coś o sortowaniu
  259. Sortowanie pośrednie - metody argsort i lexsort
  260. Alternatywne algorytmy sortowania
  261. Częściowe sortowanie tablic
  262. Wyszukiwanie elementów w posortowanej tablicy za pomocą metody numpy.searchsorted
  263. A.7. Pisanie szybkich funkcji NumPy za pomocą pakietu Numba
  264. Tworzenie obiektów numpy.ufunc za pomocą pakietu Numba
  265. A.8. Zaawansowane tablicowe operacje wejścia i wyjścia
  266. Pliki mapowane w pamięci
  267. HDF5 i inne możliwości zapisu tablic
  268. A.9. Jak zachować wysoką wydajność?
  269. Dlaczego warto korzystać z sąsiadujących ze sobą obszarów pamięci?
  270. B. Dodatkowe informacje dotyczące systemu IPython
  271. B.1. Skróty klawiaturowe
  272. B.2. Magiczne polecenia
  273. Polecenie %run
  274. Uruchamianie kodu zapisanego w schowku
  275. B.3. Korzystanie z historii poleceń
  276. Przeszukiwanie i korzystanie z historii poleceń
  277. Zmienne wejściowe i wyjściowe
  278. B.4. Interakcja z systemem operacyjnym
  279. Polecenia powłoki systemowej i aliasy
  280. System tworzenia skrótów do katalogów
  281. B.5. Narzędzia programistyczne
  282. Interaktywny debuger
  283. Pomiar czasu - funkcje %time i %timeit
  284. Podstawowe profilowanie - funkcje %prun i %run-p
  285. Profilowanie funkcji linia po linii
  286. B.6. Wskazówki dotyczące produktywnego tworzenia kodu w środowisku IPython
  287. Przeładowywanie modułów
  288. Wskazówki dotyczące projektowania kodu
  289. B.7. Zaawansowane funkcje środowiska IPython
  290. Profile i konfiguracja
  291. B.8. Podsumowanie

Zobacz spis treści



Sprawdź dostępność, zarezerwuj (zamów):

(kliknij w nazwę placówki - więcej informacji)

Wyp. dla Dorosłych
Aleja Niepodległości 20

Sygnatura: 004
Numer inw.: 130016
Dostępność: wypożyczana na 30 dni

schowekzamów

Dodaj komentarz do pozycji:

Swoją opinię można wyrazić po uprzednim zalogowaniu.