Książki
Papiernia
Zabawki
Gry
Puzzle
Multimedia
Różności
Skarpetki
LEGO
Promocje

Zaawansowana analiza danych w PySpark

Okładka książki Zaawansowana analiza danych w PySpark

Szczegóły:

Wydawca: Helion
ISBN: 9788383220697
EAN: 9788383220697
oprawa: Miękka
Tłumaczenie: Watrak Andrzej
tytuloryg: Advanced Analytics with PySpark: Patterns for Learning from Data at Scale Using Python and Spark
wydanie: 1
format: 16.5x23.5cm
język: polski
liczba stron: 192
rok wydania: 2023
(0) Sprawdź recenzje
Cena:
40,94 zł
Cena detaliczna: 
69,00 zł
41% rabatu
WYSYŁKA: 3 - 5 dni
Dodaj do koszyka
Dodaj do schowka
Najniższa cena z ostatnich 30 dni: 38,19

Opis

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Dzięki książce poznasz:

model programowania w ekosystemie Spark

podstawowe metody stosowane w nauce o danych

pełne implementacje analiz dużych publicznych zbiorów danych

konkretne przypadki użycia narzędzi uczenia maszynowego

kod, który łatwo dostosujesz do swoich potrzeb

PySpark: systemowa odpowiedź na problemy inżyniera danych!

Uwaga!!!
Ten produkt jest zapowiedzią. Realizacja Twojego zamówienia ulegnie przez to wydłużeniu do czasu premiery tej pozycji. Czy chcesz dodać ten produkt do koszyka?
Tak
Nie
Oczekiwanie na odpowiedź
Dodano produkt do koszyka
Kontynuuj zakupy
Przejdź do koszyka
Oczekiwanie na odpowiedź
Oczekiwanie na odpowiedź
Wybierz wariant produktu
Dodaj do koszyka
Anuluj
Oczekiwanie na odpowiedź