- Autor: Opracowanie zbiorowe
 - Wydawca: HELION
 - EAN: 9788383220697
 - Oprawa: miękka
 - Cena sug. br.: 69,00 zł
 - Cena brutto: 69,00 zł (w tym 5% VAT)
 - Cena netto: 65,71 zł
 - Data premiery: 2023-03-07
 - Dostępne od: 2023-03-08
 - Dostępność: Brak
 
                Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.
Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
          
Tylko zalogowani, zarejestrowani użytkownicy
          instytucjonalni mogą zamawiać towar
          Chcesz zostać klientem Liber? Prosimy o kontakt z działem handlowym.
        
Użytkowników indywidualnych zapraszamy do sklepu detalicznego.
          Rozpoczeto import danych
          z Navireo.