Zaawansowana analiza danych w PySpark: metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje d...
Gespeichert in:
Beteiligte Personen: | , , , , |
---|---|
Weitere beteiligte Personen: | |
Format: | Elektronisch E-Book |
Sprache: | Polnisch |
Veröffentlicht: |
Gliwice
Helion
[2023]
|
Ausgabe: | [First edition]. |
Schlagwörter: | |
Links: | https://learning.oreilly.com/library/view/-/9788383220703/?ar |
Zusammenfassung: | Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. |
Umfang: | 1 Online-Ressource (192 Seiten) illustrations |
ISBN: | 9788383220703 8383220707 |
Internformat
MARC
LEADER | 00000cam a22000002 4500 | ||
---|---|---|---|
001 | ZDB-30-ORH-093387911 | ||
003 | DE-627-1 | ||
005 | 20240228122014.0 | ||
007 | cr uuu---uuuuu | ||
008 | 230626s2023 xx |||||o 00| ||pol c | ||
020 | |a 9788383220703 |c electronic bk. |9 978-83-8322-070-3 | ||
020 | |a 8383220707 |c electronic bk. |9 83-8322-070-7 | ||
035 | |a (DE-627-1)093387911 | ||
035 | |a (DE-599)KEP093387911 | ||
035 | |a (ORHE)9788383220703 | ||
035 | |a (DE-627-1)093387911 | ||
040 | |a DE-627 |b ger |c DE-627 |e rda | ||
041 | |a pol | ||
082 | 0 | |a 006.3/12 |2 23/eng/20230614 | |
100 | 1 | |a Tandon, Akash |e VerfasserIn |4 aut | |
240 | 1 | 0 | |a Advanced analytics with PySpark |
245 | 1 | 0 | |a Zaawansowana analiza danych w PySpark |b metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |c Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak |
250 | |a [First edition]. | ||
264 | 1 | |a Gliwice |b Helion |c [2023] | |
300 | |a 1 Online-Ressource (192 Seiten) |b illustrations | ||
336 | |a Text |b txt |2 rdacontent | ||
337 | |a Computermedien |b c |2 rdamedia | ||
338 | |a Online-Ressource |b cr |2 rdacarrier | ||
520 | |a Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. | ||
630 | 2 | 0 | |a SPARK (Electronic resource) |
650 | 0 | |a Data mining | |
650 | 0 | |a Big data | |
650 | 0 | |a Python (Computer program language) | |
650 | 4 | |a SPARK (Electronic resource) | |
650 | 4 | |a Exploration de données (Informatique) | |
650 | 4 | |a Données volumineuses | |
650 | 4 | |a Python (Langage de programmation) | |
650 | 4 | |a Big data | |
650 | 4 | |a Data mining | |
650 | 4 | |a Python (Computer program language) | |
700 | 1 | |a Ryza, Sandy |e VerfasserIn |4 aut | |
700 | 1 | |a Laserson, Uri |d 1983- |e VerfasserIn |4 aut | |
700 | 1 | |a Owen, Sean |e VerfasserIn |4 aut | |
700 | 1 | |a Wills, Josh |e VerfasserIn |4 aut | |
700 | 1 | |a Watrak, Andrzej |e ÜbersetzerIn |4 trl | |
966 | 4 | 0 | |l DE-91 |p ZDB-30-ORH |q TUM_PDA_ORH |u https://learning.oreilly.com/library/view/-/9788383220703/?ar |m X:ORHE |x Aggregator |z lizenzpflichtig |3 Volltext |
912 | |a ZDB-30-ORH | ||
951 | |a BO | ||
912 | |a ZDB-30-ORH | ||
049 | |a DE-91 |
Datensatz im Suchindex
DE-BY-TUM_katkey | ZDB-30-ORH-093387911 |
---|---|
_version_ | 1821494940941680640 |
adam_text | |
any_adam_object | |
author | Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh |
author2 | Watrak, Andrzej |
author2_role | trl |
author2_variant | a w aw |
author_facet | Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh Watrak, Andrzej |
author_role | aut aut aut aut aut |
author_sort | Tandon, Akash |
author_variant | a t at s r sr u l ul s o so j w jw |
building | Verbundindex |
bvnumber | localTUM |
collection | ZDB-30-ORH |
ctrlnum | (DE-627-1)093387911 (DE-599)KEP093387911 (ORHE)9788383220703 |
dewey-full | 006.3/12 |
dewey-hundreds | 000 - Computer science, information, general works |
dewey-ones | 006 - Special computer methods |
dewey-raw | 006.3/12 |
dewey-search | 006.3/12 |
dewey-sort | 16.3 212 |
dewey-tens | 000 - Computer science, information, general works |
discipline | Informatik |
edition | [First edition]. |
format | Electronic eBook |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>03394cam a22005412 4500</leader><controlfield tag="001">ZDB-30-ORH-093387911</controlfield><controlfield tag="003">DE-627-1</controlfield><controlfield tag="005">20240228122014.0</controlfield><controlfield tag="007">cr uuu---uuuuu</controlfield><controlfield tag="008">230626s2023 xx |||||o 00| ||pol c</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9788383220703</subfield><subfield code="c">electronic bk.</subfield><subfield code="9">978-83-8322-070-3</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">8383220707</subfield><subfield code="c">electronic bk.</subfield><subfield code="9">83-8322-070-7</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-627-1)093387911</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)KEP093387911</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(ORHE)9788383220703</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-627-1)093387911</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-627</subfield><subfield code="b">ger</subfield><subfield code="c">DE-627</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1=" " ind2=" "><subfield code="a">pol</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">006.3/12</subfield><subfield code="2">23/eng/20230614</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Tandon, Akash</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="240" ind1="1" ind2="0"><subfield code="a">Advanced analytics with PySpark</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Zaawansowana analiza danych w PySpark</subfield><subfield code="b">metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark</subfield><subfield code="c">Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">[First edition].</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Gliwice</subfield><subfield code="b">Helion</subfield><subfield code="c">[2023]</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 Online-Ressource (192 Seiten)</subfield><subfield code="b">illustrations</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="a">Text</subfield><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="a">Computermedien</subfield><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="a">Online-Ressource</subfield><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.</subfield></datafield><datafield tag="630" ind1="2" ind2="0"><subfield code="a">SPARK (Electronic resource)</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Data mining</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Big data</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Python (Computer program language)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">SPARK (Electronic resource)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Exploration de données (Informatique)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Données volumineuses</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Python (Langage de programmation)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Big data</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Data mining</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Python (Computer program language)</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Ryza, Sandy</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Laserson, Uri</subfield><subfield code="d">1983-</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Owen, Sean</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Wills, Josh</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Watrak, Andrzej</subfield><subfield code="e">ÜbersetzerIn</subfield><subfield code="4">trl</subfield></datafield><datafield tag="966" ind1="4" ind2="0"><subfield code="l">DE-91</subfield><subfield code="p">ZDB-30-ORH</subfield><subfield code="q">TUM_PDA_ORH</subfield><subfield code="u">https://learning.oreilly.com/library/view/-/9788383220703/?ar</subfield><subfield code="m">X:ORHE</subfield><subfield code="x">Aggregator</subfield><subfield code="z">lizenzpflichtig</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-30-ORH</subfield></datafield><datafield tag="951" ind1=" " ind2=" "><subfield code="a">BO</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-30-ORH</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91</subfield></datafield></record></collection> |
id | ZDB-30-ORH-093387911 |
illustrated | Illustrated |
indexdate | 2025-01-17T11:22:22Z |
institution | BVB |
isbn | 9788383220703 8383220707 |
language | Polish |
open_access_boolean | |
owner | DE-91 DE-BY-TUM |
owner_facet | DE-91 DE-BY-TUM |
physical | 1 Online-Ressource (192 Seiten) illustrations |
psigel | ZDB-30-ORH TUM_PDA_ORH ZDB-30-ORH |
publishDate | 2023 |
publishDateSearch | 2023 |
publishDateSort | 2023 |
publisher | Helion |
record_format | marc |
spelling | Tandon, Akash VerfasserIn aut Advanced analytics with PySpark Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak [First edition]. Gliwice Helion [2023] 1 Online-Ressource (192 Seiten) illustrations Text txt rdacontent Computermedien c rdamedia Online-Ressource cr rdacarrier Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation) Ryza, Sandy VerfasserIn aut Laserson, Uri 1983- VerfasserIn aut Owen, Sean VerfasserIn aut Wills, Josh VerfasserIn aut Watrak, Andrzej ÜbersetzerIn trl |
spellingShingle | Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation) |
title | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |
title_alt | Advanced analytics with PySpark |
title_auth | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |
title_exact_search | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |
title_full | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak |
title_fullStr | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak |
title_full_unstemmed | Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak |
title_short | Zaawansowana analiza danych w PySpark |
title_sort | zaawansowana analiza danych w pyspark metody przetwarzania informacji na szeroka skale z wykorzystaniem pythona i systemu spark |
title_sub | metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark |
topic | SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation) |
topic_facet | SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation) |
work_keys_str_mv | AT tandonakash advancedanalyticswithpyspark AT ryzasandy advancedanalyticswithpyspark AT lasersonuri advancedanalyticswithpyspark AT owensean advancedanalyticswithpyspark AT willsjosh advancedanalyticswithpyspark AT watrakandrzej advancedanalyticswithpyspark AT tandonakash zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT ryzasandy zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT lasersonuri zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT owensean zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT willsjosh zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT watrakandrzej zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark |