Internformat: Zaawansowana analiza danych w PySpark | Technische Universität München

Zaawansowana analiza danych w PySpark: metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje d...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Beteiligte Personen:	Tandon, Akash (VerfasserIn), Ryza, Sandy (VerfasserIn), Laserson, Uri 1983- (VerfasserIn), Owen, Sean (VerfasserIn), Wills, Josh (VerfasserIn)
Weitere beteiligte Personen:	Watrak, Andrzej (ÜbersetzerIn)
Format:	Elektronisch E-Book
Sprache:	Polnisch
Veröffentlicht:	Gliwice Helion [2023]
Ausgabe:	[First edition].
Schlagwörter:	SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation)
Links:	https://learning.oreilly.com/library/view/-/9788383220703/?ar
Zusammenfassung:	Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
Umfang:	1 Online-Ressource (192 Seiten) illustrations
ISBN:	9788383220703 8383220707

Internformat

MARC


LEADER	00000cam a22000002 4500
001	ZDB-30-ORH-093387911
003	DE-627-1
005	20240228122014.0
007	cr uuu---uuuuu
008	230626s2023 xx \|\|\|\|\|o 00\| \|\|pol c
020			\|a 9788383220703 \|c electronic bk. \|9 978-83-8322-070-3
020			\|a 8383220707 \|c electronic bk. \|9 83-8322-070-7
035			\|a (DE-627-1)093387911
035			\|a (DE-599)KEP093387911
035			\|a (ORHE)9788383220703
035			\|a (DE-627-1)093387911
040			\|a DE-627 \|b ger \|c DE-627 \|e rda
041			\|a pol
082	0		\|a 006.3/12 \|2 23/eng/20230614
100	1		\|a Tandon, Akash \|e VerfasserIn \|4 aut
240	1	0	\|a Advanced analytics with PySpark
245	1	0	\|a Zaawansowana analiza danych w PySpark \|b metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark \|c Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak
250			\|a [First edition].
264		1	\|a Gliwice \|b Helion \|c [2023]
300			\|a 1 Online-Ressource (192 Seiten) \|b illustrations
336			\|a Text \|b txt \|2 rdacontent
337			\|a Computermedien \|b c \|2 rdamedia
338			\|a Online-Ressource \|b cr \|2 rdacarrier
520			\|a Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
630	2	0	\|a SPARK (Electronic resource)
650		0	\|a Data mining
650		0	\|a Big data
650		0	\|a Python (Computer program language)
650		4	\|a SPARK (Electronic resource)
650		4	\|a Exploration de données (Informatique)
650		4	\|a Données volumineuses
650		4	\|a Python (Langage de programmation)
650		4	\|a Big data
650		4	\|a Data mining
650		4	\|a Python (Computer program language)
700	1		\|a Ryza, Sandy \|e VerfasserIn \|4 aut
700	1		\|a Laserson, Uri \|d 1983- \|e VerfasserIn \|4 aut
700	1		\|a Owen, Sean \|e VerfasserIn \|4 aut
700	1		\|a Wills, Josh \|e VerfasserIn \|4 aut
700	1		\|a Watrak, Andrzej \|e ÜbersetzerIn \|4 trl
966	4	0	\|l DE-91 \|p ZDB-30-ORH \|q TUM_PDA_ORH \|u https://learning.oreilly.com/library/view/-/9788383220703/?ar \|m X:ORHE \|x Aggregator \|z lizenzpflichtig \|3 Volltext
912			\|a ZDB-30-ORH
951			\|a BO
912			\|a ZDB-30-ORH
049			\|a DE-91

Datensatz im Suchindex

DE-BY-TUM_katkey	ZDB-30-ORH-093387911
_version_	1821494940941680640
adam_text
any_adam_object
author	Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh
author2	Watrak, Andrzej
author2_role	trl
author2_variant	a w aw
author_facet	Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh Watrak, Andrzej
author_role	aut aut aut aut aut
author_sort	Tandon, Akash
author_variant	a t at s r sr u l ul s o so j w jw
building	Verbundindex
bvnumber	localTUM
collection	ZDB-30-ORH
ctrlnum	(DE-627-1)093387911 (DE-599)KEP093387911 (ORHE)9788383220703
dewey-full	006.3/12
dewey-hundreds	000 - Computer science, information, general works
dewey-ones	006 - Special computer methods
dewey-raw	006.3/12
dewey-search	006.3/12
dewey-sort	16.3 212
dewey-tens	000 - Computer science, information, general works
discipline	Informatik
edition	[First edition].
format	Electronic eBook
fullrecord	<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>03394cam a22005412 4500</leader><controlfield tag="001">ZDB-30-ORH-093387911</controlfield><controlfield tag="003">DE-627-1</controlfield><controlfield tag="005">20240228122014.0</controlfield><controlfield tag="007">cr uuu---uuuuu</controlfield><controlfield tag="008">230626s2023 xx \|\|\|\|\|o 00\| \|\|pol c</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9788383220703</subfield><subfield code="c">electronic bk.</subfield><subfield code="9">978-83-8322-070-3</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">8383220707</subfield><subfield code="c">electronic bk.</subfield><subfield code="9">83-8322-070-7</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-627-1)093387911</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)KEP093387911</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(ORHE)9788383220703</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-627-1)093387911</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-627</subfield><subfield code="b">ger</subfield><subfield code="c">DE-627</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1=" " ind2=" "><subfield code="a">pol</subfield></datafield><datafield tag="082" ind1="0" ind2=" "><subfield code="a">006.3/12</subfield><subfield code="2">23/eng/20230614</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Tandon, Akash</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="240" ind1="1" ind2="0"><subfield code="a">Advanced analytics with PySpark</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Zaawansowana analiza danych w PySpark</subfield><subfield code="b">metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark</subfield><subfield code="c">Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak</subfield></datafield><datafield tag="250" ind1=" " ind2=" "><subfield code="a">[First edition].</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Gliwice</subfield><subfield code="b">Helion</subfield><subfield code="c">[2023]</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">1 Online-Ressource (192 Seiten)</subfield><subfield code="b">illustrations</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="a">Text</subfield><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="a">Computermedien</subfield><subfield code="b">c</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="a">Online-Ressource</subfield><subfield code="b">cr</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="520" ind1=" " ind2=" "><subfield code="a">Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.</subfield></datafield><datafield tag="630" ind1="2" ind2="0"><subfield code="a">SPARK (Electronic resource)</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Data mining</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Big data</subfield></datafield><datafield tag="650" ind1=" " ind2="0"><subfield code="a">Python (Computer program language)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">SPARK (Electronic resource)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Exploration de données (Informatique)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Données volumineuses</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Python (Langage de programmation)</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Big data</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Data mining</subfield></datafield><datafield tag="650" ind1=" " ind2="4"><subfield code="a">Python (Computer program language)</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Ryza, Sandy</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Laserson, Uri</subfield><subfield code="d">1983-</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Owen, Sean</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Wills, Josh</subfield><subfield code="e">VerfasserIn</subfield><subfield code="4">aut</subfield></datafield><datafield tag="700" ind1="1" ind2=" "><subfield code="a">Watrak, Andrzej</subfield><subfield code="e">ÜbersetzerIn</subfield><subfield code="4">trl</subfield></datafield><datafield tag="966" ind1="4" ind2="0"><subfield code="l">DE-91</subfield><subfield code="p">ZDB-30-ORH</subfield><subfield code="q">TUM_PDA_ORH</subfield><subfield code="u">https://learning.oreilly.com/library/view/-/9788383220703/?ar</subfield><subfield code="m">X:ORHE</subfield><subfield code="x">Aggregator</subfield><subfield code="z">lizenzpflichtig</subfield><subfield code="3">Volltext</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-30-ORH</subfield></datafield><datafield tag="951" ind1=" " ind2=" "><subfield code="a">BO</subfield></datafield><datafield tag="912" ind1=" " ind2=" "><subfield code="a">ZDB-30-ORH</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-91</subfield></datafield></record></collection>
id	ZDB-30-ORH-093387911
illustrated	Illustrated
indexdate	2025-01-17T11:22:22Z
institution	BVB
isbn	9788383220703 8383220707
language	Polish
open_access_boolean
owner	DE-91 DE-BY-TUM
owner_facet	DE-91 DE-BY-TUM
physical	1 Online-Ressource (192 Seiten) illustrations
psigel	ZDB-30-ORH TUM_PDA_ORH ZDB-30-ORH
publishDate	2023
publishDateSearch	2023
publishDateSort	2023
publisher	Helion
record_format	marc
spelling	Tandon, Akash VerfasserIn aut Advanced analytics with PySpark Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak [First edition]. Gliwice Helion [2023] 1 Online-Ressource (192 Seiten) illustrations Text txt rdacontent Computermedien c rdamedia Online-Ressource cr rdacarrier Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych. Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy. SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation) Ryza, Sandy VerfasserIn aut Laserson, Uri 1983- VerfasserIn aut Owen, Sean VerfasserIn aut Wills, Josh VerfasserIn aut Watrak, Andrzej ÜbersetzerIn trl
spellingShingle	Tandon, Akash Ryza, Sandy Laserson, Uri 1983- Owen, Sean Wills, Josh Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation)
title	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
title_alt	Advanced analytics with PySpark
title_auth	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
title_exact_search	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
title_full	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak
title_fullStr	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak
title_full_unstemmed	Zaawansowana analiza danych w PySpark metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills ; tłumaczenie Andrzej Watrak
title_short	Zaawansowana analiza danych w PySpark
title_sort	zaawansowana analiza danych w pyspark metody przetwarzania informacji na szeroka skale z wykorzystaniem pythona i systemu spark
title_sub	metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
topic	SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation)
topic_facet	SPARK (Electronic resource) Data mining Big data Python (Computer program language) Exploration de données (Informatique) Données volumineuses Python (Langage de programmation)
work_keys_str_mv	AT tandonakash advancedanalyticswithpyspark AT ryzasandy advancedanalyticswithpyspark AT lasersonuri advancedanalyticswithpyspark AT owensean advancedanalyticswithpyspark AT willsjosh advancedanalyticswithpyspark AT watrakandrzej advancedanalyticswithpyspark AT tandonakash zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT ryzasandy zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT lasersonuri zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT owensean zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT willsjosh zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark AT watrakandrzej zaawansowanaanalizadanychwpysparkmetodyprzetwarzaniainformacjinaszerokaskalezwykorzystaniempythonaisystemuspark

Verfügbarkeit