DuckDB in Action / DuckDB в действии Год издания: 2024 Автор: Needham Mark, Hunger Michael, Simons Michael / Нидэм Марк, Хангер Майкл, Саймонс Майкл Издательство: Manning Publications Co. ISBN: 978-1-6334-3725-8 Язык: Английский Формат: PDF Качество: Издательский макет или текст (eBook) Интерактивное оглавление: Да Количество страниц: 314 Описание: Dive into DuckDB and start processing gigabytes of data with ease—all with no data warehouse. DuckDB is a cutting-edge SQL database that makes it incredibly easy to analyze big data sets right from your laptop. In DuckDB in Action you’ll learn everything you need to know to get the most out of this awesome tool, keep your data secure on prem, and save you hundreds on your cloud bill. From data ingestion to advanced data pipelines, you’ll learn everything you need to get the most out of DuckDB—all through hands-on examples. Open up DuckDB in Action and learn how to: Read and process data from CSV, JSON and Parquet sources both locally and remote Write analytical SQL queries, including aggregations, common table expressions, window functions, special types of joins, and pivot tables Use DuckDB from Python, both with SQL and its "Relational"-API, interacting with databases but also data frames Prepare, ingest and query large datasets Build cloud data pipelines Extend DuckDB with custom functionality Pragmatic and comprehensive, DuckDB in Action introduces the DuckDB database and shows you how to use it to solve common data workflow problems. You won’t need to read through pages of documentation—you’ll learn as you work. Get to grips with DuckDB's unique SQL dialect, learning to seamlessly load, prepare, and analyze data using SQL queries. Extend DuckDB with both Python and built-in tools such as MotherDuck, and gain practical insights into building robust and automated data pipelines. about the technology DuckDB makes data analytics fast and fun! You don’t need to set up a Spark or run a cloud data warehouse just to process a few hundred gigabytes of data. DuckDB is easily embeddable in any data analytics application, runs on a laptop, and processes data from almost any source, including JSON, CSV, Parquet, SQLite and Postgres. about the book DuckDB in Action guides you example-by-example from setup, through your first SQL query, to advanced topics like building data pipelines and embedding DuckDB as a local data store for a Streamlit web app. You’ll explore DuckDB’s handy SQL extensions, get to grips with aggregation, analysis, and data without persistence, and use Python to customize DuckDB. A hands-on project accompanies each new topic, so you can see DuckDB in action. what's inside Prepare, ingest and query large datasets Build cloud data pipelines Extend DuckDB with custom functionality Fast-paced SQL recap: From simple queries to advanced analytics about the reader For data pros comfortable with Python and CLI tools. Погрузитесь в DuckDB и начните с легкостью обрабатывать гигабайты данных — и все это без использования хранилища данных. DuckDB - это передовая база данных SQL, которая позволяет невероятно легко анализировать большие массивы данных прямо с вашего ноутбука. В DuckDB в действии вы узнаете все, что вам нужно знать, чтобы получить максимальную отдачу от этого потрясающего инструмента, обезопасить свои данные на prem и сэкономить сотни долларов на облачных счетах. На практических примерах вы узнаете все, что нужно для получения максимальной отдачи от DuckDB — от приема данных до расширенных конвейеров обработки данных. Откройте DuckDB в действии и узнайте, как: Считывание и обработка данных из CSV, JSON и Parquet-источников как локально, так и удаленно Написание аналитических SQL-запросов, включая агрегирование, общие табличные выражения, оконные функции, специальные типы соединений и сводные таблицы Используйте DuckDB из Python, как с SQL, так и с его "реляционным" API, взаимодействуя не только с базами данных, но и с фреймами данных Подготавливайте, загружайте и запрашивайте большие наборы данных Создавайте облачные конвейеры передачи данных Расширяйте DuckDB за счет пользовательских функций Практичный и всеобъемлющий, DuckDB в действии представляет базу данных DuckDB и показывает, как ее использовать для решения распространенных проблем с обработкой данных. Вам не нужно будет читать страницы документации — вы узнаете об этом в процессе работы. Познакомьтесь с уникальным диалектом SQL в DuckDB, научитесь легко загружать, подготавливать и анализировать данные с помощью SQL-запросов. Расширьте DuckDB с помощью Python и встроенных инструментов, таких как MotherDuck, и получите практические рекомендации по созданию надежных и автоматизированных конвейеров передачи данных. о технологии DuckDB делает анализ данных быстрым и увлекательным! Вам не нужно настраивать Spark или запускать облачное хранилище данных только для обработки нескольких сотен гигабайт данных. DuckDB легко встраивается в любое приложение для анализа данных, работает на ноутбуке и обрабатывает данные практически из любых источников, включая JSON, CSV, Parquet, SQLite и Postgres. о книге DuckDB в действии поможет вам на каждом примере, начиная с настройки и выполнения первого SQL-запроса, перейти к таким сложным темам, как построение конвейеров передачи данных и внедрение DuckDB в качестве локального хранилища данных для веб-приложения Streamlit. Вы познакомитесь с удобными SQL-расширениями DuckDB, научитесь агрегировать, анализировать и обрабатывать данные без сохранения, а также использовать Python для настройки DuckDB. К каждой новой теме прилагается практический проект, так что вы сможете увидеть DuckDB в действии. что внутри Подготавливайте, загружайте и запрашивайте большие наборы данных Создавайте облачные конвейеры обработки данных Расширяйте DuckDB за счет пользовательских функций Быстрый обзор SQL: от простых запросов к расширенной аналитике о читателе Для специалистов в области обработки данных, которые знакомы с Python и инструментами CLI.
Примеры страниц (скриншоты)
Оглавление
1 ■ An introduction to DuckDB 1 2 ■ Getting started with DuckDB 12 3 ■ Executing SQL queries 22 4 ■ Advanced aggregation and analysis of data 58 5 ■ Exploring data without persistence 98 6 ■ Integrating with the Python ecosystem 123 7 ■ DuckDB in the cloud with MotherDuck 144 8 ■ Building data pipelines with DuckDB 163 9 ■ Building and deploying data apps 193 10 ■ Performance considerations for large datasets 223 11 ■ Conclusion 262
Needham Mark, Hunger Michael, Simons Michael / Нидэм Марк, Хангер Майкл, Саймонс Майкл - DuckDB in Action / DuckDB в действии [2024, PDF, ENG] download torrent for free and without registration
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum You cannot attach files in this forum You can download files in this forum