DuckDBによるデータ解析学入門


データアナリストの生命はSQLサーブを通してデータを読み込み、様々なPythonパッケージを使用して分析し、最終的に技術報告書を作成することを公約します.これらのSQLクエリでは、データのテラバイトを処理するときに処理するのに長い時間がかかることがあります.このペースの速い世界では、この戦略は惨めに失敗します、そして、大部分の分析論はデータ分析をする伝統的な方法から離れて動いています.DuckDBはすべての問題を解決し、それはPython&Rと統合されています.それはSQLiteと同様に動作し、高速分析クエリを提供することに焦点を当てています.

サンプルコード


res = duckdb.query(SELECT sex, SUM(expected_recovery_amount) as Expected,
 SUM(actual_recovery_amount) as Actual 
 FROM bank_data.csv
 WHERE recovery_strategy LIKE Level 4 Recovery
 GROUP BY sex
 HAVING sex = Female’”)
res.df()

記事を読む完全なガイドAnalytics Vidhya