デファクトスタンダードである pandasと比較して、それぞれの特徴とそれに基づく、 有効な状況(導入先のプロジェクトにおける使用目的など)が異なる 7 [2] pandas - Python Data Analysis Library(https://pandas.pydata.org/) [3] Polars — DataFrames for the new era(https://pola.rs/) [4] PySpark Overview — PySpark 3.5.3 documentation(https://spark.apache.org/docs/latest/api/python/index.html#pyspark-overview) [5] Dask | Scale the Python tools you love(https://www.dask.org/) [6] Scale your pandas workflow by changing a single line of code — Modin 0.32.0+0.g3e951a6.dirty documentation(https://modin.readthedocs.io/en/stable/) [7] FireDucks(https://fireducks-dev.github.io/ja/)
as pd Polars import polars as pl PySpark from pyspark.sql import SparkSession spark = SparkSession.builder.appName('app-name').getOrCreate() [29] Index - Polars user guide(https://docs.pola.rs/#example) 全体的に差はない 別途必要な手続きが存在(難 しくはない)
import pandas as pd Dask import dask.dataframe as dd Modin import modin.pandas as pd FireDucks import fireducks.pandas as pd [29] Index - Polars user guide(https://docs.pola.rs/#example) 全体的に差はない importの変更だけで 良いというコンセプト importの変更だけで 良いというコンセプト