?? 950? ?? pandas ????? ??? ?? ??? RAPIDS cuDF? GPU ??? ??? ? ?? ???? ??? NVIDIA GTC 2024?? ???????.
?? ????:??? Google Colab?? ?? ?? ??? pandas? ?? ??? ? ???RAPIDS cuDF? ??? ? ????. ?? ?? Colab ??????????? ??? ???. |
???? ??? Python? ??? ?? ? ?? ?????? pandas? ???? ?? API? ?? ??? ?????? ??? ?????. ??? ??? ??? ??? ???? CPU ?? ?????? ?? ??? ???? ???? ?????.
RAPIDS? ??? ?? ? ?? ?????? ???? ?? ??? GPU ?? Python ?????? ?? ?? ??????. RAPIDS cuDF? ??? ??, ???, ??? ?? pandas? ??? API? ???? GPU DataFrame ????????. ?? ??? cuDF? GPU ?? ?? ?????? ???? ???????.
?? ??, RAPIDS? ?? ?? ???? ??? CPU/GPU ??? ??? ???? ?? ?? ?? pandas ?????? ???? ???? ???? cuDF ??? ??????. GTC 2024?? NVIDIA? ?? ?? RAPIDS v24.02 ????? pandas? cuDF ???? ???? ??? ? ??? ??????. ? ??? ?? ??? NVIDIA AI Enterprise 5.0?? ??? ?????.
? ?????? Jupyter ????? ??? ???? ??? pandas ?????? ?????. ??? CPU ???? pandas? ????, ?? ??? cudf.pandas ?? ????? ???? RAPIDS cuDF? pandas? ????? ?????.
pandas ?????? ??? CPU/GPU ?? ??
cuDF? ?? pandas? ??? API? ??? ????? ??? DataFrame ????? ??? ??? ????. ??? cuDF? ???? ???? ??? ???? ???? ??????:
- cuDF?? ?? ???? ???? ???? ?? pandas ??? ?? ??.
- ??? ?????? ???? ?? ??????? CPU? GPU ??? ?? ??? ?? ?? ??.
- ?? PyData ????? ?? pandas??? ??? ??? ??? ?? ??? ? cuDF? pandas ?? ???? ??.
24.02 ?????? ??? GPU ?? ??? ??? ?? ?? ??? ??? ??? ???? ?? cuDF? pandas? ???? ? ????.
? ??? ??? ??? ?????? ??? ??? ???? ????? pandas? ?? ????? ?? ??? ???? ?? ???????. cuDF? pandas? ???? ?, ??? ????? GPU?? ???? ??? ?? ?? CPU(pandas ??)?? ?????. cuDF? ??? ?? GPU? CPU? ????? ??????. ?? ?? ??? CPU/GPU ??? ???? ?? ??? ??? pandas ?????? ??? ? ????.
GA ????? cuDF? ??? ?? ??? ?????:
- ?? ?? ?? ???: cuDF Jupyter Notebook ?? ????? ????? cuDF Python ?? ??? ????? ?? ???.
- ?? ????? ???: pandas ??? ??? pandas ???? ???? ???? ?? ?????? ?????. ??? ??? ????? ??? pandas ??? ???? ?? ????.
- ?? CPU/GPU ?????: ????? ???? ?? ?? ??? ??, ???, ???? ???? ??? ? ????.
Jupyter ???? pandas ?????? GPU ??? ????? cudf.pandas
?? ????? ?????:
% load_ext cudf.pandas import pandas as pd |
Python ????? ??? ? ? ??? ?????? cudf.pandas ?? ??? ?????:
python -m cudf.pandas script.py
pandas ?????? ??? ?? ????
??? ??? ????? ??? ???? ??, ?? ??? ?? pandas ??? ???? ?? ??? ????? ???? pandas API? ???? ??? ?? ????. ??? RAPIDS cuDF? ???? pandas? ?? ??? ?? ????? ??? ??? ??? ? ????.
H2o.ai?? ??? ???? ??????? ?? ????? DuckDB? pandas ??? ??? ?? ??? ?? ??? ? ????. DuckDB? ???? ??? ??? ?? ?? ??? ?? ??? ??? ?? ??? ???? ?? ???? ?? ???? CPU ?? DataFrame ? SQL ??? ?????.
5GB? ???? ????, ??? ?? ? ?? ??? ??? ???? ? ? ?? ??? ? pandas ??? ??? ???? ?????.
???? ? ????? pandas? ?? cuDF? ????? ??? ???? ??? ??? ???? ????. cuDF? ??? pandas ??? ??? ???? ? ?? ??? ?? ????. pandas ???? ??? ???? ?? ??? ? ???, ???? ???? GPU? ???? ?? ???? CPU? ???? ?????? ????? ????? ?? ??? ?? ??? ??? ? ????.
??? ??????. cuDF ?? CPU/GPU ????? ?? ?? ?? ? ? ??? ??? ? 1~2?? ?????(?? 1).

HW: NVIDIA Grace Hopper, CPU: Intel Xeon Platinum 8480C | SW: pandas v2.2, RAPIDS cuDF 23.10
? ???? ??? ?? ??? ?? ??? ??? cuDF ??? ?????.
??
pandas? Python ????? ?? ?? ???? DataFrame ????????, CPU?? ??? ??? ??? ??? ?????.
?? ???? cuDF? ???? ??? ???? ??? pandas ?????? ???? ???? ??? ? ????. 5GB ??? ??? ???? ?? ????? ???, 150? ?? ?? ??? ??? ? ????.
Google Colab? ?? GPU ?? ???? ? ??? ???? ?? cuDF ???? pandas? ???? ???.
??? ??? RAPIDS ????? cuDF pandas ???? ?????.
?? ???
- DLI ??: RAPIDS cuDF? ?????? ?? ?? ???
- DLI ??: ????? ??? ?? ????? ?????
- GTC ??: RAPIDS cuDF? ???? ?? ?? ?? pandas ?????
- GTC ??: ?????? ??? ?? ???? ?? ????
- SDK: RAPIDS
- SDK: DGL ????