ビッグデータの処理
🦏 大型データフレームの表示
import pandas as pd
laptops_df = pd.read_csv('data/laptops.csv')
...
と省略されるlaptops_df.shape
(167, 15) # 167rows(노트북 종류) / 15columns(특징)
laptop_df.head(3) # 맨 위 세 줄 출력

laptop_df.tail(6) # 마지막 여섯 줄 출력

laptops_df.columns

laptops_df.info() # 각 컬럼의 기본 정보 확인
# row 수 다른 경우는 해당 값이 비어있는 것

laptops_df.describe() # 평균, 중간값, 최소최댓값, 표준편차 등

必要に応じて
inplace=True
laptops_df.sort_values(by='price') # 가격이 낮은 순으로 정렬

laptops_df.sort_values(by='price', ascending=False) # 가격이 높은 순으로 정렬

🦏 大シリーズの表示
...
laptop_df['brand']

laptop_df['brand'].unique()

laptops_df['brand'].value_counts()

laptops_df['brand'].describe()

* 출처: CODEIT - 데이터 사이언스 입문
Reference
この問題について(ビッグデータの処理), 我々は、より多くの情報をここで見つけました https://velog.io/@tataki26/큰-데이터-다루기テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol