개요
pandas에서 읽어온 csv를 샘플링하여 다시 csv로 저장하는 예제이다.
사용법
import random
import pandas as pd
p = 0.01 # 1% of the lines
df = pd.read_csv(
'/d_drive/avito/test.csv',
header=0,
skiprows=lambda i: i > 0 and random.random() > p
)
df.to_csv('/d_drive/avito/test_sample.csv')
관련