개요

pandas에서 읽어온 csv를 샘플링하여 다시 csv로 저장하는 예제이다.

사용법

import random
import pandas as pd

p = 0.01  # 1% of the lines
df = pd.read_csv(
    '/d_drive/avito/test.csv',
    header=0,
    skiprows=lambda i: i > 0 and random.random() > p
)
df.to_csv('/d_drive/avito/test_sample.csv')