Python data.py make_db train 최종 용량은 얼마나 되나요?


#1

데이터 다운로드 다 받고,
python data.py make_db train
돌리는데 tmp 폴더에 얼마나 많은 데이터들이 들어가게되나요?

config.json에서
“db_chunk_size”:50000
“num_workers”:8

그리고 data.py 에서
161번째 줄 chunk_size=50000

으로 변경한뒤 돌리는중인데,

1 TB 가 넘는데 저만 그런건지 궁금합니다.


#2

저는 num_workers만 6으로 줄인 상태에서 tmp에는 131GB가 들어가 있습니다.