pandas 의 한계Dataset을 불러올 때 pandas 의 DataFrame 객체를 불러와서 분석하는 것이 일반적이다.그래서 나 역시 pandas 로 분석을 하곤 했었다.하지만 Dataset의 크기가 굉장히 많을 경우, pandas 만으로는 한계가 있다.pandas 의 DataFrame 은 In-Memory 기반이기에 메모리 한계가 있다.그래서 불러온 Dataset의 특정 column 에 대한 dtype 을 변환하거나(이를테면 object 타입을 category 로 변환을 한다거나, 64bit 숫자 타입을 32bit로 변환한다거나)혹은 resampling을 한다거나 여러 방법론이 존재한다.이러한 눈물 나는 노력에도 불구하고 Dataset이 GB 급만 되더라도 엄청나게 메모리를 많이 잡아먹는다.일반적으..