pandas 코드로 대규모 클러스터에서 더 빠르게 빅데이터를 분석 해보자 - Koalas
- Data Analytics
- 중급
- 2020년 9월 27일 4:30 오후
- 한국어
설명
pandas는 전세계 많은 분석가들이 표준으로 사용하는 라이브러리 입니다
데이터가 늘어날수록 분석 속도가 느려져서 고민해본 경험이 있으신가요?
Koalas는 pandas 라이브러리에 익숙한 데이터 분석가들이 같은 코드를 사용하여,
대규모 병렬처리 엔진(Apache Spark)을 고민없이 활용 가능하여 빅데이터 분석이 가능하도록 도와줍니다.
이번 발표에서는 데이터 분석가와 엔지니어의 역할과 오픈소스 프로젝트인 Koalas에 대한 소개와 활용성에 관해 이야기하고자 합니다.