pandas 코드로 대규모 클러스터에서 더 빠르게 빅데이터를 분석 해보자 - Koalas

설명

pandas는 전세계 많은 분석가들이 표준으로 사용하는 라이브러리 입니다

데이터가 늘어날수록 분석 속도가 느려져서 고민해본 경험이 있으신가요?

Koalas는 pandas 라이브러리에 익숙한 데이터 분석가들이 같은 코드를 사용하여, 

대규모 병렬처리 엔진(Apache Spark)을 고민없이 활용 가능하여 빅데이터 분석이 가능하도록 도와줍니다. 

이번 발표에서는 데이터 분석가와 엔지니어의 역할과 오픈소스 프로젝트인 Koalas에 대한 소개와 활용성에 관해 이야기하고자 합니다.

발표 동영상

https://youtu.be/Y9kdUq_qIa8

후원사 목록

다이아몬드

사파이어

스타트업

커뮤니티

출판사/미디어