이 선 넘으면 침범이야, BEEP!

Description

온라인에서 발생하는 혐오표현은 널리 알려진 사회적 문제입니다. 익명성 때문에 혐오의 강도가 오프라인에 비해 더욱 세고, 온라인 상에 기록되기 때문에 그 내용을 지지하는 집단만 있다면 쉽게 불특정다수에게 확산되어 피해의 강도가 증폭됩니다. 최근에 발생한 일련의 비극적인 사건들로 포털 사이트들은 연예 및 스포츠 뉴스의 댓글란을 폐쇄하는 조치를 취했지만 그 곳이 아니더라도 혐오 발언은 어딘가에서 계속 표출이 되고 있기 때문에 다소 아쉬울 수 있는 해결책입니다.

이 때문에 어떤 텍스트에 혐오발언이 담겨 있는지 아닌지를 검출하는 모델은 불필요한 곳에서의 혐오 확산 및 노출을 제어할 수 있다는 면에서도, 표현의 자유를 침해하지 않고도 혐오발언으로 인한 피해를 감소시킬 수 있기 때문에도 중요합니다.

하지만 좋은 혐오탐지 모델 개발을 위해서는 우선, 좋은 데이터셋이 필요합니다. 그래서 이번 발표에서는 데이터를 구축하기 위해 했던 고민과 삽질기, 그리고 완성된 데이터를 활용해서 학습한 혐오탐지 모델을 소개할 예정입니다. 발표를 통해 혐오발언에 대한 다양한 논의와 모델 개선을 위해 필요한 작업들에 대한 토의가 이루어지길 기대합니다.

Slides

https://www.slideshare.net/JiHyungMoon1/pyconkr2020-beep-238646571

Video

https://youtu.be/P0fyKb3U9yo

Sponsors

Diamond

Sapphire

Startup

Community

Publisher/Media