YNAT(Topic Classification)


YNAT task

  • 목표 : 주어진 뉴스 표제(Headline)가 어떤 토픽(TopicP) __정치/경제/사회/생활문화/세계/IT과학/스포츠__에 속하는지 분류

  • 데이터 구성 : 2016년 12월 ~ 2020년 12월 네이버 뉴스에 게제된 연합뉴스 기자의 표제 70,000개 중 ‘정치/경제/사회/생활문화/세계/IT과학/스포츠’에 속한 표제를 각 토픽별로 고르게 추출, 개인정보 포함 문장 또는 분류 불가나 편견 및 혐오표현 문장을 제외한 63,892개의 문장으로 구성

  • label: 정치/경제/사회/생활문화/세계/IT과학/스포츠

  • train/val/test : 45,678 / 9,107 / 9,107


Notebook List

Index

Task

Topic

담당자

작성일

01-1

YNAT(Topic Classification)

HuggingFace Hub 을 활용한 Fine tuning Baseline

김대웅

21-08-25