Semantic Textual Similarity


STS task

  • 목표 : 두 문장의 의미 유사도(Semantic Similarity)를 0 (유사하지 않음) ~ 5 (매우 유사함) 점으로 예측함

  • 데이터 구성 : 에어비앤비 리뷰(리뷰 도메인), 정책 브리핑(뉴스 도메인), ParaKQC(스마트스피커 도메인)에서 유사한 문장들(3 ~ 5점 분포)과 유사하지 않은 문장들(0~ 3점 분포)을 추출 혹은 생성

  • label:

    • real-label: 0 ~ 5 의 실수값

    • label: 0(유사하지 않음), 1(유사함)

  • train/val/test : 11,668 / 519 1,037


Notebook List

Index

Task

Topic

담당자

작성일

02-1

STS

HuggingFace Hub 을 활용한 Fine tuning Baseline

김대웅

21-09-08