Semantic Textual Similarity¶

STS task¶

목표 : 두 문장의 의미 유사도(Semantic Similarity)를 0 (유사하지 않음) ~ 5 (매우 유사함) 점으로 예측함
데이터 구성 : 에어비앤비 리뷰(리뷰 도메인), 정책 브리핑(뉴스 도메인), ParaKQC(스마트스피커 도메인)에서 유사한 문장들(3 ~ 5점 분포)과 유사하지 않은 문장들(0~ 3점 분포)을 추출 혹은 생성
label:
- real-label: 0 ~ 5 의 실수값
- label: 0(유사하지 않음), 1(유사함)
train/val/test : 11,668 / 519 1,037

Index	Task	Topic	담당자	작성일
02-1	STS	HuggingFace Hub 을 활용한 Fine tuning Baseline	김대웅	21-09-08