Semantic Textual Similarity¶
본 자료는 가짜연구소 3기 KLUE 로 모델 평가하기 크루 활동으로 작성되었습니다.
공식 KLUE 자료를 참고하여 진행되었습니다.
STS task¶
목표 : 두 문장의 의미 유사도(Semantic Similarity)를 0 (유사하지 않음) ~ 5 (매우 유사함) 점으로 예측함
데이터 구성 : 에어비앤비 리뷰(리뷰 도메인), 정책 브리핑(뉴스 도메인), ParaKQC(스마트스피커 도메인)에서 유사한 문장들(3 ~ 5점 분포)과 유사하지 않은 문장들(0~ 3점 분포)을 추출 혹은 생성
label:
real-label: 0 ~ 5 의 실수값
label: 0(유사하지 않음), 1(유사함)
train/val/test : 11,668 / 519 1,037
Notebook List¶
Index |
Task |
Topic |
담당자 |
작성일 |
---|---|---|---|---|
02-1 |
STS |
HuggingFace Hub 을 활용한 Fine tuning Baseline |
21-09-08 |