Objective

Entity, relation을 embedding 할 수 있어야한다.

기존 방법에 비해 학습하기 쉬워야하며 파라미터 갯수가 적어야 한다.

큰 데이터셋에 대해 scalable 해야합니다.

스크린샷 2022-05-05 오후 1 30 27

Dataset

Freebase, WordNet 데이터셋에서 사용되는 Relation

스크린샷 2022-05-05 오후 1 32 26

실제 Freebase 데이터셋의 Entity와 Relation 예시

스크린샷 2022-0![Uploading 스크린샷 2022-05-05 오후 1.35.08.png…]() 5-05 오후 1 33 09

벡터의 합과 벡터간의 거리(distance / dissimilarity)가 사용됩니다.

스크린샷 2022-05-05 오후 1 35 45

거리값을 기준을 벡터들을 정렬할 수 있고 그 중 테스트셋의 정답 벡터의 순위로 ‘rank’를 구할 수 있습니다.

‘rank’의 평균값을 통해 테스트셋에 대한 ‘mean-rank’를 구할수 있습니다.

또한 상위 10 순위에 포함되는지 유무를 통해 ‘hits@10(%)’ 비율을 구할 수 있습니다.

스크린샷 2022-05-05 오후 1 43 40

스크린샷 2022-05-05 오후 1 44 08

스크린샷 2022-05-05 오후 1 44 23

Link prediction Task에서 이전의 방법에 비해 좋은 성능을 보였습니다.

큰 데이터셋(FB1M)에 대해서도 동작하였고 좋은 성능을 보입니다.

모델의 파라미터의 갯수도 적은 편(0.81M)입니다. 기존 방법들과 비교했을 때 Unstructured를 제외하면 가장 적습니다.

스크린샷 2022-05-05 오후 1 51 18