Authors) Chi Sun, Luyao Huang, Xipeng Qiu
Publication) NAACL HLT 2019 - 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies - Proceedings of the Conference
1. Task 정의
- Aspect-based sentioment analysis (ABSA): "그 식당은 분위기는 좋았지만 맛이 별로였다" 라는 댓글이 있으면 분위기 aspect에 대해서는 positive sentiment, 맛 aspect에 대해서는 negative sentiment로 분류하는 태스크이다.
Aspect | Sentiment |
분위기 | Positive |
맛 | Negative |
- Targeted aspect-based sentiment analysis (TABSA): "A 식당은 분위기가 좋고 맛은 별로다. 나는 개인적으로 A 식당에 가느니 B 식당에 가겠다."
Target | Aspect | Sentiment |
A 식당 | 분위기 | Positive |
A 식당 | 맛 | Negative |
A 식당 | 전반적 | Negative |
B 식당 | 분위기 | None |
B 식당 | 맛 | None |
B 식당 | 전반적 | Positive |
2. 이 논문의 아이디어
TABSA task가 single sentence task로 기존에 접근해지던 반면, double sentence task ( QA, NLI)로 변환하였다.
3. How?
- QA: 추가적인 질문을 자연어의 형태로 덧붙인다.
- "A 식당의 맛은 어떤가?" + "그 식당은 분위기는 좋았지만 맛이 별로였다"
- CLS embedding으로 classification
- => Positive label을 G.T로 학습
- NLI: 자연어는 아니고 간단한 pseudo-문장 형태의 평서문을 덧붙인다.
- "A 식당-맛" + "그 식당은 분위기는 좋았지만 맛이 별로였다"
- CLS embedding으로 classification
- => Positive label을 G.T로 학습
QA와 NLI로 객관식 스타일로 변형하는 접근도 있지만 이정도만 적겠다.
4. 왜 이게 잘 될까?
TABSA는 task와 aspect에 대해서 답을 찾아야하기 때문에 문제에 컨디션이 생긴다. 그런데 이 컨디션을 제시하기 위한 방법으로 auxiliary sentence를 사용했다.
5. 그냥 sentiment classification 문제에도 적용할 수 있는가?
얼핏 봐선 적용 불가능해보인다.