로고

모바일메뉴 열기
이전학기 작품
큰화살표
큰화살표

 

자기주도 프로젝트
registrant1

SentencePiece를 이용한 유튜브 댓글의 감정분류 문제 성능 개선 연구

작품개요
수많은 단어 변칙이 존재하는 유튜브 댓글 데이터를 이용하여 Out Of Vocabulary(OOV) 문제를 해결하고, 이진 감정 분류의 성능을 개선하고자 한다. 문장 벡터화 과정에서 일반적으로 사용되는 파이썬 라이브러리인 Keras Tokenizer 대신에 Neural Machine Translation에서 주로 사용되는 SentencePiece를 적용하여 감정 분류 모델의 성능을 비교 분석한다. 그 결과 SentencePiece는 전처리 작업을 최소화할 수 있고 단어 사전의 크기가 제한적이어도 OOV를 효과적으로 처리한다는 사실을 알게 되었다.

※영상이 보이지 않을 시, 오른쪽 위 전체창 보기를 클릭하세요 view_ap

Like it 8
댓글 4

like 좋아요

comment 댓글

댓글
등록자
  • 임윤진
  •  
  • 소프트웨어학과/정통대
  • 4
  • skewon**@ajou.ac.kr
멘토
  •  
  • 박준규
  • 일반대학원 컴퓨터공학과
  •  
  •  

자기주도 프로젝트 다른 작품 보기

  • 경기도 수원시 영통구 월드컵로 206 아주대학교 팔달관
    TEL : 031-219-3070~3
  • Copyright 2021 by 아주대학교 AI융합교육원. All Rights Reserved.