PlaynView-DistinctWordFinder
PlaynView
일반
K팝과 J팝의 과거 10년(2008~2017년)의 연간 톱100 팝음악 가사에서 두 나라의 차별되는 특징 단어가 무엇인지를 발견하는 프로그램
* 시연동영상 : https://youtu.be/cFlsN6oM55c
후원기업상_엘에스웨어상
2018 년
인공지능(AI)

두 종류의 문서군(document set)을 구분 짓는 특징 단어들을 추출하는 프로그램을 개발한다.
예컨대 한국과 일본의 과거 10년(2008~2017년) 동안의 탑10 가요들의 가사에서 국가간에 차이가 나는 단어가 무엇인지를 발견하는 프로그램을 제안한다.


본 프로그램은 텐서 분해(tensor decomposition, 더 자세히는 CP decomposition) 알고리즘을 활용하여 두 문서군을 구분하는데 도움이 되는 특징적인 단어들을 추출한다.

 

이를 통해 예컨대 한국과 일본의 과거 10년 톱10 가요 가사에서 두 나라의 차이를 드러내는 단어들이 어떤 것인지를 파악할 수 있다.

 

이렇게 두 문서군을 구분 짓는(또는 차별하는) 단어 목록을 추출하게 되면, 예컨대 일본 시장을 겨냥한 K-POP 신곡 론칭(launching) 시, 상기 예시에서 얻은 한일 과거 10년 가요 가사 속 국가간 차별 단어 목록을 이용하여 새로 론칭할 노래 가사에 어떤 단어들을 (즉, 개념들을) 삽입하는 것이 좋을지를 판단하는데 도움을 줄 수 있다.

맨 위로
맨 위로