MACE's life blog

텍스트마이닝 - 다빈도 출현어휘 추출 본문

My work

텍스트마이닝 - 다빈도 출현어휘 추출

mace-lifelog 2016. 1. 17. 21:27
반응형
  • 프로젝트명 : 서울 정보소통광장 신년 콘텐츠 - 키워드로 본 2016년 박원순 서울시장 신년사 
  • 담당업무 : 데이터 분석(R)
  • 프로젝트 기간 : 2016.01.04 
  • 사용툴 : R


서울시장의 신년사 텍스트를 분석하여 다빈도 출현 어휘를 추출하면, 어떤 부분을 강조하고 있는지 보다 쉽게 알수 있고, WordCloud를 활용하면 인포그래픽과 같이 사용자에게 보다 쉽게 접근할 수 있다고 생각했다. 

신년사 텍스트는 서울시 온라인 매체에서 스크랩하였으며, R을 활용해서 텍스트마이닝과 워드클라우드 아웃풋을 출력했다. 포토샵으로는 동그란 원형으로 마스킹만 적용했다.  





* 작업원본: http://opengov.seoul.go.kr/issue/7147724

    

  

반응형
Comments