포틀랜드에 살고 있는 프로그래머이자 인디 저널리스트인 andy baios는 현재 whitburn project라는 소소한 이름의, 하지만 실체는 절대 소소하다 할 수 없는 프로젝트를 진행중입니다. 이 프로젝트는 1890년부터 현재까지- 120년동안 빌보드 차트에 올랐던- 총 37,000곡을 수집해 스프레드쉬트로 정리하고 그 내용을 바탕으로 다양한 데이타를 만들어내는 프로젝트인데요. andy baios가 구글 오피스를 통해 스프레드쉬트를 공개한 덕 분에 많은 이들이 이를 통해 재미난 데이타를 만들어 내고 있습니다. (일종의 수동 api랄까요.) 그리고 오늘은 music thing 블로그에서 재미난 걸 만들어 냈군요. 바로 37,000곡의 제목이 쓰인 9,000개가 넘는 각기 다른 단어 중에서 가장 많이 쓰인 단어 100개를 tagcrowd의 기능을 이용 태그 클라우드로 정리한 것입니다. 내용은 다음과 같습니다.

역시 가장 많이 쓰인 단어는 love로군요. 120년동안 얼마나 많은 남성들이 여자를 꼬시기 위해 애 써왔는지, 얼마나 많은 여성들이 남자를 유혹하기 위해 애 써왔는지 알 수 있는 결과 입니다. 저도 예전에 제 (시디와 LP는 정리할 엄두를 못내고) itunes 라이브러리에서 love라는 단어가 쓰인 곡이 얼마나 되는지 검색한 적이 있습니다. 오늘 다시 해보니 총 35,073개의 곡 중에서 1,580개의 곡에 love라는 단어가 들어가네요. 이렇게 많은 사람들이 love라는 단어를 말하고 있는데, 저는 태어나서 연애경험과는 무관하게 딱 한명의 여자에게 밖에 사랑한다는 말을 하지 못했군요. 이제 얼마전 그 여자와는 더이상 그 말을 전할 수 없는 관계가 되었고요. 부디 이 포스트를 보는 분들이라도 수 많은 love라는 단어가 등장하는 곡의 주인공이 되시길 바랍니다,만 그런 분이라면 지금 이 시간에 블로고스피어를 떠돌고 계실리는 없겠지요. 뭐, 별 수 있나요. 오늘도 술이나 마시는 수 밖에요.
…는 아마도 모두가 예상했다시피 Love랍니다. ^^
이 블로그에서 보고 직접 원래의 블로그로 찾아가보았습니다. 자, 어떤 단어가 많이 쓰였을까요?
태그 클라우드에서 가장 크기가 큰 몇개…
사랑노름이 빠지면 안되지요 ㅎㅎㅎ
등장하는 단어 중 ‘love’를 제외한 나머지 단어들이 사랑노름의 ‘노름’에 해당할 것 같군요. 그러고보니 백단어 모두 사랑노름이네요.
역시 그랬군요. 영화 제목도 한번 같은 시스템으로 돌려보고 싶어집니다.
뭐가 제일 많을런지~ ㅋㅋ love 말고 다른 단어가 나올 것 같기도 해요.
글쎄요. 영화에선 어떤 단어가 가장 많이 쓰였을까요. the?
정관사, 부정관사, 소유격 같은 건 빼야 하는거 아닐까요..; ㅋㅋ
팝송도 그렇게 계산했을 거라고 믿고 싶어진다는.
마땅히 생각나는게 없어 the,라 얘기했는데 너무 집요하시군요. 음악밖에 난 몰라 노래라도 부르고 싶어집니다. 흑.