2007년 1월 27일 토요일

del.icio.us에 가입하다

저는 개인적으로 Internet Explorer의 북마크 기능을 썩 좋아하지 않는 편입니다. 북마크 하나 당 파일 하나로 만들어지기 때문에 북마크 이름에 특수 문자를 쓸 수 없다는 점, 북마크가 많아지면 파일도 따라서 많아지기 때문에 느려진다는 점 등이 그 이유입니다. 그래서, 단일 HTML 파일로 관리되는 FireFox의 북마크 기능을 더 좋아합니다.

하지만, 어떤 것을 사용해도 분리되어 있는 두 대 이상의 컴퓨터에서 동일한 내용의 북마크를 사용하려면 약간의 수고를 감수할 수 밖에 없습니다. 그래서, 온라인 북마크 시스템을 사용하려고 좀 살펴봤는데, 처음 시도해본 것이 Google의 '즐겨찾기'였습니다. 툴바와 연동되는 점, Google의 다른 서비스들처럼 '레이블'과 ''이 지원되는 점 등이 나름대로 좋기는 했는데, 뭔가 조금 부족하다는 느낌을 받았습니다. 순수하게 온라인 북마크 기능만을 지원하는 그 이상은 아니었던 것이죠.

그 다음 시도로서, 많은 사람들이 사용한다는 '딜리셔스(del.icio.us)'를 사용해보았습니다. (예전부터 느꼈던 것이지만, 도메인 이름이 상당히 독특합니다. 이것만으로도 기본 50점 이상은 따고 들어가는 것 같습니다.) 가입을 하고 우선 설정 페이지로 갔습니다. 이것저것 설정할 것이 많더군요. 딜리셔스 역시 FireFox나 Internet Explorer 등의 브라우저에 사용할 수 있는 플러그인을 지원하고 있었습니다. 아무튼 이것저것 설명을 자세히 읽어보면서 하나씩 기능을 이해해나가다 보니 이게 또 물건이더군요.

가장 큰 특징은, 북마크를 많은 사람들과 공유할 수 있으면서(물론 설정에 따라서 비공개 북마크를 만들 수도 있습니다.) 동일한 북마크를 얼마나 많은 사람들이 어떤 분류 기준(tag, Google 즐겨찾기의 레이블과 유사한 역할을 함)으로 사용하고 있는지 통계로 보여준다는 점입니다. Tag만 봐도 요즘 사람들의 관심사와 트렌드를 어느 정도 파악할 수 있겠다는 생각이 들더군요.

그리고, tag의 조합으로 북마크를 쉽게 검색할 수 있다는 점, 특정 사용자 혹은 전체 사용자들을 대상으로 북마크를 구독(subscription)할 수 있다는 점, network을 만들어서 소속된 사람들과 쉽게 북마크 정보를 공유할 수 있다는 점 등등, 그야말로 'Social Bookmarking'이라는 이름값 하는 기능들을 고루 갖추고 있다는 생각이 들었습니다.

그 외에 link roll이나 tag roll 같은 유사 위젯(widget) 기능도 지원하고 있어서 제 블로그에도 tag roll 하나 달아보았습니다.(제 관심사가 한 눈에 보이는군요.) 더 혁신적인 서비스가 등장하기 전까지는 아마도 딜리셔스를 계속 쓰게 될 것 같습니다.

덧말.
제가 지금까지 개인적으로 유지하던 북마크가 꽤 많은 편이라 딜리셔스로 옮겨가는 작업이 만만치가 않네요. FireFox 북마크에 대한 import 기능을 지원하기는 하지만, 원하는 분류대로 적절히 잘 나누어지는 것이 아니었기 때문에 결국 엉망이 되어 버려서 계정을 삭제하고 새로 가입하는 사태가 발생했더랬습니다.(모두 삭제하기 기능은 없는 거지?) 결국 지금은 비교적 자주 사용하는 북마크부터 하나씩 천천히 옮기고 있는 중입니다. 비록 시간은 한참 걸리겠지만, 이 작업을 통해 버릴 것 버리고 정리할 것 잘 정리해서 알짜배기 북마크로만 재련 해낼 수 있을 것이라 믿어 의심치 않습니다. ;-)

2007년 1월 23일 화요일

POPFile - 자동화된 메일 분류 도구




POPFile
은 일종의 POP3 Proxy입니다. POP3 서버와 메일 클라이언트 사이에 위치하면서 메일을 자동으로 분류해주는 기능을 하게 됩니다. 얼마 전에 소개해드린 SpamBayes가 Outlook Add-in 방식을 지원하는 것과 비교하면 POPFile이 설치 및 사용에 있어 조금 더 귀찮은 것이 사실입니다. 그러나 POPFile만의 장점도 있으니 계속 읽어보시기 바랍니다. ;-)



POPFile은 Perl로 만들어졌는데, Python을 사용하여 만들어진 SpamBayes와 기본적으로 거의 동일한 알고리즘을 사용하는 것이기 때문에 성능에 대해서는 따로 말씀을 드릴 필요가 없으리라 생각됩니다. 대신, POPFile만의 특징이 있는데 차근히 하나씩 살펴보도록 하죠.

1. 단순히 스팸 메일만 분류해주는 것이 아니라 다양한 bucket('양동이'란 말로 POPFile에서는 분류 기준이 되는 단위를 지칭합니다.)을 두고 여러 가지로 분류를 해주는 것이 가능합니다.

2. SpamBayes처럼 메일을 직접 특정폴더로 이동하는 것이 아니라 메일의 제목에 특정 문자열을 붙여준다거나 혹은 메일 헤더에 특정 문자열을 삽입하는 방식을 이용하기 때문에 이것을 사용해서 실제 메일 클라이언트의 분류 규칙을 따로 설정해야 합니다. 얼핏보면 오히려 불편해보일 수 있겠지만, POP3 Proxy로서는 이것이 최선일 겁니다. 대신 분류 기준을 만드는 것이 훨씬 수월해지는 것은 사실이니 그것만 해도 충분하지 않을까요?

3. POPFile은 Perl로 만들어졌기 때문에 Perl을 사용할 수 있는 거의 모든 플랫폼에서 사용할 수 있습니다. Windows용으로는 친절하게도 초보자를 위해 설치 프로그램도 제공이 됩니다. Perl을 따로 설치할 필요도 없고 Perl에 대해서 아무 것도 몰라도 됩니다.

4. POPFile은 아직 별도의 GUI 프로그램은 제공하지 않고 있으며, localhost의 8080 포트로 웹페이지 형태의 인터페이스를 제공합니다. (설정을 바꾸면 8080 대신 다른 포트를 사용할 수 있습니다.)그렇기 때문에 설정이나 분류 오류에 대한 정정 등은 브라우저를 사용해서 웹 인터페이스에 접속한 후 이용 가능합니다.

5. 다국어를 지원합니다. 당연히 한국어도 지원합니다. :)



단순히 spam과 ham(spam이 아닌 'good' 메일을 지칭)만을 구분하기 위한 용도라면 SpamBayes가 오히려 더 편리할 수 있으니 굳이 POPFile에 목숨 걸지 않으셔도 됩니다. POPFile의 진정한 힘은 다양한 종류의 메일을 적절히 구분하기 위해서 Outlook(혹은 다른 어떤 메일 클라이언트라도)의 분류 규칙과 씨름하시는 분들만 느낄 수 있는 것입니다.

처음 설치를 하게 되면 POPFile 역시 '바부팅이 문어 대가리(POPFile 홈페이지에 문어가 등장합니다.)'에 불과합니다. 아무 것도 모르죠. 그래서 하나씩 차근차근 가르쳐야 합니다. Bucket을 많이 만들수록 가르치는 과정도 더 오래 걸릴 것입니다. 하지만, 잘 가르친 문어는 복잡한 메일의 분류를 정말 손쉽게 처리할 수 있도록 해줍니다. 문어실수(잘못 분류하는 일)를 하게 되면 웹인터페이스의 분류 히스토리 페이지로 가서 정정해주시면 됩니다. 가르치는 방법은 단지 그것뿐입니다.

저는 업무 상 받는 메일들이 꽤 다양해서 업무 관련 bucket만 6 개가 됩니다. 그리고, 기타 개인 메일들을 위한 bucket이 3 개, 스팸 메일용 bucket 1 개, 합이 10 개입니다. 문어를 가르치기 시작한지 이틀째인데, 처음 서너번 정도 실수한 것을 교정해주었더니 이제는 제법 척척 잘 가려주는군요. 스팸 메일은 가차 없습니다. 현재까지 필터율 98% 입니다. 어찌보면 SpamBayes보다 더 잘 가려주는 것 같은 느낌도 들 정도네요.

POPFile 공식 홈페이지는 다음과 같습니다.

LINK: http://popfile.sourceforge.net/

소개글을 쓰는 제가 굳이 설치나 사용법에 대해 언급하지 않아도 될 만큼 공식 홈페이지에서 설치부터 사용법까지 매우 친절하고 상세하게 잘 설명해줍니다.

복잡한 메일을 자동으로 분류하기 위해서 Outlook 분류 규칙에 목숨 걸지 마세요. 메일 클라이언트가 바뀌기라도 하면 어쩌시려구요? 설마 분류 기준을 처음부터 다시 만들 생각은 아니겠죠? 문어(POPFile) 한 마리 키워보세요. ;-)