분당아재의 솔직한 블로그

이젠 1달러에 겨우 1,160원

IT산책

오랜만에 구글수표를 받았습니다.
블로그를 운영하고 있는 것이 꼭 구글수표 때문만은 아니지만 가끔씩 날라오는 수표를 받는 기분은
항상 좋은 건 사실입니다. ^^

이번에도 얼마되지 않지만 날라온 구글수표를 갖고 환전하러 은행으로 갔습니다.


환율 현황판을 보니 1달러에 1160원 정도 하는군요.
갖고 있는 수표를 환전해 봐야 수수료 떼고 나면 대략 11만원정도 나올 것 같습니다.
예전에 1500원 가까이 할 때 수표를 교환했던 기억이 있는데 그땐 제법 큰 돈을 만졌던 것 같은데
앞으로는 그런 일이 별로 없을 것 같네요.

세계경제의 침체로 인해 약달러 현상이 저에게도 이런 영향을 끼칠 지는 정말 몰랐습니다. ㅎㅎㅎ
환전한 수표로 마눌님 크리스마스 선물을 준비해야겠네요.

검색엔진 이야기(3) - 검색엔진의 구조

IT산책

검색엔진 이야기 세번째입니다.
오늘은 검색엔진의 전체적인 흐름에 대해서 이야기 하겠습니다.

그동안 검색엔진에 대해서 올렸던 포스트에 관심이 있으시면 아래 링크를 참고하시기 바랍니다.


먼저 검색엔진의 일반적인 구조를 살펴보겠습니다.


검색엔진의 구조는 크게 데이터를 수집하는 수집부문, 수집된 데이터를 역파일(inverted File)로 만드는 색인부문, 실제 사용자에게 검색서비스를 하는 검색부문으로 나눌 수 있습니다.
검색엔진을 만드는 회사마다 조금씩 다른 구조를 가질 수 있겠지만 일반적으로 3부문으로 구분하면 큰 문제는 없습니다.

1. 수집부문
무언가 검색을 하기 위해서는 가장 먼저 검색대상이 되는 것으로부터 데이터(텍스트)를 수집하는 것이 첫번째 작업입니다.

검색대상으로는 일반 기업이나 공공기관에서 많이 사용하는 전자결재, 지식관리(KMS), 문서관리(EDMS), 게시판, 자료실 등 일반적인 RDB(Oracle, MS-SQL, MySQL, Informix, Sybase 등)에 저장된 거의 모든 데이터가 해당됩니다.

전자결재, KMS, EDMS 등도 공급하는 솔루션회사 별로 제품의 성격, DB 스키마 등이 다 다르기 때문에 사실 검색엔진 입장에서는 수집이 가장 힘든 작업 중 하나입니다.

이런 RDB를 수집할 때는 Bridge라고 불리우는 수집기 모듈을 사용합니다.
업체에 따라 DB Gateway, DB Bridge 등으로 불리는데 여기서는 Bridge라는 용어로 설명을 하겠습니다.

DB Bridge에서 검색대상 데이터를 수집할 때는 JDBC 방식으로 데이터를 수집합니다.
각 검색대상에서 검색이 될만한 필드를 뽑아서 SQL로 구성한 후 DB Bridge에 해당 SQL를 전달하여
원하는 필드값들을 Select하여 텍스트로 저장하도록 합니다.
이렇게 저장된 텍스트를 가지고 색인 작업을 수행합니다.

때론, RDB가 아닌 다른 시스템을 검색하는 경우도 있습니다.
IBM의 Notes 시스템을 검색하거나 Exchange 서버의 메일이나 게시판을 수집하는 경우가 그것인데요. 이 경우에는 Notes를 전문적으로 수집하는 Notes Bridge, Exchage 서버의 메일을 수집하는 Exchage Bridge 등 전용 수집기를 써야 합니다.

인터넷 상의 웹문서를 수집하는 경우도 있습니다.
이 경우에는 WebBridge라는 것을 사용해야 하는데요. 이것에 대해서는 과거에 써 높았던 포스트를 참고하시기 바랍니다.



하지만 어떤 경우는 수집기를 통한 결과는 텍스트 형태의 임시 파일로 저장됩니다.
수집기의 역할을 검색대상으로 부터 텍스트를 추출하여 색인기로 전달하는 것 입니다.

2. 색인부문

수집기를 통하여 수집된 텍스트를 검색이 잘 되도록 역파일(Inverted File)로 변환하는 역할을 색인기(Indexer)가 담당합니다.
이 색인기가 어떤 알고리즘으로 설계되고 동작되는지에 따라 그 검색엔진의 성능이 좌우됩니다.

과거에는 검색대상이 되는 시스템의 DB량이 많지 않아서 웬만한 색인 알고리즘을 갖고도 데이터를 색인하고 검색하는데 무리가 없었습니다.
그러나 지금은 기업/공공기관에서 보유한 데이터 양이 수십G Byte에서 많게는 Tera Byte에 이르기 때문에 웬만한 검색엔진들은 색인하다가 시스템 다운이 되기도 합니다.

이런 이유로 인해서  대용량 검색을 지원하지 못하는 검색엔진 회사들은 어느새 시장에서 사라졌습니다. 지금은 와이즈넛, 코난, 다이퀘스트 등 몇 개 회사가 왕성하게 영업중입니다.

역시 이런 이유로 인해서 색인파일의 구조나 성능에 대한 측정값 등은 보안에 꽤 민감한 사항입니다.
자칫 경쟁사로 부터 공격의 대상이 될 수 있으니까요.
색인에 대한 이야기는 간단하게 접도록 하겠습니다.

3. 검색부문

사용자가 입력한 검색질의(Query)에 대해서 색인파일을 잘 뒤져서 검색결과 목록을 작성한 후 다시 사용자에게 제공하는 역할을 하는 것이 검색기(Searcher)입니다.

검색기도 기술적으로 굉장히 중요한 부분입니다.
포탈이나 쇼핑몰 같이 동시에 많은 사용자가 많은 Query를 보낼 때 검색결과를 제대로 찾아서 전달할 수 있는가?
각종 오름차, 내림차 등 정렬, 페이지 처리, 한 페이지에 보여줄 검색결과 개수, 상세 조건검색,
결과 내 검색 등 다양한 옵션에 대해서 모두 빠른 시간에 검색결과를 보여줘야 하기 때문에 이 부분도
상당한 기술이 필요합니다.

또한, 검색기는 Daemon이나 Service 형태로 늘 실행되면서 사용자의 Query를 기다려야하기 때문에
절대로 죽어서는 안됩니다. (물론, 대부분의 검색엔진들은 가끔씩 죽기도 합니다. ㅎㅎㅎ)

요즘은 이런 중요하고도 기본적인 검색기능 이외에
검색어 자동완성 기능, 인기검색어, 연관검색어, 테마 검색 등 사용자의 입력 편의를 위한 다양한 부가기능이 더 중요하게 여겨지기도 합니다.

어느새 검색엔진 본래의 역할은 기본이 되어버렸고
어떤 회사에서 눈에 보기 좋은 부가기능을 더 많이 갖고 있는가가 업체를 선택하는 중요한 요소가 되었습니다.
사용자들이 그만큼 게을려졌다는 것이겠지요. ㅜ.ㅜ


포스트를 적다보니 처음 의도와는 다른 방향으로 간 것 같습니다.
두서없이 적다보니 내용도 좀 부실해 졌네요.
나중에 좀더 보완해서 올려보도록 하겠습니다.


맛집을 소개하다보니 이런 일도 있네요.

IT산책

맛집 후기를 몇 편 작성해서 올렸었습니다.
제가 미각이 그다지 뛰어난 것도 아니고 맛있는 음식을 일부러 찾아 다니는 스타일도 아니지만
그래도 기회가 있을 때마다 제가 다녔던 음식점 중에서
순전히 제 주관적으로 좋은 느낌을 가지고 있던 음식점에 대해서 이용후기를 작성하여 포스팅하였습니다.


아직 많진 않죠? ^^;

이렇든 몇집 안되는 음식점에 대해서 포스트를 작성했지만
이 중에서 어느 음식점 사장님께서 '인터넷에 소개를 해 주어 고맙다. 꼭 한번 다시 찾아와달라'라고 직접 댓글을 달아주셨습니다.

바로 대치동 한티해물칼국수가 그 집인데요.
칼국수와 보쌈이 맛있어서 점심때 그리고 직원 회식때 가끔 이용하는 곳입니다.

사장님께서 부르는시는데 안 갈수가 있나요? 바로 달려갔습니다. ㅎㅎㅎ
블로그에 올리기 전에도 두번정도 가서 안면이 있었는데 제가 블로그에 소개했다고 하니
너무 감사하다면서 이것저것 서비스 음식을 막 챙겨주십니다. ^^;

Korean Cuisine & Food - 한국음식 - 07 May 2009 - Seoul, South Korea - IMCOM-K
Korean Cuisine & Food - 한국음식 - 07 May 2009 - Seoul, South Korea - IMCOM-K by US Army Korea - IMCOM 저작자 표시비영리변경 금지


같이 간 직원들이 블로그에 올린 것이 효과가 있느냐.. 라고 질문하니
어느 일요일에 한 무리의 사람들이 왔었는데 대치동 맛집이라고 검색해서 제가 올린 포스트를 보고
그 집에 찾아왔다고 하더랍니다. 사장님께서 그 점에 무척 감동받으신 듯 합니다.

그 후로 한두번 점심식사를 하러 더 갔는데 그때마다 알아보시고 칼국수보다 더 비싼 뽕잎만두를 챙겨주셔서 감사히 먹었습니다. 직원들에게 체면이 살기도 했구요.

이런 작은 기쁨도 블로그를 운영하는 하나의 재미가 아닐까 생각합니다.

김제동의 '사람이 사람에게'

IT산책

방송인 김제동씨가 KBS 스타골든벨에서 하차되지 하루 전날에 서울 모처에서 강의한 동영상입니다.

가슴에 팍팍~~ 와 닿은 말들이 있네요.

"내 나라 내 땅에서 영어를 잘하는 것 잘하는 것은 자랑거리이나 못하는 것이 수치는 아니다"

"유머는 그 사람을 좋아하기 때문에 ..."

"사랑과 시와 예술과 웃음에는 기술이 필요없습니다. 진심만 있으면 됩니다. "



당분간 김제동時의 모습을 TV에서 볼 수 없다는 것이 아쉽긴 합니다만 곧 좋은 모습으로 복귀할 것이라 생각됩니다.

이사람의 강의는 들어도 재미있고 감동도 있네요.

조만간 대안학교를 준비한다고 하는데 여유만 되면 같이 참여하고 싶네요.

식약청 홈피의 내용을 인용한 것도 명예훼손인가?

IT산책

황당한 메일 한 통을 받았습니다.
생각에 따라 어찌보면 황당할 수도 있고 아닐 수도 있겠습니다만
저는 좀 이해가 안되더군요.

메일의 내용은 이렇습니다.


올 4월에 석면 파동이 있었고 식품의약품 안전청에 석면이 함유된 화장품의 목록을 공개하였습니다.

식품의약품안전청 게시물 바로가기

식약청은 석면 함유 화장품을 회수하라는 명령과 함께 관련 제품을 회수 활동도 직접 병행하고 있는 상태였고 저는 해당하는 석면 함유 화장품의 목록과 사진을 식약청에서 인용하여 블로그에 포스트하였습니다.

굳이 변명을 하자면 인터넷 유저들이 식약청 홈페이지에 들어가서 일일이 볼 사람들이 적을 것 같아
좀더 많은 사람들에게 석면 함유 화장품의 목록을 알리고 싶어서 제 블로그에 올렸습니다.

이것이 명예훼손일까요?
있지도 않은 사실을 위조해서 퍼트린 것도 아니고 정부공인기관에서 공개한 자료를 좀더 알린 것 뿐인데 명예훼손이라니 참 황당했습니다.

지금 해당 포스트는 Daum 관리자에 의해서 접근금지 되어 있는 상태입니다.
불필요한 소송에 휘말리고 싶지 않으면 바로 삭제하고 그렇지 않으면 권리침해신고센터에 소명을 해서 신고를 하라고 합니다.

신고를 하려고 봤더니 신분증도 이미지로 올려야 되고 자세한 사유도 써야 하더군요.
갑자기 귀찮니즘이 발동하기 시작했습니다.
그까이꺼이 대충~~ 삭제해하죠 모... ^^;

앞으로는 정부가 공개한 정보도 포스트에 올릴 때 조심해야 할 것 같습니다.
올려놓고 무관심하게 있다가는 법원의 출두명령을 받을지도 모르니까요.


메신저로 금융사기 치는 법

IT산책

기분 좋은 월요일입니다. ^^;
선덕여왕을 기다리는 관계로 월요일이 즐겁습니다. ㅎㅎㅎ

오전 주간보고 회의를 마치고 프로젝트를 수행하고 있는 한 사이트를 점검도 하고
점심도 사줄 겸 해서 방문했습니다.
팀원들과 점심을 먹고 있는 사이에 회사에서 전화가 불이나게 오더군요.

요지는 저의 NateON 메신저로 누군가 돈을 요구하고 있다는 것입니다.
평소 MSN을 많이 사용하고 NateON은 회사사람 몇 사람만 등록해 두고 업무로 가끔 사용하고 있었는데 500만원, 450만원, 100만원 등을 직원들에게 빌려달라고 한다는 것이었습니다.

순간 약간 겁이 나고 어이가 없었습니다.
얼마전에 PC도 깨끗하게 포맷했고 백신 프로그램으로 전체 디스크로 싹 검사했을 때 아무런 이상이 없었는데 어떻게 메신저가 해킹이 될 수 았을까?
아무리 생각해도 답이 안나오더군요.

그래도 컴퓨터로 먹고 사는 직업이고 남보다는 조금 더 잘 안다고 생각했었는데 해킹 기술도 참으로
대단한 것 같습니다.

지난주에는 회사의 다른 직원이 친구에게 돈을 몇백만원 보냈는데 그게 오늘처럼 해킹당한 친구 아이디와 대화하다가 그냥 아무 의심없이 돈을 보낸 사건이 있었습니다. 경찰에 신고하고 지급정지하고 암튼 할 수 있는 조치를 취하긴 했죠.

오늘의 경우는 총무팀의 한 과장이 저의 메신저(?)를 받고 약간 의심이 들어 바로 저에게 전화를 걸어 확인하고서는 사이버경찰에 신고하기 위해서 일부러 시간을 끌고 계좌번호, 이름 등을 알아내는 통에 아무런 사고 없이 넘어갔습니다.
저도 전화를 받고 얼른 NateON에 등록된 사람들에게 문자를 보내서 절대로 돈을 보내지 말라고 했구요.

그럼 이놈들의 수법을 한번 살펴보겠습니다.  (상대방의 아이디는 안보이게 처리합니다.)

처음부터 아주 다정하게 이름을 부르더랍니다.
NateON 리스트에 있던 몇 사람에게 그랬는데 일단 평소에 이름으로 부르지 않던 사람이 바로 다정하게 이름을 부르면 의심을 꼭 하세요.



전형적인 수법으로 보안카드를 두고와서 그러니 돈을 대신 보내주면 저녁에 주겠다는 식으로 말을 합니다. 이때부터 우리 회사 총무팀 과장이 감을 잡고 시간을 질질 끌었습니다.


500만원을 빌려달라고 하고.. 없다니까 100만원이라도 안되냐고 그럽니다.

총무팀 과장님이 계좌번호를 받아서 정확하게 18원을 송금했습니다. ㅎㅎㅎ
그러고는 계좌이체가 안된다고 다른 은행 없냐고 물으면서 다른 계좌까지 알아내고자 하는 노력을 했죠.
확보된 데이터를 가지고 사이버경찰에 신고했습니다.

저도 한번 설정된 패스워드를 그렇게 쉽게 바꾸는 편이 아니었습니다.
하지만 오늘 사건을 계기로 주기적으로 패스워드를 교체해야 한다는 사실을 새삼 느꼈습니다.

누가 저리 당할까 생각하지만  참 쉽게 돈을 주는 사람이 있더군요.
절대로 메신저로는 돈을 주지 마세요.
꼭~~ 명심합시다.

결혼기념일, 아내 생일을 잊지말자 - 일정관리 프로그램 네이버 캘린더

IT산책

이런 저런 이유로 네이버를 그다지 좋아하지 않았지만 우연한 기회에 네이버 캘린더라는 놈을 접하게 되었습니다.

그동안 다음캘린더, 플랭클린 플래너 웹버전, AnyCall의 일정관리, 아웃룩 등 나름대로 여러가지 일정관리 프로그램을 사용해 보았습니다만 딱히 입맛에 맞는 것이 없어서 그냥 온라인은 아웃룩, 오프라인은 플래너를 가지고 관리를 했었습니다.

그런데 네이버 캘린더라는 놈은 생각보다 괜찮더군요.
가장 마음에 드는 기능은 저장에 해 놓은 일정을 문제메시지로 날려준다는 것입니다. ㅎㅎ
잊을만 하면 문자로 팍팍~~ 날려주니 중요한 기념일이나 일정을 잊을 일이 별로 없더군요.

두번째는 아웃룩과 동기화가 잘 된다는 것입니다.
다음캘린더를 사용할 때 사용하다가 그만 둔 것이 바로 아웃룩 동기화가 제대로 안되어서 버렸었는데
네이버는 잘 되더군요. (물론 이제는 다음 캘린더도 잘 될 것이라 생각합니다.)

일정관련하여 문자나 메일로 받을 수 있고 기본적인 메모도 가능하고 미니캘린더라 하여 웹이 아닌
PC에 항상 띄워놓고 쓸수도 있고 괜찮은 것 같습니다.


제가 사용하고 있는 네이버 캘린더의 웹화면입니다.
일간, 주간, 월간, 2주 등 다양한 View가 가능합니다. 또한, 개인일정, 회사일정, ㅇㅇ일정 등 여러 개를 색깔로 구분하여 입력할 수도 있습니다.


제가 마음에 들어했던 무료 SMS입니다. 본인의 휴대전화를 등록해 놓으면 모든 일정, 기념일을
문자로 받을 수 있습니다.


제가 애용하는 미니캘린더 입니다.
항상 띄워놓고 일정관리를 하고 있습니다. 기능은 웹화면과 거의 같습니다.

그외 일정공유를 통해 팀원들과 업무일정을 공유할 수도 있고 할일 목록을 작성할 수도 있습니다.
한번쯤 사용해 보시면 마음에 드실꺼라 생각합니다.

네이버 캘린더 바로가기

포탈들도 무시하는 간도반환

IT산책

2009년 9월 4일이 지나면 간도가 영영 중국땅이 되어 버리기 때문에 그 전에 소송이라도 해서 시효를 연장해야 된다는 재미교포의 기사가 있었습니다.

[관련기사]

하지만 그 기사가 올라온 시간에만 잠시 반짝였을 뿐 '간도반환'에 대해서 포탈이나 메타블로그 들은 무심한 것 같습니다.

어떤 기사를 보면 인터넷에서 블로그에서 간도반환에 대한 관심이 너무 뜨겁고 각종 포스트가 올라온다고 하였습니다.

하지만, 다음, 네이버, 야후, 올블로그, 블로그코리아, 티스토리 등 어디를 찾아보아도
"간도", "간도반환" 등으로 만들어진 섹션이 없습니다.


포탈에서, 메타블로그에서 섹션이건 탭이건 하나만 개설해 주고 관련 기사와 포스트들을 모아 놓은 정도만 신경을 써줘도 그 영향력이 대단할 것이라 생각되는데 전혀 그렇게 움직이질 않고 있습니다.

돈 많은 포탈은 간도에 대해서 전혀 무관심인 것일까요? 아니면 무지일까요?
어제, 그제 그리고 오늘까지
포탈의 한 귀퉁이를 장식하고 있는 것은 "김민선","광우병", "전여옥" 뭐 이런 것들입니다.

이 주제가 요 2-3일동안 회자되었고 또한 많은 네티즌들이 관심을 갖고 있는 것도 사실입니다.
그러니 당연 포탈에서는 트래픽 유도차원에서 이런 기사, 포스트를 상당부분 걸어놓았겠지요.
그건 인정합니다. 돈 벌어야 되니까 당연히 그렇게 해야 됩니다.

그러나 개인적으로 "간도반환"문제도 광우병 문제만큼 중요하고 또한 시급한 문제라고 생각합니다.
현실적으로 Dead Line이 설정된 문제니까요.

포탈과 메타블로그에게 부탁드립니다.
늦었지만 지금이라도 간도에 대한 컨텐츠를 모아 올려주시고 네티즌들의 의견을 담을 수 있는 그릇을 하나 만들어 주세요.

그러면 그 파장이 정부로, 정치권으로 흘러들어서 간도반환소송으로 이어질 것입니다.
국민의 소리가 있는 곳이면 정치권이 움직입니다.
그러나 지금과 같은 모습이면 정부, 정치권 절대로 안 움직일 것 입니다.

중국하고 싸워야 하고 귀찮은 일일지도 모르고..
나중에 혹시라도 지면 욕먹게 되니 누구하나 선뜻 나서지 못하고 있는 것 같습니다.

다시 한번 말씀드립니다.
포탈에서 조금더 관심을 가져주세요.
간도가 우리땅이 되는 것을 상상하면서 말이죠.