시멘틱 웹

이온디
2009년 11월 15일

Tim Berners-Lee에 의해 1989년에 처음 제안된 월드와이드웹은 널리 알려진 클라이언트-서버 개념과 쉽게 익힐 수 있는 간단한 HTML 언어를 이용하여 편리성을 추구한 덕분에 일반 사용자 누구나 쉽게 정보를 접근하거나 게시할 수 있게 되었고, 결과적으로 폭발적인 정보의 증가를 가져왔다. 웹에는 현재 수많은 기관과 커뮤니티, 개인들이 서로 다른 목적으로 생성한 셀 수 없을 정도의 많은 문서와 정보가 포함되어 있다. 사용자들은 이러한 정보를 이용하기 위해 브라우저에 URL 주소를 직접 입력하거나 하이퍼링크를 따라가기도 하고, 검색엔진의 도움을 받기도 한다. 이러한 단순성이 현재 웹의 성장을 가져온 중요 열쇠가 되기도 하였다.

하지만 이런 단순성이 웹의 정보가 감당할 수 없을 정도로 방대해진 현 상황에서는 문제점으로 작용하기도 한다. 검색 측면에서 보면 현재의 웹 검색엔진은 주로 단어의 빈도수나 어휘 정보를 이용하여 문서의 유사도를 측정하고 랭킹을 매기기 때문에 사용자의 질의와는 관계없는 많은 문서를 결과로 가져올 수 있고 이로 인해 사용자는 불필요한 정보를 걸러내느라 시간을 낭비하게 된다. 또한 HTML로 여러 관련 문서를 확장하거나 통합, 공유하는 것은 매우 어렵다.

이런 문제점이 발생하는 가장 주된 원인은 현재의 웹이 사람을 위한 것이고 이를 위해 사람이 보고 잘 이해할 수 있도록 하기 위한 브라우저의 디스플레이 또는 레이아웃 기술에 초점을 맞추고 있다는 것이다. HTML 언어의 특징이 바로 이러한 디스플레이용이라는 사실이 이를 뒷받침하고 있다. HTML을 이용하여 문서의 내용과 의미를 나타내는 시맨틱 정보를 표현하기가 어려우며, 따라서 사람이 아닌 프로그램 또는 소프트웨어 에이전트(software agent)가 자동으로 문서로부터 의미를 추출하기가 어렵다. 시맨틱 웹은 메타데이터의 개념을 통하여 웹 문서에 시맨틱 정보를 덧붙이고 이를 이용하여 소프트웨어 에이전트가 이 의미 정보를 자동으로 추출할 수 있는 패러다임을 조성하는 것이다. 부수적으로 의미 정보의 자동 추출뿐 아니라 정보의 확장이나 공유 등도 가능하게 될 것이다.

Tim Berners-Lee는 시맨틱 웹이 기존의 웹과 완전히 구별되는 새로운 웹의 개념이 아니라 현재 웹을 확장하여 웹에 올라오는 정보에 잘 정의된 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이라고 그 역할을 정의하였다.[1] 대표적인 월드와이드웹 표준화 단체인 W3C(World Wide Web Consortium)에서는 시맨틱 웹을 RDF나 기타 다른 표준을 기반으로 웹에 있는 데이터를 추상적으로 표현하는 것이라고 정의하였다. 두 가지의 정의가 어떻게 보면 일맥 상통한다고 할 수 있으며 결국은 기존의 웹 데이터에 의미를 부여할 수 있는 표현 방법을 제시하는 것으로 요약된다.

다음 글을 참고하세요.

http://html5korea.co.kr/board_htmlelements

 
댓글은 로그인 사용자만 작성 가능합니다. 로그인하기