_075-094________±èÇöÈñ.hwp


태그 질의 확장 기능에 기반한 
비디오 검색 시스템의 효율성에 한 실험  연구*

An Experimental Study Investigating the Retrieval Effectiveness of 
a Video Retrieval System Using Tag Query Expansion

김 현 희(Hyun-Hee Kim)**

목  차

1. 서 론
1.1 연구의 배경과 목
1.2 연구 문제, 가설  방법

2. 선행 연구
2.1 폭소노미 기반 탐색
2.2 질의 확장

3. 비디오 자료의 태그 분석
3.1 태그의 특성  색인어로서의 가치
3.2 태그 구조화 작업
3.3 논의

4. 실험 설계
4.1 표본 비디오
4.2 실험시스템 설계
4.3 피조사자와 설문지
4.4 실험 차

5. 데이터 분석
5.1 질의 확장이 비디오의 검색 효율성에 

미치는 향
5.2 논의

6. 결 론

 록
본 연구는 폭소노미가 비디오 자료를 색인하고 라우징 하는데 얼마나 유용한지 살펴본 후, 동등어, 동의어 

 련어를 활용한 질의 확장을 통해서 수행되는 폭소노미 태그 통제가 비디오 검색에 얼마나 효율 인지 조사해 

보았다. 이를 해서, 태그들을 태그 간의 동등  연  계에 기 하여 클러스터링하고 이러한 정보를 질의 

확장에 용시킨 실험 시스템을 설계, 구 하고 이러한 제안된 시스템이 정보검색 과정에서 폭소노미의 효율성을 

얼마나 개선시킬 수 있는지에 해서 실험을 통해서 확인해 보았다. 실험 결과, 질의 확장을 통해서 태그 통제를 

한 제안된 시스템은 태그 통제를  하지 않은 시스템과 비교하여, 재 율은 증가하 으나 정확률은  차이가 

없는 것으로 나타났다. 본 연구 결과는 폭소노미를 디지털 비디오 도서 의 소셜 메타데이터로 용하기 한 

하나의 방안이 될 것으로 생각된다.

ABSTRACT
This study designed a pilot system in which queries can be expanded through a tag ontology where 

equivalent, synonymous, or related tags are bound together, in order to improve the retrieval 
effectiveness of videos. We evaluated the proposed pilot system by comparing it to a tag-based system 
without tag control, in terms of recall and precision rates. Our study results showed that the mean 
recall rate in the structured folksonomy-based system was statistically higher than that in the 
tag-based system. On the other hand, the mean precision rate in the structured folksonomy-based 
system was not statistically higher than that in the tag-based system. The result of this study can 
be utilized as a guide on how to effectively use tags as social metadata of digital video libraries. 

키워드: 텍사노미, 폭소노미, 태그, 비디오, 질의 확장, 시맨틱 검색
Structured Folksonomy, Relevance Judgment, Recall, Precision, Tag Gardening

*

**

이 논문은 2009년도 정부재원(교육과학기술부 인문사회연구역량강화사업비)으로 한국학술진흥재단의 

지원을 받아 연구되었음(KRF-2009-32A-H00005). 

본 내용은 한국문헌정보학회 창립 40주년 기념 국제학술 회(2010년 10월 8일)에서 발표한 것을 정리한 것임. 

명지 학교 문헌정보학과 교수(kimhh@mju.ac.kr)

논문 수일자: 2010년 9월 6일   최 심사일자: 2010년 9월 16일   게재확정일자: 2010년 11월 9일

한국문헌정보학회지, 44(4): 75-94, 2010. [DOI:10.4275/KSLIS.2010.44.4.075]


76  한국문헌정보학회지 제44권 제4호 2010

1. 서 론

1.1 연구의 배경과 목

통제어휘와 텍사노미는 용어간의 계를 정

의하는 분류시스템으로 정의된다. 텍사노미는 

용어간의 계층  는 연  계를 설정하는 

문가에 의해서 설계된 통제 기호나 어휘의 

집합인 통제 어휘로 정의된다(Smith 2008). 

이러한 통제어휘나 텍사노미의 특성  하나는 

인  요소가 개입된다는 이다. 를 들어서, 

도서 은 어떠한 주제의 자료라도 수집하여 정

리할 수 있어야 하는데 정보 문가들이 모든 

지식의 분야에서 문가가 되어 색인하는 것이 

어려운 것이 실이다(Steele 2009). 이러한 문

제 은 분류 시스템이 디지털 도서 과 웹에 

용될 때 더 커지는데 이는 방 한 데이터의 

양 때문이다.  다른 문제 은 통제어휘 는 

텍사노미는 정보 문가에 의해서 설계되기 때

문에 이용자 어휘와 일치하지 않는 경우들이 

생겨날 수 있다는 이다.

최근, 이용자들은 웹에서 스스로 컨텐츠를 

구축하기 시작하 다. 즉, 이용자들은 문헌들을 

축 하고 이러한 문헌들이 검색될 수 있도록 

그들의 키워드(웹 2.0에서는 태그로 지칭됨)로 

태깅하기 해서 소셜 소 트웨어를 사용하기 

시작하 다. 이러한 색인 과정은 소셜 태깅이

라 부르고 한 랫폼에서 사용된 태그의 집합

은 폭소노미로 지칭된다(Weller 2007). 자원에 

한 메타데이터 생성 작업이 문 인 활동에

서 이용자에 의한 공유된 의사소통 활동으로 

변화하는 것은 요한 발 이며 이러한 변화는 

미래 시스템 개발을 해서 연구되어야 할 분

야로 생각된다(Mathes 2004).

폭소노미는 비용  효과 면에서 유리하고 

비디오와 같이 텍스트 기반 메타데이터를 컨텐

츠에 포함하고 있지 않는 멀티미디어 자료인 

경우에 특히 유용하며 한 이용자 어휘를 반

할 수 있다는 이 장 으로 언 되고 있다. 

Heymann et al.(2008), Yi(2009), Geisler and 

Burns(2007), Sharma and Elidrisi(2008) 등

을 포함한 많은 연구들은 폭소노미가 컨텐츠를 

색인하고 검색하는데 효율 인 방법으로 사용

될 수 있고 앞에서 언 한 텍사노미와 련된 

문제를 해결하는 안이 된다고 주장하고 있다. 

구체 으로, Heymann 등은 소셜 태그를 웹 

검색 질의를 확 시키는 자원으로 사용할 수 있

는지 연구하 는데 소셜 태그가 웹 검색에 유용

하게 용될 수 있음을 확인하 다. Yi는 잠

재 의미 색인 방법(Latent Semantic Indexing 

method)을 사용한 정보 검색 모델의 맥락에서 

소셜 태그의 색인 가치를 평가하 다. 그의 연

구 결과는 태그된 자원의 DDC-기반 분류를 

해서 색인어로서의 소셜 태그의 사용 가능성을 

보여 주었다. 한편, Geisler와 Burns는 유투  

태그가 특히 검색에 부가 가치를 제공하고 있

는데, 이는 태그의 66%가 서명이나 기술과 같

은 다른 메타데이터에 나타나지 않기 때문이라

고 하 다. Sharma와 Elidrisi는 유투  비디오

를 비디오 태그를 이용하여 미리 정의된 카테

고리에 따라서 분류했는데 분류의 정확성은 

65%로 나타났다. 이들은 이러한 연구 결과를 

기반으로 하여 비디오 태그가 메타데이터로 사

용될 수 있다고 제안하고 있다.

이와 같이 기존 연구들이 폭소노미가 색인

어로서 유용하게 사용될 수 있다고 제안하고 


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  77

있지만 여 히 이를 정보 검색에 효율 으로 

용하기 해서는 해결해야 할 몇 가지 문제

들이 있다. 표 으로, 폭소노미-기반 근

은 텍사노미와 달리 태그들을 태그간의 계

를 드러내지 못하는 평면 인 구조로 보여

다(Matusiak 2006). 즉, 폭소노미는 어휘 통제

를 하고 있지 않으며 이로 인해서 동의어는 함

께 모아지지 않고, 동음이의어는 구별되지 않

는다. 이는 검색 효율성의 하를 가져다  수 

있다. 

따라서, 폭소노미의 특성을 그 로 유지시

키면서 이를 텍사노미의 질 높은 구조  시맨

틱과 결합시키는 하나의 방안으로 태그간의 

계를 기술한 온톨로지를 이용해서 폭소노미

를 구조화하는 것을 생각해 볼 수 있다. 용어

(태그)간의 계는 크게 두 가지, 동치  계

(paradigmatic relationship)와 통합  계

(syntagmatic relationship)가 있다. 동치  

계는 계층 계, 동등 계 는 연 계와 같

은 언어  객체의 클래스들을 정의하는 유사성 

계를 의미한다. 반면에 통합  계는 언어

 단 ( , 단어, 구 등)가 다른 언어  단 들

과 차례로 함께 출 한다는  때문에 형성되

는 계를 의미한다. 이러한 온톨로지에 기반

한 구조화된 폭소노미는 태그 생성 시 태그 추

천 방식을 통해서 태그 품질을 리하는 측면

으로 활용될 수 있고, 질의를 확장하여 검색 결

과를 확장할 때에도 이용될 수 있다. 

본 연구의 목 은 태그들을 태그 간의 동등 

 연  계에 기 하여 구성한 온톨로지를 

통해서 구조화한 후 이를 태그 질의 확장에 

용한 구조화된 폭소노미 기반 시스템을 설계, 

구 하고 이러한 제안된 시스템이 정보검색 과

정에서 폭소노미의 효율성을 얼마나 개선시킬 

수 있는지 테스트해 보았다. 아울러, 비디오 태

그의 색인어로서의 가치를 분석해 보고 비디오 

태그들을 태그 간의 동등  연  계에 기

하여 어느 정도 구조화시킬 수 있는지 조사해 

보았다. 

1.2 연구 문제, 가설  방법

본 연구는 크게 세 개의 연구문제와 두 개의 

연구 가설을 갖고 있다. 다음은 이들을 설명하

면서 동시에 각 연구 문제  가설을 검증하기 

해서 사용한 연구 방법들을 설명한다.

1.2.1 연구 문제 1과 2

첫 번째 연구 문제는 비디오 자료에 할당된 

태그의 특성  색인어로서의 가치는 어느 정도

인가이다. 이를 해서 총 5개의 카테고리와 17

개의 하 카테고리로 구분한 태그 카테고리 

임워크를 이용하고, 비디오 태그의 분석 결과

를 이미지 자료의 태그 분석 결과와 비교해 보

고자 한다. 두 번째 연구 문제는 비디오 태그들

을 태그 간의 동등  연  계에 기 하여 어

느 정도 구조화시킬 수 있는지 조사해 보고자 

한다. 이를 해서 구체 으로 태그간의 동등

계를 악하기 해서는 워드넷(WordNet) 2.1

의 동의어를 이용하 고, 태그간의 연 계를 

악하기 해서는 리커의 련어 태그 데이

터베이스를 사용하 다. 

1.2.2 연구 문제 3

세 번째 연구 문제는 동의어와 련어에 의

한 질의 확장이 비디오의 검색 효율성(재 율


78  한국문헌정보학회지 제44권 제4호 2010

과 정확률)에 어떤 향을 미칠 것인가이다. 선

행 연구들을 살펴보면, 통제어를 사용한 질의 

확장이 재 율을 증진시키지만 정확률을 감소

시킨다는 연구가 있고(Greenberg 2001), 복

수개의 시소러스를 사용한 질의 확장이 질의 

확장을  하지 않는 경우와 비교하여 정확

률이 높아진다는 연구 결과도 있다(Mandala, 

Tokunaga & Tanoka 1999). 이러한 연구들은 

부분 텍사노미를 기반으로 한 연구이기 때문

에 그 결과를 폭소노미 검색에 그 로 용하

기에는 어려움이 있다. 김 희와 김용호(2010)

는 이미지 자료에 해 태그 구조화를 통한 질

의 확장을 한 경우와 질의 확장을  하지 않

은 경우를 비교한 경우, 질의 확장을 한 경우가 

하지 않은 경우 보다 재 율과 정확률이 모두 

통계 으로 더 높게 나타났다. 따라서 폭소노

미 검색 환경에서 실험을 한 앞의 연구 결과에 

기 하여 다음과 같은 가설을 구축하 다. 

∙가설 1: 동의어와 련어에 의한 질의 확

장을 통해서 태그 통제를 한 구조화한 폭

소노미 기반 시스템이 태그 통제를  

하지 않은 태그 기반 시스템보다 평균 재

율이 더 높을 것이다.

∙가설 2: 동의어와 련어에 의한 질의 확

장을 통해서 태그 통제를 한 구조화한 폭

소노미 기반 시스템이 태그 통제를  

하지 않은 태그 기반 시스템보다 평균 정

확률이 더 높을 것이다.

두 개의 연구 가설들을 검증하기 해서 두 

개의 비디오 검색 시스템, 즉 질의 확장을 할 수 

있고, 라우징 단계에서 텍스트 기반 메타데이

터를 보여주는 폭소노미 기반 시스템  질의 

확장을 하지 않고, 텍스트 기반 메타데이터를 

보여주는 태그 기반 시스템을 구 하 다. 이 

시스템들의 구성을 해서 유투 의 술  건

축 분야의 300개의 비디오를 샘  자료로 이용

하 다. 두 시스템간의 검색 효율성(재 율과 

정확률)을 비교, 평가하기 해서 9개의 질문과 

M 학의 학부 학생들로 구성된 58명의 피조사

자들을 이용하 고, 평가 결과의 통계 분석을 

해서 SPSS 통계 패키지를 활용하 다.

2. 선행 연구

2.1 폭소노미 기반 탐색

Kolbitsch(2007)는 Furnas et al.(1987)의 

연구 결과에 기 하여 시스템 이용자들이 동일

한 객체에 해서 매우 다양한 태그들을 부여

한다고 주장하고 있다. 를 들어서 동일한 객

체에 해서 두 명의 이용자가 태깅을 할 때, 

이용자 A는 이용자 B에게 명확하지 않은 표

을 이용할 수 있고 그 반 의 경우도 일어날 수 

있다. 이는 언어 문제를 야기시킨다. 그는 이와 

같은 리커의 언어 문제를 해결하기 해서, 

리커 질의를 워드넷으로 확장한, WordFlickr

시스템을 제안하 다. 제안된 시스템과 리커

의 검색 결과를 비교하는 비공식 인 실험을 

하 다. 질  평가 결과는 WordFlickr가 리

커보다 뛰어나고, WordFlickr의 검색 결과  

가장 높은 빈도의 태그들이 의미 으로 리커

의 검색결과보다 이용자의 기 질문에 더 가

까운 것으로 나타났다. 이 연구는 리커 보다 

WordFlickr가 검색 효율 측면에서 더 우수하


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  79

다고 실험을 통해서 증명하지는 못했다. 유사

한 연구로, Laniado et al(2007b)는 의미 으

로 질의를 확장하기 해서 딜리셔스의 폭소노

미를 워드넷과 결합하 다. 

Hayman(2007)은 시소러스에 의해 통제될 

수 있는 폭소노미 모델을 소개하 다. 이 모델

은 이용자가 문서를 태깅할 때 참조할 수 있도

록 시소러스를 제공한다. 이러한 근 방식은 

자칫 소셜 태깅의 자유와 편리함을 잃어버릴 

우려가 있어 보인다. Morrison(2008)은 소셜 

북마크 웹 사이트에서의 폭소노미의 검색 기능

을 검색 엔진  주제 디 토리와 재 율과 정

확률 측면에서 비교하 다. 비교 결과, 검색 엔

진이 가장 높은 재 율과 정확률을 나타냈고, 

폭소노미의 검색 기능도 기  이상으로 높게 

나타났다. 체 으로 디 토리는 폭소노미 보

다 정확률은 높았으나 재 율은 비슷했다. 이 

연구는 폭소노미 기반 검색 환경에 합한 새

로운 탐색 로직과 기술의 개발이 필요하다고 

제안하 다. 

Melenhorst et al.(2008)은 검색 과정에 

한 소셜 태그, 문 메타데이터, 자동으로 생성

되는 메타데이터의 기여도를 조사했다. 이 연

구를 해서 194명의 피조사자들이 총 115개 

비디오들을 태깅하도록 하 다. 한 140명의 

 다른 피조사자들이 8개 질문에 답할 수 있도

록 비디오 자료를 검색하도록 하 다. 검색 결

과, 소셜 태그가 문 메타데이터나 자동으로 

생성되는 메타데이터와 거의 동등한 검색 결과

를 보여 주었다. Siersdorfer et al.(2009)은 겹

치거나 복된 비디오 형식에서 유투 가 높은 

복성을 보여 다고 하 다. 따라서, 이들을 

컨텐츠 복을 이용하여 자동 으로 풍부한 비

디오 태그를 얻기 한 태그 확장 방안들을 제

안하 다. 

김 희 외(2010)는 이미지 자료에 해 태그 

통제를 통한 질의 확장을 할 수 있는 구조화된 

폭소노미 시스템을 제안하 다. 이 연구는 키

피디아, 워드넷  리커 련 태그들은 동등

어, 동의어, 련어 태그를 선택하기 해 사용

하 다. 실험 결과는 제안된 구조화된 폭소노미 

시스템의 재 율과 정확률이 통제되지 않은 태

그기반 시스템보다 통계 으로 더 높게 나타났

다. 한 이들은 리커 이미지에 할당된 태그

를 17개 하 카테고리로 분류하 다. 분류 결

과, 그룹명, 사진술 등을 기술한 메타데이터요

소(34.1%)가 가장 높게 나타났고, 그 다음으로 

장소(14.9%), 객체(12.4%), 주제(9.7%) 순으로 

나타났다.

2.2 질의 확장

Mandala, Tokunaga  Tanoka(1999)는 세 

가지 다른 유형의 시소러스의 결합으로 질의 

확장을 수행하 다. WordNet, 동시 출  기반

(co-occurrence-based) 시소러스, 심어-수

식어(head-modifier) 계를 기반으로 한 시

소러스가 그것이다. 여기서, 심어-수식어 

계는 네 개의 구문  계, 즉, 주어-동사, 동

사-목 어, 형용사-명사, 그리고 명사-명사 

계를 포함한다. 확장된 용어에는 기 질의

에 있는 단어들과 비교하여 유사성에 따라서 

가 치가 부여되었다. 이 연구 결과, 세 시소러

스의 결합을 통한 질의 확장은 질의 확장을 

 하지 않았을 경우 는 오직 한 시소러스만 

포함했을 경우보다 더 좋은 평균 정확률을 보


80  한국문헌정보학회지 제44권 제4호 2010

여주었다. Greenberg(2001)는 Boolean 정보 시

스템(the Dialog system)을 통해 검색된 ABI/ 

Inform 데이터베이스에서 ProQuest의 통제어

휘를 사용한 질의 확장을 한 여러 시소러스 

계들의 효과를 조사하 다. 이 연구는 동의

어와 의어의 이용이 정확률을 조  감소시키

면서 재 율을 증가시키는 반면, 련어와 

의어의 이용은 정확률에서 상당한 감소를 가져

다 주었지만 상 으로 재 율을 증가시켰다

고 밝혔다. Manning(2008)은 질의 확장이 일

반 으로 재 율을 향상시킨다고 보고하고 있

다. 이러한 연구들은 부분 통 인 색인을 

기반으로 한 연구이기 때문에 그 결과를 폭소

노미 검색에 그 로 용하기에는 어려움이 있

다. 김 희와 김용호(2010)는 이미지 자료에 

해 태그 구조화를 통한 질의 확장을 한 경우

와 질의 확장을  하지 경우와 비교한 경우, 

질의 확장을 한 경우가 하지 않은 경우 보다 재

율과 정확률이 모두 통계 으로 더 높게 나

타났다. 

선행연구들은 폭소노미가 이용자의 요구와 

기  틀에 합한 방식으로 컨텐츠를 주석하

고 검색하는 효율 인 방법이라고 주장하고 

있다. 하지만, 이러한 연구들은 폭소노미 태그

가 비디오 자료의 검색에 얼마나 잘 용될 수 

있는지 더 나아가 질의 확장과 같은 태그 가드

닝(tag gardening)1)이 검색 효율성 향상에 어

떤 향을 미치는지에 한 구체 인 연구 결

과는 거의 없는 편이다. 따라서, 본 연구는 태그

간의 계를 분석하여 질의를 확장할 수 있는 

구조화된 폭소노미 기반 시스템을 설계, 구

하고 이러한 제안된 시스템이 정보검색 과정에

서 폭소노미의 효율성을 얼마나 개선시킬 수 

있는지에 해서 조사해 보고자 한다. 

3. 비디오 자료의 태그 분석

태그의 특성  색인어로서의 가치(연구 문

제 1)와 비디오 자료의 태그 구조화 작업(연구 

문제 2)을 분석한 결과는 다음과 같다.

3.1 태그의 특성  색인어로서의 가치

3.1.1 태그 분포 패턴

이미지, 비디오와 같은 멀티미디어 자료에 부

여된 태그들은 텍스트 기반 자료에 할당된 태그

와 조  다른 성격을 지니고 있는 것으로 악

되었다(Ménard 2007). 즉, 멀티미디어 자료에 

부여되는 태그의 카테고리는 Panofsky(1955)

가 이미지에 한 사람들의 이해 수 을 설명하

기 해서 사용한 ‘ 도상학(기술)’, ‘도상학(분

석)’  ‘도상해석학(해석)’의 세 단계를 포함하

여 멀티미디어 자료와 련된 제작자, 소장 장

소 등과 같은 메타데이터(isness)  개인 정보 

카테고리로 구분된다는 이다. 즉, 기술 단계

에서는 멀티미디어 자료의 기본 이며 자연

인 특징( , 색상, 모양)이 인지되며, 분석 단계

에서는, 멀티미디어가 무엇에 한 것인가를 

찰하는 단계이며 멀티미디어 속의 객체, 사건 

등이 인지된다. 해석 수 은 이미지가 갖는 고

유의 의미를 악하는 단계이다. <표 1>은 태

 1) Governor(2006)에 의해서 만들어진 용어로 재는 폭소노미 태그를 좀 더 생산 이고 효과 으로 사용하기 

해서 태그를 편집하고 조직하는 과정을 기술하기 해서 사용된다. 


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  81

카테고리 하 카테고리 빈도(%)

기 술

색상 11( 0.36)

질감/재료 14( 0.46)

모양/구성  7( 0.23)

숫자  8( 0.26)

텍스트  7( 0.23)

합계 47( 1.54)

분 석

사람/지 465(15.38)

사건/활동 191( 6.32)

객체 523(17.30)

공간(장소) 279( 9.23)

시간 51( 1.69)

씬(장면) 55( 1.82)

합계 1564(51.74)

해 석

추상 226( 7.48)

분 기/감정 6( 0.20)

주제 654(21.63)

기능 19( 0.63)

합계 905(29.94)

메타 데이터
메타데이터요소 497(16.44)

합계 497(16.44)

개인 정보
사 인 정보 10( 0.33)

합계 10( 0.33)

총 합 계 3023(100.0)

<표 1> 태그 분포 패턴

그들을 총 5개의 카테고리와 17개의 하 카테

고리로 구분한 것이다.

3.1.2 태그 분석 기

샘  비디오 300개 비디오에 부여된 총 3,023

개의 태그(복합어: 289(9.6%), 단일어: 2,734 

(90.4%))를 분석하 다. 태그 분석은 총 세 사

람이 했다. 문헌정보학과 학원생 두 명과 박

사 연구원 한 명이 수행했다. 태깅 분석 기 을 

숙지한 후, 처음에는 태그 분석을 두 명의 연구

자가 하 는데 두 연구자간의 분석 결과의 상

계수는 r=0.90로 높게 나타났다. 그런 다음 

박사 연구원을 포함한 세 명의 연구자들은 논

의를 통해서 두 연구자간에 일치하는 않은 태

그들에 해서 최종 으로 합의를 이끌어내어 

분류 작업을 진행하 다. 

태그 분석에서는 다음과 같은 분석 가이드를 

정하 다. 태그는 이용자가 입력한 형태 그

로 분석하 다. 를 들어서, 이용자가 “New 

York”이라고 복합어 형태로 입력했으면 그

로 분석하 다. 복합어 “New York”에는 분석 

카테고리에 있는 공간(장소) 서 카테고리를 

부여하 다. 한 “New”와 “York”를 각각 입

력했다면 이를 두 개의 단일어로 처리하 다. 


82  한국문헌정보학회지 제44권 제4호 2010

복합어나 단일어의 카테고리와 서 카테고리

를 할당할 때 분명치 않는 것은 비디오의 요약

문, 다른 태그들, 댓  등을 참조하여 해당 비디

오에 맞는 카테고리로 분류하고자 하 다. 

를 들어서, “New”와 “York”이라는 각각의 단

일어가 한 비디오에 함께 출 하고 해당 비디

오가 뉴욕에 한 주제를 언 했다면, “New”

과 “York” 단어 모두에 공간(장소) 서 카테

고리를 부여하 다. 한편 “New”라는 단어가 

“York”이라는 단어 없이 단독으로 출 하고 

다른 태그, “Jersey”, “Oleans” 등과 함께 해

당 출 하면서 지역을 언 했으면 역시 공간

(장소) 서 카테고리를 부여하 다.  다른 경

우로 “New”가 “University of New South 

Wales” 학을 지칭한 경우에는 “New”에 객

체 서 카테고리가 할당되었다. 본 샘  자료에

는 없지만 비디오가 뉴욕커에 한 주제를 다

루면서 “New”과 “Yorker”라는 단어가 함께 

부여된 경우라면 이 두 단어에는 사람/지 의 

서 카테고리가 할당될 것이며, “New”가 “새

로운” 의미로 사용되었다면 해석 카테고리에 

있는 추상 서  카테고리가 할당될 것이다. 

다음 단계는 두 개 이상의 분류 카테고리가 

겹치는 경우는 다음과 같은 기 을 용하 다. 

주로 비디오의 체 인 주제와 사건/활동, 추

상 인 개념, 장소, 객체 등과 겹치는 경우가 많

이 발생하 다. 이 경우는 이용자들의 사건/활

동, 객체 등의 인식과 추상 인 개념을 우선

으로 분석하고자 주제를 제외한 각 하  카테

고리의 분류를 우선시했다. 첫째, 주제와 사건/

활동이 겹치는 경우가 많이 생겨났다. 를 들

어, DDC 분류표의 ‘792’에 속해 있는 “춤”, 

“dance” 등을 주제로 볼 것인가, 아니면 사건/

활동으로 볼 것인가 하는 문제이다. 이 경우에는 

사건/활동을 우선시하여 태깅하 다. 둘째, 주

제와 추상 인 개념이 겹치는 경우도 생겨났다. 

를 들어, DDC 분류표의 ‘360’에 속해있는 “빈

곤”, “poverty”의 경우에는 추상 인 개념을 우

선시하여 태깅하 다. 셋째, 주제와 객체가 겹치

는 경우가 있었다. 를 들어, DDC 분류표의 

‘726’에 해당하는 “교회(건물)”, “church”의 경

우에는 객체를 우선시 하 다. 이외에 다의어와 

품사가 여러 개인 단어는 해당 비디오의 내용을 

악하여 합한 하  카테고리로 분류하도록 

하 다. 끝으로, 앞의 단계들을 통해서 분석 결

과가 명확하지 않는 경우에는 복수개의 하  카

테고리들을 부여하도록 하 다(김민경 2009).

분석 결과, 분석 카테고리(51.74%)가 가장 

높았고, 그 다음으로 해석(29.94%), 메타데이

터(16.44%) 순으로 나타났다. 한 가장 자주 

사용되는 하 카테고리는 주제(21.6%)이고, 그 

다음은 객체(17.3%), 메타데이터요소(16.4%), 

사람/지 (15.4%), 공간(장소)(9.2%) 순으로 

나타났다. 이와 같이 주제는 물론 비디오 속의 

객체, 사람  공간 인식을 폭소노미로 보완할 

수 있음을 확인할 수 있어서 폭소노미가 색인

어로서의 가치가 있는 것으로 나타났다. 

3.2 태그 구조화 작업

태그 구조화 작업은 크게 두 가지, 즉 워드넷 

2.1 단어와 유투  태그와의 매칭을 분석하

고, 그 다음으로 리커 태그와 유투  태그와

의 매칭을 조사하 다. 

첫째, 워드넷 단어와 3,023개의 태그  빈도

가 두 개 이상인 428개2)의 유투  태그간의 


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  83

복도를 단어를 기 으로 분석한 결과, 유투  

태그들의 255개(59.6%)가 워드넷 단어와 일치

하 다. 이러한 일치율은 Cattuto et al.(2008)

의 연구 결과 보다 다소 낮은 편이다. 그들은 

딜리셔스에 있는 가장 인기 있는 1,000개 태그 

 61.0%가 워드넷에 포함되어 있다고 보고하

다. 일치되면 그 다음 작업으로 수작업으로 

워드넷 동의어(synonyms) 항목을 체크한 후 

유투  태그와 의미 으로 가장 가까운 워드넷 

동의어를 최  세 개까지 선택하도록 하 다. 

이와 같이 일치율이 낮은 것은 복합어의 통일

되지 않은 여러 형태의 사용이나 검색을 고려

하지 않고 개인 인 정보 리를 하여 태그

를 부여하는 습  때문으로 분석되기도 하 다

(Peters 2009).

둘째, 428개의 유투  태그와 리커 태그와

의 복도를 조사하 다. 조사 결과, 유투  태

그의 410개(95.8%)가 리커 태그와 일치하

다. 복되지 않은 부분의 경우 어 이외의 

외국어로 된 태그들이었다. 그 다음 단계로 

복된 경우에 리커 태그가 련어 태그들을 

갖는 경우를 체크한 결과 408개(99.5%)의 

리커 태그가 련어 태그들을 포함하고 있었다. 

이와 같이 부분의 리커 태그들은 련어 

10개(핵심 련어 3와 비핵심 련어 7개)를 

포함하고 있었다.

3.3 논의

비디오 자료에 할당된 태그들을 분석한 결

과, 자주 사용되는 하 카테고리는 주제, 객체, 

메타데이터요소, 사람/지 , 공간(장소) 순으

로 나타나 주제는 물론 비디오 속의 객체, 사람 

 공간 인식을 폭소노미로 보완할 수 있음을 

확인할 수 있었다. 이러한 분석 결과를 이미지 

태그를 분석한 김 희 외(2010)의 연구 결과 

즉, 메타데이터요소(34.1%)가 가장 높게 나타

났고 그 다음으로 장소(14.9%), 객체(12.4%), 

주제(9.7%) 순으로 나타난 것과 비교해 볼 때, 

비디오 태그들이 이미지 태그들 보다 색인 

문가가 할당한 색인어에 더 가까운 것으로 보

인다. 이러한 결과는 Heckner, Neubauer  

Wolff(2008)가 주장한 내용 즉, 유투 의 비디

오들은 범 하게 태깅되는데, 이는 유투  이

용자들이 태깅을 하는 이유는 개인 수집물을 

리하기 해서 보다는 가능한 많은 사람들이 그

들이 등록한 비디오들을 검색하고 라우징할 

수 있도록 하기 해서라는 주장과 일치한다. 

선행 연구에서 지 한 것처럼 태그들을 살펴

본 결과, 태그간의 계층  구조를 보여주지 못

하고, 단복수의 구분이 없으며, 동의어는 물론 

동등어 통제가 되어 있지 않다는 것이 문제

으로 나타났다. 태그 구조화 작업에서는 리

커 태그와 유투  태그와의 복도(95.8%)는 

매우 높게 나왔다. 그러나, 워드넷을 통한 질

의 확장이 좋은 검색 결과를 산출할지라도, 모

든 질의(태그)가 확장될 수 없는 문제가 생겨

날 수 있는 이다. 따라서 태그와 텍사노미 용

어와의 일치율을 높이기 해서 태그의 어간 

사용, 여러 복합어 패턴을 하나의 일 성 있는 

 2) 출  빈도가 1인 태그들을 분석한 결과, 어 이외의 외국어들로 된 태그, 철자가 틀린 태그 등이 많았고 색인어

로서의 비용  효과 면에서 효용성이 낮아서 제외시켰다. 428개의 태그  복합어는 16개(3.7%)이었고, 단일어

는 412개(96.3%)이었다. 


84  한국문헌정보학회지 제44권 제4호 2010

형식으로 환시키기 한 방안이 필요해 보인

다(Yi and Chan 2009).

4. 실험 설계

다음은 연구문제 3에서 나온 두 개의 연구 

가설들(1.2.2 참조)을 검증하기 해서, 실험 

시스템들을 구 하고, 58명의 피조사자들을 

상으로 실험을 실시하 다. 다음은 실험 시스

템에 사용된 표본 비디오, 시스템 설계, 피조사

자와 설문지  실험 차에 해서 기술한다.

4.1 표본 비디오

샘  자료로 비디오를 선정한 이유는 태그들

이 제한된 텍스트 메타데이터를 갖는 비디오 

자료에 좀 더 다양한 근 을 제공하는데 매

우 유용하게 사용될 수 있다고 생각되었기 때

문이다. 한 술과 건축 분야에 한 비디오

로 샘  비디오의 주제를 제한하 는데 이는 

도서 에서 활용할 수 있는 학술 이면서 다양

한 해석이 가능한 주제로 생각되었기 때문이

다. 술 분야 자료는 ‘ 술’ 는 ‘art’를 검색

어로 하여 검색된 결과 에서 태그가 3개 이

상 부여된 150개의 비디오들을 일차 으로 선

정하 다. 그리고 건축 분야 자료는 ‘건축’ 는 

‘architecture'를 검색어로 하여 동일한 기 으

로 150개 비디오들을 선정하 다. 이로써 샘  

비디오의 수는 300개로 하 는데 질의가 9개로 

구성된 실험 환경에게 최소한 300개의 샘  자

료가 필요하다고 생각되었기 때문이다. 

4.2 실험시스템 설계

본 연구에서는 제안한 구조화된 폭소노미 기

반 시스템을 구 하고 이 시스템의 평가를 

해서 질의 확장 기능이 없는 태그 기반 시스템

도 함께 구성하 다. 

4.2.1 구조화된 폭소노미 기반 시스템 

제안한 폭소노미 기반 시스템은 태그 선택과 

라우징을 해서 카테고리  알 벳순 태그 

일들을 구축하 고, 질의 확장을 해서는 

동등의, 동의어  련어 일들을 구성하

다. 다음은 이러한 일들이 어떻게 구성되었

는지 상세히 설명하고 아울러 인터페이스에 

해서 상술한다.

(1) 태그 라우징  선택: 카테고리  

알 벳순 태그 일 

태그를 라우징하거나 선택하기 해 사용

될 두 개의 태그 일(카테고리와 알 벳 태그 

일)을 만들었다. 선정된 300개 비디오에 부여

된 총 3,325개 태그들  태그가 무 짧아서 의

미가 없거나 제3외국어로 해석이 불가능한 302

개를 제외한 3,023개를 데이터베이스로 구축하

다. 이들 태그들을 분석하여 복된 태그들을 

통합하여 총 1,542개의 유니크한 태그로 압축시

켰다. 각 비디오의 평균 태그 수는 10.1개로 나

타났다. 1,542개의 태그 에서 출 빈도가 2개 

이상인 428개의 태그들을 이용하여 두 개의 태

그 일들을 구성하 다. 먼 , 카테고리 태그 

일의 428개의 태그들은 김 희 외(2009)에 

의해 개발된 분류법(categorization)에 기 하

여 17개의 하 카테고리별로 분류하 다. 알


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  85

벳순 태그 일의 태그들은 단순히 알 벳순으

로 배열하여 구성하 다. 

(2) 태그 질의 확장: 동등어, 동의어  

련어 일 

① 질의 확장 과정

질의 확장은 크게 두 단계로 구분하 다. 첫 

번째 단계는 자동으로 질의를 확장하는 단계이

다. 즉, 단수/복수, 다양한 형태의 복합어 등 동

등 계에 있는 단어들로 확장하는 단계로 이

때는 동등어 일을 이용한다. 두 번째 단계는 

동의어나 련어 태그 옵션, 는 두 개의 옵션 

모두를 선택할 수 있는 단계로 동의어  련

어 일을 이용한다. 를 들어서, 이용자는 제

안된 시스템으로 질의를 제시한다. 그런 다음 

시스템은 입력된 질의를 동등어 태그 일을 

사용하여 자동 으로 확장한다. 한 이용자는 

질의를 더 확장하기 해서 동의어나 련어 

태그 옵션, 는 두 개의 옵션 모두를 선택할 

수 있다.

② 동등어, 동의어  련어 일

질의 확장을 해서 총 세 종류의 용어 일

을 구성하 다. 먼  키피디아  일반 사

을 이용하여 단수/복수, 다양한 형태의 복합어, 

어 이외의 외국어로 표 되는 것 등의 동등

어들을 클러스터링한 동등어 태그 일을 구성

하 다. 그런 다음, 동의어 태그 일을 만들기 

해 워드넷을 사용했다. 워드넷은 린스턴 

학에 의해 개발된 어를 한 가장 큰 어휘 

데이터베이스이다. 워드넷은 명사, 동사, 형용

사, 부사를 인지(cognitive) 동의어로 분류하고, 

인지(cognitive) 동의어 간에 개념  의미 계

와 어휘  계를 제공한다(Fellbaum 1998). 

마지막으로 련어 태그 일을 만들기 해서, 

리커 련 태그들을 사용하 다. 이는 태그

의 동시 출 (co-occurrence) 빈도에 기 하

여 생성된다(Specia and Motta 2007). 유투  

비디오 자료에 리커의 련 태그들을 사용한 

이유는 리커 태그의 동시 출  패턴이 유투

 태그의 동시 출  패턴과 유사하다고 가정

했기 때문이다. 

<표 2>는 동등어, 동의어  련어 태그 

일의 일부를 보여 다. 각 태그는 최  4개의 

동등어, 3개의 동의어, 그리고 3개의 련어로 

구성된다. 태그수를 3~4개로 제한한 이유는 

다음과 같다. 리커의 핵심 련어는 3개이므

로 이를 기 으로 하여 동의어와 련어의 최

 개수를 3개로 제한하 다. 동등어는 모두 포

함시키는 것이 좋을 듯하여 사 에 태그들을 

분석한 결과 최  4개까지 동등어를 포함하고 

있었기 때문이다. 의미 으로 연결된 워드넷 

동의어 태그와 동시 출  빈도에 기 하여 연

결된 리커 련어 태그간의 복도를 체크해 

보았다. 련어의 약 16.8%는 동의어와 동등하

거나 유사한 것으로 나타났다. 를 들어서, 

“building”은 “architecture”의 동의어이자 

련어로 나타났다. 이외에 “Real”은 축구 으

로 지칭되는 복합어 “Real Madrid”로 인하여 

“Madrid”와 련어로 연결되고, “fashion”은 

복합어 “fashion model” 때문에 “model”의 

련어로 분류된다. 이와 같이, 많은 태그들은 

복합어로 인하여 련되어지고 있다. 이외에, 

garden/flower, water/sea 등과 같은 몇몇 태

그들은 연  계로 련되고 있었다.

반면에, “award”와 “cubism”과 같이  


86  한국문헌정보학회지 제44권 제4호 2010

련이 없어 보이는 단어들도 련어로 간주되어 

좀 더 자세한 정보를 얻기 해서 리커 련

어 태그 데이터베이스를 분석해 보았다. 앞에서 

언 한 것처럼, 리커의 태그들을 분석한 결과, 

많은 이용자들이 리커의 그룹명을 태그로 등

록하는 경우가 많았는데 “cubism award”도 그

룹명  하나로 나타났다. 따라서 이용자들이 

태그를 등록할 때 복합어로 하지 않고 단일어

인 “cubism”, “award”를 각각 따로 등록했기 

때문에 이 두 태그간의 동시 출 빈도가 높게 

나와서 련어로 연결되어 있는 것으로 분석되

었다. 따라서 그러한 그룹명을 갖고 있지 않은 

유투 에 용하기 해서는 리커 그룹명과 

련된 련어 태그들을 삭제하거나 질의 확장

시 이용자가 불필요한 련어는 제거시키는 단

계를 추가한다면 이 문제를 좀 더 완화시킬 것

으로 생각된다. 한 리커에서 그룹명을 태

그로 입력시 그룹명 목록을 보여주고 선택하여 

입력하도록 하면 그룹명과 련된 복합어 문제

도 해결될 수 있을 것으로 보인다(표 2 참조).

(3) 인터페이스 설계

이용자가 시스템으로 질의를 제시할 수 있는 

HTML 인터페이스를 설계하 다. 제안된 시

스템의 인터페이스를 살펴보면, 이용자는 질의

를 구성하기 해서 “알 벳순 태그 목록”이나 

“카테고리 태그 목록”에서 태그를 선택하거나 

직  질의를 입력할 수 있다(그림 1 참조). 그

런 다음, 입력된 질의는 동등어 태그 일을 사

용하여 자동 으로 확장된다. 를 들어, <그림 

1>에서처럼, 이용자가 질의어로 “art”를 입력

하면, 그 후 질의는 자동 으로 “art or arts or 

arte or 아트”로 변환되고, 동의어와 련어 목

록은 참조를 해서 화면에 디스 이 된다. 

다음으로, 이용자는 질의를 더 확장하기 해

서 동의어 태그 옵션, 련어 태그 옵션, 는 

이 두 개의 옵션을 동시에 선택할 수 있다. 만약 

사용자가 동의어 태그 옵션을 선택한다면, 질

의는 “art or arts or arte or 아트 or artwork 

or fine art”로 변환된다. 시스템은 이용자가 블

리언 연산자 “or” 는 “and”를 사용해서 두 검

색 용어를 결합하도록 허용한다. 검색 결과의 

화면은 <그림 2>에서 처럼 비디오 코드 번호, 

어  한국어 제목들, 태그들, 하이퍼링크 이미

지(IMAGE)를 포함하는 5개의 필드를 보여 

다. 하이퍼링크 이미지는 이용자가 메타데이

터뿐만 아니라 비디오를 체크할 수 있는 곳인 

유투  사이트로 연결할 수 있도록 허용한다.

동등어 태그 동의어 태그 련어 태그

Architecture 建筑, 建築 building, edifice building, city, sky

Art arts, arte, 아트 artwork, fine art blue, black, color

Award - prize, symbol Flickr, cubism. soe

Fashion - manner, mode, style girl, portrait, model

Garden - yard, grounds flower, flowers, macro

Real - actual, true Madrid, Spain, palacio

Water - liquid sea, blue, lake

<표 2> 동등어, 동의어  련어 태그


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  87

<그림 1> 구조화된 폭소노미 기반 시스템의 인터페이스

<그림 2> 검색 결과

<그림 3> 태그 기반 시스템 인터페이스

즉, 이용자가 비디오 제목, 기술, 업로드된 태그

와 댓 , 할당된 카테고리 등과 같은 메타데이

터를 라우징하거나 는 비디오클립의 일부

를 들음으로써 그 비디오가 한 것인지 

단할 수 있다. 검색 결과를 디스 이 하기 

해서 특정한 질의 등  알고리즘을 사용하지 

않고 검색 결과를 코드 순서 로 출력하여 

보여 주었다.

4.2.2 태그 기반 시스템

태그 기반 시스템은 키워드의 완 일치 는 

부분일치를 허용한다(그림 3 참조). 태그 기반 

시스템은 질의를 구성하기 해서 이용자로 하

여  키워드를 바로 입력하거나 알 벳순 태그 

일로부터 태그를 선택하도록 하며, 질의 확

장은 허용하지 않는다. 검색 결과의 출력 형식

은 <그림 2>와 같이 5개의 필드를 보여 다.


88  한국문헌정보학회지 제44권 제4호 2010

4.3 피조사자와 설문지

M 학에서 58명의 피조사자들을 모집하

다. 문헌정보학을 공하는 학부 학생으로, 성

별 는 학년 차이를 없애기 해서 피조사자

들을 두 그룹(A와 B)으로 균등하게 나 었다. 

따라서, A와 B 그룹은 29명의 피조사자를 포

함한다. 한 9개의 검색 질의를 구성하여 사용

하 다(표 3 참조).

4.4 실험 차

두 개 시스템을 검색하는 방법을 설명한 후, 

그룹 A의 29명과 그룹 B의 29명에게 각각 9개

의 질의를 주고 구조화된 폭소노미 기반  태

그 기반 시스템을 이용하여 질의에 답하도록 

요청하 다. 실험은 M 학교 컴퓨터실에서 수

행되었다. 58명의 참가자들에게 50분 내에 9개

의 질의에 답하도록 했다. 피조사자들은 각 질

문에 한 합 비디오(들)로 생각되는 비디오 

코드(들)를 어 내도록 하 고, 이 자료에 기

하여 각 질문에 한 재 율과 정확률을 계

산하 다(총 522개 사례, 58명의 피조사자 × 9

개의 질의).

5. 데이터 분석

5.1 질의 확장이 비디오의 검색 효율성에 

미치는 향

가설 검증을 해서, 두 그룹의 재 율과 정

확률의 평균  표  편차 분석, t-검증을 수행

하 다. 테스트에 한 유의확률 수 (p) 는 

sig는 0.05이다. SPSS가 데이터 분석을 해 

사용되었다. <표 4>는 두 그룹에 한 재 율과 

번호 질문( 합 비디오 코드)

1
이슬람(islam)의 건축물(architecture)에 한 모든 비디오들을 찾아서 비디오 번호들을 기술하시오(56, 95, 

147)

2 버마(Burma)에 한 모든 비디오들을 찾아서 비디오 번호들을 기술하시오(876, 922, 930)

3
집 는 집 내부를 리모델링(remodeling) 는 페인  하는 방법에 해서 설명하는 모든 비디오들을 찾아서 

비디오 번호들을 기술하시오(9, 43, 46, 813)

4
뉴욕(NY)과 련된(건축, 여행 등) 비디오들을 찾아서 비디오 번호들을 기술하시오(16, 38, 114, 125, 834, 

836, 864, 869, 925, 931, 942)

5
사람 얼굴을 그리는 방법(draw)에 해서 설명하고 있는 모든 비디오들을 찾아서 비디오 번호들을 기술하시오(49, 

50, 904, 937, 947)

6

 는 과거 고  유럽(Europe) 건축물에 한 모든 비디오들을 찾아서 비디오 번호들을 기술하시오( 국, 

랑스, 로마, 그리스, 러시아 등 유럽 륙에 있는 모두 나라 포함함)(41, 57, 79, 94, 103, 104, 131, 137, 146, 

806, 828, 909)

7 도서  건물(architecture)을 설명하는 부분을 담고 있는 비디오의 번호를 기술하시오(하나)(136).

8 술(art)과 건축(architecture)간의 계에 해서 기술하는 비디오를 찾아서 그 번호를 기술하시오(하나)(811)

9 수채화(watercolour)에 한 모든 비디오들을 찾아서 비디오 번호들을 기술하시오(51, 123)

<표 3> 검색 질의


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  89

시스템 

측정

재 율과 정확률의 평균(표  편차) t-values(p-values) 

폭소노미 시스템(n=29) 태그 시스템(n=29)  폭소노미 vs. 태그

정확률 0.75(0.33) 0.74(0.33) 2.71(0.00)

재 율 0.63(0.39) 0.53(0.36) 0.23(0.60)

<표 4> t-검증 결과

정확률의 평균값과 t-검증 결과에 한 통계값

을 기술한 것이다. 

두 그룹간의 재 율과 정확률이 통계 으로 

차이가 있는지 확인하기 해서 t-검증을 수행

하 다. 분석 결과, <표 4>에서 볼 수 있듯이, 구

조화된 폭소노미 기반 시스템의 재 율(0.63)

이 태그 기반 검색 시스템의 재 율(0.53)과 비

교하여 통계 으로 유의미한 차이를 보 기 때

문에 가설 1은 증명되었다. 그러나, 구조화된 폭

소노미 기반 시스템의 정확률(0.75)이 태그 기

반 검색 시스템의 정확률(0.74)과 비교하여 통

계 으로 유의미한 차이를 보이지 않았기 때문

에 가설 2는 기각되었다. 

 
5.2 논의 

질의 확장을 통해서 태그 통제를 한 시스템은 

태그 통제를  하지 않은 시스템과 비교하여, 

재 율은 증가하 으나(0.53→ 0.63), 정확률

은 통계 으로 차이가 없어서(0.74→0.75), 가

설 1은 검증되었으나 가설 2는 기각되었다. 이

와 같이 동등어, 동의어  련어에 기 한 질

의 확장과 같은 태그 가드닝은 재 율을 높여 

주는 효과가 있음을 확인하 다. 그러나 이미

지 연구 결과(김 희 외 2010)와 달리 정확률

에는 차이가 없는 것으로 나타났다. 이미지의 

경우 검색 결과에서 합 이미지를 선택하는 

과정이 비디오 보다 훨씬 쉬운 것이 정확률을 

높인 이유의 하나로 생각해 볼 수 있다. 다시 

말해서 1차 검색 결과에서 한 장으로 되어 있는 

이미지를 직  확인해 볼 수 있기 때문에 합

하지 않은 이미지를 가려내는 가능성이 훨씬 

높을 수 있다는 의미이다. 그러나 비디오의 경

우는 비디오 체 클립을 모두 보기 어려운 상

황인데다 비디오의 내용을 일부 확인한다 해도 

어로 되어 있기 때문에 비디오의 의미 악

이 더 어려웠을 것으로 단된다. 

따라서, 본 연구에서는 정확률을 높이는 두 

가지 방안을 제안한다. 첫째, 효율 인 멀티미

디어 자료의 검색을 해서 라우징 단계에서 

텍스트 기반 메타데이터 는 서로게이트 뿐만 

아니라 멀티미디어 기반 서로게이트를 제시하

는 방안이다. 다시 말해서, 비디오와 같은 멀티

미디어 자료를 검색하고 라우징하기 해서 

태그를 포함한 텍스트 기반 메타데이터만을 사

용하는 것은 한계가 있다는 이다. 이용자들

이 비디오 속의 객체, 인물을 태그로 기술하는 

경우가 많아서 비디오 속의 구체 인 내용 즉, 

객체, 사람  공간 인식을 폭소노미로 보완할 

수는 있지만 이용자들은 비주얼 서로게이트와 

같은 멀티미디어 서로게이트를 확인하고서 비

디오의 내용을 좀 더 정확하게 악할 수 있을 

것이다. 

둘째, 합성 등  알고리즘을 사용하는 방


90  한국문헌정보학회지 제44권 제4호 2010

안이다. 폭소노미 내에서 자료를 한 등  가

능성은 세 가지, 즉 태그, 동(collaboration) 

 이용자 역으로 집 될 수 있다(Peters & 

Stock 2007). 본 연구의 경우에는 이용자가 지

정하는 유투  카테고리와 태그 유형을 고려하

여, 탐색 결과를 유투 의 카테고리( , 교육, 

과학  기술 등)에 따라서 배열한다. 그런 다

음 각 카테고리에 검색된 비디오들을 태그 유

형 즉, 질의에 있는 태그를 갖는 비디오(들)은 

제일 먼  배열되고 그 다음으로 질의에 있는 

태그의 동의어, 련어 등을 갖는 비디오(들)

을 배열시키는 방안이다. 이때, 비디오 검색 결

과의 등 화를 좀 더 효율 으로 하기 해서 

Mandala, Tokunaga  Tanoka(1999)의 연

구에서처럼 확장된 태그에 기 질의에 있는 

태그들과 비교하여 유사성에 따라서 가 치를 

부여할 수 있는 방안을 생각해 볼 수 있다.

끝으로, 본 연구에서는 태그 확장을 해서 

의미 으로 연 된 동의어와 태그간의 동시 출

 빈도에 기 한 련어를 사용하 다. 본 연구

의 분석 결과를 살펴보면 련어의 약 16.8%는 

동의어와 동등하거나 유사한 것으로 나타났다. 

한 동시 출 빈도에 기 하여 추출한 많은 

련어 태그들이 동일한 복합어의 일부분인 것으

로 나타났고, 일부 태그들은 연  계에 의해서 

련되기도 한다. Peters와 Weller(2008)는 동

시 출  빈도에 의해서 기 하여 클러스터링된 

태그들은 의어, 하 어와 같은 계층  계에 

의해서 서로 련되기도 한다고 제안하고 있다. 

이와 같이 일부 기존 연구들이 동시 출 빈

도에 련된 태그들의 특성을 부분 으로 제시

하고 있지만 체 인 패턴을 제시하지 못하고 

있다. Laniado et al(2007a)은 동시 출  빈도

에 기반을 둔 련된 태그에 한 링크와 태그 

클러스터와 같은 특징은 매우 유용하지만 련 

정보를 항상 발견할 수 없다고 주장하 다. 왜

냐하면 이 태그들을 조직화하기 해서 의미

인 기 을 사용하지 않았기 때문이다. 이용자

가 그들의 검색 목 에 따라서 용어를 히 

사용할 수 있도록 하기 해서 의미 인 련

어와 동시 출  빈도에 기 하여 구성한 용어

간의 계를 기존의 연구 결과에 기 하여 좀 

더 체계 으로 분석할 필요가 있어 보인다.

6. 결 론

본 연구는 비디오 자료에 할당된 태그의 특

성  색인어로서의 가치는 어느 정도인지 살

펴본 후, 텍사노미의 시맨틱 정보에 기 한 비

디오 자료의 태그 구조화 작업이 어느 정도 가

능한지 조사해 보았다. 그 결과는 다음과 같다.

첫째, 유투  비디오의 태그들을 분석한 결

과, 가장 자주 사용되는 하 카테고리는 주제

(21.6%)이고, 그 다음은 객체(17.3%), 메타데

이터요소(16.4%), 사람/지 (15.4%) 순으로 

나타나 주제는 물론 비디오 속의 객체, 사람  

공간 인식을 폭소노미로 보완할 수 있음을 확

인할 수 있어서 폭소노미 태그가 색인어로서 

가치가 있는 것으로 나타났다. 

둘째, 워드넷의 단어와 유투  태그와의 복

도를 분석한 결과, 유투  태그들의 약 59.6%가 

워드넷의 단어와 일치하 다. 이때 문제는 워

드넷을 통한 질의 확장이 좋은 검색 결과를 산

출할지라도, 모든 질의(태그)가 확장될 수 없

는 문제가 생겨날 수 있는 이다. 따라서, 태그


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  91

와 텍사노미 용어간의 일치율을 높이기 한 

방안들에 한 연구가 필요해 보인다. 

한, 실험을 통해서 동의어, 련어 등에 의

한 질의 확장이 비디오의 검색 효율성(재 율

과 정확률)에 어떤 향을 미치는지 조사해 보

았다. 실험 결과는 다음과 같다.

첫째, 질의 확장을 통해서 태그 통제를 한 시

스템은 태그 통제를  하지 않은 시스템과 

비교하여, 재 율은 증가하 으나(0.53→0.63), 

정확률은 통계 으로 차이가 없어서(0.74 →

0.75), 가설 1은 검증되었으나 가설 2는 기각되

었다. 따라서 본 연구에서는 정확률을 증진시

키는 두 가지 방안, 즉 라우징 단계에서 멀티

미디어 기반 서로게이트를 사용하는 방안과 검

색 결과를 디스 이할 때 합성 등  알고

리즘의 사용을 제안하 다.

끝으로 본 연구 결과는 시스템 설계자 는 

사서가 폭소노미 태깅 시스템을 구 하는 것 

뿐만 아니라 태그들을 디지털 비디오 도서 의 

소셜 메타데이터로 효율 으로 활용하는데 하

나의 지침이 될 것으로 생각된다. 

참   고   문   헌

[1] 김민경. 2009. 폭소노미를 활용한 이미지 검색의 효율성 개선 방안에 한 연구 . 석사학  논문. 

명지 학교 학원, 문헌정보학과.

[2] 김 희, 김용호. 2010. 구조화된 소셜 메타데이터를 활용한 이미지 자료의 시맨틱 검색에 한 실험

 연구. 한국문헌정보학회지 , 44(1): 117-135. 

[3] 김 희, 김민경. 2009. 리커 이미지 자료에 한 이용자 태깅 행태 분석과 활용 방안. 정보 리연

구 , 40(2): 71-94.

[4] 한승희. 2009. 집단지성을 활용한 시소러스 갱신에 한 연구. 정보 리학회지 , 26(3): 25-43. 

[5] Cattuto, C. et al. 2008. “Semantic analysis of tag similarity measures in collaborative tagging 

systems." In Proceedings of the 3rd Workshop on Ontology Learning and Population (OLP3), 

Stroudsburg, PA.

[6] Fellbaum, C. 1998. WordNet: An Electronical Lexical Database. Cambridge, MA: The MIT 

Press. 

[7] Furnas, G. W., et al. 1987. “The vocabulary problem in human-system communication." 

Communications of the ACM, 30(11): 964-971.

[8] Hayman, S. 2007. “Folksonomies and tagging: New developments in social bookmarking." 

Proceedings of the Ark Group Conference: Developing and Improving Classification Schemes. 

[online]. [cited]. 


92  한국문헌정보학회지 제44권 제4호 2010

<http://www.educationau.edu.au//jahia/webdav/site/myjahiasite/shared/papers/arkhayma

n.pdf>.

[9] Heckner, M., et al. 2008. “Tree, funny, to_read, google: are tags supposed to achieve? a 

comparative analysis of user keywords for different digital resource types." In Proceeding 

of the 2008 ACM workshop on Search in social media, 26-30 October 2008. Napa Valley, 

California, USA.

[10] Heymann, P., Koutrika, G., & Garcia-Molina, H. 2008. “Can social bookmarking improve 

web search?" In Proceedings of the International Conference on Web Search and Web Data 

Mining. NewYork: ACM Press. 195-206. 

<http://ilpubs.stanford.edu:8090/858/1/2008-2.pdf>. 

[11] Iyer, H. and Lewis, C. D. 2007. Prioritization strategies for video storyboard keyframes. 

Journal of American Society for Information Science and Technology, 58(5): 629-644.

[12] Governor, J. 2006. “On the emergence of professional tag gardeners." In Blog Posted 1 

October 2006. [online]. [cited 2008. 8. 5]. 

<http://www.redmonk.com/jgovernor/2006/01/10/on-the-emergence-of-professional-tag-

gardeners/>.

[13] Geisler, G., & Burns, S. 2007. “Tagging video: Conventions and strategies of the YouTube 

community." In Proceedings of the Joint Conference on Digital Libraries (JCDL 2007), 480. 

[14] Greenberg, J. 2001. “Automatic query expansion via lexical-semantic relationships." Journal 

of the American Society for Information Science and Technology, 52(5): 402-415. 

[15] Kolbitsch, J. 2007. “WordFlickr: A solution to the vocabulary problem in social tagging 

systems." In Proceedings of I-MEDIA '07 and I-SEMANTICS '07, Sept 2007. Graz, Austria.

[16] Krovetz R., & Croft W. 1992. “Lexical ambiguity and information retrieval." ACM transactions 

on Information Systems, 10(2): 115-141.

[17] Laniado, D., et al. 2007a. “A semantic tool to support navigation in a folksonomy." In 

Proceedings of the eighteenth conference on Hypertext and hypermedia, Manchester, UK. 

[18] Laniado, D., et al. 2007b. “Using WordNet to turn a folksonomy into a hierarchy of concepts." 

In Semantic Web Application and Perspectives - Fourth Italian Semantic Web Workshop, 

Dec 2007. 192-201. 

[19] Marchionini, G., et al. 2009. “Multimedia surrogates for video gisting: Toward combining 

spoken words and imagery." Information Processing and Management, 45(2009): 615-630. 

[20] Manning, C., et al. 2008. Introduction to information retrieval. Cambridge, England: Cambridge 

University Press.


태그 질의 확장 기능에 기반한 비디오 검색 시스템의 효율성에 한 실험  연구  93

[21] Mandala, R., Tokunaga, T., & Tanoka, H. 1999. “Combining multiple evidence from different 

types of thesaurus for query expansion." In Proceedings of the 22nd Annual International 

ACMISIGIR Conference on Research and Development in Information Retrieval, 191-197.

[22] Mathes, A. 2004. “Folksonomies - cooperative classification and communication through 

shared metadata." [online]. [cited 2010. 3. 7]. 

<http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.35.1000&rep=rep1&type=pdf>.

[23] Matusiak, Krystyna K. 2006. “Towards user-centered indexing in digital image collections.” 

OCLC Systems & Services: International digital library, 22(4): 283-298.

[24] Melenhorst, M. et al. 2008. “Tag-based information retrieval for educational videos." EBU 

TECHNICAL REVIEW, 2008Q2.

[25] Ménard, E. 2007. “Image Indexing: How Can I Find a Nice Pair of Italian Shoes?" Bulletin 

of the American Society for Information Science and Technology, 34(1): 21-25.

[26] Morrison, J. 2008. “Tagging and searching: Search retrieval effectiveness of folksonomies 

on the World Wide Web.” Information Processing and Management, 44: 1562-1579.

[27] Panofsky, E. 1955. Meaning in the visual arts: Meaning in and on art history. Chicago: 

University Of Chicago Press.

[28] Peters, I. 2009. Folksonomies: Indexing and Retrieval in Web 2.0. Berlin: De Gruyter.

[29] Peters, I. & Weller, K. 2009. “Tag gardening for folksonomy enrichment and maintenance." 

Webology, 5(3). [online]. [cited 2010. 3. 3]. 

<http://www.alt.phil-fak.uni-duesseldorf.de/infowiss/admin/public_dateien/files/35/122787

6254tag_garden.pdf>.

[30] Sharma, A. S., & Elidrisi, M. 2008. “Classification of multi-media content (videos on 

YouTube) using tags and focal points." [online]. [cited 2010. 3. 3]. 

<http://www-users.cs.umn.edu/~ankur/FinalReport_PR-1.pdf>.

[31] Siersdorfer, S., Pedro, J. S., & Sanderson, M. 2009. “Automatic video tagging using content 

redundancy." In Proceeding of 32nd ACM SIGIR Conference, Boston, USA.

[32] Smith, G. 2008. Tagging: People-powered metadata for the social Web. Berkeley: New 

Riders.

[33] Song, Y. and Marchionini, G. 2007. “Effects of audio and visual surrogates for making sense 

of digital video." In Proceedings of CHI 2007, San Jose, CA, USA. 867-876.

[34] Specia, L., & Motta, E. 2007. “Integrating folksonomies with the semantic web." Edited 

by Franconi, E., Kifer, M, & May, W. ESWC2007, LNCS, 4519: 624-639.

[35] Steele, T. 2009. “The new cooperative cataloging.” Library Hi Tech, 27(1): 68-77.


94  한국문헌정보학회지 제44권 제4호 2010

[36] Weller, K. 2007. “Folksonomies and ontologies: Two new players in indexing and knowledge 

representation." H. Jezzard (Hrsg.): Applying Web 2.0. In Proceeding of Innovation, Impact 

and Implementation. Online Information 2007 Conference, London. 

[37] Yang, M. & Marchionini, G. 2004. “Exploring Users' Video Relevance Criteria - A Pilot Study." 

In Proceedings of the Annual Meeting of the American Society of Information Science and 

Technology, 12-17 Nov 2004. Providence, RI. 229-238.

[38] Yi, K. 2009. “A study of evaluating the value of social tags as indexing terms." In 

Proceedings of the Sixth International Conference on Knowledge Management, [CD-ROM]. 

Singapore: World Scientific Publishing.

[39] Yi, K., & Chan, L. M. 2009. “Linking folksonomy to Library of Congress subject headings: 

an exploratory study." Journal of Documentation, 65(6): 872-900. 

•국문 참고자료의 영어 표기
(English translation / romanization of references originally written in Korean)

[1] Min-Kyung Kim. 2009. A study on Improving the Search Efficiency of Image Data Using 

Folksonomies. Graduate Thesis, Myongji University.

[2] Hyun-Hee Kim, & Yong-Ho Kim. 2010. “An experimental study on semantic searches for 

image data using structured social metadata." Journal of Korean Library and Information 

Science Society, 44(1): 117-135. 

[3] Hyun-Hee Kim, & Min-Kyung Kim. 2009. “Investigating the End-User Tagging Behavior 

and its Implications in Flickr." Journal of Information Management, 40(2): 71-94.

[4] Seung-Hee Han. 2009. “Thesaurus Updating Using Collective Intelligence: Based on Wikipedia 

Encyclopedia." Journal of the Korea Society for Information Management, 26(3): 25-43.