061-080______¿Ï-Á¶ÀçÀÎ.hwp 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 A Study on Book Metadata Creation and Distribution on Supply Chain 조 재 인(Jane Cho)* 목 차 1. 서 론 2. 공 사슬상의 계자들과 도서메타데이터 3. 출 계와 도서 계 메타데이터 유사 표 과 상호 운용성 분석 4. 도서메타데이터의 효율 인 생성․유통 방안 고찰 4.1 공 사슬상의 도서메타데이터 흐름 분석 4.2 효율 생성․유통 방안 제시 5. 결 론 5.1 요약 5.2 제언 록 최근 출 계는 이용자의 구매 의사 결정에 있어 메타데이터 활용이 매우 요한 요소임을 인식하게 됨에 따라, 효율 인 데이터의 작성과 품질 유지, 그리고 공 사슬상의 표 과 교환 시스템에 해 심을 갖게 되었다. 도서 계 한 목록 작성의 경제 효용성을 추구하면서 좀 더 최 정보원에 근 한 데이터 소스를 통해 작업을 간소화할 수 있는 모델을 추구하게 되었다. 본 연구는 발생 기원은 동일하지만 각각 출 계와 도서 계에서 각기 다른 형식과 표 으로 활용되고 있는 도서메타데이터의 흐름을 살펴보고 공통의 쟁 과 상호 운용의 가능성을 조망하 다. 최근 출 계와 도서 계를 심으로 논의되고 있는 각종 이슈들을 검해 보고 도서메타데이터의 효율 인 생성․유통 방안에 해 고찰하 다. ABSTRACT Recently, the publishing community now recognizes the importance of metadata in customers’ buying decisions. As a result, they are more interested in effective metadata creation and quality maintenance, as well as standardization of exchanging system in the supply chain. As the library community also investigates the economic effectiveness of creating metadata, they try to find the best model for simplifying metadata creation by using sources close to the original. This study analyzes metadata work flow which had same source but be used in different fields by their own type and standard. It also discusses the same issues about each section and possibility about interoperation. Finally this paper tries to find an effective creation and distribution model of book metadata which can be used in domestic publishing and the library community. 키워드: 출 공 사슬, 도서메타데이터 ONIX, MARC, CIP * 인천 학교 문헌정보학과 조교수(chojane123@naver.com) 논문 수일자: 2010년 7월 19일 최 심사일자: 2010년 7월 26일 게재확정일자: 2010년 8월 17일 한국문헌정보학회지, 44(3): 61-80, 2010. [DOI:10.4275/KSLIS.2010.44.3.061] 62 한국문헌정보학회지 제44권 제3호 2010 1. 서 론 출 계는 유통과 매를 해 메타데이터를 생산하고 도매상, 서 으로 이어지는 비즈니스 로세스에 의해 공 사슬상(Supply Chain)1) 의 트 들과 공유하게 된다. 한편, 도서 계는 발견과 식별, 소장을 해 메타데이터를 생성하 고 국가 표도서 , 서지유틸리티기 , 개별도 서 으로 이어지는 일련의 흐름 속에서 상호 공 유하거나 교환하게 된다. 도서메타데이터는 그 발생 기원은 동일하지만, 출 계와 도서 계의 공 사슬상에서 고유의 목 에 의해 각기 다른 표 과 형식으로 생산되어 진화되어 간다. 온라인 환경에서 출 계는 그동안 비즈니스 목 으로 내부 으로만 활용하 던 메타데이 터를 이용자들에게 쉽게 공개할 수 있게 되었 다. 더구나 이용자의 구매 의사 결정에 있어 메 타데이터 활용이 매우 요한 요소임을 인식하 게 됨에 따라, 효율 인 데이터 작성과 품질 유 지, 그리고 공 사슬상의 표 과 교환 시스템에 해 심을 갖게 되었다. 한편 도서 계에서도 검색 엔진의 등장으로 도서 목록의 요성이 감소되기 시작하면서, 카피목록, 자동처리를 통 해 신속성을 제고하고 비용을 삭감하기 한 총체 로세스 정비가 요구되게 되었다. 그 에 따라 공동목록이나 아웃소싱을 통해 비용을 감할 뿐 아니라, 출 계의 정보원(Upstream Metadata)을 통하여 작업을 간소화할 수 있는 모델도 고민하게 되었다. 그러한 맥락에서 LC (Library of Congress)는 출 계 메타데이터 반입을 통한 기술목록 작성 계획을 발표하 으 며, OCLC(Online Computer Library Center) 도 ‘A Symposium for Publishers and Librari- ans’2)를 계기로 도서메타데이터 생성과 유통 의 새로운 패러다임을 모색하게 되었다. 본 연구에서는 최근 논의되고 있는 도서메 타데이터에 한 이슈들을 종합하여, 출 계와 도서 계의 공통 요구와 복 노력, 그리고 상 호 운용의 가능성 등을 검토해 보고자 한다. 더 불어 이를 기반으로 도서메타데이터 생명 주기 에 있어 보다 진화된 메카니즘의 도입 가능성 을 모색해 본다. 본 연구는 첫째, 공 사슬상의 계자들 입장에서 메타데이터의 유통 경향과 련 쟁 을 분석하 다. 둘째, 출 계와 도서 계 양측에 용되고 있는 유사 데이터 표 과 상호 운용성을 살펴보았다. 셋째, 행 도서 메타데이터 흐름상의 특징을 악해 보며, 양 측이 복 노력을 최소화하고 상호 정 으로 메타데이터를 운용할 수 있는 방안을 고찰해 보았다. 2. 공 사슬상의 계자들과 도서메타데이터 NISO(National Information Standards Orga- nization)와 OCLC는 도서메타데이터 계자들 을 출 사, 도서유통업체, 서 , 메타데이터벤 더, 포털, 국가 표도서 로컬도서 으로 구 분하고 있다. 본 장에서는 NISO와 OCLC의 조 사(NISO and OCLC 2009), ‘A Symposium for Publishers and Librarians' 련 자료, 한국출 1) 공 업체에서 고객에 이르는 모든 거래 트 와의 정보, 자 , 지식의 흐름을 지칭하는 용어. 2) A Symposium for Publishers and Librarians. . 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 63 유통진흥원(http://www.booktrade.or.kr/) 등 을 참조하여 개별 계자들 입장에서 도서메타 데이터의 유통 경향과 련 쟁 들을 종합해 보 도록 한다. 2.1 출 사 미국의 형 출 사는 출 물의 제작과정에 서 발생되는 메타데이터를 ONIX(ONline Infor- mation eXchange) 형식으로 리하고 있다. 그러나 아직까지 많은 소규모 출 사들은 엑 셀을 비롯해 독자 인 포맷을 채택하고 있다. 더구나 도서 홍보나 신간 안내를 해 제작하는 린트 카탈로그가 메타데이터의 역할을 신 하기도 한다. 이러한 상황은 혼자서 기획, 편집, 업까지 도맡아 하고 있는 개미출 사가 체 의 1/4 가량을 차지하고 있는 우리나라의 경우 에 더 일반 이라고 할 수 있겠다. 기존에는 출 사들이 고유의 리 시스템을 통하여 데이터 를 내부 으로만 리하 기 때문에 비즈니스 트 간의 공유와 교환에 한 요구가 발생하 지 않았다. 그러나 공 사슬의 유통 산화와 데이터 리의 효율화에 한 수요가 발생하면 서, 표 데이터 형식이 필요하게 되었다. 한 온라인 환경에서 출 사들이 간 유통 과정을 생략하고 이용자들과 직 하게 되면서, 메 타데이터의 생성과 공 사슬망내에서의 품질 유지에도 심을 갖게 되었다. 이러한 배경으로 최근 BISG(The Book Industry Study Group) 은 ONIX 일을 평가하고 데이터의 품질과 시성의 기 을 수하는 출 사들을 식별하는 로세스도 운 하게 되었다. 2.2 도서 유통 업체 도서 유통 업체인 Baker & Taylor, Ingram 은 매해 다루게 되는 도서의 숫자가 10%씩의 증가율을 보이고 있다고 하 다. 실제 20만권 정 도가 증가하지만 디지털 포맷을 비롯한 다양한 구 형의 등장으로, 한 개의 컨텐츠가 보통 2-3개 의 매체로 간행되고 있기 때문이라고 한다. 보통 유통 업체들은 CIP(Cataloging in Publication) 보다 출 사의 메타데이터를 우선 으로 채택 하게 되지만, 수서와 동시에 MARC 데이터 제 공을 원하는 도서 들을 해 미의회도서 의 PCC(Program for Cooperative Cataloging)에 도 참여하고 있다. 한편, 북센, 송인서 , 한국출 동조합과 같은 한국의 표 인 유통 업체 들은 한국출 유통진흥원과 공동으로 자체 입 고 도서에 한 ONIX를 작성하고 있다. 출 과정의 부산물로 생성되는 해외 사례와 달리 유통 단계에서 최 의 ONIX가 작성되고 있는 셈이다. 2.3 서 한편 표 인 오 라인 서 인 반스앤노블 은 양질의 기술 메타데이터가 매출과 직결된다 는 생각을 가지고 있다. 우리나라의 최 서 인 교보 문고 역시 질 좋은 메타데이터가 마 의 경쟁력이라고 단하여 데이터의 무상 공 유에는 다소 제한 인 입장을 보이고 있다. 기 술 데이터의 품질 제고와 정확성, 신속성 제고 를 하여 반스엔노블은 출 사와 유통업체에 게 44개의 필수 데이터 요소를 요구하고 있다. BISG가 정의하고 있는 요소들이 부분 포함 64 한국문헌정보학회지 제44권 제3호 2010 되지만, 기술 요소 이외에도 재고 여부, 배포처 리스트, 가격과 같이 물류 변화에 따른 가변 요소도 매우 요하게 간주되고 있으며, 그런 측 면에서 간혹 ONIX보다 EDI(Electronic Data Interchange)가 더욱 탁월한 구조로 평가되기 도 한다. 각기 다른 소스들로부터 데이터를 수집 하게 되는 형 온라인 서 에서는 범용 으로 수용되는 표 이나 최우량사례(Best Practice) 가 데이터 유지 기 을 결정하는 요한 요소 가 된다. 2.4 메타데이터 벤더 NISO의 보고서에서는 데이터를 수집하여 보 강하고 재배포하는 Bowker, Nielsen Book, 서 지 유틸리티 기 인 BDS(Bibliographic Data Services), 그리고 OCLC를 메타데이터 벤더로 정의하고 있다(NISO and OCLC 2009). 우리 나라의 경우에는 ONIX를 생성하고 각계에 필 요한 형식으로 배포하는 한국출 유통진훙원, 서지유틸리티서비스를 제공하는 한국교육학술 정보원 등이 여기에 해당된다고 볼 수 있겠다. 벤더들은 다양한 형식의 데이터를 수집한 후, 특정 표 에 따라 보강하여 MARC 는 ONIX in XML 형식으로 유통업체, 매상, 도서 등 에 재배포한다. 데이터를 수집하여 가공하고 다 시 배포하는 역할을 하는 이들에게 있어 상호 운용성은 매우 요한 요소인데, ONIX가 50%, 엑셀을 비롯한 기타 디지털 형식이 45%, 나머지 는 5%는 인쇄물 형태로 수집되고 있다. Bowker 와 Nielsen Book은 서명과 자명의 거 통제 를 통하여 데이터를 보강시킬 뿐 아니라, 표지 이미지, 목차, 자 양력, 북 수상, 독자 수 , 이 용자 리뷰와 평가, 추천 정보 등을 여기에 추가 시키고 있다. 한 ISBN을 등록하고 출 사 리픽스를 부여하며, CISAC(International Con- federation of Societies of Authors and Com- posers), IFFRO(The International Federation of Reproduction Rights Organizations)와 함 께 ISTC(International Standard Text Code) 를 창설하여, 작권 리 업무 효율화를 한 기반을 마련하기도 하 다. 한편, UK의 CIP 아 웃소싱 업무를 맡고 있는 BDS는 75,000건의 출 코드를 만들어낼 뿐 아니라, ONIX를 MARC21로 변환시켜 보 하고 있다고 하며, 매해 6-12만 개의 서지 코드를 수집하고 있는 OCLC는 NextGen Pilot3)을 통해 보강된 ONIX 를 생성시켜, 역으로 출 계에 재보 할 계획을 가지고 있다고 한다. 그 만큼 메타데이터 벤더 들은 공 사슬내에서 데이터의 품질 제고와 배 포에 있어 요한 간자 역할을 수행하고 있다. 한편, 우리나라에서는 한국출 유통진흥원이 ONIX를 생성하고 각계에 필요한 형식으로 배 포하는 역할을 수행한다. 한국출 유통진흥원 은 앞서 언 한 바와 같이 유통 업체인 북센의 창고에 입고된 신간도서에 한 ONIX를 작성 하여 서 , 유통 업체 등에 보 하며, 데이터를 MARC으로도 변환하여 국립 앙도서 , 한국 교육학술정보원 일선 도서 에 다양한 방식 으로 보 하고 있다. 3) Next Generation Cataloging. . 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 65 2.5 포털 한편, 작권 침해 문제로 출 계와 작가 조합 등에 의해 제소된 바 있는 구 은 최근 긴 상 끝에 작권 비용에 련된 Book Rights Registry 의 운 을 맡게 되었다. 이 등록소를 통해 권리 보유자들의 데이터베이스를 리하고, 그들을 확인하여 소재를 악하며, 지 을 조율하게 된 다. 따라서 자와 작을 식별하고 작 간의 계를 악하는 문제, 한 시리즈와 멀티 볼룸 작을 식별하고 리하는 문제 등이 이슈가 되 고 있다. 구 은 이 문제의 해결을 해 최근 메 타데이터의 리를 강조하게 되었으며, 더불어 유 작 식별 알고리즘을 개발하는 등 도서와 작의 식별에도 많은 심을 기울이고 있다. 한 편, 우리나라의 네이버는 책서비스를 통하여 출 사들의 신간을 홍보하고, 구매자들과 연결될 수 있는 직 인 경로를 제공하고 있다. 한 국내 주요 온라인 서 과 종별 도서 종합목 록을 통합한 명실공히 도서 통합 포털을 지향하 고 있어, 유 작의 식별과 품질 유지의 문제 가 주목된다. 2.6 국가 표도서 데이터 교환을 한 표 과 서지 제어에 한 각종 정책을 개발하는 미의회도서 은 R2 컨설 을 통해 북미 지역의 MARC 시장을 분석하고 업계의 불필요한 복에 하여 지 한 바 있다 (R2 Consulting LLC 2009). 목록의 경제성에 한 부분은 최근 도서 계에 화두가 되고 있는 데, 이러한 맥락에서 LC는 PCC 로젝트를 통 해 동 목록과 거의 요성을 유도하고 있으 며, 도서 산업과 작권, 도서 과 정보 분야에서 사용되는 다양한 표 들이 상호 운용되어야 한 다는 을 매우 강조하고 있다. 국가 표도서 은 출 계와의 데이터 공유를 해서도 많은 연 구를 수행하고 있는데, 자 의 XML 포맷 에서 핵심 요소를 추출하여 ONIX 코드로 만 드는 로젝트, 그리고 XML이나 텍스트 베이스 PDF에서 메타데이터를 추출하여 METS(Meta- data Encoding and Transmission Standard) 와 함께 MODS(Metadata Object Description Schema) 포맷으로 활용하는 연구가 주목되고 있다. 한편, 국가 표도서 은 출 사로부터 받 은 정보를 기반으로 CIP를 작성하여 도서 매 업자에게 신간에 한 출 도서 목록을 제공 하고 있다. 출 도서 목록은 출 이 완료된 이후에 제목, 크기, 페이지 등의 수정 작업을 거 쳐 완벽한 목록으로 보강되고, 여기에 주제 분석, 거 통제 등의 지 인 작업이 더해져 도서 계 에 여러 가지 창구로 재 보 된다. 2.7 로컬 도서 NISO와 OCLC의 보고서에 의하면(2009), 일선 도서 에서는 30% 미만에 해서만 원목 작업을 수행하고 있다고 한다. 그러나 아직까지 다운로드 받은 많은 코드들이 로컬 도서 의 목록 작성 행에 의해 수정되고 있다고 보고되 고 있다. LC가 보 한 코드 350,000건 80% 가 로컬 도서 에 의해 업그 이드되었고, BL 이 만든 26만건 에서도 55%가 업그 이드되 었다고 하니, 국가 표도서 이 완벽한 수 의 서지데이터를 작성하여 배포하여도 로컬 도서 벨에서는 많은 부분의 수정과 갱신이 이루 66 한국문헌정보학회지 제44권 제3호 2010 어지고 있는 셈이다. 한편, 최근에는 자 과 자책의 향으로 많은 이용자들이 목록이 아 니라, 구 과 같이 원문의 내용 검색을 통하여 원하는 페이지로 직 근하게 되었다. 따라서 목록 작성에 투입되는 인력과 산 운 의 효율 성 문제가 제기되고 있다. 계자 메타데이터 황 시 데이터 형식 출 사 - 미국의 형 출 사는 ONIX를 활용하고 있지만 부분은 엑셀 일을 비롯해 독자 인 포맷을 선택. 국내 출 사는 거의 부분 ONIX를 작성하지 않음 - 직 이미지, 목자, 서평 등의 부가 정보를 구축하여 홈페이지를 통해 홍보하는 경우가 많아지면서 메타데이터의 생성과 유지 에 한 필요성을 인식하게 됨 - 출 사 ONIX (미국 50%), 엑셀 인쇄목록 자체포멧 유통업체 - CIP 데이터보다는 출 사의 데이터가 우선 으로 채택 - 도서 이 수서와 동시에 MARC을 원하고 있어, 많은 벤더들이 미의회도서 의 PCC에 참여 - 국내에서는 유통단계에서 최 ONIX가 작성 - Baker & Taylor, Ingram - 북센,한국출 동조합 ONIX, 자체포멧, MARC 서 - 기술메타데이터가 매출과 직결된다고 인식 - 반스앤노블은 BISG가 정의하고 있는 기술 요소 이외에도 재고 여부, 배포처 리스트, 가격과 같은 가변 인 데이터 시. 매를 한 시 갱신 강조 - 아마존 반스앤노블 - 교보문고 YES24 ONIX, EDI 자체포멧 MARC 메타데이터 벤더 - 거 통제를 수행하여 데이터를 보강하며 챕터, 커버 이미지, 목차, 베스트셀러 사이테이션, 자 양력, 북 수상, 독자 수 , 이용자 리뷰와 평가, 추천 정보 등을 추가 - 공 사슬내에서 도서메타데이터의 품질 제고와 배포에 있어 요한 간자 역할을 수행 - Bowker Nielsen Book, BDS, OCLC - 출 유통진흥원, KERIS ONIX MARC 자체포멧 포털 - 구 은 수 백만권의 책을 디지털화하여 공개하고 있으며 작 권 비용에 련된 Book Rights Registry 운 . 자와 작을 식별하고 작간의 계 악에 주력. ONIX와 MARC을 모두 수용 - 네이버는 책서비스를 통해 출 사가 신간을 홍보하고 직 매할 수 있는 기회 지원. 국내 최 도서 포털을 해 각종 서 과 도서 의 데이터를 수집․통합 - 구 북, 네이버책 ONIX MARC 국가 표 도서 - 출 사로부터 받은 정보를 기반으로 CIP를 작성하고 도서 에 제공 - 북 벤더에게도 출 3-6개월 에 신간에 한 출 도서 목록을 제공. 출 이 완료된 이후에 제목, 크기, 페이지 등의 수정 작업을 거쳐 완벽한 목록으로 보강되고, 주제 분석, 거 통제 등의 지 인 작업이 더해져 도서 계에 여러 가지 창구로 재 보 - LC - 국립 앙도서 MARC(CIP) 로컬 도서 - 30% 미만에 해서만 원목 작업 수행 - 다운로드 받은 서지에 해서도 로컬 행에 의한 추가 작업 다수 수행 - 도서 목록의 유효성과 경제성에 한 논의 가속 - 개별 도서 MARC <표 1> 공 사슬상 계자들과 도서메타데이터 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 67 2.8 도서메타데이터 유통 경향과 련 쟁 술한 도서메타데이터 유통 경향은 아래와 같이 요약해 볼 수 있겠다. 첫째, 공 사슬의 유통 산화와 데이터 리의 효율화에 한 수 요가 증하면서, 출 사들은 표 데이터 생성 과 품질 유지에 많은 심을 갖게 되었다. 둘째, 온라인 시장 유율 증가는 서 을 포함한 출 계 내부에 있어, 기술 메타데이터에 한 요 성을 더욱 강조하게 되었다. 셋째, 최근 하나의 작이 다양한 매체로 간행되면서 도서유통업 계 역시 더 많은 양의 메타데이터를 처리하게 되었으며, 유 작의 효과 식별과 작권 리 효율화의 문제에도 직면하게 되었다. 네 번째, 한편, 도서 계는 아직도 기술 목록에 많 은 시간과 노력을 투입하고 있어, 경제 효용 성을 제고하기 한 안의 모색이 실히 요구 되고 있다. 도서메타데이터는 출 사, 도서유통업체, 서 , 도서 등 공 사슬상에서 각기 필요한 형 식과 내용으로 활용되고 있어, 생성과 품질 유 지에 복 투입되는 시간과 비용에 한 문제 가 쟁 이 되고 있다. 이와 련하여 Hachette Book Group의 계자는 출 사가 도서에 한 가장 정확한 정보를 가지고 있다고 강조하 고 도서유통업체, 서 , 도서 등은 최 정보 원(Upstream Metadata)인 출 사의 데이터 를 효율 으로 활용하는 방안을 모색할 필요가 있다고 논평하 다. 같은 맥락에서 NetLibrary 의 Suzanne Kemperman(OCLC 2009a)은 아 마존이든 도서 이든 상 없이 이용자들은 동 일한 검색 경험을 원하므로, 발견이라는 이슈 는 양 커뮤니티에 있어 요한 공통 컨셉이라 고 말하 다. 따라서 출 계와 도서 계는 서지 데이터를 연계하여 공동 활용해야 할 것이라고 지 하 다. 도서 계도 이제 원목 작업은 도서 계 체에서 그만두어야 할 시기가 되었다고 논평하고, 최 정보원(Upstream Metadata) 데이터를 활용하여 목록의 경제성을 추구해야 한다고 논의하 다(OCLC 2009a). 한편, 최근 하나의 콘텐츠가 자책, 화 등 다양한 방식으로 사용되면서, 콘텐츠에 한 작권 리 문제가 두되었다. 따라서 동일 작의 다양한 구 형을 식별하고, 자를 정 확하게 식별하는 문제에 한 요성도 부각되 었다. 그 밖에 시리즈와 그 구성물을 식별하는 문제, ISBN 부여 단 를 결정하는 문제 등이 도서 산업과 도서 분야에서 쟁 이 되고 있 다. 출 계와 도서 계는 각각 메타데이터 형 식으로 MARC과 ONIX를 채택할 뿐 아니라, 자와 작의 식별을 해서도 각기 다른 표 을 채택하고 있어, 최근 양측의 문성을 바 탕으로 한 공동 응 노력이 필요하다고 논의 되어진다. 3. 출 계와 도서 계 메타데이터 유사 표 과 상호 운용성 분석 출 계와 도서 계는 비즈니스 트 와 유 기 간에 데이터가 원활히 흘러갈 수 있도 록 각기 표 을 정의하고 있는데, 언 했다시 피, 양측은 유사하면서도 상이한 형식을 채택 하고 있다. 본 장에서는 몇 가지의 체계에 해 그 유사성과 차이 , 그리고 상호 운용성을 살 펴보도록 한다. 68 한국문헌정보학회지 제44권 제3호 2010 3.1 ONIX / MARC ONIX는 XML 메시지 구조를 사용하는 코 드 값으로 구성되어 있는 스키마로 도서산업계 에서 데이터를 교환하기 한 표 으로 사용된 다. 2001년 1월에 도서 산업의 상품정보를 자 형태로 표 하고 자상거래를 지원하기 하여 버 1이 발표되었다. 온라인 거래가 가능 한 모든 콘텐츠에 용 가능한 ONIX에는 목록 정보, 자정보, 도서정보, 출 사정보, 유통정 보 등을 포함하고 있다. ONIX는 출 사로부터 도매상과 메타데이터 벤더에게 다양한 경로로 달되며, 출 후 갱신된 리뷰, 가격, 상태 정 보는 ONIX 피드로 트 들에게 재배포 된다. 한편, 최근 발표된 ONIX 3.0은 디지털 콘텐츠 를 더욱 효과 으로 다루고 동일 작의 다양 한 구 형이 구조 으로 연계되도록 지원하며, 연속간행물을 좀 더 효율 으로 다룰 수 있도 록 개선되었다고 한다.4) 한편, 출 계에 응되는 메타데이터 형식상 의 표 인 MARC은 출 정보를 기반으로 CIP 데이터로 먼 탄생된다. 출 사가 교정쇄 는 자 버 으로 표제지, 권기, 색인 등을 국가 표도서 에 보내면, 국가 표도서 은 CIP를 제 작하여 출 될 작에 포함시켜 되돌려 보낸다. 미국에서는 10개 정도의 큰 출 사가 55,000건 정도를 ONIX 형태로 보내고 있지만, CIP 생성 에 ONIX가 직 사용되지 않으며, 국가 표도 서 이 작성한 통제 해딩과 분류 번호도 출 사 의 ONIX 스트림에 의해 다시 환류되지 않는다. 여하튼 두 표 은 기본 으로 구조상 그리고 어의상의 큰 차이를 가지고 있다. MARC은 유 통과 매에 련된 상세 사항을 취 하지 않으 며, ONIX는 수용자에 의해 데이터가 어떻게 사 용되고 갱신되며 리되는지에 한 정보를 다 루지 않는다. 더구나 MARC에서와 같은 근 에 한 개념이 부재하다. 이러한 차이로 인 해 사실상 두 표 의 완벽한 매핑은 불가능하며, 매핑 가운데 데이터 손실 발생도 불가피하다 (Godby 2010). 그러나 ONIX와 MARC은 LC, OCLC에 의해 서지 정보의 획득을 한 매핑이 시도되고 있으며, 국내에서도 한국출 유통진 흥원이 MARC 생성을 해 ONIX를 활용하고 있다(한국출 유통진흥원 2006). 3.2 BISAC / LCSH, DDC BISAC(Book Industry Standards and Com- munications)은 출 계의 공 사슬상에서 범용 으로 활용되는 주제 분류 표목으로 검색 시스 템을 통해 주제 분야를 검색하거나 도서를 배열 하기 하여 활용된다. 9개의 알 벳 문자에 의해 표 되며, 컴퓨터, 소설, 역사 등 52개의 주요 섹 션으로 구성 된다.5) 가령 아 리카 역사 일반은 HIS001000으로 표 되며, HISTORY/AFRICA/ GENERAL로 해석될 수 있다. LCSH가 300,000 개의 용어로 구성되어 있는 반면, BISAC은 3,000 개에 불과한데, BISAC이 좀 더 이며 이용 자 친화 이라는 평가를 받고 있다. 따라서 공공 도서 에서도 DDC를 신하여 BISAC을 채택 하고 있는 곳이 늘고 있다고 한다. Maricopa도 서 은 포커스 구룹 인터뷰를 통해 DDC 분류가 4) EDItEUR. . 5) BISAC. . 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 69 이용자들에게 친숙하지 않아, 서 과 같이 더 쉬 운 분류 체계를 도입할 필요가 있음을 입증하 고, 그에 따라 BISAC을 채택하게 되었다고 말하 고 있다(Norman Oder 2007). 최근 OCLC에서 는 BISAC과 DDC의 매핑을 추진한 바 있을 정 도로 도서 계의 BISAC 용 가능성에 해서 도 논의가 이루어지고 있다(Mitchell 2010). 3.3 ISNI / NACO, VIAF The International Standard Name Identifier (ISNI)6)는 ISO Standard(ISO 27729)로 미디어 콘텐츠 산업의 출 , 리, 콘텐츠 배포와 공 사슬망에서 이름 식별을 하여 사용된다. ISNI 는 혼동될 수 있는 이름의 모호성을 분명하게 하기 한 도구를 제공하며, 이 정보가 유 시 스템들 사이에 연계되기 하여 활용된다. 개인 에 한 망라 정보를 직 으로 제공하기 하여 개발된 시스템이 아니기 때문에, 다양한 공 사슬상의 트 들이 개인 정보를 유출하지 않으면서도 정보를 교환할 수 있는 구조를 가진 다. 개인을 구분하기 한 최소한의 메타데이터 로 구성되며, 기타 정보는 제한 속이 보장된 데 이터베이스내에서 리된다. ISNI 운 체계는 참조 데이터베이스를 생성 리하는 Registra- tion Authority(RA)와 이용자들에게 ISNI 서비 스를 제공하는 Registration Agencies(RAG) 로 구분된다. RAG는 CISAC(International Confederation of Societies of Authors and Composers), IFRRO(International Federation of Reproduction Rights Organisations), IPDA (International Performers’ Database Associ- ation), Bowker 이외에도 OCLC(Online Com- puter Library Center) 등이 맡고 있다. 한편, 도서 계는 거 통제와 이름 식별 체계 유지를 하여 NACO(The name authority pro- gram component of the PCC)와 VIAF 등을 운 하고 있다. VIAF(The Virtual International Authority File)는 미의회도서 , 독일국립도 서 , 랑스국립도서 의 동 로젝트로 하 나의 단일 이름 거에 하여 세 개 기 의 거 일을 가상으로 조합하게 된다. VIAF는 천 만개 이상의 인명과 그 이형으로 구성된 거 코드를 가지고 있으며, NACO의 회원이 로컬 <그림 1> ISNI 운 구조 (출처: www.isni.org) 6) ISNI. . 70 한국문헌정보학회지 제44권 제3호 2010 <그림 2> RA, RAG의 역할 (출처 www.isni.or) 도서 의 인명 코드를 추가하게 되면, 자동 으로 VIAF가 갱신되는 구조로 운 된다. 도서 계에서는 1984년에 Standard Author- ity Data Number(ISADN)를 개발하 으나, 거 코드의 기능 요건으로 FRAR(Functional Requirements for Authority Records)를 정의 할 뿐, 더 이상 인명식별체계는 업데이트 하지 않 고 있다. 신 최근 MARBI(MARC Advisory Committee 2010)는 출 계에서 사용되고 있는 ISNI를 아래와 같이 서지와 거 코드에 추가 시켜 인명식별방식을 보완하고자 하여 주목된다. 100 1# $aRendell, Ruth,$d1930-$0ISNI 8462 8328 5653 6435 3.4 ISTC / FRBR 한편, The International Standard Text Code (ISO 21047)7)는 출 사, 도서 매업자와 작 권 리 시스템에서 서로 다른 구 형을 가지고 있는 동일 원 작을 식별하기 하여 고안된 개 념이다. 표 은 2009년 5월에 공식 으로 출 되었으며 International ISTC Agency에서 구 이 시작되었다. ISTC의 기본 인 신텍스는 16개 의 숫자와 문자로 구성되고 있으며, Registration element, Year element, Work element, Check digit이 포함된다. ISTC registration agency 는 작자와 작권 표자의 요구에 의해 고 유번호를 부여하게 되는데, 작권이 만료된 작물도 공정 이용을 해 국가도서 이 고유 번호 부여를 요구하기도 한다. 한편, 도서 계의 FRBR은 서지 세계를 개 체와 계에 의해 재해석하는 새로운 개념 모델 로 작, 표 형, 구 형, 아이템의 계층 구조 를 취하고 있다. FRBR은 ICP, RDA 등 차세 목록의 기본 개념이 되고 있을 정도로 도서 계 에서 매우 요한 개념으로 이해되고 있다. 하나 의 작이 다양한 표 형과 구 형으로 표 되 7) ISTC. . 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 71 거나 제작될 수 있다는 개념을 기반으로 하고 있 어, 다양한 유 작물을 동일 작 벨로 그 룹핑하는 것이 가장 요한 과제가 된다. OCLC 는 서지 데이터베이스에서 동일 작에서 생 된 유 작을 클러스터하는 워크셋 알고리즘 을 개발하 으며, FRBR 워크셋 정보를 웹상에 서 활용할 수 있는 xISBN 서비스를 운 하고 있다. 한편, ISTC를 FRBR의 작 벨 는 표 형 벨에 매핑하는 문제에 한 논의는 아 직 혼란스러운데, ISTC가 텍스트 기반 작의 식별체계인 만큼, MARBI(MARC Advisory Committee 2010)는 최근 소설류에 한해 MARC 21 포멧에 아래와 같이 식별번호를 포함시키고 자 한다. 024 7# $aISTC 0A3 2009 012445C9 B$2istc [ISTC for the work “Winter in Madrid”] 3.5 유사 표 의 상호 운용성 에서 살펴본 바와 같이 양측은 유사한 표 을 채택하여 도서메타데이터를 리하고 있다. ① 자료의 발견과 식별을 한 메타데이터 형식 으로 도서 계는 MARC을, 발견과 유통․ 매 를 하여 출 계는 ONIX를 사용하고 있으며, ② 자료의 내용 분류를 하여 도서 계는 LCSH나 DDC를, 출 계는 BISAC이나 BIC을 사용하고 있다. 한편, ③ 도서 계는 자의 식별 을 해 거 통제를 실시하고 있으나, 출 계는 ISNI를 활용하고 있으며, ④ 동일 작에서 생 된 다양한 구 형을 통제하기 하여 출 계는 ISTC(International Standard Text Code)를, 도 서 계는 FRBR이라는 개념을 활용하고 있다. 술한 표 들은 도서의 매와 유통, 도서 소장과 이용자 근이라는 상이한 목 을 해 개발되었다. 그러므로 자는 가격과 상태에 한 유통과 마 정보, 그리고 작권 리의 효율성 제고에 촛 을 맞추며, 후자는 발견과 근 그리고 유 작의 식별을 강조하게 된다. 따라서 양측 체계는 구조상, 어의상의 큰 차이를 가지며, 이로 인해 완벽한 호환은 불가능하다고 평가된다. 그러나 부족한 부분을 보완하기 하 여 상 측 표 이 제한 으로 활용되고 있으며, 축 된 문성이나 노하우를 채택하여 좀 더 효 율 으로 발 시킬 수 있는 방안에 한 논의도 이루어지고 있다는 이 주목된다. 4. 도서메타데이터의 효율 인 생성․유통 방안 고찰 앞에서는 도서메타데이터의 유통 경향을 분 석하고 련 쟁 을 도출하 다. 더불어 양측이 채택하고 있는 유사 표 에 하여 살펴보았다. 도서메타데이터는 출 사, 도서유통업체, 서 , 도서 등 공 사슬상에서 각기 필요한 형식과 내용으로 활용되고 있어, 생성과 품질 유지에 복 투입되는 시간과 비용에 한 문제가 쟁 이 되고 있다. 한 원소스 멀티유스 경향으 로 하나의 컨텐츠가 다양한 방식으로 간행되면 서, 동일 작의 다양한 구 형을 식별하거나 자를 정확하게 식별하는 문제도 쟁 이 되고 있다. 각기 다른 표 을 운용해 온 양측은 최근 상호 운용하여 경제성을 도모하는 한편, 직면 한 복잡한 문제에 공동 처할 필요를 느끼기 시작하 다. 72 한국문헌정보학회지 제44권 제3호 2010 본 장에서는 도서메타데이터를 둘러싼 여러 가지 쟁 가운데, 생성과 품질 유지의 효율성을 제고시키는 측면에 을 맞춰 양측에 용 가 능한 새로운 메카니즘을 고민해 보고자 한다. 4.1 공 사슬상의 도서메타데이터 흐름 분석 언 했다시피, 생성과 품질 유지의 효율성에 한 문제가 논의의 쟁 이 되고 있어, 먼 , 도 서메타데이터의 흐름을 공 사슬망 차원에서 조 망하고, 그 특징과 문제 을 구체화할 필요가 있 겠다. 본 장에서는 OCLC(2009b)의 조사를 바 탕으로 ONIX CIP 데이터 샘 , 출 사, 유 통업체, 서 등 각 공 사슬 계자들 사이트를 참조하여 <그림 3>과 같이 메타데이터의 흐름을 재구성해 보았다. ① 출 단계, ② 출 후 유통 단계, ③ 매 단계, ④ 도서 소장 서 비스 단계로 구분하여, 주요 계자, 데이터 형 식과 주요 요소, 그리고 흐름상의 특징을 아래와 같이 정리해 본다. ① 출 단계 ∙주요 계자: 출 사, 국가 표도서 ∙데이터 형식: ONIX, CIP, 기타포멧 ∙주요 생성 요소: 출 /인쇄정보, 기본서 지정보, 주제분석 거통제정보(CIP) ∙㉠ 출 에는 출 /인쇄에 한 정보 뿐 아니라, 기본 서지정보가 생성된다. 그러 나 출 완료 후, 서명, 부서명, 사이즈 등 이 변화되므로 이 단계의 서지정보는 매 우 유동 이다. 일부 출 사들은 ONIX를 이용해 메타데이터를 리하지만, 부분 의 소출 사들은 독자 인 형식으로 데 이터를 리하고 있다. ㉡ 한편, 출 사가 국가 표도서 에 제출한 데이터는 주제 명 표목과 분류 기호 등이 추가되어 CIP 데이터로 탄생되기도 한다. 그러나 CIP 신청률이 2008년 기 으로 체 발행물의 7-13%로(김선애 2009) 매우 조한 국내 에서는 출 메타데이터의 존재를 일반 화하기 어렵다. ② 출 후 유통단계 ∙주요 계자: 유통업체, 메타데이터 벤더 ∙데이터 형식: ONIX, MARC, 기타포멧 ∙주요 생성 요소: 상태, 유통 정보, 독자수 , 북수상, 이미지, 목차 등 보완된 기술 정보 ∙㉠ 책이 출 되면 페이지, 크기와 같은 형 태사항과 서명, 부서명 같은 서지 데이터 가 고정된다. ㉡ 도매상과 유통업체는 도 서 입수 후, ONIX를 검증하고 가격과 상 태 같은 유통 정보를 업데이트한다. 한 도서 납품을 하여 MARC 데이터를 구축하기도 한다. ㉢ 메타데이터 벤더는 거 통제, 주제 분석, 챕터 정보, 이미지, 목차, 자 양력, 북수상 정보 등을 추가해 데이터의 품질을 보강하여, 다양한 형식으 로 서 , 도서 등에 배포한다. 국내에서 는 한국출 유통진흥원이 유통 단계에서 최 ONIX 메타데이터를 생성하여 신간 출 물이라는 이름으로 련 업체 도 서 에 배포하고 있다. ③ 매 단계 ∙주요 계자: 서 , 이용자 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 73 ∙데이터 형식: ONIX, MARC, EDI, 기타 포멧 ∙주요 생성 요소: 배포처, 가격 정보, 리뷰, 평 등 이용자 생성 정보 ∙㉠ 서 은 도매상, 출 사, 벤더 등으로부 터 입수한 메타데이터에 새로운 데이터를 추가시킨다. 리뷰나 평 같은 이용자 생 성 메타데이터를 추가하여 이용자가 구매 결정시 활용할 수 있도록 보강하기도 한 다. 한편, ㉡ 재고 여부, 배포처 리스트, 가 격과 같은 가변 데이터 요소가 이 단계 에서 갱신된다. ④ 도서 소장 서비스 단계 ∙주요 계자: 서지유틸리티기 , 도서 , 이용자 ∙데이터 형식: MARC ∙주요 생성 요소: 기술정보, 근 정보, 로컬 소장 정보 ∙㉠ 도서 은 CIP 데이터 는 도매상이나 벤더가 제공하는 신간출 정보를 수서 결 정 과정에서 활용한다. ㉡ 수서가 완료되면 데이터는 정리 트로 인계되며, 소장정보 를 포함한 로컬 목록 작업이 완성된다. ㉢ 도매상이 납품하거나 각종 서지유틸리티에 서 제공받은 MARC이 활용되지만, ㉣ 로 컬의 고유 정보 입력과 수정, 보완 작업에 많은 시간과 노력이 투입되기도 한다. <그림 3>과 같이 공 사슬망 차원에서 조망 한 도서메타데이터는 출 단계에서 이용자 에게로 이어지는 생명 주기에 의해 진화되어 가 <그림 3> 공 사슬상의 메타데이터 흐름 74 한국문헌정보학회지 제44권 제3호 2010 는 특징을 보인다. 출 단계에서는 기본서지 정보와 출 /인쇄에 련된 각종 정보가 생성되 며, 유통단계에서는 다양한 기술정보가 보강될 수 있다. 이용자들과 직 만나게 되는 매단계 에서는 구매자들의 선택을 돕거나 마 의사 결정에 활용 가능한 다양한 정보가 생성될 수 있다. 한편, 국가 표도서 의 CIP, 유통업체의 MARC 납품 등을 통해 출 계와 도서 계에 상호 유입되면서 불필요한 재구축도 감소시킬 수 있어, 이러한 흐름상의 특징을 체계화하면, 도서메타데이터를 효율 으로 생성하여 유통시 킬 수 있다. 그러나 이러한 특징에도 불구하고 공 사슬 상의 각 계자들은 도서메타데이터를 자신들 의 목 에 따라 각기 다른 형식과 내용으로 구 축하면서 단편 으로 활용하고 있다. 다시 말해 생명 주기 동안 보강된 데이터 요소들을 각 계자들 사이에 효과 으로 공유하지 않고 복 구축하거나 재 작성하면서 불필요한 노력을 발 생시킨다. 유통업체와 벤더, 온라인 서 등 출 계 계자들은 각기 마 과 리 정보의 최 신성 유지를 하여 많은 인력을 투입하고 있으 며, 도서 계 역시 각종 서지유틸리티로부터 무 료로 활용할 수 있는 데이터를 도매상이나 벤더 들로부터 유상으로 구매하거나 별도의 목록 인 력을 투입하여 새롭게 작성하면서 불필요한 산과 노력을 투입하고 있다. 한 양측이 많은 노력을 투입하여 보강한 데이터 요소들도 상호 간 충분히 공유되지 않고 있다. 도서 계가 주 제 분석, 거 통제 등 지 인 노력으로 보강한 데이터 요소들이 출 계로 극 유입되어 활용 되지 않으며, 출 /인쇄에 한 상세정보, 이용 자 리뷰나 평가, 자의 이력, 북수상, 이용자 수 등 출 계의 공 사슬상에서 생성되거나 보 강된 의미 있는 데이터 요소들도 원활히 도서 계에 유입되어 활용되지 못한다. 4.2 효율 생성․유통 방안 제시 술한 바와 같이, 도서메타데이터는 동일한 정보원을 가지지만 양측의 목 에 따라 각기 다 른 형식으로 활용되고 있으며, 각계의 노력으로 풍부해진 데이터 요소들이 상호 공유되지 못하 고 있다. 도서 계와 출 계는 상호 운용 가능 성과 필요성을 모두 인지하고 있으며, MARC 과 ONIX의 부족한 부분을 시에 교류하길 원 한다. 더 근본 으로는 출 단계에서부터 고 품질의 서지데이터가 생성되어 출 계와 도서 계에 공유되고, 생명주기에 따라 진화되길 기 한다. 그러한 맥락에서 본 장은 이를 한 몇 가지 방안에 해 고민해 보고자 한다. 4.2.1 ONIX와 KORMARC의 상호 보강 메카니즘 출 계에서 유통되는 메타데이터와 도서 계의 목록데이터는 서로 부족한 부분을 보강할 수 있어야 할 것이다. 출 계에서 유통되는 메 타데이터에는 출 /인쇄에 한 상세정보 이외 에도 생명 주기에 따라 도서 계에서 확보하기 어려운 다양한 정보가 생성될 수 있다. 반면, 도 서 계의 목록 데이터에도 주제 분석과 거 통 제를 통해 출 계에서 확보하기 어려운 다양한 정보가 생성될 수 있다. 한 소 서지데이터 를 기반으로 한 다양한 마이닝 기술을 통해 서 지 요소를 더욱 풍부하게 보강시킬 수 있다. 가 령 FRBR 워크셋을 통해 신간도서의 원 작과 련된 서지 코드를 소 DB에서 추출한다면, 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 75 원 작의 서명, 자, 주제에 련된 상세 정보, 그리고 동일 원 작에서 생된 다양한 유 작 정보를 기계 으로 확보하여 양측이 모두 유 용하게 활용할 수 있을 것이다. 우리나라의 경우, 유통단계에서 작성된 ONIX 의 서지 요소가 KORMARC으로 변환되어 서지 유틸리티 기 을 통해 도서 계에 보 되고 있 다. 여기에 사용되는 변환 알고리즘을 수정하여, 오닉스와 KORMARC이 상호 보강되는 새로운 메카니즘을 도입할 수 있을 것이다. <그림 4>는 본 논문에서 제안하는 ONIX와 KORMARC의 상호 보강 메카니즘 개념도이다. 아래에서 조 더 구체 으로 설명해 본다. 첫째, 그림 상단에서 보이는 바와 같이, 재 는 유통 단계에서 작성된 ONIX의 서지 데이터 요소가 ONIX to KORMARC 알고리즘을 통해 MARC으로 변환되어 서지유틸리티 기 을 비 롯한 도서 계에 신간출 정보로 보 되고 있다. 둘째, ONIX와 KORMARC의 단순 매핑으 로는 도서 계에서 지 까지 다루지 않았지만 최근 그 요성이 강조된 다양한 요소들이 유실 될 수 있다. 더구나 기술의 수 차이 등 구조 문제로 인하여 매핑이 쉽지 않은 경우도 존재한 다. 가령 ONIX의 PR8에 정의된 “공헌자 이름/ 형태”에는 직 소속기 , 자의 이력, 자 의 배경 등 다양한 기술사항이 하 요소로 정의 되어 있다. 그러나 KORMARC과의 기술 수 차이는 변환 과정에서 이러한 요소를 원활히 수 용하기 어렵게 한다. PR14에서 다루고 있는 “독 자”도 마찬가지이다. 역시 하 요소로 심연령 , 독자기술( , 컴퓨터 보자), 독자범 독자범 의 정확도 등이 정의되어 있으나 같은 <그림 4> ONIX와 KORMARC 상호 보강 메카니즘 개념도 76 한국문헌정보학회지 제44권 제3호 2010 이유로 변환이 용이하지 않다. ONIX의 변환 알 고리즘은 이러한 요소를 수용하기 하여 보완 될 필요가 있으며, 추가 요소의 수용을 해 경 우에 따라 KORMARC의 구조 수정도 필요 해 보인다. 셋째, 상호 보강을 해 KORMARC과 ONIX 를 매핑하면, 다음과 같은 세 가지 경우가 나타 날 수 있다. ONIX와 일치하는 MARC이 존재 하지 않는 경우, ONIX와 일치하는 MARC이 존 재하는 경우, 그리고 KORMARC은 존재하나 ONIX가 아직 생성되지 않은 경우이다. ① 먼 , ONIX와 일치하는 MARC이 존재하지 않는 경 우는, 신간에 한 ONIX가 생성되었지만, 아직 KORMARC은 생성되지 않은 상태이다. 이러 한 경우, ONIX의 서지 요소(ISBN, 총서, 서명 자사항, 자, 사항, 발행정보, 독자사항 등) 로 KORMARC을 자동 생성시킬 수 있으며, 이 데이터는 도서 계에서 신간출 정보로 활용될 수 있다. ② 한편, ONIX와 KORMARC이 모 두 존재하는 경우는 상호 보강 알고리즘에 의해 ONIX 고유의 요소( 자이력, 자 기, 심연 령, 서평 등)로 KORMARC을 보강시키며, 동 시에 KORMARC 고유의 요소(주제명, 분류번 호, 유 작정보 등)로 ONIX를 보강시킬 수 있다. 상호 보강 알고리즘은 매핑 상이 되는 상 데이터에 부족한 요소를 발견하여 보완하 거나, 우수한 쪽의 데이터 요소로 체시킬 수 있다. ③ 마지막으로 ONIX보다 KORMARC 이 먼 생성되어버린 경우도 있다. 우리나라에 서는 유통 단계에서 최 의 ONIX가 구축되고 있으므로, 간혹 출 사의 직 을 통해 신간을 구입한 도서 이 ONIX보다 먼 KORMARC 을 작성하게 되는 경우가 있을 수 있다. 이러한 경우, 먼 구축된 KORMARC의 서지 요소 (ISBN, 서명 자사항, 주제분석, 거통제)로 ONIX를 자동 생성시킬 수 있으며, 이 데이터는 완벽한 ONIX를 구축하는데 기 데이터로 활 용될 수 있을 것이다. 넷째, 최근에는 하나의 컨텐츠가 도서, 만화, 화 등 다양한 매체로 재생산되고 있다. 한 새롭게 출 된 도서일지라도 기존 작의 개작, 증보, 번역물 하나일 수 있다. OCLC는 이러 한 아이디어를 바탕으로 FRBR 알고리즘을 NextGen Pilot에 활용하고 있다. 같은 방식으 로 국내 최 서지데이터베이스인 UNICAT에 서 FRBR 클러스터를 생성하면, 상이 되는 도서의 다양한 유 작에 공통 으로 포함되 어 있는 서지 정보(주제명, 분류번호, 원제목, 원 자 등)를 기계 으로 추출하여, 신간 서지 데이터의 품질을 제고시킬 수 있을 것이다. 따 라서 ONIX와 일치하는 KORMARC이 존재하 지 않는 ①번과 같은 경우에도, FRBR 클러스 터 정보로 ONIX의 서지 요소를 보강시킬 수 있 게 된다. 4.2.2 CIP 활성화를 통한 고품질 서지데이터 생성․공유 한편, 술한 ONIX와 MARC의 상호 보강 메카니즘이 CIP가 활성화되어 있지 않은 국내 환경을 한 보완 안이라면, CIP 활성화는 출 계와 도서 계가 출 단계에서부터 고품 질의 서지데이터를 생성하여 공유할 수 있는 좀 더 근원 방안이라고 말할 수 있겠다. CIP는 출 사, 유통 업체, 서 등 공 사슬상의 계자 들이 복하여 서지데이터를 작성하는 노력을 최소화시킬 수 있으며, 동시에 카피 목록 작성을 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 77 통해 도서 업무의 경제성을 제고시킬 수 있다. 따라서 ONIX와 MARC의 상호 보강 메카니즘 과 더불어 출 사들의 CIP 신청을 독려할 수 있 는 방안에 한 고민도 필요하겠다. CIP를 제공 한 출 사가 시에 출 도서를 홍보하고 매 경로를 확보할 수 있다면 자연스럽게 참여율을 제고할 수 있을 것이다(김선애 2009). 국내 최 도서 포털이면서, 매 시스템을 연계하고 있는 “네이버 책”의 출 사 신간 등록 서비스와 제휴 한다면, CIP 참여율 제고에 많은 도움을 받을 수 있을 것으로 기 된다. 4.2.3 생명 주기에 따라 진화되는 매커니즘 앞서 언 한 바와 같이, 도서메타데이터는 공 사슬상에서 시간이 지남에 따라 도서의 상태, 재고 여부, 가격 등의 비즈니스 련 정보 뿐 아 니라, 이용자 에서 평 , 리뷰, 태그 등 새로 운 정보가 추가될 수 있다. 이러한 정보는 출 계 측면에서는 비즈니스 의사 결정 데이터로 활 용될 수 있으며, 도서 계에서는 이용자의 단 과 선택을 돕는 정보로 활용될 수 있을 것이다. 데이터가 일 으로 유지되어서 생명 주기에 따라 진화되어가기 해서는 먼 출 계 내부 의 표 채택이 선행되어야 하며, 동시에 데이 터 흐름에 따라 추가되고 갱신된 부분이 공 사 슬에 역으로 환류되는 메커니즘의 고안도 필요 할 것이다. ONIX 피드를 통해 진화된 데이터가 정보원을 향해 자동 피드되고 종합목록과 같은 서지시스템으로도 달되어 연계 으로 갱신될 뿐 아니라, 그것을 다운로드 받은 로컬도서 에 도 피드되는 방안을 고민해 볼 필요가 있을 것 이다. 5. 결 론 5.1 요약 본 연구에서는 첫째, 공 사슬상의 계자들 입장에서 메타데이터의 유통 경향과 련 쟁 을 분석하 다. 하나의 작이 다양한 매체와 형식으로 간행되면서 출 계는 자세한 기술 정 보 제시를 요구받게 되었고, 온라인 시장 유 율 증가로 인해 메타데이터는 출 마 의 주 요 요소가 되었다. 도서 계는 목록 작성의 경 제 효용성을 추구하면서, 최 정보원에 근 한 데이터 소스를 통해 목록 작성 업무를 간소 화할 수 있는 모델을 모색하게 되었다. 한편, 원 소스 멀티유스 경향으로 하나의 컨텐츠가 다양 한 방식으로 간행되면서, 동일 작의 다양한 구 형을 식별하거나 자를 정확하게 식별하 는 문제가 양측에게 모두 쟁 이 되고 있다. 이 러한 배경으로 최근 상호 운용하여 경제성을 도 모하는 한편, 직면한 복잡한 문제에 한 공동 처 필요가 제기되었다. 둘째, 출 계와 도서 계에서 용되고 있는 유사 데이터 표 과 상호 운용성을 살펴보았다. 출 계는 매와 유통을 해 ONIX, BISAC/BIC, ISNI, ISTC 등을 사용하고 있으며, 도서 계는 도 서 소장과 이용자 근을 해 MARC, LCSH/ DDC, 거통제, FRBR 등을 사용하고 있다. 양 측 체계는 구조상, 어의상 큰 차이를 가지고 있 어 완벽한 호환은 불가능하지만, 부족한 부분을 상호 보완한다면 좀 더 효율 으로 운용될 수 있다고 평가된다. 한편, 이용자의 선택과 구매 결정을 지원하기 한 양질의 기술 메타데이터 생성, 그리고 유 작과 자의 식별 문제는 78 한국문헌정보학회지 제44권 제3호 2010 양측 표 이 직면한 공통 과제로 그간의 문성 을 바탕으로 한 공동 응이 실히 요구된다. 셋째, 출 계와 도서 계에서 유통되고 있는 도서메타데이터 흐름상의 특징과 문제 을 악 해 보았다. 행 도서메타데이터는 출 단계 에서부터 이용자에게로 이어지기까지 출 사, 유통업체, 서 , 도서 등에서 각기 필요한 형 식과 내용으로 활용되고 있다. 생명 주기 동안 상호간 복잡하게 교류되면서 진화되기도 하지 만, 개별 계자들에 의해 복 구축되거나 재 작성되면서 불필요한 노력이 발생되기도 한다. 한 생명 주기 동안 보강된 데이터 요소들이 각 계자들 사이에 효과 으로 공유되지 못하고 있다. 넷째, 의 분석을 바탕으로 도서메타데이터 생명 주기에 있어 보다 진화된 메카니즘의 도입 가능성을 모색해 보았다. 아래 제언에서 기술하 고 있는 바와 같이, 본 연구는 양측이 복 노력 을 최소화하고 상호 정 으로 메타데이터를 운용할 수 있는 3가지 방안을 제시하 다. 5.2 제언 도서 계와 출 계가 새로운 메카니즘을 통 해, MARC과 ONIX의 부족한 부분을 시에 교류할 수 있다면, 도서 계는 신속하고 정확한 기술정보를 확보하고 이를 통해 목록의 경제성 을 제고할 수 있다. 한 출 계도 주제 분석과 거 통제 등으로 풍부해진 메타데이터를 시 에 확보하고 매자 시스템으로 양질의 데이터 가 신속하게 달될 수 있을 것이다. 본 연구에 서는 도서메타데이터의 새로운 생성․유통 체 계를 한 몇 가지 방안을 제안하 다. 첫 번째, ONIX와 MARC 데이터가 상호 매핑되어 양측 의 부족한 부분을 보강할 수 있는 알고리즘이 도 입되어야 할 것이다. MARC에 부족한 출 /인 쇄에 한 상세정보와, 자 기, 서평 등의 마 정보, ONIX에 부족한 주제 분석, 거 통 제, 연 록 정보 등을 상호 보강하여 양측이 시에 활용할 수 있는 새로운 체계가 고안되어 야 할 것이다. 두 번째, CIP 제도를 활성화시켜 출 도서 정보가 도서 계에 원활히 유입되 고, 도서 계의 지 노력을 통해 보강된 서지 정보가 출 계에서도 원활히 활용되어야 할 것 이다. 세 번째, 도서메타데이터 생명 주기에 따 라 추가되고 갱신되는 다양한 정보를 ONIX 피 드를 통해 공 사슬에 역으로 환류시키고, 이미 다운로드 받아 활용하고 있는 도서 계에도 자 동 피드시킬 수 있는 메커니즘이 고안되어야 할 것이다. 참 고 문 헌 [1] 김선애. 2009. 우리나라 CIP 로그램에 한 고찰. ꡔ제46회 국도서 회 세미나 3: 공공도서 목록, 빠르고 정확하게ꡕ. [online]. [cited 2009. 12. 1]. . [2] 장지숙. 2009. 공공도서 목록 품질향상을 한 방안: CIP를 심으로. ꡔ제46회 국도서 회 공 사슬상의 도서메타데이터 생성․유통에 한 고찰 79 세미나 3: 공공도서 목록, 빠르고 정확하게ꡕ. [online]. [cited 2009. 12. 1]. . [3] 한국출 유통진흥원. 2006. KORMARC ↔ ONIX 변환표. [online]. [cited 2009. 10. 1]. . [4] 国立国会図書館, 2007, デューイ十進分類法を採用しない図書館,議論の的に, カレントア ウェアネス-E No.111. [online]. [cited 2009. 10. 1]. . [5] A Symposium for Publishers and Librarians. [online]. [cited]. . [6] BISAC. [online]. [cited]. . [7] EDItEUR. [online]. [cited]. . [8] Godby, & Carol Jean. 2010. “Mapping ONIX to MARC." [online]. [cited 2010. 4. 10]. . [9] ISNI. [online]. [cited]. . [10] ISTC. [online]. [cited]. . [11] Mitchell, Joan S. 2010. “BISAC-DDC Mappings. ALA Midwinter Meeting Boston January 16, 2010." [online]. [cited 2010. 3. 1]. . [12] MARC Advisory Committee. 2010. “MARC DISCUSSION PAPER NO. 2010-DP03." [online]. [cited 2010. 3. 10]. . [13] NISO, & OCLC. 2009. “Streamlining Book Metadata Workflow." [online]. [cited 2009. 12. 1]. . [14] Oder, & Norman. 2007. “Behind the Maricopa County Library District’s Dewey-less Plan, Library Journal, 5/31/2007." [onine]. [cited 2009. 10. 1]. . [15] OCLC. 2009a. “Report on OCLC's Symposium for Publishers and Libraries." [online]. [cited 2010. 3. 3]. . [16] OCLC. 2009b. “From ONIX to MARC and Back Again: New Frontiers in Metadata Creation at OCLC, ALA Midwinter January 25, 2009." [online]. [cited 2010. 3. 13]. . [17] R2 Consulting LLC. 2009. “Study of the North American MARC Records Marketplace." [online]. [cited 2009. 12. 30]. . 80 한국문헌정보학회지 제44권 제3호 2010 [18] Working Group on the Future of Bibliographic Control. 2008. “On the Record: Report of The Library of Congress Working Group on the Future of Bibliographic Control." [online]. [cited 2009. 11. 1]. . •국문 참고자료의 영어 표기 (English translation / romanization of references originally written in Korean) [1] Sun-Ae Kim. 2009. “Urinara CIP Programe Gwanhan Gochal." 46th KLA General Conference Semina 3: Gonggongdoseogwanmokrok, Bbareugo Jeonghwakhage. [online]. [cited 2009. 12. 1]. . [2] Ji-Suk Jang. 2009. “Gonggongdoseogwan mokrok Pumjilhyangsangeul Wihan Bangan: CIPreul Jungsimeuro." 46th KLA General Conference Semina 3: Gonggongdoseogwanmokrok, Bbareugo Jeonghwakhage. [online]. [cited 2009. 12. 1]. . [3] Book Trade Promotion Center. 2006. KORMARC ↔ ONIX Byeonhwanpyo. [online]. [cited 2009. 10. 1]. .