世界記録遺産『日省録』、電子版はミスだらけ(上)
ttp://www.chosunonline.com/news/20110608000035 ttp://www.chosunonline.com/news/20110608000036 ttp://file.chosunonline.com//article/2011/06/08/927479808281834620.jpg 「人と書くべきところ入と書き、全と書くべきところ金という字を書いている。現の字を理、平を年と誤って書いたところもある。聞を間、官を宮と書いた箇所も…」
これは、ソウル大学奎章閣のウェブサイトに掲載されている、朝鮮王朝時代の記録『日省録』で見つかった誤字の数々。正祖10年(1786年)1月22日付の
記事だけでもこうだ。最近、インターネットの掲示板にこうしたミスの指摘を10回も掲載したイさん(古典翻訳院研究学生)は「読んでみると、文章がめちゃくちゃな
ケースが多い。こんなことでは、きちんと研究するのは難しい」と語った。
先月、国連教育科学文化機関(ユネスコ)の世界記録遺産に登録された『日省録』のオンラインデータベースのテキストは、あちこちに間違いがある。奎章閣の
ウェブサイトでは現在『日省録』をはじめ、『朝鮮王朝実録』『承政院日記』『備辺司謄録』など古記録類の原本イメージファイルと並び、別途漢字を入力した漢文
テキストもサービスしている。問題は、漢字を入力する初期の過程で原文とは異なる字が入力されるなどのミスが、現在まで放置されているということだ。
『日省録』とは、英祖36年(1760年)から隆煕4年(1910年)までの151年間にわたり、国王の動静や国政諸般の運営事項を日記体で整理した資料。全2329冊、
22万9900ページ余り、文字数だけでも約3500万字という一大資料だ。従って、ミスの全体像を把握するのは容易ではない。
本紙は、古書のデジタル入力を専門に手掛けるA社に検査を依頼した。奎章閣の掲示板でミスが指摘された正祖10年1月21日(全5ページ)から22日(全16
ページ)と、任意に選んだ正祖12年1月1日(全4ページ)から2日(全14ページ)に限って検査を実施。その結果、計39ページ、7389字のうち42字が間違っていた。
毎ページ1件以上のミスがあったことになる。正確度は99.43%(1000字当たり誤字6字)。現時点で一般的な基準値とされる正確度99.9%(1000字当たり誤字1字)に
比べ、ミスは許容値のほぼ6倍に達する。
>>914続き
ミスの類型はさまざまだ。最も多いのは、原文の文字と似ている別の文字を使用したケース。正祖10年1月21日付の記事の場合、原文では「處分之不」となって
いる部分を「處分之下」、「筵奏萬萬」を「筵泰萬萬」と誤って書き写していた。文字を連続して間違えているケースもある。正祖12年1月1日のテキスト2に出てくる
「力有贍之之」の「之之」は、誤って「乏乏」と書かれていた。文字の順番を変えているケースもあり、正祖12年1月2日付の記事では「安進績」を「進安績」としていた。
奎章閣情報資料管理部の関係者は「規模が極めて大きいことを考慮すると、ミスの発生は避けられない。ミスの指摘は、年に1−2回、確認され次第反映して
いるが、根本的な問題解決には予算上困難がある」と語った。
安大会(アン・デヒ)成均館大学教授は「こうしたミスは、『日省録』だけの問題ではない可能性が大きい。この機会に、国史編さん委員会や古典翻訳院、
奎章閣などに分散している古典デジタル化事業を、統合管理すべきではないかと点検してみる必要がある」と語った。さらに、原文入力だけでなく、オンライン
翻訳事業に対する点検の必要性も提起された。パク・ヒョンム韓国学中央研究院教授は「『朝鮮王朝実録』のような古記録類をオンライン翻訳する場合、古語を
そのまま使うケースが多く、市民や外国人が読めなかったり、読みづらかったりする。原文の正確な入力だけでなく、翻訳にももう少し体系的な関心を向ける
必要がある」と語った。
全炳根(チョン・ビョングン)記者
そもそも初等教育段階で漢字を覚えてないんだから無理無理