【韓国文化】ソウル大のウェブサイトに掲載されている世界記録遺産『日省録』電子版は誤字だらけ…問題解決の目処も立たず[06/08]
http://file.chosunonline.com//article/2011/06/08/927479808281834620.jpg 「人と書くべきところ入と書き、全と書くべきところ金という字を書いている。現の字を理、平を年と誤って書いたところもある。聞を間、官を宮と書いた箇所も…」
これは、ソウル大学奎章閣のウェブサイトに掲載されている、朝鮮王朝時代の記録『日省録』で見つかった誤字の数々。
正祖10年(1786年)1月22日付の記事だけでもこうだ。
最近、インターネットの掲示板にこうしたミスの指摘を10回も掲載したイさん(古典翻訳院研究学生)は
「読んでみると、文章がめちゃくちゃなケースが多い。こんなことでは、きちんと研究するのは難しい」と語った。
先月、国連教育科学文化機関(ユネスコ)の世界記録遺産に登録された『日省録』のオンラインデータベースのテキストは、あちこちに間違いがある。
奎章閣のウェブサイトでは現在『日省録』をはじめ、『朝鮮王朝実録』『承政院日記』『備辺司謄録』など
古記録類の原本イメージファイルと並び、別途漢字を入力した漢文テキストもサービスしている。
問題は、漢字を入力する初期の過程で原文とは異なる字が入力されるなどのミスが、現在まで放置されているということだ。
『日省録』とは、英祖36年(1760年)から隆煕4年(1910年)までの151年間にわたり、国王の動静や国政諸般の運営事項を日記体で整理した資料。
全2329冊、22万9900ページ余り、文字数だけでも約3500万字という一大資料だ。従って、ミスの全体像を把握するのは容易ではない。
本紙は、古書のデジタル入力を専門に手掛けるA社に検査を依頼した。
奎章閣の掲示板でミスが指摘された正祖10年1月21日(全5ページ)から22日(全16ページ)と、
任意に選んだ正祖12年1月1日(全4ページ)から2日(全14ページ)に限って検査を実施。
その結果、計39ページ、7389字のうち42字が間違っていた。毎ページ1件以上のミスがあったことになる。正確度は99.43%(1000字当たり誤字6字)。
現時点で一般的な基準値とされる正確度99.9%(1000字当たり誤字1字)に比べ、ミスは許容値のほぼ6倍に達する。
ミスの類型はさまざまだ。最も多いのは、原文の文字と似ている別の文字を使用したケース。
正祖10年1月21日付の記事の場合、原文では「處分之不」となっている部分を「處分之下」、「筵奏萬萬」を「筵泰萬萬」と誤って書き写していた。
文字を連続して間違えているケースもある。正祖12年1月1日のテキスト2に出てくる「力有贍之之」の「之之」は、誤って「乏乏」と書かれていた。
文字の順番を変えているケースもあり、正祖12年1月2日付の記事では「安進績」を「進安績」としていた。
奎章閣情報資料管理部の関係者は
「規模が極めて大きいことを考慮すると、ミスの発生は避けられない。
ミスの指摘は、年に1−2回、確認され次第反映しているが、根本的な問題解決には予算上困難がある」と語った。
安大会(アン・デヒ)成均館大学教授は
「こうしたミスは、『日省録』だけの問題ではない可能性が大きい。
この機会に、国史編さん委員会や古典翻訳院、奎章閣などに分散している
古典デジタル化事業を、統合管理すべきではないかと点検してみる必要がある」と語った。
さらに、原文入力だけでなく、オンライン翻訳事業に対する点検の必要性も提起された。
パク・ヒョンム韓国学中央研究院教授は
「『朝鮮王朝実録』のような古記録類をオンライン翻訳する場合、古語をそのまま使うケースが多く、
市民や外国人が読めなかったり、読みづらかったりする。原文の正確な入力だけでなく、翻訳にももう少し体系的な関心を向ける必要がある」と語った。
全炳根(チョン・ビョングン)記者
ソース 朝鮮日報 記事入力 : 2011/06/08 10:26:18
http://www.chosunonline.com/news/20110608000035 関連スレ
【韓国】韓国メディア「我が国の世界記録遺産は9件になりアジア最多の誇りを守った」 [05/31]
http://kamome.2ch.net/test/read.cgi/news4plus/1306805121/
世界記録遺産なのにやる気ねぇw
そもそもソウル大すら誤字だろ。
日帝統治時代が嫌ニダっていって。
大清国属?
5 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:12:11.73 ID:HYHQtnKk
漢文記録の解析だったら、日本に任せたほうがいいだろ
6 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:12:27.40 ID:UKyh96kl
OCRで手抜き入力したのか
流石、愚民。
8 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:14:11.83 ID:apjGFryu
>>1 世界記録遺産の主旨を丸で理解してないだろw
9 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:14:17.30 ID:yDojp1o8
コピペ対策だろ
10 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:14:26.59 ID:pBDCi9t9
これ、OCRにぶっこんだままだろw
漢字読めないんだから仕方無いニダ
12 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:16:08.71 ID:tSbU59tS
その誤字だらけの物を論拠として語るのが韓国クオリティ
まあ、作家の空想の産物の小説を歴史の根拠にするよりはマシだがw
13 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:16:27.64 ID:a750v9ov
そもそも現代においても
機能性文盲が25%の国だし
どうせ読めない・読まないからいいニダ
朝鮮の大学は日本国民の税金で建ててやった。
漢字OCRというものがどういう振る舞いをするか知らなかったんだろな。
17 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:17:37.95 ID:pBDCi9t9
問題解決の為の簡単な方法がある。それはしまむー達ホロン部が手伝う事だ
日本には漢字が使える朝鮮人が50万人以上いるんだから、使わない手は無いよw
18 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:18:12.06 ID:wSvMD+di
>国連教育科学文化機関(ユネスコ)の世界記録遺産に登録された『日省録』
間違いの酷さが世界記録遺産に登録されたニダ。
19 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:19:16.90 ID:rP6p9ZFZ
漢字が読めないニダ
ウリは漢字が読めないけど
OCRを使えば簡単に漢字を読み込めるニダ
流石IT大国!
21 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:19:28.39 ID:BBqcH5u2
正確なタイプが99%程度というのは、日本の業者も大体一緒。
普通はこんなもん。ただ、絶対にミスが許されない場合は、再チェックを複数回やるけど。
そういう依頼はしなかったんだろう。
22 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:21:03.34 ID:a750v9ov
>>17 ちょっとまてw
半月禿とかコピペ馬鹿とか
なりすましとか釣りじゃなくて。本気で煽ってるのに
日本語がまともに通じないガチな連中もいるぞw
OCRにぶっこんでノーチェックでフィニッシュです
サーバーに酢と塩を振り掛ければ直りますわよ?
25 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:25:33.62 ID:yGGLx6n6
そんなムリなこといっても
26 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:28:31.11 ID:tmjixtBT
>>1 誤字脱字妄想捏造などの記録的例文として永久に晒されていろ。
このまま遺跡になったら、未来の人は????
どんな解釈するか……
28 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:29:04.29 ID:OmfZV80l
OCRは日帝残滓
29 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:30:21.66 ID:rtCPk+2O
誤字ごととっておくのがお勧めです
漢字の誤字がわかる韓国人もいるんだね。よかったねぇw
その内、ハングルならocr認識率高いニダ゚ 漢字より優秀ニダに3ベリカ
32 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:32:14.80 ID:j3XdB4oE
>市民や外国人が読めなかったり、読みづらかったりする。
いや、自国民が…
33 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:33:05.60 ID:oc8uQXkE
ウリナラファンタジーは世界のお笑いネタ。
学会では芸人扱い。
34 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:33:11.17 ID:Ds2OEVqP
読めないんだからどうでも良いだろうにw
35 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:34:23.52 ID:JIBva+In
縦書きの資料を横書きにするのもよくわからん。
日本から強奪する予定の資料も、正しい内容が知りたきゃ日本で調べろになりそうだな
36 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:36:59.22 ID:Sj87G8Z8
>>21 紙幣の耐久検査を数回やって安全ニダ言う国だし
37 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:37:40.33 ID:a750v9ov
>古記録類をオンライン翻訳
表現の仕方とか、まともに翻訳しても朝鮮語だとややこしいのになりそう
これに意味のわからない古語も加わるとかなあ
オンライン翻訳で済むのかしら?とも思う
日帝がハングル広めるまで文盲率8割近かったんだっけw
39 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:39:02.73 ID:T21Ip2vn
馬鹿見本の遺産だから、あってるだろ。
40 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:39:41.07 ID:qp/P06aI
>>1 字が読めない馬鹿は、素直に撮像してjpgでアップしろよ。w
41 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:44:14.19 ID:6scKvRBC
>『日省録』とは、英祖36年(1760年)から隆煕4年(1910年)までの151年間にわたり、国王の動静や国政諸般の運営事項を日記体で整理した資料。
>全2329冊、22万9900ページ余り、文字数だけでも約3500万字という一大資料だ。従って、ミスの全体像を把握するのは容易ではない。
1760年〜1910年 151年間 資料として、新しい上に、短か!! 3,500万字 少な!!
日本でこの程度の資料なら、重要度もあるけど…
量的に10名以下のチームで、3年掛からずに現代語の意尺が付きそうだけど…
宝暦10年 吉宗が将軍職を、家重へ譲り 大御所として駿府に居た頃?
精度の低いOCRソフトを使い、漢字を知らん奴が更正したか。
そもそも更正が行われたかも疑問だな。
43 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:45:09.93 ID:mm3cbafY
単に朝鮮製の読み取りソフトの誤読だろ。
っつか、正確でもやつら原文読めないから無問題。
44 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:45:28.46 ID:SVRCz1i2
ぶっちゃけ韓国の大学教授より
アメリカの大学教授たちの方が漢字知ってるよ
45 :
はぶちょの上司:2011/06/08(水) 12:46:45.42 ID:rDqmDjOt
原文自体が誤字だらけなんでね?
>>1 >全2329冊、22万9900ページ余り、文字数だけでも約3500万字
えぇと1P辺り158文字?
仮に1行16文字だと10行無いの?
47 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:47:33.91 ID:eixYQM04
朝鮮人が先祖代々バカの動かぬ証拠w(AA略)
48 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:48:10.41 ID:fiyyoPee
古文も漢字表記を止めれば解決!!!!
49 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:48:32.51 ID:wThaZIgO
酷い扱いされてんな…資料にもならんだろうこれ
50 :
はぶちょの上司:2011/06/08(水) 12:49:33.59 ID:rDqmDjOt
馬鹿遺産なら朝鮮が独占なのに
51 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:51:12.46 ID:NbkQqOhV
李泰鎮が名誉教授の大学だからなぁ…
朝鮮日報日本語版にも入力間違いがしょっちゅうある。
>>49ニャーに、朝鮮製の資料ニャんて初めから誰も期待してニャいニャ。
54 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:53:30.19 ID:zhuh4yXo
ハングルで書かれた文章は
日本語で言えばひらがなだけで書かれた文章のようなもの。
ひらがなしかしらない奴が漢字読めるわけ無いだろ。
そういう事。
朝鮮王朝実録と並ぶ韓国の黒歴史書w
× Seoul大学
○ Sole底辺大学
57 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:57:55.38 ID:imkHDBTf
捏造史を誤字混じりで書くのか
ケンチャナヨでいいだろう。
58 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 12:58:18.15 ID:a750v9ov
>国王の動静や国政諸般の運営事項を日記体で整理した資料。
このレベルだと弘前藩庁日記の方が凄そうな気が
犬車民国
ざっくり計算して20万文字以上の誤字があるってことか
胸が熱くなるな
>>58 朝鮮王朝実録とかが面白いのは、中国に事大しまくってたせいで
ある意味記録者が黒歴史を中立的に記述できてたこと。
記録者の身分が事大先から保証されてたんだと思う。
その代わり中国、特に明の悪口はこれっぽっちも書いてないけど。
>>46 毛筆で書いたものだから、そんなもんじゃね?
63 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:01:37.61 ID:X90S54q+
単発文字の間違いと言っているけど本当は意にそぐわない文章を直そうとしたら
そういう漢字を修正しないといけなくなった。じゃないのか
64 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:03:49.77 ID:ehl49NxZ
手書き文字とかはOCRが苦手とする所
65 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:04:02.01 ID:a750v9ov
>>61 そういうのが書かれてるなら価値ある罠w
属国としての歴史だし
66 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:04:46.71 ID:aS2cbiLd
>>61 それって、中立というか祖国をけなしてるだけなのでは?
ロジカルに意味不明の文章になるのは発見しやすいが不成と成を間違えたような場合、
文章自体の意味は逆になる。(故意にやりそうで怖い)
あの国的には史料の方を修正しそうな気がする。
68 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:12:28.80 ID:zhuh4yXo
「超新星」も「超新塾」になるのか?
69 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:13:42.12 ID:OI9dy8tk
朝鮮人が敵視する此処ら辺りのコテにでも頼んだ方が良い仕事するだろうな。
ついでに日本語訳もしてくれるかもしれんぞ。
なんたって、韓国が認めたくない真実も混じってるかもしれんからなw
70 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:13:49.12 ID:RJu8yfxH
文盲だから
>>1 画像ファイルも添付しといて、誰かが気づくたびに直すくらいしかないかねー(・ω・`)
72 :
忍法帖【Lv=8,xxxP】 【東電 80.4 %】 :2011/06/08(水) 13:15:00.87 ID:t1vVk/HD
>>1 つーか、乞食朝鮮人って漢字を馬鹿にしていて全く学習してないから
そもそも、漢字を知らないんじゃん!www 文盲が漢字使うなってこった!
アジ暦といい勝負だなw
74 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:15:06.16 ID:UKyh96kl
日本だと漢文は返り点使って日本語で読み下すけど
ハングルだと古代中国語として読むしかないのかな
75 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:16:57.54 ID:bp9tMSIS
旧字体を変換するならある程度の誤写は仕方ない気が駿河
ありえない間違いっていうかそもそも漢字を理解してないっぽい誤写は恥ずかしいね
てかさ、普通に歴史資料が残ってんじゃんw
なんだよニッテイ…
スペイン語と混ぜちゃえよ
なんか情熱的な言語が生まれそうな予感
79 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:25:32.25 ID:dW6MXotY
漢文を知らないやつが入力してるから
こんな事になるんだろうな。
単に記号として入力w
ひらがなのふっかつのじゅもんもまちがえることがあるからきにするな
自分の名前さえも誤字で公開していた元総理のHPがあってだな…
>>1 世界記録遺産とは、そもそも保存能力がない国の為に有るもの。チョンに正確な資料を保存する能力が無いことが証明されただけ。
こんどは無くした憲法の原本の複製を保存してもらえよ(w。
JPEGはっといた方がましだったんじゃないのかw
ミス多すぎだろ
研究してるやつもっと真面目にやれw
84 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 13:55:13.05 ID:kQ9xvOFT
属国奴隷の歴史なんて、研究者は死にたくならないのか?
85 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 14:05:35.94 ID:60L+t8PW
漢字読めないニダ
韓国ってブチ上げるのは早くても、メンテとか運用予算っていつも考えてないよな。
軍用機を買ってもエンジンの予備部品が買えなくて稼働率落とすとか、
予算が無いから入札でパチモン業者に騙されてニセモノの砲身掴まされるとか、
フェリーで福岡航路開いても接岸料金払えずに踏み倒すとか、
KTXの自動改札のメンテが出来ずに廃止するとか・・・えーと、後何があったっけ?
88 :
忍法帖【Lv=8,xxxP】 【東電 78.8 %】 :2011/06/08(水) 14:55:03.29 ID:t1vVk/HD
>>87 目先のことだけエエかっこしいする、朝鮮人カンも同じメンタリティだぜ!www
89 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 14:55:54.90 ID:a750v9ov
>>87 F1レース場とかもその範疇かと
あとペのレストランも
表向き老朽化で休業してるw
ホントはどうだか知らんけどw
>>87-89 韓国には「外華内貧」という言葉があるらしいなw
連中もいちおう自覚してるみたいだw
91 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 15:08:50.43 ID:muxLBL5/
よく分からんのだが、これって漢字で書かれてるのか?
93 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/08(水) 16:26:42.84 ID:A8tkPx8d
なんだ、日本の旧社会保険庁と同じことやってるんじゃないかw
94 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/09(木) 05:07:35.64 ID:LY1Vb8c5
>>93 > これは、ソウル大学奎章閣のウェブサイトに掲載されている
何を今更w 韓国ソウル大学の研究者が、
旧社保庁のバイト程度って事くらい判ってるでしょw
ソウル大の研究者なら「犬が偉そうに眠ってて困る」って書いても漢字だけ拾って大韓民国って読んでくれそうw
96 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/09(木) 06:35:57.74 ID:gVFrHtjW
こんな状態で、日本から朝鮮図書を奪還したとしても意味ないじゃん。
まさに猫に小判、亀に真珠
98 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/11(土) 18:58:00.44 ID:i9cB10/d
101 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/11(土) 19:21:07.29 ID:RB9ujoaL
間違っててもホルホルできるんならかまわないだろ
102 :
<丶`∀´>(´・ω・`)(`ハ´ )さん:2011/06/11(土) 19:25:42.48 ID:NA5MY8cZ
留学生では韓国人よりアメリカ人の方が漢字が得意だよ
朝鮮王朝実録ってすげえぞw
内ゲバばかりで、国体や国民の安寧&隆盛に殆ど目を向けてないw
きれいごとの政策や民の痛み苦しみが話題になるのは、政敵を倒す為の口上にだけw
これで『国』と称してたんだから、呆れてしまうw
朝鮮人に、市町村以上の規模を運営させるのは無理なんだと、これを読めば理解出来るwww
名前が実話時代っぽいよな<朝鮮王朝実録
105 :
<丶`∀´>(´・ω・`)(`ハ´ )さん: