「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正
原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と
「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。
原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ
く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ
があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因
という。
誤字があったページ。10日までに修正されている
http://image.itmedia.co.jp/news/articles/1406/10/l_yuo_ocr.jpg 誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
は」などと一部ネットユーザーの間で騒ぎになっていた。
同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ
ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け
たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。
ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な
間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから
なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。
このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料
が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。
http://www.itmedia.co.jp/news/articles/1406/10/news067.html