【IT】「東京電力」→「東京電カ」、「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」? 原子力規制庁、サイトを修正

このエントリーをはてなブックマークに追加
120世 ★@転載は禁止
「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正

原子力規制庁がWebサイトで公開している資料の1つで、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と
「口」(くち)になっていると指摘され、同庁が修正する騒ぎがあった。

 原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼ
く)と「口」(くち)になっていたとネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎ
があった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違った文字を認識してしまったことが原因
という。

誤字があったページ。10日までに修正されている
http://image.itmedia.co.jp/news/articles/1406/10/l_yuo_ocr.jpg

 誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキ
ンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について
[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたので
は」などと一部ネットユーザーの間で騒ぎになっていた。

 同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイ
ミングがギリギリだったため、画像PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付け
たという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。

 ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な
間違い(「キ」と「千」のミス、「力」(ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つから
なかったという。同庁の広報担当者は「こちらのミスで申し訳ない」と話している。

 このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料
が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。

http://www.itmedia.co.jp/news/articles/1406/10/news067.html
2名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:21:30.52 ID:cIkOkPg20
暴カニ男
3名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:21:49.07 ID:aVMY+zrV0
姑息すぎるw
4名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:22:11.53 ID:Iy9xk8uW0
放射脳はこれすら陰謀だと騒いでたからな
完全にキチガイ化してる
5名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:22:24.34 ID:NOm6+OiQ0
そんなクソみたいなOCRソフトねーよ
6名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:23:15.04 ID:doBIst210
実は意図的にやりました
スボククチチウム、東京電カ、原子カ
7名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:23:28.18 ID:iArBq7d20
また嘘吐いたのか
これで何回目だよw
8名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:23:31.15 ID:qOdGY6Oy0
テキスト化したものをそのまま貼り付けるだけの簡単なお仕事です。
9名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:23:43.87 ID:cFwjfpxb0
ロト
10名無しさん@0新周年@転載は禁止:2014/06/10(火) 14:23:48.64 ID:ouxqFkXHO
どこのソフト使ったんだよ