【調査】日本のブログの4割は「スパム」…ニフティ「BuzzPulse」にフィルタリング技術搭載予定[08/03/26]
1 :
やるっきゃ騎士φ ★:2008/03/26(水) 17:34:27 ID:???
大手プロバイダーのニフティは、日本の全ブログ記事の約4割が、読者にとってはほとんど
意味のない「スパムブログ」だとの調査結果を発表した。アフィリエイト収入や特定の
サイトへの誘導を狙って、自動的に頻繁に更新されるのが特徴だという。
検索エンジン経由でブログにアクセスしてみると、「中身は、他のサイトの記事のパクリ
だけ」「言葉がランダムにつながっていて、文章の意味が通じない」といった経験を
したことはないだろうか。それが、最近増えている「ブログスパム」だ。
機械的に大量に生成して、検索サイトからアクセスを集め、アフィリエイト広告収入や、
他のサイトへの誘導などを狙ったもの。コンテンツとして無意味な上、一般的な利用者に
とっては迷惑になる場合もある。
ニフティは、スパムブログを、その特徴から、他のサイトのコンテンツを自動的に取得する
「引用スパム」、アフィリエイトリンクだけで内容がない「アフィリエイトスパム」などの
七つに分類(詳細は本文最後)。その上で、それぞれの特徴を抽出して、特定のブログが
スパムブログかどうかを自動的に判定するフィルタリング技術を開発した。
この技術を使って、昨年10月から今年2月にかけて、月ごとに日本のブログから
約10万記事をサンプリングして調べたところ、全記事のうち、平均して約40%が
スパムブログであることがわかったという。
同社は、特定のキーワードについて、ブログ上の評判を分析するサービス
「BuzzPulse」を展開している。今後は、このサービスにフィルタリング技術を
搭載していく予定だという。
ニフティによる「スパムブログ」の分類は以下の通り。
【引用スパム】他ブログやニュース記事、検索されやすいワードの検索結果などの引用を
自動的に取得して、記事を生成している。
【アフィリエイトスパム】商品写真とそのアフィリエイトリンクを大量に自動で掲載
しているブログ。内容がほとんどない。
【ワードサラダ】文章をフレーズ単位で機械的に組み合わせて生成しているブログ。
一見、人間が書いているように見えて、良く見ると文章の意味が通じていない。
【自動マルチポスト】同一記事を複数のブログに機械的に大量に投稿する。
【わいせつ記事】わいせつな文章や画像、動画などが掲載されているブログ。
【出会い系】出会い系サイトを運営しているブログや、その入り口となっているブログ。
【ワンクリック詐欺】ワンクリック詐欺を運営しているブログや、ワンクリック詐欺に
誘導するための入り口となっているブログ。
ソースは
http://www.asahi.com/komimi/TKY200803260179.html
でもそれ以外のブログも読者にとってそれ以上に意味の無いチラシの裏d(ry
俺のブログのことか
2chには1%しか云々思い出してはにかんだ
ワードサラダ
これのブログみてみたい
6 :
名刺は切らしておりまして:2008/03/26(水) 17:44:26 ID:he1uaXHO
在日韓国人がよくやっているやつか。って
>>3は在日か
7 :
名刺は切らしておりまして:2008/03/26(水) 17:45:12 ID:M7nIW68Y
ニフティの基準もあてにならない
8 :
名刺は切らしておりまして:2008/03/26(水) 17:47:12 ID:IGVpIDz+
スパムサイト外して検索できるようにGoogleが対応すれば
日本のシェア拡大なんて簡単にできるな
9 :
名刺は切らしておりまして:2008/03/26(水) 17:47:35 ID:WsaoXso3
全部出会い系業者がやってる奴じゃねーか。
わいせつブログだけ検索できる検索エンジン作ったら需要あるかも
2chコピペははいりますか
折角検索してお越しいただいたのに役に立たないチラシの裏でごめんなさい
2chのなかの割合も知りたいな
全書き込みのうち、マルチや嫌韓コピペ、ウィルスコードや宇宙語がどのくらいの割合なのか。
14 :
名刺は切らしておりまして:2008/03/26(水) 17:51:24 ID:aqVlvNsZ
ああヤフーニュースのことか。
15 :
名刺は切らしておりまして:2008/03/26(水) 17:55:17 ID:qiR6xiMp
全世界の9割のブログは読む価値無し
そもそも検索でブログそのものを除外できるオプションつけて欲しい。
結果がブログだらけで欲しい情報になかなかたどり着けない。
楽天アフィのcookie仕込んであるの相当あるよな。
IEで見て右下の情報バーに目のマークが出る奴は
大体なんか仕込んである。
19 :
名刺は切らしておりまして:2008/03/26(水) 18:10:34 ID:EiCHNXp9
>>8 俺はゴミも含めて情報だと思ってるからGoogleはそのままがいい
>>17 Fx使いならCustomizeGoogleでフィルタかけてやればいい。
blog以上に目障りなはてなブックマークとか消せるし。
なにを検索しても”はてな”が引っかかるのがウザい。しかもなんにも書いてない。
22 :
(;`・ω・):2008/03/26(水) 18:36:24 ID:AEeDY82f
____ ____ ______
|____| |____| | .|
 ̄ ̄ ̄ ̄| |
______ ______ / /
|______| |______| / /
 ̄ ̄
+
━ヽニニフ
24 :
名刺は切らしておりまして:2008/03/26(水) 18:41:06 ID:XDUAw9JZ
RSSは当たり前のようにパクられてるな。
26 :
名刺は切らしておりまして:2008/03/26(水) 18:46:04 ID:vt/qwt+O
検索妨害だ
28 :
名刺は切らしておりまして:2008/03/26(水) 20:13:49 ID:67uZKnaE
最近は素材集サーチリンク系のサイトのヒット率がさがってちょっとストレス減ってきた。
あれくらいウザいもんはないよな。根こそぎ排除してほしいくらい。
29 :
名刺は切らしておりまして:2008/03/26(水) 20:23:22 ID:OXkGlbWO
自分のブログの記事のコピーブログが、自分のブログより上位に表示されて悔しい。
googleより先に開発か
googleの中の人ってひょっとするとアホなの?
googleは広告で食べてるので・・・ってことでは?
スパムブロガーはgoogleに広告料払うほど金もってないでしょ?w
34 :
名刺は切らしておりまして:2008/03/26(水) 21:10:36 ID:OXkGlbWO
>>33 こういうのってグーグルにメール送ればいいの?
昔、俺の会社名でググったら俺の会社の公式HPより
俺の会社の公式HPを紹介していた他人のブログが一番上に表示されてた。
で、そのことを俺のブログで書いたらGoogleからアクセスが来て翌日検索順位が入れ替わってたな
提灯ブログで商売しようと目論んでる業界が広告媒体にしようとしてるのが問題だな。
検索に引っかからないようにするのは検索エンジン側の問題でちゃんとやって欲しいね
37 :
名刺は切らしておりまして:2008/03/26(水) 21:44:07 ID:CfrOP9rb
スパムは嫌だがスパムは大好きだ。
ニフティてまだあったんだ
>>10 エログは糞ばっかだから、意外と需要がないと思われ。
エログはyour file hostばっかで困る
【ワードサラダ】の見本というか、例はないかい。
どんな文章が生成されているのか見たい。