ここでやろー
きちゃった(^_^;)
sameがやるのは
1) キーワードリスト(以下エゾリス)を取得する(毎時とか毎分とかの話)
取得先はoff lineで聞こうっと
2) スレ表示(r.so) で
>>1 の時だけリンクに置き換え(多分エゾリスはエンコードするはず)
リンク先は・・・ ここに書いてもいいよ
これで完成かな?
>72
おう(^_^;)すでにファイルは出力始めてる
ファイルの更新は20分に1回。
んで、キーワードリストは
キーワード\tリンク先URL
キーワード\tリンク先URL
キーワード\tリンク先URL
キーワード\tリンク先URL
:
:
ってなってる(^_^;)
キーワードは100〜200くらい入ってくる(^_^;)
18:00にリセットで最初は100前後
最終的に17:40頃200くらいのキーワードが「たまる」はずー
リンク先URL はエンコードされてると嬉しい
そして キーワード\tリンク先URL\t\t\t\t\t\CRLFとか余裕を持って作るのが定石だったり
>76
URLエンコード了解(^_^;)つかそうしてます
\t増やすー
大公開の前に
キャッシュヒット率
wikipediaに問い合わせた実数
がみれる統計ページが必要
PVや転送量などと同様に一箇所からリンクしてさ
80 :
ピロリ(北海道):2008/11/18(火) 15:32:32.06 ID:3S5irBZG0
デザイン、
一目見て、あーやつが作ったんだな、あそこが作ったんだなと解らなければいけない。
speedoと同じgifを同じ場所にいれよう。
>79
まだできてない(^_^;)
>80
了解〜(^_^;)
あと名称を言いやすいのにした(^_^;)
>84
goo
DREAMS COME TRUE
がリンクされない(^_^;)
googleはGoogleとしてなかったのでリンクされないのか・・・・
>85
ラー油
リバーサルミラー
がリンクされてない(^_^;)もしかして、リンクの数に制限があるのかな?
87 :
ピロリ(北海道):2008/11/18(火) 19:09:46.99 ID:3S5irBZG0
できたような気がする
>78
おまたせー(^_^;)できたー
89 :
ピロリ(北海道):2008/11/18(火) 22:08:53.68 ID:3S5irBZG0
はいはい
昨日からここ見てたから <ぼけぺでぃあ
┌┐
んvヘゝ
i ∧∧
ノ (;゚Д゚) <ぼけ
/ (ノ |)
| !
゙:、..,_,.ノ
U U
>>88 au とか newsで不満が出ているようですよ。
>91
ぅぃぅぃ(^_^;)
>93
あ、いや(^_^;)こっちでなんとかします
17:40頃に反映されて直るはずー
95 :
ピロリ(北海道):2008/11/19(水) 18:03:44.25 ID:onlNuOgL0
ASCIIだけははじくとか
ASCIIはいっていたらはじくとか
二バイト文字に変換するとか
>95
・アスキー文字列ははじく
・2バイト文字も1文字だけのははじく
をまず入れます。
これで確定ではなくて、まずそうする(^_^;)
>97
あ、2バイトに変換っていいかも(^_^;)>アスキー文字列
まず>96やって、現状をなんとかする(^_^;)
で、その後に、2バイト変換をゆっくり作る。
99 :
ピロリ(北海道):2008/11/19(水) 18:37:16.11 ID:onlNuOgL0
次に
一番やらなきゃいけないことは・・・
キャッシュヒット率95%達成
まずはwikipediaになかったやつは再度見に行かない
>99
ぅぃぅぃ(^_^;)
>99
で、現状そういうふうに動いてる(^_^;)
項目がなかった場合も、項目がなかったというページをキャッシュして
2度目以降はwikipediaにはアクセスしてない。
りょーかいー
ということは何種類あるの?
1) あった
2) なかった
3) 項目がなかった
の三種類?
詳しく教えて欲しい。
>102
現在のお返事は
1) 項目があった
実際に記事があるかないかは関係なく、wikipediaがデータをくれればこれ。
記事がなかった場合もwikipediaのその項目の記事がなかったよというページをキャッシュする。
2) データが取れなかった
wikipediaがタイムアウトしてしまったなどなど
3) 404
うらぺでぃあのURL表記を間違えた
です(^_^;)
読んだ結果でそれが区別できるようにして欲しい
結果のhtmlのなかに
1) Mirv=debut
2) Mirv=xlarge
3) Mirv=diet
とか埋め込むとか、、
>104
なるほど(^_^;)
<mirv=hutoi>
<mirv=katai>
<mirv=nagai>
と入れよう(^_^;)
<> で囲むと </mirv> も入れなきゃ
<!-- mirv=green --> とかがいいかもよ
>105
<mirv=hutoi> 読み込み成功
と
<mirv=nagai> 404エラー
組み込んだ(^_^;)
<mirv=katai> タイムアウト
はちょっと待ってね。
>107
おー(^_^;)そうする
>107
読み込み成功
<!--mirv=nagai-->
404エラー
<!--mirv=hutoi-->
の二つ入れた(^_^;)
タイムアウトはもうちょい待ってね
>110
間違えた(^_^;)
読み込み成功
<!--mirv=hutoi-->
404エラー
<!--mirv=nagai-->
こうだね(^_^;)
<!-- mirv=hutoi --> のようにスペースを入れよう。
>122
ぅぃぅぃ(^_^;)
読み込み成功
<!-- mirv=hutoi -->
ログ取得失敗
<!-- mirv=katai -->
404エラー
<!-- mirv=nagai -->
入れたー(^_^;)
ども
キャッシュ率が上がらない理由を考えよう
Wikipedia に読みに行った URLをファイルに書き出すんだ、全部
ファイルは 2008111920.txt とかにして
2008年11月19日20時台の意味
>115
できた(^_^;)
はいー
見た感じ、まだまだどんどん新規に読み込んでいるようですなぁ
つまりどんどん利用されている(googleかもだけど、)
グーぐるからだったら G 付けるるとか
MSからだったら B とつけるとか
すると解りやすいかな
>119
んだすな(^_^;)
M- MS Live
G- Google
Y- Yahoo
B- 百度
K- 携帯(ボット以外)
O- その他(ボット以外)
なんてのを頭につけてもらおう(^_^;)
>120
明日朝一で入れてもらう(^_^;)
下のgoogleの検索を押すと・・・
ばけばけ@AU
キャッシュ率のページだけど、
各行のあたまに 1,2,3,4,5 って時があった方がいい
ヤフオクへのリンク
うん やっぱ逆だぜ
>122
まかせろ(^_^;)
>122-126
まかせろ(^_^;)
>120 入れた
>122 直った
>123 入れた
(^_^;)
>125-126
恥ずかしい間違いが発見されて直った(^_^;)
よかた よかた
裏ペディアはiPhone用のタグはいってますかー?
キャッシュ率90%超えてきたな
ここで新しいのを入れると下がるはず
一個だけ入れてみた、そんなに変化ないかな?
>132
入ってますー(^_^;)
ほいほい
んじゃ次はあれだな
mirv=hutoi
Gのクロール キターーーーーー
>135
ぅぃぅぃ(^_^;)もうちょいでできるー
読み込み成功:記事あり
<!-- mirv=hutoi -->
読み込み成功:記事なし
<!-- mirv=hayai -->
ログ取得失敗
<!-- mirv=katai -->
404エラー
<!-- mirv=nagai -->
になった(^_^;)これを元にキーワードを厳選するところを作りはじめた
ほーい
>140
これは・・・・(^_^;)ごちそうだと思う
食うべ 食うべ
>>120 なんだが、
K , O は k , o にして欲しい(小文字にする)
>142
うむ(^_^;)出されたものは残さず食う主義です
了解>k,o
>142
今日中になんかしら動く予感(^_^;)何が動くかはお楽しみな感じで
>138
厳選されるようになった(^_^;)
厳選後全部でいくつくらい?
>146
88個(^_^;)
>142
k,oやった(^_^;)
黙々とごちそうを料理中(^_^;)
まてまて
まだ何もしちゃだめー
まずは構想をねらなきゃ
>148
げろげろ(^_^;)了解
>150
おいらも気になっていろいろ調べ中(^_^;)なんざんしょ・・・・
ほぼ検索wikpediaに載っていないから
数字10桁は<!-- mirv=nagai -->で処理 wikiには行かないようにしてー
どうもISBN番号の予感(^_^;)
>152
ぅぃぅぃ(^_^;)
>156
です(^_^;)
おぅおぅ
ISBN番号リンクは・・・・
a) 直接amazonの検索結果にリンクする
b) 一旦、wikipediaの中のISBN番号リンクページにリンクする
そこにはamazonとかの検索結果へのリンクがあるので、これらを生リンクにする
c) もっとアバンギャルドな何かを考える(^_^;)
>160
a)にしよう(^_^;)
どうもb)にしてもあまりいいことがないと思う。
>>162 ということは、、
wikipediaを見に行く必要がない方法を選んだということかな?
amazon「とか」はamazon以外には何があるのかな?
キーワードに
クロノ
クロノトリガー
と別なキーワードを内包したらどうなるかのテスト(^_^;)
モエ
モエレ沼
(^_^;)
>167
現在クロノトリガーのみキーワードに存在してる
しかし、クロノトリガーがリンクにならない(^_^;)
それはさておき、>168で内包のテスト
あ(^_^;)クロノトリガーリンクされてた
見るとこ間違えてた。
>168
問題は出なかった(^_^;)
>173
あ、そうか(^_^;)そっちも手当しないといけないか
まだそうなってないー
んじゃ はじいて
つまり 10桁数字はwikipedia を呼ばなくする
>174
1 wikiには読みに行かない
2 キャッシュは作らない
3 404ページを表示する
(^_^;)
>177
ぅぃぅぃ(^_^;)了解
・リクエストをはじくのは10桁のみ
・リンクはISBN全部に対応して完璧に
はいはい
|ω・`)・・
>180
いらっしゃぁ〜い(^_^;)
すばらしい
youtube,amazon,ヤフオク,2典へのリンク文字列
現状
[2典] [amazon] [YouTube] [Y!オークション]
になってるのを
キーワード@amazon
キーワード@2典
キーワード@YouTube
キーワード@ヤフオク
っていうふうにしよう(^_^;)
大変よくできました <マァヴ
>185
した(^_^;)
>163
できた(^_^;)
・キーワードリストには追加してない
いつ加えるの?
>189
明日50位くらいまで入れてみる(^_^;)
たぶん、現在のキーワードが90〜100くらいあって
こっちの50位までを追加すると130くらいに増えるはず。
はいー
入れたら教えてー
>192
ぅぃぅぃ(^_^;)
暴発しました
>>193 のように
球団 -> %E7%90%83%E5%9B%A3 のエンコードはどうやってやるの?
当方 Perl です
改造した
>>1 だけしか置き換えない
各キーワード一回だけしか置き換えない
>196
おりょ(^_^;)調べる
>196
キャッシュがないキーワードで連打したときに起こることが判明(^_^;)
これはちと手ごわい
キャッシュディレクトリが存在していて、中身がない時は
「5秒待ってね」とか表示しよっかな・・・・
>199
もうちっと対策を考える(^_^;)
さて>190をやろう(^_^;)
現在のキーワードの数92個
「5秒待ってね」とか表示しよっかな
筋が悪いなぁ
>201
1540時頃にキーワード追加が反映される予定(^_^;)
>202
だよなぁ(^_^;)
>>199 だったらそのままだもいいような
同じキーワードを後から引いたらキャッシュされてんでしょ?
>201
反映された(^_^;)キーワード数は116個になった
>204
おお(^_^;)すげぇ
>206
んだ(^_^;)連打中でも、キャッシュが生成されたらwikiには読みに行かなくなる
さて どうなるか、
「クリックする人が多いとそれはいいことだ」でいいのかな?
さめうら各サーバは 毎分新しいリストを作っている
キーワードファイルは11分,31分,51分に更新するようにした(^_^;)
>213
了解ー(^_^;)
>213
tiger3509が呼び出してる(^_^;)
連打してるリクエスト3つ調べたけど、どれもtiger3509の4連発だった
やっぱ
>>1 以外も置き換えるようにしてみる
同一スレ内では各語一回だけ
>212
ちょっと変更(^_^;)
キーワードの取得元の更新タイミングに合わせて
6,11,16,21,26,31,36,41,46,51,56分に更新にした。
あ(^_^;)>217
毎時1分もやってる
>219
ぅぃぅぃ(^_^;)
質問です
キーワードを入れて検索するページってあるんでしたっけ?
何か検索して下に出てくるんじゃなく
googleのtopページみたいなやつ
>221
ないー(^_^;)
きーわーどリストに 「うらぺ」とかでリンクしたいから作ってー
とってもシンプルでok
URLの途中がwikiに繋がっちゃって
言われてますよ。
>224
ぅぃぅぃ(^_^;)現場に直行
エルモアには怪しい文字列入ってない(^_^;)
内包とかかな?
もうちょい調べる。
いま 1 しか
置き換えやってないよ
>232
ぅぃ(^_^;)
近々 リンク中の置き換えしないようにするけど
その前にバグは除去しよう作戦、
おう(^_^;)
>226
なんか動きが変(^_^;)
auからだと表示できないといわれる
調べる
>238
直った(^_^;)
原因は何かわかる?
何もしていないけど、
>240
見当つかない(^_^;)
>236書いた時点では
(番組ch(NTV)) の「番組」だけがうらぺでぃあへのリンクになってたんだけど
>237書いて確認したら>236,>237とも期待通りに表示された・・・・(^_^;)
なるほど、わかったわかった
今晩か連休中にはなんとかするかー
水曜日にIS-Fに会いに行く
>246
つ〜れてって♪
つ〜れてって♪
IF-S見に行くときつ〜れてって〜♪(^_^;)
>247
あれ?(^_^;)
今は全部問題なし・・・・だ
>247
今は全滅(^_^;)
今晩がんばってなおすぅ
なんで?
毎回 www からコピーすんの?
同期めんどくさそうだが
>253
googleさん好みの構造にしようかと(^_^;)
同期はしない。
三か月に一回とか更新はするかも。
そーか
同期しないなら
みんなに迷惑だからやめたほうがいいと思う
同期するならsameではやって欲しくないぞ
その分他に資源を与えたい。
んだ(^_^;)計測装置も見つけたので、効果のほどもわかるはずー
>256-257
そかー(^_^;)
sameでやらないと意味がないのだな(^_^;)これは
つまりどっちに転んでもやらないほうがよい・・・・と
わかた。やめとくー
>260
>215な感じ(^_^;)
1900時台はまだ続いてた(^_^;)
もっかい確認するー
まだ続いてる(^_^;)
呼び出し元はやっぱtiger3509だわ(^_^;)
3509 というと
h.ula.cc ?
そだな、、
わかったわかった
同じキーワードだとはじくんだけど
wikiにないからリストに登録されていないんだ、、
ゴミリストも作るか、、
媛蹈鞴五十鈴媛命 は
ヒメタタライスズヒメ
おいらが見てた
>269
了解〜(^_^;)
どうやら連打なくなったー(^_^;)
>268
見てたんか(^_^;)ははは
hit数も倍以上になってるねぇ
でも %は上がっている
また変なのがリンクされて崩れたか?
雰囲気 どこかのクローリングのような
8000アクセス中6800アクセスがUAにFOXと入ってます(^_^;)
>>226 はあとで組み込む予定
>>251 が終わってからやるです
「検索」って文字を置き換える?
>279
URLエンコードって意味かな?(^_^;)やってます
あと、半角で%という文字も確か置き換えます。
>280
ですね(^_^;)h.ula.ccからです
ワラタ
3509 は H とかにするとか < ログ
>284
んだね(^_^;)できるかどうかやってみる
たぶんできたと思う(^_^;)
だめだったら書き戻す
急ぎではないけど
おー
しゃて やるか
確かにGとMが拮抗してきた(^_^;)
ああ(^_^;)まずそうなURLを貼ったけどキーワードが変わってご破算
実は先ほど配りました
今のところ苦情はないが・・・
んじゃスレに書いてくる(^_^;)
つーかVistaひどいな(^_^;)また画面壊れた
ああ(^_^;)もう話が進んでた
そういう使い方があったか(^_^;)
なんか全体的にダメになってるな・・・・(^_^;)
直してもらう
土・日・月と日本の市場はしまっているけど、
そ、そか(^_^;)それでか・・・・
同一スレないで何回も置き換えるのをやめた
キーワードのリンク文字を黒にするのはどうだろう?(^_^;)
確かに、文章中に青いリンクがあると、レスが頭に入りにくい。
<a href="
http://hogehoge.com"><font color="#000000">リンク</font></a>
な感じで。
やってみる
黒くした
読みやすくなった(^_^;)
今夜sameの負荷を見て、問題なさげだったら
明日、ブラジルからのキーワードを100位までに増やす(^_^;)
メモ(^_^;)
・うらぺでぃあキーワードランキング
・お掃除というか、バックグラウンドでいろいろ仕事するプログラム
まずは、登録された有効項目数を調べるとかそんな感じのことをやる
ちなみに現状で/homeの使用率1%(^_^;)inodeも1%
がんばれー
流れは
ほぼbugは取れたようだから大至急完成させてしまう。
完成後はさわらない、さわっているうちは完成じゃない。
ということで、
半角文字入れてみる
IMF
どうなるか
>>316 オフィシャルアニメーションガイド銀魂あにめガヤガヤ箱 (ジャンプコミックス)
bizplusとか出るのは出るんだなぁ
>318
ぅぃぅぃ(^_^;)
半角を入れた(^_^;)
>316
それはたぶんISBN番号
なんでまぎれこんだのか調べるー(^_^;)
>318
了解(^_^;)
すばらしー
1ファイルが1MB食うとして、17.5GBくらいになっちゃうか(^_^;)
なんかやり口を考える。
m.2ch.netであふれたのか・・・・(^_^;)
単にファイル容量だけ気にしてもしょうがない・・・・と
一日1ページとかにするかな。
履歴は・・・
祭りの思い出なんかは一ヶ月に一ファイルです
現在のディスク使用状況(^_^;)
Filesystem Size Used Avail Capacity iused ifree %iused Mounted on
/dev/ar0s1f 207G 2.9G 188G 2% 433064 27640918 2% /home
>338
ぅぃぅぃ(^_^;)
「10年間なにもしなくても動き続ける」が目標
これが出来たら終了。
>341
ぅぃ(^_^;)
・お掃除プログラム
・TOP100履歴を一日単位にして、1/24のファイル数にする
・/md使ってDISK I/Oを1/5とかに減らす
これができたら終了の予感。
マァヴへ
壷のtemplate\ThreadHeader.txtのsame.u.laの部分をspeedo.ula.ccに書き換えて
■このスレッドのQRコード■をクリックするとエラーに成るスレッドが有ります
例えばニュー速報+
【ネット】 日弁連、Google「ストリートビュー」のプライバシー問題で緊急集会
http://mamono.2ch.net/test/read.cgi/newsplus/1227592320/ エラーメッセージ
┌───-┐
│ over │
│ 64 │
│ bytes │
└───-┘
サーバの移転等でURLが長く成ったのが原因だと思います
何とかできないでしょうか?
>345
どうよ?(^_^;)
お掃除プログラムできた(^_^;)と思う
実際の削除は90日間呼び出しがなかったキャッシュが消されるので
来年になる予定〜
携帯が留守電になった日(^_^;)とほー
今夜キャッシュのお掃除テストをやる(^_^;)
始動時刻は3:30
終了時刻は5:30
10日以上参照されていないキャッシュデータを順次削除していく。
QRコード
Wikipedia
wikipedia
wiki
ウィキペディア
(^_^;)
お掃除プログラムはうまく動いた
/md化完了(^_^;)
バックアップ完了
以上で10年ほったらかし体制完成!
すばらしい
現在何日キャッシュ?
>353
30日以上過ぎたキャッシュは、次のアクセスで更新されるー(^_^;)
そして、90日以上アクセスのないキャッシュはお掃除対象〜
|ω・`) 静かになってる
356 :
[ ^ω^] モルモットさん(金)(栃木県):2008/12/16(火) 21:06:20.31 ID:BtnUIPww0
植田佳奈
ポルノ
JAL
画像
山梨
花より男子
セックス
mixi
アメトーク
perfume
仮面ライダー
あかね色
流出
東方神起
ドラゴンボール
NARUTO
梨花
とらドラ
完美世界
wii
ラブレター
佐川急便
遠藤
新潟
麻生
コンサドーレ
ショタ
上村愛子
Perfume
ダルビッシュ有
翻訳
植田
クリスマス
メイちゃんの執事
宅建
ディシディア
魔法少女アイ
エロ動画
吉原
朝日杯
とくダネ
ライセンス
さんま
YUI
iphone
安藤美姫
パワプロクンポケット
ラグビー
二宮和也
ワンピース
zip
三国無双
Amazon
やる夫
赤い糸
冬至
機動戦士ガンダム
MSN
share
愛讐のロメラ
視聴率
ガンバ大阪
上田桃子
価格.com
BLEACH
浅田好未
中川翔子
ポケモン
Mr.Children
アイドルマスター
国籍法
ラテール
相棒
yahoo
テイルズ
フィギュアスケート
湯田友美
ドル
NHK紅白歌合戦
和歌山
司法書士
ジャニーズ
どうぶつの森
マリオカート
ニコニコ動画
浅尾美和
ヘタリア
ビルマの竪琴
グランパス
浅田真央
戦場の絆
ドラマ
津田恒美
イチロー
日経
八反安未果
パンチラ
転職
オナニー
セレブと貧乏太郎
アスガルド
ps3
白騎士物語
コブクロ
ウイニングイレブン
コードギアス
キン肉マン
派遣
泰葉
流星のロックマン
流星の絆
ジャンプ
銀魂
777
モンスターハンター
自殺
金津園
大喜利
パンヤ
福袋
ベガルタ
幻想水滸伝
一級建築士
家庭教師ヒットマンREBORN!
ファーディナンド
新都社
年賀状
M-1グランプリ
トヨタ
ダベンポート
札幌
長澤まさみ
バウムクーヘン
ガンダム00
大航海時代
ガンバ
bleach
石原あつ美
アイドリング
山形
谷村奈南
スザンヌ
皇室
女神転生
徳島
2ちゃんねる
上野樹里
遠藤保仁
金城武
浜崎あゆみ
ウェイン・ルーニー
女装
ミュージックステーション
ファミスタオンライン
ロナウド
福井
YouTube
チーム・バチスタの栄光
古閑美保
マキシマムザホルモン
日経平均
炎神戦隊ゴーオンジャー
ガンダム
動画
ドラゴンクエスト
アンパンマン
ポケットモンスター
三国志大戦
マンU
アメトーーク
EXILE
恩田美栄
パンドラサーガ
西武
斎藤隆
fate
楽天
あいのり
naruto
マリノス
秋田
佐藤健
富山
探偵ファイル
pixiv
ガンダム無双
風のガーデン
ハローワーク
井上真央
サッカー
バイオハザード
原油
戸田恵梨香
mr.children
はなまるマーケット
バダ・ハリ
マクロス
キム・ヨナ
郵便番号
吉沢悠
マルサ
遊戯王
ANA
武豊
ナルト
ジョジョ
ファイナルファンタジー
篤姫
マクドナルド
クリスティアーノ・ロナウド
イノセント・ラヴ
神楽坂恵
上地雄輔
Google
福山雅治
アークロード
石川遼
女神
ぐるなび
竜王戦
暴走特急
真央
home
韓国
爆笑レッドカーペット
倒産
ユニクロ
大分
プーペガール
流星
牧場物語
goo
ジャンプフェスタ
ユーロ
シャープ
伊藤英明
重盛さと美
仙台
だんだん
clannad
移籍
武装神姫
ネウロ
トリックスター
東方
着声
彩雲国
スピッツ
大塚愛
ともさかりえ
サエコ
ウォン
西岡剛
スペシャルフォース
マスゴミ
裁判員制度
株式市場
外国為替市場
毎日新聞
朝日新聞
読売新聞
産経新聞
工作員
日本経済新聞
ウィスキー
ウイスキー
アラフォー
ふるさと納税
コナン
Wikipedia
wikipedia
wiki
ウィキペディア
最近
ググれ
ggrks
QRコード
マスゴミ
裁判員制度
株式市場
外国為替市場
工作員
毎日新聞
朝日新聞
読売新聞
産経新聞
日本経済新聞
ウィスキー
ウイスキー
ウィキペディア
ggrks
ググれ
QRコード
Wikipedia
wikipedia
wiki
アラフォー
ふるさと納税
最近
情報処理推進機構
IPA
ipa