amezo2000のsock.cgiを使っていますが
1投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時38分58秒
unicodeで書かれたサイトの抜き取りがまったくできません
誰か助けて
2投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時39分30秒
柴田に言えよ
3投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時41分53秒
文字コードの処理ってどの時点で行われてはるの
4投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時46分32秒
全部sjisにもっていきたいんだけど
eucだけはこんな感じで対応してる
これにunicodeも加えたいんです


#EUCならSJISへ変換。
if ($h_data =~ /(euc-jp|EUC-jp|EUC-JP)/){
print "$HEAD{'title'} euc converted<br>\n";
&jcode::convert(\$data2, "sjis","euc");
}else{
print "$HEAD{'title'} is sjis<br>\n";
&jcode::convert(\$data2, "sjis");
}

5投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時49分30秒
だれかわかったら教えてね
全ソース↓
http://mediaserver.hp.infoseek.co.jp/source/up1210.txt
6投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時56分32秒
jcode.plがunicodeに対応してたらできるんでは?
と全然わからないけど適当に答えてみます。
7投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 21時59分25秒
つーか、なぜ日本は文字コードを統一しませんか
8投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時01分22秒
http://euc.jp/i18n/charcode.ja.html#chap6
2バイト文字の国はやっぱいろいろあるんじゃにゃーかな
9投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時15分34秒
全然分からないけど、これ使えばいいんじゃないのか。
http://www.mytools.net/memo/JcodePM.html
10投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時16分54秒
elsif{〜}って言うの入れてやってみて動かなかったということ?>>1
11投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時19分41秒
なるほど、jcode.plはunicodeに対応してないから
>>9みたいに対応してるやつを使わないとだめってわけか
12投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時22分13秒
>>9
ここと同じwebarenaサーバーで使っているのですが
インストールされてないような
>>10
elseif節に何をいれればよいのやら・・・

もう無理っぽい だめぽ
13投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時25分51秒
なければ自分で入れれ。
全然分からないけど。
14投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時29分54秒
>>12
jcode.pmを同じディレクトリに入れて
ちょこちょこと書き換えればいいんじゃないの?
&jcode::convert(\$data2, "sjis","euc");
ってところをjcode.pm用の文に。
それと、elsif{}の中にはif{}の中と同じやつを
euc云々→unicodeに置き換えて書き足せばいいでしょ
たぶん
15投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時30分46秒
あと、
require './jcode.pl';
のところもjcode.pmに書き換えて。だよね?
16投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 22時54分16秒
どう?できそう?
17投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時02分07秒
できないよー
jcode.pmを入れるってのがもう出来ない
どのファイルいれればいいのやら

(デフォで入ってるモジュール)
http://web.arena.ne.jp/suite/support/manual/cgi-cgi/perlmodule/index.html
18投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時04分12秒
jcode.pmってファイルを普通にcgiと同じところに置くだけでは
19投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時06分50秒
perlのバージョンが新しければ
http://openlab.jp/Jcode/index-j.html
で書いてあるように置くだけだと思うんだけど
http://web.arena.ne.jp/suite/support/manual/cgi-cgi/perlmodule/index.html
ほら、古いしさぁ
20投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時09分48秒
ああ、これはダメだ
あきらめろ>>1
21投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時16分41秒
わかんね
22投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時27分00秒
http://www.mytools.net/memo/JcodePM.html

これでなんとか
23投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時30分02秒
これはjcode.pm入れろと
webarenaにごねたほうがよさそうだね
重くなりそうだし
24投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時44分19秒
三河人に相談してみれ
きっと力になってくれる
25投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月29日(金) 23時53分41秒
まあ同じwebarenaだから協力してくれるかも知らんけんども
26投稿者: 投稿日:2005年04月30日(土) 00時01分49秒
やれるだけのことはやった
でもダメだったー
27投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 00時02分39秒
ここで聞いてみ
http://bbs.on.arena.ne.jp/tera/
28投稿者: 投稿日:2005年04月30日(土) 00時06分23秒
スレ立ててきました
神様お願い
29投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 00時07分10秒
なんのスクリプトか書かないと
30投稿者: 投稿日:2005年04月30日(土) 00時14分21秒
書いてきた
31投稿者: 投稿日:2005年04月30日(土) 02時04分33秒
近況報告
http://mediaserver.hp.infoseek.co.jp/source/up1212.txt
動くは動くんだがよぅ変換しよらんのですよ
32投稿者: 投稿日:2005年04月30日(土) 02時39分28秒
このやり方↓で、
なぜeucは出来てunicodeが出来んのか全くわからない
もう寝るぽ

########unicode変換格闘中#########################################################

#EUCならSJISへ変換。
if ($h_data =~ /(euc-jp|EUC-jp|EUC-JP)/){

Jcode::convert(\$data2, "sjis","euc");
print "$HEAD{'title'} euc converted<br>\n";
}


#UNICODEならSJISへ変換。
if ($h_data =~ /(UTF-8)/){

Jcode::convert(\$data2, "sjis","utf8");
print "$HEAD{'title'} UTF-8 converted<br>\n";

}


##################################################################################
33投稿者:24  投稿日:2005年04月30日(土) 09時13分56秒
すまん・・・

4投稿者:三河人  投稿日:2005/04/30(土)03:13:48 返 ???
うーむ、私もやった事が無いので全然解りません。
すみません。
34投稿者:24  投稿日:2005年04月30日(土) 09時25分42秒
よく分からんが参考になりそうなところを見つけてきたよ
http://www.kawa.net/works/jcode/uni-escape.html
http://www.wikiroom.com/sakurai/index.php?DJcode
35投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 09時25分53秒
富士
36投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 09時28分27秒
判定ができてないのか。それとも変換ができていないのか
37投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 09時35分41秒
富士がこんな高度なことをやってるとは思えない
38投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 20時46分08秒
>>32
if{}
elsif{}
else{}
の形で入れなさいよ
39投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 20時46分36秒
富士カメラうざいよ
40投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 20時47分57秒
でも結果は同じだろうけど
41投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 20時48分19秒
>>39
おまえがうざいよ
42投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 20時49分22秒
うるせーかめら
43投稿者: 投稿日:2005年04月30日(土) 22時22分16秒
>>38
その辺は追々改良するとしてさ、
unicodeのサイト(俺様キングダム)のデータ取り込んだ時とか
convertの命令通ってるのは間違いないんだけど
(直後にprint文でメッセージ出すから)
ちっともsjisに変わってないのよ
Jcode.pmがちゃんと機能してないのかなぁ
44投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 23時03分46秒
俺様キングダムって今それどころじゃないだろ
詐欺師が正体暴かれてて笑える
45投稿者: 投稿日:2005年04月30日(土) 23時12分30秒
そうなん?
unicodeにされたせいで全然チェックできへんかったわ

こんな↓エラーログがでてるんだけど
Undefined subroutine &main::Jcode called at sock.cgi line 173.
46投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 23時26分10秒
sock.cgiの173行目って何?
47投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 23時44分28秒
>>45
それは>>32でeuc読ませたときは出るの?
32のやつはeucのテキストは正常に変換できるがunicodeは無理、ってことけ?
48投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年04月30日(土) 23時47分16秒
>>44
詳しく
49投稿者: 投稿日:2005年04月30日(土) 23時49分33秒
いろんな所みて
$data2 = Jcode($data2)->sjis;
こんなコードでいいのかなぁみたいに書いたんだけど
ダメなんじゃよ

http://mediaserver.hp.infoseek.co.jp/source/up1220.txt

>>47
古い書き方でならエラーにはならんのだけど、eucしか変換してくれへん。
今風に書いてみたら今度はエラーになった。
50投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 00時00分29秒
1と状況が共有出来ないので解決は困難と思われる。
51投稿者: 投稿日:2005年05月01日(日) 00時04分12秒
やっぱいかんかねぇ

すませんでした。
52投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 00時05分58秒
ソースとか設置方法とかが今でも公開されてれば俺もやってみるんだが
53投稿者: 投稿日:2005年05月01日(日) 00時13分34秒
うざかったら止めるんで言ってくださいね

Jcodeがちゃんと動いてunicode変換ができるならこれ↓を走らすと「美しい日本語」と表示されるらしいんだが、
エラーは出ないけど変換もなされてないんだよね。困った。

#!/usr/bin/perl
use Jcode;

print "Content-type: text/html; charset=Shift_JIS\n\n";
print "テスト中。";

$utf8 = "\xe7\xbe\x8e\xe3\x81\x97\xe3\x81\x84"
. "&#26085;&#26412;"
. "\xe8\xaa\x9e";


$str = Jcode->new($utf8,utf8)->sjis;


for ($str){
s/(\&\#(\d+)\;)/Jcode->new(pack("n",$2),ucs2)->sjis/eg;
print;
}


exit;
54投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 00時41分29秒
自分の使ってるレンタル鯖で試してみようかと思ったけど
めんどくさくてやる気がしないごめんよ
55投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 00時50分04秒
\って\のことか?
56投稿者: 投稿日:2005年05月01日(日) 01時00分38秒
すまん、文字化けです
これ↓

$utf8 = "\xe7\xbe\x8e\xe3\x81\x97\xe3\x81\x84"
. "&#26085;&#26412;"
. "\xe8\xaa\x9e";
$str = Jcode->new($utf8,utf8)->sjis;
for ($str){
s/(\&\#(\d+)\;)/Jcode->new(pack("n",$2),ucs2)->sjis/eg;
print;
}
57投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 01時03分36秒
自分とこのレンタル鯖でやってみたけど国際エラーばかり出るので嫌になってやめた。
58投稿者: 投稿日:2005年05月01日(日) 01時05分57秒
perlが古い鯖はあきらめた方がいいのかもしれんね
はぁ
59投稿者:57  投稿日:2005年05月01日(日) 01時08分14秒
5.8.4だから古くはないと思うんだけどねぇ、なんかもうさっぱりわけわからんですわ
60投稿者: 投稿日:2005年05月01日(日) 01時10分17秒
5.8以降なら標準モジュールでunicode変換ができるって
どっかに書いてあったよ

俺もその鯖ならこんな苦労はいらないのかもしれぬ
61投稿者: 投稿日:2005年05月01日(日) 19時24分52秒
経過報告
suiteからsuite2に乗り換えてperlのバージョンをあげる事で
unicode問題は解決できるかもしれんのでやってみる。

しりえくぼさんへ
ここもsuite2にした方がいいかもしれません。
鯖空き容量とか計算してくれるみたいですよ
62投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 19時27分00秒
ここはたしかsuite2
63投稿者: 投稿日:2005年05月01日(日) 19時28分34秒
そ、そうやったんか!
64投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月01日(日) 19時34分37秒
http://web.arena.ne.jp/suite2/support/mainte/status.html
ここにamezor.on.arena.ne.jpを入れると使用鯖がちゃんと出てくるからね
65投稿者: 投稿日:2005年05月03日(火) 01時35分59秒
悪戦苦闘の末、
unicodeの抜き取りに成功しました。
http://mediaserver.hp.infoseek.co.jp/source/up1235.txt
(やたら無駄がおおいですが)

これで流行りのブログも読み放題だぜいやっほー
66投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月03日(火) 02時29分02秒
UTF-8をUTF-16に変換して、それをEUCにしてからS-JISにする?

それしかなかったのかよ
67投稿者:ヾ(゚д゚)ノ゛バカー  投稿日:2005年05月03日(火) 02時47分57秒
使い方とか設置方法とか教えれ>>1
投稿者 メール
(゚Д゚) <