新しいアーカイバプラグインを開発するスレ

このエントリーをはてなブックマークに追加
225名無しさん@お腹いっぱい。
だね
226名無しさん@お腹いっぱい。:03/05/20 14:56 ID:m9CzaTQC
期待保守age
227名無しさん@お腹いっぱい。:03/05/21 00:24 ID:vEJ9kHWi
副副(略)委員長のネタだったら面白いんだが。
228名無しさん@お腹いっぱい。:03/05/21 00:30 ID:FCfaB0B1
ラジオなんて放送してる暇が有るならさっさと作っちゃいなさい
229名無しさん@お腹いっぱい。:03/05/21 12:14 ID:WChkNgA4
約束の22日がちかづいてまいりました
230名無しさん@お腹いっぱい。:03/05/21 22:45 ID:EAMt9lgt
さぁ営農ギコ氏今こそ漢を見せるときです。
231名無しさん@お腹いっぱい。:03/05/21 23:51 ID:0XlEpjx7
残り9分
232名無しさん@お腹いっぱい。:03/05/21 23:57 ID:F90vIu3f
あと24時間待ってやる
233名無しさん@お腹いっぱい。:03/05/21 23:59 ID:LdI288pm
ムスカ「時間だ!答えを聞こう!」
234名無しさん@お腹いっぱい。:03/05/22 00:03 ID:1dVHTxf0
(´・ω・`)
235名無しさん@お腹いっぱい。:03/05/22 01:01 ID:nYXbdNi7
営農ギコ「バルス!」
236名無しさん@お腹いっぱい。:03/05/22 01:16 ID:cytL7enM
>>218
そうか?
これが固まってりゃかなり進んだと見れると俺は思うけど。
引継ぎも楽だしなー
237山崎渉:03/05/22 01:45 ID:eoyKEfXZ
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
238名無しさん@お腹いっぱい。:03/05/22 02:07 ID:ywbti2uQ
つか22日に作業再開って言ってるだけで、何を出すって話ではないだろ
なにをそんなにがっついてるんだ?
239名無しさん@お腹いっぱい。:03/05/22 02:14 ID:DUfKZ4+C
いや本人から報告してもらわんと(・∀・)ニヤニヤ
240名無しさん@お腹いっぱい。:03/05/22 09:23 ID:2PehyxkP
22日キター
241名無しさん@お腹いっぱい。:03/05/22 10:13 ID:HAZjzbYe
>>215
進んでるかい?
242名無しさん@お腹いっぱい。:03/05/22 23:25 ID:CAMLzQzC
22日もあと30分なわけだが
243名無しさん@お腹いっぱい。:03/05/22 23:32 ID:yaNhXYOJ
復活してるじゃん。ホーム見て来なって。
244 ◆Ukspgzd3n6 :03/05/22 23:54 ID:2FEjPAG2
はい、ご無沙汰しますた。いままで保守ってくれた方に感謝でつ。
これから約1ヶ月間開発期間がとれるので、できるところまで突っ走ります。

まず5月中にWikiの内容の充実とhikocrtをなんとかすべく。

ちなみに。上旬にWikiの内容がdだ事件ですが、どうやらsf.netの全域で
パーミッション全開とか管理者が居ないファイルが削除されてようで。まったくもぅ。

>>223
SYNさんの意見により、UTF-8でつ。
んでも、UCS-2への変換関数とかも用意できると思います。

>>228
今日は失敗してたんだって。
245名無しさん@お腹いっぱい。:03/05/22 23:56 ID:yaNhXYOJ
sf.jpで再構築してくらさい。.net嫌い。
246名無しさん@お腹いっぱい。:03/05/22 23:57 ID:rCFSqW8S
>>244
期待してます
頑張って下さい
247 ◆Ukspgzd3n6 :03/05/22 23:59 ID:2FEjPAG2
DGCAスレでもお呼びがかかったし(;´Д`)

>>245
その手もあるんだけど、sf.netの方と使い分けるのメンドイ(Unaceの方で経験済)
248名無しさん@お腹いっぱい。:03/05/23 00:07 ID:VKeUwJRj
sf.netってMLとか謎の文字化けするし…
249名無しさん@お腹いっぱい。:03/05/23 11:53 ID:Hqi+cnl0
なんでデメリットばかりのUTF−8を無理に使おうとするのか理解できん。
まーアンチUCS-2で使いたくないってのが本音だろうな。
250名無しさん@お腹いっぱい。:03/05/23 13:18 ID:dtVuIl5D
ところでHPDの仕様決まったの?
251名無しさん@お腹いっぱい。:03/05/23 13:20 ID:8BOmTxXr
   / ̄ ̄ ̄ ̄ ̄ ミ
  /   ,――――-ミ
 /  /  /   \ |
 |  /   ,(・) (・) |
  (6       つ  |
  |      ___  |   / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
  |      /__/ /  <  時間かかるよ!
/|         /\   \_________
252名無しさん@お腹いっぱい。:03/05/23 13:54 ID:aYtvPQRE
>>249
どのあたりがデメリット?
ASCII7bit文字がそのまま使えるメリットは凄く大きいよ。
世界を相手にするならUTF-8がいい。
253名無しさん@お腹いっぱい。:03/05/23 16:02 ID:dHykqGp4
日本語しかねーのに
254名無しさん@お腹いっぱい。:03/05/23 16:44 ID:2KBxrQKm
UTF-8でいいんじゃない?
255名無しさん@お腹いっぱい。:03/05/23 17:29 ID:t9knoEPH
cabとか7zとかまで考えるならUTF-8は必須だろう
XPあたりからUTF16だからWCHARのメリット無いし
256名無しさん@お腹いっぱい。:03/05/23 18:00 ID:F+Gc2TNH
>>255
Unicodeは処理中はUCS-2(UTF-16)、保存時はUTF-8というのが基本では?
257名無しさん@お腹いっぱい。:03/05/23 19:06 ID:t3ZO3cGd
>>256
処理も保存もUTF-8がいいよ。
UTF-16にはUTF-8に対するアドバンテージは一切無い。
サロゲートペアが出てきた時点でUCS2のメリットは死んだ。
258名無しさん@お腹いっぱい。:03/05/23 19:11 ID:Hqi+cnl0
>>252
UTF-8じゃそのまま処理する事は出来ないから変換しなきゃならない。
ASCII7bit文字がそのまま使えるメリットなんて絶対7bit文字しか使わないってところでしか意味無い。
ほかの文字が少しでも使われる可能性があるなら結局その事を考えた仕様にしなければならない。
絶対7bit文字しか使わないってところなんて世界中捜してもあるか?
英語圏だって結構ASCII以外の文字使うこと多いぞ。
259名無しさん@お腹いっぱい。:03/05/23 19:32 ID:t3ZO3cGd
>>258
違う。
UTF-8のメリットは、7bit文字もそれ以外のunicode文字も表現できながら、
7bit文字がそのまま使えるということ。SJISが成功したのと同じなんだよ。これは。
260名無しさん@お腹いっぱい。:03/05/23 20:46 ID:Hqi+cnl0
>>259
だからそのまま使えたとこで意味が無いといってんの。
そりゃ、保存の時は都合が良いかもしれないがそんなの関係ない。
261名無しさん@お腹いっぱい。:03/05/23 20:52 ID:QTb5Bjod
>>259
じゃあSJISでいいじゃん。
262名無しさん@お腹いっぱい。:03/05/23 20:56 ID:t3ZO3cGd
>>260
意味が無いと思っているだけだろ?
既に日本や欧州や米国でUTF-8を使っている奴がたくさんいるのは、
メリットがあることの証明だよ。
そいつらは何らかのメリットがあって使っているのは確実だし、
そういう奴らと仕事するにもUTF-8はメリットがある。
263名無しさん@お腹いっぱい。:03/05/23 20:57 ID:t9knoEPH
>>261
UTF-8採用している書庫形式もあるんだからSJISだと困るでしょ
264名無しさん@お腹いっぱい。:03/05/23 20:58 ID:t3ZO3cGd
>>261
SJISでは表現できる文字が少ないし、全言語の文字を同時表示することを考えると、
unicode系でないと話にならない。
265名無しさん@お腹いっぱい。:03/05/23 20:59 ID:t3ZO3cGd
実際にすべての文字を格納することを考えると、UCS4かUTF8しかない。
266名無しさん@お腹いっぱい。:03/05/23 21:00 ID:t3ZO3cGd
>>265
「将来拡張されても」が抜けていた。念のため。
267名無しさん@お腹いっぱい。:03/05/23 21:08 ID:2KoJ6e/W
結局、どういう話し合いだったのですか?
268grave:03/05/23 21:25 ID:+0HEI1Ag
激安ソフト!!

ご提供するソフトは
 Illustrator10 : Photoshop7 :FLASH MX:Painter6.0j
で一本五千円でご提供します!!

新規インストール版のCDとシリアルナンバーのみお渡しします。
その他箱、説明書等の付属品はありません。登録はできません。
細かいことは気にせず使えれば良いという方、安く手に入れたい
という方や学生さんにお勧めです。

購入を希望される方は

[email protected]

までをメールください。
まっております。
269名無しさん@お腹いっぱい。:03/05/23 22:19 ID:Hqi+cnl0
>>262
だから保存の時と処理の時をいっしょにしないでよ。
で、内部処理でUTF-8を使ってる奴がたくさんいるってのはどこで調べたの?
そんなにたくさん人のソース見て回ったの?
俺も勉強の為に山ほど見てきたがUTF-8使って何か処理するたびにUCS2なりSJISに変換してる奴は見たこと無い。
逆にUCS2なりSJISで処理してUTF-8で書き出すってものなら見かけるが。

処理の時にASCII7bit文字しか使わないことが前提のソフトなんて只のバグ持ちだ。
だからそんなものは意味が無いといってるの。
UTF-8自体が意味のないものだとは言っていない。

あと将来拡張云々言ってるけどそんときゃ今のWiindowsもその他OSも大きな仕様変更されてるし
どの道その時にはプラグインも調整しなくちゃならないだろうよ。
270名無しさん@お腹いっぱい。:03/05/23 22:40 ID:QTb5Bjod
じゃあ文字セットは UCS-4 でエンコードは UTF-8 でいいんじゃないの。
271名無しさん@お腹いっぱい。:03/05/23 22:44 ID:KO4KftfM
なーんか理想ばっかり追っかけて結局何もできなそうだな。
頭でっかちのプログラミングヲタにありがちな結末(w
272名無しさん@お腹いっぱい。:03/05/23 22:52 ID:t9knoEPH
>>271
理想を追わないなら統合アーカイバで十分じゃないか
273名無しさん@お腹いっぱい。:03/05/23 23:00 ID:2KoJ6e/W
>>271
理想を追い求めてスレを消費しているのは、その他の一般人だろ?
274名無しさん@お腹いっぱい。:03/05/23 23:10 ID:PPZ76NBz
>>271
てかここでやり合ってるのは部外者同士だから
275名無しさん@お腹いっぱい。:03/05/23 23:35 ID:1/8TMQaa
理想を追いかけるにはそれ相応の実力が必要。
>>247 にはそれがあるかは微妙なところ。
276名無しさん@お腹いっぱい。:03/05/23 23:38 ID:/wcQ7qKm
動かない実力者より、動く未熟者を応援したいな、俺は。
277名無しさん@お腹いっぱい。:03/05/23 23:58 ID:NWCBMdDF
他人の足を引っ張る事しかできんヘタレがいるな。
278名無しさん@お腹いっぱい。:03/05/24 00:12 ID:dWeEA1oK
鹿毛ながら応援しとります{´・ω・`}ガンバッテ
279名無しさん@お腹いっぱい。:03/05/24 01:00 ID:7mapf4yu
>>269
SJISで処理しているのなんて、世界的に見れば無いに等しい。
分かっている人間のコードや、新規格にはUTF8ベースが多い。javaもUTF8だ。
マルチプラットフォームを考えるなら間違いなくUTF8にアドバンテージがある。
さらに、wchar系のエンコードには根本的な問題がある。
それは、文字列の任意の一部のバイト列を正しく解釈できないという問題。
データの破壊に弱く、ビュアは非常に作りにくいが、これがUTF8なら全く起こらない。
280名無しさん@お腹いっぱい。:03/05/24 01:07 ID:7mapf4yu
まぁ、ここでも読んどけ。
http://homepage1.nifty.com/nomenclator/unicode/ucs_utf.htm

特に、
>UTF-16では,UCS-4のU+110000以降の文字を表現することができません。
とかの問題もな。
281名無しさん@お腹いっぱい。:03/05/24 02:26 ID:6AkmkcBz
UTF-8を使うからには、全てのDLL及び対応アプリはUCS-4のU+110000以降の文字に対応して、
そうじゃないDLLやアプリは(ベータ版とかの限定的な扱いだとしても)絶対に出ないってこと?
282名無しさん@お腹いっぱい。:03/05/24 05:42 ID:9IvuANyn
>>280
UTF-16 じゃない(XPのNTFSとかで扱えない)文字が扱えると、
それはそれで混乱のもとになる気がしなくも無いが。
283名無しさん@お腹いっぱい。:03/05/24 05:43 ID:9IvuANyn
>>279
Java が UTF-8 ってのは何処の事を差して言ってるんだ?
284名無しさん@お腹いっぱい。:03/05/24 05:46 ID:9IvuANyn
まぁ決定権は作る人間にあると思うので UTF-8 でやれば良いと思うけど。
285名無しさん@お腹いっぱい。:03/05/24 08:52 ID:R35wZ5i0
そもそもWin専用じゃないんだからUTF-16を選ぶメリットはまったく無い
286名無しさん@お腹いっぱい。:03/05/24 09:18 ID:NhN6+SI9
>>279
>SJISで処理しているのなんて、世界的に見れば無いに等しい。
相変わらず分かってないなぁ、ここは日本だぞ?
だから例でSJISの名前出しただけであって世界中でSJIS使われてるだなんて事いってる訳じゃないんだが。
韓国行けば韓国の文字コード、中国なら中国、ロシアならロシア、それぞれの文字コード使ってるだろうよ。

>分かっている人間のコードや
誰よ?具体例あげてソースの場所教えてくれ。

>新規格にはUTF8ベースが多い
新規格の言語がどうだろうがこれはCだぞ。関係ない。
WindowsAPIがそのままUTF-8を扱えるのであればそれで良いだろうがそうじゃない。

>それは、文字列の任意の一部のバイト列を正しく解釈できないという問題。
安心しろ、UCS-2のWiindowsも同じ問題を抱えている。
いくらプラグインのほうが対応してようがWindowsの方でこけるだろうよ。
そもそも、UCS-4のU+110000以降の文字なんて今のWindowsで扱えないだろう。
将来、対応した時のため?その時そのプラグインも手を加えなくちゃ使えないだろうっての。
素直にUCS-2使っておいて、変更された時にプラグインのほうも調整すればいい。
287名無しさん@お腹いっぱい。:03/05/24 09:22 ID:NhN6+SI9
>>285
メリットが無かろうが無理に扱いづらいUTF-8を使う必要も無い。
288名無しさん@お腹いっぱい。:03/05/24 09:35 ID:R35wZ5i0
>>287
目標はクロスプラットフォーム(Win32,Linux,MacOS X,etc...) なんだってば
289名無しさん@お腹いっぱい。:03/05/24 09:51 ID:NhN6+SI9
Linux,MacOS X,etc...がUTF-8に対応してるとは知らなかったよ。
290名無しさん@お腹いっぱい。:03/05/24 10:22 ID:i+FKlp++
結局UTF-8とUTF-16ってどっちの方がたくさんの文字表せるの?
291名無しさん@お腹いっぱい。:03/05/24 10:45 ID:R35wZ5i0
>>290
UTF-8
292名無しさん@お腹いっぱい。:03/05/24 10:59 ID:NhN6+SI9
けどども道使えないから一緒
293名無しさん@お腹いっぱい。:03/05/24 11:21 ID:6AkmkcBz
ドモドウ?
294名無しさん@お腹いっぱい。:03/05/24 11:25 ID:R35wZ5i0
>>292
確かに現時点ではFSの方が対応していなかったりするけど
だからといってUTF-16を選ぶ意味は無い
WinNT系で変換がいらないからといってそれが大きなアドバンテージにはなりえない
295名無しさん@お腹いっぱい。:03/05/24 11:34 ID:wTO/EQEA
トモゾウ
296名無しさん@お腹いっぱい。:03/05/24 11:38 ID:wTO/EQEA
>>291
つことはUTF-16はもう使えない?
297名無しさん@お腹いっぱい。:03/05/24 11:42 ID:NhN6+SI9
>>294
だからといってUTF-16を選ぶ意味は無いというなら
同じくUTF-8を選ぶ意味も無い。

何を根拠に大きなアドバンテージにはなりえないといってるのか分からないが
少なくともアドバンテージが存在するということは認めるんですね。
だったらそんなものを使う必要も無い。
298名無しさん@お腹いっぱい。:03/05/24 11:50 ID:NhN6+SI9
サルでも分かる説明。

対応アプリが"C:\ほげほげ.txt"を圧縮しようとする時
UNICODEを定義してプログラムを書いていている場合。

プラグインがUCS2の時
wchar lpszFileName[MAX_PATH];
::lstrcpy(lpszFileName, L"C:\ほげほげ.txt");
hc_add(lpszFileName, option); // 以降プラグイン内部でもlpszFileNameはそのまま使用することが可能。

UTF8の時
wchar lpszFileName[MAX_PATH];
::lstrcpy(lpszFileName, L"C:\ほげほげ.txt");
DWORD dwLen = ::WideCharToMultiByte(CP_UTF8, 0, lpszFileName, -1, NULL, 0, NULL, NULL);
char* lpszU8FileName = malloc(dwLen + 1);
::WideCharToMultiByte(CP_UTF8, 0, lpszFileName, -1,lpszU8FileName, dwLen + 1, NULL, NULL);
hc_add(lpszU8FileName, option); // プラグイン内部でAPIを使う際はwcharに戻す必要がある。
frre(lpszU8FileName);

仮に文字コード変換のマクロを定義しても見た目が多少良くなるだけでやってることに変わりは無い。
さてどちらがスマートか。どちらがバグを生む可能性が低いだろうか。
これはプラグイン作者が書くコードではなく利用者が書くコードだということを忘れずに。
299名無しさん@お腹いっぱい。:03/05/24 11:51 ID:NhN6+SI9
あ、どうでも良い事だが\\としなくちゃならんかったな
300名無しさん@お腹いっぱい。:03/05/24 11:55 ID:R35wZ5i0
WinNT系専用ならそれでもいいんだがね
301名無しさん@お腹いっぱい。:03/05/24 11:58 ID:NhN6+SI9
>>300
だからさ、これはプラグインのコードじゃないって言ってるでしょうが。
302名無しさん@お腹いっぱい。:03/05/24 12:04 ID:R35wZ5i0
>>301
インターフェースの問題なら利用者がラッパでも書けば良いだろ
303名無しさん@お腹いっぱい。:03/05/24 12:09 ID:NhN6+SI9
>>302
インターフェイスとかそんな問題じゃない。
どれだけ利用しやすいかだ。
で、インターフェイスの問題というのが何かわからないが利用者にラッパまで書かせるきですか。
とことん使いにくくなっていくな。
304名無しさん@お腹いっぱい。:03/05/24 12:38 ID:hvoniban
>>289
http://www.apple.co.jp/macosx/technologies/darwin.html
http://www.zdnet.co.jp/help/tips/linux/l0672.html
http://www.olug.gr.jp/~hhide/OIA/19980704/beos.html
http://jp.sun.com/products/software/solaris/fcc/ucc-details1000.html
http://www-online.kek.jp/~keibun/javaprog/unicode.html

>>298
プラグインがUTF-8のとき
 int main( int argc, char* argv[] ) {
  hc_add( "MyArchive", argv[1] );
 }
UCS2のとき
 int main( int argc, char* argv[] ) {
  size_t len1 = strlen(argv[2])+1, len2 = len1*2;
  char* buf = (char*)malloc( len2 ), name=buf;
  iconv( iconv_open("UCS2", "UTF-8"), &argv[1], &len1, &buf, &len2 );
  hc_add( "M\0y\0A\0r\0c\0h\0i\0v\0e\0\0", name );
  free( name );
}
305名無しさん@お腹いっぱい。:03/05/24 13:22 ID:S0iL6/7N
>>304
UTF-8の方の引数にASCII以外の文字列が来た時が考慮されてない。
0点。

あと、VC++限定なら_wmainもあるのだが。