そのとおりです読みの順番です
やっぱ膨大な辞書DBでもないと無理ですよね
なんか関数を組み込めるらしいので出来たりしないかなと思ったのですが
>>936 漢字コードの並びはJIS第一水準が音読みで第二水準が部首順じゃなかったかな。
だから読みで並べるのは無理だし、漢字には複数の読み方があるので
期待通りには並ばないな。
素直にフリガナ付けてそっちでソート
ふつうに考えれば音訓複数の読みがある上に複合語では同じ単語でも読みが異なるとか
そのままソートが不可能だと思わないのかな?
940 :
NAME IS NULL:2012/08/10(金) 10:47:54.29 ID:dgVF/wY5
老舗と世論が並んでたらどっちが先にくるのかっていう
>>939 漢字列でソートしてくれなんて要求が有ったら
脊髄反射レベルで断る。
日本向けにカスタマイズされた日本製RDBMSでもあれば
そういう機能も組み込んでるでしょう
まあたぶんないけど
>>940 ?と思ったけど「ろうほ」なんて読み方有るんだな、知らなかった。
944 :
NAME IS NULL:2012/08/10(金) 13:27:16.96 ID:dgVF/wY5
浅草と浅草寺とか
>>942 組み込んでるも何も、原理的に無理という話なんだが。
原理的に無理じゃない
作ろうと思えば作れる
じゃあ
>>240 の分だけでいいから、作ってみなよ。
948 :
NAME IS NULL:2012/08/10(金) 15:44:23.82 ID:dgVF/wY5
藤村俊二と島崎藤村とか
>>946 漢字の1〜n個の全ての組み合わせのソート用辞書を作れば不可能ではないな。
そんなんやるんなら素直にふりがな付けます。
>>949 その組み合わせのどれを選択するつもりなんだよ…。
ネタで言ってるんじゃないなら、まじでプログラマー向いてないと思うぞ。
>>950 漢字の全ての組み合わせに決まっておろうw
組み合わせの結果、存在しない熟語も含めて全てふりがな辞書を作る。
JIS第1と第2で6,355文字あるので10文字の組み合わせだけでも
107437414620186645551479209503916015625通り
計算違うか?w
今のハードでは無理だな
プログラマーに向いているとかの前に日本人じゃないんだろう。漢字を知らないとしか思えない。
>>953 そういうのは普通のアプリ開発でも制限事項とするだろう。
それが許容されるかどうかは
>>933 の顧客(?)の要求仕様次第。
>>954 漢字を知らない連中がユニコード作っちゃったわけだが
>>955 複数の読み方がある熟語は入力禁止とか? (w
これを「制限事項」とか言ってくるベンダーいたら今後取引しないよ。
世論はせろんでもよろんでも意味は同じだが
追従はついしょうとついじゅうで意味が異なる。
困ったなw
>>957 なんでやねん
片方の読みに統一やがな
>>958 『追従』だけでてきたら何かわからんがな
>>952 にあるような天文学的組み合わせが出てきた時点でネタ確定ですがな
おまえら暇なんやのぅ
ORDER BYの話題になってないって話でしょ。
これ任意のソートってできないの?
「任意のソート」とか言う、オレオレ用語をちゃんと定義してくれ。
つまりオレオレ並べ替え。
一行目を二行目と三行目の間に突っ込むとか。
Excel でも使っとけ。
みんな難しい事考えてるのね
× 難しいこと
○ アホなこと
おまえらしょうもないスケージュール管理とかそんなことしかやってないの?
ちょと何言ってるかわかんない
ORDER BY に延々と書けば好きな順番にできるw
夏休みで空気脳が降臨しましたw
日本脳炎ですね
>>974 >>963へのレスだよ。
同じ読みは人間でも区別付かないから無理だろ。
任意の順番なら、 ORDER BY num = 15 DESC, num = 3 DESC , ・・・
とかつなげりゃ好きな順番にできる。
×同じ読み
○漢字の読み
ミスった
>>971 一行目、二行目、三行目を識別するフィールドが無い場合は?
>>963 みたいな奴は、そういうテーブルでも何とかしろとか言うぞ。
Excel はできるからな。(w
識別するフィールドとかそういう専門用語はわからないけど個別にidならふってるよ
カードのシャフルみたいにidとか関係なく何枚目を何枚目の後に移動とかそういう事じゃないの?
だからそう言ってんじゃん
978を読めよ
このスレきもすぎ
983 :
NAME IS NULL:2012/08/13(月) 23:00:13.37 ID:7Zv3PRLA
というか文字列型って単なるbinary string扱いなんだよな
substr() がマルチバイト対応されてないので、五十音索引ページとか作ろうとすると、
アプリ側でもう一度集約処理してあげないといけなくて、うへぇ。。
ふり仮名データみたいなのを一緒に持たせないときびしい
>>983 > substr() がマルチバイト対応されてないので
http://www.sqlite.org/lang_corefunc.html substr(X,Y,Z): If X is a string then characters indices refer to actual UTF-8 characters.
> create table t (name text);
> .separator '\n'
> .import test.txt t1 -- test.txt は、このスレの内容を utf-8 で保存したもの。
> select substr(name, 1, 1), count(*) from t group by substr(name, 1, 1) order by count(*);
...
"お",94
"な",96
"あ",102
"ど",110
s,128
h,130
"こ",136
S,178
9,194
4,222
6,226
5,228
7,228
8,230
2,240
3,248
1,260
"そ",272
>,724
"",1562