1 :
132人目の素数さん :
03/09/04 13:41 R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft) です.簡単なデータ解析から非常に高度・専門的な統計解析まで,さま ざまな解析が出来る優れたソフトです.またRはSやSplusに操作環境な どが良く似ており, Sで動作するものはRでもほとんど(90%以上)変更な しに動作します. スレが無いから立ててみました.
3 :
132人目の素数さん :03/09/04 13:47
3次元プロットって、こんな感じ以外には実現出来ないの? x <- seq(-10, 10, length= 30) y <- x f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r } z <- outer(x, y, f) z[is.na(z)] <- 1 op <- par(bg = "white") persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "blue")
ぶらくーら
SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?
sage
関数 lsfit() で y = X b + e (変数は全て行列)の b を 推定することができますよ.lsfit() の結果を abline() に 渡すことによって回帰直線を描くことも出来ます. > x <- c(64,70,58,66,81,73,75,72,90,53) > y <- c(177,175,162,176,184,170,179,177,188,157) > z <- lsfit(x,y) > plot(x,y) > abline(z,col=2) さらに,lsfit() による回帰の結果 z から, > ls.diag(z) とすることで,以下のような情報が得られます. std.dev : 残差の標準偏差. hat : h_{ii} of the hat matrix H .すなわち行列の対角成分. std.res : 規準化残差. stud.res : スチューデント化残差. cooks : Cook の距離. dfits : DFITS 統計量. correlation : 回帰係数推定量の相関行列. std.err : 回帰係数推定量の標準偏差. cov.scaled : 係数行列の Scaled covariance matrix. cov.unscaled : 定数項に対応する列を含めた計画行列を QR 分解したときの ( t(R).R )^-1 すなわち ( t(x).x )^-1 . cov.unscaled * std.dev^2 で回帰係数推定量の分散共分散行列 を求めることが出来る.
8 :
to:sage :03/09/18 02:52
9 :
132人目の素数さん :03/09/18 03:04
>>8 確か「これはバグじゃない、仕様なんだ」とMSが言い逃れしてたよな(w
レス有難うございます。説明がかなり不足してました。どうも最小自乗平均とlsfitは違うような感じです。
最小自乗平均というのは「線形混合モデル」という、個体内誤差と個体間誤差が存在する場合に行う分散分析モデルでよく登場します。
ホームページとしては
http://www.yukms.com/biostat/download/sem_menu.html に統計セミナーのページがあり、例えば第8回セミナーの20〜27ページに出て来るデータとその解析が割と分かりやすいと思います。
このページではJMPとかいう統計ソフトで解析をしているのですが、この解析をRで再現できないかな、と思って一時期四苦八苦していました。(高いソフトはとても買えない)
> Data1 RBC dose animal week R 1 807 0 1 0 1 2 815 0 1 4 1 3 810 0 1 13 1 4 646 0 2 0 2 5 667 0 2 4 2 6 717 0 2 13 2 7 695 0 3 0 3 8 774 0 3 4 3 9 780 0 3 13 3 10 672 0 4 0 4 11 742 0 4 4 4 12 769 0 4 13 4 13 730 30 9 0 1 14 670 30 9 4 1 15 722 30 9 13 1 16 826 30 10 0 2 17 766 30 10 4 2 18 780 30 10 13 2 19 785 30 11 0 3 20 772 30 11 4 3 21 771 30 11 13 3 22 653 30 12 0 4 23 606 30 12 4 4 24 612 30 12 13 4
表5.1のデータをこんなデータフレームとして作成すると、2元配置分散分析(間違い)は > summary(aov(RBC ~ dose * week, Data1)) で、3元配置分散分析(これも間違い)は > summary(aov(RBC ~ (dose + week + R) ^ 2, Data1)) で、再現できます。そして正しい解析である線形混合モデルは、nlmeライブラリを読んで > library(nlme) > anova(lme(RBC ~ dose * week, random =~ 1 | animal, Data1)) で、ほぼ再現できます(dose に関するpの値がちょっと違うのはよく分かりませんが)。 しかし、図5.2、5.3の再現の仕方がよく分かりません(組み込みのメソッドはない?)。自作したいのですが技量が足りず。たぶんlsfitは線形モデル解析でしか使えないと思います 長文失礼。めんどくさい話なので読み飛ばしてくれて結構です。ともあれRは最重要アプリの1つ。
14 :
132人目の素数さん :03/09/23 15:48
>>14 そうですね。しかし、R(およびS)の標準的な考え方では
summary(aov()) あるいは anova(lm()) で分散分析は
行うのが通常かと。思います。何元配置でも同じような
式を書けば1行でできますんで。
2元配置分散分析(間違い)と3元配置分散分析(これも間違い)というのは、 どういう意味で「間違い」なのでしょうか?小生、間違いに気づかずに 普通にsummary(aov(...))で解析していたのでガクガクブルブルなのですが…。
>>16 ええと... 「この例題のような、1個体から複数データを取った場合では
通常の二元配置分散分析を使ったり、個体番号を第3番目の因子として用
いた三元配置分散分析を使うのは間違い」という意味なのですが..。
上記のホームページのテキストに、「こんな場合に普通の2元や3元使って
んじゃねえよこのヴォケが!」というようなことが書いてあります。
しかし結構むずかしく書いてあるので、もうすこしやさしいホームページ
としては、「ハンバーガーショップで学ぶ楽しい統計学」
http://chiharu.cside4.jp/elearn/stat2002/INDEX.HTM があります。
第7章(2要因被験者間)が普通の2元配置で
summary(aov(y ~ a * b)) または anova(lm(y ~ a * b))
第8章(2要因被験者内)が2因子とも被験者内での比較なので
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/a + person/b))) が正しい
第8章11応用問題(1要因被験者間、1要因被験者内)は
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/b))) が正しい
というふうになると思います。
なので、summary(aov())はError項を正しく指定すれば、被験者内要因があ
っても正しく解析できます。
anova(lm())ではこの解析は不可能で、anova(lme())を用いなくてはならな
いようです。その際にはnlmeライブラリを読み込む必要があります。
18 :
132人目の素数さん :03/10/11 22:37
私は
>>3 ではないですが、皆さんが3次元プロット、3次元の関数や密度を
どのように描いているのかは気になるところです。
>>18 全部読んでないけど
scatterplot3d
ってパッケージ知ってる?
18レスぐらい読めよって感じだけど読む気がしない・・・・
20 :
132人目の素数さん :03/10/12 20:23
3次元プロットって、以下の3つしか知らないのですが…。 image() > x <- y <- seq(-4*pi, 4*pi, len=27) > r <- sqrt(outer(x^2, y^2, "+")) > image(z, axes = FALSE, main = "Math can be beautiful ...", + xlab = expression(cos(r^2) * e^{-r/6})) persp() > x <- seq(-10, 10, length= 30) > y <- x > f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r } > z <- outer(x, y, f) > z[is.na(z)] <- 1 # 関数 persp() はNA を受け付けない > op <- par(bg = "white") > persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "lightblue") contour() > x <- -6:16 > op <- par(mfrow = c(2, 2)) > contour(outer(x, x), method = "edge", vfont = c("sans serif", "plain")) 他にもあるんですかねぇ?GNUPLOTみたいにplot3dがあってもおかしくないような…。
中澤 港:「Rによる統計解析の基礎」ピアソン・エデュケーション, 2003年10月15日初版第1刷,A5判,183pp.,ISBN4-89471-757-3, 1,800円+税
RでGibbs samplingできますか?
26 :
132人目の素数さん :03/10/15 23:36
あと
>>22 さんにも感謝!(書き忘れてました…)
22=24だから気にするな。 なんかやる気が起きんのは仕事に疲れてるからだな・・・ ↑独り言
31 :
132人目の素数さん :03/10/18 17:20
24さん、イイ! library(scatterplot3d) にある scatterplot3d() を利用する。 > data(trees) > scatterplot3d(trees, type = "h", highlight.3d = TRUE, angle = 55, scale.y = 0.7, pch = 16) が最高!
33 :
132人目の素数さん :03/10/20 17:09
34 :
132人目の素数さん :03/10/22 20:18
じゃ、おねがいします。
>>33 作ろうか?
今日中にキタ━━━(゚∀゚)━━━━!!!!!があったら
pdfで書いてもいいけど。
>>35 神キタ━━━━━(゚∀゚)━━━━━!!!!
いや、マジでおながいします。
>>36 んじゃあ、シコシコTeX打ちする。
論文の合間にでも書くんで、ボチボチと待っててくだされ。
38 :
132人目の素数さん :03/10/25 00:18
すみません 最近Rを知りました。ところで、MathematicaとR、どっちが最強でつか?
39 :
132人目の素数さん :03/10/25 00:39
使い慣れているMathematica と、言ってみるテスト
40 :
Mathematica :03/10/26 20:23
Rは微分や積分などの解析計算ができないです・・・。 あくまでRは統計解析用のソフト。ただ、代数系の計算 やデータの処理はMathematica(5と比較しても)なんか 比べ物にならない位、速いです。 まあ比べること自体が無理なような気が・・・。Mathematica じゃヘボい統計計算しかできないし。
Matlabはどうよ? Mapleし込みのシンボリック計算も出来るし、 行列演算もデータのハンドリングもOKだし。
42 :
132人目の素数さん :03/10/27 02:41
>>40 Mathematicaの場合、データをインポートするだけでもえらい時間が掛かるね
精々数百キロ〜1メガ程度のデータなのにえらい時間が掛かるんだけど
Rの場合、ほとんど一瞬だった
なんとかせい、Mathematica!
43 :
132人目の素数さん :03/10/27 18:32
確かにMatlabは行列計算に長けていますが、C(FORTRANも?)などで
計算部分の高速化を図っているのはRも同じです。
>>40 さんの話にもありますが、Rは高度な統計計算、最近(2000〜)
のアルゴリズムも平気で実装されているところに魅力があるわけでして、
統計パッケージの数が半端ではありません。
(逆にバグフィックスのチェックがあまりなされていないことになりますが)
しかも無料ですし!!
ただ、数式処理ソフトではないので数値誤差がでるのは仕方がないですね。
>>40 さんのご指摘どおり、Rは微分や積分などの解析計算が出来ないので
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/23.html みたいなことをしないといけませんし。(↑のプログラムはちと安っぽいですが)
というか、ここのページのPDFを勝手に作って怒られないんですかね?
ま、いいか。Rの精神からいけばオーケーか。
そもそもMatlabっておいくらですの?
45 :
132人目の素数さん :03/10/27 21:05
>> Sで動作するものはRでもほとんど(90%以上)変更な >>しに動作します. すいかません。S知らないんでですけど ぐらいて的にどこがちがうんですか? 長所。短所は? すいません教えてください
46 :
132人目の素数さん :03/10/27 22:12
R習わなくても、Excelで十分じゃん。 といったら、みんなから叩かれそう。。。でも自分の場合は Excelで出来ること以上のことをやろうとしたことないので。 Rのメリットって、Excelにないマニアック(自分から見れば だけど)な統計処理がいっぱい実装されているということ? 皆さんはRにしか出来ない事って、そんなに出くわすのですか?
でくわしまくそ
48 :
132人目の素数さん :03/10/28 20:24
>47 どういうときに?
49 :
132人目の素数さん :03/10/28 20:46
>>43 積分は標準でできますが?
ex)
> f<-function(x){exp(-x^2/2)/sqrt(2*pi)}
> integrate(f,-Inf,Inf)$value
とかやるとちゃんと1って返してくれるよ
混合効果モデル 一般化線形モデル 非線形モデル ブートストラップ が必要な時
51 :
132人目の素数さん :03/10/29 19:27
まあ Excel もいろいろ問題は有るが 取っ掛かりとしては無難だと思うよ。 ん〜。1000点以下のデータ自体の 分析には手軽ではないでしょうか。 そのサンプル集団から母集団の推定等を 本格的にする頃には専用ソフトの方を 使えるレベルになっているでしょう。
Excelだめじゃんという煽りはしたくないのだが、
青木先生のページと、そこのリンク先も見てみてください。
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html 以下、私の考えです。
ただ計算するだけなら、まあいいと思うのですが、
1. 多変量解析にはVBAで書いたアドインソフトが沢山ありますが、
たとえ関数にバグがなくても、数値計算には誤差の集積を避けるために
いろいろノウハウがあり、数式のまんまVBAでつくってあるソフトはどうかな?
と思います。
2.最大の問題は、Excelの関数はどういう計算方法か、明らかにしてないところです。
たとえば、Mathematicaだったら、どういう計算方法か問い合わせすると、
この論文のこのアルゴリズムで、誰がC(など)で書いて発表したものを
使っていると返事がちゃんときます。
Rの場合、それはすっかり公表済みであることが大半です。
なにか分析して、論文に書いて印刷されて、後になって
スマソ、Excelのバグのせいでうそだった。
実は有意差ありませんでした なんて
大変なことになるのは避けたい。
ずいぶん前のことですが、Pentiumのバグのせいで、
いろんな方面で自分の論文の計算結果は大丈夫だったか??
ってちょっとしたパニックが起きました。
55 :
132人目の素数さん :03/10/30 21:12
漏れExcel派なんですが、 そりゃみなさんの言うように、非線形なモデルやブートストラップはできないけど、 そして大量のデータを食わせることもできないけど、でも殆どの場合(統計の入門書 に出てくる程度)はExcelでなんとかなるし、そして現実に直面する問題も統計の 入門書に出てくる程度が殆どじゃないですか? Excelで出来ない事はMathematicaでやるか、プログラムをガリガリ書いていたし。 何が便利かって、データを編集するのも、グラフ書くのも、色を変えたりするのも、 めちゃめちゃ簡単で分かりやすいじゃない。コマンドとか覚えなくても いいじゃないですか。そういう“お手軽さ”が統計ソフトにはないから。 別にMSのまわし者ではないけどね。
要するに現実に直面する問題によるってこと。 漏れの場合入門書にちょうど出て来ない程度の問題が、仕事上は多いな。
58 :
132人目の素数さん :03/10/30 23:38
59 :
132人目の素数さん :03/10/31 02:08
内部で何をやっているか気にならない人はEXCEL、
内部で何をやっているか気になる人はRなのでは?
>>54 さんのリンクにもありますが、ええ加減な計算をしといて、
それを仕様だと言い張るMSの内部仕様は信用できませんけど、ええ加減な
計算でも不具合が起こらない程度の計算しかしないのならEXCELで良いでしょう。
ところでRで積分できるんだったら微分は出来ます?
>なにか分析して、論文に書いて印刷されて、後になって >スマソ、Excelのバグのせいでうそだった。 >実は有意差ありませんでした なんて >大変なことになるのは避けたい。 EXCELで計算した時点でrejectされそう・・・。
回帰分析でR^2が負になるらしいね.2乗した値が負て...
62 :
132人目の素数さん :03/10/31 03:41
>>60 Excelで出力したグラフが張り込まれてる論文って結構見るけど?
縄田和満 「Excelによる線形代数」(朝倉) という名著を読めばそんな偏見もふっ飛ぶさ. 最近はExcelで流体力学まで学べるのですよ. Excelマンセー
>>63 だから「線形」じゃない計算はExcelじゃ難しいんだってばさ。
線形代数ならLispとかpythonもいいかもよ?
ExcelとRの比較って意味小さいよ。市場がちがうんだから。
漏れとしてはSASやJMP使ってる人の、Rとの比較が聞きたい
65 :
132人目の素数さん :03/10/31 15:24
>>64 65535個以上の行データが扱えないExcelなんてRから見ればおもちゃだなw
>>64 JMP良く使ってます。
この外れ値どれだ?みたいな探索的データ分析は得意ですね。
それから、変数の数がサンプル数よりも多いような
困ったケースでも、とにかく主成分分析できる。
もちろん、統計学的にはまずいのだが、
現実には、それでもとにかく主成分分析を
やって、代表的な変数に絞り込みをしたいときはある。
こういうケースは、普通につくってあるソフトだと、
逆行列が計算できなくて(と思う)、固有ベクトルが求められない。
SPSSはだめ。私がやってみたところ、Mathematicaではでます。
Rのprincompだと、計算をそもそもしません。
まあ、そんなんやらないというのが正しいのではあるが。
使い分けですか?
急ぐ分析レポート類で、定番の手法で分析するだけのときはJMP,
定番の手法でも、やっぱりJMPみたいなパッケージだとフレキシビリティ
たりないね。
自分の研究であれこれやってみるとき、また言うまでもないが
最新の手法を使ってみるときにはRですな。
68 :
132人目の素数さん :03/11/01 11:15
>>66 私もJMPを愛用してます。
あとは因子分析さえ付けてくれれば文句無いんですが。
JMPいいなあ。 漏れは検定しかしないんだけど、JMPだと推定/逆推定で Rじゃ出来ないことができるらしい。 Rだと逆推定は一般化線形モデルのbinomialでdose.p()がある ぐらいで、それ以上のモデルだとbootstrap使わないと信頼区 間がだせん。 しかし、変数がサンプル数より多いような場合の主成分分析て どうゆう計算方法でやってるのか、説明書に書いてあるの?
>>70 線形混合モデルの逆推定とその信頼区間が出せるパッケージってある?
あったらすげーうれしいけど..。nlme内にはないとおもうが。
やっぱりCIのある逆推定はdose.pだけじゃないかなあ たのむよ〜
74 :
132人目の素数さん :03/11/04 20:21
>>70 自分で探せってこと?英語で検索かけるのは面倒だが…。
75 :
132人目の素数さん :03/11/05 02:07
あのー微分できる言語ってなんでしょうか? ヘスケルでつか
>>60 EXCELで計算した時点でrejectされそう・・・。
>>62 Excelで出力したグラフが張り込まれてる論文って結構見るけど?
グラフじゃなくて関数使って計算させたらってことだろ?
といっても医学薬学関係の論文ならRでも(SASでやらないと)rejectされるだろうが.
まあSASとRを比較するのが間違いだが,強いて言えばSASは古すぎる.
古いがゆえに信頼性は高い(と思われている)が,計算するのに命令書きすぎ.
その点Rはプログラム作成も関数定義もその他諸々楽.それにタダだし.
欠点は上にもあるが,最新のアルゴリズムが搭載されているがゆえバグ多し.
Excel??内部で何やってるか分からない上にバグだらけな関数を使うほど
俺は自信家じゃない.SUMやソート,グラフを描く程度しか使わないのなら
EXCELで十分.セル形式ならRにも(貧相なのが...)あるし。
x <- read.table("sample.dat")
data.entry(x)
ところでJMPってSASを作ってる会社が出してるんだよね?
JMPってどうなの?使いやすいの?俺的には「使いやすくなったSAS」って
いうイメージがあるんだが.
>>71 >>72 自分で探せってことだろ?各々専門分野が違うんだし,
>>70 が紹介している
nにはちゃんとpdfでリファレンスがついてるじゃん.
>>75 Mathematica,Maple,Mupad,Maxima...
あとRの関数D()かな?俺は使ったことないから「使える」かどうかは知らないけど.
77 :
132人目の素数さん :03/11/07 02:33
へぇ〜
78 :
132人目の素数さん :03/11/07 20:51
JMPの宣伝に必死だなw
やっぱり2元配置分散分析の計算方法がわからないです(泣) 63 48 44 76 82 54 62 56 58 74 57 57 47 70 75 のデータの分散分析表の作り方を教えていただけないでしょうかm(__)m anova(lm())の使い方がよく分からないものですから…
80 :
132人目の素数さん :03/11/14 20:51
ありがとうございました!! 青木先生は偉大です(><) ちなみにanova(lm())を使って求めるやり方はどういう風に行えばいいのでしょうか???
82 :
132人目の素数さん :03/11/15 09:24
83 :
132人目の素数さん :03/11/15 19:43
85 :
132人目の素数さん :03/11/15 19:57
なるほど。。うーん… lmは線形モデルによる回帰を行うのですよね? それでanovaは与えられた数値から分散分析表を求めるもの(?)でいいですよね? 目的変数と説明変数とわかっていればlm(目的変数~説明変数)で回帰係数が出せるのですが 63 48 44 76 82 54 62 56 58 74 57 57 47 70 75 のように目的変数がわからない(?)場合はlm(y~x)のyの部分はどうすればよいのでしょうか?? 本当にど素人ですいません…。
87 :
132人目の素数さん :03/11/17 17:02
88 :
132人目の素数さん :03/11/17 17:50
89 :
132人目の素数さん :03/11/17 17:59
「absolute error」 ってなんじゃらほい?
91 :
132人目の素数さん :03/11/18 02:18
>>87 微分もできるよ
ex)
> D(expression(sin(x)),"x")
cos(x)
92 :
132人目の素数さん :03/11/18 22:13
>>91 すげぇ!へぇへぇへぇへぇへぇへぇへぇ・・・
93 :
132人目の素数さん :03/11/18 22:53
>>92 もうMathematicaは、い・ら・な・い!!
確かにすごいすねー。かなりつかえますねー。 >88 のページはまだ頑張って読んで勉強してまス(汗
> D(expression(log(x)),"x") 1/x > D(expression(3*x^5),"x") 3 * (5 * x^4) へぇ。ただ、これ以上の具体的な使い方がワカラン。
あまり数式処理能力に期待なさると失望しますよ. RはMathematicaではありません (MapleでもMatlabでもありません). Rの本質とは関連が薄いのですから,「そんなのもあるんだ」程度に捉えておいた方が.
+じゃない「元祖」ニュー即から久方ぶりに専門板にきてみたら、間違えて
数学板をクリックしちまった。速攻タブ消そうかと思ったが、なんとなく
スレタイトル眺めてたら偶然このスレ発見。
こんなスレあったんだ。Rのグラフィックス表示で悩んでいたけど
このスレで紹介されてる
ttp://www.okada.jp.org/RWiki/ の参考実例集すっげーいいじゃん。こういう実例がほしかったの。
いやー今日はいい日だ。おまいらありがとう。
勉強してまたくるよ。ヽ( ・∀・)ノ●ウンコー
100 :
132人目の素数さん :03/11/20 19:34
金持ちはS-PLUSを買え。
>>96 >>97 データを入れたら自動的に解析結果を出力するような関数を作成してるときに、
たまに密度を微分したり、自分で作った密度を積分してp値を出したいときに使えません?
数値積分はまだしも、数値微分は凄まじく誤差が出ますから重宝しますよ。
>>99 仰るとおり、こんなページが出来たのならRの将来は明るいですよぉ〜!
http://www.okada.jp.org/RWiki/ >>100 勘弁してください、20万も払えないっすよ…。パッケージも普通に数万〜数十万しますし…。
102 :
132人目の素数さん :03/11/20 20:30
というか、獣医ってもっとも統計から縁遠いんだよね。 5群10群あろうが明らかにノンパラであろうが、すべてstudentTだし 漏れ、最初にこのソフトさわったとき、なんだ?このdosみたいな画面はと 思った。恐る恐る>=2*4とかって入力したら、エラーでやがんの。 もうびびったね。正直。ウンコちびりそうになった。で思わず、ベーシックおもいだして >print"うんこ”って入力したね。そしたら、得体の知れない文字と挙句にエラー 涙がでそうになったね。本当にこれつかえるのか?借金して素直にSPSS買おうかと
104 :
悩める獣医 :03/11/21 01:27
で、ようやくマニュアルよんだのね。日本語のpdf。でもちんぷんかんぷんなの。
ああわからない。どうしようとおもったさ。で、
>>95 のところみながら学んだのさ。
まだぜーんぜんだけど、なんとかなりそうには思えてきた。
で、な、最近texをやろうと思うのさ。獣医ってtexなんて論外の世界なんだけど
ね。これがまたわかんないわけさ。もうたすけてぇーって感じ。
まぁこんな感じだ。ヽ( ・∀・)ノ●ウンコー
というか、ここではhttpのhは抜かなくてもいいのか・・・・?
105 :
132人目の素数さん :03/11/21 01:28
106 :
悩める獣医 :03/11/21 01:38
>>105 いやーほめられちゃったよ。まいったな。
お礼にウンコやる
つ●
もうね、すごいんだよ。この業界。きっとみんなが聞いたら発狂するよ。
漏れはいやなの。ちゃんとしたいの。数式にあこがれてるの。
ちゃんと、正規検定とか、多群の比率を検定したいの。
と・・いうか・・・ひょっとして・・・カナーリ場違いなのか?漏れは・・・
イヤーン
おれは、S言語の本を一冊買った。緑色の表紙のやつ。 ツカミ程度の情報しか得られなかったけど、血肉にはなっていると思う。 やっぱ、最初はネットで情報漁るより、本一冊買うほうがためになるよ。 ある程度分かってきたら、ネットだけで勉強できるけどね。
108 :
('A`) R. ◆AInRnjuvGo :03/11/21 01:48
109 :
悩める獣医 :03/11/21 02:01
というか、各統計専門のBBSは怖すぎて質問できねぇから
ちょっと質問していい?
可能な限り、自分で勉強はするからさ。回りはだーれもRなんて
つかってないのよ。マジで。
>>108 一応、
>>95 の教程はおわったつもりだけど、読んだほうがいいかな?
ある程度なら、何も見ずに計算できまつ。
ああベクトルはつかわなさそうなので飛ばしたんですけど・・・
というか、注文しちゃった。金ねぇのになぁ・・・
110 :
132人目の素数さん :03/11/21 02:13
>>106 ってかおまい自体検定してもらったほうがいいかもなw
111 :
132人目の素数さん :03/11/21 02:15
>>109 ってかRもSも本質的な同じなのだが・・・w
112 :
悩める獣医 :03/11/21 02:16
113 :
132人目の素数さん :03/11/21 02:18
しかし、Rの書籍が出てからなんか急にRの認知度が高まった気がするんだけど、気のせい?
114 :
悩める獣医 :03/11/21 02:26
115 :
132人目の素数さん :03/11/21 02:35
117 :
132人目の素数さん :03/11/21 02:40
わしはslashdotは見てないんだが書店はちょくちょく行ってる 書店で初めてRを知った人も多いと思うが、どうか?
118 :
悩める獣医 :03/11/21 02:46
>>115 げ・・・ありがとう。早速キャンセルします。
なんか、こんな夜中にありがとうね。
がんばるわ
ヽ( ・∀・)ノ●ウンコー
119 :
132人目の素数さん :03/11/21 02:54
ウンチイラネw
>>117 そのような人も,多いと思います.
何にせよ,ユーザーが増えるのはいいことだと思います.
ところでみなさん、利用してるOSはWin?Linux?
>>121 MacOS X...
edit()がきれいでよいです。
123 :
132人目の素数さん :03/11/21 22:28
Linux版Rは面構えがWin版とは違うのですね。 クノーピクス上ではじめて知りました。
124 :
132人目の素数さん :03/11/21 22:29
Linux版Rは面構えがWin版とは違うのですね。 クノーピクス上ではじめて知りました。
125 :
132人目の素数さん :03/11/21 23:31
SASって個人で使えねーの?
>>125 Webでは値段表とかでてませんが、1-2年前にどっかでみたときには,
まぁ普通の個人で手が出せるお値段ではなかったと思うです。
しかもたしか年間使用契約で買い取りはできなかったような。
SPSSとかS-PLUSのおねだんならなんとかなるかもしれませんが...SASを大学とかで
勉強しても就職先で実際に使用できなくて泣く人も多いかもね。
127 :
132人目の素数さん :03/11/22 09:27
パッケージを増やすたびに値段が違うらしい 確か基本的なパッケージだけで年間契約15万円以上したかな それだけで四則演算はできたはず
SASを個人使用したい奴なんかいるのか? あんな糞ツール大規模データマネジメントしか使いようないべ。
129 :
132人目の素数さん :03/11/22 19:58
>>128 同等なことがRで十分できるんだからS系を使うメリットはほとんどないと思われ
130 :
132人目の素数さん :03/11/22 21:42
131 :
132人目の素数さん :03/11/23 01:47
SASをMXで流せ
132 :
132人目の素数さん :03/11/25 00:30
age
論文を書く上で、審査員に解析したプログラムのソフト名を聞かれないんだったら SASは要らないと思われ。パッケージの信頼性以外、使うメリット梨。SASはコマンド入力が面倒すぎ! ようやくS-PLUSのパッケージ群も信頼性が出だしたが、いかんせん値段が…。けどS-PLUSが認知されだしたら 「学校や会社ではS-PLUS、家ではR」 ということが出来るメリットはあるかな。
134 :
132人目の素数さん :03/11/26 02:13
135 :
132人目の素数さん :03/11/27 06:33
136 :
132人目の素数さん :03/11/27 20:46
>>136 suになってから,
# R CMD INSTALL hoge/hogehoge.tar.gz
まずは,man R CMD してみましょう。
>>137 >まずは,man R CMD してみましょう。
R CMD INSTALL --help
の誤りでした。
139 :
136 <- 厨 :03/11/28 20:54
すいません、OS書くのを忘れてました…。Win環境でRやってます。 UNIX or Linux ではないので、man が使えないんです…。
RjpWikiに行ってみたら?
Win版で Alt+p のサブメニューで解決できないのなら、 どのような状態にあるのでしょうか?
142 :
132人目の素数さん :03/11/29 01:10
>>139 Windowsならupdateは超簡単だよ
RGuiのメニューで[Packages]から[update packages from CRAN]を選択すれば
自動的にアップデートされます。
base以外のパッケージを入れたい場合は同じ[Packages]から[Install package(s) from CRAN]
か[Install package(s) from zip files...]を選べばOKです。
143 :
132人目の素数さん :03/11/29 21:55
描画がずっと速やなったやん。 1.8.1>1.7.1
145 :
132人目の素数さん :03/11/30 15:56
すみません、質問です。 グラフを描く際、凡例中の数式に変数値を割り当てるにはどうすれば良いのでしょうか? 例えば frame();legend(0,1,expression(frac(a,b),frac(c,d)),lty=c(1,1),y.intersp=2) のように入力すると分数表示でa/bとc/dが縦に並んで表示されますが、このaなどの文字を 変数値で置き換えて表示させたいのですがどうやれば良いのでしょうか? よろしくお願いいたします。
>>145 自分で新に関数を定義すればできると思います。
以下は直接の解ではないけど参考になれば。
myplot <- function(x){
xx <- length(x)
plot(x,main=c("number of samples:",xx))
}
y <- rnorm(100)
myplot(y)
>>145 146のつづき。
a,bに何を代入したいかにより,xx <- length の部分を書き改めましょう。
aがベクトルの合計値なら a <- sum(x)とかね。
ここからのポイントは,プロットしたいデータオブジェクトがどんなものなの
か,そのデータのどういう要素を用いて,a,b,c,dを定義したいのかどうか,
ということになりますね。
148 :
132人目の素数さん :03/11/30 23:19
>>146-147 回答ありがとうございます。実はその方法だと凡例の中での数式に値を与えることは
できません。expression内でfracという分数を表現する数式が利用できるわけですが
そのときaやbは文字として認識されてしまうので、いくらexpressionの部分を関数で
定義しても結局expressionを使う限りにおいてはaやbの部分を数値に置き換えることは
できません。expression以外でfracのような数式表現が利用できて変数値も数式中に
利用できるような例があれば嬉しいのですが・・・
>>148 146です。
よく知りもせず口を挟みましたが,挟みついでに。
frac()の正体はなんでしょう?Rの関数ではないようですが。
>>147 MASSパッケージのfractions関数は使えそうでしょうか?
>>147 frac()が曲者なんで,正統な方法ではないと思われるが,下のような代入を応
用してはどうか?
> ex1 <- expression(frac(x,y))
> ex1
expression(frac(x, y))
> ex1[[1]]
frac(x, y)
> ex1[[1]][[2]]
x
> a <- 1
> b <- 2
> ex1[[1]][[2]] <- a #代入
> ex1[[1]][[3]] <- b #代入
> ex1
expression(frac(1, 2))
frac()の話途中ですいませんが…、例えばscatterplot3dパッケージを 取ってきた際に、まず .tar.gz -> zip と圧縮形式を変えてから、Rのメニューから Package -> Install from local .zip ... を選択すると > install.packages(choose.files('',filters=Filters[c('zip','All'),]), .libPaths()[1], CRAN = NULL) updating HTML package descriptions と出るので一見、上手くいったのかなと思いきや、 > local({pkg <- select.list(sort(.packages(all.available = TRUE))) + if(nchar(pkg)) library(pkg, character.only=TRUE)}) Error in testRversion(descfields) : This package has not been installed properly See the Note in ?library というエラーが出てしまいます。仕方がないので scatterplot3d.R を 直接読み込んでいる有様なのですが、よい善処法があればお教え願います。
154 :
132人目の素数さん :03/12/02 06:49
>>152 > .tar.gz -> zip
>
> と圧縮形式を変えてから、Rのメニューから
ってかこれ自体おかしいだろ
Rのメニュー[Package]から[Install Package(s) from CRAN...]を選択するのが
一番楽だと思うぞ。CRANにある好きなパッケージが一覧から選択して簡単にダウンロード
&インストールしてくれるわけだから。
155 :
132人目の素数さん :03/12/02 06:54
>>154 (続き)
一度インストールしたパッケージは次回からRのメニュー[Packages]から
[Load package...]を選択すれば一覧の中に表示されているのでそれを
選択して取り込むことができます。
156 :
悩める獣医 :03/12/02 11:43
だいぶパワーアップしてきた
157 :
132人目の素数さん :03/12/03 11:14
>>149 epressionの中だけで利用できる数式表現で分数を表します。
>>145 自己解決しました。substituteを使えばできます。例えば、
expr<-substitute(paste(frac(a,b),sum(frac(c,k),k==1,n)),list(a=1,b=2,c=3,n=100))
として
frame();legend(0,1,expr,bty="n")
とかするとaやnが数値に置き換わった数式が表示できます。
158 :
132人目の素数さん :03/12/03 12:57
159 :
132人目の素数さん :03/12/03 21:29
>>153-155 解決しました!
>>153 さんのファイルをDLしたら、普通にインストールできました。
***.tar.gz はwinでは使えないんですね。
age
161 :
132人目の素数さん :03/12/09 10:50
時系列に対して変量回帰を当てはめた場合の分散分析は summary(aov(a ~ b + c + poly(d,3)))でいいんでしょうか? (a:評価値、b,c:母数効果、d:時系列)
162 :
132人目の素数さん :03/12/14 05:44
14
163 :
132人目の素数さん :03/12/16 22:56
plot関数で プロットの点(type='p')の大きさを変えることはできますか? デフォルトでは大きすぎます。
>163 plot(....,pch=数字)ではいかがですか?
165 :
132人目の素数さん :03/12/19 14:30
任意小数に小数点以下何位まで含まれているか(精度)が知りたいです。 例えば12.2なら指数表記では122e-1だから1位。12.20は1220e-2なので2位。 文字列に変換して小数点「.」の右側の文字数をカウントするのはおもしろくないので、 そのまま使える関数とかはありませんか?
167 :
132人目の素数さん :03/12/21 20:37
Rで関数定義を行う際に、局所変数や局所的な配列が使いたいときってどうすればよいのでしょうか?
168 :
132人目の素数さん :03/12/22 23:52
これって擬似逆行列とかって 求められますかね? どうも因子分析できなくて
169 :
132人目の素数さん :03/12/24 21:55
170 :
132人目の素数さん :03/12/28 21:34
>>167 そんなことは気にしなくてよいはずです。
171 :
132人目の素数さん :03/12/31 21:46
帰無仮説:ボブサップが曙に負ける 対立仮説:ボブサップが曙に負けない を有意水準5%で検定したいのですが、どうすればよいでしょうか?
172 :
132人目の素数さん :03/12/31 22:02
>>171 あと1時間半後に誰かがレスするんじゃない?
173 :
132人目の素数さん :03/12/31 23:04
>>171 有意水準0.001%で検定しましたが,帰無仮説が棄却されました.
よって対立仮説が棄却され,「ボブサップが曙に負けない」と
結論付けられました.
それではよいお年を.
174 :
132人目の素数さん :04/01/04 23:24
age
ここは棄却されまくりなスレでつね
176 :
132人目の素数さん :04/01/12 21:38
LifeCycleSavings のデータを、変数srを目的変数として重回帰分析したら、寄与率が33%とか出た・・・ > data(LifeCycleSavings) > ls.print(lsfit(LifeCycleSavings[,-1],LifeCycleSavings[,1])) Residual Standard Error=3.8027 R-Square=0.3385 F-statistic (df=4, 45)=5.7557 p-value=8e-04 Estimate Std.Err t-value Pr(>|t|) Intercept 28.5661 7.3545 3.8842 0.0003 pop15 -0.4612 0.1446 -3.1885 0.0026 pop75 -1.6915 1.0836 -1.5610 0.1255 dpi -0.0003 0.0009 -0.3618 0.7192 ddpi 0.4097 0.1962 2.0882 0.0425 レポートで出てるんだけど、考察書くとしたらどう書けばいいの? 「寄与率がこのように低くなってしまったのは、○○だからだと思われる」の○○って、どう書けば・・・ ちなみに、 sr・・・貯蓄額 pop15・・・15歳以下の人口比率 pop75・・・75歳以上の人口比率 dpi・・・可処分所得 ddpi・・・dpiの伸び率
177 :
132人目の素数さん :04/01/13 18:00
>>176 ここには変数ごとのt-test結果が張っていないけど、
t-testで棄却されていない変数を落として重回帰を
やり直したらRの値が増えるんじゃない?
AICとかで測って変数を減らしてもいいだろうけど。
178 :
132人目の素数さん :04/01/24 21:15
Rで多変量のスプライン回帰がやりたいのですが、いいパッケージありますかね? 普通のsplineは(x,y)の場合しかできないもので・・・。
160
>>176 ○○=「適切な変数を投入できなかった」
>>177 どんなクソ変数であっても,それを落としたときに
Rの値が増えることはあり得ないと思うが気のせい?
182 :
132人目の素数さん :04/02/02 18:54
ほしゅ
183 :
132人目の素数さん :04/02/02 18:55
ほっしゅ
184 :
R-Tips”管理”人 :04/02/03 22:11
185 :
132人目の素数さん :04/02/06 00:24
>>184 R初心者(統計自体始めたばかり)ですが、早速いただきました。
ありがとうございます。じっくり読ませていただきます。
大作ですので、プリントアウトだけでも一仕事ですな。w
Rのコマンドライン履歴って .Rhistory に格納されますよね. 長くなってきたらエディタとかで勝手に上の方を削ってしまって問題ないのでしょうか.
>186 試しに削ってみたけど大丈夫みたいだったよ
>>187 やっぱり大丈夫ですか.私もやってみましたが,判断にはサンプルの数が必要だと思いまして.
どうでもよい変数を何度も表示したりしてると,
次にワークスペースを回復したときに履歴から重要な入力が辿り辛いんですよね.
189 :
132人目の素数さん :04/02/08 22:30
190 :
132人目の素数さん :04/02/10 22:19
3次元の2ベクトル a,b が張る平面を描画するプログラムをつくれますか?
191 :
132人目の素数さん :04/02/11 00:26
使わないライブラリも全部入れて毎日アップデートするのが日課でつw
>190 scatterplot3dがお役に立つと思います。
>191 CRANからのアップデートは簡単でよろしいですな。んでも、新作ライブラリーはどうしてます?
194 :
132人目の素数さん :04/02/19 21:37
195 :
132人目の素数さん :04/02/23 22:56
>>193 update.packages() で解決します。また
read.dcf(file=system.file("DESCRIPTION",package="tree"))
でパッケージの情報の取得が可能です。dcfはdebian control format の
事ですが、Windowsでも使えます。
196 :
132人目の素数さん :04/02/27 11:48
あげ
197 :
132人目の素数さん :04/02/28 14:18
ESS使ってる人いますか? .emacs.elの中でどうやって設定しているのでしょう? (load "usr/lib/..../lisp/ess-site") で設定すると使いもしないのにいつも不要なバッファは生成されて困っています。 RというよりEmacsの質問になると思いますがアドバイスお願いします。
198 :
132人目の素数さん :04/03/04 21:59
Emacs+ESS+Rを利用してます。emacsでRファイルを編集するとき、コメントマーク「#」の数により、その行の色を変更できると便利ですよね。 とりあえずの対処療法として、 M-x hi-lock-mode M-x highlight-regexp [RET] ### [RET] hi-red-b M-x highlight-regexp [RET] ## [RET] hi-green-b などとしてます。(順序が大事)
889
200 :
132人目の素数さん :04/03/09 03:54
200
sage
202 :
132人目の素数さん :04/03/17 17:44
やっぱりlisp-statでしょ
204 :
132人目の素数さん :04/03/17 23:18
lisp-statとRは作者が一緒ですよ.
205 :
132人目の素数さん :04/03/20 04:58
R 1.9.0 alpha 版が出ました!
206 :
132人目の素数さん :04/03/26 03:10
>>205 おっ、出たの!で、どんな機能拡張があったの?
207 :
132人目の素数さん :04/03/27 00:55
・計算速度がUP(MCMC 法の実行時間が R 1.8.1 より4倍(!?)近く早くなったとのコメント) ・アンダースコアを変数名に使えるようになる ・標準ライブラリの構成が大きく変わる だそうです.
r
javaとの連携の情報,どこかにない?
R 1.9.0
>> 209 RjpWikiの「RとWebサービス」のRSOAPを使ってやるのがいまのところ Java的には一番美しい方法かも。ほかはJNIっぽい...
1.9.0リリースキタ━━━━━━(゚∀゚)━━━━━━ !!!!! とりあえずシコシコビルド中。
213 :
132人目の素数さん :04/04/18 00:51
RでX11やX12等の季節調整ができる関数なんぞありますか?
214 :
132人目の素数さん :04/04/20 22:57
時系列?なら ts パッケージがありますよ.
215 :
132人目の素数さん :04/04/29 17:16
tsパッケージは少し弱い。 arima.predict さえない。
216 :
132人目の素数さん :04/05/01 12:22
Rで待ち行列シミュレーションのプログラム書いた人いませんか? R-Wikiの方ででも公開してください。おながいします。
217 :
132人目の素数さん :04/05/01 22:54
218 :
132人目の素数さん :04/05/08 19:43
The R Book 期待あげ
219 :
132人目の素数さん :04/05/08 22:13
The R Book 楽しみにしてるんだが、いったいいつ出るのだ。
5月末には書店に並ぶと思われ <RjpWikiより
>220 サンクス。今、見てきた。 > 出版時期: 5月末発売予定 > 出版社: 九天社 > 価格: 税込み3900円(本体価格3800円)の予定 > B5変型版/448頁(予定) CD-ROM付 むー、正直CD-ROMはイラナイ。
スレ違いスマソ。 MuPADに関する質問はどこでするのが最適ですか?
223 :
132人目の素数さん :04/05/09 01:33
>221 本文中で使ってるデータとかが収録されててスグ試せるならいいかも >CD-ROM
224 :
132人目の素数さん :04/05/11 00:56
>>224 いいねぇ。
R-Tipsのページは知ってたけど、PDF版もあったとは。
欲を言えば、多変量解析の部分をもっと充実させて欲しい。
因子分析とかk-means法のクラスタ分析とかSEMとか。
227 :
132人目の素数さん :04/05/21 00:31
>> 225 載ってるジャン。コマンド名さえあればヘルプを見ればいいっしょ。
みなさん、The R Book は手に入りましたか?
229 :
132人目の素数さん :04/05/25 00:35
池袋のジュンク堂で買ったよ。
230 :
132人目の素数さん :04/05/26 13:52
思ったより分厚かったのと、立ち読みして読みやすかったので買いました。 皆さん顔写真入りで砂。
232 :
132人目の素数さん :04/05/30 20:58
curve関数の質問です。 例えば指数分布関数 dexpを描画したいときにはどうすればいいのでしょうか? イメージ的には curve ( dexp(rate=3) ) としたいのですが・・・
こんな感じでしょうか? curve(dexp, from=0, to=3)
234 :
132人目の素数さん :04/05/30 22:00
>>233 レスありがとうございます。
ただ、それでは
dexp関数のパラメータ rate=3
を反映することが出来ていないと思うのですが・・・
235 :
132人目の素数さん :04/05/31 00:12
失礼. curve(dexp(x, 3), from=0, to=3)
おかげさまで出来ました。 [curve]と引数を与えないでソースを見てさらに納得しました。
待ち行列パッケージなんてあっても良さそうだね。 つくろかな。 もうあるような気もするが・・
238 :
132人目の素数さん :04/06/02 17:33
初心者です。 Rの用語集とかないですか?
239 :
132人目の素数さん :04/06/02 20:34
241 :
132人目の素数さん :04/06/09 21:42
age
242 :
132人目の素数さん :04/06/14 20:43
R 1.9.1 alpha が出ましたね.
243 :
132人目の素数さん :04/06/17 17:34
関数の使い方は分かるんですが、 その仕組みや構造そのもの(例えば数式、理論など)を 知りたいときは何を見たら分かるのでしょうか?
244 :
132人目の素数さん :04/06/18 00:25
(1) 関数名をそのまま入れる > var (2) ヘルプを見たり,ヘルプの参考文献を見たりする > ?var
245 :
助けてください・・ :04/06/22 00:16
例数不揃いのときのNested-ANOVAってどうすればいいんでしょうか? ヘルプ読んでもnested-anovaにヒットしない・・・ ネットでも例数が揃っている場合しか見つからないんです。 x y z a i 3 a i 4 a j 4 a j 1 a j 6 b i 5 b i 2 b i 7 b j 3 b j 2 >summary(lm(z~x/y)) でやったら、SASとかSPSSと答えが微妙に違う・・・
すいません summary(aov(z~x/y))の間違いです。どのみちダメでした。
WindowsのRでxgobiはどうやって入れたら良いのでしょう。 Xを立ち上げないと駄目?
249 :
132人目の素数さん :04/06/27 14:48
250 :
132人目の素数さん :04/07/06 18:26
187
Vine linux 2.95にR-1.9.1をソースからコンパイルしてインストールしました。 ところがRを実行し終了しても.Rhistoryが作成されず、入力履歴が残らないんですけど、 入力履歴を保存するようにするには何か設定が必要なのですか? ちなみに.RDataはちゃんと保存されています。
>>251 自己レスです。
readline-develをインストールしてからRをbuildしなおすことで
解決できました。
お騒がせしました。
253 :
132人目の素数さん :04/07/12 20:53
今日はシステムに対する世界観が変わりました。 x1 = 0.5 - 0.3 x2 = 0.3 - 0.1 x1 == x2 FALSE になるのは仕方ないのでしょうか? 機械誤差というところまでは解ったのですが、 完全に理解しないと、この先やっていけない気がしました。 抽象的な質問ですがよろしければ、ご教授下さい。
255 :
132人目の素数さん :04/07/12 22:50
>>253 R では == で実数を比較しない方が良いのでは?identical()を使って下さい.
> x1 = 0.5 - 0.3
> x2 = 0.3 - 0.1
> x1-x2
[1] 2.775558e-17
> identical(all.equal(x1,x2),TRUE)
[1] TRUE
256 :
132人目の素数さん :04/07/13 14:06
257 :
132人目の素数さん :04/07/28 08:54
621
>>253 システムに対する世界観が変わるほどの問題じゃないぞw
これはCでも同じ。普通は
x1 - x2 < 小さな数
として処理するところ。
ぬお、絶対値付け忘れた。
260 :
綺麗だなぁ :04/08/08 22:59
x <- seq(-10, 10, length= 200) y <- x f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r } z <- outer(x, y, f) z[is.na(z)] <- 1 persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = rainbow(200), border=NA)
261 :
132人目の素数さん :04/08/11 22:29
今だ!R2.0.0ゲットオォォォォ!!  ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´ ∧∧ ) (´⌒(´ ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡  ̄ ̄ (´⌒(´⌒;; ズザーーーーーッ
262 :
132人目の素数さん :04/08/14 02:19
"2004-08-14 01:03:12" といった文字列を整数にするには、どうしたらよいで しょうか。as.Date()のようにフォーマットが指定できて、時間も処理できる 関数ってありますか? μ秒も処理できるとなおよいです。 > ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16") > t <- as.Date(ct, "%Y-%m-%d %H:%M:%S") > format(t, "%Y-%m-%d %H:%M:%S") [1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"
263 :
132人目の素数さん :04/08/14 02:25
なんだかnlmeパッケージのアップデートが失敗するんですが みなさんうまくいってますか?
あっ、今やったらうまくいった! 昼やったときは途中でエラー出てたのに・・・
265 :
132人目の素数さん :04/08/14 12:22
>>262 >"2004-08-14 01:03:12" といった文字列を整数にするには
「整数」の基準が良く分からないのですが,例えば1900年1月1日00:00:00を
基準にして何秒たっているかを秒で表示するということでしょうか?
> as.Date()のようにフォーマットが指定できて、時間も処理できる関数
の「フォーマットが指定」の意味が良く分からないのですが….
266 :
132人目の素数さん :04/08/15 23:37
>>265 以下のstrptime()のようなもの。tが整数かどうかは、不明。
> ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16")
> t <- as.Date(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"
> t <- strptime(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 01:03:12" "2004-08-14 01:03:14" "2004-08-14 01:03:16"
267 :
132人目の素数さん :04/08/22 00:11
age
268 :
132人目の素数さん :04/08/29 17:17
890
269 :
132人目の素数さん :04/09/05 07:10
182
270 :
132人目の素数さん :04/09/10 05:57
559
271 :
132人目の素数さん :04/09/10 06:26
え
272 :
132人目の素数さん :04/09/15 03:59:17
思わぬ失敗 > a<-c(-5,1,-2,3,4) > a[a>2] とすると [1] 3 4 となりaでa>2を満たすものが抽出されるけど、同じ調子で > a[a<-2] とするとaに2が代入され初期化されてしまう。正しくは > a[a<(-2)] としないとダメ。結果は [1] -5 となる。
273 :
132人目の素数さん :04/09/18 10:05:24
MUSASHIとRって相性良いと思う?
274 :
132人目の素数さん :04/09/22 08:02:27
summary()の結果をファイルに落としたい時にはどうしたら良いの?
275 :
132人目の素数さん :04/09/22 21:33:59
sink() でよいかな。
276 :
274 :04/09/23 11:19:25
>275 Thanx! 助かりました! sink("sink-examp.txt") summary(x) sink(NULL) ですね. ?sinkのexampleにあるように"sink()"ではsink-ingが止まらず, "sink(NULL)"しないとだめでした [R-1.9.1 win32]
277 :
132人目の素数さん :04/09/28 02:49:12
310
278 :
132人目の素数さん :04/09/29 22:30:21
DBI パッケージとどのパッケージを組み合わせれば PostgreSQLを扱えるのでしょうか・・・・・ いくら探してもPostgreSQL用パッケージだけが見つからないのです。
279 :
132人目の素数さん :04/10/02 12:24:01
280 :
132人目の素数さん :04/10/02 12:27:25
rpgsqlは開発が終わってますよね。 ふと思ったのですがRDBIとDBIは同一パッケージなのでしょうか?
いや、別物でした。 RDBIの後継がDBIになるわけで・・・
282 :
132人目の素数さん :04/10/02 15:24:41
rdbiも古いのではないでしょうか? それともpostgresと連携したければ、 dbiではなくrdbiを使わないといけないのでしょうか?
284 :
132人目の素数さん :04/10/02 22:55:58
RODBCが汎用性からいえばよいのではないでしょうか。 The R Bookの第4章にいろいろ情報がありますね。
Linuxで使ってるので、ODBCには少し抵抗感があったりします。 しかし、dbiがpostgresqlをサポートしていないようなので とりあえずODBCを使わせてもらうことにしました。 レスありがとうございました。
286 :
132人目の素数さん :04/10/03 15:14:10
ESSの補完バッファが鬱陶しいのですが 役割が終わったら、役目を果たせなくても閉じてくれるような 設定にすることはできませんか?
モジュールのインストールがうまくいかないよ 最近インストールに失敗するモジュールが増えた?
いつの間にか、Help → HTML Help → Search Engine & Keywords が使えなくなってる。 WindowsXPのSP2のスクリプトブロックが原因かな、と思う。 でも、IEのセキュリティオプションで片っ端から「有効」に設定してもダメ。 誰か同じ問題に困って、解決出来たひと、います?
289 :
132人目の素数さん :04/10/08 06:42:02
R-2.0.0 キター----!
290 :
132人目の素数さん :04/10/08 23:41:18
まじっすかワーイヽ(゚∀゚)メ(゚∀゚)メ(゚∀゚)ノワーイ 釣りじゃないよね(´・ω・`)
291 :
132人目の素数さん :04/10/09 00:45:21
どう変わったのかな 調べる気力が起きん・・・('A`)
293 :
132人目の素数さん :04/10/09 11:32:19
294 :
132人目の素数さん :04/10/10 22:33:19
WindowsでESSを使うにはどうしたらいいんですか?
295 :
132人目の素数さん :04/10/10 22:35:31
>>294 Meadowというエディタを入れれば使えるけど
そこまでしてESS使う必要ないと思うよ。
費用対効果が悪すぎる。*nix全般を覚える必要に迫られるから。
R-2.0はESSに負けないエディタが付属しているみたいだから,
そちらを調べたらどうでしょうか?
296 :
132人目の素数さん :04/10/10 22:51:08
グニュー
あぼーん
298 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 14:34:48
Re:>297 捏造すんな。
300 :
LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 17:32:13
Re:>299 お前は普段から汚いことしてるから私が自作自演していると思うんだろうな。
301 :
132人目の素数さん :04/10/13 22:40:59
>>288 自己レス。
困ってたのは俺だけか...
明示的にJavaのランタイムをインストールしたらOKになった。
...今までいろんなPCで使ってきたけどJavaの存在を全く意識してなかった。
実はなにげにJava入れとったのかしらん。
ついでに、IEオプション詳細設定で、「マイコンピュータのファイルでの
アクティブコンテンツの実行を許可する」にチェックを入れておくと、
いちいち承認を求めてこないので、ややスッキリ。
R2.0.0 Patched / WindowsXPSP2でした。
復刊にご協力下さい。
竹内啓,柳井晴夫 多変量解析の基礎 東洋経済新報社
http://www.fukkan.com/vote.php3?no=22328 統計学を専門とする人ではなくとも、
多変量解析を使うときに手元に是非置いておきたい名著。
多変量解析の基礎理論がわかりやすくかつ体系的に厳密に展開されていきます。
多変量解析に関するこれだけの名著は未だに出ていないと思います。
よろしくお願いします。
304 :
132人目の素数さん :04/10/15 11:58:06
>> 301 オプションはダブルクォーテーション ("")を一旦閉じてから書かないと駄目です。 つまり, "C:\Program Files\R\rw2000\bin\Rgui.exe" --internet2 とすれば良いはず。
305 :
132人目の素数さん :04/10/15 13:04:24
/⌒ヽ, ,/⌒丶、 ,- `,ヾ / ,;;iiiiiiiiiii;、 \ _ノソ´ iカ / ,;;´ ;lllllllllllllii、 \ iカ iサ' ,;´ ,;;llllllllllllllllllllii、 fサ !カ、._ ,=ゞiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii!! __fカヘ. / `ヾサ;三ミミミミミご彡彡彡ミヾサ`´ 'i、 i' ,._Ξミミミミミミき彡/////ii_ | | ;カ≡|ヾヾヾミミミミミぶ、//巛iリ≡カi | | iサ |l lヾヾシヾミミミミり|ii//三iリ `サi | | ,カ ,カll|l l lヾリリリリリ川川|爪ミミiリllカ、カi | | ;iサ,サ |l l l リリ川川川川|爪ミミiiリ サi サi | | iカ ;カ, |l l リリリリ川川川川l爪ミミilリ ,カi カi | | iサ ;サ, |リ リリ川川川川川l爪ミミiリ ,サi サi | | iサ ;iカ, | リ彡彡川川川川|爪ミミiリ ,カi :サ、 | ,i厂 iサ, |彡彡彡彡ノ|川川|爪ミミリ ,サi `ヘ、 ,√ ,:カ, |彡彡彡彡ノ川川|ゞミミミリ ,カi `ヾ ´ ;サ, |彡彡彡彡川川リゞミミリ ,サi ;カ, |彡彡彡彡リリリミミミシ ,カi ,;サ, |彡彡ノリリリリミミミシ ,サi ;メ'´ i彡ノリリリリリゞミミシ `ヘ、 ;メ ヾリリリリノ巛ゞシ `ヘ、 ;メ ``十≡=十´ `ヘ、 ┃ ┃ | | / \ / \ / \
306 :
301 :04/10/15 21:32:17
>304 間にスペースが必要だったんですね。 目からウロコです。助かりました。 どうもありがとうございました!
589
153
なおしときました
287
313 :
NK :04/11/11 16:56:35
バージョンを2.00にしてRODBCもバージョンを1.1−2に更新したら 今まででsqlSaveコマンドでACCESSに結果を書出していたのが、”Error in gsub (pattern,replacement,x,ignore.case,extend invalid regular expression" というエラーメッセージが出てきて動かなくなってしまいました。 どなたか、解決方法をご存知ないでしょうか?
314 :
132人目の素数さん :04/11/15 19:53:43
608
315 :
age :04/11/20 17:10:27
age
316 :
132人目の素数さん :04/11/21 00:41:39
重回帰分析で、修整済みR^2が1に近づくとNANになっちゃうんですが なぜですか?教えてエロい人
317 :
132人目の素数さん :04/11/21 09:30:32
385
318 :
132人目の素数さん :04/11/24 22:54:25
vine linux 3.0を使っています. odesolveを使用したく, odesolve_0.5-12.tar.gzをダウンロードしました. $ R CMD INSTALL /path/to/odesolve_0.5-12.tar.gz を実行しましたが,うまくいきません.
>>318 自己レスです.
>update.packages()
で解決しました.
glmmMLうまく入らないな
321 :
132人目の素数さん :04/12/02 08:05:38
529
322 :
132人目の素数さん :04/12/04 15:44:48
クラスタ分析てエクセルでどうやってやるんでしょうか。 初心者なのでわかりません。どなたか教えていただけないでしょうか。
323 :
320 :04/12/04 17:05:18
>>320 解決
パッケージ入れるときは管理者じゃないといけないなんて・・・orz
それを先にいってれぼ
>>316 ver2.0.0のlmにはバグあるみたい
>>322 エクセル自体には、そのような高度な統計関数はないので、アドオンをインストールするか、
Rを使う。 Rはユーザーインターフェースは原始的だが、統計処理については非常に豊富で
パワフルで、正確と思う。 インストールして損するソフトとは思わないが。
325 :
ECL :04/12/07 01:27:23
Rで三角ダイヤグラムを作図できるのでしょうか。 三角ダイヤグラムは、主に地学、金属学、化学などの分野で使われてる 正三角形の各辺を10等分して目盛を入れ、三成分系の組成をプロットし、 その図から組成比の変化などを検討するというやつで。
>>325 あらゆるグラフィックを比較的容易に自作できるのがRのウリなので、自作してみては?
案外、探し回るよりも早いかも。
328 :
132人目の素数さん :04/12/10 20:39:56
x y z 1 1 2 2 4 5 4 2 5 ... とデータがあるとします。 この時、 persp( x , y , z , z_guess=TRUE ) 等として z を補完してくれることはないのでしょうか? 回帰分析でzを補完するイメージです。
329 :
132人目の素数さん :04/12/11 08:42:25
二つのデータをヒストグラムにして、それを重ねて表示させたいのですが どうやったらよいでしょうか?
330 :
132人目の素数さん :04/12/11 09:05:33
coplotってなんじゃらほい。 見方が解らないです。
331 :
132人目の素数さん :04/12/13 03:14:18
332 :
132人目の素数さん :04/12/14 21:54:30
データフレームからサンプルをn個抽出するにはどうすればいいのでしょうか? sample ( data , 3 ) だと3列ランダムサンプリングされてしまいます。
333 :
132人目の素数さん :04/12/15 01:26:58
>>332 データフレーム???
データフレームのどのデータからサンプリングするわけ?
それがわからなきゃそもそもできないだろが!
334 :
132人目の素数さん :04/12/15 01:38:04
[File]→[Change Dir...]で指定される作業用ディレクトリは保存できないんでしょうか?
>>332 sample(as.matrix(dataframe),3)
>>334 起動時に引数で渡せば良い。
起動用のショートカットの「作業フォルダ」に望むパスを指定する。
337 :
132人目の素数さん :04/12/15 21:34:34
>>335 それだと、数値属性の情報もカテゴリーデータの情報も失われてしまいますよね?
何かいい方法ないのでしょうか?
338 :
132人目の素数さん :04/12/15 22:22:13
>>336 おかげさまでできました。
ありがとうございました。
>>337 colnamesの情報を残したまま抽出したいということでしょうか?
そうなるとデータそのものから抽出するより、座標を抽出して
対応するデータをとってきたほうがいいような。
n x mのデータフレームとしてi <- sample(1:(n*m),3)とかやって、
dataframe[i%/%m+1,i%%m+1]とか?
あとはiをみれば情報は残ってるはず
340 :
132人目の素数さん :04/12/15 22:46:28
う〜ん、難しいです。 baseに入っているstate.x77を例に教えていただけないでしょうか? state.x77[1:3,] Population Income Illiteracy Life Exp Murder HS Grad Frost Area Alabama 3615 3624 2.1 69.05 15.1 41.3 20 50708 Alaska 365 6315 1.5 69.31 11.3 66.7 152 566432 Arizona 2212 4530 1.8 70.55 7.8 58.1 15 113417 こういったデータフレームがあった時に、イメージとしては sample( state.x77 , 2 )としたら 2オブザベーション返ってくる感じです。 あつかましいお願い申し訳ありません。
>>340 ちょっとやりたいことがはっきりしませんが...SAS語の「オブザベーション」と
同じ意味だとすると...
state.x77[sample(nrow(state.x77),3),]
ということ?
求めるデータのイメージを具体的に示してもらえれば答えやすいですが。
342 :
初心者 :04/12/21 23:58:27
質問です. 線形重回帰分析で予測値の信頼区間をプロットしたいのですが, 色々探したのですが,掲載されていませんでした・・・ どなたかご存知でしょうか? 非常に困っているので教えて下さい. 宜しくお願い致します.
343 :
132人目の素数さん :04/12/22 21:47:38
344 :
132人目の素数さん :04/12/24 01:44:05
>343 それって単回帰のページですよね 重回帰での信頼区間はそれだとでないような・・・ まあ、私も重回帰での信頼区間のだしかたを知らないのでなんともいえないのですが・・・ 自分でがつがつ書くしかないんですかね〜
>>344 モデルをmlm として
predict(mlm, int="c")
ではいかが。
補足: 単回帰も重回帰も、直線回帰であれば lm() でまったく区別なく扱えます。 ロジスティックとか、直線でない場合は glm() を。 参考書: Introductory Statistics with R (だれか翻訳してるかなぁ)
347 :
132人目の素数さん :04/12/24 14:53:10
age
348 :
348 :04/12/28 05:23:53
>346 信頼区間の値がかなりばらついているから、 重回帰では使えないと思ってました。 参考書みて勉強してみます ありがとうございました
349 :
132人目の素数さん :04/12/30 22:12:08
poly とは要するになんでしょ?
350 :
132人目の素数さん :04/12/31 08:59:49
boxplot()で平均値を表示させることはできるのでしょうか?
Rはフリードマン検定全部やってくれるのですか? 他の使い方もあるのでしょうか?
352 :
132人目の素数さん :05/01/18 20:52:14
中心化移動平均を求めるには? filter関数では無理ですよね?
Rは数値を入れ込むのがめんどう・・・・エクセルの表でぱっとやってくれないの?
>>353 read.csv("hoge.csv")
>>353 read.table("hoge.csv", sep=',')
この辺の使い分けは rjpwiki にも列挙してあるだけで自分で調べて欲しいという
ことになっていますね.そんなに重要なことはないのかな?
>>356 自分で調べるも何も、まんまな訳だが。
>>353 Excel上でRを使う方法があるよ。私はLinuxユーザだから試したことがないけどね。
OpenOffice.org Calc上で使えるようになったら、演習講義に採用するかも。
データ入力がexcelじゃ限界あるだろ
359 :
132人目の素数さん :05/01/23 16:58:52
カーソルキーで移動できるターミナルのCSVエディタがあればなあ。 MSDOSのロータスみたいなので、式はなしでもいい。 そいうのしりませんか。
>>357 >Excel上でRを使う方法
マジっすか?
どっかに関連情報のリンクとかあったら教えていただきたいです。
361 :
132人目の素数さん :05/01/23 19:52:57
>>362 うほっ。Wikiにあったとは…。ありがとうございました。
>365 お前はききかじりじゃねえか
こんな関数ありますか? hoge(f, a, b, c, d, ...) ==> f(f(f(f(a,b),c),d),...) f (引数 2 つ) を適用した結果を引数の 1 番目,リストの次を 2 番目として また f を適用し,,,という動作です.
>>366 >>365 だけど、もちろん両方とも使ってみた上での発言だよ。emacsのCSVモードは日本
語に難があって、今は使ってない。まぁコンソールと言わずに、OpenOffice.org Calc ->
csvとした方が効率がよいと思うけど。
>>367 そんな関数というか、まんま書いたらいいと思うけど。
fuga <- function(x,y){x+y}
hoge <- function(f,x){
y <- x[1]
for (i in x[-1]) { y <- fuga(i,y) }
}
>>368 反応がないということは分かりにくかったか?
f(引数2つ) の例として f <- function(x,y){x+y}
という関数があったとして、
> f(2,3)
[1] 5
だな。で、
> x <- c(5,7,1,8,9,12)
というxがあったとして、f(f(f(f(f(5,7),1),8),9),12) を計算したいとする。
> y <-x[1]; (for (i in x[-1]) {y <- f(i,y)})
[1] 42
と書けば
>>367 の期待通りに結果になる。
>368 じゃあただのききかじりだな
>>368 返事が遅れてすみません.
無いみたいなので自分で作ろうとしましたが,
まだ R に馴れていないので脱線し,そのままになっていました.
結局,まんましか思い浮かばず...
脱線中に困ったのですが,
mapply を 兼ねた apply はありませんか?
できれば apply( mat1, 1, function (m1, v1, v2) {...}, vec1, vec2 )
のようにしたいところを,
apply( cbind (vec1, vec2, mat), 1, function (m) { ... } )
というように,頭から 1 コずつ適用して欲しいベクトルも行列に混ぜないと
なりませんよね.
372 :
132人目の素数さん :05/01/28 00:32:25
SASユーザです。教えて下さい。 行列計算用のパッケージ(SASではIMLなど)はありますでしょうか? その中で、逆行列や最適化の計算はできるでしょうか?
374 :
132人目の素数さん :05/01/29 11:53:29
plot ( x , log="xy" ) で対数軸にプロットしたいのですが、 軸が指数表記になってしまいます。5e-01 これを通常の十進表記にすることはできるのでしょうか?
375 :
132人目の素数さん :05/01/31 20:24:41
grangerの因果性のテストができるパッケージなどあるのでしょうか?
666
377 :
132人目の素数さん :05/02/17 21:19:51
もう一度質問させてもらいます。 時系列varモデル、grangerの因果性のテストができるパッケージなどあるのでしょうか?
378 :
132人目の素数さん :05/02/20 03:16:37
379 :
132人目の素数さん :05/02/28 22:47:13
345
>>215 、
>>378 便乗質問
ついでにARIMAなども扱えるようなパッケージはあるのでしょうか?
381 :
132人目の素数さん :05/03/08 14:17:04
age
382 :
132人目の素数さん :05/03/09 00:59:30
arimaはデフォで使える。 varはarで可能。 grengerは?だれか教えて。
383 :
132人目の素数さん :05/03/10 22:28:35
グランジャー因果はなかった希ガス
385 :
132人目の素数さん :05/03/11 11:16:32
グランジャー因果って何ですか?グーぐるで「とは検索」しても出てこなかったのですが・・
ハースト指数ってどのモジュールから取れますか? 本家サイト検索しても出てこなかったので、無理でしょうか・・
日本地図ってデフォでついてたっけ?
389 :
132人目の素数さん :05/03/12 12:30:57
グレンジャー因果が無いってのは致命的では? 実務上時系列で一番重要なものではないか。
390 :
Cox回帰 :05/03/12 17:05:03
matlabで生存時間解析を行いたいんですけど(COX回帰とか)、どこかに サブルーチンはフリーで落ちていないでしょうか?
>>389 Rって「研究者が自分に必要なものを自作する世界」(R. Gentleman in ISM, [12, Mar. 2005])だから
今までに必要な人がいなくて作られてないってのは別に不自然じゃないと思うよ。
欲しければ自分で作ってRコミュニティに貢献してくださいな。
それとグレンジャー因果って本当に因果なの?個人的には時間差を持った相関にしか見えないん
だけどな。
それとGranger因果ってF検定してるだけだった希ガス
393 :
132人目の素数さん :05/03/13 08:47:13
>時間差を持った相関にしか見えない 専門家にはそうにしか見えなくても良いんだよ。 手法の詳細はともあれ、実務上は時系列の因果関係を示せる指標が求められる。 ラグを考えないピアソン相関係数を示しただけじゃ偶に突っ込まれちゃうんだよね。 そうなると多少難しいグレンジャー因果が必要とされる。
>>393 回答あんがと。本来は相関でしかないものを確信犯的に因果と言っている人に文句は言わないよ〜
(似たようなことは俺もしてるし)
調べたけど、やっぱりF検定するだけだからGrangerのためにパッケージはいらんかもよ(←適当ですまん)
どなたかwaveslimを使って時系列のウェブレット分析してる方いますか? ご丁寧にGDPなどのサンプルデータまで入っているのに使い方が分からないorz コアプログラムも分からない・・
396 :
132人目の素数さん :05/03/13 15:53:14
ロジスティック回帰分析を行うのにRではglm(一般化線型モデル)を 用いますが、見やすく出力してくれる関数等は存在するのでしょうか? 例えば偏回帰係数はオッズ比の自然対数ですが、これをオッズ比に戻すために exp ( x ) 信頼区間を求めるために exp ( x + 1.96 * StdError) 等としますよね? ちょっと手間がかかるので、もっとスマートな方法があるのではと思いました。
397 :
132人目の素数さん :05/03/18 10:53:09
定数項を含まないGLMを推定したいのですが、GLM()でマニュアルにある通り intercept=FALSE と設定しても Error in glm.control(...) : unused argument(s) (intercept ...) と出てしまってうまくいきません。自分のモデルが悪いのかと思い、helpにある モデル Dobson (1990) Page 93 で試したのですが同じでした。Rは標準インストール しただけの状態で特にパッケージなどは入れていません。 私は何か勘違いをしているのでしょうか?もしご存知の方がいらしたら是非お教えください。
398 :
397 :05/03/18 12:03:53
397ですが、自己解決しました。マニュアルどおりのintercept=FALSEではうまくいかないのですが、 式を指定するところで、説明変数の最後に-1をつければ(e.g. y ~x1+x2+x3-1) よいようです。 お騒がせしました。
>>387 Splusの方のmapsにはあるらしいよ。
市町村合併で大変だろうけど。
>>388 素直にshapeファイルとmaptoolsを使った方がいろいろと小回りが利くと思うけど。。。
400 :
132人目の素数さん :2005/03/24(木) 05:09:19
age
401 :
132人目の素数さん :2005/03/28(月) 21:28:32
ヒストグラムの重ね書きはできますか?
402 :
132人目の素数さん :2005/04/13(水) 06:31:02
874
403 :
132人目の素数さん :2005/04/15(金) 00:52:35
>>401 x1 <- rnorm(100)
x2 <- rnorm(100)
hist(x1, xlim=c(-5,5), ylim=c(0,0.5), prob=T)
par(new=T)
hist(x2, xlim=c(-5,5), ylim=c(0,0.5), prob=T, col=2)
404 :
132人目の素数さん :2005/04/18(月) 22:15:19
R -2.1.0.になりました
405 :
132人目の素数さん :2005/04/18(月) 22:29:05
Rでアソシエーション分析なんてできますか?
406 :
132人目の素数さん :2005/04/18(月) 23:11:35
407 :
132人目の素数さん :2005/04/21(木) 00:56:15
408 :
132人目の素数さん :2005/04/21(木) 03:04:48
>>407 ありがとうございます。e1071をインストールしたら統計関数がみれました。
409 :
132人目の素数さん :2005/04/21(木) 20:43:07
v2.1 example関数にバグがあるね。 エラーになる。
v2.1 日本語環境がまだまだ中途半端に感じたので、ロケールをCに設定。 その上で、example関数を実行したら which[x] ..not defined default value.. ISO???? のようなエラーが発生。正確には覚えていない。 今手元でテストできる環境にないのでスマソ。
412 :
132人目の素数さん :2005/04/24(日) 13:12:01
グラフィック全般での質問ですが、軸の数字を小さく表示することはできますか?
413 :
132人目の素数さん :2005/04/25(月) 11:29:15
plot(x,y,cex.axis=.8) try ?par
414 :
132人目の素数さん :2005/04/29(金) 21:17:23
Rをインストールするとき, BLASライブラリのサポートを必要とした方がいいのでしょうか?
415 :
132人目の素数さん :2005/04/29(金) 22:54:25
mean関数のtrim引数の動作が全く理解できません。 このtrim関数の意味を教えて下さい。よろしくお願いします。
まずい回答例 まずい質問の模範的な例ですね。まず質問場所がまずい。 自分が何をしたのか説明しないで、どうして赤の他人に問題がわかりますか。
417 :
132人目の素数さん :2005/05/03(火) 06:21:40
age
回答者の知識レベルにも依るでしょ。
>>415 トリム平均でぐぐれ
>>416 シムラー!!! 2005-05-01 (日) 08:31:32のRwiki 、Rwiki
420 :
132人目の素数さん :2005/05/05(木) 13:23:32
Rを独習中で、The R bookを使っているのですが、decomposeコマンドを使う際に dataコマンドで、データセットを読み込むとありました。 しかし読み込みが出来ません。単に読み込む前に何か私がし忘れていることが あるのでしょうか? どなたか、教えていただけませんか?
data ( co2 ) #この時点で読み込みは完了している。 decompose ( co2 )
422 :
132人目の素数さん :2005/05/05(木) 14:16:10
>>421 data(読み込みたいファイル)としても、
not foundと表示されるんです。
やはり、方法が間違っているのでしょうか?
一般のテキストファイルを読み込もうとしてるのなら、 help ( "read.table" ) help ( "scan" )
424 :
132人目の素数さん :2005/05/05(木) 15:00:41
>>423 read.table("c:〜.txt")という風に、上の本に書いてあるようにして、
こっちのコマンドでは読み込みは正常に出来ているみたいです。
plot(〜)とすると、ちゃんと図になりますし。
しかし、dataコマンドの方は、notfoundと表示されます。
教えてくださったように、helpは二つとも見てみましたが、
read.tableの使い方はあっているようです。
目的は、Rを使って時系列分析をすることなんですが、
そこから前に進めなくて。
co2ってデータセットは普通にインストールすれば入っているものですから、 not foundになるのはちょっと変ですね。 本の付録についているCD-ROMに本に書いてあるコマンドを書いたファイルが あるので、それをメモ帳か何かで開いてコピーして実行してみてはどうでしょう?
426 :
132人目の素数さん :2005/05/06(金) 12:32:29
>>425 data(co2),decompose(co2)は上手いこといきました。なぜ、出来なかったのかは
分かりませんが、多分タイプミスだと思います。
ありがとうございます。
しかし、このco2のデータは元々入っているものですが、元々入っていない
私の作成したデータの場合はやはり上手いこといかないのですが・・・。
decompose(ファイル名)としても、
Time series has no or less than 3 periods!
と表示されるのです。初心者なので、本の通りに進めているのですが、
データは自分のものを使って分析したいと考えていますので。
何かし忘れていることがあるのでしょうか?
>>426 そのメッセージは、「データに含まれる時点(period)が3時点未満である」
と指摘していると思うのですが、その指摘自体は正しいですか?
Moving averages を使って解析する上で、少なくとも3時点ないと
だめなのではないかと思います。
428 :
132人目の素数さん :2005/05/06(金) 14:40:04
>>427 その指摘自体が良く分からないのです。
私が使うデータは、円ドルレートのデータで、約2500日分のレートが入っています。
形式は、txtです。read.tableにより読み込んで、plotで描けば、レートの変動が
グラフになって表示されるので、3時点ということはないと思うのですが。
単に2500個のデータがあるだけではだめなのでしょうか?
429 :
科学者の卵 :2005/05/06(金) 15:49:47
私は、科学者の卵です。はじめて掲示板に書き込みます。 よろしく、お願いいたします。 ヨーロッパでは、品質管理の統計にCOV(私は聞いたことがない)という 手法か?、単位か?で表現することがあるそうですが、どなたかご存じでしょうか 教えてください
431 :
430 :2005/05/06(金) 16:13:45
432 :
BlackLightOfStar ◆ifsBJ/KedU :2005/05/06(金) 18:58:04
Re:>429 おそらくCOVは日本語でいう共分散のことだろう。covarianceの略。
433 :
132人目の素数さん :2005/05/06(金) 20:20:11
>>428 そのデータは、「年」と「日」に分解されていますか?
period として年、season として日を認識させないといけないのでは。
co2 は、「年」と「月」という構造を持ってますよね。
434 :
132人目の素数さん :2005/05/06(金) 21:45:32
>>433 分解されていません。co2の方は、確かに分解されていました。
しかし、どのようにすれば良いのでしょうか?
持っているThe R bookには載っていなくて。
私の使う為替レートは、年は1993〜2005で連続ですが、市場が開いていない日
があるので、抜けている日があるのですが。
435 :
132人目の素数さん :2005/05/07(土) 08:13:56
436 :
132人目の素数さん :2005/05/07(土) 08:52:08
>>435 ありがとうございます。今、早速そのページのようにしたら、本のように
上手い事出来ました。
自分の使っている本を書かれた方から直接教えて頂けるのは、本当に
嬉しい限りです。
本当にありがとうございました。
へぇ、矢野先生も2ch見てるのね。 先生、decompもいいけどX12を実装してください。 と匿名をいいことに無茶を言ってみる。
438 :
132人目の素数さん :2005/05/15(日) 19:21:43
helpコマンドで良く出てくる「S3」とはなんでしょうか?
439 :
132人目の素数さん :2005/05/16(月) 21:13:43
tsオブジェクトで月平均や年合計を簡単に計算する方法はあるのでしょうか?
>>439 aggregateで月平均や年合計を計算可能です。
>a numeric(0) >is.numeric(a) [1] TRUE ええええええええええええ
最頻値の出し方はどうすればよいのでしょう。 mode関数はRには備わってないようですが、、、。
443 :
132人目の素数さん :2005/05/18(水) 14:02:00
>>443 boxplot(x,outline=F)
じゃないの?
R 2.1.0 patchedでの話です。
?boxplot
でヘルプファイルが出ます。
確認してください。
445 :
132人目の素数さん :2005/05/18(水) 20:09:56
希望するグラフができました。 本当にありがとうございました。
446 :
132人目の素数さん :2005/05/18(水) 21:24:53
>>440 レスありがとうございます。
しかし、年合計はできたのですが、月平均の方法がわかりません。
どのようにやればいいのでしょうか?
447 :
132人目の素数さん :2005/05/19(木) 20:54:36
"2 > 1" や"x == y"のような文字列を論理式として扱いたいんですが方法がわかりません。ご教授お願いします。
448 :
447 :2005/05/19(木) 21:49:10
一応、ファイルに出力→source()で実行って形で自己解決出来ましたが、よりよい方法があったら教えてください。
xx <- parse(text = "x+y") x = 2; y<- 23; eval(xx) symbol あるのにわざわざ文字列? xx <- quote(x + 3) x <- 33 ;eval(xx) x <- -3 ;eval(xx)
クロージャもあるし a <- function(x) {x == y}; y<-3; a(3)
451 :
447 :2005/05/20(金) 10:03:29
>>499 ,450
ありがとうございます。うまくいきました。
treeで作ったルールセットを分割して保存・実行したかったんです。
452 :
132人目の素数さん :2005/05/22(日) 11:54:16
すみません、賢い2ちゃんねるのみなさんに質問です。 text<-"abcdefg" regMatchPos("abcdefg","cde") は、S-PLUSだと動くのに、 [,1] [,2] [1,] 3 5 Rだと動かない Error: couldn't find function "regMatchPos" 理由を教えていただけないでしょうか。 「データによるプログラミング」にも似たような式が載っているのに不思議です。
賢くないから答えない
R Functions for Regular Expressions * grep() * regexpr() * gsub() * sub()
455 :
132人目の素数さん :2005/05/22(日) 12:28:34
454さん 解決しました。ありがとうございます。
質問です。 例えば100個のベクトルに対してトリム平均で上下2%を取り除いた平均を求めるとします。 このとき、取り除いた上下2%のベクトルsを知る事ができるのでしょうか。 どなたかやり方をご存知であればご教示ください。
>>456 100個の2%ってことは、2個。
sortして、1番目と2番目と99番目と100番目が取り除いたものじゃないの?
458 :
456 :2005/05/31(火) 12:47:15
>>457 レスどうもです。一応検証してみました。
> a <- rnorm(100)
> mean(a,0.02) == mean(sort(a)[-c(1,2,99,100)])
[1] TRUE
> a <- rnorm(99)
> mean(a,0.02) == mean(sort(a)[-c(1,2,98,99)])
[1] FALSE
> mean(a,0.02) == mean(sort(a)[-c(1,99)])
[1] TRUE
上下2%の時、ベクトル100個では上下2個除いていて
99個のときは一個づつ除いてるみたいですね。
いや、Rがトリム平均を求める時にちゃんと上下2%を認識して弾いてるわけだから
自分でまた計算し直すのもアホらしいと思ったけどしょうがないですよね
そうですよね。
459 :
132人目の素数さん :2005/06/02(木) 15:32:41
age
460 :
誰か :2005/06/08(水) 08:45:59
3×3行列で 一行目5 53 50 ニ行目53 657 536 三行目50 536 558の逆行列を表計算ソフトで求めれますか?
スレ違い?
>>460 Excel でいいなら
一行目79310 -2774 -4442 ニ行目-2774 290 -30 三行目-4442 -30 476
の全体を27428 で割ったもの。
462 :
132人目の素数さん :2005/06/08(水) 15:47:53
461さん、ありがとうございました。
463 :
460 :2005/06/08(水) 15:48:12
461さん、ありがとうございました。
MacOSX TigerにRcmdrが入りません。 何か必要なんでしょうか?
465 :
132人目の素数さん :2005/06/17(金) 12:14:56
age
466 :
たかの :2005/06/17(金) 19:51:08
初歩的な質問で,申し訳ありません. CRANからRMySQLをダウンロードして,RGuiのパッケージから 「ローカルにあるZIPファイルからのパッケージのインストール」を実行しました. library()で確認したところ, 「No title available (pre-2.0.0 install?) **~」 と表示されてしまい,使用する事ができません. WindowsXPサービスパック1,R 2.1.0を使用しているのですが, どなたかご教授頂けないでしょうか.
467 :
132人目の素数さん :2005/06/21(火) 01:21:09
質問です。いまRの説明文を書いているのですが、 「C言語の構造体」=「R言語のリスト」っていう説明で、問題はありませんか?
問題オオアリだと思うが。 一つのリストにいろいろな型の値を入れられるという趣旨かなと想像するけど。
469 :
132人目の素数さん :2005/06/21(火) 17:34:47
468さん はい、そういうことを言いたいのですが、 467の言い方だとどこらへんがマズいですか?
C union ならいろいろな型を入れられる。 R の list はgeneric vector を作る関数だとマニュアルに書いてある。
R の list は、vectorやmatrixに名前(names()で参照)をつけて保存 するもので、同じ長さのvectorをいくつか束ねると dataframe に なります。 Cのような機械語寄りの言語だと同様の概念はありませんが、 強いてたとえるならば、構造体というよりも、 void型のポインタの配列といったところでしょうか。 JavaやC++のSTLでいうところのコレクション系クラスがしっくり きますね。
472 :
132人目の素数さん :2005/06/22(水) 05:44:43
>471-472 ありがとうございました。勉強になります。
474 :
132人目の素数さん :2005/06/22(水) 20:10:09
>>473 さん
えーと? 僕が誰だかばれているとなると、ちょっとびっくりです。
ですががんばります。
いつか(今年末くらい?)、Rの世界に恩返ししたいので、よろしく。
476 :
132人目の素数さん :2005/06/22(水) 22:03:34
Rで基本統計量を出力するプログラムってどう書けばいいのですか? プログラム例を教えてもらいたのですが・・・。
summary(matrix(c(1,2,3,4,5,6,7,8),nrow=4,ncol=2))
478 :
473 :2005/06/23(木) 15:10:37
>>474 かまかけがあたった(^o^;
RjpWikiの間○先生の書き込みでは出版予定は秋ということでしたが、のびたのね。
どこのどなたか存じ上げませんが、応援しています。
479 :
sage :2005/06/23(木) 21:49:14
おお、○瀬先生関連でしたか。了解です。 まだ延びると決定したわけではないですが、なかなか進まないので、 どうせ遅れるであろうと、すこし遅めに言ってみました。 先生に教えていただくまで、 RjpWikiの存在を知らなかったくらいですから、 (「C言語の構造体」=「R言語のリスト」と言う時点で力量が知れている) あまり期待できるようなものではありませんが、努力いたします。 それではおやすみなさい。
480 :
132人目の素数さん :2005/06/23(木) 22:31:46
特定の数とそれ以外の複数の数から、特定の数のランクだけを取得したい のですが、どうしたらいいでしょうか? 通常のRank関数だと、配列全てに対して表示されてきますが、特定の配列のみの 順位だけを知りたいのです。 よろしくお願いします
mat<- matrix(c(1,200,3,400,5,600),nrow=2) rank(mat[2,]) tapply (mat, c(1,2,1,2,1,2), rank) rankって線形代数のやつじゃないのか…
>>480 非常に泥臭い方法だけど、
> (x <- round(runif(5),2))
[1] 0.07 0.02 0.76 0.81 0.33
で、例えば0.81のランクを知りたかったとする。
> y <- cbind(x,rank(x))
> y[x == 0.81,2]
[1] 5
483 :
132人目の素数さん :2005/06/24(金) 11:43:06
Rwikiも携帯から見れるように最新バージョンにアップしてほしいな
484 :
484 :2005/06/24(金) 20:41:31
√(484) = 22
ありがとうございます。参考になりました。
486 :
132人目の素数さん :2005/06/28(火) 06:31:11
age
487 :
132人目の素数さん :2005/06/28(火) 22:25:46
RからC言語で書いたプログラムは呼び出せるみたいだが、 逆にC言語で書いたプログラムからRを呼び出すことはできないの? MatLabみたいに。
VBとかなからokでは?
489 :
132人目の素数さん :2005/06/29(水) 10:49:44
VC++から呼び出したいんだよね。 誰か方法知らない?
491 :
132人目の素数さん :2005/07/03(日) 09:04:06
NN、descision tree ができるのはわかりました。 ところでアソシエーションルールができるパッケージはないのでしょうか?
492 :
132人目の素数さん :2005/07/10(日) 13:26:57
時系列分析で、ある過程がAR過程かMA過程のどちらに従うか、という 問題はどのようにRで対処すれば良いのでしょうか?
493 :
132人目の素数さん :2005/07/12(火) 19:58:33
行列のベキを計算するのに、以下のような関数を定義したのですが、 power1 <- function(mat, n) { ei <- eigen(mat, symmetric=FALSE, EISPACK=TRUE); d <- diag(ei$values); u <- ei$vectors; return (u %*% (d^n) %*% Conj(t(u))); } これをテストすると、ぜんぜん違う結果になるんです。 > mat <- matrix(c(1,2,-2,3), 2, 2); > power1(mat, 3) [,1] [,2] [1,] -20+5.152129e-16i -17+0i [2,] 37+3.209238e-17i -20+0i > mat %*% mat %*% mat [,1] [,2] [1,] -19 -18 [2,] 18 -1 何か間違っているでしょうか?
octave と比べてみれば? A=[1,-2;2,3];[ev,lbd]= eig(A);ev*(lbd.^3)/ev
for文中の値がsinkで出力できません. 例えば, for (n in 1:10){ sink("hoge.txt") x <- n * 2 x sink()} または, sink("hoge.txt") for (n in 1:10){ x <- n * 2 x} sink() のどちらでも,出力先のファイルは作成されるものの, xの値が出力されないっす. 自分としては,結構いろいろ調べたツモリですが,原因不明. どこがいけないんでしょうか?誰か教えてください.
496 :
31 :2005/07/13(水) 16:44:31
>>495 sink("hoge.txt")
for (n in 1:10){
x <- n * 2
print(x)}
sink()
497 :
495 :2005/07/13(水) 16:57:14
>31さん ありがとうございます. ...自分のアホさ加減に耳から血が出そうですorz
いやー、Rは便利ですね。 データの扱いは簡単だし、基本的な関数は入ってるし、 わかんなかったらここに聞けば的確な答えが返ってくるし。 おかげで、Rばっかり使って、たまにCとかjava使わなきゃいけない羽目に なったとき苦労しますw。
>>492 いろいろやってみて、2乗誤差とかみて決めるんじゃ駄目なの?
501 :
132人目の素数さん :2005/07/15(金) 02:43:25
Rを自分のプログラムに組み込んで何かアプリケーション作った人っています?
502 :
132人目の素数さん :2005/07/16(土) 22:55:57
なんか作って欲しい関数とかない?
503 :
132人目の素数さん :2005/07/16(土) 23:33:52
なんか作って欲しい関数とかない?
萌えAA散布図を生成する関数。
505 :
sage :2005/07/17(日) 00:59:23
よしキター 入力形式はどうするのがいい?
とりあえず萌え.jpgのバイナリを渡して忠実にその散布図化をRでしてくれれば一応使いものにはなる。
507 :
132人目の素数さん :2005/07/17(日) 14:22:08
試行数が30で、成功確率が0.3の二項分布で、 成功数がx回以下となる確率を求める方法と、 その分布関数を図示する方法を教えてください。 調べても分かりませんでした。お願いします。
508 :
132人目の素数さん :2005/07/17(日) 14:41:25
plot(1:30,pbinom(1:30,30,0.3))
509 :
132人目の素数さん :2005/07/17(日) 15:42:57
>>508 ありがとうございます。確率はどのようにすれば求められるか教えていただけないでしょうか?
510 :
132人目の素数さん :2005/07/17(日) 15:43:59
pbinom(x,30,0.3)
511 :
132人目の素数さん :2005/07/17(日) 15:52:25
>>508 ありがとうございます!
何回も悪いんですが…
この二項分布を標準化して正規近似することによって、成功数がx回以下となる確率の
近似値を求め、それを図示する方法も教えていただけませんか(>_<)
512 :
132人目の素数さん :2005/07/17(日) 16:13:49
plot(function(x){pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30))},0,30) par(new=T) plot(0:30,pbinom(0:30,30,0.3)) 正規近似 pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30)) 何の宿題?
513 :
132人目の素数さん :2005/07/17(日) 16:23:34
>>512 本当にありがとうございました。
友達の大学の宿題です。統計は習った事があるので出来るかと思ったら
全然分からなくて…。お騒がせしました(>_<)
514 :
132人目の素数さん :2005/07/17(日) 16:44:27
S-PLUSの「labclust関数」に相当することを、R言語で実現したいのですが、 どうすればいいか、チエを貸していただけませんか? 以下のプログラムは、S-PLUSだと動くのですが、R日本語版だと、 最後の1行で > labclust(葉の位置,label=学生) Error: couldn't find function "labclust" となって失敗してしまいます。 どうかよろしくお願いいたします。 ------------------------------------------------------------- 学生<-c("芥川","菊池","島崎","太宰","夏目","樋口","森") 人数<-length(学生) 果物<-c("ぶどう","パイナップル","りんご","すいか","オレンジ","もも","バナナ","いちご","さくらんぼ","メロン") 果物数<-length(果物) 好み行列<-matrix(rep(seq(果物数),人数),果物数,人数) 好み行列<-apply(好み行列,2,"sample") dimnames(好み行列)<-list(果物,学生) 好み行列 距離<-dist(t(好み行列),m="manhattan") 木の情報<-hclust(距離) 葉の位置<-plclust(木の情報,label=FALSE) labclust(葉の位置,label=学生) -------------------------------------------------------------
515 :
132人目の素数さん :2005/07/17(日) 17:02:54
葉の位置<-plclust(木の情報,label=学生) じゃだめなの?
516 :
132人目の素数さん :2005/07/17(日) 18:17:35
>>515 さん
あっさりできてしまいました!!
ありがとうございます!!
evaluation nested too deeply: infinite recursion / options(expression=)? というエラーメッセージって入れ子構造が複雑すぎて無限再帰になっているという意味ですか? 要素数3000のデータから一つ選んでexp(x)に突っ込むってだけなのになぁ・・・
518 :
132人目の素数さん :2005/07/19(火) 17:44:13
519 :
132人目の素数さん :2005/07/23(土) 10:52:13
eval.c に該当コード有り。evalのし過ぎ。
520 :
132人目の素数さん :2005/07/23(土) 11:29:07
フィボナッチage mfib <- function(n, x) { if (n == 0) x else mfib(n-1, matrix(c(1,1,1,0),2,2) %*% x ) } mfib (4, matrix(c(1,0),2,1)) eigen(matrix(c(1,1,1,0),2,2))
521 :
132人目の素数さん :2005/07/26(火) 02:05:01
identifyは、plotで出力するものにしかできないのでしょうか。 pairsで描画した散布図行列に対して、identifyを行いたいのですが。 identifyで不可能でしたら、そういうことが可能なパッケージがあれば教えていただけませんか。 あともしよろしければ、それを見つけたとき、どんな感じで検索かけたか教えていただけますか。 よろしくお願いします。
522 :
132人目の素数さん :2005/07/26(火) 22:49:09
無いっぽいです。
523 :
521 :2005/07/27(水) 00:10:25
>> 522 ありがとうございます。 こうなったら、どうにかがんばって自作してみます。 (むりっぽいかも)
524 :
132人目の素数さん :2005/08/09(火) 13:45:07
Rで4倍精度の計算はどうするのですか? 宜しくご教示お願い致します。
525 :
132人目の素数さん :2005/08/14(日) 16:13:51
基本的なデータ操作のところでいまだに躓く..... どこかにいい資料ないですかね? DBからとってきたデータが case_no, item, value という並びでcase_noとitemがキーになっている2次元データなので、 解析にかけられるよう列方向にitemを並べたデータフレームを作りたい だけなんですけど。 helpやRjpWikiやR-Tips(書籍)を見てもうまい方法を見つけられません。
526 :
132人目の素数さん :2005/08/14(日) 17:28:00
>基本的なデータ操作のところでいまだに躓く..... どこかにいい資料ないですかね? これはたしかにそうおもうね 数こなすしかないんだろうけど で >DBからとってきたデータが ってのはマトリクス?リスト?
527 :
132人目の素数さん :2005/08/14(日) 17:37:16
>基本的なデータ操作のところでいまだに躓く..... 自分も同じ。 SASが手放せない。 良い資料が欲しいですね。
528 :
525 :2005/08/14(日) 22:35:01
同じように思っている方は多いんですね。 こういったところをしっかり書いた入門書が欲しいですね。 >ってのはマトリクス?リスト? 元はDBから抽出したタブ区切りテキストで、read.delim()で読み込んで データフレームにしています。 元の問題ですが、とりあえず、itemでsplit()したものをcase_noでmerge()すると いう方法でなんとかいけました。 ただ、いっぺんにはmerge()できないのでfor()を使っていたり、「ホントにこんな 面倒なことをしないとできないの?」という感じです。
529 :
132人目の素数さん :2005/08/14(日) 23:28:10
そもそもRってデータマネジメントには向いていないのでは? AWK、PERLを併用するしかないような気がする。 SQLでデータフレームを操れればまだ何とかなるような気もするが。
530 :
132人目の素数さん :2005/08/15(月) 00:21:12
データフレームとして読み込むためにawkで下処理ってのはよくやる RDBMを操るパッケージはCRANにいろいろあるからそれを使うのも一つの手かもしれない で元の問題なんだけどどういうデータがどうなって欲しいのか理解できないので データサンプルとコードを(問題なければ)見せてもらえればアドバイスできるかも
531 :
お盆 :2005/08/15(月) 08:45:54
初歩的なことですが,教えてください. 同一の100人を対象に,同じ調査を2回行いました. 途中で,解説を行い,解説前後の比較を行いたいと考えています.つまり,解説の効果の判定です. 一回目の正解は32人,2回目の正解は63人でした.これを統計的に解析する方法を教えてください. 簡単すぎて,手元の本に載っていないのです.
533 :
お盆 :2005/08/15(月) 08:57:17
132人目の素数さん,レス,ありがとうございます. 統計学の基本知識も乏しいもので,場違いかもしれません. 困っているのは,あまりに簡単すぎて,統計学の本に載っていないことなのです. というより,そもそも調査自体が単純すぎるのでしょうか? 教えてください.
534 :
532 :2005/08/15(月) 10:08:07
>>531 mcnemar testでググってください。
適合度検定を含め、統計の教科書には
スペースの関係もあり、載せられないですね。
χ二乗検定の自由度の計算自体も和書には
なく、Raoを持ち出さないとダメでした。
日本じゃ専門書売れないでしょうね。
Raoの訳書は今でも売っているのかな。
535 :
525 :2005/08/15(月) 11:39:08
>>530 このようなデータがあり、case_noとitemに現れる値は不定とします。
case_no,item,value
"CASE1","ITEM1",1
"CASE1","ITEM2"2
"CASE2","ITEM1",4
"CASE2","ITEM3",5
"CASE3","ITEM2",6
"CASE3","ITEM3"7
ここから、下のようなデータフレームを得たいのです。
$case_no,$ITEM1,$ITEM2,$ITEM3
CASE1,1,2,NA
CASE2,4,NA,5
CASE3,NA,6,7
536 :
525 :2005/08/15(月) 11:39:59
(続き) 試行錯誤の結果、出来たのはこんな感じです。 # ファイル読み込み rawdata <- read.delim( ファイル名, header=TRUE ) # itemでデータ分割 items <- split( rawdata, rawdata["item"] ) # 結果のデータフレームを準備 frame <- data.frame( unique( rawdata["lot_id"] ) ) # 各itemをcase_noでマージ for ( i in names(items) ) { frame <- merge( frame, items[[i]][ c( "case_no", "value" ) ], by=c("case_no"), all=TRUE ) names( frame )[ length(frame) ] <- i }
どっかのに使いやすくて制限がないスプレッドシート式のデータエディタねえかなあ
538 :
お盆 :2005/08/17(水) 17:06:12
132人目の素数さん ありがとうございました. 書き込みできなくて,お礼が遅くなりました.
539 :
132人目の素数さん :2005/08/17(水) 18:57:04
R初心者ですみません。 5万ケタ程度の表集計にRを導入したのですが、100桁ごとに平均をだしたいと思って四苦八苦しています。範囲集計、てどうやってやるんですか?
540 :
132人目の素数さん :2005/08/17(水) 21:13:41
randuが始めから入ってたので使ってみた。 vec<-randu[,1]; mapply(function(x){y<-x*100;mean(vec[(y+1):(y+100)])}, 0:3)
541 :
132人目の素数さん :2005/08/17(水) 23:05:23
HOGE <- function(func, mat, num, n, m) { m<-m/num -1; mapply(function(x){vec<-mat[,x];mapply(function(y){y<-y*num;func(vec[(y+1):(y+num)])},0:m)},1:n) } HOGE(mean, randu, 100, 3,400)
なんだか初心者が増えているみたいで。嬉しいな。裾野は広がっているって感じがする。
>>529 awkもperlも面倒なので、使い捨てシェルスクリプトを書いている。
cut paste cat grep sed tr sort diff head tail ぐらいで十分だ。今のところ。
>>544 おいおい、それらを駆使するぐらいなら
awk,perlの方がずっと楽だぞ。使えるならな。
>>543 ちょっとわかったやつが、初心者の質問の
言葉じりとかにからむ傾向が強いのも特徴。これがなければもっと広がるだろうな
547 :
544 :2005/08/19(金) 11:19:04
>>545 awkは使えないけど、perlは大分鍛えたつもりだが、やっぱりシェルスクリプトの方が
らく。主観の問題だろうけど、perlだと襟を正してデバックしながらやらなくちゃいけ
ない気がする。それなら、むしろRでgrep sub gsub regexpr substr strsplit pasteを
使ってRのスクリプトに加えちゃう。
csvライブラリを使ったrubyもおすすめ。 元CSV >> rubyで列単位で抽出・加工 >> Rのread.csv のような使い方が便利。
549 :
132人目の素数さん :2005/08/20(土) 01:07:39
>>547 Rのスクリプトに加えるってどんな感じっすか?
550 :
132人目の素数さん :2005/08/20(土) 06:57:28
>>535 このような場合,RDBMSから抽出するときに,クロス集計をおこなってテーブ
ルの形式を変換するのが,常套手段かと。
元もとのテーブルをそのままR読み込み,それからクロス集計させても同じ結
果を得ることでしょうが。。。
だれかgrassと連携させてる使っている人います? winでcygwin+grassからだとRを参照するのは無理なんかな〜
552 :
132人目の素数さん :2005/08/24(水) 00:16:41
The GRASS PackageのGRASS.connect()に get.cygwinstring()とset.cygwinstring(cygwin)というのがあるが, 詳しくはワカラソ.使った人おる?
二年。
554 :
132人目の素数さん :2005/09/05(月) 18:11:30
age
555 :
132人目の素数さん :2005/09/14(水) 18:32:31
556 :
132人目の素数さん :2005/09/15(木) 11:13:11
R-help mailing list に話題が挙がってたね。
557 :
132人目の素数さん :2005/09/15(木) 22:00:18
ベルヌイ分布 2項分布 ポアソン分布 正規分布 指数分布 ワイブル分布 の形状を把握、及びそれらの平均と分散を R を使って計算。。。 って出来る方います?
559 :
132人目の素数さん :2005/09/15(木) 23:37:55
Rってmulti-threadな処理ってできますか?
561 :
132人目の素数さん :2005/09/19(月) 19:27:16
>>559 それなら、自分で考えなさい。
>>560 R本体にはスレッドコントロールをするAPIはないような感じ。
マルチスレッド版のBLASを使うぐらいか。
R-helpにはRVPMっていう名前がでてきたけど、ぐぐってもひっかからない...
562 :
560 :2005/09/20(火) 12:10:34
>>561 レスどうもです。どうしてもマルチスレッドやりたい時は
perlからマルチスレッド立てて、perlからRを走らせるとか、、
が自分の思いつく方法なのかなぁ・・・ってできるんだろうか。
つまらん話だが、Rってググるとき困るよな。 もちっと特徴的な名前だったらよかったのに。 みんなどうやってる? 俺は「R 統計」とか。R言語と呼ばれる機会も意外と少ないし。 まあRjpWikiのおかげでググる必要あまりないっつーのもありますが。 感謝です。>>Rjp関係者
>>563 「R 時系列」とか「R 生存時間」とかより
「Rを 時系列」とか「Rで 生存時間」のほうが
若干良いような気はする。
R statistics
566 :
132人目の素数さん :2005/09/23(金) 13:42:00
567 :
132人目の素数さん :2005/09/26(月) 09:42:52
二要因分散分析はできたんだけど、 そのあとのpost hoc testはどうやってやればいいの?
568 :
132人目の素数さん :2005/09/26(月) 13:10:06
569 :
132人目の素数さん :2005/09/27(火) 22:06:53 ID:0
例えば下記のデータで
x <- read.csv("test.csv")
for(i in c("A","B")){
plot(x$i)
}
とするとどうもうまくいかない。
データフレームにしてfor(i in 1:2){x[,i]}
とすればいい話なんだが解決策どなたかご存知?
##テストデータ test.csv
year,A,B
1991,50,100
1992,40,300
1993,30,500
>>525 CRANのサイト内をググってもダメ?
あとはgoogleでfiletype:.R として拡張子指定でググルとかソースしか出てこないけど・・・
570 :
132人目の素数さん :2005/09/27(火) 22:30:35 ID:0
>>569 for(i in c("A","B"))のままでも
plot(x$i) を plot(x[,i])にすれば通ると思うけど...
どううまくいかないのかがわからない...
571 :
132人目の素数さん :2005/09/28(水) 17:32:03
>>579 あ”、間違えてた。すみません。
こないだは、うまくいかなかったのは
データのA=1991 B=1992 で、
for(i in c("1991","1992")){ ・・・
としたときだった。as.characterとか駆使したんだが・・・
572 :
132人目の素数さん :2005/09/28(水) 21:44:23
やりたいことは、データフレームにyearで検索をかけたいということ? grep()等もありうるけど、これでどうだろう? cond <- is.na(x$year) # 結果が FALSE FALSE FALSEになれば別の式でもOk for(i in c("1991","1992")) cond <- cond | x$year == i plot(x[cond,c("A","B")]
573 :
132人目の素数さん :2005/09/30(金) 20:10:08
sjava わかる人いますか?
574 :
132人目の素数さん :2005/10/02(日) 18:21:17
>>572 そんな感じですが、要はAを1991とかBを1992とか数値にした場合にForがまわらないということなのですが・・・
相関ルールを見つけるパッケージってありますか?
arules
578 :
575 :2005/10/05(水) 11:54:08
ありがとうございます
580 :
132人目の素数さん :2005/10/08(土) 14:40:01
names と rownames の違いを教えてください
Rで定義されている関数内でどのような計算がされているのかが知りたく, 定義式を見てみたいのですがどうすれば見れるでしょうか? 具体的にはshapiro.testなのですが, インストールフォルダ\library\stats を探してみたのですが,説明文らしきものは見つかったのですが関数そのものは 見つかりませんでした
>>582 R 上で () をつけずに呼び出せばどう?
locate shapiro grep shapiro `locate /usr/ |grep \\.R$` or grep shapiro `find /usr/ -name \*.R` windowsならcygwin入れるべし。
585 :
sage :2005/10/21(金) 16:43:48
>>582 583の方法でよいと思われる「shapiro.test」とするだけで・・・
あるリスト「 L 」内の同じ行列数の複数のデータフレーム同士の
平均を求めたいのですが、
mean(L[[1:3]])とはできないようで、いい方法あります?
とりあえず
(L[[1]]+L[[2]]+L[[3]])/3
とやればできるのだが、もっとうまいやり方がありそうですが・・・
しまった、あげちゃったOTL
>>585 mean(unlist(L)[1:3])
>もっとうまいやり方がありそうですが・・・
っと言って他人の力を借りるのは、Rくらいの言語を自力で作れるくらいになってからにしましょう。
もっとうまいやり方は Rを使わないという手も含めて無数にありますから。
改良 list.filter <- function (classListLis, classListFunc) { classListLis[unlist(lapply(classListLis, classListFunc))] } list.asMatrixBy <- function (lis,func) {func(unlist(lapply(lis,func)))} list.mean<- function (x){list.asMatrixBy(x,mean)} list.mean(A[1:3]) list.mean(A[c(1,2,3)]) list.mean(list.filter(A, is.numeric))
先生ありがとうございます。 関数の作り方も含め勉強になります。 これを参考に自分で書いてみます。
590 :
132人目の素数さん :2005/10/23(日) 00:28:10
dist関数でマハラノビス距離を求めることはできないのですか?
help(dist) help(mahalanobis)
592 :
132人目の素数さん :2005/10/23(日) 18:10:25
関数:f(x)を最小にするxを見つけたいんですが、どんな関数を使ったら、 早いでしょうか? (教えて君ですんません(鬱。)
593 :
592 :2005/10/23(日) 18:15:59
optim()とかそんなところでしょうか?
594 :
587 :2005/10/23(日) 23:10:35
「もっとうまいやり方」についてとやかく書いたのは、
綺麗で高速なプログラムの書き方を追及するよりも
自分の仕事をしっかりやりなさいって意味であり、
教えて君ですんませんって書けという意味ではありません。
>>592 「全ての集合」とか言うと論理が破綻するので、
x は doubleのvector とか言った方がよい。
optimでは微分系のが速いと思うけど問題によりけり。
595 :
困ってます :2005/10/25(火) 21:55:40
知識が無くて困ってます 18.514.818.416.416.115.415.415.3 8項目の平均が16.287 標準偏差が1.422 です。 ばらつきの大きさがどの程度なのかを知りたいのですがどうすればよいでしょうか。 教えてください
1.422
>>595 ばらつきの大きさがどの程度なのかを知るための数値が標準偏差です。
数値をみて判断するのは、比較対照がない場合は主観です。
私の主観では、標準偏差が0.1程度ならほとんどが16のあたりに固まっている。ばらつきがない。
10ならかなりばらばら、1.422ならそれなりにばらばら。
hist()の間隔を指定したいのですが、breakes=c(0,1,2,3)とはできますが、 最大最小を気にせずこの間隔だけ(上記の例なら1) を指定して描くことはできないでしょうか?
>>595 データが正規分布に従うと仮定してCritical Intervalを計算したよ。
95%で [15.098, 17.477] でした。
この範囲が母平均を含む確率が95%だよ、ということ。
観測平均が16.287だから、まぁそれなりなんじゃないかな、と。
(蛇足:標準偏差のCIは [0.94066, 2.8956] でした。)
>>600 :観測平均が16.287だから、まぁそれなりなんじゃないかな、と。
ちょっと意味不明。
shapiro.tstすると
Shapiro-Wilk normality test
data: x
W = 0.8322, p-value = 0.06263
ですね。
ワイブル分布のパラメータ推定で..非線形回帰か関数の最適化でいけるはずと思って
やってみたが(だから,コードといっても,要は分布関数にfitさせるだけなんだが),
optim()ではどうもうまく推定できなかった。非線形回帰では,初期値をある程度適当に
とれば,それなりにいい結果が得られるようであった。これで十分な精度かどうかは
不明だが,悪くはないと思う。なお,なんらかの確率密度関数に従うと思われるデータxの
近似曲線をプロットするだけなら,plot(density(x))とすればいい..
ttp://phi.ypu.jp/swtips/Rnewsarchives2.html
603 :
132人目の素数さん :2005/10/31(月) 05:24:23
age
604 :
132人目の素数さん :2005/11/11(金) 07:23:31
敷居が高いクソ統計ソフト、とか思っていたが、Rコマンダーってのを入れたら、感覚的に使いやすくなった感じがする。 Rユーザーがこれを宣伝しないのは何故?
WINのJGRやたら重かった
607 :
132人目の素数さん :2005/11/12(土) 04:50:41
>>605 dクス。
ますます敷居が下がりました。
>>604 > Rユーザーがこれを宣伝しないのは何故
たぶん、慣れた人は使わないからじゃない?私の場合は、emacsからRを操作する方が効率がい
いし、生産性が高いから、emacs+essばかりになっている。Rユーザの多くは、「Rcmdrを使っ
ていない=紹介できない」という状態だと思うよ。
>>604 試しに計算センターのPCにインストールしたら、
起動するのみメチャ時間がかかり、とても講義に
使えませんでした。
610 :
132人目の素数さん :2005/11/13(日) 01:58:23
>>609 確かにローディングはちょっと遅くなったが、こっちのパソコンではそれほど気にならなかった。
エクセルのローディングの方がはるかに時間が掛かる。
どの道、初心者向けとしてはRcmdrは悪くないと思う。
機能的に不満が募っていけば、その内RのCLIやりたくなってくるかも。
もうちょっと色々な機能をRcmdrのプルダウンに実装出来ればもっと良かった。
せめて『Live 2ch』くらいのボタン数とかあればなあ・・・・・・。
そーゆーの作って、エロイ人
611 :
132人目の素数さん :2005/11/13(日) 07:01:48
だいたい100万個データを入れると、逝ってしまうのが多い
612 :
132人目の素数さん :2005/11/13(日) 07:02:55
ベクタープロセッサーを搭載した、200個並列のマシンが必要です
200個並列って、半端な数だなー。
614 :
132人目の素数さん :2005/11/14(月) 16:53:54
Rにはエクセルで言う『Solver』みたいな機能ありますか?
変数の数がケース数より多いデータはRでは主成分分析できないんですか? princomp()ではエラーがでてしまいますね。 青木先生が公開されている、pca()、princomp2()もやっぱり同じようなエラーがでてしまいます。 Rwikiのリンクを参考に調べてみたんですが、うまい解決法が見つからなくて…。 prcomp()ではとりあえず分析してくれるのですが、princomp()との違いは何なの?
616 :
132人目の素数さん :2005/11/26(土) 07:00:30
age
元々、変数の数がケース数より多いときって主成分分析できましたっけ?
618 :
617 :2005/11/28(月) 02:02:58
あ〜そうだ、線形独立なベクトルをケース数より多く作れないから、 変数の数がケース数より多いとだめなんじゃない?
転置したらどないですか
>>619 計算はできるだろうけど意味合いが変わらない?
621 :
132人目の素数さん :2005/11/30(水) 14:03:01
622 :
132人目の素数さん :2005/11/30(水) 20:07:05
転置無用
624 :
132人目の素数さん :2005/12/07(水) 19:10:27
age
Rはお節介で動きが読みにくい関数が多く感じる
具体的に
ANOVA、任意の2群に対してt検定をしたいのですが、オブジェクトがないと言われます。
CSVファイルからデータ入力はできました。
どうやら、objectとして認識して欲しい物が
objectとして認識されていない事が問題なのではないか。
というところまではわかりました。
私としては「AO」や「B0r」などがobjectとして認識されると有り難いのです。
その上で「AO」と「B0r」でt検定をしたいのです・・・
手入力も試みましたが、今度は表全体(x)をobjectとして認識させる方法?が分からずに困りました。
>>2 のページは見たつもりです。
かなり格闘しましたが、暗雲が立ち込めています・・・
回答もしくはヒントを与えていただけると有り難いです。
628 :
627 :2005/12/17(土) 01:40:37
ちなみに 「str(x)」に対しては `data.frame': 5 obs. of 12 variables: $ A0 : num 63.6 64 63.9 61.5 63.1 $ A0r: num 53.2 61.7 54.5 53.9 53.8 ・・・(中略) $ B8 : num 85 85.3 87 87 85.7 $ B8r: num 77.1 75.2 76.5 77.8 78.3 「x」に対しては A0 A0r A4 A4r A8 A8r B0 B0r B4 B4r B8 B8r 1 63.6 53.2 80.8 72.6 84.8 78.1 63.8 57.3 76.9 72.8 85.0 77.1 ・・・(中略 5 63.1 53.8 80.8 73.1 86.1 76.9 60.2 55.6 77.1 73.1 85.7 78.3 「objects()」に対しては [1] "x" 「A0」に対しては エラー:object "A0" not found 「t.test(A0,B0)」に対しては、当然ですが 以下にエラーt.test(A0, B0) : object "A0" not found と出力されます。
629 :
132人目の素数さん :2005/12/17(土) 19:09:18
age
630 :
627 :2005/12/18(日) 01:17:19
>>627 自己レスですが、
A0 <- x$A0
などとする事で解決しました。
正攻法ではない気もしますが、、、
631 :
132人目の素数さん :2005/12/18(日) 02:56:32
>>630 正攻法かどうかは知らないが
t.test(A0,B0,data=x)
とか、
attach(x)
t.test(A0,B0)
なんて方法もあるよ
632 :
132人目の素数さん :2005/12/18(日) 23:15:24
>>630 ごめん。
t.test(A0,B0,data=x)
はだめだ。
t.test(データ ~ グループ化因子 , data=x)
じゃないと。
633 :
627 :2005/12/19(月) 00:49:53
>>632 レスありがとうございます。
データをどう認識してもらうかってのが苦戦してました。
attach()が便利そうですねぇ。一つ賢くなりました。
あと、検定の方はおかげさまでうまくいきました!!
本当にありがとうございました。
624
635 :
132人目の素数さん :2006/01/06(金) 12:35:26
<- の代わりに = を使うと,何か問題が起こったりするんですか?
>>635 精神衛生上の問題だけじゃないの?
矢印の方が付値のイメージに合ってるかもしれないけど
オレは他の言語で慣れてるし、タイプしやすい「=」のが好き。
あと、「->」と「<-」の使い分け程度の差なんじゃないでしょうか。
あ、あと等号「==」と付値「=」の混同を防ぐためでもあるのかな。
638 :
635 :2006/01/09(月) 23:25:51
問題ないですよね。ありがとうございました
>>636 精神衛生上というのは同意。代入は <- で関数のオプションは = だとなんだか安心。
<- もESSだとアンダーバー1ストロークで入力できるので、私の場合は変わらない。
ESS (Emacs Speaks Statistics) なんていうものがあったんですね。 Emacs使いとしては嬉しい限り。早速使ってみます。
やっぱ無保証のソフトを信じすぎるのもアブナイね。
>>641 まぁソフトウェアにバグはつきもの。
そして、売り物でも使用許諾契約に「No Warranty」が明記されているものがほとんどだという罠。
SASでもSPSSでもS-PLUSでもRでも, WindowsでもLinuxでも, 信じすぎるのはまずい。
Rにチャレンジしようと思っているのですが、散布図行列を表示するまでを学べるサイトってないでしょうか? R2.2にコマンダーを入れています。 Wikiは基本的に知識のある人向けみたいでしたので基本的な操作などのその手前で悩んでる人向けの サイトが見つかりません。
644 :
132人目の素数さん :2006/01/16(月) 09:35:24
質問なのにSAGEてました。スマソ
>>643 初心者向けの説明はある程度系統立てて執筆する必要があるから、メモ感覚で書き込めるWikiにはそぐわないのかもしれない。
Rcmdrの使い方というのはないかもしれないけど、R-Tipsがよいのでは。Commander自体の使い方は見ればわかるから、知りたいのは
おそらくデータフレームとは?みたいな部分だろうし。
最もお手軽にはじめたいなら、最近は入門書もたくさんあるので(Wikiのリンク集参照)読むべし。
>>643 『工学のためのデータサイエンス入門』のp.8に散布図行列表示の例アリ。
pairsのコマンドを使うみたい。
Rのおまけに付いてるデータで"airquality"ってデータがあるから、それで試して見ればイイと思う。
Rコマンダーでは、まず、
『データ』→『パッケージ内のデータ』→『アタッチされたパッケージからデータセットを読み込む』
でポップアップが出てくるから、そこでパッケージで『datasets』を選択、データセットで『airquality』
を選んでOKボタンをクリックして下さい。(かなり下の方にあります。Rでは大文字と小文字を識別
するので、大文字のA〜Zの表記のアトに小文字のa〜zが来ます。)
そしたらRコマンダー上でデータセットでairqualityが選択されている状態になる筈です。
そこでRコマンダー上のスクリプトウィンドウに次のコードを入力します。
(data(airquality, package="datasets")って表示されてるでしょうが、次の行から入力して構いません。)
pairs(airquality, panel = panel.smooth, main = "airquality data")
そして今書いたコードをマウスで選択して色を反転させて、右クリックボタンで『実行』を選びます。
そうすると散布図行列が表示される筈です。
多分これで上手くいく筈だと思います。
Rcmdrはヘンなバグがあって、R本体では問題なく動くコードがRcmdr上では動作しない場合もあるんで、
あんまり信用しすぎない方がいいでしょう。
Rcmdr上でも散布図行列のプルダウンメニューがありますが、こちらで試したところ、変数選択でのスクロール
ウィンドウが突如正常に動き出さない、と言ったような現象も見られました。
>>647 >基本的にRコマンダーの基本的な使い方
すいません。バグりました○| ̄|_
>>645 レスありがとうございます。
R-Tipsでテキストデータの読み込みから勉強していきます。
>>646-647 教えてあげた例できちんと表示できました。
Wikiの例を見ると、色分け表示も出来るみたいですしファイルを読み込むことが出来たら色々とチャレンジしてみます。
また壁にぶつかったら皆様よろしくお願いします。明日の夕方までを目標にがんがります。
>>651 あっ、四苦八苦してたらレスがw
ありがとうございます。読んでチャレンジしてみます。
エクセルのファイルを読み込もうとしたらRODBCを使って色々と書かないといけないみたいなので、
CSVかプレーンテキストに変換しようとしてました。
>>652 RODBC使用されてるんですか。
RとExcelって相性悪くって一般ユーザーにはキツいですよね(笑)。
元々研究室でシコシコやる為に開発されてるトコがあるみたいなんで、Rは汎用ソフトとしては確かに
キツいニュアンスがありますよね。あんまり親切な設計ではないと僕も思います。
RODBC使わないでも、Excel側で『ファイル』→『名前を付けて保存』を選び、ファイルの種類をエクセル
ファイルではなくって、テキスト(タブ区切り)かCSV(タブ区切り)を選択して保存したあと、Rcmdrから
『テキストファイルをインポート』するのが一応常套手段だと思います。
他にもRExcel
http://www4.kcn.ne.jp/~felix/Softwares/R/RExcel.html と言うのがあって、これはExcel上からRを操作できると言う謳い文句・・・・・・の筈なんですが、残念ながら
これもバグが多いようです(涙)。
僕のExcelにも実装しましたが、マトモに動いた例がありません(涙)。
普通にカンマ区切りファイル経由の受け渡しで困ったことがないので、 なぜここでつまづく人が多いのかわからない... Excelのデータって一度インポートしたら、あとの加工やグラフ作成は全部Rのほうが カンタンにできるから, XLSブックを直接読める必要はあんまりないと思うけど。
↑あ、『カンマ区切りファイルの受け渡しでも』ですね。
>>655 具体的にどのようなファイルで、
「データフレームとして認識してもらえなかったり、
またインポートされてもアタッチできなかったり」
したことがありますか?まだそういう経験がないので勉強させてください。
また、bug report はされていますか?もしされたならばちょっとみてみたいので
R-develの番号を教えて下さい。
(そのあたりのソースをちょっといじってるもので...)
>>658 やはり日本語の場合でしたか。
カンマ区切りファイルは文字コードの情報を持っていないし、Excelの専売特許と
いうわけでもないので、Windows環境でもShift_JISとUTF-8のテキストが混在するように
なった現在、どちらかなのかを明示的に指定(2.2.0以降だとできると思います)しないと
読めないのもやむを得ないかなと思います。文字コードの自動判定機能を日本語の場合だけ
入れるというのも不適切だし...
ファイル名も同様です。Win98/MeだとShift_JISで、2000/NTはUTF-8ですよね。でも98/Me
がShift_JISなのも日本だけの話だから、本家のコードに組み込むのもよくないし...
Officeのように、いつまでも日本語版、英語版、中国語版、韓国語版、ヨーロッパ版と
分けて使わなければならない状況よりは、多少文字コードの明示的指定の手間は増えるけれども
1つのバイナリですべての言語環境に対応できたほうがよいだろう、ということでこういう形に
なっているのだと思います。本来こういう文字コード変換はOS側でやってくれるべきものだから、
国際化時代以前のOSの限界なのかなぁと思ったり。
次期Officeの標準XMLフォーマットなら内部に文字コード情報を含んでいるから、Rでも
(最初はパッケージが何か必要かもしれませんが)そのまま読める期待は大です。
>>658 それは、Rの問題と言うより、データファイルの扱いの一般常識に欠けているのが原因だと思うけど。
HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。日本語ファイル名を読めたり読めなかったり違いは、想像するにShift-JISコードを使っ
ていて、文字の1バイト目にバックスラッシュ(円記号)がある場合でしょ。これを知らないとCGIを
書いているときにも文字化けで悩まされる。いわば、日本語文字コードの不具合。
まぁ、現実的な解として、kakasiでファイル名をローマ字に自動変換してからインポートするバッチ
ファイルをかませて、見かけは日本語ファイル名を指定してそのままインポートするようにすればよ
いのでは。もしくは、UTF8をファイル名の文字コードに採用しているWindows2000などに変更するとか。
>>659 なるほど。どっちかと言うとWindows側の問題なんですね。
>>660 >HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。
ただし、言っておきますが、全員が全員HPを持ってたりファイルサーバを運営しているわけではないのです。
それを『一般常識』と言っちゃうのはどうかと思います。
逆に言うと、『そのぐらいの知識がなければRは使えない』と言うご意見ならRは単に『一般向けソフトではない』
と言った意味になります。
ファイルの互換性が高い方が『一般向け』ではあるのですから。
>>661 確かに一般常識というのは言い過ぎたかも知れないけど、一般的な国際的ソフトウェアを
扱う場合には知らないと苦労する知識だと思う。Rは世界の人々を対象とした一般向けで
あり、『日本人向けに特殊化されたソフトウェア』ではないと思う。あなたは、日本語を
使う特殊な人口集団向けのソフトウェアを『一般向けのソフト』とよぶのかい?
Rをあたかも『日本人向けに特殊化されたソフトウェア』として扱おうと無理をするとそれ
なりの知識が必要になる。
663 :
659 :2006/01/17(火) 15:42:00
>>662 おっしゃる通り、R好きとしては現在では日本語を扱うときのちょっとした不具合は
ある程度しょうがないものとして受け入れてほしい。
でも、日本人としては日本語のファイル名もコンテンツも全くシームレスにあつかえたほうが
確かに幸せ。
現状、WindowsもMacOS XもShift_JISの亡霊を引きずっているところが多少残っているし、
LinuxはX11をまだ切れないし、
海外ツールの本家バージョンでそのまま日本語がたいがい通る、というところにいきつくには
あと2,3年は必要なのかなぁ。
664 :
132人目の素数さん :2006/01/19(木) 19:21:51
Rでの直交表実験の解析について教えてください。 分散分析表はaov(データ ~ . , データと計画行列のデータフレーム)で求まることはわかったのですが 1.このときの最適水準を求める方法 2.最適水準での母平均の点推定と区間推定 3.最適水準と他の水準との母平均の差の点推定と区間推定 の方法がわかりません。 これらを計算してくれるパッケージや関数はありますか?
665 :
132人目の素数さん :2006/01/24(火) 03:33:40
学校の情報処理論というコンピューター演習の授業の宿題で、以下のキーワードを使って データ予測のための統計と検定について150字程度で説明しなければならないんですが、 いまいちよくわかりません。 よければ誰か教えてください。 キーワード:基本統計量,検定 ポイント: データを予測するまでの流れ 分析手法としての統計量 検定と予測の関係
>>665 宿題は自分で考えれ。統計の教科書を見ればすぐわかる。
Webで調べるなら「検定」だけだと少しつらいかな。「統計学的検定」で調べてみ。
667 :
132人目の素数さん :2006/01/31(火) 23:45:22
非線形回帰のr^2値やF検定は可能? もし可能ならその理論的根拠は? 例えば、回帰関数が意味がないとしたときに、ある既知分布に従う検定統計量が見つかる?
773
669 :
132人目の素数さん :2006/02/17(金) 00:47:58
>>669 何を今頃。でも、この本は入門者にお薦め。
671 :
132人目の素数さん :2006/02/22(水) 02:21:55
lmとpolyを組み合わせて1つ以上の変数に関する多項式を生成したうえであてはめを行えばよい。。。。。。。。ってどいうこと? lm polyってなんね?
672 :
132人目の素数さん :2006/02/22(水) 02:36:13
うーん、わからね
673 :
132人目の素数さん :2006/02/22(水) 02:49:37
散布図をRcommanderから表示させると、データが100〜120の範囲にあるのに、 空白のデータを0と認識してしまいグラフがいびつな形になっていて使い物になりません。 空白のセルを0ではなく、NAとして認識させるにはどうすればいいのでしょうか? 元データはCSVファイルカンマ区切り、データが空白のセルはNAではなく完全に空白です。 データセットを取り込むときに空白に設定しても駄目でした。
674 :
132人目の素数さん :2006/02/22(水) 03:19:06
predict.gamって何? どこしらべてもわからん。
675 :
132人目の素数さん :2006/02/22(水) 09:02:43
ガーン,図のなかに日本語使えるの 今日はじめて知りました.すごい,すごすぎる! もうSASやめます.SPSSも捨てます. Rについていきます.船尾さんの最新の 本読むまで,図に日本語つかえないと思っていた 私はアホですか?
>>675 いまどき、こんな人がいるんだ。まだまだ啓蒙不足だな。
図に日本語を使えるかどうかでいえば、ずいぶん昔から使えていたよ。
ただ、1文字1文字コード番号を指定するような感じで気軽には使えな
かったし、文字数も限られていた。
それから、PSfragを使えば日本語は全く問題がなかった。
>>674 RSiteSearch("predict.gam")
は実行してみた?
678 :
673 :2006/02/22(水) 19:38:12
相手してください。。。。。orz
>>673 コンマ区切りならテキストエディタで事前に
NAに変換しておくというのはだめなん?
680 :
132人目の素数さん :2006/02/25(土) 23:35:29
681 :
132人目の素数さん :2006/02/25(土) 23:37:18
682 :
132人目の素数さん :2006/02/26(日) 06:15:52
教えて下され 確率p=0.5からなる二項分布で信頼区間を95%としてその範囲が±0.01(pの±1%)となるには、試行回数nは何回必要になるのか、 求める式も知りたいです 関連のサイトをいろいろ見てみたのですが専門用語とか出てきて分かりません あと確率pと試行nが設定された場合の推定範囲の求め方も知りたいです お願いします
683 :
132人目の素数さん :2006/02/27(月) 00:29:35
Rの2.21にRcommanderを使用しているのですが、散布図行列で左下に散布図、クロス部分にヒストグラム、
右上に相関係数を表示させるにはどのようにすればいいのでしょうか?
http://www.okada.jp.org/RWiki/index.php?cmd=read&page=%A5%B0%A5%E9%A5%D5%A5%A3%A5%C3%A5%AF%A5%B9%BB%B2%B9%CD%BC%C2%CE%E3%BD%B8%A1%A7%BB%B6%C9%DB%BF%DE%B9%D4%CE%F3 のサイトを参考に
pairs3 <- function () {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
png("pairs3.png") # png デバイスを開く
pairs(Dataset, panel=panel.smooth,
cex = 1.5, pch = 24, bg="light blue",
diag.panel=panel.hist, cex.labels = 2, font.labels=2,lower.panel=panel.smooth, upper.panel=panel.cor)
dev.off()
# postscript
}
などとやってみたのですが、駄目でした。
Rcommanderの散布図行列コマンドScatterplotにupper.panel=panel.corを追加したりもしたのですが、同じく駄目でした。
どなたかよろしくお願いします。
pairs3 <- function (Dataset) { oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避 on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰 panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義 { usr <- par("usr") # 現在のユーザー領域座標情報を得る on.exit(par(usr)) # 関数終了時に usr パラメータ復帰 par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更 h <- hist(x, plot = FALSE) breaks <- h$breaks; nB <- length(breaks) y <- h$counts; y <- y/max(y) rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...) } panel.cor <- function(x, y, digits=2, prefix="", cex.cor) { usr <- par("usr") # 現在のユーザー領域座標情報を得る on.exit(par(usr)) # 関数終了時に usr パラメータ復帰 par(usr = c(0, 1, 0, 1)) # ユーザー領域変更 r <- abs(cor(x, y)) txt <- format(c(r, 0.123456789), digits=digits)[1] txt <- paste(prefix, txt, sep="") if(missing(cex.cor)) cex <- 0.5/strwidth(txt) text(0.5, 0.5, txt, cex = cex * r+0.5) } # png("pairs3.png") # png デバイスを開く pairs(Dataset, diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor) } こんな感じかな。例)pairs3(iris[,1:4])
>>684 様
レスありがとうございます。
きちんと動作しました。
教えて君で申し訳ないのですが、プロット点の色を変える方法と、プロットを丸ではなく、
点にする方法、平滑線ではなく最小二乗線にする方法を教えていただけないでしょうか?
Wikiを参考にしながら、"red"やpch = "."を挿入したりしてみたりしたのですが、うまく動作しなくて。。。
あともう一つなのですが、相関係数を計算するときに1000近いデータ中に一つでもデータに空白があると
>cov/cor 関数に欠損した観測値があります。
とエラーになってしまいます。
そのデータを削除すること以外で、このエラーを回避する方法がありましたら教えてください。
686 :
684 :2006/02/28(火) 19:56:24
>>685 ウィザードでないので複雑な図形制御は分からないです。
しかし、欠損値の解除は分かります。
>>684 で
r <- abs(cor(x, y, "complete.obs"))
とすればOKです。
687 :
684 :2006/02/28(火) 20:38:51
図形引数の受け渡しは分かりました。直した関数を載せます。 回帰直線を入れるにはpanel.smoothという関数を別途入れ替える必要がありそうで無理。 ---------- pairs3<-function (Dataset, ...) { oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避 on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰 panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義 { usr <- par("usr") # 現在のユーザー領域座標情報を得る on.exit(par(usr)) # 関数終了時に usr パラメータ復帰 par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更 h <- hist(x, plot = FALSE) breaks <- h$breaks; nB <- length(breaks) y <- h$counts; y <- y/max(y) rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...) } panel.cor <- function(x, y, digits=2, prefix="", cex.cor, ...) { usr <- par("usr") # 現在のユーザー領域座標情報を得る on.exit(par(usr)) # 関数終了時に usr パラメータ復帰 par(usr = c(0, 1, 0, 1)) # ユーザー領域変更 r <- abs(cor(x, y, "complete.obs")) txt <- format(c(r, 0.123456789), digits=digits)[1] txt <- paste(prefix, txt, sep="") if(missing(cex.cor)) cex <- 0.5/strwidth(txt) text(0.5, 0.5, txt, cex = cex * r+0.5) } # png("pairs3.png") # png デバイスを開く pairs(Dataset, panel=panel.smooth, ..., diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor) } ---------- 例)pairs3(iris[,1:4], pch=24, bg = c("red", "green3", "blue")[unclass(iris$Species)])
>>686-688 レスありがとうございます。
欠損データがあっても相関値を求めることは
>>686 の方法で出来ました。
あと、最小二乗法の計算方法も
>>688 の方法でできました。
でも、色を変えることと、マークを丸から他のものに変えることはできませんでした。
pch="."やpch=3などと変えてみたのですが変わりませんでした。
色々とやっているのですがうまくいきません。
ここのところ聞きまくりなので、今晩四苦八苦してみます。
690 :
684 :2006/03/02(木) 07:22:04
>>688 サンクス!
>>687 にこのpanel.lsfitを組み込んでlower.panelをそのpanel.lsfitにすればOKみたいだね。
>>689 自分で考えるのも勉強になっていいと思うよ。
で、一晩経ったので、俺の見つけた答を書いておくと
panel.lsfitで
lines(xx,yy, col="red")
points(x,y, ...)
とすれば、
>>687 の例にも対応できて直線も赤になる。
また、最後のpairsでpanelの設定は要らないので取ってしまってもちゃんと動くようだ。
691 :
132人目の素数さん :2006/03/02(木) 16:00:28
age
Scilab, Octaveは数式処理はほとんど無理 maximaのほかにRisa-Asirとかあった気が。
693 :
692 :2006/03/02(木) 21:42:01
すごい過去にレスしてしまった。 無視して下さい。
>>690 レスありがとうございます。
そちらの線もそうなのですが、実際の観測値が黒の丸になっているのでそれを変えようと
色々とやっているのですが、色も形も変えられないもので。。。
695 :
132人目の素数さん :2006/03/02(木) 23:58:40
皆さんは、日次データの分析ってどうされてますか? たとえば、金融時系列データだと土日の市場が開いていない期間のデータを どう扱うかに苦慮しています。 パッケージのtserieを使っても、日次データなのでFrequency=365として しまうと、土日含みになってしまいます。対応方法ってありますでしょうか?
696 :
684 :2006/03/03(金) 23:36:49
697 :
132人目の素数さん :2006/03/04(土) 18:31:13
Rで入力補完機能って無いのかね。 あると便利なんだけど。
ちょっとお伺いしたいんですが、ライブラリーのRmpiをインストールしようとすると、 ld; can't locate file for: -lcc_dynamic と出て失敗してしまうのですが、なにか良い解決策はないでしょうか? 環境は MacOSX 10.4.5 CPU:G5 R 2.2.0 です。
>>698 buildでコケる時はソースを/tmpにでも展開してMakefileいじってまた固めて
R CMD INSTALL 固めたファイル
ってやってる。
当然アップデートの度にやる羽目になるがな。
>>697 ESSがあるから別にRが内部的に入力補完機能を持つ必要はないんじゃない?
>>698 Tiger特有の問題のような気がする。
sudo gcc_select 3.3
で直るかも。
>>697 Mac版(GUI)では標準で補完機能付き。WindowsならJGRで。
>>698 Rmpiって色々と躓く部分が多いから注意が必要
703 :
132人目の素数さん :2006/03/06(月) 08:47:47
>>700 Win環境じゃ無理でしょ。
MeadowやらCygwinEmacs等は使いにくいし。
趣味や研究でやっている人以外はWin環境なんだから
そこら辺を考えてもらいたい。
>>703 >
>>700 > Win環境じゃ無理でしょ。
> MeadowやらCygwinEmacs等は使いにくいし。
> 趣味や研究でやっている人以外はWin環境なんだから
> そこら辺を考えてもらいたい。
かんがえたくないんでしょうねぇ、きっと。「Win?へ〜んなものつかってんだねぇ〜」って感覚なんでしょうねぇ。
ソースは公開されてるんだから、自分で作れば良いのに。
>>706 Macでは日本語表示が出るようだけどWinでは出ないのですが、
無理ですか?(起動時のエラーを回避するのにも相当時間がかかった。)
> 趣味や研究でやっている人以外は... 研究または趣味のソフトじゃなかったのか。。。 Windowsユーザとかそんな底辺層にまでRが普及し始めているとは嬉しい限り。 でも、Windowsユーザが入力補完機能なんて言葉を知っているとは思えないんだが。
709 :
697 :2006/03/07(火) 21:33:00
微妙に荒れてますなw 結局FreeBSDにWindowsからESS+SSH転送+PC Xサーバ使ってます。
>>696 レスが遅れてすみません。
きちんと動作しました。ありがとうございました。
Widowsって2GB以上のメモリは使えないのでRがそのまま落ちるらしいけど、 MacOSXな人はどうですか?
> Windowsユーザとかそんな底辺層 > Windowsユーザが入力補完機能なんて言葉を知っているとは思えない こんなこと思ってる、しかも2チョンに書き込んじゃうバカがいるんだね 自我が肥大してるな
713 :
132人目の素数さん :2006/03/09(木) 21:32:12
言葉で表現されることと自我が肥大することとは別だ
Rのクライアント領域より大き目のグラフを作成する方法って無いでしょうか? いつもは800*600のノートマシンで作業しているのですけど、これだとグラフが 小さすぎます。 できたら1000*1000程度の大きさのグラフを作成したいので。
>>714 png()とか使ってファイルに書き出す
717 :
132人目の素数さん :2006/03/10(金) 13:16:46
グラフの質問が連続してて申し訳ないけど、グラフにタイトルを入れるのはどうすればいいのでしょうか? 複数のグラフを表示するコマンドにTITLEの文を挿入したら最初のグラフのタイトルになっちゃいます。
718 :
132人目の素数さん :2006/03/11(土) 03:11:59
719 :
132人目の素数さん :2006/03/14(火) 01:07:23
すいません教えてください。 ( y2 <- backsolve(r, x, transpose = TRUE)) transpose = TRUEとはどういう意味なのでしょうか?
720 :
719 :2006/03/14(火) 01:12:39
>713 はぁ?言葉で表現されること? お前がそう世界を認識して書き込んでんだろ バカなら黙ってれば?
ゆとり教育
723 :
竹内まりや :2006/03/20(月) 08:12:00
ケンかはやめて♪ わたしのためーに♪ 争わないーで♪
これでグラフ作るときは エクセルとどちらが速いか、後々効率いいか、他人に任せれるか と数分悩むことにしている。
726 :
age :2006/03/27(月) 01:27:20
age
>>723 その歌ってすごい自意識過剰だよな。
けんかしている男二人って、
「その女が欲しい」んじゃなくて、
「この男に負けたくない」というだけだもんな。
映画タイタニックに出てきたローズの婚約者と同じ。
728 :
竹内まりや :2006/03/28(火) 23:48:22
ケンかはやめて♪ わたしのためーに♪ 争わないーで♪
729 :
729 :2006/03/29(水) 20:19:56
√(729) = 27
730 :
age :2006/03/30(木) 00:32:48
age
731 :
132人目の素数さん :2006/03/30(木) 02:50:18
sage
732 :
132人目の素数さん :2006/03/30(木) 10:53:57
以前にこちらで教えていただいた配列行列を使っているのですが、 パラメーターを増やすと警告が出てしまいます。 pairs3(Dataset[,5:15], pch=24, col="blue",bg=c("red")[unclass(Dataset$Species)]) としていて[,5:13]だと問題ないのですが、5:15にすると、 警告:min の引数がに有限な値がありません:Inf を返します 警告:max の引数に有限な値がありません:-Inf を返します 以下にエラーplot.window(xlim, ylim, log, asp, ...) : 有限な 'xlim' の値が必要です となってしまいます。 念のために空白のデータをすべて削除したり系列の名前を変更したりしたのですが駄目でした。 そもそもminやmaxと言う項目は追加していません。 新しく追加したのは、V Ave,V m_mと言う二つの項目でminやmaxは使っていないのですが・・・ これはどのようにすれば回避できるのでしょうか? どなたか回避方法が分かりましたら教えてください。
配列行列じゃなくて散布図行列でした。失礼。
ごめんなさい。ゼロがオーになってました。
735 :
age :2006/04/14(金) 00:30:32
あげ
736 :
132人目の素数さん :2006/04/15(土) 20:24:38
うんこヌッシーだw
737 :
132人目の素数さん :2006/04/24(月) 21:27:10
ユニックスでバッチでRが動くことは知ってるんですが ウインドーズでもバッチで動くんでしょうか
動くはず。 Excelと連携させるソフトがあってそれが確かRをバッチで 呼び出して処理したたと思う。
739 :
竹内均 :2006/04/24(月) 23:41:40
ケンかはやめて♪ わたしのためーに♪ 争わないーで♪
このスレであるなら「竹内啓」の方がよく似合う。
741 :
132人目の素数さん :2006/04/25(火) 01:19:37
酷
0.5-0.4-0.1でExcel同様、 変な値出るんですけど既出ですか?
743 :
age :2006/04/26(水) 01:06:13
既出みたいなもんです.気になるならば以下のようにしてください. > round(0.5-0.4-0.1) [1] 0
> .3-.2-.1 [1] -2.775558e-17 なるほど。
>>744 それに2.775558e-17を足すと…
746 :
737 :2006/04/26(水) 06:37:10
>738 >動くはず。 書籍やどっかのHPでやり方を紹介してませんでしょうか けっこうねちっこく探したのですがウインドウズでの バッチの方法は見つかりませんでした.
747 :
738 :2006/04/27(木) 01:54:03
とりあえずなんらかのコマンドを順番に打ったファイルを Rのbinフォルダに準備して(その名前をたとえばcommand.txtとする) そこで次のようなコマンドを実行すると R --no-save < command.txt 計算してくれるよ。余分な出力がつくから出力されたものを 何かに使うのならさらに処理がいるけど。
748 :
738 :2006/04/27(木) 09:29:18
749 :
742 :2006/04/27(木) 18:38:24
750 :
132人目の素数さん :2006/04/28(金) 06:55:58
>747,748 ありがとうございました.心から感謝いたします.
751 :
132人目の素数さん :2006/04/29(土) 10:28:59
もしかして一時期(1,2年前)と比べて人気が無くなってますか? 仕事で忙しくて情報にキャッチアップしていくのも辛くなってきた・・・・
>>751 新しい書籍も出て世間的には人気は上向きと言えるのでは
ないでしょうか。
環境が整ってきたことで逆にこのスレの進み具合が遅くなったと
思っています。
753 :
132人目の素数さん :2006/05/03(水) 09:08:31
R・・・・ データが大きくなると使い物にならないのですが、 メモリを2Gぐらい積めば快適に使えるのでしょうか? 積めば積むほど大規模データを扱えると思って間違いないですか?
洗面器を使うかバケツを使うかってことだろう。
755 :
132人目の素数さん :2006/05/03(水) 11:51:48
SAS欲しいなぁ
756 :
132人目の素数さん :2006/05/03(水) 14:39:04
>753必要ないオブジェクトを解放すれば 結構使えますよ.100かける数万件は扱えてます. >755SASのデータステップなんて 大域変数ばっかで,まともな仕事できないよ なんてったってSASは構造化言語じゃないから IML使うと倍も金取るし
757 :
132人目の素数さん :2006/05/03(水) 15:28:06
>>756 仕事でRを使っているのですか?
>100かける数万件は扱えてます
私の業務ではまだまだ足りないので
将来的に数百万件×100ぐらいは使えるようになって欲しいです。
あと、業務では大域変数ばっかりだろうとSASは使い易いです。
代わりになる言語や環境があるなら紹介して欲しいです。
>>756 , 757
Rはデータマイニング用アプリではなく統計解析プラットホームなので、
デフォルト状態では大規模データは苦手です。まぁパッケージをいろいろ駆使すれば
数百万件というものできないことはないのでしょうが...
SASはプログラミング言語ではなくて、定型業務向け簡易言語なので
プログラムが美しくないのは(歴史が古いこともあって)やむをえないでしょう。
最近はどちらかというとマイニング向けにしているようだし。
定型業務で超大規模データのマイニングをやるならSAS, 研究開発系業務で
インタラクティブにさまざまな解析を進めていくならばRというように住み分けが
できるのではないでしょうか。
Rで扱えるまでデータを小さくするのが大変なんですよね。 その目的でSASを使うのも馬鹿げているし... Access、Perl、Awk どれもいまいち...
MUSASHIとかどうなんでしょうか?
MUSASHIですか。 食わず嫌いかもしれませんがデータマイニングという、 大規模データハンドリングを前提としている世界に XMLという冗長なデータフォーマットを持ってきている時点で二の足を踏んでしまいます。 失礼かもしれませんがいつ開発が止まるかもわかりませんし.... Wekaなんかでも開発がとまっているのではないでしょうか?
762 :
132人目の素数さん :2006/05/03(水) 21:37:12
学校や会社にず〜っと在籍して,ず〜っとSASが使えるなら良いのですが, その環境から放り出されたら,せっかく蓄えた知識が水泡と化しますからね... あと,いつ開発が止まるかわからないソフトを使うのも良いのですが, 開発が止まっちゃったら,せっかく蓄えた知識が水泡と化しますからね... 後者はRも孕んでいる危険ですが,「多くの人が使っている」ので 他のソフトよりは危険率が小さいのではないでしょうか?? 「フリー」であるのと「多くの人が使っている」というのがRの強みですよね.
Rの欠点はデータハンドリング、中でも大規模データの取り扱いが苦手な事だけだと思います。
>>762 学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。
あと、ユーザー数については、R は SAS はおろか、S-Plus の足下にも及ばないはず。
>>763 有償サポートがないので、業務用途に使いにくい(研究用途なら問題ないけど)。
765 :
132人目の素数さん :2006/05/03(水) 22:34:19
>>764 s-plusは数百万×100変数ぐらいのデータを扱えるのですか?
766 :
R好きです :2006/05/03(水) 22:41:17
>有償サポートがないので、業務用途に使いにくい サポートしてくれるのは現バージョンと 1つ前のバージョンくらいだよ. 長年書き溜めたプログラムがバージョンアップして 動かなくなっても「サポート対象外」といわれる. 有償ソフトは下らないバージョンアップで 食いつないで,しかも上位コンパチとは限らないから 始末が悪い.
>>764 世界中のCRANから配布されているRのユーザー数をどのように把握したのかに
興味があるので、情報ソースを示してもらえませんか?
768 :
R好きです :2006/05/03(水) 22:44:18
>Rの欠点はデータハンドリング、 オイラはSASもRも使うけど,Rのほうがハンドリング ときだと思うぞ!百万件といったって 目的に応じて加工するのが主な仕事場わけで グレップ使えるRのほうが協力じゃん
769 :
R好きです :2006/05/03(水) 22:45:44
すみません.お酒飲んでるんで タイプにミスが目立ちます
770 :
R好きです :2006/05/03(水) 22:49:33
>学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。 っていうか大学でSASならって,就職したらSASがない という場合が困るんですよ.特に小さい組織だと SASのアコギな値上げに付いていけない その点R習っとけば,どこにいっても使い続けられる ってことだと思います
771 :
R好きです :2006/05/03(水) 22:54:49
>開発が止まっちゃったら,せっかく蓄えた知識が水泡と化しますからね... これ意味分かりません.私が20年以上前に書いたTEXやS のプログラムは今でも動きます. クヌースは,これ以上TEXをいじらないといっている Rもコアの部分は開発を止めてもいいと思う TEXが相であるように,あとは世界中のボラティアの パッケージにまかせればいい 上位互換でないコア部分のバージンアップは,もう やめたほうがいいと思います.
RがSASよりデータハンドリングに優れているって事はありえませんから。
774 :
132人目の素数さん :2006/05/03(水) 23:11:58
ッつーか誰かSASのクローン作らないかな(笑)? SのクローンやSPSSのクローンとかあるんだから、SASのクローンあっても良さそうだけど。 ASAとか名前付けちゃって(笑)。
775 :
R好きです :2006/05/03(水) 23:13:35
>RがSASよりデータハンドリングに優れているって事はありえませんから。 何故? 1.マイニングのハンドリングならグレップやサブのほうが軽くて有利 2.構造化言語で,バグが入りにくい (SASなんて変数管理が難しくて,大規模で継続的な仕事に 向かない) ちなみに私はSAS歴25年です(長ければいいてもんじゃあないですが)
776 :
132人目の素数さん :2006/05/03(水) 23:14:21
Rは好きなのですが、実務でRが活かせる分野ってありますか? アンケート分析ぐらいなら活かす事が出来ると思うのですがSPSSの方が楽ですよね。
>>770 SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。
あってもかなり研究指向が強く、採用が博士号もってること前提、とかになってそう。
あと、R は割と簡単に習得できる(C とか勉強したことあれば、楽勝)けど、
SAS は癖が強いので、研修うけないと習得が面倒です。大学で習えるのはラッキーかと。
778 :
R好きです :2006/05/03(水) 23:27:24
>SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。 えっSASの非情な,非常識な値上げ攻勢知らないんですか? HPに定価を乗せずに,ワンtoワンマーケと称して とんでもない値段(値上げ,それも毎年)吹っかけます SPSS見たいにHPに定価が乗っていれば ボラレル心配ないけど,SASは値上げについていけなくて 振り落とされる組織・大学多いんですよ 大学教育ではやめてるところ多いですよ
779 :
132人目の素数さん :2006/05/03(水) 23:29:23
>>775 あなたは多分SASもRも素人だ。
特に実務経験がなさそう。
780 :
132人目の素数さん :2006/05/03(水) 23:31:52
>ッつーか誰かSASのクローン作らないかな(笑)? どこかがSASのクローンを作ってSASに訴えられなかったっけ? ソースをそのまま利用したからだったかな?
>> 776 アンケート分析ぐらいならSPSSを使わなくてもExcelと、VBAの統計パッケージで十分な ような気が... 研究が本職の人ならRを活かせると思いますが、データ処理が本職の人は、統計計算機能はあまり なくて良いからクロス集計や条件抽出がとにかく高速な、しっかりしたRDBを基礎においた システム(統計解析パッケージ、とは呼ばれていないかもしれないけど)を使ったほうがいい のではないでしょうか。Cacheとかの強力DBがバックエンドにあるとよさげですね... 研究が本職の人は、いろんなモデルをデータと格闘しながら使っていかなければならないので、 インタラクティブな使い方に強いRは向いてると思います。
実務じゃないのね・・・
783 :
R好きです :2006/05/03(水) 23:38:13
>Rは好きなのですが、実務でRが活かせる分野ってありますか? 活かせない分野ってあるんでしょうか? 構造化言語だから,使っているうちに 関数がたまって,ぐんぐん どんな分野でも使いやすくなりますよ >アンケート分析ぐらいなら活かす事が出来ると思うのですがSPSSの方が楽ですよね。 マウスでクリックというのは,小規模な(卒論)とかには いいのですが,実務で条件を少しずつ変えて 何百枚も図を出したりするにはGUIのSPSSは だめっすよ.CUIのRのほうが,本格的で大量の 出力にはむいてますよ.
784 :
132人目の素数さん :2006/05/03(水) 23:39:16
SPSSもマクロがあるでしょ
製薬業界だと、オラクルクリニカルやリントライアルとSASを組み合わせて使ってますよ。
>> 777 ...今風の職業プログラマ(VMSとかは知らない世代です)をしたことがある経験から 言うと、SASの文法は癖なんていうレベルではありません...もはやあれはプログラミング 言語とは呼べないと思います。昔はあれが普通だったのかもしれませんが..... 他に応用できない技術であるという点で、SASが出資している大学でないならば、 あれを「プログラミング」と称して教えるのだけは避けてもらいたい気持ちです。
787 :
R好きです :2006/05/03(水) 23:43:29
完全に酔いが回ったので寝ます 2chには基本的に来ないのですが 今日は楽しかったです おやすみなさい
おやすみなさい
確かにRの言語仕様は最高ですよね。
なんかスレのびてますが... 「統計」っていう日本語の意味が広がりすぎてるから議論になっちゃうのかなぁ、 と思いました。 単純集計とクロス表の解析がメインのマイニング的データ処理分野と、 少数例に対して数理モデルをつくっていく解析分野を、 どっちも「統計解析ソフト」でやろうとするからいけないような。 ちょっと不思議なのは製薬業界かな。 SASってWebとか見るとマイニング系アプリのように売ってるのに、 製薬業界ではそのデータ解析機能を頼りにして採用している?? 業界の伝統、でしょうか...
>>783 実務、ですよ。(探索的な)研究なら R でいいですが、データ解析の実務。
金融業界、製薬業界、マーケティング会社等々、SAS や SPSS が業界標準になってるので、
R で解析した結果(あるいは書いたプログラム)を顧客(社内顧客含む)が受け取ってくれるか
どうかがまず問題になります。一人で業務を完結できるわけではないからね。
>>786 私もあれを「プログラミング言語」とは呼びたくないです。
コーディングがあれほど楽しくないものもないでしょう。
>>780 へえ、面白い。
ベル研生まれのSのクローンが訴えられなくって
大学生まれのSASのクローンが訴えられるのか。
しかし、西洋の大学は偉いなあ。商用ソフトにせよクローンにせよ
きちんと一般に技術的な貢献してるからなあ。
それに比べ日本の大学は・・・・・・
793 :
132人目の素数さん :2006/05/04(木) 00:18:46
実務だと解析の前段階が大きな作業ウェイトを占める。 そのフェーズはSASなしでは考えられない。 S-plusやspssを導入している企業でもその為だけにSASを導入しているところが多い。 研究室の中のように綺麗で解析に都合の良いデータばかりを扱うわけにもいかないので・・・・ あとSASがデータマイニングを前面に押し出しているのは本当に最近の事だよ。 ルーツは言うまでも無く「統計」。
> 研究室の中のように綺麗で解析に都合の良いデータばかりを扱う
>>792 SとRの関係はUNIXとLinuxの関係と同じ(ソースは別物だけど互換性がある)じゃないの?
>>792 学校でRを勉強して企業に入ったら関数に保証のあるSを導入して欲しいってのが
Sのスタンスらしいよ。本にインタビューが載ってた。
798 :
132人目の素数さん :2006/05/04(木) 07:56:24
>関数に保証のある でも「補償」はしないから意味なしでしょう 如何なる損害も補償しないと宣言しています 1つ1つの関数の結果の正しさを「保証」しているというなら 基本部分の信頼性はRもSも同じレベルでしょう バグを報告しても直ぐに直してくれるわけではないから 正確には結果の正しさも「保証」しているわけではないです 「保証」って何?と思います
799 :
132人目の素数さん :2006/05/04(木) 08:04:16
S-PLUS 7 Working with Big Data というのがありますね。 これを使うと行数に制限がないそうです。 Rも見習って欲しいものです。 自費で買うならS-PLUSかな。
800 :
132人目の素数さん :2006/05/04(木) 08:21:39
ところで、S-PLUSの導入費用は?
>>798 仕事で使うにあたっては責任をなすりつける先があるのは重要だと思うが
802 :
798 :2006/05/04(木) 11:22:41
>801 やってごらんなさい.責任なんて絶対取りませんから 保証の有無の差なんてゼロです
この過疎スレに必死な奴がいる件について
804 :
132人目の素数さん :2006/05/04(木) 11:49:29
Rの話題は何でも楽しいからいいよ。 >保証の有無の差なんてゼロです 確かにこれが現実だし。
うちの会社だとお偉方に導入を進言する時にフリーなのは受け入れられにくい
806 :
132人目の素数さん :2006/05/04(木) 12:52:54
フリーなら勝手にいれてしまへ フリーなら申請すればすぐに通るでしょ。
ちょっと問題だと思うのは。 SもRも動作保障しない意味では同じ これはなるほど、と思う。 でもRマンセーがエクセル叩くの意味が分からないんだよね。 エクセルも計算ミス一杯あって困る、ってのは分かるんだけど、 統計解析専門ソフトが動作保障しないと言う話と大同小異と言えば言えなくもない。
>>796 はじめてのS-PLUS/R言語プログラミング
S/R関係でもっともわかりやすい入門書
809 :
132人目の素数さん :2006/05/04(木) 15:27:32
>>808 データ解析環境「R」
R関係でもっともわかりやすい入門書
>>802 ちょっと勘違いをしてるのでは...
解析結果がおかしくてユーザーに損害が出ても保証しない、というのはもちろん R でも S-Plus でも同じ。
ただ、「メーカーも認めてる不具合なら仕方がない」となるか、「フリーウェアなんか使うからだ!」
になるかの違いは(担当部署にとって)極めて大きい。
>>806 それ、インストールの許可が出ただけ。「導入した」ことにはならない。
私物として持ち込んだ電卓と同じ扱いで、(業務手順書には現れない)検算ぐらいにしか使えない。
811 :
万年ボケ :2006/05/04(木) 18:37:27
おはつです。 研究職でないのに、Rを使いたいなんて思うのは、クラージー?? 高いソフトが買えないって言うのが本音、、、。 現場が忙しくて、なかなかスキルがあがらんのです、、、。 Rの入り口付近で、うろちょろしてます。 リタイヤしてからも、それまで覚えたRの知識が使えるチーズを探すのも、面白そうだけど、、、。 数年ぶりに自分の時間が持ててる万年ボケです。
812 :
132人目の素数さん :2006/05/04(木) 18:58:48
いえす、ゆーあーくらーじー!! ばっとあいあむくらーじーとぅ。
813 :
万年ボケ :2006/05/04(木) 19:42:43
おー、さんきゅー べーりーまっち! くらじー いず くれいじー で、くれいじー いず とっぷりーだー おぶ じゃぽーね??! 仕事柄、自分とこのエビデンスを解析しなきゃねーってなこともあるわけですよ。 品質工学的な手法もあるわけで、金をかけずに、安上がりに出来る方法はないか、貧乏人は探すわけですよ。
アメリカ製のソフトがこっちの販売会社で責任取れないのもしょーがない、ってばしょーがないよね。 多分中身いじる事出来ないでしょ? 日本人の為の日本人による日本製の統計ソフトが無い、ってのがどっちかと言えば問題がある気がする。 日本の統計学者って何やってんだろね?
816 :
132人目の素数さん :2006/05/04(木) 21:30:02
810は非本質的な論拠がまかり通るアホな職場にいますな スキルアップして転職しんしゃい
817 :
132人目の素数さん :2006/05/04(木) 21:35:20
複数のソフトで計算して中を取ればいい
>>816 例えばどこ?
一流どころのメーカーは全部「非本質的な論拠がまかり通るアホな職場」になると思うけど?
中小企業だと逆に「いいかげん」な仕事をしてても許される、ということはありそうだけど。
820 :
132人目の素数さん :2006/05/04(木) 22:44:53
>一流どころのメーカーは全。。。 んなこたーない あんたのスキルと比較して1流っていうこったろ
>>820 どこでもいいから例証してみて。
トヨタ、武田薬品、プルデンシャル(メーカーじゃないけど)、・・・
RよりOctaveの方が楽だけど Octaveには「最小二乗法」のパッケージすら入って無い(forgeにはそれらしいのが入ってる…) まあ単回帰ぐらい自分で書くし、重回帰だってOctaveなら10行ぐらいで書けるのだが 一般人が統計解析に使うのはどうだろうと思ってしまう
823 :
132人目の素数さん :2006/05/04(木) 23:14:14
S-PLUSのENTERPRISE版が欲しくなった。
Octaveのpolyfitとかglsは最小自乗だよ。 ただ、octaveとかは数値計算ツールであって 統計用じゃないんでおすすめ出来ない。 欠損値とかうまくあつかえないはず。
OctaveってMATLABのクローンだっけ? どこで手に入るの? Rjp-wikiみたいなサポートサイトってあるの?
829 :
132人目の素数さん :2006/05/05(金) 01:58:49
831 :
132人目の素数さん :2006/05/05(金) 09:29:10
arules使っている人いますか?
832 :
万年ボケ :2006/05/05(金) 11:57:11
>>831 windowsでも動く"weka"っていう、データマイニングのソフトがあるそうな。
http://www.weka-jp.info/から 、ダウンロード可。メーリングリストもある。
使ったことないけど、クレージーな万年ボケは挑戦したくなる。
MUSASHIはLinuxだけど、これはWINもMacOSもある。
833 :
132人目の素数さん :2006/05/05(金) 12:03:19
wekaはjavaで書かれているから遅いよ。
834 :
132人目の素数さん :2006/05/05(金) 12:06:39
cor ( x ) の出力を 変数1 変数2 相関係数 VAR1 VAR2 0.03 VAR1 VAR3 0.14 VAR1 VAR4 0.23 VAR2 VAR3 0.74 VAR2 VAR4 0.59 ... のようにする事はできますか?
835 :
132人目の素数さん :2006/05/05(金) 12:47:46
cor(x)から情報を抽出するんだジョー!
>>753 ホントだ。
10万件くらいデータぶち込めばかなりアヤシイですね。
明らかにバグります。
パソコン上のメモリが足りないのかな?
837 :
132人目の素数さん :2006/05/06(土) 09:39:13
小規模データしか扱えないですよね。 どうにかならないものでしょうか・・・ 上の難しい話を除いても実務で使える領域は限られている。
これだとハンドルできるデータ量はエクセルの方が多い感じですね。 まあ、エクセルも6万近いデータ入れれば確かにバグりますがwww。 やっぱノートじゃダメなのかなあ・・・・・・。
839 :
132人目の素数さん :2006/05/06(土) 13:28:22
SASしかね
Fortran90使えよ
漢ならアセンブラ。 異議は認めません。
>>841 Matlab使ってると、別にFortran90でも変わらないなという感じもする。
846 :
132人目の素数さん :2006/05/07(日) 12:54:13
フォートランならCの方がいい ただCは文字列操作が苦手
>>846 変数宣言したりポインタとか面倒にょ
その点、FORTRANは楽
文字列操作もライブラリ使えばいいし
848 :
132人目の素数さん :2006/05/07(日) 18:27:51
FORTRANならC++の方が現実的だと思う。 システムに落とすときにFORTRANだと稟議が通らない気がする。
職場のカルチャー次第かな、と思う。 大学とか(国公立の)研究機関なら、FORTRAN の方が好まれそう。 C++ は使ったこともない、みたいな人がほとんどだったりして。
C++の統計のライブラリってどのくらい充実しているのかな? 当たり前だけどライブラリがないと何も出来ないから。 アメリカだと、エンジニアリング系の学生はmatlabとmathematicaを普通に使って、 他に必要とあれば専用のソフトを使う。 SASはビジネススクールや経済学部の 学生がよく使っていた。 C++は難しいし、普通は使わないですね。
>815 HalWinとかって日本製じゃん。
853 :
132人目の素数さん :2006/05/21(日) 08:51:34
解析フェーズになったら、SASよりS(R含む)の方がずっと使い易いですよね。 S-PLUS買いたいな。
854 :
132人目の素数さん :2006/05/23(火) 00:00:53
しかもS−PlusはSASより維持費がずーっと安いぞ
855 :
132人目の素数さん :2006/05/24(水) 00:01:10
Rは維持費がタダだぞ
856 :
132人目の素数さん :2006/05/27(土) 08:14:59
Rは大規模データを扱えるようにしていく気があるのでしょうか? 今のままでは統計学習用途で終わってしまう気がします。
R で扱えない規模のデータって、どれぐらいの大きさ? SAS の方が限界が低いと思ってたんだけど。
Rは研究用、SASは業務用ですよ。 どちらが大きいデータセットを扱えるように設計されているかは判りますよね??
>>859 だから、具体的に比較してもらえない?
地震波「研究」もあれば、アンケート調査(臨床試験、でもいいけど)のデータ解析「業務」もあるし。
普通、前者には R、後者には SAS を選ぶよね。
>>856 ないんじゃない?
元々研究者用でしょう。
研究者=一般普及度が高い、ってワケではないでしょうから、
そう言った意味では、いくらRファンが「普及」を謳っても限界があると思う。
そもそも研究者が一般のニーズを良く理解している、とも思えないしね。
一般側としては「研究側」に合わせる努力ができる人しかこう言った特殊な
ソフトは使わんでしょ。
862 :
132人目の素数さん :2006/05/27(土) 18:37:24
>>861 その開き直りスタンスをRは取ると・・・・
それじゃ駄目だ。俺の役には立てねぇ
1.データ解析業務従事者(臨床試験データ解析、マーケティング、・・・) 2.数学系研究者(数理統計学、計算機統計学、・・・) 3.非数学系研究者(数理経済学、遺伝子工学、生態学、地震工学、環境工学、気象工学、・・・) 4.卒論・修論のためにデータ解析をやる必要がある学生・院生 5.なぜかデータ解析を(一時的にでも)やる羽目になった非研究職の会社員 1は仕事で SAS か SPSS を使う(R を知っていようがいまいが)。 2や3は仕事の一部(データ解析、シミュレーション)で R を使う。 ここで言ってる「一般」って、4あるいは5、という理解でいいのかな?
>>863 多分。
ある意味Rって自慰ソフトだよね。
一般的には統計取る必要がある場面ってのが極めて少ないわけだし。
殆どのケースではExcelで間に合うしさ。
865 :
132人目の素数さん :2006/05/27(土) 20:12:35
そこで大規模データ対応ですよ。
866 :
132人目の素数さん :2006/05/27(土) 20:39:46
>>860 統計の世界にいてSASを知らないなんてもぐりだぞ
いっぱいデータ食わせたらメモリ消費が大変なことになりますたwwww
>>866 知ってるよ?SAS、仕事で使ってるし。R も詳しい方だと思う。
でも、どちらも大規模データが扱えなくて困った、という経験は無い(サンプルサイズで10万ぐらいまでだけど)。
で、SAS は変数が多い(マイクロアレイデータとか)と困難がある、という話を聞いたことがあるから、どうなんだろうって。
869 :
132人目の素数さん :2006/05/27(土) 22:04:17
>>868 SASなら、500万件×200変数以上でも普通に扱えます。
Rだと10万件×20変数でもアップアップ。
870 :
132人目の素数さん :2006/05/27(土) 22:06:34
メモリが256だと1万件でも辛くネ?
>>869 で、マイクロアレイデータとかだと5000変数だったりしますよね?
時系列でとった気象データだったりすると、もっと変数が多くなるわけで。
SAS はどこまで耐えられるのでしょうか?
実際に10万件(10万オブザーベーション)といったデータを扱う
領域にどんなものがあるか、ということに興味があるのです。
医学統計の実務をしているのですが、多くても1万件を超えたことがありません。
それと、500万件×200変数以上でも普通に扱えます、と言われますが、
ハードディスクにスワップされますよね?
相関係数求めたら、現実的な時間で結果がかえってきますか?
>>870 メモリ 256 だと、Windows なら SAS を立ち上げただけで挙動不審になるのでは?
872 :
132人目の素数さん :2006/05/27(土) 22:43:31
ちょっと実験したくなって
x <- matrix(rnorm(1),2500000,50)
を実行したら、ブルースクリーン・・・・・
>>871 SASはハードディスクに直接I/Oをかけるのでメモリ量は基本的に関係ありません。
プログラム本体を格納できるだけのメモリがあればいい。基本的にだけど。
またそれでいてあの速度だから手放せない。
Rのメモリの使い方は体育会系って感じがしてある意味好きw
874 :
132人目の素数さん :2006/05/27(土) 23:03:15
>>873 Rは完全に文科系。
体育会系というならSASでしょ。ガリガリ音を立てて計算をしている。
S-PLUS9も大容量データハンドルを謳っているけど、
ハードディスクに直接書き込むようになったのかな?
>>872 iMac G5 でやったら、20秒ぐらいでかえって来たよ。
> x[2500000,50]
[1] -0.0607673
>>872 > x <- matrix(rnorm(1),2500000,50)
警告:Reached total allocation of 734Mb: see help(memory.size)
警告:Reached total allocation of 734Mb: see help(memory.size)
エラー:サイズ 976562 Kb のベクトルを割り当てることができません
877 :
132人目の素数さん :2006/05/28(日) 09:35:06
Rからwww上の圧縮ファイルをダウンロードする関数はありますか?
878 :
132人目の素数さん :2006/05/28(日) 22:17:23
help ( download.file )
879 :
132人目の素数さん :2006/05/28(日) 22:30:13
880 :
132人目の素数さん :2006/05/28(日) 22:50:55
あの、基本的な質問で申し訳ないのですが、 S3やS4ってどういう意味ですか?
882 :
132人目の素数さん :2006/06/02(金) 19:30:11
Rコンソール上では日本語で書き込みができるのにデータの読み込みをすると文字化け(エスケープ?)してしまいます。 R2.3.0、OSX10.4.6です。 読み込ませたのはカンマ区切りのcsvファイルとテキストファイルで、同じことをWinXPのRでやってみてもらったところ問題なく表示できていました。 対処法分かる方がいましたらお願いします。
文字コード変えてやってみた?
884 :
132人目の素数さん :2006/06/03(土) 22:00:13
miで改行コードも含めていろいろ変えてみたんですがどうにもならなかったです・・・ ツールバーにあるので気になってたのですが、もしかしてこのパッケージってOSXではX11を通して動いてるんですかね? だとしたらkinput2なんかを入れたりして日本語環境を構築しないとだめなんでしょうか?
>>882 Intel Mac miniで同じバージョンのRですが、UTF-8, 改行LFのCSVファイルが列名, データともに
問題なく読み込めていますよ。
>>884 X11はX11()デバイスを使うときだけ必要(Rcommanderとか使うとき)
基本的にCocoaアプリです。
886 :
132人目の素数さん :2006/06/04(日) 07:09:34
>基本的にCocoaアプリ
ですよね、最初から日本語表示、入力ともにできてたので可能性は薄いと思ってました。
さきほど別のMacにRを入れてみてmiでファイルの文字コードを
>>885 にあるように変換してから読み込ませたところ問題なく表示できました。
インストール時の失敗かなにかなんでしょうか・・・再インストールも含めて試してみます。
887 :
132人目の素数さん :2006/06/05(月) 08:39:41
SASは今までの惰性でしばらくは使用され続けるけれど 設計思想が古いから遠からず緩やかな死を迎えると思う SAS社自身もそのことはよーく知っていてもう学生の教育に力はいれていない (私の分野ではSASを採用している授業が周囲でどんどん減っている) 若いときSASで教育された今現役の人が年をとったらそれでおしまいになる 将来に向けて養成するんじゃなくて現世代から絞れるだけ搾り取る というマーケを展開していることがそれを如実に示している.
>>886 システム環境設定の「言語環境」で、「書式」タブの「地域」が「日本」になっているかどうかも
確認したほうがよいでしょう。これが米国とかだと英語版相当の機能になるはず。
>>882 read.csv()でエンコードを指定できなかったけ?file()だけだったけ?
.Callの引数で "S_c_use_method"とは何物なのでしょうか. 後ろの引数に指定する関数のための「おまじない」みたいなものなのでしょうか?
>>887 SAS 社の売り上げはちょっと調べれば判るだろうけれど、まだまだ急成長を続けている。
SAS のトレーニングは、(昔は)宣伝のために SAS 社がサービスでやってただけ。
SAS/STATだけ見るとどうなんだろう?
893 :
132人目の素数さん :2006/06/05(月) 23:19:03
>>887 は学者かなんかでしょ?
マイニングもどきの統計ではSAS以外の選択肢は考えられない
894 :
132人目の素数さん :2006/06/06(火) 05:30:29
>>893 はSASの社員か,企業の電脳土方かなんかでしょ?
895 :
132人目の素数さん :2006/06/06(火) 08:17:41
しかしさ、「R」って名前は不便だよ、google検索とかするときに R Anova とかで検索しても、けっこう関係ないのばっかり。 Stata Anova とかならStataの記事ばかりでてくるのによ。 R 検索で指定できねーよ、ばか。
R指定
それは「C」や「S」にも共通する。 まぁ、RSiteSearch()を使ってくれ。
898 :
132人目の素数さん :2006/06/06(火) 19:33:17
Rの学校の宿題全く出来ないよぉ>< いみわかんなぃし。。。助けてぇ・・・
900 :
132人目の素数さん :2006/06/06(火) 23:30:34
>>894 馬鹿だねぇ。
Rで済むようなセコイ仕事しかしてないから想像もできないのかな?
デジャヴ
902 :
132人目の素数さん :2006/06/07(水) 00:08:04
>>900 >Rで済むようなセコイ仕事
ゲノム解析ってセコイ仕事??
せこい。井の中
重箱の角を突いくことが業績になるバイオインフォはニッチ産業
905 :
132人目の素数さん :2006/06/07(水) 23:23:19
Rでゲノム解析は間違いなくセコイでしょ。 SASが使える環境なら間違いなくSASを選ぶよ。
906 :
132人目の素数さん :2006/06/08(木) 00:32:15
1 名前:ひろゆき@どうやら管理人[] 投稿日:2006/06/08(木) 10:05:39 数学に素養のある住人の数学板離れの防止、 そして数学好きの新参者が寄りつきやすい環境を整備するために 数学板の諸悪の根源を排除しましょう。 最近大量に発生している数学と関係のない雑談を繰り返すコテハン、 これを減らしていかなければ今後数学板の存亡に影響が出てくることは間違いないでしょう。 そしてこれらのコテハンを発生・定着させている根源がスレタイにあるコテハンの人物であることがはっきりと分かりました。 数学とは無縁のこのコテハンを数学板から排除することが数学板の正しい活性化のための早道です。 数学好きの真面目な住人の皆様、どんどん訴えて参りましょう。
908 :
GiantLeaves ◆6fN.Sojv5w :2006/06/08(木) 15:12:37
talk:
>>907 人の脳を読む能力を悪用する奴を排除しないと結局悪くなるぞ。
909 :
132人目の素数さん :2006/06/15(木) 04:01:21
>>909 ぐぐってみたが、どうもカテゴリカル回帰というのはSPSSでしか
使わないみたいだね。カテゴリーの関連を知りたかったら
普通は林の数量化法を使うと思うけど国内専用だからなあ。
ぐぐった結果でもその2つがどの程度違うものなのかが
分からなかった。誰か知っている人がいたら教えてほしい。
912 :
132人目の素数さん :2006/06/16(金) 16:47:00
「くりかえし」というものを習い 計算が止まらなくて ウインドーを閉じたことがあるが、 ウインドーを閉じずに計算をストップする方法は あるのでしょう?
>>912 ESC(Windows/Mac)
Ctrl+C (Linux)
914 :
909 :2006/06/16(金) 23:10:46
お返事ありがとうございます。重要なことを書き忘れてました。 事情がありまして,従属変数が順位尺度,独立変数が間隔尺度なんです。 それで,それら変数をそのまま使うためにはどうしたものか…と考えていた ところ,SPSSのカテゴリカル回帰分析なるものを見つけました。しかし, SPSSのcategoriesは使えない状態でして,Rでなんとかならないかなぁと 考えて質問させていただきました。 (重)回帰分析・数量化I類の従属変数は量的変数でなければいけませんよね? (…分析方法を考え直した方がいい気がしてきました。
915 :
132人目の素数さん :2006/06/17(土) 00:43:26
916 :
132人目の素数さん :2006/06/17(土) 10:13:21
917 :
909さんへ :2006/06/17(土) 12:38:49
ゆいでーす. よろぴくね ダミーさんでは,順序が表現できなくて,ゆい,悲しいな あなたがぁ やりたいことをぉ 叶えてくれる分析法は 「多値カテゴリ順序データのプロビット(ロジスティック)回帰」だぴょん 名前が長いけど覚えてくれたぁ? やりかだけどぉ SEMのMplus,EQS,とかぁ,LISRELがおすすめでーーす. うふっ! Rだったらねぇ,SEMパッケージとpolycorパッケージを組み合わせてぇ ブートストラップを行う方法がぁ そのまんま SEMパッケージのEXにあるからぁ ソレソレーーって利用できちゃうわよ ゆい,応援してるからぁ,くじけないで頑張ってね.約束よ!
918 :
909 :2006/06/20(火) 21:45:56
>>915 ,917
ありがとうございます。統計って,マジで奥が深いですね。
そうなんですよ。順位が勿体ないなぁと思って,どうしたものかなぁ…と思っていたんです。
Rにはまだまだ不慣れで時間はかかるかもしれませんが,頑張ってみます。
お忙しい中,ありがとうございました。
すごい基本的なことだと思うのですが、教えてください。 Mac OS X 10.4.6でRをターミナル上で使おうとしたのですが、 > options(device="Quartz") > demo(graphics) [中略] > if (dev.cur() <= 1) get(getOption("device"))() 以下にエラーget(x, envir, mode, inherits) : 変数 "Quartz" は存在しません > options(device="X11") > demo(graphics) [中略] > if (dev.cur() <= 1) get(getOption("device"))() 以下にエラーX11(display, width, height, pointsize, if (is.null(gamma)) 1 else gamma, : デバイス 'X11' を開始できません 追加情報: Warning message: X11 ディスプレイ '' へのコネクションを開くことができません となります。X11は起動してあります。どうすればターミナル上のRでグラフィックディバイスが 開くのでしょうか。
test
922 :
132人目の素数さん :2006/06/29(木) 12:01:29
>>922 GNU GPLのFAQを読んでみた感想。
Rで利用するスクリプトは個人(あるいは会社内)で
利用するだけならもちろん公開の義務はないでしょう。
商用利用の方ですが、外部プログラムとしてRを
呼んで作業をさせるだけでシステムそのものにはRが
含まれないなら問題はないと思われます。
しかし、システムの主たる目的がRがないと達成できない
ならRを広い意味で含むソフトウェアと考えられ、GPL違反と
言われるかもしれません。
# たとえば、特殊な用途に限っても統計解析をするソフト
# として裏でRが動くだけというものは市販はできないでしょう。
といっても上記のように独立した構造であり、
納入するのが1社だけで一般に市販することがないなら
問題がないように思うのですが、どうでしょうか?
# 当たり前ですが、Rに関わる部分は無保証であり、
# そのシステムを利用する会社に何らかの損害が生じて
# それが外部利用のRのせいであると分かっても
# あなたの会社が賠償するか相手の会社にそれは免責事項
# であると納得してもらう必要があります。
# そちらの方がはるかに問題だと思いますがね。
924 :
132人目の素数さん :2006/06/30(金) 06:40:46
当たり前ですが エクセル,SPSS,SASにもバグはあり それに起因して,そのシステムを利用する会社に損害が生じても MS社もSPSS社もSAS社も,損害を賠償する積もりなんて これっぽっちもありません. 契約書をよく読むと,絶対賠償しなくて済む様に,これでもかと イロイロ書いてあります.だからその点は「実質」Rと同じです.
ソフトの購入に支払った金額までなら補償してくれる可能性は ありますが、「実質」Rと同じというのは正しいでしょうな。 ただ問題なのはそういう事態が発生した場合、システムを 構築した会社がそれはうちの問題ではないと言い逃れられること にあるのでしょう。Rを使ってもその部分はうちには責任ないということを 相手の会社に納得してもらえばいいのですが、それは難しいのでは ないかということです。
>>924 賠償が受けられるかどうかは問題ではないんだよ。
SAS に由来するバグを理由に発注元が受注会社に賠償を求めることなど最初から出来ないから。
SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれないから、
普通に契約を結ぶ限りでは「責を負う」必要などない。
で、発注元の担当者も好きこのんで R の使用を要求したりしない。
賠償を得られようが得られまいが、不具合が発生した時点で自分のクビが飛ぶから。
927 :
132人目の素数さん :2006/07/01(土) 08:52:04
>発注元の担当者も好きこのんで R の使用を要求したりしない。 どっちにしろ賠償されないなら,発注コストが低く見積もれて ソースがみられるRのほうが安心じゃん
社会に出てないのがすぐわかる
929 :
132人目の素数さん :2006/07/01(土) 10:30:25
SASの社員 or SASの奴隷の電脳土方(低所得)
>>927 担当者の立場をイメージできないのかな?
SAS や SPSS や S-plus といった統計パッケージソフトは、
営利企業が自社の社会的信頼をかけて作成しているため、
事実上の品質保証がある。品質の保証されたパッケージを使う限り、
バグが出てもその使用を指示した発注元の担当者の責任は問われない。
これは、OS として Windows や商用 Linux を使う場合と同じ。
で、R はその意味での品質の保証が無い(実際の品質とは関係ない)。
OS として Mona OS を使うのと同じ(ソースが見れるから安心?)。
R に由来するバグが出て業務に支障が生じたとき、その責はもちろん
「品質の保証が無い統計パッケージソフトを選択した」担当者にある。
会社組織や行政機構の一員なら、当然、しかるべき責任をとらされる。
当然ながら、生じた問題の責任を自分一人でとりきれる場合には、
R が選択肢に入ってくる。自然科学系の研究者(あるいは卒論執筆中の学生)で、
自分の研究のためにデータ解析をするような場合がこれ。
R の豊富なパッケージに利点を見いだせば、使用になんの躊躇も無い。
実際、両方使える者は(私を含めて)皆、目的に応じて使い分けているはず。
931 :
132人目の素数さん :2006/07/01(土) 20:22:54
>事実上の品質保証がある。 だからないって.そもそも保証って何だよ. 補償しない保証なら,おれがしてやるよ 中が見えないだろ.プロがミミズで作ったソーセージだろ Rはオープンだからごまかしきなないだろ だれでも中がみれるから,直ぐにへんなコードはとうたされるだろ
面白いな。 発注元は自力でシステムも作れないし、統計ももちろん分からない から外注なんだろ?受注を受けた方もRの全ての機能が必要な システムでもないだろうに自分で組まずにRを使おうって言ってるんだよな。 どんな話し合いになるのかなあ。w
こういうコマンドを実行してください。 とか言うのかねw
>>926 >SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれない
ここが微妙だな...
統計をまれにしか使わない客との契約でそれを納得してもらえるかどうか?
要求仕様が統計解析部分を含んだシステム全体としてのものだと、外部から調達した部分の
バグも自社の責任の範囲内とみなされるだろうな...
>>931 >そもそも保証って何だよ.
「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。
三菱重工の部品を使ってロケットを組み立てたなら、その部品のせいで打ち上げに
失敗して人工衛星を壊しても、「三菱重工の部品を使った」ことは過失とは見なされない。
でも、泡沫メーカーの部品を使ったり、自社製造の部品を使い、そのせいで失敗したら、
部品の選択そのものが過失。訴えられ、おそらくは負ける。
あなたは認めない(認めたくない?)かも知れないけど、法廷では立派に物を言う「保証」だよ。
>補償しない保証なら,おれがしてやるよ
あなたには出来ない。
守るべき社会的信頼が無い者が何を言おうと・何をしようとそもそも保証に「ならない」から。
>>932 >発注元は自力でシステムも作れないし、統計ももちろん分からないから外注なんだろ?
少なくとも、製薬会社では違うね。統計で博士号取ってるような連中が担当者になって発注してるよ。
解析業務には波があるから、全部自社で解析するよりピーク時に外注した方が人件費が浮くんだよ。
>>934 契約書に免責条項として
「OS あるいは SAS に由来する不具合については、乙(=受託会社)はその責を負わない。」
って書いておけば、大丈夫。普通、書くし、それがのめないような発注元は相手にしない。
ついで言うと、作った SAS プログラムを発注元に提供「しない」契約が普通。
データを受け取って、解析結果だけ納品するんだよ。
936 :
132人目の素数さん :2006/07/02(日) 05:37:10
>「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。 一流とか自分でいうな 実効が何もないんだからそれは自己満足.中身を見せずに社会的信頼といっても自己欺瞞 中身が見えているRのほうが清廉潔白 >あなたには出来ない ちゃんと読めよ 何も補償しないのは同じ(SASにもできない) という文脈のレトリックにまともに答えてどうする 本当に社員か?
>>936 >一流とか自分でいうな
例え私が三菱重工あるいはSAS社の社員だとしても、この説明の内容を変更する必要は感じないね。
>実効が何もないんだからそれは自己満足
発注元の担当者にとって、「業務に支障が出たとき、それに対する責任を負わずにすむ」
ことが社会的信頼のある製品を選択することの実効だ、と言っている。
一般論としてそれは認められない、というのならまともに反論してください。
>中身を見せずに社会的信頼といっても自己欺瞞
自己欺瞞って、SAS 社の?社会的信頼は、世間が企業(の製品)に対して付与するものだよ。
もちろん、「中身を見せない(見せる)」ことも、社会的信頼に反映される。
まあ、SAS 社がソースコードを公開しても、誰も読まないだろうけど。
>中身が見えているRのほうが清廉潔白
中身が見えている点において、ね。
>文脈のレトリックにまともに答えてどうする
まともに返すこと自体がレトリックだよ。
>本当に社員か?
民間企業の社員じゃないよ。
1.疑問なんだけど、R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる?
私はどちらにも利点・欠点があり、それゆえに今後も使いわけられていく、と思うのだけど。
2.R の欠点の一つ(もちろん、美点でもある)に開発・保守が非営利で行われている、ということがあり、
それが業務用途での採用の足かせになっている、という考えには同意できない?
すでにパッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途では広く使われて
いること、一般企業でフリーウェアの導入(メーラーとか)が困難なことについて、どういう理由があると思う?
>>935 発注元が製薬メーカーだったらSAS以外の統計ソフトは認めないので
今回の事態は起こらないだろうな。そもそも君のいうとおり解析のみを
外注してシステムの外注はほとんどしないだろう。(よく使うものなら
自分たちで組むだろう。)
というわけでおれは製薬メーカーが発注元だとは思っていない。
それでもどういう契約をしたのかが基本になるのは確かだな。
939 :
132人目の素数さん :2006/07/02(日) 11:11:17
>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる はい,そう思っています.今現在はオープンソースという思想がジワジワ浸透し始め た時期(まだまだ少数派ですが)だと思っております. 1.お金をもらった社員がSASのために,ソース公開されない状況でかいたプログラム 2.自分が開発した手法,D論なんかで深く係わった手法を,同じ分野の 研究者が自分のコードを簡単に見られる状況で公開したプログラム では後者のほうがシステムとして信じられるという,当たり前のことが認められる時代 が直ぐにくると思います.研究者は名誉を重んじます. >それが業務用途での採用の足かせになっている、という考えには同意できない? 今現在,採用の足かせであることは事実です >パッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途 では広く使われていること こんな不合理なことはいつまでも続きはしません.企業は合目的だから(非合理的な保 守性も合目的だからで),オープンソースという思想が社会に半分くらい認知された時 点で,なだれを打ってオープンソース(Rとかリナックスとか)に移行すると思います. >発注元が製薬メーカーだったらSAS以外の統計ソフトは認めない こんなの今だけ,大橋の世代が終われば,もっと合理的な若い世代はSASを支持しない. 支持する理由がない.無意味なバージョンアップ,無意味な新製品.SASも自分達の寿 命が長くないことを悟ってるから,非道な値上げで現世代から搾り取って終わりにしよ うとしている.新しく大学でSASを導入するとこなんで皆無です(私は情報教育の学会 にも入ってます)今は過渡期です
>>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる
>はい,そう思っています.
ご立派。R に心酔してるんだね。Robert Gentleman だって全面的に優れているとは思ってないだろうよ。
>大橋の世代が終われば,もっと合理的な若い世代はSASを支持しない.支持する理由がない.
O橋先生の世代で SAS を強力にサポートしてるのって、O橋先生だけじゃん...
次世代はH田先生あたりがあとを引き継ぐだろうから、きっとあまり変わらないよ。
そもそも日本は SAS 社から見れば世界の10%でしかないし、SAS は FDA 標準。
日本に R の時代が来るのは、アメリカの一般企業が SAS を捨ててから。
政治力の問題で、米国標準は世界標準だから。
で、MS とか SAS 社 とか Oracle がつぶれると米国に税金が落ちなくなるから、
米国政府は国益のために最後まで自国のソフトウェア産業(国策産業!)を保護するだろう。
>SASも自分達の寿命が長くないことを悟ってるから
業績は右肩あがりみたいだね。
http://www.sas.com/corporate/report05/annualreport05.pdf あと、MS 社は Windows のソースコードを開示したように、SAS 社も
「業績をあげるために必要と判断すれば」あっさり開示すると思うよ。
もちろん、オープンソースの理念とは別物だけど。
>新しく大学でSASを導入するとこなんで皆無です
主だった大学ではとっくに導入が済んでるだけでは?
>>940 SASを授業で一斉に使えるだけのライセンスで契約している大学って
そんなにあるの?研究室単位では使っているところはあるだろうけどね。
SASとRが本質としてどっちが優れているかなんて関係ない。 言い訳ができるのがどっちかというだけ。
RとS-PLUSを比較するのは分かるがSASと比較する意味が全く分からん。 RなんてGUIインターフェースがまるっきり無いんだからそういう面では糞だろ? SASみたいに矢印引っ張るだけで解析なんてRには到底できっこない。 何を勘違いしてるのやら。
944 :
132人目の素数さん :2006/07/03(月) 18:59:50
どうでもいいがな。 所詮は道具。
945 :
132人目の素数さん :2006/07/03(月) 22:11:27
>主だった大学ではとっくに導入が済んでるだけでは? 慶応は岸元 クビ(防人島流し)にしてSASからRに文系も理系も全面移行
>>943 きみがSASもRも素人なのは解った。
ま、俺はRとAccessで仕事したくないね。
私は仕事自体したくありませんが、なにか?
みなさん、 議論しているひまがあったら T c l / T k が い ら な い G U I つ く っ て く れ ま せ ん か ?
>>949 つJGR
...たしかにRcmdr以外は統計処理自体の初心者向けじゃないな...
っつーかたった10万くらいのデータでバグるRをそこまで信用できないでしょ?
SAS vs. Rってコンテクストはナンセンスだと思うよ。
道具は所詮道具、と言ってる
>>944 が正しいと思う。
Rマンセーもいいけど、Rにそこまで「心酔」する理由も分からんです。
マニアは逆に一般化を遠ざけるよ。そこがRの弱点www
Q&A (中級者コース)の慶応大生の書き込みを見て、ふっと思ったのだけど、 Windows版ではpage()はサポートされていないの? Linux版、Gtk版、MacOSX版でちゃんとあるのだけど。
>>954 その「サポート」っていうのが何を意味するかわかんないけど
例えばpage("?")とか"?"オブジェクトの中身のページャ表示は
Windows版Rでも普通にできる。(ヘルプ閲覧用窓と同じのが開く)
でも、行列やベクトル等の数値オブジェクトはだだ書きされるから
それらの表示や確認には不向き。(列も行も見分けがつかなくなる)
で今、表計算ソフト風に閲覧できるedit(x)を慶応大生に勧めてきた。
956 :
132人目の素数さん :2006/07/09(日) 21:53:31
いくらなんでも早すぎだろ。 こんなにペースの遅いスレなのに。
二年三百九日。
959 :
132人目の素数さん :2006/07/13(木) 00:40:39
age
960 :
age :2006/07/16(日) 23:37:52
age
961 :
132人目の素数さん :2006/07/19(水) 15:08:59
SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?
962 :
132人目の素数さん :2006/07/19(水) 19:41:40
こういうこと書き込むのはSASの社員か 岸本のような元SAS社員しかいねーよ 実際のユーザーはしいたげられてっからな
grep()で、結果を反転させたいのだけど、helpを見てもそれらしいオプションがない。 要するに、grep --invert-match をしたいのだけど。正規表現を工夫してしのぐしかないの?
>>963 txt[-grep("foo",txt)]
という感じではだめなのか?
966 :
132人目の素数さん :2006/07/24(月) 22:24:06
age
351
968 :
132人目の素数さん :2006/07/29(土) 00:26:30
age
969 :
132人目の素数さん :2006/07/29(土) 11:49:38
データマネジメントの分野でのRの効率的な勉強法を教えてください。
970 :
132人目の素数さん :2006/07/30(日) 11:29:52
二年三百二十九日。
972 :
132人目の素数さん :2006/08/03(木) 23:48:29
age
973 :
132人目の素数さん :2006/08/06(日) 12:34:25
>> EXCELデータをRに読み込むときってどうしてます? >> 私はRODBC使ってますが. >1. >範囲選択 >2. >read.delim("clipboard") これってどうよ?
いんじゃね
975 :
132人目の素数さん :2006/08/07(月) 17:08:34
別に統計解析を信頼できるソフトで行うときに、 ディフェクトスタンダードなソフトなんて存在しない…。 …しなくなるといいな。
976 :
age :2006/08/11(金) 13:47:39
age
w^3 = 1, w != 0 で,行列 [ 1 1 1 ] [ 1 w w^2 ] [ 1 w^2 w ] の rank ってどうやって求めたらいいですか?
978 :
977 :2006/08/12(土) 01:48:05
間違えた.w != 1 でした
979 :
909 :2006/08/12(土) 14:40:52
ゆいさん、いらっしゃいますでしょうか?以前、「多値カテゴリ順序データの プロビット回帰」に関してご教授いただきました909です。その後、試行錯誤 しまして、うまくいったように思うのですが、本当にできているか不安でして 改めてお伺いしたくレスさせていただきました。 データフレームをData、そこに含まれる従属変数をy、独立変数をx1,x2,x3と した場合、以下の構文で大丈夫でしょうか? 記載に不足などがあるかもしれませんが、余裕がございましたら改めてお教え いただけると幸いです。勝手ばかりで申し訳ありませんが、よろしくお願いします。 hcor <- function(data) hetcor(data, std.err=FALSE)$correlations model.data <- specify.model() y <- x1, lam1, NA y <- x2, lam2, NA y <- x3, lam3, NA x1 <-> x1, NA, 1 x2 <-> x2, NA, 1 x3 <-> x3, NA, 1 y <-> y, the1, NA R.data <- hcor(Data[,c("y","x1","x2","x3")]) sem.data <- sem(model.data, R.data, N=n) summary(sem.data) system.time(boot.data <- boot.sem(Data[,c("y","x1","x2","x3")], sem.data, R=1000, cov=hcor), gcFirst=TRUE) summary(boot.data, type="norm")
>975 こまかいけど「デファクト・スタンダード(de facto standard)」な。 ディフェクト(defect)は「欠陥」。
cumsumのヘルプにある cummin(c(3:1, 2:0, 4:2)) cummax(c(3:1, 2:0, 4:2)) って意味が分からない。 今夜もやもやして寝られそうにないので誰か教えて。
> c(3:1, 2:0, 4:2)-> x > x [1] 3 2 1 2 1 0 4 3 2 これのminとmaxでしょ。
>>982 質問の仕方が悪かったのかな。
3 2 1 2 1 0 4 3 2
3 2 1 1 1 0 0 0 0
3 3 3 3 3 3 4 4 4
1行目をどうすれば2行目または3行目になりますか。
あぁぁ、そうか、なるほど。やっと分かった。
でも、こんなのどんな使い道があるのだろうね。
仮にその行列をxとすると y <- x[1,] x[1,] <- x[2,] x[2,] <- y で1行目と2行目入れ替え
>>984 いや、その、
>>981 からの流れ(cummin()とcummax()の挙動)なんだけど。。。
c(3:1, 2:0, 4:2) → 3 2 1 2 1 0 4 3 2
cummin(c(3:1, 2:0, 4:2)) → 3 2 1 1 1 0 0 0 0
cummax(c(3:1, 2:0, 4:2)) → 3 3 3 3 3 3 4 4 4
で、質問はcummin()とcummax()の使い道。こんな時に便利とかある?
二年三百四十六日二十三時間四分。
>>985 それは新記録の挙動を自動的に生成するときぐらいかな。
(cumminは小さいほど新記録、cummaxは大きいほど新記録)