＝　統計解析フリーソフト　Ｒ　＝

1 ：１３２人目の素数さん：03/09/04 13:41

R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)
です.簡単なデータ解析から非常に高度・専門的な統計解析まで，さま
ざまな解析が出来る優れたソフトです．またRはSやSplusに操作環境な
どが良く似ており, Sで動作するものはRでもほとんど(90%以上)変更な
しに動作します.

スレが無いから立ててみました．

2 ：リンク集：03/09/04 13:45

R - 統計解析とグラフィックスの環境
http://datamining.tama.ac.jp/~yama/R/

Rの使い方
http://web.sfc.keio.ac.jp/~watanabe/r.htm

関数一覧（青木先生）
http://aoki2.si.gunma-u.ac.jp/R/

統計言語 R の関連ドキュメントの和訳
http://www.is.titech.ac.jp/~mase/R.html

R　のコマンド集
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r2.html

統計言語 R の講義
http://genome.ag.saga-u.ac.jp/R/

3 ：１３２人目の素数さん：03/09/04 13:47

3次元プロットって、こんな感じ以外には実現出来ないの？

x <- seq(-10, 10, length= 30)
y <- x
f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
z <- outer(x, y, f)
z[is.na(z)] <- 1
op <- par(bg = "white")
persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "blue")

4 ：１３２人目の素数さん：03/09/10 15:34

ぶらくーら

5 ：１３２人目の素数さん：03/09/17 19:34

SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?

6 ：sage：03/09/18 02:42

sage

7 ：sage：03/09/18 02:48

関数 lsfit() で y = X b + e （変数は全て行列）の b を
推定することができますよ．lsfit() の結果を abline() に
渡すことによって回帰直線を描くことも出来ます．
> x <- c(64,70,58,66,81,73,75,72,90,53)
> y <- c(177,175,162,176,184,170,179,177,188,157)
> z <- lsfit(x,y)
> plot(x,y)
> abline(z,col=2)
さらに，lsfit() による回帰の結果 z から，
> ls.diag(z)
とすることで，以下のような情報が得られます．
std.dev ：残差の標準偏差．
hat ： h_{ii} of the hat matrix H ．すなわち行列の対角成分．
std.res ：規準化残差．
stud.res ：スチューデント化残差．
cooks ： Cook の距離．
dfits ： DFITS 統計量．
correlation ：回帰係数推定量の相関行列．
std.err ：回帰係数推定量の標準偏差．
cov.scaled ：係数行列の Scaled covariance matrix．
cov.unscaled ：定数項に対応する列を含めた計画行列を
QR 分解したときの ( t(R).R )^-1 すなわち ( t(x).x )^-1 ．
cov.unscaled * std.dev^2 で回帰係数推定量の分散共分散行列
を求めることが出来る．

8 ：to:sage：03/09/18 02:52

Rは以下のサイトからダウンロードできます．
http://datamining.tama.ac.jp/~yama/R/install.html

EXCELで統計解析を行った場合，以下のような不具合が
指摘されています．
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

といっても，Rにもエラーは山ほどあるんでしょうけど．

9 ：１３２人目の素数さん：03/09/18 03:04

>>8

確か「これはバグじゃない、仕様なんだ」とMSが言い逃れしてたよな(w

10 ：１３２人目の素数さん：03/09/18 05:48

ここのページも詳しい。

「租界Rの門前にて――統計言語「R」との極私的格闘記録」（三中信宏氏＠農水省農業環境技術研）
http://cse.niaes.affrc.go.jp/minaka/R/R-top.html

11 ：5：03/09/18 18:05

レス有難うございます。説明がかなり不足してました。どうも最小自乗平均とlsfitは違うような感じです。
最小自乗平均というのは「線形混合モデル」という、個体内誤差と個体間誤差が存在する場合に行う分散分析モデルでよく登場します。
ホームページとしては http://www.yukms.com/biostat/download/sem_menu.html に統計セミナーのページがあり、例えば第8回セミナーの20～27ページに出て来るデータとその解析が割と分かりやすいと思います。
このページではJMPとかいう統計ソフトで解析をしているのですが、この解析をRで再現できないかな、と思って一時期四苦八苦していました。(高いソフトはとても買えない)

12 ：11：03/09/18 18:06

> Data1
RBC dose animal week R
1 807 0 1 0 1
2 815 0 1 4 1
3 810 0 1 13 1
4 646 0 2 0 2
5 667 0 2 4 2
6 717 0 2 13 2
7 695 0 3 0 3
8 774 0 3 4 3
9 780 0 3 13 3
10 672 0 4 0 4
11 742 0 4 4 4
12 769 0 4 13 4
13 730 30 9 0 1
14 670 30 9 4 1
15 722 30 9 13 1
16 826 30 10 0 2
17 766 30 10 4 2
18 780 30 10 13 2
19 785 30 11 0 3
20 772 30 11 4 3
21 771 30 11 13 3
22 653 30 12 0 4
23 606 30 12 4 4
24 612 30 12 13 4

13 ：12：03/09/18 18:07

表5.1のデータをこんなデータフレームとして作成すると、2元配置分散分析(間違い)は
> summary(aov(RBC ~ dose * week, Data1))
で、3元配置分散分析(これも間違い)は
> summary(aov(RBC ~ (dose + week + R) ^ 2, Data1))
で、再現できます。そして正しい解析である線形混合モデルは、nlmeライブラリを読んで
> library(nlme)
> anova(lme(RBC ~ dose * week, random =~ 1 | animal, Data1))
で、ほぼ再現できます(dose に関するpの値がちょっと違うのはよく分かりませんが)。
しかし、図5.2、5.3の再現の仕方がよく分かりません(組み込みのメソッドはない?)。自作したいのですが技量が足りず。たぶんlsfitは線形モデル解析でしか使えないと思います

長文失礼。めんどくさい話なので読み飛ばしてくれて結構です。ともあれRは最重要アプリの1つ。

14 ：１３２人目の素数さん：03/09/23 15:48

2元配置分散分析なら青木先生が関数を定義されてますね。
http://aoki2.si.gunma-u.ac.jp/R/twoway-anova.html

15 ：12：03/09/24 16:51

>>14
そうですね。しかし、R(およびS)の標準的な考え方では
summary(aov()) あるいは anova(lm()) で分散分析は
行うのが通常かと。思います。何元配置でも同じような
式を書けば1行でできますんで。

16 ：素人：03/09/24 19:05

2元配置分散分析(間違い)と3元配置分散分析(これも間違い)というのは、
どういう意味で「間違い」なのでしょうか？小生、間違いに気づかずに
普通にsummary(aov(...))で解析していたのでｶﾞｸｶﾞｸﾌﾞﾙﾌﾞﾙなのですが…。

17 ：12：03/09/25 09:26

>>16
ええと... 「この例題のような、1個体から複数データを取った場合では
通常の二元配置分散分析を使ったり、個体番号を第3番目の因子として用
いた三元配置分散分析を使うのは間違い」という意味なのですが..。
上記のホームページのテキストに、「こんな場合に普通の2元や3元使って
んじゃねえよこのｳﾞｫｹが!」というようなことが書いてあります。
しかし結構むずかしく書いてあるので、もうすこしやさしいホームページ
としては、「ハンバーガーショップで学ぶ楽しい統計学」
http://chiharu.cside4.jp/elearn/stat2002/INDEX.HTM
があります。
第7章(2要因被験者間)が普通の2元配置で
summary(aov(y ~ a * b)) または anova(lm(y ~ a * b))
第8章(2要因被験者内)が2因子とも被験者内での比較なので
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/a + person/b))) が正しい
第8章11応用問題(1要因被験者間、1要因被験者内)は
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/b))) が正しい
というふうになると思います。
なので、summary(aov())はError項を正しく指定すれば、被験者内要因があ
っても正しく解析できます。
anova(lm())ではこの解析は不可能で、anova(lme())を用いなくてはならな
いようです。その際にはnlmeライブラリを読み込む必要があります。

18 ：１３２人目の素数さん：03/10/11 22:37

私は>>3 ではないですが、皆さんが3次元プロット、3次元の関数や密度を
どのように描いているのかは気になるところです。

19 ：１３２人目の素数さん：03/10/12 00:31

>>18
全部読んでないけど
scatterplot3d
ってパッケージ知ってる？

18レスぐらい読めよって感じだけど読む気がしない・・・・

20 ：１３２人目の素数さん：03/10/12 20:23

>18レスぐらい読めよって感じだけど

まあまあ。ところで普通のplotでscatterplotが出来るのに、
scatterplot3d ってのが見当たらないんですが…。
http://stat.ethz.ch/R-alpha/R-devel/doc/html/search/SearchEngine.html

3次元プロットはたぶん>>3 さんのようにするのが普通
(ヘルプに載ってるやりかた)なのでしょうが、
z <- outer(x, y, f)
ってのが気に食わないのでしょうかねぇ？>17

21 ：20：03/10/12 20:25

3次元プロットって、以下の3つしか知らないのですが…。

image()
> x <- y <- seq(-4*pi, 4*pi, len=27)
> r <- sqrt(outer(x^2, y^2, "+"))
> image(z, axes = FALSE, main = "Math can be beautiful ...",
+ xlab = expression(cos(r^2) * e^{-r/6}))

persp()
> x <- seq(-10, 10, length= 30)
> y <- x
> f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
> z <- outer(x, y, f)
> z[is.na(z)] <- 1 # 関数 persp() はNA を受け付けない
> op <- par(bg = "white")
> persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "lightblue")

contour()
> x <- -6:16
> op <- par(mfrow = c(2, 2))
> contour(outer(x, x), method = "edge", vfont = c("sans serif", "plain"))

他にもあるんですかねぇ？GNUPLOTみたいにplot3dがあってもおかしくないような…。

22 ：１３２人目の素数さん：03/10/12 21:58

>>21
レスをよく読んでないんだけど。

ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/contrib/main/

にscatterplot3d
ってパッケージがあるからそれを使えばよし。
Rってそんなもん。どんなもんだ。
文章滅茶苦茶ですまん。読む気がなければ書く気にもなれん。
Rは好きなんだけど･･･悪気はない。すまん。

23 ：１３２人目の素数さん：03/10/13 01:13

中澤　港：「Rによる統計解析の基礎」ピアソン・エデュケーション，
2003年10月15日初版第１刷，A5判，183pp.，ISBN4-89471-757-3，
1,800円＋税

24 ：１３２人目の素数さん：03/10/13 10:29

>>20
http://stat.ethz.ch/R-alpha/R-devel/doc/html/search/SearchEngine.html
はデフォルトで入っているパッケージ群だから後は必要に応じて自分でインストールせなならん。

http://hosho.ees.hokudai.ac.jp/~kato/unix/R.html
ほい、ここでも読み

25 ：１３２人目の素数さん：03/10/14 04:23

RでGibbs samplingできますか？

26 ：１３２人目の素数さん：03/10/15 23:36

>>17

レスどうもです！参考になりました！！

27 ：21：03/10/15 23:42

>>24 さん、ありがとうございます。早速入れて
みました！副産物として>>25 さんの Gibbs sampling
ができるパッケージも発見しました。適当なフォ
ルダに保存してlibrary()で呼び出せば使えそう
です。

解説PDF
http://cran.r-project.org/doc/packages/negenes.pdf

パッケージ
http://cran.r-project.org/src/contrib/negenes_0.98-3.tar.gz

28 ：21：03/10/15 23:45

あと>>22 さんにも感謝！（書き忘れてました…）

29 ：１３２人目の素数さん：03/10/16 20:56

22=24だから気にするな。

なんかやる気が起きんのは仕事に疲れてるからだな･･･
↑独り言

30 ：１３２人目の素数さん：03/10/17 11:07

>>24
通りすがりですが，
http://hosho.ees.hokudai.ac.jp/~kato/unix/R.html
は役に立ちました．

24さん，ありがとう．

31 ：１３２人目の素数さん：03/10/18 17:20

24さん、イイ！

library(scatterplot3d) にある scatterplot3d() を利用する。

> data(trees)
> scatterplot3d(trees, type = "h", highlight.3d = TRUE, angle = 55, scale.y = 0.7, pch = 16)

が最高！

32 ：節子さん：03/10/18 18:42

http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r2.html

33 ：１３２人目の素数さん：03/10/20 17:09

中澤　港：「Rによる統計解析の基礎」草稿？
http://phi.ypu.jp/statlib/stat.pdf

「Rを使って統計」の本だけど、「R自体の使い方」の本としては
使えなさそうですね。Rの付属マニュアル(PDF)は英語だし、その日本語
訳は「意味分かって訳してる？」っているレベルだし、統計をあまり
やっていない人がRの使い方を勉強する際にはこれも使えなさそう…。
個人的には>>32 さんが紹介した頁
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r2.html
のPDF版みたいなのが欲しいところですが。

34 ：１３２人目の素数さん：03/10/22 20:18

じゃ、おねがいします。

35 ：節子さん：03/10/23 20:56

>>33

作ろうか？
今日中にｷﾀ━━━（ﾟ∀ﾟ）━━━━!!!!!があったら
pdfで書いてもいいけど。

36 ：33じゃないけど：03/10/23 22:58

>>35
神ｷﾀ━━━━━(ﾟ∀ﾟ)━━━━━!!!!

いや、マジでおながいします。

37 ：節子さん：03/10/23 23:42

>>36
んじゃあ、シコシコTeX打ちする。
論文の合間にでも書くんで、ボチボチと待っててくだされ。

38 ：１３２人目の素数さん：03/10/25 00:18

すみません

最近Ｒを知りました。ところで、MathematicaとＲ、どっちが最強でつか？

39 ：１３２人目の素数さん：03/10/25 00:39

使い慣れているMathematica

と、言ってみるテスト

40 ：Mathematica：03/10/26 20:23

Rは微分や積分などの解析計算ができないです・・・。
あくまでRは統計解析用のソフト。ただ、代数系の計算
やデータの処理はMathematica（5と比較しても）なんか
比べ物にならない位、速いです。

まあ比べること自体が無理なような気が・・・。Mathematica
じゃヘボい統計計算しかできないし。

41 ：１３２人目の素数さん：03/10/27 01:19

Matlabはどうよ？
Mapleし込みのシンボリック計算も出来るし、
行列演算もデータのハンドリングもOKだし。

42 ：１３２人目の素数さん：03/10/27 02:41

>>40
Mathematicaの場合、データをインポートするだけでもえらい時間が掛かるね
精々数百キロ～１メガ程度のデータなのにえらい時間が掛かるんだけど
Ｒの場合、ほとんど一瞬だった
なんとかせい、Mathematica！

43 ：１３２人目の素数さん：03/10/27 18:32

確かにMatlabは行列計算に長けていますが、C（FORTRANも？）などで
計算部分の高速化を図っているのはRも同じです。
>>40 さんの話にもありますが、Rは高度な統計計算、最近（２０００～）
のアルゴリズムも平気で実装されているところに魅力があるわけでして、
統計パッケージの数が半端ではありません。
（逆にバグフィックスのチェックがあまりなされていないことになりますが）
しかも無料ですし!!
ただ、数式処理ソフトではないので数値誤差がでるのは仕方がないですね。
>>40 さんのご指摘どおり、Rは微分や積分などの解析計算が出来ないので

http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/23.html

みたいなことをしないといけませんし。（↑のプログラムはちと安っぽいですが）
というか、ここのページのPDFを勝手に作って怒られないんですかね？
ま、いいか。Rの精神からいけばオーケーか。

44 ：１３２人目の素数さん：03/10/27 19:50

そもそもMatlabっておいくらですの？

45 ：１３２人目の素数さん：03/10/27 21:05

＞＞ Sで動作するものはRでもほとんど(90%以上)変更な
＞＞しに動作します.
すいかません。Ｓ知らないんでですけど
ぐらいて的にどこがちがうんですか？
長所。短所は？
すいません教えてください

46 ：１３２人目の素数さん：03/10/27 22:12

R習わなくても、Excelで十分じゃん。
といったら、みんなから叩かれそう。。。でも自分の場合は
Excelで出来ること以上のことをやろうとしたことないので。
Rのメリットって、Excelにないマニアック(自分から見れば
だけど)な統計処理がいっぱい実装されているということ？
皆さんはRにしか出来ない事って、そんなに出くわすのですか？

47 ：１３２人目の素数さん：03/10/28 08:27

でくわしまくそ

48 ：１３２人目の素数さん：03/10/28 20:24

＞４７
どういうときに？

49 ：１３２人目の素数さん：03/10/28 20:46

>>43
積分は標準でできますが？
ex)
> f<-function(x){exp(-x^2/2)/sqrt(2*pi)}
> integrate(f,-Inf,Inf)$value
とかやるとちゃんと１って返してくれるよ

50 ：１３２人目の素数さん：03/10/29 08:30

混合効果モデル
一般化線形モデル
非線形モデル
ブートストラップ
が必要な時

51 ：１３２人目の素数さん：03/10/29 19:27

まあ Excel もいろいろ問題は有るが
取っ掛かりとしては無難だと思うよ。

ん～。１０００点以下のデータ自体の
分析には手軽ではないでしょうか。

そのサンプル集団から母集団の推定等を
本格的にする頃には専用ソフトの方を
使えるレベルになっているでしょう。

52 ：１３２人目の素数さん：03/10/29 21:08

http://www.eonet.ne.jp/~nohohon/osaka-band.htm
http://diary4.cgiboy.com/vote/vote.cgi?i=dave&s=7
http://www.kodama.com/bbs/dave/

53 ：１３２人目の素数さん：03/10/30 09:46

別にデータの大きさとは関係ない
完全ランダムサンプリングでない場合とか
原因と結果が直線関係とみなせない場合は
すでにExcelは無用の長物。
ｵﾏｴﾗ
http://www.amazon.co.jp/exec/obidos/ASIN/4431708219/qid=1067474340/
読んでるか?

54 ：１３２人目の素数さん：03/10/30 11:32

Excelだめじゃんという煽りはしたくないのだが、
青木先生のページと、そこのリンク先も見てみてください。
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

以下、私の考えです。
ただ計算するだけなら、まあいいと思うのですが、
1. 多変量解析にはVBAで書いたアドインソフトが沢山ありますが、
たとえ関数にバグがなくても、数値計算には誤差の集積を避けるために
いろいろノウハウがあり、数式のまんまVBAでつくってあるソフトはどうかな？
と思います。
2.最大の問題は、Excelの関数はどういう計算方法か、明らかにしてないところです。
たとえば、Mathematicaだったら、どういう計算方法か問い合わせすると、
この論文のこのアルゴリズムで、誰がC（など）で書いて発表したものを
使っていると返事がちゃんときます。
Rの場合、それはすっかり公表済みであることが大半です。

なにか分析して、論文に書いて印刷されて、後になって
スマソ、Excelのバグのせいでうそだった。
実は有意差ありませんでした　なんて
大変なことになるのは避けたい。

ずいぶん前のことですが、Pentiumのバグのせいで、
いろんな方面で自分の論文の計算結果は大丈夫だったか？？
ってちょっとしたパニックが起きました。

55 ：１３２人目の素数さん：03/10/30 21:12

漏れExcel派なんですが、
そりゃみなさんの言うように、非線形なモデルやブートストラップはできないけど、
そして大量のデータを食わせることもできないけど、でも殆どの場合（統計の入門書
に出てくる程度）はExcelでなんとかなるし、そして現実に直面する問題も統計の
入門書に出てくる程度が殆どじゃないですか？
Excelで出来ない事はMathematicaでやるか、プログラムをガリガリ書いていたし。

何が便利かって、データを編集するのも、グラフ書くのも、色を変えたりするのも、
めちゃめちゃ簡単で分かりやすいじゃない。コマンドとか覚えなくても
いいじゃないですか。そういう“お手軽さ”が統計ソフトにはないから。
別にMSのまわし者ではないけどね。

56 ：１３２人目の素数さん：03/10/30 21:21

要するに現実に直面する問題によるってこと。
漏れの場合入門書にちょうど出て来ない程度の問題が、仕事上は多いな。

57 ：１３２人目の素数さん：03/10/30 21:49

>>55
の手におえなかった仕事が
>>56
のところに行く。

58 ：１３２人目の素数さん：03/10/30 23:38

>>57
には仕事もこないと。

59 ：１３２人目の素数さん：03/10/31 02:08

内部で何をやっているか気にならない人はEXCEL、
内部で何をやっているか気になる人はRなのでは？
>>54 さんのリンクにもありますが、ええ加減な計算をしといて、
それを仕様だと言い張るMSの内部仕様は信用できませんけど、ええ加減な
計算でも不具合が起こらない程度の計算しかしないのならEXCELで良いでしょう。

ところでRで積分できるんだったら微分は出来ます？

60 ：sage：03/10/31 02:13

>なにか分析して、論文に書いて印刷されて、後になって
>スマソ、Excelのバグのせいでうそだった。
>実は有意差ありませんでした　なんて
>大変なことになるのは避けたい。

EXCELで計算した時点でrejectされそう・・・。

61 ：１３２人目の素数さん：03/10/31 02:26

回帰分析でR^2が負になるらしいね.2乗した値が負て...

62 ：１３２人目の素数さん：03/10/31 03:41

>>60
Excelで出力したグラフが張り込まれてる論文って結構見るけど？

63 ：１３２人目の素数さん：03/10/31 07:42

縄田和満「Excelによる線形代数」(朝倉) という名著を読めばそんな偏見もふっ飛ぶさ．
最近はExcelで流体力学まで学べるのですよ．
Excelマンセー

64 ：１３２人目の素数さん：03/10/31 10:58

>>63
だから「線形」じゃない計算はExcelじゃ難しいんだってばさ。
線形代数ならLispとかpythonもいいかもよ?
ExcelとRの比較って意味小さいよ。市場がちがうんだから。
漏れとしてはSASやJMP使ってる人の、Rとの比較が聞きたい

65 ：１３２人目の素数さん：03/10/31 15:24

>>64
65535個以上の行データが扱えないExcelなんてＲから見ればおもちゃだなｗ

66 ：54：03/10/31 19:03

>>64
JMP良く使ってます。
この外れ値どれだ？みたいな探索的データ分析は得意ですね。
それから、変数の数がサンプル数よりも多いような
困ったケースでも、とにかく主成分分析できる。
もちろん、統計学的にはまずいのだが、
現実には、それでもとにかく主成分分析を
やって、代表的な変数に絞り込みをしたいときはある。
こういうケースは、普通につくってあるソフトだと、
逆行列が計算できなくて（と思う）、固有ベクトルが求められない。
SPSSはだめ。私がやってみたところ、Mathematicaではでます。
Rのprincompだと、計算をそもそもしません。
まあ、そんなんやらないというのが正しいのではあるが。

使い分けですか？
急ぐ分析レポート類で、定番の手法で分析するだけのときはJMP,
定番の手法でも、やっぱりJMPみたいなパッケージだとフレキシビリティ
たりないね。
自分の研究であれこれやってみるとき、また言うまでもないが
最新の手法を使ってみるときにはRですな。

67 ：１３２人目の素数さん：03/10/31 20:38

>>66
おもろい&参考になる

68 ：１３２人目の素数さん：03/11/01 11:15

>>66
私もJMPを愛用してます。
あとは因子分析さえ付けてくれれば文句無いんですが。

69 ：１３２人目の素数さん：03/11/01 17:43

JMPいいなあ。
漏れは検定しかしないんだけど、JMPだと推定／逆推定で
Rじゃ出来ないことができるらしい。
Rだと逆推定は一般化線形モデルのbinomialでdose.p()がある
ぐらいで、それ以上のモデルだとbootstrap使わないと信頼区
間がだせん。
しかし、変数がサンプル数より多いような場合の主成分分析て
どうゆう計算方法でやってるのか、説明書に書いてあるの？

70 ：１３２人目の素数さん：03/11/01 23:10

>Rのprincompだと、計算をそもそもしません。

>Rだと逆推定は一般化線形モデルのbinomialでdose.p()がある
>ぐらいで、それ以上のモデルだとbootstrap使わないと信頼区
>間がだせん。

あの・・・、全然そんなことないのですが・・・。
Ｒは自分で使うパッケージを使う分だけ入れるソフトなんですから。

http://cran.r-project.org/src/contrib/PACKAGES.html

71 ：１３２人目の素数さん：03/11/02 00:14

>>70
線形混合モデルの逆推定とその信頼区間が出せるパッケージってある？
あったらすげーうれしいけど．．。nlme内にはないとおもうが。

72 ：１３２人目の素数さん：03/11/03 02:38

ふかし？ >>70

73 ：１３２人目の素数さん：03/11/04 10:37

やっぱりCIのある逆推定はdose.pだけじゃないかなあ
たのむよ～

74 ：１３２人目の素数さん：03/11/04 20:21

>>70
自分で探せってこと？英語で検索かけるのは面倒だが…。

75 ：１３２人目の素数さん：03/11/05 02:07

あのー微分できる言語ってなんでしょうか？
ヘスケルでつか

76 ：１３２人目の素数さん：03/11/05 20:01

>>60
EXCELで計算した時点でrejectされそう・・・。
>>62
Excelで出力したグラフが張り込まれてる論文って結構見るけど？

グラフじゃなくて関数使って計算させたらってことだろ?
といっても医学薬学関係の論文ならRでも(SASでやらないと)rejectされるだろうが.
まあSASとRを比較するのが間違いだが,強いて言えばSASは古すぎる.
古いがゆえに信頼性は高い(と思われている)が,計算するのに命令書きすぎ.
その点Rはプログラム作成も関数定義もその他諸々楽.それにタダだし.
欠点は上にもあるが,最新のアルゴリズムが搭載されているがゆえバグ多し.
Excel??内部で何やってるか分からない上にバグだらけな関数を使うほど
俺は自信家じゃない.SUMやソート,グラフを描く程度しか使わないのなら
EXCELで十分.セル形式ならRにも(貧相なのが...)あるし。

x <- read.table("sample.dat")
data.entry(x)

ところでJMPってSASを作ってる会社が出してるんだよね?
JMPってどうなの?使いやすいの?俺的には「使いやすくなったSAS」って
いうイメージがあるんだが.

>>71 >>72
自分で探せってことだろ?各々専門分野が違うんだし,>>70 が紹介している
㌻にはちゃんとpdfでリファレンスがついてるじゃん.

>>75
Mathematica,Maple,Mupad,Maxima...
あとRの関数D()かな?俺は使ったことないから「使える」かどうかは知らないけど.

77 ：１３２人目の素数さん：03/11/07 02:33

へぇ～

78 ：１３２人目の素数さん：03/11/07 20:51

JMPの宣伝に必死だなｗ

79 ：ど素人：03/11/14 18:31

やっぱり２元配置分散分析の計算方法がわからないです（泣）
63 48 44 76 82
54 62 56 58 74
57 57 47 70 75
のデータの分散分析表の作り方を教えていただけないでしょうかｍ（＿＿）ｍ
anova(lm())の使い方がよく分からないものですから…

80 ：１３２人目の素数さん：03/11/14 20:51

>>79
青木先生は偉大です。
http://aoki2.si.gunma-u.ac.jp/R/twoway-anova.html

81 ：ど素人：03/11/14 23:55

ありがとうございました！！
青木先生は偉大です（＞＜）

ちなみにanova(lm())を使って求めるやり方はどういう風に行えばいいのでしょうか？？？

82 ：１３２人目の素数さん：03/11/15 09:24

>>81
>>15 が正しいでしょう。その前後も参照のこと。

83 ：１３２人目の素数さん：03/11/15 19:43

>>80

lm()の使い方は大丈夫ですか？
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/44.html

上が分かってらっしゃるなら

?anova

で使い方を見れば分かりますよ。

84 ：83：03/11/15 19:53

嘘ついたかも・・・。修正します。
http://pbil.univ-lyon1.fr/library/base/html/anova.html
http://pbil.univ-lyon1.fr/library/base/html/lm.summaries.html

85 ：１３２人目の素数さん：03/11/15 19:57

>>83

それって一元配置分散分析じゃないの？

86 ：ど素人：03/11/17 00:12

なるほど。。うーん…
lmは線形モデルによる回帰を行うのですよね？
それでanovaは与えられた数値から分散分析表を求めるもの（？）でいいですよね？
目的変数と説明変数とわかっていればlm(目的変数~説明変数）で回帰係数が出せるのですが
63 48 44 76 82
54 62 56 58 74
57 57 47 70 75
のように目的変数がわからない（？）場合はlm(y~x)のｙの部分はどうすればよいのでしょうか？？
本当にど素人ですいません…。

87 ：１３２人目の素数さん：03/11/17 17:02

>>49
感動しました！個人的には20へぇ！

88 ：１３２人目の素数さん：03/11/17 17:50

>目的変数がわからない（？）

おっしゃりたいことは判ります（笑）。群同士の比較ですからね。
とりあえず>>12 さんが紹介している（↓この㌻最高）
http://chiharu.cside4.jp/elearn/stat2002/INDEX.HTM
でイメージを掴んでから、青木先生の説明
http://aoki2.si.gunma-u.ac.jp/lecture/TwoWayANOVA/TwoWay.html
を見られたらどうでしょう？すると
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/44.html#19
に書いてあることが何となくわかるような気がします。

89 ：１３２人目の素数さん：03/11/17 17:59

Rの日本語化パッチがでました！
http://www.okada.jp.org/RWiki/index.php?R%A4%CE%C6%FC%CB%DC%B8%EC%B2%BD%A4%CA%A4%F3%A4%C7%A4%E2%B7%C7%BC%A8%C8%C4#content_1_2

ところで、RのGUIのメニューからCRANに繋いでパッケージをインスコする
方法は知っているのですが、
http://cran.r-project.org/src/contrib/PACKAGES.html
から取ってきたファイルのパッケージを呼び出すにはどうすれば良いのでしょう？
小生、WinXP使っていますが、パッケージが詰まっているフォルダに解凍した
ファイルを置いて　library(パッケージ名)　としてもエラーが出ます・・・。

90 ：１３２人目の素数さん：03/11/17 21:03

「absolute error」

ってなんじゃらほい？

91 ：１３２人目の素数さん：03/11/18 02:18

>>87
微分もできるよ
ex)
> D(expression(sin(x)),"x")
cos(x)

92 ：１３２人目の素数さん：03/11/18 22:13

>>91
すげぇ！へぇへぇへぇへぇへぇへぇへぇ・・・

93 ：１３２人目の素数さん：03/11/18 22:53

>>92
もうMathematicaは、い・ら・な・い！！

94 ：ど素人：03/11/18 22:55

確かにすごいすねー。かなりつかえますねー。

＞８８
のページはまだ頑張って読んで勉強してまス（汗

95 ：１３２人目の素数さん：03/11/18 23:00

>>94
確かに
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r.html
はＲについて最もわかりやすい気がする

96 ：１３２人目の素数さん：03/11/18 23:41

> D(expression(log(x)),"x")
1/x

> D(expression(3*x^5),"x")
3 * (5 * x^4)

へぇ。ただ、これ以上の具体的な使い方がワカラン。

97 ：１３２人目の素数さん：03/11/19 23:06

あまり数式処理能力に期待なさると失望しますよ．
RはMathematicaではありません (MapleでもMatlabでもありません)．
Rの本質とは関連が薄いのですから，「そんなのもあるんだ」程度に捉えておいた方が．

98 ：('A`)　R. ◆AInRnjuvGo ：03/11/20 01:22

数式処理をフリーでやろうと思うなら，

Maxima
http://maxima.sourceforge.net/
Scilab
http://scilabsoft.inria.fr/
Octave
http://www.octave.org/

あたりが妥当では？

99 ：悩める獣医：03/11/20 16:33

+じゃない「元祖」ニュー即から久方ぶりに専門板にきてみたら、間違えて
数学板をクリックしちまった。速攻タブ消そうかと思ったが、なんとなく
ｽﾚﾀｲﾄﾙ眺めてたら偶然このスレ発見。

こんなｽﾚあったんだ。Rのグラフィックス表示で悩んでいたけど
このｽﾚで紹介されてる
ttp://www.okada.jp.org/RWiki/
の参考実例集すっげーいいじゃん。こういう実例がほしかったの。

いやー今日はいい日だ。おまいらありがとう。

勉強してまたくるよ。ヽ( ･∀･)ﾉ●ｳﾝｺｰ

100 ：１３２人目の素数さん：03/11/20 19:34

金持ちはS-PLUSを買え。

101 ：1：03/11/20 20:28

>>96 >>97
データを入れたら自動的に解析結果を出力するような関数を作成してるときに、
たまに密度を微分したり、自分で作った密度を積分してp値を出したいときに使えません？
数値積分はまだしも、数値微分は凄まじく誤差が出ますから重宝しますよ。

>>99
仰るとおり、こんなページが出来たのならRの将来は明るいですよぉ～！
http://www.okada.jp.org/RWiki/

>>100
勘弁してください、20万も払えないっすよ…。パッケージも普通に数万～数十万しますし…。

102 ：１３２人目の素数さん：03/11/20 20:30

>>95
来年２月になくなるらしい

103 ：悩める獣医：03/11/21 01:25

というか、獣医ってもっとも統計から縁遠いんだよね。
5群10群あろうが明らかにノンパラであろうが、すべてstudentTだし

漏れ、最初にこのソフトさわったとき、なんだ？このdosみたいな画面はと
思った。恐る恐る>=2*4とかって入力したら、エラーでやがんの。
もうびびったね。正直。ｳﾝｺちびりそうになった。で思わず、ベーシックおもいだして
>print"うんこ”って入力したね。そしたら、得体の知れない文字と挙句にエラー
涙がでそうになったね。本当にこれつかえるのか？借金して素直にSPSS買おうかと

104 ：悩める獣医：03/11/21 01:27

で、ようやくマニュアルよんだのね。日本語のpdf。でもちんぷんかんぷんなの。
ああわからない。どうしようとおもったさ。で、>>95のところみながら学んだのさ。
まだぜーんぜんだけど、なんとかなりそうには思えてきた。

で、な、最近texをやろうと思うのさ。獣医ってtexなんて論外の世界なんだけど
ね。これがまたわかんないわけさ。もうたすけてぇーって感じ。
まぁこんな感じだ。ヽ( ･∀･)ﾉ●ｳﾝｺｰ

というか、ここではhttpのhは抜かなくてもいいのか・・・・？

105 ：１３２人目の素数さん：03/11/21 01:28

>>103
おまいみたいなのがいることにﾜﾗﾀ

106 ：悩める獣医：03/11/21 01:38

>>105
いやーほめられちゃったよ。まいったな。
お礼にｳﾝｺやる
つ●

もうね、すごいんだよ。この業界。きっとみんなが聞いたら発狂するよ。
漏れはいやなの。ちゃんとしたいの。数式にあこがれてるの。
ちゃんと、正規検定とか、多群の比率を検定したいの。

と・・いうか・・・ひょっとして・・・ｶﾅｰﾘ場違いなのか？漏れは・・・

ｲﾔｰﾝ

107 ：１３２人目の素数さん：03/11/21 01:41

おれは、S言語の本を一冊買った。緑色の表紙のやつ。
ツカミ程度の情報しか得られなかったけど、血肉にはなっていると思う。

やっぱ、最初はネットで情報漁るより、本一冊買うほうがためになるよ。
ある程度分かってきたら、ネットだけで勉強できるけどね。

108 ：('A`)　R. ◆AInRnjuvGo ：03/11/21 01:48

>>107

おそらくこれだすな，

Sによるデータ解析
http://www.amazon.co.jp/exec/obidos/ASIN/432002589X/ref=sr_aps_b_1/249-3164417-2019506

109 ：悩める獣医：03/11/21 02:01

というか、各統計専門のBBSは怖すぎて質問できねぇから
ちょっと質問していい？
可能な限り、自分で勉強はするからさ。回りはだーれもRなんて
つかってないのよ。マジで。

>>108
一応、>>95の教程はおわったつもりだけど、読んだほうがいいかな？
ある程度なら、何も見ずに計算できまつ。
ああベクトルはつかわなさそうなので飛ばしたんですけど・・・

というか、注文しちゃった。金ねぇのになぁ・・・

110 ：１３２人目の素数さん：03/11/21 02:13

>>106
ってかおまい自体検定してもらったほうがいいかもなｗ

111 ：１３２人目の素数さん：03/11/21 02:15

>>109
ってかＲもＳも本質的な同じなのだが・・・ｗ

112 ：悩める獣医：03/11/21 02:16

>>111
それはわかってますよー

>>110
数学板はきびしいね
(´・ω・`)

113 ：１３２人目の素数さん：03/11/21 02:18

しかし、Ｒの書籍が出てからなんか急にＲの認知度が高まった気がするんだけど、気のせい？

114 ：悩める獣医：03/11/21 02:26

ttp://www.amazon.co.jp/exec/obidos/ASIN/4894717573/249-6424432-9345152
これでつか？

とりあえず購入しまーす。

115 ：１３２人目の素数さん：03/11/21 02:35

>>114
購入しなくても著者のページに草稿があるよん
中澤港「Ｒによる統計解析の基礎」
http://phi.ypu.jp/statlib/stat.pdf

116 ：('A`)　R. ◆AInRnjuvGo ：03/11/21 02:35

>>113

RWikiにある記事を考慮すると，

まず

Rで統計はじめませんか
http://slashdot.jp/article.pl?sid=03/07/16/0123201&topic=58

で爆発する土台が出来て，
今回のRの本出版で爆発した，んでは？

117 ：１３２人目の素数さん：03/11/21 02:40

わしはslashdotは見てないんだが書店はちょくちょく行ってる
書店で初めてＲを知った人も多いと思うが、どうか？

118 ：悩める獣医：03/11/21 02:46

>>115
げ・・・ありがとう。早速キャンセルします。

なんか、こんな夜中にありがとうね。
がんばるわ

ヽ( ･∀･)ﾉ●ｳﾝｺｰ

119 ：１３２人目の素数さん：03/11/21 02:54

ｳﾝﾁｲﾗﾈw

120 ：('A`)　R. ◆AInRnjuvGo ：03/11/21 03:04

>>117

そのような人も，多いと思います．
何にせよ，ユーザーが増えるのはいいことだと思います．

121 ：１３２人目の素数さん：03/11/21 18:40

ところでみなさん、利用してるOSはWin？Linux?

122 ：１３２人目の素数さん：03/11/21 18:47

>>121

MacOS X...
edit()がきれいでよいです。

123 ：１３２人目の素数さん：03/11/21 22:28

Linux版Ｒは面構えがWin版とは違うのですね。
クノーピクス上ではじめて知りました。

124 ：１３２人目の素数さん：03/11/21 22:29

Linux版Ｒは面構えがWin版とは違うのですね。
クノーピクス上ではじめて知りました。

125 ：１３２人目の素数さん：03/11/21 23:31

ＳＡＳって個人で使えねーの？

126 ：１３２人目の素数さん：03/11/22 00:37

>>125

Webでは値段表とかでてませんが、1-2年前にどっかでみたときには,
まぁ普通の個人で手が出せるお値段ではなかったと思うです。
しかもたしか年間使用契約で買い取りはできなかったような。
SPSSとかS-PLUSのおねだんならなんとかなるかもしれませんが...SASを大学とかで
勉強しても就職先で実際に使用できなくて泣く人も多いかもね。

127 ：１３２人目の素数さん：03/11/22 09:27

パッケージを増やすたびに値段が違うらしい
確か基本的なパッケージだけで年間契約１５万円以上したかな
それだけで四則演算はできたはず

128 ：１３２人目の素数さん：03/11/22 16:36

SASを個人使用したい奴なんかいるのか？
あんな糞ツール大規模データマネジメントしか使いようないべ。

129 ：１３２人目の素数さん：03/11/22 19:58

>>128
同等なことがＲで十分できるんだからＳ系を使うメリットはほとんどないと思われ

130 ：１３２人目の素数さん：03/11/22 21:42

バージョンアップ版が出てます
R-1.8.1
http://cran.r-project.org/

131 ：１３２人目の素数さん：03/11/23 01:47

SASをＭＸで流せ

132 ：１３２人目の素数さん：03/11/25 00:30

age

133 ：１３２人目の素数さん：03/11/25 17:38

論文を書く上で、審査員に解析したプログラムのソフト名を聞かれないんだったら
SASは要らないと思われ。パッケージの信頼性以外、使うメリット梨。SASはコマンド入力が面倒すぎ！
ようやくS-PLUSのパッケージ群も信頼性が出だしたが、いかんせん値段が…。けどS-PLUSが認知されだしたら
「学校や会社ではS-PLUS、家ではR」
ということが出来るメリットはあるかな。

134 ：１３２人目の素数さん：03/11/26 02:13

>>130
なかまさん、もう日本語化パッチを作ってますね･･･。
http://www.okada.jp.org/RWiki/?R%C6%FC%CB%DC%B8%EC%B2%BD%A5%D7%A5%ED%A5%B8%A5%A7%A5%AF%A5%C8

135 ：１３２人目の素数さん：03/11/27 06:33

Ｒってパッケージが充実してるよね
http://www.okada.jp.org/RWiki/?cmd=read&page=CRAN%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8%A5%EA%A5%B9%A5%C8&word=%B2%F3%B5%A2

136 ：１３２人目の素数さん：03/11/27 20:46

>>135
おそらくここの㌻の和訳ですよね？
http://cran.r-project.org/src/contrib/PACKAGES.html
只今、↑から.tar.gzファイルを拾ってきて、以下のマニュアル
http://buran.u-gakugei.ac.jp/~mori/LEARN/R/R-admin-jp.v15.pdf
を見ながらパッケージをインストールしようと思っているのです
が、どうも上手くいきません…。updateじゃなくて圧縮ファイル
からインストールすることって出来ないんですかね？

137 ：１３２人目の素数さん：03/11/27 21:19

>>136
suになってから，
# R CMD INSTALL hoge/hogehoge.tar.gz

まずは，man R CMD してみましょう。

138 ：１３２人目の素数さん：03/11/27 22:09

>>137
>まずは，man R CMD してみましょう。
R CMD INSTALL --help
の誤りでした。

139 ：136 <- 厨：03/11/28 20:54

すいません、OS書くのを忘れてました…。Win環境でRやってます。
UNIX or Linux ではないので、man が使えないんです…。

140 ：１３２人目の素数さん：03/11/28 21:26

RjpWikiに行ってみたら？

141 ：１３２人目の素数さん：03/11/28 21:44

Win版で
Alt+p
のサブメニューで解決できないのなら、
どのような状態にあるのでしょうか？

142 ：１３２人目の素数さん：03/11/29 01:10

>>139
Windowsならupdateは超簡単だよ
RGuiのメニューで[Packages]から[update packages from CRAN]を選択すれば
自動的にアップデートされます。
base以外のパッケージを入れたい場合は同じ[Packages]から[Install package(s) from CRAN]
か[Install package(s) from zip files...]を選べばＯＫです。

143 ：１３２人目の素数さん：03/11/29 21:55

>>35 >>37
(-Д-） PDFまだぁ～？

144 ：１３２人目の素数さん：03/11/30 12:08

描画がずっと速やなったやん。
１．８．１＞１．７．１

145 ：１３２人目の素数さん：03/11/30 15:56

すみません、質問です。

グラフを描く際、凡例中の数式に変数値を割り当てるにはどうすれば良いのでしょうか？
例えば
frame();legend(0,1,expression(frac(a,b),frac(c,d)),lty=c(1,1),y.intersp=2)
のように入力すると分数表示でa/bとc/dが縦に並んで表示されますが、このaなどの文字を
変数値で置き換えて表示させたいのですがどうやれば良いのでしょうか？

よろしくお願いいたします。

146 ：１３２人目の素数さん：03/11/30 19:03

>>145
自分で新に関数を定義すればできると思います。
以下は直接の解ではないけど参考になれば。
myplot <- function(x){
xx <- length(x)
plot(x,main=c("number of samples:",xx))
}
y <- rnorm(100)
myplot(y)

147 ：１３２人目の素数さん：03/11/30 19:08

>>145
146のつづき。
a,bに何を代入したいかにより，xx <- length の部分を書き改めましょう。
aがベクトルの合計値なら a <- sum(x)とかね。
ここからのポイントは，プロットしたいデータオブジェクトがどんなものなの
か，そのデータのどういう要素を用いて，a,b,c,dを定義したいのかどうか，
ということになりますね。

148 ：１３２人目の素数さん：03/11/30 23:19

>>146-147
回答ありがとうございます。実はその方法だと凡例の中での数式に値を与えることは
できません。expression内でfracという分数を表現する数式が利用できるわけですが
そのときaやbは文字として認識されてしまうので、いくらexpressionの部分を関数で
定義しても結局expressionを使う限りにおいてはaやbの部分を数値に置き換えることは
できません。expression以外でfracのような数式表現が利用できて変数値も数式中に
利用できるような例があれば嬉しいのですが・・・

149 ：１３２人目の素数さん：03/12/01 02:43

>>148
146です。
よく知りもせず口を挟みましたが，挟みついでに。
frac()の正体はなんでしょう？Rの関数ではないようですが。

150 ：１３２人目の素数さん：03/12/01 02:45

>>147
MASSパッケージのfractions関数は使えそうでしょうか？

151 ：１３２人目の素数さん：03/12/01 03:14

>>147
frac()が曲者なんで，正統な方法ではないと思われるが，下のような代入を応
用してはどうか？

> ex1 <- expression(frac(x,y))
> ex1
expression(frac(x, y))
> ex1[[1]]
frac(x, y)
> ex1[[1]][[2]]
x
> a <- 1
> b <- 2
> ex1[[1]][[2]] <- a #代入
> ex1[[1]][[3]] <- b #代入
> ex1
expression(frac(1, 2))

152 ：136：03/12/01 17:54

frac()の話途中ですいませんが…、例えばscatterplot3dパッケージを
取ってきた際に、まず

.tar.gz -> zip

と圧縮形式を変えてから、Rのメニューから

Package -> Install from local .zip ...

を選択すると

> install.packages(choose.files('',filters=Filters[c('zip','All'),]), .libPaths()[1], CRAN = NULL)
updating HTML package descriptions

と出るので一見、上手くいったのかなと思いきや、

> local({pkg <- select.list(sort(.packages(all.available = TRUE)))
+ if(nchar(pkg)) library(pkg, character.only=TRUE)})
Error in testRversion(descfields) : This package has not been installed properly
See the Note in ?library

というエラーが出てしまいます。仕方がないので scatterplot3d.R を
直接読み込んでいる有様なのですが、よい善処法があればお教え願います。

153 ：１３２人目の素数さん：03/12/01 19:03

>152
Windows版用ならこのあたりで入手できます。

ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/bin/windows/contrib/1.8/scatterplot3d_0.3-14.zip

154 ：１３２人目の素数さん：03/12/02 06:49

>>152
> .tar.gz -> zip
>
> と圧縮形式を変えてから、Rのメニューから
ってかこれ自体おかしいだろ
Ｒのメニュー[Package]から[Install Package(s) from CRAN...]を選択するのが
一番楽だと思うぞ。CRANにある好きなパッケージが一覧から選択して簡単にダウンロード
＆インストールしてくれるわけだから。

155 ：１３２人目の素数さん：03/12/02 06:54

>>154（続き）
一度インストールしたパッケージは次回からＲのメニュー[Packages]から
[Load package...]を選択すれば一覧の中に表示されているのでそれを
選択して取り込むことができます。

156 ：悩める獣医：03/12/02 11:43

だいぶパワーアップしてきた

157 ：１３２人目の素数さん：03/12/03 11:14

>>149
epressionの中だけで利用できる数式表現で分数を表します。
>>145
自己解決しました。substituteを使えばできます。例えば、
expr<-substitute(paste(frac(a,b),sum(frac(c,k),k==1,n)),list(a=1,b=2,c=3,n=100))
として
frame();legend(0,1,expr,bty="n")
とかするとaやnが数値に置き換わった数式が表示できます。

158 ：１３２人目の素数さん：03/12/03 12:57

札幌北高校　安部里美　
http://ks502.hp.infoseek.co.jp/cgi-bin/up/src/up0068.jpg

159 ：１３２人目の素数さん：03/12/03 21:29

>>153-155

解決しました！>>153 さんのファイルをＤＬしたら、普通にインストールできました。
***.tar.gz はwinでは使えないんですね。

160 ：age：03/12/08 21:03

age

161 ：１３２人目の素数さん：03/12/09 10:50

時系列に対して変量回帰を当てはめた場合の分散分析は
summary(aov(a ~ b + c + poly(d,3)))でいいんでしょうか？
(a：評価値、b,c：母数効果、d：時系列)

162 ：１３２人目の素数さん：03/12/14 05:44

163 ：１３２人目の素数さん：03/12/16 22:56

plot関数で
プロットの点(type='p')の大きさを変えることはできますか？

デフォルトでは大きすぎます。

164 ：１３２人目の素数さん：03/12/16 23:58

>163
plot(.．．．，pch=数字)ではいかがですか？

165 ：１３２人目の素数さん：03/12/19 14:30

>>163
詳しくはココ。
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/33.html

166 ：１３２人目の素数さん：03/12/21 13:28

　任意小数に小数点以下何位まで含まれているか（精度）が知りたいです。
例えば12.2なら指数表記では122e-1だから１位。12.20は1220e-2なので２位。

　文字列に変換して小数点「．」の右側の文字数をカウントするのはおもしろくないので、
そのまま使える関数とかはありませんか？

167 ：１３２人目の素数さん：03/12/21 20:37

Rで関数定義を行う際に、局所変数や局所的な配列が使いたいときってどうすればよいのでしょうか？

168 ：１３２人目の素数さん：03/12/22 23:52

これって擬似逆行列とかって
求められますかね？

どうも因子分析できなくて

169 ：１３２人目の素数さん：03/12/24 21:55

>>168
ここの「一般逆行列を求める方法（ムーア・ペンローズ型一般逆行列）」をご覧下さい。
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/16.html#09

170 ：１３２人目の素数さん：03/12/28 21:34

>>167
そんなことは気にしなくてよいはずです。

171 ：１３２人目の素数さん：03/12/31 21:46

帰無仮説:ボブサップが曙に負ける
対立仮説:ボブサップが曙に負けない

を有意水準5%で検定したいのですが、どうすればよいでしょうか?

172 ：１３２人目の素数さん：03/12/31 22:02

>>171
あと１時間半後に誰かがレスするんじゃない？

173 ：１３２人目の素数さん：03/12/31 23:04

>>171
有意水準0.001%で検定しましたが，帰無仮説が棄却されました．
よって対立仮説が棄却され，「ボブサップが曙に負けない」と
結論付けられました．

それではよいお年を．

174 ：１３２人目の素数さん：04/01/04 23:24

age

175 ：１３２人目の素数さん：04/01/04 23:48

ここは棄却されまくりなスレでつね

176 ：１３２人目の素数さん：04/01/12 21:38

LifeCycleSavings のデータを、変数srを目的変数として重回帰分析したら、寄与率が３３％とか出た・・・

> data(LifeCycleSavings)
> ls.print(lsfit(LifeCycleSavings[,-1],LifeCycleSavings[,1]))
Residual Standard Error=3.8027
R-Square=0.3385
F-statistic (df=4, 45)=5.7557
p-value=8e-04

Estimate Std.Err t-value Pr(>|t|)
Intercept 28.5661 7.3545 3.8842 0.0003
pop15 -0.4612 0.1446 -3.1885 0.0026
pop75 -1.6915 1.0836 -1.5610 0.1255
dpi -0.0003 0.0009 -0.3618 0.7192
ddpi 0.4097 0.1962 2.0882 0.0425

レポートで出てるんだけど、考察書くとしたらどう書けばいいの？
「寄与率がこのように低くなってしまったのは、○○だからだと思われる」の○○って、どう書けば・・・
ちなみに、
sr・・・貯蓄額
pop15・・・15歳以下の人口比率
pop75・・・75歳以上の人口比率
dpi・・・可処分所得
ddpi・・・dpiの伸び率

177 ：１３２人目の素数さん：04/01/13 18:00

>>176
ここには変数ごとのt-test結果が張っていないけど、
t-testで棄却されていない変数を落として重回帰を
やり直したらRの値が増えるんじゃない？
AICとかで測って変数を減らしてもいいだろうけど。

178 ：１３２人目の素数さん：04/01/24 21:15

Rで多変量のスプライン回帰がやりたいのですが、いいパッケージありますかね？
普通のsplineは(x,y)の場合しかできないもので・・・。

179 ：１３２人目の素数さん：04/02/01 04:42

160

180 ：竹澤：04/02/02 10:48

＞Rで多変量のスプライン回帰

　gcvpack.dll　がRでもS-Plusでも使えます。
以下のWWWページの（１１４）で公開されています。

http://cse.naro.affrc.go.jp/takezawa/smooth-7.html

181 ：もう手遅れかもしれんが：04/02/02 13:07

>>176
○○＝「適切な変数を投入できなかった」

>>177
どんなクソ変数であっても，それを落としたときに
Rの値が増えることはあり得ないと思うが気のせい？

182 ：１３２人目の素数さん：04/02/02 18:54

ほしゅ

183 ：１３２人目の素数さん：04/02/02 18:55

ほっしゅ

184 ：R-Tips”管理”人：04/02/03 22:11

私は節子さんではありませんが、論文の合間にシコシコTeX打ちして
R-TipsのPDF版を作りました。
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf
ついでにR-Tipsのhtmlも改訂しました（注：移転しています）。
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
良かったら御覧下さい。

185 ：１３２人目の素数さん：04/02/06 00:24

>>184
R初心者(統計自体始めたばかり)ですが、早速いただきました。
ありがとうございます。じっくり読ませていただきます。

大作ですので、プリントアウトだけでも一仕事ですな。ｗ

186 ：１３２人目の素数さん：04/02/07 15:28

Rのコマンドライン履歴って .Rhistory に格納されますよね．
長くなってきたらエディタとかで勝手に上の方を削ってしまって問題ないのでしょうか．

187 ：１３２人目の素数さん：04/02/07 15:59

>186
試しに削ってみたけど大丈夫みたいだったよ

188 ：186：04/02/07 17:50

>>187
やっぱり大丈夫ですか．私もやってみましたが，判断にはサンプルの数が必要だと思いまして．

どうでもよい変数を何度も表示したりしてると，
次にワークスペースを回復したときに履歴から重要な入力が辿り辛いんですよね．

189 ：１３２人目の素数さん：04/02/08 22:30

>>184

キター!!!

190 ：１３２人目の素数さん：04/02/10 22:19

３次元の２ベクトル a,b　が張る平面を描画するプログラムをつくれますか？

191 ：１３２人目の素数さん：04/02/11 00:26

使わないライブラリも全部入れて毎日アップデートするのが日課でつｗ

192 ：１３２人目の素数さん：04/02/11 10:50

>190
scatterplot3dがお役に立つと思います。

193 ：１３２人目の素数さん：04/02/11 10:56

>191
CRANからのアップデートは簡単でよろしいですな。んでも、新作ライブラリーはどうしてます？

194 ：１３２人目の素数さん：04/02/19 21:37

RjpWikiをみる。

>>184

いいぞっ!

195 ：１３２人目の素数さん：04/02/23 22:56

>>193

update.packages() で解決します。また
read.dcf(file=system.file("DESCRIPTION",package="tree"))
でパッケージの情報の取得が可能です。dcfはdebian control format の
事ですが、Windowsでも使えます。

196 ：１３２人目の素数さん：04/02/27 11:48

あげ

197 ：１３２人目の素数さん：04/02/28 14:18

ESS使ってる人いますか？
.emacs.elの中でどうやって設定しているのでしょう？

(load "usr/lib/..../lisp/ess-site")
で設定すると使いもしないのにいつも不要なバッファは生成されて困っています。

ＲというよりEmacsの質問になると思いますがアドバイスお願いします。

198 ：１３２人目の素数さん：04/03/04 21:59

Emacs+ESS+Rを利用してます。emacsでRファイルを編集するとき、コメントマーク「#」の数により、その行の色を変更できると便利ですよね。
とりあえずの対処療法として、

M-x hi-lock-mode
M-x highlight-regexp [RET] ### [RET] hi-red-b
M-x highlight-regexp [RET] ## [RET] hi-green-b

などとしてます。(順序が大事)

199 ：１３２人目の素数さん：04/03/07 13:48

889

200 ：１３２人目の素数さん：04/03/09 03:54

200

201 ：１３２人目の素数さん：04/03/14 20:26

sage

202 ：１３２人目の素数さん：04/03/17 17:44

R統計システムについてのよくある質問
ttp://www.cbrc.jp/~tominaga/translations/R/FAQ.txt

203 ：１３２人目の素数さん：04/03/17 17:48

やっぱりlisp-statでしょ

204 ：１３２人目の素数さん：04/03/17 23:18

lisp-statとRは作者が一緒ですよ．

205 ：１３２人目の素数さん：04/03/20 04:58

R 1.9.0 alpha 版が出ました！

206 ：１３２人目の素数さん：04/03/26 03:10

>>205
おっ、出たの！で、どんな機能拡張があったの？

207 ：１３２人目の素数さん：04/03/27 00:55

・計算速度がUP（MCMC 法の実行時間が R 1.8.1 より４倍(!?)近く早くなったとのコメント）
・アンダースコアを変数名に使えるようになる
・標準ライブラリの構成が大きく変わる

だそうです．

208 ：１３２人目の素数さん：04/04/04 16:58

209 ：１３２人目の素数さん：04/04/10 20:19

javaとの連携の情報，どこかにない？

210 ：１３２人目の素数さん：04/04/12 21:37

R 1.9.0

211 ：１３２人目の素数さん：04/04/12 23:55

>> 209

RjpWikiの「RとWebサービス」のRSOAPを使ってやるのがいまのところ
Java的には一番美しい方法かも。ほかはJNIっぽい...

212 ：１３２人目の素数さん：04/04/13 03:04

1.9.0リリースｷﾀ━━━━━━(ﾟ∀ﾟ)━━━━━━ !!!!!
とりあえずシコシコビルド中。

213 ：１３２人目の素数さん：04/04/18 00:51

RでX11やX12等の季節調整ができる関数なんぞありますか？

214 ：１３２人目の素数さん：04/04/20 22:57

時系列？なら ts パッケージがありますよ．

215 ：１３２人目の素数さん：04/04/29 17:16

tsパッケージは少し弱い。
arima.predict さえない。

216 ：１３２人目の素数さん：04/05/01 12:22

Rで待ち行列シミュレーションのプログラム書いた人いませんか？
R-Wikiの方ででも公開してください。おながいします。

217 ：１３２人目の素数さん：04/05/01 22:54

http://cl.is.kyushu-u.ac.jp/Literacy/PP/H14/adp/program/queue.files/frame.htm
http://www.bunkyo.ac.jp/~nemoto/lecture/simulation/98/queue1/ppframe.htm

218 ：１３２人目の素数さん：04/05/08 19:43

The R Book　期待あげ

219 ：１３２人目の素数さん：04/05/08 22:13

The R Book 楽しみにしてるんだが、いったいいつ出るのだ。

220 ：１３２人目の素数さん：04/05/08 22:40

5月末には書店に並ぶと思われ <RjpWikiより

221 ：219：04/05/09 00:11

>220
サンクス。今、見てきた。

> 出版時期: 5月末発売予定
> 出版社: 九天社
> 価格: 税込み3900円(本体価格3800円)の予定
> B5変型版/448頁(予定) CD-ROM付

むー、正直CD-ROMはイラナイ。

222 ：１３２人目の素数さん：04/05/09 00:44

スレ違いｽﾏｿ。

MuPADに関する質問はどこでするのが最適ですか？

223 ：１３２人目の素数さん：04/05/09 01:33

>221

本文中で使ってるデータとかが収録されててスグ試せるならいいかも >CD-ROM

224 ：１３２人目の素数さん：04/05/11 00:56

>221

ならこれはどうよ？無料だし、もちろんCDはついてないし。
http://cwoweb2.bai.ne.jp/~jgb11101/files/r-tips.pdf

225 ：221：04/05/12 00:46

>>224
いいねぇ。
R-Tipsのページは知ってたけど、PDF版もあったとは。

欲を言えば、多変量解析の部分をもっと充実させて欲しい。
因子分析とかk-means法のクラスタ分析とかSEMとか。

226 ：１３２人目の素数さん：04/05/13 22:58

>>222
最強！！数学ソフトウェア(maple, mathcad etc)
http://science2.2ch.net/test/read.cgi/math/1051275230/

やや荒れ気味かも

227 ：１３２人目の素数さん：04/05/21 00:31

>> 225

載ってるジャン。コマンド名さえあればヘルプを見ればいいっしょ。

228 ：221：04/05/25 00:15

みなさん、The R Book は手に入りましたか？

229 ：１３２人目の素数さん：04/05/25 00:35

池袋のジュンク堂で買ったよ。

230 ：１３２人目の素数さん：04/05/26 13:52

http://www.amazon.co.jp/exec/obidos/ASIN/4901683128/qid=1085547150/sr=1-1/ref=sr_1_10_1/250-9982525-4383410

231 ：１３２人目の素数さん：04/05/26 22:42

思ったより分厚かったのと、立ち読みして読みやすかったので買いました。
皆さん顔写真入りで砂。

232 ：１３２人目の素数さん：04/05/30 20:58

curve関数の質問です。

例えば指数分布関数
dexpを描画したいときにはどうすればいいのでしょうか？

イメージ的には

curve ( dexp(rate=3) )

としたいのですが・・・

233 ：１３２人目の素数さん：04/05/30 21:41

こんな感じでしょうか？

curve(dexp, from=0, to=3)

234 ：１３２人目の素数さん：04/05/30 22:00

>>233
レスありがとうございます。

ただ、それでは
dexp関数のパラメータ rate=3
を反映することが出来ていないと思うのですが・・・

235 ：１３２人目の素数さん：04/05/31 00:12

失礼．

curve(dexp(x, 3), from=0, to=3)

236 ：１３２人目の素数さん：04/05/31 20:39

おかげさまで出来ました。
[curve]と引数を与えないでソースを見てさらに納得しました。

237 ：１３２人目の素数さん：04/06/01 20:32

待ち行列パッケージなんてあっても良さそうだね。
つくろかな。

もうあるような気もするが・・

238 ：１３２人目の素数さん：04/06/02 17:33

初心者です。
Ｒの用語集とかないですか？

239 ：１３２人目の素数さん：04/06/02 20:34

単語検索はこちら．
http://www.okada.jp.org/cgi-bin/Rsearch/namazu.cgi/

一覧はこちら．
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/00.html

手法別一覧はこちら．
http://aoki2.si.gunma-u.ac.jp/R/

240 ：238：04/06/03 16:02

>>239
ありがとうございます。

241 ：１３２人目の素数さん：04/06/09 21:42

age

242 ：１３２人目の素数さん：04/06/14 20:43

R 1.9.1 alpha が出ましたね．

243 ：１３２人目の素数さん：04/06/17 17:34

関数の使い方は分かるんですが、
その仕組みや構造そのもの（例えば数式、理論など）を
知りたいときは何を見たら分かるのでしょうか？

244 ：１３２人目の素数さん：04/06/18 00:25

(1) 関数名をそのまま入れる

> var

(2) ヘルプを見たり，ヘルプの参考文献を見たりする

> ?var

245 ：助けてください・・：04/06/22 00:16

例数不揃いのときのNested-ANOVAってどうすればいいんでしょうか？
ヘルプ読んでもnested-anovaにヒットしない・・・
ネットでも例数が揃っている場合しか見つからないんです。

x y z
a i 3
a i 4
a j 4
a j 1
a j 6
b i 5
b i 2
b i 7
b j 3
b j 2

>summary(lm(z~x/y))
でやったら、SASとかSPSSと答えが微妙に違う・・・

246 ：助けてください・・：04/06/22 00:36

すいません
summary(aov(z~x/y))の間違いです。どのみちダメでした。

247 ：リンク集：04/06/23 00:08

>>246
http://www.okada.jp.org/RWebRef/RManualJP/anova.lm.jp.html
http://www.okada.jp.org/RWebRef/RManualJP/anova.glm.jp.html
http://www.okada.jp.org/RWebRef/R-intro.html

248 ：１３２人目の素数さん：04/06/23 03:42

WindowsのRでxgobiはどうやって入れたら良いのでしょう。
Xを立ち上げないと駄目？

249 ：１３２人目の素数さん：04/06/27 14:48

>>248
こんな感じですか？
http://su10.sgu.ac.jp/~jin/R/08.html

250 ：１３２人目の素数さん：04/07/06 18:26

187

251 ：１３２人目の素数さん：04/07/08 02:21

Vine linux 2.95にR-1.9.1をソースからコンパイルしてインストールしました。

ところがRを実行し終了しても.Rhistoryが作成されず、入力履歴が残らないんですけど、
入力履歴を保存するようにするには何か設定が必要なのですか?
ちなみに.RDataはちゃんと保存されています。

252 ：１３２人目の素数さん：04/07/09 17:07

>>251
自己レスです。
readline-develをインストールしてからRをbuildしなおすことで
解決できました。

お騒がせしました。

253 ：１３２人目の素数さん：04/07/12 20:53

今日はシステムに対する世界観が変わりました。

x1 = 0.5 - 0.3
x2 = 0.3 - 0.1

x1 == x2
FALSE

になるのは仕方ないのでしょうか？
機械誤差というところまでは解ったのですが、
完全に理解しないと、この先やっていけない気がしました。

抽象的な質問ですがよろしければ、ご教授下さい。

254 ：１３２人目の素数さん：04/07/12 22:23

>>253
http://www.google.co.jp/search?hl=ja&ie=UTF-8&q=%22%E4%B8%B8%E3%82%81%E8%AA%A4%E5%B7%AE%22
http://www.google.co.jp/search?hl=ja&ie=UTF-8&q=%22%E8%A1%A8%E7%8F%BE%E8%AA%A4%E5%B7%AE%22

例えば
http://www.amy.hi-ho.ne.jp/jbaba/messages/1764.html

255 ：１３２人目の素数さん：04/07/12 22:50

>>253
R では == で実数を比較しない方が良いのでは？identical()を使って下さい．

> x1 = 0.5 - 0.3
> x2 = 0.3 - 0.1
> x1-x2
[1] 2.775558e-17
> identical(all.equal(x1,x2),TRUE)
[1] TRUE

256 ：１３２人目の素数さん：04/07/13 14:06

http://hp.vector.co.jp/authors/VA008683/
最強ってこと？

257 ：１３２人目の素数さん：04/07/28 08:54

621

258 ：１３２人目の素数さん：04/08/03 01:40

>>253
システムに対する世界観が変わるほどの問題じゃないぞｗ
これはCでも同じ。普通は

x1 - x2 < 小さな数

として処理するところ。

259 ：258：04/08/03 01:42

ぬお、絶対値付け忘れた。

260 ：綺麗だなぁ：04/08/08 22:59

x <- seq(-10, 10, length= 200)
y <- x
f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
z <- outer(x, y, f)
z[is.na(z)] <- 1
persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = rainbow(200), border=NA)

261 ：１３２人目の素数さん：04/08/11 22:29

今だ!R2.0.0ｹﾞｯﾄｵｫｫｫｫ！！
￣￣￣￣￣∨￣￣￣　　　　　　　(´´
　　　　 ∧∧　　　）　　　　　　(´⌒(´
　　⊂（ﾟДﾟ⊂⌒｀つ≡≡≡(´⌒;;;≡≡≡
　　　　　　￣￣　 (´⌒(´⌒;;
　　　　　　ｽﾞｻﾞｰｰｰｰｰｯ

262 ：１３２人目の素数さん：04/08/14 02:19

"2004-08-14 01:03:12" といった文字列を整数にするには、どうしたらよいで
しょうか。as.Date()のようにフォーマットが指定できて、時間も処理できる
関数ってありますか？
μ秒も処理できるとなおよいです。
> ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16")
> t <- as.Date(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"

263 ：１３２人目の素数さん：04/08/14 02:25

なんだかnlmeパッケージのアップデートが失敗するんですが
みなさんうまくいってますか？

264 ：２６３：04/08/14 02:28

あっ、今やったらうまくいった！
昼やったときは途中でエラー出てたのに・・・

265 ：１３２人目の素数さん：04/08/14 12:22

>>262

>"2004-08-14 01:03:12" といった文字列を整数にするには

「整数」の基準が良く分からないのですが，例えば1900年1月1日00:00:00を
基準にして何秒たっているかを秒で表示するということでしょうか？

> as.Date()のようにフォーマットが指定できて、時間も処理できる関数

の「フォーマットが指定」の意味が良く分からないのですが…．

266 ：１３２人目の素数さん：04/08/15 23:37

>>265
以下のstrptime()のようなもの。tが整数かどうかは、不明。
> ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16")
> t <- as.Date(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"
> t <- strptime(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 01:03:12" "2004-08-14 01:03:14" "2004-08-14 01:03:16"

267 ：１３２人目の素数さん：04/08/22 00:11

age

268 ：１３２人目の素数さん：04/08/29 17:17

890

269 ：１３２人目の素数さん：04/09/05 07:10

182

270 ：１３２人目の素数さん：04/09/10 05:57

559

271 ：１３２人目の素数さん：04/09/10 06:26

え

272 ：１３２人目の素数さん：04/09/15 03:59:17

思わぬ失敗
> a<-c(-5,1,-2,3,4)
> a[a>2]
とすると
[1] 3 4
となりaでa>2を満たすものが抽出されるけど、同じ調子で
> a[a<-2]
とするとaに2が代入され初期化されてしまう。正しくは
> a[a<(-2)]
としないとダメ。結果は
[1] -5
となる。

273 ：１３２人目の素数さん：04/09/18 10:05:24

MUSASHIとRって相性良いと思う？

274 ：１３２人目の素数さん：04/09/22 08:02:27

summary()の結果をファイルに落としたい時にはどうしたら良いの？

275 ：１３２人目の素数さん：04/09/22 21:33:59

sink()
でよいかな。

276 ：274：04/09/23 11:19:25

>275
Thanx!　助かりました！

sink("sink-examp.txt")
summary(x)
sink(NULL)
ですね．

?sinkのexampleにあるように"sink()"ではsink-ingが止まらず，
"sink(NULL)"しないとだめでした
[R-1.9.1 win32]

277 ：１３２人目の素数さん：04/09/28 02:49:12

310

278 ：１３２人目の素数さん：04/09/29 22:30:21

DBI パッケージとどのパッケージを組み合わせれば
PostgreSQLを扱えるのでしょうか・・・・・

いくら探してもPostgreSQL用パッケージだけが見つからないのです。

279 ：１３２人目の素数さん：04/10/02 12:24:01

http://rpgsql.sourceforge.net/

280 ：１３２人目の素数さん：04/10/02 12:27:25

rpgsqlは開発が終わってますよね。

ふと思ったのですがRDBIとDBIは同一パッケージなのでしょうか？

281 ：１３２人目の素数さん：04/10/02 12:28:58

いや、別物でした。
RDBIの後継がDBIになるわけで・・・

282 ：１３２人目の素数さん：04/10/02 15:24:41

スマソ >rpgsql古い

http://www.bioconductor.org/repository/release1.4/package/html/index.html
http://www.nakama.ne.jp/memo/cran-R/Rdbi.PgSQL/

283 ：１３２人目の素数さん：04/10/02 22:30:10

rdbiも古いのではないでしょうか？
それともpostgresと連携したければ、
dbiではなくrdbiを使わないといけないのでしょうか？

284 ：１３２人目の素数さん：04/10/02 22:55:58

RODBCが汎用性からいえばよいのではないでしょうか。
The R Bookの第4章にいろいろ情報がありますね。

285 ：１３２人目の素数さん：04/10/03 12:30:25

Linuxで使ってるので、ODBCには少し抵抗感があったりします。
しかし、dbiがpostgresqlをサポートしていないようなので
とりあえずODBCを使わせてもらうことにしました。

レスありがとうございました。

286 ：１３２人目の素数さん：04/10/03 15:14:10

ESSの補完バッファが鬱陶しいのですが
役割が終わったら、役目を果たせなくても閉じてくれるような
設定にすることはできませんか？

287 ：１３２人目の素数さん：04/10/04 22:11:52

モジュールのインストールがうまくいかないよ
最近インストールに失敗するモジュールが増えた？

288 ：１３２人目の素数さん：04/10/08 00:20:51

いつの間にか、Help → HTML Help → Search Engine & Keywords が使えなくなってる。
WindowsXPのSP2のスクリプトブロックが原因かな、と思う。
でも、IEのセキュリティオプションで片っ端から「有効」に設定してもダメ。

誰か同じ問題に困って、解決出来たひと、います?

289 ：１３２人目の素数さん：04/10/08 06:42:02

　R-2.0.0　ｷﾀｰ----!

290 ：１３２人目の素数さん：04/10/08 23:41:18

まじっすかﾜｰｲヽ(ﾟ∀ﾟ)メ(ﾟ∀ﾟ)メ(ﾟ∀ﾟ)ノﾜｰｲ

釣りじゃないよね(´･ω･`)

291 ：１３２人目の素数さん：04/10/09 00:45:21

釣りじゃありませんっ！

なかまさんのサイト（Win，Vine）
http://r.nakama.ne.jp/R-2.0.0/

292 ：１３２人目の素数さん：04/10/09 01:42:25

どう変わったのかな
調べる気力が起きん・・・('A`)

293 ：１３２人目の素数さん：04/10/09 11:32:19

http://www.okada.jp.org/RWiki/index.php?%a3%d22.0.0%a4%ce%bf%b7%b5%a1%c7%bd%a1%a6%ca%d1%b9%b9

294 ：１３２人目の素数さん：04/10/10 22:33:19

WindowsでESSを使うにはどうしたらいいんですか？

295 ：１３２人目の素数さん：04/10/10 22:35:31

>>294
Meadowというエディタを入れれば使えるけど
そこまでしてESS使う必要ないと思うよ。
費用対効果が悪すぎる。*nix全般を覚える必要に迫られるから。

R-2.0はESSに負けないエディタが付属しているみたいだから,
そちらを調べたらどうでしょうか？

296 ：１３２人目の素数さん：04/10/10 22:51:08

ｸﾞﾆｭｰ

297 ：あぼーん：あぼーん

あぼーん

298 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/11 14:34:48

Re:>297 捏造すんな。

299 ：１３２人目の素数さん：04/10/11 15:55:13

>>297-298　スレを荒らすな！自作自演はもうウンザリだ！

300 ：LettersOfLiberty ◆rCz1Zr6hLw ：04/10/11 17:32:13

Re:>299 お前は普段から汚いことしてるから私が自作自演していると思うんだろうな。

301 ：１３２人目の素数さん：04/10/13 22:40:59

WinのＲをインストールしました。
パッケージなどをダウンロードするために、
Ｒのショートカットを右クリックして、リンク先の最後に--internet2とつけたいのですが、
（http://www.okada.jp.org/RWiki/index.php?cmd=read&page=Windows%C8%C7R%A4%CEFAQ&p=3　参照）
「パス名が無効です」というエラーがでてしまうは何故ですか？教えてください。

302 ：１３２人目の素数さん：04/10/14 00:24:37

>>288
自己レス。
困ってたのは俺だけか...

明示的にJavaのランタイムをインストールしたらOKになった。

...今までいろんなPCで使ってきたけどJavaの存在を全く意識してなかった。
実はなにげにJava入れとったのかしらん。

ついでに、IEオプション詳細設定で、「マイコンピュータのファイルでの
アクティブコンテンツの実行を許可する」にチェックを入れておくと、
いちいち承認を求めてこないので、ややスッキリ。

R2.0.0 Patched / WindowsXPSP2でした。

303 ：１３２人目の素数さん：04/10/14 07:31:33

復刊にご協力下さい。

竹内啓,柳井晴夫多変量解析の基礎　東洋経済新報社
http://www.fukkan.com/vote.php3?no=22328

統計学を専門とする人ではなくとも、
多変量解析を使うときに手元に是非置いておきたい名著。
多変量解析の基礎理論がわかりやすくかつ体系的に厳密に展開されていきます。
多変量解析に関するこれだけの名著は未だに出ていないと思います。

よろしくお願いします。

304 ：１３２人目の素数さん：04/10/15 11:58:06

>> 301
オプションはダブルクォーテーション ("")を一旦閉じてから書かないと駄目です。
つまり，
"C:\Program Files\R\rw2000\bin\Rgui.exe" --internet2
とすれば良いはず。

305 ：１３２人目の素数さん：04/10/15 13:04:24

306 ：301：04/10/15 21:32:17

>304
間にスペースが必要だったんですね。
目からウロコです。助かりました。
どうもありがとうございました！

307 ：１３２人目の素数さん：04/10/24 03:40:38

589

308 ：１３２人目の素数さん：04/10/30 12:01:20

153

309 ：１３２人目の素数さん：04/11/04 03:10:40

RjpWikiＱ＆Ａ（初心者コース）の冒頭にある
｢マニュアル : http://buran.u-gakugei.ac.jp/~mori/LEARNR Data Import/Export/R/ 」
がリンク切れなのだがどこへ行けばいいのだろう

310 ：１３２人目の素数さん：04/11/04 10:14:51

なおしときました

311 ：309：04/11/04 20:56:34

ありがとうございます>>310

312 ：１３２人目の素数さん：04/11/09 03:20:07

287

313 ：NK：04/11/11 16:56:35

バージョンを２．００にしてRODBCもバージョンを１．１－２に更新したら
今まででsqlSaveコマンドでACCESSに結果を書出していたのが、”Error in gsub
(pattern,replacement,x,ignore.case,extend invalid regular expression"
というエラーメッセージが出てきて動かなくなってしまいました。
どなたか、解決方法をご存知ないでしょうか？

314 ：１３２人目の素数さん：04/11/15 19:53:43

608

315 ：age：04/11/20 17:10:27

age

316 ：１３２人目の素数さん：04/11/21 00:41:39

重回帰分析で、修整済みR^2が1に近づくとNANになっちゃうんですが
なぜですか？教えてエロい人

317 ：１３２人目の素数さん：04/11/21 09:30:32

385

318 ：１３２人目の素数さん：04/11/24 22:54:25

vine linux 3.0を使っています．
odesolveを使用したく，
odesolve_0.5-12.tar.gzをダウンロードしました．
$ R CMD INSTALL /path/to/odesolve_0.5-12.tar.gz
を実行しましたが，うまくいきません．

319 ：１３２人目の素数さん：04/11/24 23:16:35

>>318
自己レスです．
>update.packages()
で解決しました．

320 ：１３２人目の素数さん：04/12/01 14:01:05

glmmMLうまく入らないな

321 ：１３２人目の素数さん：04/12/02 08:05:38

529

322 ：１３２人目の素数さん：04/12/04 15:44:48

クラスタ分析てエクセルでどうやってやるんでしょうか。
初心者なのでわかりません。どなたか教えていただけないでしょうか。

323 ：320：04/12/04 17:05:18

>>320解決
パッケージ入れるときは管理者じゃないといけないなんて･･･orz
それを先にいってれぼ

>>316
ver2.0.0のlmにはバグあるみたい

324 ：１３２人目の素数さん：04/12/04 17:34:40

>>322
エクセル自体には、そのような高度な統計関数はないので、アドオンをインストールするか、
Rを使う。　Rはユーザーインターフェースは原始的だが、統計処理については非常に豊富で
パワフルで、正確と思う。　インストールして損するソフトとは思わないが。

325 ：ECL：04/12/07 01:27:23

Rで三角ダイヤグラムを作図できるのでしょうか。
三角ダイヤグラムは、主に地学、金属学、化学などの分野で使われてる
正三角形の各辺を10等分して目盛を入れ、三成分系の組成をプロットし、
その図から組成比の変化などを検討するというやつで。

326 ：１３２人目の素数さん：04/12/07 17:18:18

>>325
あらゆるグラフィックを比較的容易に自作できるのがRのウリなので、自作してみては？
案外、探し回るよりも早いかも。

327 ：１３２人目の素数さん：04/12/07 23:20:35

>325
ttp://www.stat.ucl.ac.be/ISpersonnel/lecoutre/stats/fichiers/_gallery.pdf　17頁？

328 ：１３２人目の素数さん：04/12/10 20:39:56

x y z
1 1 2
2 4 5
4 2 5
...

とデータがあるとします。
この時、
persp( x , y , z , z_guess=TRUE )

等として z を補完してくれることはないのでしょうか？
回帰分析でzを補完するイメージです。

329 ：１３２人目の素数さん：04/12/11 08:42:25

二つのデータをヒストグラムにして、それを重ねて表示させたいのですが
どうやったらよいでしょうか？

330 ：１３２人目の素数さん：04/12/11 09:05:33

coplotってなんじゃらほい。
見方が解らないです。

331 ：１３２人目の素数さん：04/12/13 03:14:18

>>328
パッケージ「あきま」なんかどうです？

332 ：１３２人目の素数さん：04/12/14 21:54:30

データフレームからサンプルをn個抽出するにはどうすればいいのでしょうか？

sample ( data , 3 )

だと３列ランダムサンプリングされてしまいます。

333 ：１３２人目の素数さん：04/12/15 01:26:58

>>332
データフレーム？？？
データフレームのどのデータからサンプリングするわけ？
それがわからなきゃそもそもできないだろが！

334 ：１３２人目の素数さん：04/12/15 01:38:04

[File]→[Change Dir...]で指定される作業用ディレクトリは保存できないんでしょうか？

335 ：１３２人目の素数さん：04/12/15 08:37:06

>>332

sample(as.matrix(dataframe),3)

336 ：１３２人目の素数さん：04/12/15 20:56:30

>>334
起動時に引数で渡せば良い。
起動用のショートカットの「作業フォルダ」に望むパスを指定する。

337 ：１３２人目の素数さん：04/12/15 21:34:34

>>335
それだと、数値属性の情報もカテゴリーデータの情報も失われてしまいますよね？
何かいい方法ないのでしょうか？

338 ：１３２人目の素数さん：04/12/15 22:22:13

>>336
おかげさまでできました。
ありがとうございました。

339 ：１３２人目の素数さん：04/12/15 22:31:57

>>337

colnamesの情報を残したまま抽出したいということでしょうか?
そうなるとデータそのものから抽出するより、座標を抽出して
対応するデータをとってきたほうがいいような。

n x mのデータフレームとしてi <- sample(1:(n*m),3)とかやって、
dataframe[i%/%m+1,i%%m+1]とか？
あとはiをみれば情報は残ってるはず

340 ：１３２人目の素数さん：04/12/15 22:46:28

う～ん、難しいです。

baseに入っているstate.x77を例に教えていただけないでしょうか？

state.x77[1:3,]
Population Income Illiteracy Life Exp Murder HS Grad Frost Area
Alabama 3615 3624 2.1 69.05 15.1 41.3 20 50708
Alaska 365 6315 1.5 69.31 11.3 66.7 152 566432
Arizona 2212 4530 1.8 70.55 7.8 58.1 15 113417

こういったデータフレームがあった時に、イメージとしては
sample( state.x77 , 2 )としたら
２オブザベーション返ってくる感じです。

あつかましいお願い申し訳ありません。

341 ：１３２人目の素数さん：04/12/16 07:57:10

>>340

ちょっとやりたいことがはっきりしませんが...SAS語の「オブザベーション」と
同じ意味だとすると...
state.x77[sample(nrow(state.x77),3),]
ということ？
求めるデータのイメージを具体的に示してもらえれば答えやすいですが。

342 ：初心者：04/12/21 23:58:27

質問です．
線形重回帰分析で予測値の信頼区間をプロットしたいのですが，
色々探したのですが，掲載されていませんでした・・・
どなたかご存知でしょうか？
非常に困っているので教えて下さい．
宜しくお願い致します．

343 ：１３２人目の素数さん：04/12/22 21:47:38

ここらへん見てみ
ttp://cse.naro.affrc.go.jp/takezawa/r-tips/r/43.html

344 ：１３２人目の素数さん：04/12/24 01:44:05

>343
それって単回帰のページですよね
重回帰での信頼区間はそれだとでないような・・・
まあ、私も重回帰での信頼区間のだしかたを知らないのでなんともいえないのですが・・・

自分でがつがつ書くしかないんですかね～

345 ：１３２人目の素数さん：04/12/24 08:48:07

>>344

モデルをmlm として
predict(mlm, int="c")
ではいかが。

346 ：345：04/12/24 08:56:28

補足: 単回帰も重回帰も、直線回帰であれば lm() でまったく区別なく扱えます。
ロジスティックとか、直線でない場合は glm() を。

参考書: Introductory Statistics with R (だれか翻訳してるかなぁ)

347 ：１３２人目の素数さん：04/12/24 14:53:10

age

348 ：348：04/12/28 05:23:53

＞346
信頼区間の値がかなりばらついているから、
重回帰では使えないと思ってました。

参考書みて勉強してみます
ありがとうございました

349 ：１３２人目の素数さん：04/12/30 22:12:08

poly

とは要するになんでしょ？

350 ：１３２人目の素数さん：04/12/31 08:59:49

boxplot()で平均値を表示させることはできるのでしょうか？

351 ：初心者：05/01/17 04:49:58

Rはフリードマン検定全部やってくれるのですか？
他の使い方もあるのでしょうか？

352 ：１３２人目の素数さん：05/01/18 20:52:14

中心化移動平均を求めるには？

filter関数では無理ですよね？

353 ：初心者：05/01/19 14:51:03

Rは数値を入れ込むのがめんどう・・・・エクセルの表でぱっとやってくれないの？

354 ：１３２人目の素数さん：05/01/19 19:12:33

>>353
scan("hoge.csv")

355 ：１３２人目の素数さん：05/01/19 19:43:14

>>353
read.csv("hoge.csv")

356 ：１３２人目の素数さん：05/01/19 23:15:08

>>353
read.table("hoge.csv", sep=',')

この辺の使い分けは rjpwiki にも列挙してあるだけで自分で調べて欲しいという
ことになっていますね．そんなに重要なことはないのかな?

357 ：１３２人目の素数さん：05/01/23 08:14:39

>>356
自分で調べるも何も、まんまな訳だが。
>>353
Excel上でRを使う方法があるよ。私はLinuxユーザだから試したことがないけどね。
OpenOffice.org Calc上で使えるようになったら、演習講義に採用するかも。

358 ：１３２人目の素数さん：05/01/23 13:59:38

データ入力がexcelじゃ限界あるだろ

359 ：１３２人目の素数さん：05/01/23 16:58:52

カーソルキーで移動できるターミナルのCSVエディタがあればなあ。
MSDOSのロータスみたいなので、式はなしでもいい。
そいうのしりませんか。

360 ：１３２人目の素数さん：05/01/23 19:25:56

>>357
>Excel上でRを使う方法
マジっすか？
どっかに関連情報のリンクとかあったら教えていただきたいです。

361 ：１３２人目の素数さん：05/01/23 19:52:57

>>359
それ、俺も欲しい

362 ：１３２人目の素数さん：05/01/24 00:14:20

>>360

http://www.okada.jp.org/RWiki/index.php?cmd=read&page=RExcel

>>361

363 ：１３２人目の素数さん：05/01/24 00:16:11

>>359,361

data.entry()

364 ：360：05/01/24 08:31:49

>>362
うほっ。Wikiにあったとは…。ありがとうございました。

365 ：１３２人目の素数さん：05/01/24 16:09:11

>>359
このスレ、ノウハウがない人が多いな。学生のたまり場になっているのかな。
コンソールで動作する表計算ソフトならあるけど、
sc ftp://ibiblio.org/pub/Linux/apps/financial/spreadsheet/!INDEX.html
これがCSVを吐いたかどうかは未確認。
emacs を -nw オプションをつけて起動するとコンソールモードになります。
それで、csv-modeになると、コンソール用csvエディタに変身するよ。
http://centaur.maths.qmw.ac.uk/Emacs/

366 ：１３２人目の素数さん：05/01/24 23:16:01

>365
お前はききかじりじゃねえか

367 ：１３２人目の素数さん：05/01/25 13:47:44

こんな関数ありますか?

hoge(f, a, b, c, d, ...) ==> f(f(f(f(a,b),c),d),...)

f (引数 2 つ) を適用した結果を引数の 1 番目，リストの次を 2 番目として
また f を適用し，，，という動作です．

368 ：１３２人目の素数さん：05/01/25 17:21:14

>>366
>>365だけど、もちろん両方とも使ってみた上での発言だよ。emacsのCSVモードは日本
語に難があって、今は使ってない。まぁコンソールと言わずに、OpenOffice.org Calc ->
csvとした方が効率がよいと思うけど。

>>367
そんな関数というか、まんま書いたらいいと思うけど。
fuga <- function(x,y){x+y}
hoge <- function(f,x){
y <- x[1]
for (i in x[-1]) { y <- fuga(i,y) }
}

369 ：１３２人目の素数さん：05/01/26 18:15:04

>>368
反応がないということは分かりにくかったか？
f(引数2つ) の例として f <- function(x,y){x+y}
という関数があったとして、
> f(2,3)
[1] 5
だな。で、
> x <- c(5,7,1,8,9,12)
というxがあったとして、f(f(f(f(f(5,7),1),8),9),12) を計算したいとする。
> y <-x[1]; (for (i in x[-1]) {y <- f(i,y)})
[1] 42
と書けば>>367の期待通りに結果になる。

370 ：１３２人目の素数さん：05/01/26 22:46:43

＞３６８
じゃあただのききかじりだな

371 ：367：05/01/27 00:47:49

>>368
返事が遅れてすみません．
無いみたいなので自分で作ろうとしましたが，
まだ R に馴れていないので脱線し，そのままになっていました．

結局，まんましか思い浮かばず．．．

脱線中に困ったのですが，
mapply を兼ねた apply はありませんか?

できれば apply( mat1, 1, function (m1, v1, v2) {...}, vec1, vec2 )

のようにしたいところを，

apply( cbind (vec1, vec2, mat), 1, function (m) { ... } )

というように，頭から 1 コずつ適用して欲しいベクトルも行列に混ぜないと
なりませんよね．

372 ：１３２人目の素数さん：05/01/28 00:32:25

SASユーザです。教えて下さい。
行列計算用のパッケージ（SASではIMLなど）はありますでしょうか？
その中で、逆行列や最適化の計算はできるでしょうか？

373 ：１３２人目の素数さん：05/01/28 00:58:44

>>372
http://www.okada.jp.org/RWiki/index.php?%B9%D4%CE%F3Tips%C2%E7%C1%B4

374 ：１３２人目の素数さん：05/01/29 11:53:29

plot ( x , log="xy" )

で対数軸にプロットしたいのですが、
軸が指数表記になってしまいます。5e-01

これを通常の十進表記にすることはできるのでしょうか？

375 ：１３２人目の素数さん：05/01/31 20:24:41

grangerの因果性のテストができるパッケージなどあるのでしょうか？

376 ：１３２人目の素数さん：05/02/16 13:12:06

666

377 ：１３２人目の素数さん：05/02/17 21:19:51

もう一度質問させてもらいます。
時系列varモデル、grangerの因果性のテストができるパッケージなどあるのでしょうか？

378 ：１３２人目の素数さん：05/02/20 03:16:37

The R Tips
http://www.amazon.co.jp/exec/obidos/ASIN/486167039X/250-6433896-6339428

379 ：１３２人目の素数さん：05/02/28 22:47:13

345

380 ：１３２人目の素数さん：05/03/08 12:13:08

>>215、>>378
便乗質問
ついでにＡＲＩＭＡなども扱えるようなパッケージはあるのでしょうか？

381 ：１３２人目の素数さん：05/03/08 14:17:04

age

382 ：１３２人目の素数さん：05/03/09 00:59:30

arimaはデフォで使える。
varはarで可能。

grengerは？だれか教えて。

383 ：１３２人目の素数さん：05/03/10 22:28:35

>>380
fBasicsはダメですか？

384 ：１３２人目の素数さん：05/03/11 07:02:42

グランジャー因果はなかった希ガス

385 ：１３２人目の素数さん：05/03/11 11:16:32

グランジャー因果って何ですか？グーぐるで「とは検索」しても出てこなかったのですが・・

386 ：１３２人目の素数さん：05/03/11 11:20:50

ハースト指数ってどのモジュールから取れますか？
本家サイト検索しても出てこなかったので、無理でしょうか・・

387 ：１３２人目の素数さん：05/03/11 11:35:28

日本地図ってデフォでついてたっけ？

388 ：１３２人目の素数さん：05/03/11 23:41:25

>>387
ttp://aoki2.si.gunma-u.ac.jp/R/map.html

389 ：１３２人目の素数さん：05/03/12 12:30:57

グレンジャー因果が無いってのは致命的では？
実務上時系列で一番重要なものではないか。

390 ：Cox回帰：05/03/12 17:05:03

matlabで生存時間解析を行いたいんですけど（COX回帰とか）、どこかに
サブルーチンはフリーで落ちていないでしょうか？

391 ：１３２人目の素数さん：05/03/13 01:54:02

>>389
Rって「研究者が自分に必要なものを自作する世界」(R. Gentleman in ISM, [12, Mar. 2005])だから
今までに必要な人がいなくて作られてないってのは別に不自然じゃないと思うよ。

欲しければ自分で作ってRコミュニティに貢献してくださいな。

それとグレンジャー因果って本当に因果なの？個人的には時間差を持った相関にしか見えないん
だけどな。

392 ：１３２人目の素数さん：05/03/13 01:58:58

それとGranger因果ってF検定してるだけだった希ガス

393 ：１３２人目の素数さん：05/03/13 08:47:13

>時間差を持った相関にしか見えない

専門家にはそうにしか見えなくても良いんだよ。
手法の詳細はともあれ、実務上は時系列の因果関係を示せる指標が求められる。
ラグを考えないピアソン相関係数を示しただけじゃ偶に突っ込まれちゃうんだよね。

そうなると多少難しいグレンジャー因果が必要とされる。

394 ：１３２人目の素数さん：05/03/13 14:55:38

>>393
回答あんがと。本来は相関でしかないものを確信犯的に因果と言っている人に文句は言わないよ～
（似たようなことは俺もしてるし）

調べたけど、やっぱりF検定するだけだからGrangerのためにパッケージはいらんかもよ（←適当ですまん）

395 ：１３２人目の素数さん：05/03/13 15:51:01

どなたかwaveslimを使って時系列のウェブレット分析してる方いますか？
ご丁寧にGDPなどのサンプルデータまで入っているのに使い方が分からないorz
コアプログラムも分からない・・

396 ：１３２人目の素数さん：05/03/13 15:53:14

ロジスティック回帰分析を行うのにＲではglm（一般化線型モデル）を
用いますが、見やすく出力してくれる関数等は存在するのでしょうか？

例えば偏回帰係数はオッズ比の自然対数ですが、これをオッズ比に戻すために
exp ( x )
信頼区間を求めるために
exp ( x + 1.96 * StdError)
等としますよね？

ちょっと手間がかかるので、もっとスマートな方法があるのではと思いました。

397 ：１３２人目の素数さん：05/03/18 10:53:09

定数項を含まないGLMを推定したいのですが、GLM()でマニュアルにある通り
intercept=FALSE
と設定しても　Error in glm.control(...) : unused argument(s) (intercept ...)　
と出てしまってうまくいきません。自分のモデルが悪いのかと思い、helpにある
モデル　Dobson (1990) Page 93　で試したのですが同じでした。Rは標準インストール
しただけの状態で特にパッケージなどは入れていません。

私は何か勘違いをしているのでしょうか？もしご存知の方がいらしたら是非お教えください。

398 ：397：05/03/18 12:03:53

397ですが、自己解決しました。マニュアルどおりのintercept=FALSEではうまくいかないのですが、
式を指定するところで、説明変数の最後に-1をつければ(e.g. y ~x1+x2+x3-1)　よいようです。
お騒がせしました。

399 ：１３２人目の素数さん：2005/03/23(水) 12:26:10

>>387
Splusの方のmapsにはあるらしいよ。
市町村合併で大変だろうけど。
>>388
素直にshapeファイルとmaptoolsを使った方がいろいろと小回りが利くと思うけど。。。

400 ：１３２人目の素数さん：2005/03/24(木) 05:09:19

age

401 ：１３２人目の素数さん：2005/03/28(月) 21:28:32

ヒストグラムの重ね書きはできますか？

402 ：１３２人目の素数さん：2005/04/13(水) 06:31:02

874

403 ：１３２人目の素数さん：2005/04/15(金) 00:52:35

>>401

x1 <- rnorm(100)
x2 <- rnorm(100)
hist(x1, xlim=c(-5,5), ylim=c(0,0.5), prob=T)
par(new=T)
hist(x2, xlim=c(-5,5), ylim=c(0,0.5), prob=T, col=2)

404 ：１３２人目の素数さん：2005/04/18(月) 22:15:19

R -2.1.0．になりました

405 ：１３２人目の素数さん：2005/04/18(月) 22:29:05

Rでアソシエーション分析なんてできますか？

406 ：１３２人目の素数さん：2005/04/18(月) 23:11:35

Ｒで尖度と歪度を定義したいのですけど、どうすればいいのでしょうか？
一応こちら（ttp://aoki2.si.gunma-u.ac.jp/R/univariate.html）の方にそれらしきものは掲載されていたのですが、これはExcelからの読み込みを対象にしているようで、いまいち分かりません。
教えていただけると幸いです

407 ：１３２人目の素数さん：2005/04/21(木) 00:56:15

>>406
詳しくはRWiki
http://www.okada.jp.org/RWiki/
で検索すれば出てきます。

Ｒメニューの[Packages]→[Install Package(s) from CRAN]から
e1071をインストールすればkurtosisやskewness等の統計関数が使えます。

408 ：１３２人目の素数さん：2005/04/21(木) 03:04:48

>>407
ありがとうございます。e1071をインストールしたら統計関数がみれました。

409 ：１３２人目の素数さん：2005/04/21(木) 20:43:07

v2.1

example関数にバグがあるね。
エラーになる。

410 ：１３２人目の素数さん：2005/04/23(土) 07:13:25

>>409
どんな？使った範囲では問題ないけど。

411 ：１３２人目の素数さん：2005/04/23(土) 11:20:47

v2.1
日本語環境がまだまだ中途半端に感じたので、ロケールをCに設定。
その上で、example関数を実行したら

which[x] ..not defined default value..
ISO????

のようなエラーが発生。正確には覚えていない。
今手元でテストできる環境にないのでスマソ。

412 ：１３２人目の素数さん：2005/04/24(日) 13:12:01

グラフィック全般での質問ですが、軸の数字を小さく表示することはできますか？

413 ：１３２人目の素数さん：2005/04/25(月) 11:29:15

plot(x,y,cex.axis=.8)
try
?par

414 ：１３２人目の素数さん：2005/04/29(金) 21:17:23

Rをインストールするとき,
BLASライブラリのサポートを必要とした方がいいのでしょうか？

415 ：１３２人目の素数さん：2005/04/29(金) 22:54:25

mean関数のtrim引数の動作が全く理解できません。
このtrim関数の意味を教えて下さい。よろしくお願いします。

416 ：１３２人目の素数さん：2005/05/02(月) 23:07:37

まずい回答例

　　まずい質問の模範的な例ですね。まず質問場所がまずい。
　　自分が何をしたのか説明しないで、どうして赤の他人に問題がわかりますか。

417 ：１３２人目の素数さん：2005/05/03(火) 06:21:40

age

418 ：１３２人目の素数さん：2005/05/03(火) 07:58:24

回答者の知識レベルにも依るでしょ。

>>415
トリム平均でぐぐれ

419 ：１３２人目の素数さん：2005/05/03(火) 23:48:28

>>416　ｼﾑﾗｰ!!!　2005-05-01 (日) 08:31:32のRwiki 、Rwiki

420 ：１３２人目の素数さん：2005/05/05(木) 13:23:32

Rを独習中で、The　R bookを使っているのですが、decomposeコマンドを使う際に
dataコマンドで、データセットを読み込むとありました。
しかし読み込みが出来ません。単に読み込む前に何か私がし忘れていることが
あるのでしょうか？
どなたか、教えていただけませんか？

421 ：１３２人目の素数さん：2005/05/05(木) 13:43:41

data ( co2 )
#この時点で読み込みは完了している。

decompose ( co2 )

422 ：１３２人目の素数さん：2005/05/05(木) 14:16:10

>>421

data（読み込みたいファイル）としても、
not　foundと表示されるんです。
やはり、方法が間違っているのでしょうか？

423 ：１３２人目の素数さん：2005/05/05(木) 14:47:46

一般のテキストファイルを読み込もうとしてるのなら、

help ( "read.table" )
help ( "scan" )

424 ：１３２人目の素数さん：2005/05/05(木) 15:00:41

>>423
read.table("c:～.txt")という風に、上の本に書いてあるようにして、
こっちのコマンドでは読み込みは正常に出来ているみたいです。
plot(～）とすると、ちゃんと図になりますし。
しかし、dataコマンドの方は、notfoundと表示されます。
教えてくださったように、helpは二つとも見てみましたが、
read.tableの使い方はあっているようです。
目的は、Rを使って時系列分析をすることなんですが、
そこから前に進めなくて。

425 ：１３２人目の素数さん：2005/05/06(金) 06:19:09

co2ってデータセットは普通にインストールすれば入っているものですから、
not foundになるのはちょっと変ですね。

本の付録についているCD-ROMに本に書いてあるコマンドを書いたファイルが
あるので、それをメモ帳か何かで開いてコピーして実行してみてはどうでしょう？

426 ：１３２人目の素数さん：2005/05/06(金) 12:32:29

>>425
data(co2),decompose(co2)は上手いこといきました。なぜ、出来なかったのかは
分かりませんが、多分タイプミスだと思います。
ありがとうございます。
しかし、このco2のデータは元々入っているものですが、元々入っていない
私の作成したデータの場合はやはり上手いこといかないのですが･･･。
decompose(ファイル名)としても、
Time series has no or less than 3 periods!
と表示されるのです。初心者なので、本の通りに進めているのですが、
データは自分のものを使って分析したいと考えていますので。
何かし忘れていることがあるのでしょうか？

427 ：１３２人目の素数さん：2005/05/06(金) 14:21:41

>>426
そのメッセージは、「データに含まれる時点（period）が３時点未満である」
と指摘していると思うのですが、その指摘自体は正しいですか？
Moving averages を使って解析する上で、少なくとも３時点ないと
だめなのではないかと思います。

428 ：１３２人目の素数さん：2005/05/06(金) 14:40:04

>>427
その指摘自体が良く分からないのです。
私が使うデータは、円ドルレートのデータで、約2500日分のレートが入っています。
形式は、txtです。read.tableにより読み込んで、plotで描けば、レートの変動が
グラフになって表示されるので、3時点ということはないと思うのですが。
単に2500個のデータがあるだけではだめなのでしょうか？

429 ：科学者の卵：2005/05/06(金) 15:49:47

私は、科学者の卵です。はじめて掲示板に書き込みます。
よろしく、お願いいたします。
ヨーロッパでは、品質管理の統計にＣＯＶ（私は聞いたことがない）という
手法か？、単位か？で表現することがあるそうですが、どなたかご存じでしょうか
教えてください

430 ：１３２人目の素数さん：2005/05/06(金) 16:12:05

>>429
このへんじゃないかな？ググっただけなんで、アレだけんども・・・

Deming's red bead experiment and mechanical sampling
http://www.ingentaconnect.com/content/mcb/176/1998/00000003/00000003/art00005

楕円近似について（その５）
http://www.geocities.jp/ikuro_kotaro/koramu/daenkinji5.htm

431 ：４３０：2005/05/06(金) 16:13:45

ついでにググりのURLも書き込んどく
http://www.google.co.jp/search?hl=ja&q=Deming%E3%80%80COV&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=

432 ：BlackLightOfStar ◆ifsBJ/KedU ：2005/05/06(金) 18:58:04

Re:>429 おそらくCOVは日本語でいう共分散のことだろう。covarianceの略。

433 ：１３２人目の素数さん：2005/05/06(金) 20:20:11

>>428
そのデータは、「年」と「日」に分解されていますか？
period として年、season として日を認識させないといけないのでは。
co2 は、「年」と「月」という構造を持ってますよね。

434 ：１３２人目の素数さん：2005/05/06(金) 21:45:32

>>433
分解されていません。co２の方は、確かに分解されていました。
しかし、どのようにすれば良いのでしょうか？
持っているThe　R　bookには載っていなくて。
私の使う為替レートは、年は1993～2005で連続ですが、市場が開いていない日
があるので、抜けている日があるのですが。

435 ：１３２人目の素数さん：2005/05/07(土) 08:13:56

>>434 ご参照あれ。
http://www.okada.jp.org/RWiki/index.php?The%20R%20Book%20%A4%B4%B0%D5%B8%AB%2F13

436 ：１３２人目の素数さん：2005/05/07(土) 08:52:08

>>435
ありがとうございます。今、早速そのページのようにしたら、本のように
上手い事出来ました。
自分の使っている本を書かれた方から直接教えて頂けるのは、本当に
嬉しい限りです。
本当にありがとうございました。

437 ：１３２人目の素数さん：2005/05/07(土) 09:03:26

へぇ、矢野先生も２ch見てるのね。
先生、decompもいいけどX12を実装してください。

と匿名をいいことに無茶を言ってみる。

438 ：１３２人目の素数さん：2005/05/15(日) 19:21:43

helpコマンドで良く出てくる「Ｓ３」とはなんでしょうか？

439 ：１３２人目の素数さん：2005/05/16(月) 21:13:43

tsオブジェクトで月平均や年合計を簡単に計算する方法はあるのでしょうか？

440 ：１３２人目の素数さん：2005/05/17(火) 07:32:59

>>439
aggregateで月平均や年合計を計算可能です。

441 ：１３２人目の素数さん：2005/05/17(火) 22:31:51

>a
numeric(0)
>is.numeric(a)
[1] TRUE

ええええええええええええ

442 ：１３２人目の素数さん：2005/05/18(水) 01:00:32

最頻値の出し方はどうすればよいのでしょう。
mode関数はＲには備わってないようですが、、、。

443 ：１３２人目の素数さん：2005/05/18(水) 14:02:00

突然失礼致します。

統計解析ソフトの「R」を使用して箱ひげ図を作図しています。
その際、外れ値を出力しないようにしたいのですが、うまくいきません。
どなたかご存知の方がいらっしゃいましたらアドバイスを頂けますと幸いです。

以下のページを参考にして、
http://epidemiology.md.tsukuba.ac.jp/ML/R-jp/20000912/224_3.html

データを読み込み、

x <- c(1:100, 1000)
boxplot(x,do.out=FALSE)

のようにして出力しているのですが、外れ値は出力されたままでした。

444 ：１３２人目の素数さん：2005/05/18(水) 18:30:01

>>443
boxplot(x,outline=F)
じゃないの？
R 2.1.0 patchedでの話です。

?boxplot
でヘルプファイルが出ます。
確認してください。

445 ：１３２人目の素数さん：2005/05/18(水) 20:09:56

希望するグラフができました。
本当にありがとうございました。

446 ：１３２人目の素数さん：2005/05/18(水) 21:24:53

>>440
レスありがとうございます。
しかし、年合計はできたのですが、月平均の方法がわかりません。

どのようにやればいいのでしょうか？

447 ：１３２人目の素数さん：2005/05/19(木) 20:54:36

"2 > 1" や"x == y"のような文字列を論理式として扱いたいんですが方法がわかりません。ご教授お願いします。

448 ：447：2005/05/19(木) 21:49:10

一応、ファイルに出力→source()で実行って形で自己解決出来ましたが、よりよい方法があったら教えてください。

449 ：１３２人目の素数さん：2005/05/20(金) 00:58:31

xx <- parse(text = "x+y")
x = 2; y<- 23; eval(xx)

symbol あるのにわざわざ文字列？

xx <- quote(x + 3)
x <- 33 ;eval(xx)
x <- -3 ;eval(xx)

450 ：１３２人目の素数さん：2005/05/20(金) 01:09:53

クロージャもあるし
a <- function(x) {x == y}; y<-3; a(3)

451 ：447：2005/05/20(金) 10:03:29

>>499,450
ありがとうございます。うまくいきました。
treeで作ったルールセットを分割して保存・実行したかったんです。

452 ：１３２人目の素数さん：2005/05/22(日) 11:54:16

すみません、賢い2ちゃんねるのみなさんに質問です。

text<-"abcdefg"
regMatchPos("abcdefg","cde")

は、S-PLUSだと動くのに、
[,1] [,2]
[1,] 3 5

Rだと動かない
　Error: couldn't find function "regMatchPos"
理由を教えていただけないでしょうか。
「データによるプログラミング」にも似たような式が載っているのに不思議です。

453 ：１３２人目の素数さん：2005/05/22(日) 12:05:20

賢くないから答えない

454 ：１３２人目の素数さん：2005/05/22(日) 12:19:52

R Functions for Regular Expressions
* grep()
* regexpr()
* gsub()
* sub()

455 ：１３２人目の素数さん：2005/05/22(日) 12:28:34

454さん

解決しました。ありがとうございます。

456 ：１３２人目の素数さん：2005/05/30(月) 23:05:51

質問です。
例えば100個のベクトルに対してトリム平均で上下2％を取り除いた平均を求めるとします。
このとき、取り除いた上下2％のベクトルsを知る事ができるのでしょうか。
どなたかやり方をご存知であればご教示ください。

457 ：１３２人目の素数さん：2005/05/31(火) 09:05:29

>>456
100個の2%ってことは、2個。
sortして、1番目と2番目と99番目と100番目が取り除いたものじゃないの？

458 ：456：2005/05/31(火) 12:47:15

>>457
レスどうもです。一応検証してみました。
> a <- rnorm(100)
> mean(a,0.02) == mean(sort(a)[-c(1,2,99,100)])
[1] TRUE
> a <- rnorm(99)
> mean(a,0.02) == mean(sort(a)[-c(1,2,98,99)])
[1] FALSE
> mean(a,0.02) == mean(sort(a)[-c(1,99)])
[1] TRUE

上下2%の時、ベクトル100個では上下2個除いていて
99個のときは一個づつ除いてるみたいですね。
いや、Ｒがトリム平均を求める時にちゃんと上下2％を認識して弾いてるわけだから
自分でまた計算し直すのもアホらしいと思ったけどしょうがないですよね
そうですよね。

459 ：１３２人目の素数さん：2005/06/02(木) 15:32:41

age

460 ：誰か：2005/06/08(水) 08:45:59

３×３行列で一行目5 53 50 ニ行目53 657 536 三行目50 536 558の逆行列を表計算ソフトで求めれますか？

461 ：１３２人目の素数さん：2005/06/08(水) 11:19:14

スレ違い？
>>460
Excel でいいなら
一行目79310 -2774 -4442 ニ行目-2774 290 -30 三行目-4442 -30 476
の全体を27428 で割ったもの。

462 ：１３２人目の素数さん：2005/06/08(水) 15:47:53

461さん、ありがとうございました。

463 ：460：2005/06/08(水) 15:48:12

461さん、ありがとうございました。

464 ：１３２人目の素数さん：2005/06/16(木) 15:22:45

MacOSX TigerにRcmdrが入りません。
何か必要なんでしょうか？

465 ：１３２人目の素数さん：2005/06/17(金) 12:14:56

age

466 ：たかの：2005/06/17(金) 19:51:08

初歩的な質問で,申し訳ありません.

CRANからRMySQLをダウンロードして,RGuiのパッケージから
「ローカルにあるZIPファイルからのパッケージのインストール」を実行しました.

library()で確認したところ,
「No title available (pre-2.0.0 install?) **~」
と表示されてしまい,使用する事ができません.
WindowsXPサービスパック1,R 2.1.0を使用しているのですが,
どなたかご教授頂けないでしょうか.

467 ：１３２人目の素数さん：2005/06/21(火) 01:21:09

質問です。いまRの説明文を書いているのですが、
「C言語の構造体」=「R言語のリスト」っていう説明で、問題はありませんか？

468 ：１３２人目の素数さん：2005/06/21(火) 14:47:39

問題オオアリだと思うが。
一つのリストにいろいろな型の値を入れられるという趣旨かなと想像するけど。

469 ：１３２人目の素数さん：2005/06/21(火) 17:34:47

468さん

はい、そういうことを言いたいのですが、
467の言い方だとどこらへんがマズいですか？

470 ：１３２人目の素数さん：2005/06/21(火) 20:50:10

C union ならいろいろな型を入れられる。
R の list はgeneric vector を作る関数だとマニュアルに書いてある。

471 ：１３２人目の素数さん：2005/06/21(火) 21:52:13

R の list は、vectorやmatrixに名前(names()で参照)をつけて保存
するもので、同じ長さのvectorをいくつか束ねると dataframe に
なります。

Cのような機械語寄りの言語だと同様の概念はありませんが、
強いてたとえるならば、構造体というよりも、
void型のポインタの配列といったところでしょうか。

JavaやC++のSTLでいうところのコレクション系クラスがしっくり
きますね。

472 ：１３２人目の素数さん：2005/06/22(水) 05:44:43

>471-472
ありがとうございました。勉強になります。

473 ：１３２人目の素数さん：2005/06/22(水) 13:29:52

>>467
例の本ですか。がんばれ。

474 ：１３２人目の素数さん：2005/06/22(水) 20:10:09

>>473さん
えーと？　僕が誰だかばれているとなると、ちょっとびっくりです。

ですががんばります。
いつか(今年末くらい?)、Rの世界に恩返ししたいので、よろしく。

475 ：１３２人目の素数さん：2005/06/22(水) 21:22:13

>>467 がばれーー！

476 ：１３２人目の素数さん：2005/06/22(水) 22:03:34

Rで基本統計量を出力するプログラムってどう書けばいいのですか？
プログラム例を教えてもらいたのですが・・・。

477 ：１３２人目の素数さん：2005/06/22(水) 22:28:41

summary(matrix(c(1,2,3,4,5,6,7,8),nrow=4,ncol=2))

478 ：473：2005/06/23(木) 15:10:37

>>474
かまかけがあたった(^o^;
RjpWikiの間○先生の書き込みでは出版予定は秋ということでしたが、のびたのね。
どこのどなたか存じ上げませんが、応援しています。

479 ：sage：2005/06/23(木) 21:49:14

おお、○瀬先生関連でしたか。了解です。

まだ延びると決定したわけではないですが、なかなか進まないので、
どうせ遅れるであろうと、すこし遅めに言ってみました。

先生に教えていただくまで、
RjpWikiの存在を知らなかったくらいですから、
(「C言語の構造体」=「R言語のリスト」と言う時点で力量が知れている)
あまり期待できるようなものではありませんが、努力いたします。
それではおやすみなさい。

480 ：１３２人目の素数さん：2005/06/23(木) 22:31:46

特定の数とそれ以外の複数の数から、特定の数のランクだけを取得したい
のですが、どうしたらいいでしょうか？

通常のRank関数だと、配列全てに対して表示されてきますが、特定の配列のみの
順位だけを知りたいのです。

よろしくお願いします

481 ：１３２人目の素数さん：2005/06/23(木) 23:07:25

mat<- matrix(c(1,200,3,400,5,600),nrow=2)
rank(mat[2,])
tapply (mat, c(1,2,1,2,1,2), rank)
rankって線形代数のやつじゃないのか…

482 ：１３２人目の素数さん：2005/06/24(金) 10:51:08

>>480
非常に泥臭い方法だけど、
> (x <- round(runif(5),2))
[1] 0.07 0.02 0.76 0.81 0.33
で、例えば0.81のランクを知りたかったとする。
> y <- cbind(x,rank(x))
> y[x == 0.81,2]
[1] 5

483 ：１３２人目の素数さん：2005/06/24(金) 11:43:06

Rwikiも携帯から見れるように最新バージョンにアップしてほしいな

484 ：484：2005/06/24(金) 20:41:31

√(484) = 22

485 ：１３２人目の素数さん：2005/06/27(月) 16:26:21

ありがとうございます。参考になりました。

486 ：１３２人目の素数さん：2005/06/28(火) 06:31:11

age

487 ：１３２人目の素数さん：2005/06/28(火) 22:25:46

RからC言語で書いたプログラムは呼び出せるみたいだが、
逆にC言語で書いたプログラムからRを呼び出すことはできないの？
MatLabみたいに。

488 ：１３２人目の素数さん：2005/06/29(水) 07:22:26

VBとかなからokでは？

489 ：１３２人目の素数さん：2005/06/29(水) 10:49:44

VC++から呼び出したいんだよね。
誰か方法知らない?

490 ：１３２人目の素数さん：2005/06/29(水) 20:49:09

つ http://www.omegahat.org/

491 ：１３２人目の素数さん：2005/07/03(日) 09:04:06

NN、descision tree ができるのはわかりました。
ところでアソシエーションルールができるパッケージはないのでしょうか？

492 ：１３２人目の素数さん：2005/07/10(日) 13:26:57

時系列分析で、ある過程がAR過程かMA過程のどちらに従うか、という
問題はどのようにRで対処すれば良いのでしょうか？

493 ：１３２人目の素数さん：2005/07/12(火) 19:58:33

行列のベキを計算するのに、以下のような関数を定義したのですが、

power1 <- function(mat, n) {
    ei <- eigen(mat, symmetric=FALSE, EISPACK=TRUE);
    d <- diag(ei$values);
    u <- ei$vectors;
    return (u %*% (d^n) %*% Conj(t(u)));
}

これをテストすると、ぜんぜん違う結果になるんです。

> mat <- matrix(c(1,2,-2,3), 2, 2);
> power1(mat, 3)
                  [,1]   [,2]
[1,] -20+5.152129e-16i -17+0i
[2,]  37+3.209238e-17i -20+0i
> mat %*% mat %*% mat
     [,1] [,2]
[1,]  -19  -18
[2,]   18   -1

何か間違っているでしょうか？

494 ：１３２人目の素数さん：2005/07/12(火) 23:46:16

octave と比べてみれば？
A=[1,-2;2,3];[ev,lbd]= eig(A);ev*(lbd.^3)/ev

495 ：１３２人目の素数さん：2005/07/13(水) 15:14:39

for文中の値がsinkで出力できません．

例えば，

for (n in 1:10){
sink("hoge.txt")
x <- n * 2
x
　sink()}

または，

sink("hoge.txt")
for (n in 1:10){
x <- n * 2
x}
sink()

のどちらでも，出力先のファイルは作成されるものの，
xの値が出力されないっす．
自分としては，結構いろいろ調べたツモリですが，原因不明．
どこがいけないんでしょうか？誰か教えてください．

496 ：31：2005/07/13(水) 16:44:31

>>495
sink("hoge.txt")
for (n in 1:10){
x <- n * 2
print(x)}
sink()

497 ：495：2005/07/13(水) 16:57:14

>31さん
ありがとうございます．
．．．自分のアホさ加減に耳から血が出そうですorz

498 ：１３２人目の素数さん：2005/07/15(金) 00:08:32

いやー、Ｒは便利ですね。
データの扱いは簡単だし、基本的な関数は入ってるし、
わかんなかったらここに聞けば的確な答えが返ってくるし。
おかげで、Ｒばっかり使って、たまにＣとかjava使わなきゃいけない羽目に
なったとき苦労しますw。

499 ：１３２人目の素数さん：2005/07/15(金) 00:10:56

>>492
いろいろやってみて、２乗誤差とかみて決めるんじゃ駄目なの？

500 ：１３２人目の素数さん：2005/07/15(金) 00:13:37

>>491
自分もそう思うんでアゲ

501 ：１３２人目の素数さん：2005/07/15(金) 02:43:25

Ｒを自分のプログラムに組み込んで何かアプリケーション作った人っています？

502 ：１３２人目の素数さん：2005/07/16(土) 22:55:57

なんか作って欲しい関数とかない？

503 ：１３２人目の素数さん：2005/07/16(土) 23:33:52

なんか作って欲しい関数とかない？

504 ：１３２人目の素数さん：2005/07/17(日) 00:54:39

萌えAA散布図を生成する関数。

505 ：sage：2005/07/17(日) 00:59:23

よしキター
入力形式はどうするのがいい？

506 ：１３２人目の素数さん：2005/07/17(日) 01:43:09

とりあえず萌え.jpgのバイナリを渡して忠実にその散布図化をRでしてくれれば一応使いものにはなる。

507 ：１３２人目の素数さん：2005/07/17(日) 14:22:08

試行数が30で、成功確率が0.3の二項分布で、
成功数がx回以下となる確率を求める方法と、
その分布関数を図示する方法を教えてください。
調べても分かりませんでした。お願いします。

508 ：１３２人目の素数さん：2005/07/17(日) 14:41:25

plot(1:30,pbinom(1:30,30,0.3))

509 ：１３２人目の素数さん：2005/07/17(日) 15:42:57

>>508
ありがとうございます。確率はどのようにすれば求められるか教えていただけないでしょうか？

510 ：１３２人目の素数さん：2005/07/17(日) 15:43:59

pbinom(x,30,0.3)

511 ：１３２人目の素数さん：2005/07/17(日) 15:52:25

>>508
ありがとうございます！
何回も悪いんですが…
この二項分布を標準化して正規近似することによって、成功数がx回以下となる確率の
近似値を求め、それを図示する方法も教えていただけませんか(>_<)

512 ：１３２人目の素数さん：2005/07/17(日) 16:13:49

plot(function(x){pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30))},0,30)
par(new=T)
plot(0:30,pbinom(0:30,30,0.3))

正規近似
pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30))

何の宿題？

513 ：１３２人目の素数さん：2005/07/17(日) 16:23:34

>>512
本当にありがとうございました。
友達の大学の宿題です。統計は習った事があるので出来るかと思ったら
全然分からなくて…。お騒がせしました(>_<)

514 ：１３２人目の素数さん：2005/07/17(日) 16:44:27

S-PLUSの「labclust関数」に相当することを、R言語で実現したいのですが、
どうすればいいか、チエを貸していただけませんか？

以下のプログラムは、S-PLUSだと動くのですが、R日本語版だと、
最後の1行で
　> labclust(葉の位置,label=学生)
　Error: couldn't find function "labclust"
となって失敗してしまいます。
どうかよろしくお願いいたします。

-------------------------------------------------------------
学生<-c("芥川","菊池","島崎","太宰","夏目","樋口","森")
人数<-length(学生)
果物<-c("ぶどう","パイナップル","りんご","すいか","オレンジ","もも","バナナ","いちご","さくらんぼ","メロン")
果物数<-length(果物)
好み行列<-matrix(rep(seq(果物数),人数),果物数,人数)
好み行列<-apply(好み行列,2,"sample")
dimnames(好み行列)<-list(果物,学生)
好み行列
距離<-dist(t(好み行列),m="manhattan")
木の情報<-hclust(距離)
葉の位置<-plclust(木の情報,label=FALSE)
labclust(葉の位置,label=学生)
-------------------------------------------------------------

515 ：１３２人目の素数さん：2005/07/17(日) 17:02:54

葉の位置<-plclust(木の情報,label=学生)
じゃだめなの？

516 ：１３２人目の素数さん：2005/07/17(日) 18:17:35

>>515さん

あっさりできてしまいました!!
ありがとうございます!!

517 ：１３２人目の素数さん：2005/07/19(火) 15:50:17

evaluation nested too deeply: infinite recursion / options(expression=)?

というエラーメッセージって入れ子構造が複雑すぎて無限再帰になっているという意味ですか？
要素数3000のデータから一つ選んでexp(x)に突っ込むってだけなのになぁ・・・

518 ：１３２人目の素数さん：2005/07/19(火) 17:44:13

>>517
コードは？

519 ：１３２人目の素数さん：2005/07/23(土) 10:52:13

eval.c に該当コード有り。evalのし過ぎ。

520 ：１３２人目の素数さん：2005/07/23(土) 11:29:07

ﾌｨﾎﾞﾅｯﾁage
mfib <- function(n, x) {
if (n == 0)
x
else
mfib(n-1, matrix(c(1,1,1,0),2,2) %*% x )
}
mfib (4, matrix(c(1,0),2,1))
eigen(matrix(c(1,1,1,0),2,2))

521 ：１３２人目の素数さん：2005/07/26(火) 02:05:01

identifyは、plotで出力するものにしかできないのでしょうか。
pairsで描画した散布図行列に対して、identifyを行いたいのですが。
identifyで不可能でしたら、そういうことが可能なパッケージがあれば教えていただけませんか。
あともしよろしければ、それを見つけたとき、どんな感じで検索かけたか教えていただけますか。
よろしくお願いします。

522 ：１３２人目の素数さん：2005/07/26(火) 22:49:09

無いっぽいです。

523 ：521：2005/07/27(水) 00:10:25

>> 522
ありがとうございます。
こうなったら、どうにかがんばって自作してみます。
（むりっぽいかも）

524 ：１３２人目の素数さん：2005/08/09(火) 13:45:07

Rで４倍精度の計算はどうするのですか？
宜しくご教示お願い致します。

525 ：１３２人目の素数さん：2005/08/14(日) 16:13:51

基本的なデータ操作のところでいまだに躓く.....
どこかにいい資料ないですかね？

DBからとってきたデータが

case_no, item, value

という並びでcase_noとitemがキーになっている2次元データなので、
解析にかけられるよう列方向にitemを並べたデータフレームを作りたい
だけなんですけど。
helpやRjpWikiやR-Tips(書籍)を見てもうまい方法を見つけられません。

526 ：１３２人目の素数さん：2005/08/14(日) 17:28:00

>基本的なデータ操作のところでいまだに躓く.....
どこかにいい資料ないですかね？

これはたしかにそうおもうね
数こなすしかないんだろうけど

で
>DBからとってきたデータが

ってのはマトリクス?リスト?

527 ：１３２人目の素数さん：2005/08/14(日) 17:37:16

>基本的なデータ操作のところでいまだに躓く.....

自分も同じ。
SASが手放せない。

良い資料が欲しいですね。

528 ：525：2005/08/14(日) 22:35:01

同じように思っている方は多いんですね。
こういったところをしっかり書いた入門書が欲しいですね。

>ってのはマトリクス?リスト?

元はDBから抽出したタブ区切りテキストで、read.delim()で読み込んで
データフレームにしています。

元の問題ですが、とりあえず、itemでsplit()したものをcase_noでmerge()すると
いう方法でなんとかいけました。
ただ、いっぺんにはmerge()できないのでfor()を使っていたり、「ホントにこんな
面倒なことをしないとできないの？」という感じです。

529 ：１３２人目の素数さん：2005/08/14(日) 23:28:10

そもそもRってデータマネジメントには向いていないのでは？
AWK、PERLを併用するしかないような気がする。

SQLでデータフレームを操れればまだ何とかなるような気もするが。

530 ：１３２人目の素数さん：2005/08/15(月) 00:21:12

データフレームとして読み込むためにawkで下処理ってのはよくやる
RDBMを操るパッケージはCRANにいろいろあるからそれを使うのも一つの手かもしれない

で元の問題なんだけどどういうデータがどうなって欲しいのか理解できないので
データサンプルとコードを（問題なければ）見せてもらえればアドバイスできるかも

531 ：お盆：2005/08/15(月) 08:45:54

初歩的なことですが，教えてください．
同一の100人を対象に，同じ調査を2回行いました．
途中で，解説を行い，解説前後の比較を行いたいと考えています．つまり，解説の効果の判定です．
一回目の正解は32人，2回目の正解は63人でした．これを統計的に解析する方法を教えてください．
簡単すぎて，手元の本に載っていないのです．

532 ：１３２人目の素数さん：2005/08/15(月) 08:48:21

>>531
mcnemar.test?

533 ：お盆：2005/08/15(月) 08:57:17

132人目の素数さん，レス，ありがとうございます．
統計学の基本知識も乏しいもので，場違いかもしれません．
困っているのは，あまりに簡単すぎて，統計学の本に載っていないことなのです．
というより，そもそも調査自体が単純すぎるのでしょうか?
教えてください．

534 ：532：2005/08/15(月) 10:08:07

>>531
mcnemar testでググってください。
適合度検定を含め、統計の教科書には
スペースの関係もあり、載せられないですね。

χ二乗検定の自由度の計算自体も和書には
なく、Raoを持ち出さないとダメでした。
日本じゃ専門書売れないでしょうね。
Raoの訳書は今でも売っているのかな。

535 ：525：2005/08/15(月) 11:39:08

>>530
このようなデータがあり、case_noとitemに現れる値は不定とします。
case_no,item,value
"CASE1","ITEM1",1
"CASE1","ITEM2"2
"CASE2","ITEM1",4
"CASE2","ITEM3",5
"CASE3","ITEM2",6
"CASE3","ITEM3"7

ここから、下のようなデータフレームを得たいのです。
$case_no,$ITEM1,$ITEM2,$ITEM3
CASE1,1,2,NA
CASE2,4,NA,5
CASE3,NA,6,7

536 ：525：2005/08/15(月) 11:39:59

(続き)
試行錯誤の結果、出来たのはこんな感じです。

# ファイル読み込み
rawdata <- read.delim( ファイル名, header=TRUE )
# itemでデータ分割
items <- split( rawdata, rawdata["item"] )
# 結果のデータフレームを準備
frame <- data.frame( unique( rawdata["lot_id"] ) )
# 各itemをcase_noでマージ
for ( i in names(items) ) {
frame <- merge( frame, items[[i]][ c( "case_no", "value" ) ], by=c("case_no"), all=TRUE )
names( frame )[ length(frame) ] <- i
}

537 ：１３２人目の素数さん：2005/08/15(月) 21:10:01

どっかのに使いやすくて制限がないスプレッドシート式のデータエディタねえかなあ

538 ：お盆：2005/08/17(水) 17:06:12

132人目の素数さん

ありがとうございました．
書き込みできなくて，お礼が遅くなりました．

539 ：１３２人目の素数さん：2005/08/17(水) 18:57:04

R初心者ですみません。
5万ケタ程度の表集計にRを導入したのですが、100桁ごとに平均をだしたいと思って四苦八苦しています。範囲集計、てどうやってやるんですか？

540 ：１３２人目の素数さん：2005/08/17(水) 21:13:41

randuが始めから入ってたので使ってみた。
vec<-randu[,1]; mapply(function(x){y<-x*100;mean(vec[(y+1):(y+100)])}, 0:3)

541 ：１３２人目の素数さん：2005/08/17(水) 23:05:23

HOGE <- function(func, mat, num, n, m) {
m<-m/num -1;
mapply(function(x){vec<-mat[,x];mapply(function(y){y<-y*num;func(vec[(y+1):(y+num)])},0:m)},1:n)
}
HOGE(mean, randu, 100, 3,400)

542 ：１３２人目の素数さん：2005/08/18(木) 17:47:33

>>537
emacsのCSVモード

543 ：１３２人目の素数さん：2005/08/18(木) 17:49:02

なんだか初心者が増えているみたいで。嬉しいな。裾野は広がっているって感じがする。

544 ：１３２人目の素数さん：2005/08/18(木) 17:56:26

>>529
awkもperlも面倒なので、使い捨てシェルスクリプトを書いている。
cut paste cat grep sed tr sort diff head tail ぐらいで十分だ。今のところ。

545 ：１３２人目の素数さん：2005/08/18(木) 21:29:11

>>544
おいおい、それらを駆使するぐらいなら
awk,perlの方がずっと楽だぞ。使えるならな。

546 ：１３２人目の素数さん：2005/08/19(金) 07:31:25

>>543 ちょっとわかったやつが、初心者の質問の
言葉じりとかにからむ傾向が強いのも特徴。これがなければもっと広がるだろうな

547 ：544：2005/08/19(金) 11:19:04

>>545
awkは使えないけど、perlは大分鍛えたつもりだが、やっぱりシェルスクリプトの方が
らく。主観の問題だろうけど、perlだと襟を正してデバックしながらやらなくちゃいけ
ない気がする。それなら、むしろRでgrep sub gsub regexpr substr strsplit pasteを
使ってRのスクリプトに加えちゃう。

548 ：１３２人目の素数さん：2005/08/19(金) 23:04:26

csvライブラリを使ったrubyもおすすめ。
元CSV >> rubyで列単位で抽出・加工 >> Rのread.csv
のような使い方が便利。

549 ：１３２人目の素数さん：2005/08/20(土) 01:07:39

>>547
Rのスクリプトに加えるってどんな感じっすか？

550 ：１３２人目の素数さん：2005/08/20(土) 06:57:28

>>535
このような場合，RDBMSから抽出するときに，クロス集計をおこなってテーブ
ルの形式を変換するのが，常套手段かと。

元もとのテーブルをそのままR読み込み，それからクロス集計させても同じ結
果を得ることでしょうが。。。

551 ：１３２人目の素数さん：2005/08/23(火) 20:14:30

だれかgrassと連携させてる使っている人います？
winでcygwin+grassからだとRを参照するのは無理なんかな～

552 ：１３２人目の素数さん：2005/08/24(水) 00:16:41

The GRASS PackageのGRASS.connect()に
get.cygwinstring()とset.cygwinstring(cygwin)というのがあるが，
詳しくはワカラソ．使った人おる？

553 ：１３２人目の素数さん：2005/09/04(日) 13:41:30

二年。

554 ：１３２人目の素数さん：2005/09/05(月) 18:11:30

age

555 ：１３２人目の素数さん：2005/09/14(水) 18:32:31

R(D)COM使ってるヒトいる?

http://cran.r-project.org/contrib/extra/dcom/RSrv135.html
http://mailman.csd.univie.ac.at/mailman/listinfo/rcom-l

556 ：１３２人目の素数さん：2005/09/15(木) 11:13:11

R-help mailing list に話題が挙がってたね。

557 ：１３２人目の素数さん：2005/09/15(木) 22:00:18

ベルヌイ分布
2項分布
ポアソン分布
正規分布
指数分布
ワイブル分布
の形状を把握、及びそれらの平均と分散を R を使って計算。。。

って出来る方います？

558 ：１３２人目の素数さん：2005/09/15(木) 23:24:17

>>557

簡単だと思うけど...
学校の宿題？

559 ：１３２人目の素数さん：2005/09/15(木) 23:37:55

>>558
はい、宿題です。

560 ：１３２人目の素数さん：2005/09/16(金) 16:29:32

Ｒってmulti-threadな処理ってできますか？

561 ：１３２人目の素数さん：2005/09/19(月) 19:27:16

>>559

それなら、自分で考えなさい。

>>560

R本体にはスレッドコントロールをするAPIはないような感じ。
マルチスレッド版のBLASを使うぐらいか。
R-helpにはRVPMっていう名前がでてきたけど、ぐぐってもひっかからない...

562 ：560：2005/09/20(火) 12:10:34

>>561

レスどうもです。どうしてもマルチスレッドやりたい時は
perlからマルチスレッド立てて、perlからＲを走らせるとか、、
が自分の思いつく方法なのかなぁ・・・ってできるんだろうか。

563 ：１３２人目の素数さん：2005/09/22(木) 09:58:18

つまらん話だが、Rってググるとき困るよな。
もちっと特徴的な名前だったらよかったのに。
みんなどうやってる？
俺は「R 統計」とか。R言語と呼ばれる機会も意外と少ないし。

まあRjpWikiのおかげでググる必要あまりないっつーのもありますが。
感謝です。>>Rjp関係者

564 ：１３２人目の素数さん：2005/09/22(木) 15:26:27

>>563

「R 時系列」とか「R 生存時間」とかより
「Rを　時系列」とか「Rで　生存時間」のほうが
若干良いような気はする。

565 ：１３２人目の素数さん：2005/09/22(木) 22:04:55

R statistics

566 ：１３２人目の素数さん：2005/09/23(金) 13:42:00

>>525
>helpやRjpWikiやR-Tips(書籍)を見てもうまい方法を見つけられません。

ネット版のR-Tipsはどうですか？
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf
93㌻からデータの基本的な扱い方が載っています．けど，あんまり詳しくないかなぁ・・・

567 ：１３２人目の素数さん：2005/09/26(月) 09:42:52

二要因分散分析はできたんだけど、
そのあとのpost hoc testはどうやってやればいいの？

568 ：１３２人目の素数さん：2005/09/26(月) 13:10:06

なかなか面白いページをみつけたよ。英語だけど。
http://www.brandonu.ca/zoology/rutherford/RBookWebSite/RBook_pdf.html

>>567
上記ページの"Multiple Comparisons"が参考になるんじゃない？

569 ：１３２人目の素数さん：2005/09/27(火) 22:06:53 ID:0

例えば下記のデータで
x <- read.csv("test.csv")
for(i in c("A","B")){
　plot(x$i)
}
とするとどうもうまくいかない。
データフレームにしてfor(i in 1:2){x[,i]}
とすればいい話なんだが解決策どなたかご存知？
##テストデータ test.csv
year,A,B
1991,50,100
1992,40,300
1993,30,500

>>525
CRANのサイト内をググってもダメ？
あとはgoogleでfiletype:.R として拡張子指定でググルとかソースしか出てこないけど・・・

570 ：１３２人目の素数さん：2005/09/27(火) 22:30:35 ID:0

>>569

for(i in c("A","B"))のままでも
plot(x$i) を plot(x[,i])にすれば通ると思うけど...
どううまくいかないのかがわからない...

571 ：１３２人目の素数さん：2005/09/28(水) 17:32:03

>>579
あ”、間違えてた。すみません。
こないだは、うまくいかなかったのは
データのA=1991　B=1992　で、
for(i in c("1991","1992")){ ・・・
としたときだった。as.characterとか駆使したんだが・・・

572 ：１３２人目の素数さん：2005/09/28(水) 21:44:23

やりたいことは、データフレームにyearで検索をかけたいということ？
grep()等もありうるけど、これでどうだろう？

cond <- is.na(x$year) # 結果が FALSE FALSE FALSEになれば別の式でもOk
for(i in c("1991","1992"))
cond <- cond | x$year == i
plot(x[cond,c("A","B")]

573 ：１３２人目の素数さん：2005/09/30(金) 20:10:08

sjava わかる人いますか？

574 ：１３２人目の素数さん：2005/10/02(日) 18:21:17

>>572
そんな感じですが、要はAを1991とかBを1992とか数値にした場合にForがまわらないということなのですが・・・

575 ：１３２人目の素数さん：2005/10/04(火) 23:43:32

相関ルールを見つけるパッケージってありますか？

576 ：１３２人目の素数さん：2005/10/05(水) 11:46:29

arules

577 ：１３２人目の素数さん：2005/10/05(水) 11:49:26

http://lmq.esalq.usp.br/CRAN/doc/packages/arules.pdf

578 ：575：2005/10/05(水) 11:54:08

ありがとうございます

579 ：１３２人目の素数さん：2005/10/05(水) 16:24:24

>>577

CRANは国内もあるので...
http://cran.md.tsukuba.ac.jp/doc/packages/arules.pdf

580 ：１３２人目の素数さん：2005/10/08(土) 14:40:01

names と rownames　の違いを教えてください

581 ：１３２人目の素数さん：2005/10/08(土) 15:03:06

>>580
?names
?rownames

582 ：１３２人目の素数さん：2005/10/12(水) 15:01:06

Rで定義されている関数内でどのような計算がされているのかが知りたく，
定義式を見てみたいのですがどうすれば見れるでしょうか？
具体的にはshapiro.testなのですが，
インストールフォルダ\library\stats
を探してみたのですが，説明文らしきものは見つかったのですが関数そのものは
見つかりませんでした

583 ：１３２人目の素数さん：2005/10/12(水) 18:17:36

>>582
R 上で () をつけずに呼び出せばどう？

584 ：１３２人目の素数さん：2005/10/12(水) 22:49:49

locate shapiro
grep shapiro `locate /usr/ |grep \\.R$`
or
grep shapiro `find /usr/ -name \*.R`
windowsならcygwin入れるべし。

585 ：sage：2005/10/21(金) 16:43:48

>>582
583の方法でよいと思われる「shapiro.test」とするだけで・・・

あるリスト「 L 」内の同じ行列数の複数のデータフレーム同士の
平均を求めたいのですが、
mean(L[[1:3]])とはできないようで、いい方法あります？
とりあえず
(L[[1]]+L[[2]]+L[[3]])/3
とやればできるのだが、もっとうまいやり方がありそうですが・・・

586 ：１３２人目の素数さん：2005/10/21(金) 16:44:52

しまった、あげちゃったOTL

587 ：１３２人目の素数さん：2005/10/22(土) 09:56:20

>>585
mean(unlist(L)[1:3])

>もっとうまいやり方がありそうですが・・・
っと言って他人の力を借りるのは、Rくらいの言語を自力で作れるくらいになってからにしましょう。
もっとうまいやり方は Rを使わないという手も含めて無数にありますから。

588 ：１３２人目の素数さん：2005/10/22(土) 11:16:06

改良
list.filter <- function (classListLis, classListFunc) {
classListLis[unlist(lapply(classListLis, classListFunc))]
}

list.asMatrixBy <- function (lis,func) {func(unlist(lapply(lis,func)))}
list.mean<- function (x){list.asMatrixBy(x,mean)}

list.mean(A[1:3])
list.mean(A[c(1,2,3)])
list.mean(list.filter(A, is.numeric))

589 ：１３２人目の素数さん：2005/10/22(土) 16:55:31

先生ありがとうございます。
関数の作り方も含め勉強になります。
これを参考に自分で書いてみます。

590 ：１３２人目の素数さん：2005/10/23(日) 00:28:10

dist関数でマハラノビス距離を求めることはできないのですか？

591 ：１３２人目の素数さん：2005/10/23(日) 09:42:55

help(dist)
help(mahalanobis)

592 ：１３２人目の素数さん：2005/10/23(日) 18:10:25

関数:f(x)を最小にするxを見つけたいんですが、どんな関数を使ったら、
早いでしょうか？　（教えて君ですんません（鬱。）

593 ：592：2005/10/23(日) 18:15:59

optim()とかそんなところでしょうか？

594 ：587：2005/10/23(日) 23:10:35

「もっとうまいやり方」についてとやかく書いたのは、
綺麗で高速なプログラムの書き方を追及するよりも
自分の仕事をしっかりやりなさいって意味であり、
教えて君ですんませんって書けという意味ではありません。

>>592
「全ての集合」とか言うと論理が破綻するので、
x は doubleのvector とか言った方がよい。
optimでは微分系のが速いと思うけど問題によりけり。

595 ：困ってます：2005/10/25(火) 21:55:40

知識が無くて困ってます
18.514.818.416.416.115.415.415.3
8項目の平均が16.287
標準偏差が1.422
です。
ばらつきの大きさがどの程度なのかを知りたいのですがどうすればよいでしょうか。
教えてください

596 ：１３２人目の素数さん：2005/10/25(火) 22:53:50

1.422

597 ：１３２人目の素数さん：2005/10/26(水) 16:40:58

>>595 箱ひげ図

598 ：１３２人目の素数さん：2005/10/27(木) 13:03:55

>>595
ばらつきの大きさがどの程度なのかを知るための数値が標準偏差です。
数値をみて判断するのは、比較対照がない場合は主観です。
私の主観では、標準偏差が0.1程度ならほとんどが16のあたりに固まっている。ばらつきがない。
10ならかなりばらばら、1.422ならそれなりにばらばら。

599 ：１３２人目の素数さん：2005/10/27(木) 14:25:49

hist()の間隔を指定したいのですが、breakes=c(0,1,2,3)とはできますが、
最大最小を気にせずこの間隔だけ（上記の例なら1）
を指定して描くことはできないでしょうか？

600 ：１３２人目の素数さん：2005/10/29(土) 17:59:58

>>595
データが正規分布に従うと仮定してCritical Intervalを計算したよ。
95%で [15.098, 17.477] でした。
この範囲が母平均を含む確率が95%だよ、ということ。
観測平均が16.287だから、まぁそれなりなんじゃないかな、と。

（蛇足：標準偏差のCIは [0.94066, 2.8956] でした。）

601 ：１３２人目の素数さん：2005/10/29(土) 19:58:25

>>600
：観測平均が16.287だから、まぁそれなりなんじゃないかな、と。
ちょっと意味不明。

shapiro.tstすると
Shapiro-Wilk normality test
data: x
W = 0.8322, p-value = 0.06263
ですね。

602 ：１３２人目の素数さん：2005/10/30(日) 02:35:49

ワイブル分布のパラメータ推定で．．非線形回帰か関数の最適化でいけるはずと思って
やってみたが（だから，コードといっても，要は分布関数にfitさせるだけなんだが），
optim()ではどうもうまく推定できなかった。非線形回帰では，初期値をある程度適当に
とれば，それなりにいい結果が得られるようであった。これで十分な精度かどうかは
不明だが，悪くはないと思う。なお，なんらかの確率密度関数に従うと思われるデータxの
近似曲線をプロットするだけなら，plot(density(x))とすればいい．．
ttp://phi.ypu.jp/swtips/Rnewsarchives2.html

603 ：１３２人目の素数さん：2005/10/31(月) 05:24:23

age

604 ：１３２人目の素数さん：2005/11/11(金) 07:23:31

敷居が高いクソ統計ソフト、とか思っていたが、Rコマンダーってのを入れたら、感覚的に使いやすくなった感じがする。
Rユーザーがこれを宣伝しないのは何故?

605 ：１３２人目の素数さん：2005/11/11(金) 09:45:20

>>604
ttp://www.ec.kansai-u.ac.jp/user/arakit/R.html

606 ：１３２人目の素数さん：2005/11/11(金) 23:38:38

ＷＩＮのＪＧＲやたら重かった

607 ：１３２人目の素数さん：2005/11/12(土) 04:50:41

>>605

㌧クス。
ますます敷居が下がりました。

608 ：１３２人目の素数さん：2005/11/12(土) 11:46:18

>>604
> Rユーザーがこれを宣伝しないのは何故
たぶん、慣れた人は使わないからじゃない？私の場合は、emacsからRを操作する方が効率がい
いし、生産性が高いから、emacs+essばかりになっている。Rユーザの多くは、「Rcmdrを使っ
ていない=紹介できない」という状態だと思うよ。

609 ：１３２人目の素数さん：2005/11/12(土) 18:18:01

>>604
試しに計算センターのPCにインストールしたら、
起動するのみメチャ時間がかかり、とても講義に
使えませんでした。

610 ：１３２人目の素数さん：2005/11/13(日) 01:58:23

>>609

確かにローディングはちょっと遅くなったが、こっちのパソコンではそれほど気にならなかった。
エクセルのローディングの方がはるかに時間が掛かる。
どの道、初心者向けとしてはRcmdrは悪くないと思う。
機能的に不満が募っていけば、その内RのCLIやりたくなってくるかも。

もうちょっと色々な機能をRcmdrのプルダウンに実装出来ればもっと良かった。
せめて『Live 2ch』くらいのボタン数とかあればなあ・・・・・・。
そーゆーの作って、エロイ人

611 ：１３２人目の素数さん：2005/11/13(日) 07:01:48

だいたい１００万個データを入れると、逝ってしまうのが多い

612 ：１３２人目の素数さん：2005/11/13(日) 07:02:55

ベクタープロセッサーを搭載した、２００個並列のマシンが必要です

613 ：１３２人目の素数さん：2005/11/13(日) 11:19:04

200個並列って、半端な数だなー。

614 ：１３２人目の素数さん：2005/11/14(月) 16:53:54

Rにはエクセルで言う『Solver』みたいな機能ありますか?

615 ：１３２人目の素数さん：2005/11/23(水) 03:20:36

変数の数がケース数より多いデータはRでは主成分分析できないんですか？
princomp()ではエラーがでてしまいますね。

青木先生が公開されている、pca()、princomp2()もやっぱり同じようなエラーがでてしまいます。

Rwikiのリンクを参考に調べてみたんですが、うまい解決法が見つからなくて…。

prcomp()ではとりあえず分析してくれるのですが、princomp()との違いは何なの？

616 ：１３２人目の素数さん：2005/11/26(土) 07:00:30

age

617 ：１３２人目の素数さん：2005/11/28(月) 01:51:51

元々、変数の数がケース数より多いときって主成分分析できましたっけ？

618 ：617：2005/11/28(月) 02:02:58

あ～そうだ、線形独立なベクトルをケース数より多く作れないから、
変数の数がケース数より多いとだめなんじゃない？

619 ：１３２人目の素数さん：2005/11/28(月) 02:33:31

転置したらどないですか

620 ：１３２人目の素数さん：2005/11/28(月) 12:07:55

>>619
計算はできるだろうけど意味合いが変わらない？

621 ：１３２人目の素数さん：2005/11/30(水) 14:03:01

>>614
optim

622 ：１３２人目の素数さん：2005/11/30(水) 20:07:05

>>621

㌧ｸｽ

623 ：１３２人目の素数さん：2005/12/06(火) 19:08:09

転置無用

624 ：１３２人目の素数さん：2005/12/07(水) 19:10:27

age

625 ：１３２人目の素数さん：2005/12/16(金) 22:52:00

Ｒはお節介で動きが読みにくい関数が多く感じる

626 ：１３２人目の素数さん：2005/12/16(金) 23:29:42

具体的に

627 ：１３２人目の素数さん：2005/12/17(土) 01:39:41

ANOVA、任意の2群に対してt検定をしたいのですが、オブジェクトがないと言われます。
CSVファイルからデータ入力はできました。
どうやら、objectとして認識して欲しい物が
objectとして認識されていない事が問題なのではないか。
というところまではわかりました。

私としては「AO」や「B0r」などがobjectとして認識されると有り難いのです。
その上で「AO」と「B0r」でt検定をしたいのです・・・
手入力も試みましたが、今度は表全体（x）をobjectとして認識させる方法？が分からずに困りました。
>>2のページは見たつもりです。
かなり格闘しましたが、暗雲が立ち込めています・・・
回答もしくはヒントを与えていただけると有り難いです。

628 ：627：2005/12/17(土) 01:40:37

ちなみに
「str(x)」に対しては
`data.frame': 5 obs. of 12 variables:
$ A0 : num 63.6 64 63.9 61.5 63.1
$ A0r: num 53.2 61.7 54.5 53.9 53.8
・・・（中略）
$ B8 : num 85 85.3 87 87 85.7
$ B8r: num 77.1 75.2 76.5 77.8 78.3

「x」に対しては
A0 A0r A4 A4r A8 A8r B0 B0r B4 B4r B8 B8r
1 63.6 53.2 80.8 72.6 84.8 78.1 63.8 57.3 76.9 72.8 85.0 77.1
・・・（中略
5 63.1 53.8 80.8 73.1 86.1 76.9 60.2 55.6 77.1 73.1 85.7 78.3

「objects()」に対しては
[1] "x"

「A0」に対しては
エラー：object "A0" not found

「t.test(A0,B0)」に対しては、当然ですが
以下にエラーt.test(A0, B0) : object "A0" not found
と出力されます。

629 ：１３２人目の素数さん：2005/12/17(土) 19:09:18

age

630 ：627：2005/12/18(日) 01:17:19

>>627
自己レスですが、
A0 <- x$A0
などとする事で解決しました。
正攻法ではない気もしますが、、、

631 ：１３２人目の素数さん：2005/12/18(日) 02:56:32

>>630
正攻法かどうかは知らないが
t.test(A0,B0,data=x)
とか、
attach(x)
t.test(A0,B0)
なんて方法もあるよ

632 ：１３２人目の素数さん：2005/12/18(日) 23:15:24

>>630
ごめん。
t.test(A0,B0,data=x)
はだめだ。
t.test(データ ~ グループ化因子 , data=x)
じゃないと。

633 ：627：2005/12/19(月) 00:49:53

>>632
レスありがとうございます。
データをどう認識してもらうかってのが苦戦してました。
attach()が便利そうですねぇ。一つ賢くなりました。
あと、検定の方はおかげさまでうまくいきました！！
本当にありがとうございました。

634 ：１３２人目の素数さん：2006/01/02(月) 03:33:22

624

635 ：１３２人目の素数さん：2006/01/06(金) 12:35:26

<- の代わりに = を使うと，何か問題が起こったりするんですか？

636 ：１３２人目の素数さん：2006/01/07(土) 11:34:23

>>635
精神衛生上の問題だけじゃないの？
矢印の方が付値のイメージに合ってるかもしれないけど
オレは他の言語で慣れてるし、タイプしやすい「=」のが好き。

あと、「->」と「<-」の使い分け程度の差なんじゃないでしょうか。

637 ：１３２人目の素数さん：2006/01/07(土) 14:52:16

あ、あと等号「==」と付値「=」の混同を防ぐためでもあるのかな。

638 ：635：2006/01/09(月) 23:25:51

問題ないですよね。ありがとうございました

639 ：１３２人目の素数さん：2006/01/10(火) 11:57:13

>>636
精神衛生上というのは同意。代入は <- で関数のオプションは = だとなんだか安心。
<- もESSだとアンダーバー1ストロークで入力できるので、私の場合は変わらない。

640 ：１３２人目の素数さん：2006/01/15(日) 01:14:27

ESS (Emacs Speaks Statistics) なんていうものがあったんですね。
Emacs使いとしては嬉しい限り。早速使ってみます。

641 ：１３２人目の素数さん：2006/01/15(日) 14:49:56

やっぱ無保証のソフトを信じすぎるのもアブナイね。

642 ：１３２人目の素数さん：2006/01/16(月) 00:19:55

>>641

まぁソフトウェアにバグはつきもの。
そして、売り物でも使用許諾契約に「No Warranty」が明記されているものがほとんどだという罠。

SASでもSPSSでもS-PLUSでもRでも, WindowsでもLinuxでも, 信じすぎるのはまずい。

643 ：１３２人目の素数さん：2006/01/16(月) 09:31:55

Rにチャレンジしようと思っているのですが、散布図行列を表示するまでを学べるサイトってないでしょうか？
R2.2にコマンダーを入れています。
Wikiは基本的に知識のある人向けみたいでしたので基本的な操作などのその手前で悩んでる人向けの
サイトが見つかりません。

644 ：１３２人目の素数さん：2006/01/16(月) 09:35:24

質問なのにSAGEてました。ｽﾏｿ

645 ：１３２人目の素数さん：2006/01/16(月) 09:58:32

>>643

初心者向けの説明はある程度系統立てて執筆する必要があるから、メモ感覚で書き込めるWikiにはそぐわないのかもしれない。
Rcmdrの使い方というのはないかもしれないけど、R-Tipsがよいのでは。Commander自体の使い方は見ればわかるから、知りたいのは
おそらくデータフレームとは？みたいな部分だろうし。
最もお手軽にはじめたいなら、最近は入門書もたくさんあるので(Wikiのリンク集参照)読むべし。

646 ：１３２人目の素数さん：2006/01/16(月) 10:44:16

>>643

『工学のためのデータサイエンス入門』のp.8に散布図行列表示の例アリ。
pairsのコマンドを使うみたい。
Rのおまけに付いてるデータで"airquality"ってデータがあるから、それで試して見ればイイと思う。
Rコマンダーでは、まず、

『データ』→『パッケージ内のデータ』→『アタッチされたパッケージからデータセットを読み込む』

でポップアップが出てくるから、そこでパッケージで『datasets』を選択、データセットで『airquality』
を選んでOKボタンをクリックして下さい。(かなり下の方にあります。Rでは大文字と小文字を識別
するので、大文字のA～Zの表記のアトに小文字のa～ｚが来ます。)
そしたらRコマンダー上でデータセットでairqualityが選択されている状態になる筈です。

そこでRコマンダー上のスクリプトウィンドウに次のコードを入力します。
(data(airquality, package="datasets")って表示されてるでしょうが、次の行から入力して構いません。)

pairs(airquality, panel = panel.smooth, main = "airquality data")

そして今書いたコードをマウスで選択して色を反転させて、右クリックボタンで『実行』を選びます。
そうすると散布図行列が表示される筈です。

多分これで上手くいく筈だと思います。

Rcmdrはヘンなバグがあって、R本体では問題なく動くコードがRcmdr上では動作しない場合もあるんで、
あんまり信用しすぎない方がいいでしょう。
Rcmdr上でも散布図行列のプルダウンメニューがありますが、こちらで試したところ、変数選択でのスクロール
ウィンドウが突如正常に動き出さない、と言ったような現象も見られました。

647 ：１３２人目の素数さん：2006/01/16(月) 10:53:43

>>643

ついでに次のPDFがあります。

～Rコマンダーについて～
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf

これを読めば、基本的にRコマンダーの基本的な使い方が分かります。

tck何とか、の知識があれば、Rコマンダー自体カスタマイズできるそうなんですが、
生憎そっちは良く分かりません。
プルダウンメニューなんかもカスタマイズできるみたいなんですがね・・・・・・。

648 ：１３２人目の素数さん：2006/01/16(月) 10:57:31

>>647

＞基本的にRコマンダーの基本的な使い方

すいません。バグりました○|￣|＿

649 ：１３２人目の素数さん：2006/01/16(月) 20:44:19

「基本的に基本的な」っていう日本語は基本的にくどいけど基本的な間違いではないかも。
http://www.google.com/search?q=%E5%9F%BA%E6%9C%AC%E7%9A%84%E3%81%AB%E5%9F%BA%E6%9C%AC%E7%9A%84%E3%81%AA

650 ：１３２人目の素数さん：2006/01/16(月) 20:48:23

>>645
レスありがとうございます。
R-Tipsでテキストデータの読み込みから勉強していきます。

>>646-647
教えてあげた例できちんと表示できました。
Wikiの例を見ると、色分け表示も出来るみたいですしファイルを読み込むことが出来たら色々とチャレンジしてみます。

また壁にぶつかったら皆様よろしくお願いします。明日の夕方までを目標にがんがります。

651 ：１３２人目の素数さん：2006/01/16(月) 21:04:44

>>649

○|￣|＿

>>650

Rcmdrですと、『データ』→『データのインポート』→『テキストファイルから』で大体のデータはインポートできます。
が、これもバグがあって、たまにデータフレームとして認識してもらえなかったり、またインポートされてもアタッチ
できなかったりします。この辺りRってかなり不安定なんですよね。

また参考PDFを紹介しておきます。

～Rにデータを読み込ませる方法～
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-data.pdf

～Rのデータフレームについて～
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-dataframe.pdf

～データハンドリング・データ加工～
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-dataframe2.pdf

652 ：１３２人目の素数さん：2006/01/16(月) 22:52:17

>>651
あっ、四苦八苦してたらレスがｗ

ありがとうございます。読んでチャレンジしてみます。

エクセルのファイルを読み込もうとしたらRODBCを使って色々と書かないといけないみたいなので、
CSVかプレーンテキストに変換しようとしてました。

653 ：１３２人目の素数さん：2006/01/17(火) 00:25:54

>>652

RODBC使用されてるんですか。
RとExcelって相性悪くって一般ユーザーにはキツいですよね(笑)。
元々研究室でシコシコやる為に開発されてるトコがあるみたいなんで、Rは汎用ソフトとしては確かに
キツいニュアンスがありますよね。あんまり親切な設計ではないと僕も思います。

RODBC使わないでも、Excel側で『ファイル』→『名前を付けて保存』を選び、ファイルの種類をエクセル
ファイルではなくって、テキスト(タブ区切り)かCSV(タブ区切り)を選択して保存したあと、Rｃｍｄｒから
『テキストファイルをインポート』するのが一応常套手段だと思います。

他にもRExcel

http://www4.kcn.ne.jp/~felix/Softwares/R/RExcel.html

と言うのがあって、これはExcel上からRを操作できると言う謳い文句・・・・・・の筈なんですが、残念ながら
これもバグが多いようです(涙)。
僕のExcelにも実装しましたが、マトモに動いた例がありません(涙)。

654 ：１３２人目の素数さん：2006/01/17(火) 00:50:08

普通にカンマ区切りファイル経由の受け渡しで困ったことがないので、
なぜここでつまづく人が多いのかわからない...
Excelのデータって一度インポートしたら、あとの加工やグラフ作成は全部Rのほうが
カンタンにできるから, XLSブックを直接読める必要はあんまりないと思うけど。

655 ：１３２人目の素数さん：2006/01/17(火) 01:04:24

>>654

>>651でも書きましたけど、Rでのカンマ区切りファイルでも万全ではないのです。

656 ：１３２人目の素数さん：2006/01/17(火) 01:05:15

↑あ、『カンマ区切りファイルの受け渡しでも』ですね。

657 ：１３２人目の素数さん：2006/01/17(火) 01:44:04

>>655

具体的にどのようなファイルで、
「データフレームとして認識してもらえなかったり、
またインポートされてもアタッチできなかったり」
したことがありますか？まだそういう経験がないので勉強させてください。

また、bug report はされていますか？もしされたならばちょっとみてみたいので
R-develの番号を教えて下さい。
（そのあたりのソースをちょっといじってるもので...)

658 ：１３２人目の素数さん：2006/01/17(火) 02:14:48

>>657

詳しくはRjpwiki

http://www.okada.jp.org/RWiki/index.php?%BD%E9%B5%E9%A3%D1%A1%F5%A3%C1%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6%281%29

の『CSVファイルのインポート』の項目をご覧下さい。
日本語化していないRの時代の話(？多分)なんですが、日本語化された今でもいまだに似たような事が起こります。
と言うより日本語ファイル名によって読めたり読めなかったりするようです。
エクセル等で顧客管理等をしてる場合、ファイル名を一々変更せねばならない手間を考えると不具合と言えると
思いますが・・・・・・。
あとセルに入力された日本語のデータなんかも『構文エラー』として認識されたりします。
いずれにせよ、Rcmdrの話なんで、657氏に有用な話かどうかは知りませんが・・・・・・。

659 ：１３２人目の素数さん：2006/01/17(火) 08:02:37

>>658

やはり日本語の場合でしたか。
カンマ区切りファイルは文字コードの情報を持っていないし、Excelの専売特許と
いうわけでもないので、Windows環境でもShift_JISとUTF-8のテキストが混在するように
なった現在、どちらかなのかを明示的に指定(2.2.0以降だとできると思います)しないと
読めないのもやむを得ないかなと思います。文字コードの自動判定機能を日本語の場合だけ
入れるというのも不適切だし...
ファイル名も同様です。Win98/MeだとShift_JISで、2000/NTはUTF-8ですよね。でも98/Me
がShift_JISなのも日本だけの話だから、本家のコードに組み込むのもよくないし...

Officeのように、いつまでも日本語版、英語版、中国語版、韓国語版、ヨーロッパ版と
分けて使わなければならない状況よりは、多少文字コードの明示的指定の手間は増えるけれども
１つのバイナリですべての言語環境に対応できたほうがよいだろう、ということでこういう形に
なっているのだと思います。本来こういう文字コード変換はOS側でやってくれるべきものだから、
国際化時代以前のOSの限界なのかなぁと思ったり。

次期Officeの標準XMLフォーマットなら内部に文字コード情報を含んでいるから、Rでも
(最初はパッケージが何か必要かもしれませんが)そのまま読める期待は大です。

660 ：１３２人目の素数さん：2006/01/17(火) 13:36:24

>>658
それは、Rの問題と言うより、データファイルの扱いの一般常識に欠けているのが原因だと思うけど。
HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。日本語ファイル名を読めたり読めなかったり違いは、想像するにShift-JISコードを使っ
ていて、文字の1バイト目にバックスラッシュ（円記号）がある場合でしょ。これを知らないとCGIを
書いているときにも文字化けで悩まされる。いわば、日本語文字コードの不具合。
まぁ、現実的な解として、kakasiでファイル名をローマ字に自動変換してからインポートするバッチ
ファイルをかませて、見かけは日本語ファイル名を指定してそのままインポートするようにすればよ
いのでは。もしくは、UTF8をファイル名の文字コードに採用しているWindows2000などに変更するとか。

661 ：１３２人目の素数さん：2006/01/17(火) 14:03:17

>>659

なるほど。どっちかと言うとWindows側の問題なんですね。

>>660

＞HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。

ただし、言っておきますが、全員が全員HPを持ってたりファイルサーバを運営しているわけではないのです。
それを『一般常識』と言っちゃうのはどうかと思います。
逆に言うと、『そのぐらいの知識がなければRは使えない』と言うご意見ならRは単に『一般向けソフトではない』
と言った意味になります。
ファイルの互換性が高い方が『一般向け』ではあるのですから。

662 ：１３２人目の素数さん：2006/01/17(火) 14:45:02

>>661
確かに一般常識というのは言い過ぎたかも知れないけど、一般的な国際的ソフトウェアを
扱う場合には知らないと苦労する知識だと思う。Rは世界の人々を対象とした一般向けで
あり、『日本人向けに特殊化されたソフトウェア』ではないと思う。あなたは、日本語を
使う特殊な人口集団向けのソフトウェアを『一般向けのソフト』とよぶのかい？
Rをあたかも『日本人向けに特殊化されたソフトウェア』として扱おうと無理をするとそれ
なりの知識が必要になる。

663 ：659：2006/01/17(火) 15:42:00

>>662

おっしゃる通り、R好きとしては現在では日本語を扱うときのちょっとした不具合は
ある程度しょうがないものとして受け入れてほしい。
でも、日本人としては日本語のファイル名もコンテンツも全くシームレスにあつかえたほうが
確かに幸せ。
現状、WindowsもMacOS XもShift_JISの亡霊を引きずっているところが多少残っているし、
LinuxはX11をまだ切れないし、
海外ツールの本家バージョンでそのまま日本語がたいがい通る、というところにいきつくには
あと2,3年は必要なのかなぁ。

664 ：１３２人目の素数さん：2006/01/19(木) 19:21:51

Rでの直交表実験の解析について教えてください。

分散分析表はaov(データ　~　.　,　データと計画行列のデータフレーム)で求まることはわかったのですが
１．このときの最適水準を求める方法
２．最適水準での母平均の点推定と区間推定
３．最適水準と他の水準との母平均の差の点推定と区間推定
の方法がわかりません。
これらを計算してくれるパッケージや関数はありますか？

665 ：１３２人目の素数さん：2006/01/24(火) 03:33:40

学校の情報処理論というコンピューター演習の授業の宿題で、以下のキーワードを使って
データ予測のための統計と検定について150字程度で説明しなければならないんですが、
いまいちよくわかりません。よければ誰か教えてください。

キーワード：基本統計量，検定
ポイント：
データを予測するまでの流れ
分析手法としての統計量
検定と予測の関係

666 ：１３２人目の素数さん：2006/01/24(火) 11:32:26

>>665

宿題は自分で考えれ。統計の教科書を見ればすぐわかる。
Webで調べるなら「検定」だけだと少しつらいかな。「統計学的検定」で調べてみ。

667 ：１３２人目の素数さん：2006/01/31(火) 23:45:22

非線形回帰のr^2値やF検定は可能？
もし可能ならその理論的根拠は？
例えば、回帰関数が意味がないとしたときに、ある既知分布に従う検定統計量が見つかる？

668 ：１３２人目の素数さん：2006/02/05(日) 08:36:21

773

669 ：１３２人目の素数さん：2006/02/17(金) 00:47:58

Ｒ入門書デター!!
http://www.amazon.co.jp/exec/obidos/ASIN/4777511847/249-6700559-7365142

670 ：１３２人目の素数さん：2006/02/17(金) 13:28:20

>>669
何を今頃。でも、この本は入門者にお薦め。

671 ：１３２人目の素数さん：2006/02/22(水) 02:21:55

lmとpolyを組み合わせて１つ以上の変数に関する多項式を生成したうえであてはめを行えばよい。。。。。。。。ってどいうこと？
lm　polyってなんね？

672 ：１３２人目の素数さん：2006/02/22(水) 02:36:13

うーん、わからね

673 ：１３２人目の素数さん：2006/02/22(水) 02:49:37

散布図をRcommanderから表示させると、データが１００～１２０の範囲にあるのに、
空白のデータを０と認識してしまいグラフがいびつな形になっていて使い物になりません。

空白のセルを０ではなく、NAとして認識させるにはどうすればいいのでしょうか？

元データはCSVファイルカンマ区切り、データが空白のセルはNAではなく完全に空白です。

データセットを取り込むときに空白に設定しても駄目でした。

674 ：１３２人目の素数さん：2006/02/22(水) 03:19:06

predict.gamって何？
どこしらべてもわからん。

675 ：１３２人目の素数さん：2006/02/22(水) 09:02:43

ガーン，図のなかに日本語使えるの
今日はじめて知りました．すごい，すごすぎる！
もうＳＡＳやめます．ＳＰＳＳも捨てます．
Ｒについていきます．船尾さんの最新の
本読むまで，図に日本語つかえないと思っていた
私はアホですか？

676 ：１３２人目の素数さん：2006/02/22(水) 11:53:53

>>675
いまどき、こんな人がいるんだ。まだまだ啓蒙不足だな。
図に日本語を使えるかどうかでいえば、ずいぶん昔から使えていたよ。
ただ、1文字1文字コード番号を指定するような感じで気軽には使えな
かったし、文字数も限られていた。
それから、PSfragを使えば日本語は全く問題がなかった。

677 ：１３２人目の素数さん：2006/02/22(水) 11:55:05

>>674
RSiteSearch("predict.gam")
は実行してみた？

678 ：673：2006/02/22(水) 19:38:12

相手してください。。。。。orz

679 ：１３２人目の素数さん：2006/02/22(水) 23:54:46

>>673
コンマ区切りならテキストエディタで事前に
NAに変換しておくというのはだめなん？

680 ：１３２人目の素数さん：2006/02/25(土) 23:35:29

>>673
相手しますよぉ～＾＾．
データセットを読み込む際，「欠測の記号」が「NA」になっているのを「」（空白）に
してみては？？
それか↓試してください．（Rcommanderでも，コマンド入力して実行できるはず）
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/40.html

>>674
↓？？
http://cran.md.tsukuba.ac.jp/src/contrib/Descriptions/gam.html

>>676
おっしゃるとおり．でもPDFで出力した場合に日本語が文字化けする問題が
解消されたのは最近なのでは？（正式にはR2.3から？？）
船尾さんの最新のR本に収録されているRなら問題ないみたいです．

681 ：１３２人目の素数さん：2006/02/25(土) 23:37:18

>>673
相手し損ねた・・・．↓の間違い・・・．
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/46.html#03

682 ：１３２人目の素数さん：2006/02/26(日) 06:15:52

教えて下され
確率p＝0.5からなる二項分布で信頼区間を95％としてその範囲が±0.01(pの±１％)となるには、試行回数nは何回必要になるのか、
求める式も知りたいです
関連のサイトをいろいろ見てみたのですが専門用語とか出てきて分かりません
あと確率pと試行nが設定された場合の推定範囲の求め方も知りたいです
お願いします

683 ：１３２人目の素数さん：2006/02/27(月) 00:29:35

Rの2.21にRcommanderを使用しているのですが、散布図行列で左下に散布図、クロス部分にヒストグラム、
右上に相関係数を表示させるにはどのようにすればいいのでしょうか？

http://www.okada.jp.org/RWiki/index.php?cmd=read&page=%A5%B0%A5%E9%A5%D5%A5%A3%A5%C3%A5%AF%A5%B9%BB%B2%B9%CD%BC%C2%CE%E3%BD%B8%A1%A7%BB%B6%C9%DB%BF%DE%B9%D4%CE%F3
のサイトを参考に
pairs3 <- function () {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
png("pairs3.png") # png デバイスを開く
pairs(Dataset, panel=panel.smooth,
cex = 1.5, pch = 24, bg="light blue",
diag.panel=panel.hist, cex.labels = 2, font.labels=2,lower.panel=panel.smooth, upper.panel=panel.cor)
dev.off()
# postscript
}
などとやってみたのですが、駄目でした。
Rcommanderの散布図行列コマンドScatterplotにupper.panel=panel.corを追加したりもしたのですが、同じく駄目でした。

どなたかよろしくお願いします。

684 ：１３２人目の素数さん：2006/02/27(月) 23:31:10

pairs3 <- function (Dataset) {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
panel.cor <- function(x, y, digits=2, prefix="", cex.cor)
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(0, 1, 0, 1)) # ユーザー領域変更
r <- abs(cor(x, y))
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep="")
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex * r+0.5)
}
# png("pairs3.png") # png デバイスを開く
pairs(Dataset, diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor)
}

こんな感じかな。例）pairs3(iris[,1:4])

685 ：１３２人目の素数さん：2006/02/28(火) 16:44:48

>>684様

レスありがとうございます。
きちんと動作しました。

教えて君で申し訳ないのですが、プロット点の色を変える方法と、プロットを丸ではなく、
点にする方法、平滑線ではなく最小二乗線にする方法を教えていただけないでしょうか？

Wikiを参考にしながら、"red"やpch = "."を挿入したりしてみたりしたのですが、うまく動作しなくて。。。

あともう一つなのですが、相関係数を計算するときに１０００近いデータ中に一つでもデータに空白があると
＞cov/cor 関数に欠損した観測値があります。
とエラーになってしまいます。
そのデータを削除すること以外で、このエラーを回避する方法がありましたら教えてください。

686 ：684：2006/02/28(火) 19:56:24

>>685
ウィザードでないので複雑な図形制御は分からないです。
しかし、欠損値の解除は分かります。
>>684で
r <- abs(cor(x, y, "complete.obs"))
とすればOKです。

687 ：684：2006/02/28(火) 20:38:51

図形引数の受け渡しは分かりました。直した関数を載せます。
回帰直線を入れるにはpanel.smoothという関数を別途入れ替える必要がありそうで無理。
----------
pairs3<-function (Dataset, ...) {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
panel.cor <- function(x, y, digits=2, prefix="", cex.cor, ...)
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(0, 1, 0, 1)) # ユーザー領域変更
r <- abs(cor(x, y, "complete.obs"))
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep="")
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex * r+0.5)
}
# png("pairs3.png") # png デバイスを開く
pairs(Dataset, panel=panel.smooth, ...,
diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor)
}
----------
例）pairs3(iris[,1:4], pch=24, bg = c("red", "green3", "blue")[unclass(iris$Species)])

688 ：１３２人目の素数さん：2006/02/28(火) 23:14:36

回帰直線にするには、panel.lsfit (RjpWikiにある関数)をlower.panelに指定すればおkでは？

http://www.okada.jp.org/RWiki/index.php?pairs%CD%D1%20%B2%F3%B5%A2%C4%BE%C0%FE%A4%C4%A4%ADpanel

このpairs3もWikiに転載してほしいな..

689 ：１３２人目の素数さん：2006/03/01(水) 23:42:59

>>686-688
レスありがとうございます。

欠損データがあっても相関値を求めることは>>686の方法で出来ました。
あと、最小二乗法の計算方法も>>688の方法でできました。

でも、色を変えることと、マークを丸から他のものに変えることはできませんでした。
pch="."やpch=3などと変えてみたのですが変わりませんでした。

色々とやっているのですがうまくいきません。
ここのところ聞きまくりなので、今晩四苦八苦してみます。

690 ：684：2006/03/02(木) 07:22:04

>>688 サンクス！
>>687 にこのpanel.lsfitを組み込んでlower.panelをそのpanel.lsfitにすればOKみたいだね。

>>689 自分で考えるのも勉強になっていいと思うよ。

で、一晩経ったので、俺の見つけた答を書いておくと
panel.lsfitで

lines(xx,yy, col="red")
points(x,y, ...)

とすれば、>>687の例にも対応できて直線も赤になる。
また、最後のpairsでpanelの設定は要らないので取ってしまってもちゃんと動くようだ。

691 ：１３２人目の素数さん：2006/03/02(木) 16:00:28

age

692 ：１３２人目の素数さん：2006/03/02(木) 21:38:56

Scilab, Octaveは数式処理はほとんど無理
maximaのほかにRisa-Asirとかあった気が。

693 ：692：2006/03/02(木) 21:42:01

すごい過去にレスしてしまった。
無視して下さい。

694 ：１３２人目の素数さん：2006/03/02(木) 23:49:21

>>690
レスありがとうございます。
そちらの線もそうなのですが、実際の観測値が黒の丸になっているのでそれを変えようと
色々とやっているのですが、色も形も変えられないもので。。。

695 ：１３２人目の素数さん：2006/03/02(木) 23:58:40

皆さんは、日次データの分析ってどうされてますか？
たとえば、金融時系列データだと土日の市場が開いていない期間のデータを
どう扱うかに苦慮しています。
パッケージのtserieを使っても、日次データなのでFrequency=365として
しまうと、土日含みになってしまいます。対応方法ってありますでしょうか？

696 ：684：2006/03/03(金) 23:36:49

>>694
それも>>690で解決してますよ。pointsの ... がみそ。

697 ：１３２人目の素数さん：2006/03/04(土) 18:31:13

Rで入力補完機能って無いのかね。
あると便利なんだけど。

698 ：１３２人目の素数さん：2006/03/05(日) 01:59:53

ちょっとお伺いしたいんですが、ライブラリーのRmpiをインストールしようとすると、
ld; can't locate file for: -lcc_dynamic
と出て失敗してしまうのですが、なにか良い解決策はないでしょうか？
環境は　
MacOSX 10.4.5
CPU:G5
R 2.2.0
です。

699 ：１３２人目の素数さん：2006/03/05(日) 06:05:11

>>698
buildでコケる時はソースを/tmpにでも展開してMakefileいじってまた固めて
R CMD INSTALL 固めたファイル
ってやってる。
当然アップデートの度にやる羽目になるがな。

700 ：１３２人目の素数さん：2006/03/05(日) 17:15:51

>>697
ESSがあるから別にRが内部的に入力補完機能を持つ必要はないんじゃない？

701 ：１３２人目の素数さん：2006/03/05(日) 23:32:16

>>698

Tiger特有の問題のような気がする。
sudo gcc_select 3.3
で直るかも。

>>697

Mac版(GUI)では標準で補完機能付き。WindowsならJGRで。

702 ：１３２人目の素数さん：2006/03/06(月) 00:41:23

>>698
Rmpiって色々と躓く部分が多いから注意が必要

703 ：１３２人目の素数さん：2006/03/06(月) 08:47:47

>>700
Win環境じゃ無理でしょ。
MeadowやらCygwinEmacs等は使いにくいし。

趣味や研究でやっている人以外はWin環境なんだから
そこら辺を考えてもらいたい。

704 ：１３２人目の素数さん：2006/03/06(月) 18:39:20

>>703
> >>700
> Win環境じゃ無理でしょ。
> MeadowやらCygwinEmacs等は使いにくいし。
> 趣味や研究でやっている人以外はWin環境なんだから
> そこら辺を考えてもらいたい。
かんがえたくないんでしょうねぇ、きっと。「Win?へ～んなものつかってんだねぇ～」って感覚なんでしょうねぇ。

705 ：１３２人目の素数さん：2006/03/06(月) 19:33:32

ソースは公開されてるんだから、自分で作れば良いのに。

706 ：１３２人目の素数さん：2006/03/06(月) 20:48:50

>>703

JGR
http://stats.math.uni-augsburg.de/JGR/

いちどつかってみてください。
GUI部分は好みに応じていくつか選択肢があるほうがよいんじゃないかな。

707 ：１３２人目の素数さん：2006/03/07(火) 07:56:23

>>706
Macでは日本語表示が出るようだけどWinでは出ないのですが、
無理ですか？（起動時のエラーを回避するのにも相当時間がかかった。）

708 ：１３２人目の素数さん：2006/03/07(火) 21:24:32

> 趣味や研究でやっている人以外は...
研究または趣味のソフトじゃなかったのか。。。
Windowsユーザとかそんな底辺層にまでRが普及し始めているとは嬉しい限り。
でも、Windowsユーザが入力補完機能なんて言葉を知っているとは思えないんだが。

709 ：697：2006/03/07(火) 21:33:00

微妙に荒れてますなw
結局FreeBSDにWindowsからESS+SSH転送+PC Xサーバ使ってます。

710 ：１３２人目の素数さん：2006/03/07(火) 22:17:11

>>696
レスが遅れてすみません。

きちんと動作しました。ありがとうございました。

711 ：１３２人目の素数さん：2006/03/08(水) 21:53:59

Widowsって2GB以上のメモリは使えないのでRがそのまま落ちるらしいけど、
MacOSXな人はどうですか？

712 ：１３２人目の素数さん：2006/03/09(木) 00:04:23

> Windowsユーザとかそんな底辺層
> Windowsユーザが入力補完機能なんて言葉を知っているとは思えない

こんなこと思ってる、しかも２チョンに書き込んじゃうバカがいるんだね
自我が肥大してるな

713 ：１３２人目の素数さん：2006/03/09(木) 21:32:12

言葉で表現されることと自我が肥大することとは別だ

714 ：１３２人目の素数さん：2006/03/10(金) 00:54:31

Rのクライアント領域より大き目のグラフを作成する方法って無いでしょうか？
いつもは800*600のノートマシンで作業しているのですけど、これだとグラフが
小さすぎます。
できたら1000*1000程度の大きさのグラフを作成したいので。

715 ：１３２人目の素数さん：2006/03/10(金) 04:12:55

>>714
png()とか使ってファイルに書き出す

716 ：１３２人目の素数さん：2006/03/10(金) 08:44:44

>>715
ありがとうございました。

717 ：１３２人目の素数さん：2006/03/10(金) 13:16:46

グラフの質問が連続してて申し訳ないけど、グラフにタイトルを入れるのはどうすればいいのでしょうか？
複数のグラフを表示するコマンドにTITLEの文を挿入したら最初のグラフのタイトルになっちゃいます。

718 ：１３２人目の素数さん：2006/03/11(土) 03:11:59

>>717
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/55.html

719 ：１３２人目の素数さん：2006/03/14(火) 01:07:23

すいません教えてください。
( y2 <- backsolve(r, x, transpose = TRUE))
transpose = TRUEとはどういう意味なのでしょうか？

720 ：719：2006/03/14(火) 01:12:39

>>719
解決しました。

721 ：１３２人目の素数さん：2006/03/18(土) 18:47:00

＞７１３
はぁ？言葉で表現されること？
お前がそう世界を認識して書き込んでんだろ

バカなら黙ってれば？

722 ：１３２人目の素数さん：2006/03/18(土) 22:22:30

ゆとり教育

723 ：竹内まりや：2006/03/20(月) 08:12:00

ケンかはやめて♪
わたしのためーに♪
争わないーで♪

724 ：１３２人目の素数さん：2006/03/21(火) 21:31:07

これでグラフ作るときは
エクセルとどちらが速いか、後々効率いいか、他人に任せれるか
と数分悩むことにしている。

725 ：１３２人目の素数さん：2006/03/26(日) 14:56:34

726 ：age：2006/03/27(月) 01:27:20

age

727 ：１３２人目の素数さん：2006/03/28(火) 08:46:52

>>723
その歌ってすごい自意識過剰だよな。
けんかしている男二人って、
「その女が欲しい」んじゃなくて、
「この男に負けたくない」というだけだもんな。
映画タイタニックに出てきたローズの婚約者と同じ。

728 ：竹内まりや：2006/03/28(火) 23:48:22

ケンかはやめて♪
わたしのためーに♪
争わないーで♪

729 ：729：2006/03/29(水) 20:19:56

√(729) = 27

730 ：age：2006/03/30(木) 00:32:48

age

731 ：１３２人目の素数さん：2006/03/30(木) 02:50:18

sage

732 ：１３２人目の素数さん：2006/03/30(木) 10:53:57

以前にこちらで教えていただいた配列行列を使っているのですが、
パラメーターを増やすと警告が出てしまいます。

pairs3(Dataset[,5:15], pch=24, col="blue",bg=c("red")[unclass(Dataset$Species)])
としていて[,5:13]だと問題ないのですが、5:15にすると、

警告：min の引数がに有限な値がありません：Inf を返します
警告：max の引数に有限な値がありません：-Inf を返します
以下にエラーplot.window(xlim, ylim, log, asp, ...) :
有限な 'xlim' の値が必要です

となってしまいます。

念のために空白のデータをすべて削除したり系列の名前を変更したりしたのですが駄目でした。
そもそもminやmaxと言う項目は追加していません。
新しく追加したのは、V Ave,V m_mと言う二つの項目でminやmaxは使っていないのですが・・・

これはどのようにすれば回避できるのでしょうか？
どなたか回避方法が分かりましたら教えてください。

733 ：１３２人目の素数さん：2006/03/30(木) 10:54:29

配列行列じゃなくて散布図行列でした。失礼。

734 ：１３２人目の素数さん：2006/03/30(木) 21:54:13

ごめんなさい。ゼロがオーになってました。

735 ：age：2006/04/14(金) 00:30:32

あげ

736 ：１３２人目の素数さん：2006/04/15(土) 20:24:38

うんこヌッシーだｗ

737 ：１３２人目の素数さん：2006/04/24(月) 21:27:10

ユニックスでバッチでＲが動くことは知ってるんですが
ウインドーズでもバッチで動くんでしょうか

738 ：１３２人目の素数さん：2006/04/24(月) 21:31:22

動くはず。
Excelと連携させるソフトがあってそれが確かRをバッチで
呼び出して処理したたと思う。

739 ：竹内均：2006/04/24(月) 23:41:40

ケンかはやめて♪
わたしのためーに♪
争わないーで♪

740 ：１３２人目の素数さん：2006/04/25(火) 00:37:10

このスレであるなら「竹内啓」の方がよく似合う。

741 ：１３２人目の素数さん：2006/04/25(火) 01:19:37

酷

742 ：１３２人目の素数さん：2006/04/25(火) 14:49:34

0.5-0.4-0.1でExcel同様、
変な値出るんですけど既出ですか？

743 ：age：2006/04/26(水) 01:06:13

既出みたいなもんです.気になるならば以下のようにしてください．

> round(0.5-0.4-0.1)
[1] 0

744 ：１３２人目の素数さん：2006/04/26(水) 04:23:44

> .3-.2-.1
[1] -2.775558e-17

なるほど。

745 ：１３２人目の素数さん：2006/04/26(水) 06:06:25

>>744
それに2.775558e-17を足すと…

746 ：737：2006/04/26(水) 06:37:10

>738
>動くはず。

書籍やどっかのＨＰでやり方を紹介してませんでしょうか
けっこうねちっこく探したのですがウインドウズでの
バッチの方法は見つかりませんでした．

747 ：738：2006/04/27(木) 01:54:03

とりあえずなんらかのコマンドを順番に打ったファイルを
Rのbinフォルダに準備して（その名前をたとえばcommand.txtとする）
そこで次のようなコマンドを実行すると

R --no-save < command.txt

計算してくれるよ。余分な出力がつくから出力されたものを
何かに使うのならさらに処理がいるけど。

748 ：738：2006/04/27(木) 09:29:18

>>747のつづき。
こんなとこ発見した。
http://www1.accsnet.ne.jp/~gen/R/batch.html

749 ：742：2006/04/27(木) 18:38:24

>>743
やっぱそうですか。どうもです。

750 ：１３２人目の素数さん：2006/04/28(金) 06:55:58

>747,748
ありがとうございました．心から感謝いたします．

751 ：１３２人目の素数さん：2006/04/29(土) 10:28:59

もしかして一時期（１，２年前）と比べて人気が無くなってますか？
仕事で忙しくて情報にキャッチアップしていくのも辛くなってきた････

752 ：１３２人目の素数さん：2006/04/29(土) 11:43:49

>>751
新しい書籍も出て世間的には人気は上向きと言えるのでは
ないでしょうか。
環境が整ってきたことで逆にこのスレの進み具合が遅くなったと
思っています。

753 ：１３２人目の素数さん：2006/05/03(水) 09:08:31

Ｒ････

データが大きくなると使い物にならないのですが、
メモリを２Ｇぐらい積めば快適に使えるのでしょうか？

積めば積むほど大規模データを扱えると思って間違いないですか？

754 ：１３２人目の素数さん：2006/05/03(水) 10:15:56

洗面器を使うかバケツを使うかってことだろう。

755 ：１３２人目の素数さん：2006/05/03(水) 11:51:48

SAS欲しいなぁ

756 ：１３２人目の素数さん：2006/05/03(水) 14:39:04

>753必要ないオブジェクトを解放すれば
結構使えますよ．１００かける数万件は扱えてます．

>755ＳＡＳのデータステップなんて
大域変数ばっかで，まともな仕事できないよ
なんてったってＳＡＳは構造化言語じゃないから
ＩＭＬ使うと倍も金取るし

757 ：１３２人目の素数さん：2006/05/03(水) 15:28:06

>>756
仕事でＲを使っているのですか？

>１００かける数万件は扱えてます

私の業務ではまだまだ足りないので
将来的に数百万件×１００ぐらいは使えるようになって欲しいです。

あと、業務では大域変数ばっかりだろうとＳＡＳは使い易いです。
代わりになる言語や環境があるなら紹介して欲しいです。

758 ：１３２人目の素数さん：2006/05/03(水) 17:41:05

>>756, 757

Rはデータマイニング用アプリではなく統計解析プラットホームなので、
デフォルト状態では大規模データは苦手です。まぁパッケージをいろいろ駆使すれば
数百万件というものできないことはないのでしょうが...

SASはプログラミング言語ではなくて、定型業務向け簡易言語なので
プログラムが美しくないのは（歴史が古いこともあって）やむをえないでしょう。
最近はどちらかというとマイニング向けにしているようだし。

定型業務で超大規模データのマイニングをやるならSAS, 研究開発系業務で
インタラクティブにさまざまな解析を進めていくならばRというように住み分けが
できるのではないでしょうか。

759 ：１３２人目の素数さん：2006/05/03(水) 19:13:14

Rで扱えるまでデータを小さくするのが大変なんですよね。
その目的でSASを使うのも馬鹿げているし...
Access、Perl、Awk
どれもいまいち...

760 ：１３２人目の素数さん：2006/05/03(水) 19:50:28

MUSASHIとかどうなんでしょうか？

761 ：１３２人目の素数さん：2006/05/03(水) 20:18:20

MUSASHIですか。
食わず嫌いかもしれませんがデータマイニングという、
大規模データハンドリングを前提としている世界に
XMLという冗長なデータフォーマットを持ってきている時点で二の足を踏んでしまいます。

失礼かもしれませんがいつ開発が止まるかもわかりませんし....
Wekaなんかでも開発がとまっているのではないでしょうか？

762 ：１３２人目の素数さん：2006/05/03(水) 21:37:12

学校や会社にず～っと在籍して，ず～っとSASが使えるなら良いのですが，
その環境から放り出されたら，せっかく蓄えた知識が水泡と化しますからね．．．

あと，いつ開発が止まるかわからないソフトを使うのも良いのですが，
開発が止まっちゃったら，せっかく蓄えた知識が水泡と化しますからね．．．

後者はRも孕んでいる危険ですが，「多くの人が使っている」ので
他のソフトよりは危険率が小さいのではないでしょうか？？

「フリー」であるのと「多くの人が使っている」というのがRの強みですよね．

763 ：１３２人目の素数さん：2006/05/03(水) 21:50:24

Ｒの欠点はデータハンドリング、中でも大規模データの取り扱いが苦手な事だけだと思います。

764 ：１３２人目の素数さん：2006/05/03(水) 22:27:44

>>762
学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。
あと、ユーザー数については、R は SAS はおろか、S-Plus の足下にも及ばないはず。

>>763
有償サポートがないので、業務用途に使いにくい（研究用途なら問題ないけど）。

765 ：１３２人目の素数さん：2006/05/03(水) 22:34:19

>>764
s-plusは数百万×100変数ぐらいのデータを扱えるのですか？

766 ：Ｒ好きです：2006/05/03(水) 22:41:17

>有償サポートがないので、業務用途に使いにくい

サポートしてくれるのは現バージョンと
1つ前のバージョンくらいだよ．
長年書き溜めたプログラムがバージョンアップして
動かなくなっても「サポート対象外」といわれる．
有償ソフトは下らないバージョンアップで
食いつないで，しかも上位コンパチとは限らないから
始末が悪い．

767 ：１３２人目の素数さん：2006/05/03(水) 22:41:25

>>764

世界中のCRANから配布されているRのユーザー数をどのように把握したのかに
興味があるので、情報ソースを示してもらえませんか？

768 ：Ｒ好きです：2006/05/03(水) 22:44:18

＞Ｒの欠点はデータハンドリング、

オイラはＳＡＳもＲも使うけど，Ｒのほうがハンドリング
ときだと思うぞ！百万件といったって
目的に応じて加工するのが主な仕事場わけで
グレップ使えるＲのほうが協力じゃん

769 ：Ｒ好きです：2006/05/03(水) 22:45:44

すみません．お酒飲んでるんで
タイプにミスが目立ちます

770 ：Ｒ好きです：2006/05/03(水) 22:49:33

＞学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。

っていうか大学でＳＡＳならって，就職したらＳＡＳがない
という場合が困るんですよ．特に小さい組織だと
ＳＡＳのアコギな値上げに付いていけない
その点Ｒ習っとけば，どこにいっても使い続けられる
ってことだと思います

771 ：Ｒ好きです：2006/05/03(水) 22:54:49

＞開発が止まっちゃったら，せっかく蓄えた知識が水泡と化しますからね．．．

これ意味分かりません．私が20年以上前に書いたＴＥＸやＳ
のプログラムは今でも動きます．
クヌースは，これ以上ＴＥＸをいじらないといっている
Ｒもコアの部分は開発を止めてもいいと思う
ＴＥＸが相であるように，あとは世界中のボラティアの
パッケージにまかせればいい
上位互換でないコア部分のバージンアップは，もう
やめたほうがいいと思います．

772 ：１３２人目の素数さん：2006/05/03(水) 23:03:42

RがSASよりデータハンドリングに優れているって事はありえませんから。

773 ：１３２人目の素数さん：2006/05/03(水) 23:04:12

>>766
だから、常に最新版にアップデートし続けないといけない。最高（最悪？）のビジネスモデルかも。

>>767
まじめに調べるとすると、「試しにインストールしてみた」だけの人をカウントするかどうかが問題。
職業プログラマーの数だと圧倒的な差があると思う。
SASプログラマーの求人はあっても、Rプログラマーの求人は聞いたことないし。
大体、研究者が研究目的に「自分で」コーディングしちゃうから、Rプログラマーって独立した職業にならないんだろうけど。
あと、ユーザーコミュニティーの活動の活発さ（ヘビーユーザーの数）。
http://www.sas.com/offices/asiapacific/japan/news/press/200602/24.html

774 ：１３２人目の素数さん：2006/05/03(水) 23:11:58

ッつーか誰かSASのクローン作らないかな(笑)?
SのクローンやSPSSのクローンとかあるんだから、SASのクローンあっても良さそうだけど。
ASAとか名前付けちゃって(笑)。

775 ：Ｒ好きです：2006/05/03(水) 23:13:35

＞RがSASよりデータハンドリングに優れているって事はありえませんから。

何故？
１．マイニングのハンドリングならグレップやサブのほうが軽くて有利
２．構造化言語で，バグが入りにくい
　　（ＳＡＳなんて変数管理が難しくて，大規模で継続的な仕事に
　　　向かない）
ちなみに私はＳＡＳ歴25年です（長ければいいてもんじゃあないですが）

776 ：１３２人目の素数さん：2006/05/03(水) 23:14:21

Ｒは好きなのですが、実務でＲが活かせる分野ってありますか？
アンケート分析ぐらいなら活かす事が出来ると思うのですがＳＰＳＳの方が楽ですよね。

777 ：１３２人目の素数さん：2006/05/03(水) 23:18:29

>>770
SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。
あってもかなり研究指向が強く、採用が博士号もってること前提、とかになってそう。
あと、R は割と簡単に習得できる（C とか勉強したことあれば、楽勝）けど、
SAS は癖が強いので、研修うけないと習得が面倒です。大学で習えるのはラッキーかと。

778 ：Ｒ好きです：2006/05/03(水) 23:27:24

＞SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。

えっＳＡＳの非情な，非常識な値上げ攻勢知らないんですか？
ＨＰに定価を乗せずに，ワンtoワンマーケと称して
とんでもない値段（値上げ，それも毎年）吹っかけます
ＳＰＳＳ見たいにＨＰに定価が乗っていれば
ボラレル心配ないけど，ＳＡＳは値上げについていけなくて
振り落とされる組織・大学多いんですよ
大学教育ではやめてるところ多いですよ

779 ：１３２人目の素数さん：2006/05/03(水) 23:29:23

>>775
あなたは多分SASもRも素人だ。
特に実務経験がなさそう。

780 ：１３２人目の素数さん：2006/05/03(水) 23:31:52

>ッつーか誰かSASのクローン作らないかな(笑)?

どこかがSASのクローンを作ってSASに訴えられなかったっけ？
ソースをそのまま利用したからだったかな？

781 ：１３２人目の素数さん：2006/05/03(水) 23:36:36

>> 776

アンケート分析ぐらいならSPSSを使わなくてもExcelと、VBAの統計パッケージで十分な
ような気が...
研究が本職の人ならRを活かせると思いますが、データ処理が本職の人は、統計計算機能はあまり
なくて良いからクロス集計や条件抽出がとにかく高速な、しっかりしたRDBを基礎においた
システム（統計解析パッケージ、とは呼ばれていないかもしれないけど）を使ったほうがいい
のではないでしょうか。Cacheとかの強力DBがバックエンドにあるとよさげですね...

研究が本職の人は、いろんなモデルをデータと格闘しながら使っていかなければならないので、
インタラクティブな使い方に強いRは向いてると思います。

782 ：１３２人目の素数さん：2006/05/03(水) 23:38:08

実務じゃないのね･･･

783 ：Ｒ好きです：2006/05/03(水) 23:38:13

＞Ｒは好きなのですが、実務でＲが活かせる分野ってありますか？

活かせない分野ってあるんでしょうか？
構造化言語だから，使っているうちに
関数がたまって，ぐんぐん
どんな分野でも使いやすくなりますよ

＞アンケート分析ぐらいなら活かす事が出来ると思うのですがＳＰＳＳの方が楽ですよね。

マウスでクリックというのは，小規模な（卒論）とかには
いいのですが，実務で条件を少しずつ変えて
何百枚も図を出したりするにはＧＵＩのＳＰＳＳは
だめっすよ．ＣＵＩのＲのほうが，本格的で大量の
出力にはむいてますよ．

784 ：１３２人目の素数さん：2006/05/03(水) 23:39:16

SPSSもマクロがあるでしょ

785 ：１３２人目の素数さん：2006/05/03(水) 23:39:48

製薬業界だと、オラクルクリニカルやリントライアルとSASを組み合わせて使ってますよ。

786 ：１３２人目の素数さん：2006/05/03(水) 23:41:18

>> 777

...今風の職業プログラマ(VMSとかは知らない世代です)をしたことがある経験から
言うと、SASの文法は癖なんていうレベルではありません...もはやあれはプログラミング
言語とは呼べないと思います。昔はあれが普通だったのかもしれませんが.....

他に応用できない技術であるという点で、SASが出資している大学でないならば、
あれを「プログラミング」と称して教えるのだけは避けてもらいたい気持ちです。

787 ：Ｒ好きです：2006/05/03(水) 23:43:29

完全に酔いが回ったので寝ます
2chには基本的に来ないのですが
今日は楽しかったです
おやすみなさい

788 ：１３２人目の素数さん：2006/05/03(水) 23:44:09

おやすみなさい

789 ：１３２人目の素数さん：2006/05/03(水) 23:46:08

確かにＲの言語仕様は最高ですよね。

790 ：１３２人目の素数さん：2006/05/03(水) 23:54:24

なんかスレのびてますが...

「統計」っていう日本語の意味が広がりすぎてるから議論になっちゃうのかなぁ、
と思いました。
単純集計とクロス表の解析がメインのマイニング的データ処理分野と、
少数例に対して数理モデルをつくっていく解析分野を、
どっちも「統計解析ソフト」でやろうとするからいけないような。

ちょっと不思議なのは製薬業界かな。
SASってWebとか見るとマイニング系アプリのように売ってるのに、
製薬業界ではそのデータ解析機能を頼りにして採用している？？
業界の伝統、でしょうか...

791 ：１３２人目の素数さん：2006/05/03(水) 23:56:42

>>783
実務、ですよ。（探索的な）研究なら R でいいですが、データ解析の実務。
金融業界、製薬業界、マーケティング会社等々、SAS や SPSS が業界標準になってるので、
R で解析した結果（あるいは書いたプログラム）を顧客（社内顧客含む）が受け取ってくれるか
どうかがまず問題になります。一人で業務を完結できるわけではないからね。

>>786
私もあれを「プログラミング言語」とは呼びたくないです。
コーディングがあれほど楽しくないものもないでしょう。

792 ：１３２人目の素数さん：2006/05/03(水) 23:57:02

>>780

へえ、面白い。
ベル研生まれのSのクローンが訴えられなくって
大学生まれのSASのクローンが訴えられるのか。

しかし、西洋の大学は偉いなあ。商用ソフトにせよクローンにせよ
きちんと一般に技術的な貢献してるからなあ。
それに比べ日本の大学は・・・・・・

793 ：１３２人目の素数さん：2006/05/04(木) 00:18:46

実務だと解析の前段階が大きな作業ウェイトを占める。
そのフェーズはSASなしでは考えられない。
S-plusやspssを導入している企業でもその為だけにSASを導入しているところが多い。
研究室の中のように綺麗で解析に都合の良いデータばかりを扱うわけにもいかないので････

あとSASがデータマイニングを前面に押し出しているのは本当に最近の事だよ。
ルーツは言うまでも無く「統計」。

794 ：１３２人目の素数さん：2006/05/04(木) 02:30:17

> 研究室の中のように綺麗で解析に都合の良いデータばかりを扱う

795 ：１３２人目の素数さん：2006/05/04(木) 04:06:07

>>792
SとRの関係はUNIXとLinuxの関係と同じ（ソースは別物だけど互換性がある）じゃないの?

796 ：１３２人目の素数さん：2006/05/04(木) 06:05:18

>>792
学校でRを勉強して企業に入ったら関数に保証のあるSを導入して欲しいってのが
Sのスタンスらしいよ。本にインタビューが載ってた。

797 ：１３２人目の素数さん：2006/05/04(木) 07:00:48

>>794
よくわかる

798 ：１３２人目の素数さん：2006/05/04(木) 07:56:24

>関数に保証のある

でも「補償」はしないから意味なしでしょう
如何なる損害も補償しないと宣言しています
１つ１つの関数の結果の正しさを「保証」しているというなら
基本部分の信頼性はＲもＳも同じレベルでしょう
バグを報告しても直ぐに直してくれるわけではないから
正確には結果の正しさも「保証」しているわけではないです
「保証」って何？と思います

799 ：１３２人目の素数さん：2006/05/04(木) 08:04:16

S-PLUS 7 Working with Big Data

というのがありますね。
これを使うと行数に制限がないそうです。
Ｒも見習って欲しいものです。

自費で買うならS-PLUSかな。

800 ：１３２人目の素数さん：2006/05/04(木) 08:21:39

ところで、S-PLUSの導入費用は？

801 ：１３２人目の素数さん：2006/05/04(木) 09:50:58

>>798
仕事で使うにあたっては責任をなすりつける先があるのは重要だと思うが

802 ：798：2006/05/04(木) 11:22:41

＞801
やってごらんなさい．責任なんて絶対取りませんから
保証の有無の差なんてゼロです

803 ：１３２人目の素数さん：2006/05/04(木) 11:38:36

この過疎スレに必死な奴がいる件について

804 ：１３２人目の素数さん：2006/05/04(木) 11:49:29

Ｒの話題は何でも楽しいからいいよ。

>保証の有無の差なんてゼロです

確かにこれが現実だし。

805 ：１３２人目の素数さん：2006/05/04(木) 12:14:17

うちの会社だとお偉方に導入を進言する時にフリーなのは受け入れられにくい

806 ：１３２人目の素数さん：2006/05/04(木) 12:52:54

フリーなら勝手にいれてしまへ

フリーなら申請すればすぐに通るでしょ。

807 ：１３２人目の素数さん：2006/05/04(木) 13:25:13

ちょっと問題だと思うのは。

SもRも動作保障しない意味では同じ

これはなるほど、と思う。

でもRマンセーがエクセル叩くの意味が分からないんだよね。

エクセルも計算ミス一杯あって困る、ってのは分かるんだけど、

統計解析専門ソフトが動作保障しないと言う話と大同小異と言えば言えなくもない。

808 ：１３２人目の素数さん：2006/05/04(木) 13:26:53

>>796

はじめてのS-PLUS/R言語プログラミング

S/R関係でもっともわかりやすい入門書

809 ：１３２人目の素数さん：2006/05/04(木) 15:27:32

>>808

データ解析環境「R」

R関係でもっともわかりやすい入門書

810 ：１３２人目の素数さん：2006/05/04(木) 18:32:57

>>802
ちょっと勘違いをしてるのでは...
解析結果がおかしくてユーザーに損害が出ても保証しない、というのはもちろん R でも S-Plus でも同じ。
ただ、「メーカーも認めてる不具合なら仕方がない」となるか、「フリーウェアなんか使うからだ！」
になるかの違いは（担当部署にとって）極めて大きい。

>>806
それ、インストールの許可が出ただけ。「導入した」ことにはならない。
私物として持ち込んだ電卓と同じ扱いで、（業務手順書には現れない）検算ぐらいにしか使えない。

811 ：万年ボケ：2006/05/04(木) 18:37:27

おはつです。

研究職でないのに、Rを使いたいなんて思うのは、クラージー？？
高いソフトが買えないって言うのが本音、、、。

現場が忙しくて、なかなかスキルがあがらんのです、、、。

Rの入り口付近で、うろちょろしてます。

リタイヤしてからも、それまで覚えたRの知識が使えるチーズを探すのも、面白そうだけど、、、。
数年ぶりに自分の時間が持ててる万年ボケです。

812 ：１３２人目の素数さん：2006/05/04(木) 18:58:48

いえす、ゆーあーくらーじー！！
ばっとあいあむくらーじーとぅ。

813 ：万年ボケ：2006/05/04(木) 19:42:43

おー、さんきゅー　べーりーまっち！

くらじー　いず　くれいじー　で、くれいじー　いず　とっぷりーだー　おぶ　じゃぽーね？？！

仕事柄、自分とこのエビデンスを解析しなきゃねーってなこともあるわけですよ。
品質工学的な手法もあるわけで、金をかけずに、安上がりに出来る方法はないか、貧乏人は探すわけですよ。

814 ：１３２人目の素数さん：2006/05/04(木) 20:29:59

>>800

30万円くらい。

815 ：１３２人目の素数さん：2006/05/04(木) 20:32:36

アメリカ製のソフトがこっちの販売会社で責任取れないのもしょーがない、ってばしょーがないよね。
多分中身いじる事出来ないでしょ?
日本人の為の日本人による日本製の統計ソフトが無い、ってのがどっちかと言えば問題がある気がする。
日本の統計学者って何やってんだろね?

816 ：１３２人目の素数さん：2006/05/04(木) 21:30:02

810は非本質的な論拠がまかり通るアホな職場にいますな
スキルアップして転職しんしゃい

817 ：１３２人目の素数さん：2006/05/04(木) 21:35:20

複数のソフトで計算して中を取ればいい

818 ：１３２人目の素数さん：2006/05/04(木) 21:42:32

>>816
日本はそのアホな職場だらけな罠

819 ：１３２人目の素数さん：2006/05/04(木) 21:43:46

>>816
例えばどこ？
一流どころのメーカーは全部「非本質的な論拠がまかり通るアホな職場」になると思うけど？
中小企業だと逆に「いいかげん」な仕事をしてても許される、ということはありそうだけど。

820 ：１３２人目の素数さん：2006/05/04(木) 22:44:53

＞一流どころのメーカーは全。。。

んなこたーない
あんたのスキルと比較して１流っていうこったろ

821 ：１３２人目の素数さん：2006/05/04(木) 22:48:01

>>820
どこでもいいから例証してみて。
トヨタ、武田薬品、プルデンシャル（メーカーじゃないけど）、・・・

822 ：１３２人目の素数さん：2006/05/04(木) 22:54:52

RよりOctaveの方が楽だけど
Octaveには「最小二乗法」のパッケージすら入って無い（forgeにはそれらしいのが入ってる…）
まあ単回帰ぐらい自分で書くし、重回帰だってOctaveなら10行ぐらいで書けるのだが
一般人が統計解析に使うのはどうだろうと思ってしまう

823 ：１３２人目の素数さん：2006/05/04(木) 23:14:14

S-PLUSのENTERPRISE版が欲しくなった。

824 ：１３２人目の素数さん：2006/05/05(金) 00:42:03

Octaveのpolyfitとかglsは最小自乗だよ。
ただ、octaveとかは数値計算ツールであって
統計用じゃないんでおすすめ出来ない。

欠損値とかうまくあつかえないはず。

825 ：１３２人目の素数さん：2006/05/05(金) 01:00:39

OctaveってMATLABのクローンだっけ?
どこで手に入るの?
Rjp-wikiみたいなサポートサイトってあるの?

826 ：１３２人目の素数さん：2006/05/05(金) 01:05:41

>>825
完全win版はこれ
http://www.math.mcgill.ca/loisel/octave-workshop/

Cygwin版はCygwinをフルインストールすると自動的に入る

Cygwin版でもいいけどCygwinのフルインストールはいやな人はこれ
http://sourceforge.net/project/showfiles.php?group_id=2888

827 ：１３２人目の素数さん：2006/05/05(金) 01:09:25

>>825
http://www.gnu.org/software/octave/

828 ：１３２人目の素数さん：2006/05/05(金) 01:43:23

>>826＆827

㌧ｸｽ

829 ：１３２人目の素数さん：2006/05/05(金) 01:58:49

>>821

>トヨタ、武田薬品、プルデンシャル（メーカーじゃないけど）、・・・

「武田薬品」という社名が出たので・・・．
FDA(Food & Drug Administration/米国食品医薬品局)は新薬の申請の際に
「SASのデータセットで」ということを要求しているようです．

http://www.jiten.com/dicmi/docs/x/13130s.htm

ですので，製薬業界では自動的に SAS を使わざるを得ない状況となっているようです．．．

830 ：１３２人目の素数さん：2006/05/05(金) 06:15:47

>>829
つまり製薬業界は皆2流ってことかw

831 ：１３２人目の素数さん：2006/05/05(金) 09:29:10

arules使っている人いますか？

832 ：万年ボケ：2006/05/05(金) 11:57:11

>>831
windowsでも動く"weka"っていう、データマイニングのソフトがあるそうな。
http://www.weka-jp.info/から、ダウンロード可。メーリングリストもある。

使ったことないけど、クレージーな万年ボケは挑戦したくなる。
MUSASHIはLinuxだけど、これはWINもMacOSもある。

833 ：１３２人目の素数さん：2006/05/05(金) 12:03:19

wekaはjavaで書かれているから遅いよ。

834 ：１３２人目の素数さん：2006/05/05(金) 12:06:39

cor ( x ) の出力を
変数１　変数２　相関係数
VAR1 VAR2 0.03
VAR1 VAR3 0.14
VAR1 VAR4 0.23
VAR2 VAR3 0.74
VAR2 VAR4 0.59
...

のようにする事はできますか？

835 ：１３２人目の素数さん：2006/05/05(金) 12:47:46

cor(x)から情報を抽出するんだジョー！

836 ：１３２人目の素数さん：2006/05/06(土) 07:00:01

>>753

ホントだ。
10万件くらいデータぶち込めばかなりアヤシイですね。
明らかにバグります。
パソコン上のメモリが足りないのかな?

837 ：１３２人目の素数さん：2006/05/06(土) 09:39:13

小規模データしか扱えないですよね。
どうにかならないものでしょうか･･･

上の難しい話を除いても実務で使える領域は限られている。

838 ：１３２人目の素数さん：2006/05/06(土) 11:15:55

これだとハンドルできるデータ量はエクセルの方が多い感じですね。
まあ、エクセルも6万近いデータ入れれば確かにバグりますがwww。
やっぱノートじゃダメなのかなあ・・・・・・。

839 ：１３２人目の素数さん：2006/05/06(土) 13:28:22

SASしかね

840 ：１３２人目の素数さん：2006/05/06(土) 20:28:35

Fortran90使えよ

841 ：１３２人目の素数さん：2006/05/06(土) 20:38:04

>>840
なにもわかってねぇ･･･

842 ：１３２人目の素数さん：2006/05/06(土) 20:51:45

漢ならアセンブラ。　異議は認めません。

843 ：１３２人目の素数さん：2006/05/06(土) 21:26:42

フォートランには山のようなサブルーチン資産もあるから、
コーディングする根性があれば大規模データ解析にはいいかも。
http://www.k2.dion.ne.jp/~sa-shibu/
SAS や R とは違って早いし。

844 ：１３２人目の素数さん：2006/05/06(土) 21:28:24

>>843
干し草の山から針を探すのが面倒

845 ：１３２人目の素数さん：2006/05/06(土) 22:23:25

>>841
Matlab使ってると、別にFortran90でも変わらないなという感じもする。

846 ：１３２人目の素数さん：2006/05/07(日) 12:54:13

フォートランならＣの方がいい
ただＣは文字列操作が苦手

847 ：１３２人目の素数さん：2006/05/07(日) 16:26:56

>>846
変数宣言したりポインタとか面倒にょ
その点、FORTRANは楽
文字列操作もライブラリ使えばいいし

848 ：１３２人目の素数さん：2006/05/07(日) 18:27:51

FORTRANならＣ＋＋の方が現実的だと思う。
システムに落とすときにFORTRANだと稟議が通らない気がする。

849 ：１３２人目の素数さん：2006/05/07(日) 19:41:38

職場のカルチャー次第かな、と思う。
大学とか（国公立の）研究機関なら、FORTRAN の方が好まれそう。
C++ は使ったこともない、みたいな人がほとんどだったりして。

850 ：１３２人目の素数さん：2006/05/07(日) 19:53:37

C++の統計のライブラリってどのくらい充実しているのかな？
当たり前だけどライブラリがないと何も出来ないから。

アメリカだと、エンジニアリング系の学生はmatlabとmathematicaを普通に使って、
他に必要とあれば専用のソフトを使う。　SASはビジネススクールや経済学部の
学生がよく使っていた。　C++は難しいし、普通は使わないですね。　

851 ：１３２人目の素数さん：2006/05/13(土) 20:54:16

852 ：１３２人目の素数さん：2006/05/18(木) 20:11:51

>815
HalWinとかって日本製じゃん。

853 ：１３２人目の素数さん：2006/05/21(日) 08:51:34

解析フェーズになったら、ＳＡＳよりＳ(Ｒ含む)の方がずっと使い易いですよね。

Ｓ-ＰＬＵＳ買いたいな。

854 ：１３２人目の素数さん：2006/05/23(火) 00:00:53

しかもＳ－ＰｌｕｓはＳＡＳより維持費がずーっと安いぞ

855 ：１３２人目の素数さん：2006/05/24(水) 00:01:10

Ｒは維持費がタダだぞ

856 ：１３２人目の素数さん：2006/05/27(土) 08:14:59

Ｒは大規模データを扱えるようにしていく気があるのでしょうか？
今のままでは統計学習用途で終わってしまう気がします。

857 ：１３２人目の素数さん：2006/05/27(土) 09:55:16

R で扱えない規模のデータって、どれぐらいの大きさ？
SAS の方が限界が低いと思ってたんだけど。

858 ：１３２人目の素数さん：2006/05/27(土) 12:39:49

>>857
oioi....

859 ：１３２人目の素数さん：2006/05/27(土) 13:43:45

Rは研究用、SASは業務用ですよ。
どちらが大きいデータセットを扱えるように設計されているかは判りますよね？？

860 ：１３２人目の素数さん：2006/05/27(土) 14:45:19

>>859
だから、具体的に比較してもらえない？
地震波「研究」もあれば、アンケート調査（臨床試験、でもいいけど）のデータ解析「業務」もあるし。
普通、前者には R、後者には SAS を選ぶよね。

861 ：１３２人目の素数さん：2006/05/27(土) 16:39:33

>>856

ないんじゃない?
元々研究者用でしょう。
研究者＝一般普及度が高い、ってワケではないでしょうから、
そう言った意味では、いくらRファンが｢普及｣を謳っても限界があると思う。
そもそも研究者が一般のニーズを良く理解している、とも思えないしね。
一般側としては｢研究側｣に合わせる努力ができる人しかこう言った特殊な
ソフトは使わんでしょ。

862 ：１３２人目の素数さん：2006/05/27(土) 18:37:24

>>861
その開き直りスタンスをＲは取ると････
それじゃ駄目だ。俺の役には立てねぇ

863 ：１３２人目の素数さん：2006/05/27(土) 19:07:59

１．データ解析業務従事者（臨床試験データ解析、マーケティング、・・・）
２．数学系研究者（数理統計学、計算機統計学、・・・）
３．非数学系研究者（数理経済学、遺伝子工学、生態学、地震工学、環境工学、気象工学、・・・）
４．卒論・修論のためにデータ解析をやる必要がある学生・院生
５．なぜかデータ解析を（一時的にでも）やる羽目になった非研究職の会社員

１は仕事で SAS か SPSS を使う（R を知っていようがいまいが）。
２や３は仕事の一部（データ解析、シミュレーション）で R を使う。

ここで言ってる「一般」って、４あるいは５、という理解でいいのかな？

864 ：１３２人目の素数さん：2006/05/27(土) 19:34:03

>>863

多分。
ある意味Rって自慰ソフトだよね。
一般的には統計取る必要がある場面ってのが極めて少ないわけだし。
殆どのケースではExcelで間に合うしさ。

865 ：１３２人目の素数さん：2006/05/27(土) 20:12:35

そこで大規模データ対応ですよ。

866 ：１３２人目の素数さん：2006/05/27(土) 20:39:46

>>860
統計の世界にいてＳＡＳを知らないなんてもぐりだぞ

867 ：１３２人目の素数さん：2006/05/27(土) 21:23:32

いっぱいデータ食わせたらメモリ消費が大変なことになりますたｗｗｗｗ

868 ：１３２人目の素数さん：2006/05/27(土) 21:25:56

>>866
知ってるよ？SAS、仕事で使ってるし。R も詳しい方だと思う。
でも、どちらも大規模データが扱えなくて困った、という経験は無い（サンプルサイズで10万ぐらいまでだけど）。
で、SAS は変数が多い（マイクロアレイデータとか）と困難がある、という話を聞いたことがあるから、どうなんだろうって。

869 ：１３２人目の素数さん：2006/05/27(土) 22:04:17

>>868
SASなら、500万件×200変数以上でも普通に扱えます。
Rだと10万件×20変数でもアップアップ。

870 ：１３２人目の素数さん：2006/05/27(土) 22:06:34

メモリが２５６だと１万件でも辛くネ？

871 ：１３２人目の素数さん：2006/05/27(土) 22:22:23

>>869
で、マイクロアレイデータとかだと5000変数だったりしますよね？
時系列でとった気象データだったりすると、もっと変数が多くなるわけで。
SAS はどこまで耐えられるのでしょうか？

実際に10万件（10万オブザーベーション）といったデータを扱う
領域にどんなものがあるか、ということに興味があるのです。
医学統計の実務をしているのですが、多くても1万件を超えたことがありません。

それと、500万件×200変数以上でも普通に扱えます、と言われますが、
ハードディスクにスワップされますよね？
相関係数求めたら、現実的な時間で結果がかえってきますか？

>>870
メモリ 256 だと、Windows なら SAS を立ち上げただけで挙動不審になるのでは？

872 ：１３２人目の素数さん：2006/05/27(土) 22:43:31

ちょっと実験したくなって

x <- matrix(rnorm(1),2500000,50)

を実行したら、ブルースクリーン･････

>>871
SASはハードディスクに直接I/Oをかけるのでメモリ量は基本的に関係ありません。
プログラム本体を格納できるだけのメモリがあればいい。基本的にだけど。
またそれでいてあの速度だから手放せない。

873 ：１３２人目の素数さん：2006/05/27(土) 22:47:27

Rのメモリの使い方は体育会系って感じがしてある意味好きｗ

874 ：１３２人目の素数さん：2006/05/27(土) 23:03:15

>>873
Rは完全に文科系。
体育会系というならSASでしょ。ｶﾞﾘｶﾞﾘ音を立てて計算をしている。

S-PLUS9も大容量データハンドルを謳っているけど、
ハードディスクに直接書き込むようになったのかな？

875 ：１３２人目の素数さん：2006/05/27(土) 23:21:56

>>872
iMac G5 でやったら、20秒ぐらいでかえって来たよ。

> x[2500000,50]
[1] -0.0607673

876 ：１３２人目の素数さん：2006/05/27(土) 23:41:12

>>872

> x <- matrix(rnorm(1),2500000,50)
警告：Reached total allocation of 734Mb: see help(memory.size)
警告：Reached total allocation of 734Mb: see help(memory.size)
エラー：サイズ 976562 Kb のベクトルを割り当てることができません

877 ：１３２人目の素数さん：2006/05/28(日) 09:35:06

Ｒからwww上の圧縮ファイルをダウンロードする関数はありますか？

878 ：１３２人目の素数さん：2006/05/28(日) 22:17:23

help ( download.file )

879 ：１３２人目の素数さん：2006/05/28(日) 22:30:13

S-PLUS Enterprise Developer 版っていくらするの？
１０万で買えたら間違いなく買うんだけどな。

Big Data ライブラリがＲにも欲しいね。
ttp://www.msi.co.jp/splus/products/V7/V70win.html

880 ：１３２人目の素数さん：2006/05/28(日) 22:50:55

あの、基本的な質問で申し訳ないのですが、

Ｓ３やＳ４ってどういう意味ですか？

881 ：１３２人目の素数さん：2006/05/29(月) 03:00:43

>>880
http://www.okada.jp.org/RWiki/index.php?S4%20%A5%AF%A5%E9%A5%B9%A4%C8%A5%E1%A5%BD%A5%C3%A5%C9%C6%FE%CC%E7

882 ：１３２人目の素数さん：2006/06/02(金) 19:30:11

Rコンソール上では日本語で書き込みができるのにデータの読み込みをすると文字化け（エスケープ？）してしまいます。
R2.3.0、OSX10.4.6です。
読み込ませたのはカンマ区切りのcsvファイルとテキストファイルで、同じことをWinXPのRでやってみてもらったところ問題なく表示できていました。
対処法分かる方がいましたらお願いします。

883 ：１３２人目の素数さん：2006/06/03(土) 19:58:31

文字コード変えてやってみた？

884 ：１３２人目の素数さん：2006/06/03(土) 22:00:13

miで改行コードも含めていろいろ変えてみたんですがどうにもならなかったです・・・

ツールバーにあるので気になってたのですが、もしかしてこのパッケージってOSXではX11を通して動いてるんですかね？
だとしたらkinput2なんかを入れたりして日本語環境を構築しないとだめなんでしょうか？

885 ：１３２人目の素数さん：2006/06/04(日) 00:46:57

>>882

Intel Mac miniで同じバージョンのRですが、UTF-8, 改行LFのCSVファイルが列名, データともに
問題なく読み込めていますよ。

>>884

X11はX11()デバイスを使うときだけ必要（Rcommanderとか使うとき)
基本的にCocoaアプリです。

886 ：１３２人目の素数さん：2006/06/04(日) 07:09:34

>基本的にCocoaアプリ

ですよね、最初から日本語表示、入力ともにできてたので可能性は薄いと思ってました。
さきほど別のMacにRを入れてみてmiでファイルの文字コードを>>885にあるように変換してから読み込ませたところ問題なく表示できました。
インストール時の失敗かなにかなんでしょうか・・・再インストールも含めて試してみます。

887 ：１３２人目の素数さん：2006/06/05(月) 08:39:41

SASは今までの惰性でしばらくは使用され続けるけれど
設計思想が古いから遠からず緩やかな死を迎えると思う
SAS社自身もそのことはよーく知っていてもう学生の教育に力はいれていない
（私の分野ではSASを採用している授業が周囲でどんどん減っている）
若いときSASで教育された今現役の人が年をとったらそれでおしまいになる
将来に向けて養成するんじゃなくて現世代から絞れるだけ搾り取る
というマーケを展開していることがそれを如実に示している．

888 ：１３２人目の素数さん：2006/06/05(月) 09:39:48

>>886

システム環境設定の「言語環境」で、「書式」タブの「地域」が「日本」になっているかどうかも
確認したほうがよいでしょう。これが米国とかだと英語版相当の機能になるはず。

889 ：１３２人目の素数さん：2006/06/05(月) 09:57:10

>>882
read.csv()でエンコードを指定できなかったけ？file()だけだったけ？

890 ：１３２人目の素数さん：2006/06/05(月) 13:36:58

.Callの引数で "S_c_use_method"とは何物なのでしょうか．
後ろの引数に指定する関数のための「おまじない」みたいなものなのでしょうか？

891 ：１３２人目の素数さん：2006/06/05(月) 20:01:10

>>887
SAS 社の売り上げはちょっと調べれば判るだろうけれど、まだまだ急成長を続けている。
SAS のトレーニングは、（昔は）宣伝のために SAS 社がサービスでやってただけ。

892 ：１３２人目の素数さん：2006/06/05(月) 21:55:05

SAS/STATだけ見るとどうなんだろう？

893 ：１３２人目の素数さん：2006/06/05(月) 23:19:03

>>887は学者かなんかでしょ？
マイニングもどきの統計ではＳＡＳ以外の選択肢は考えられない

894 ：１３２人目の素数さん：2006/06/06(火) 05:30:29

>>893はSASの社員か，企業の電脳土方かなんかでしょ？

895 ：１３２人目の素数さん：2006/06/06(火) 08:17:41

しかしさ、「R」って名前は不便だよ、google検索とかするときに
　R Anova
とかで検索しても、けっこう関係ないのばっかり。
Stata Anova
とかならStataの記事ばかりでてくるのによ。

R　検索で指定できねーよ、ばか。

896 ：１３２人目の素数さん：2006/06/06(火) 08:23:24

R指定

897 ：１３２人目の素数さん：2006/06/06(火) 11:46:35

それは「C」や「S」にも共通する。
まぁ、RSiteSearch()を使ってくれ。

898 ：１３２人目の素数さん：2006/06/06(火) 19:33:17

>>895

R 統計

で結構出ます^^

899 ：１３２人目の素数さん：2006/06/06(火) 22:32:11

Ｒの学校の宿題全く出来ないよぉ＞＜
いみわかんなぃし。。。助けてぇ･･･

900 ：１３２人目の素数さん：2006/06/06(火) 23:30:34

>>894
馬鹿だねぇ。
Ｒで済むようなセコイ仕事しかしてないから想像もできないのかな？

901 ：１３２人目の素数さん：2006/06/06(火) 23:35:12

デジャヴ

902 ：１３２人目の素数さん：2006/06/07(水) 00:08:04

>>900
>Ｒで済むようなセコイ仕事

ゲノム解析ってセコイ仕事？？

903 ：１３２人目の素数さん：2006/06/07(水) 00:19:17

せこい。井の中

904 ：１３２人目の素数さん：2006/06/07(水) 01:13:21

重箱の角を突いくことが業績になるバイオインフォはニッチ産業

905 ：１３２人目の素数さん：2006/06/07(水) 23:23:19

Ｒでゲノム解析は間違いなくセコイでしょ。

ＳＡＳが使える環境なら間違いなくＳＡＳを選ぶよ。

906 ：１３２人目の素数さん：2006/06/08(木) 00:32:15

>>905
業者さん乙ｗ

907 ：１３２人目の素数さん：2006/06/08(木) 11:21:23

1 名前：ひろゆき＠どうやら管‎理人[] 投稿日：2006/06/08(木) 10:05:39
数学に素養のある住人の数学板離れの防止、
そして数学好きの新参者が寄りつきやすい環境を整備するために
数学板の諸悪の根源を排除しましょう。

最近大量に発生している数学と関係のない雑談を繰り返すコテハン、
これを減らしていかなければ今後数学板の存亡に影響が出てくることは間違いないでしょう。

そしてこれらのコテハンを発生・定着させている根源がスレタイにあるコテハンの人物であることがはっきりと分かりました。

数学とは無縁のこのコテハンを数学板から排除することが数学板の正しい活性化のための早道です。
数学好きの真面目な住人の皆様、どんどん訴えて参りましょう。

908 ：GiantLeaves ◆6fN.Sojv5w ：2006/06/08(木) 15:12:37

talk:>>907 人の脳を読む能力を悪用する奴を排除しないと結局悪くなるぞ。

909 ：１３２人目の素数さん：2006/06/15(木) 04:01:21

教えていただきたいのですが,Rでカテゴリカル回帰分析(最適尺度法)は
どのようにすれば良いのでしょうか？
ググってみたり,http://www.okada.jp.org/RWiki/を調べたりしていた
のですが,結局分かりませんでした…｡お手数をおかけしますが,ご教授
いただければ幸いです｡

910 ：１３２人目の素数さん：2006/06/16(金) 00:47:06

>>909
ぐぐってみたが、どうもカテゴリカル回帰というのはSPSSでしか
使わないみたいだね。カテゴリーの関連を知りたかったら
普通は林の数量化法を使うと思うけど国内専用だからなあ。
ぐぐった結果でもその2つがどの程度違うものなのかが
分からなかった。誰か知っている人がいたら教えてほしい。

911 ：１３２人目の素数さん：2006/06/16(金) 06:19:25

>>909

数量化I類?

912 ：１３２人目の素数さん：2006/06/16(金) 16:47:00

「くりかえし」というものを習い
計算が止まらなくて
ウインドーを閉じたことがあるが、
ウインドーを閉じずに計算をストップする方法は
あるのでしょう？

913 ：１３２人目の素数さん：2006/06/16(金) 20:25:48

>>912

ESC(Windows/Mac)
Ctrl+C (Linux)

914 ：909：2006/06/16(金) 23:10:46

お返事ありがとうございます｡重要なことを書き忘れてました｡

事情がありまして,従属変数が順位尺度,独立変数が間隔尺度なんです｡
それで,それら変数をそのまま使うためにはどうしたものか…と考えていた
ところ,SPSSのカテゴリカル回帰分析なるものを見つけました｡しかし,
SPSSのcategoriesは使えない状態でして,Rでなんとかならないかなぁと
考えて質問させていただきました｡
(重)回帰分析･数量化I類の従属変数は量的変数でなければいけませんよね？
(…分析方法を考え直した方がいい気がしてきました｡

915 ：１３２人目の素数さん：2006/06/17(土) 00:43:26

>>914
ダミー変数を使ったら？？

916 ：１３２人目の素数さん：2006/06/17(土) 10:13:21

>>913
ありがとうございます。

917 ：909さんへ：2006/06/17(土) 12:38:49

ゆいでーす．　よろぴくね
ダミーさんでは，順序が表現できなくて，ゆい，悲しいな
あなたがぁ　やりたいことをぉ　叶えてくれる分析法は
「多値カテゴリ順序データのプロビット（ロジスティック）回帰」だぴょん
名前が長いけど覚えてくれたぁ？　やりかだけどぉ
SEMのMplus,EQS，とかぁ，LISRELがおすすめでーーす．　うふっ！
Rだったらねぇ，SEMパッケージとpolycorパッケージを組み合わせてぇ
ブートストラップを行う方法がぁ　そのまんま
SEMパッケージのEXにあるからぁ　ソレソレーーって利用できちゃうわよ
ゆい，応援してるからぁ，くじけないで頑張ってね．約束よ！

918 ：909：2006/06/20(火) 21:45:56

>>915,917
ありがとうございます｡統計って,マジで奥が深いですね｡

そうなんですよ｡順位が勿体ないなぁと思って,どうしたものかなぁ…と思っていたんです｡
Rにはまだまだ不慣れで時間はかかるかもしれませんが,頑張ってみます｡
お忙しい中,ありがとうございました｡

919 ：１３２人目の素数さん：2006/06/20(火) 23:35:40

>>917

ﾜﾛﾀwwww

920 ：１３２人目の素数さん：2006/06/22(木) 17:53:18

すごい基本的なことだと思うのですが、教えてください。
Mac OS X 10.4.6でRをターミナル上で使おうとしたのですが、
> options(device="Quartz")
> demo(graphics)
[中略]
> if (dev.cur() <= 1) get(getOption("device"))()
以下にエラーget(x, envir, mode, inherits) : 変数 "Quartz" は存在しません
> options(device="X11")
> demo(graphics)
[中略]
> if (dev.cur() <= 1) get(getOption("device"))()
以下にエラーX11(display, width, height, pointsize, if (is.null(gamma)) 1 else gamma, :
デバイス 'X11' を開始できません
追加情報: Warning message:
X11 ディスプレイ '' へのコネクションを開くことができません
となります。X11は起動してあります。どうすればターミナル上のRでグラフィックディバイスが
開くのでしょうか。

921 ：１３２人目の素数さん：2006/06/29(木) 12:00:59

test

922 ：１３２人目の素数さん：2006/06/29(木) 12:01:29

すみませんが、質問です。
GNU R の商用利用は、どの程度まで可能なのでしょうか？

1.社内の個人的業務処理
2.社内運用システムの作成
3.社外に納品するシステムの作成

できたら3.をやりたいと考えているのですが。

また、R で書いたスクリプトは、必ず公開しなければならないのでしょうか？
↓を見たのですが、どうもRがどういうカテゴリに属するのか、良く分かりません。
http://www.gnu.org/licenses/gpl-faq.ja.html#IfInterpreterIsGPL

923 ：１３２人目の素数さん：2006/06/30(金) 00:33:03

>>922
GNU GPLのFAQを読んでみた感想。

Rで利用するスクリプトは個人（あるいは会社内）で
利用するだけならもちろん公開の義務はないでしょう。

商用利用の方ですが、外部プログラムとしてRを
呼んで作業をさせるだけでシステムそのものにはRが
含まれないなら問題はないと思われます。
しかし、システムの主たる目的がRがないと達成できない
ならRを広い意味で含むソフトウェアと考えられ、GPL違反と
言われるかもしれません。
# たとえば、特殊な用途に限っても統計解析をするソフト
# として裏でRが動くだけというものは市販はできないでしょう。

といっても上記のように独立した構造であり、
納入するのが1社だけで一般に市販することがないなら
問題がないように思うのですが、どうでしょうか？
# 当たり前ですが、Rに関わる部分は無保証であり、
# そのシステムを利用する会社に何らかの損害が生じて
# それが外部利用のRのせいであると分かっても
# あなたの会社が賠償するか相手の会社にそれは免責事項
# であると納得してもらう必要があります。
# そちらの方がはるかに問題だと思いますがね。

924 ：１３２人目の素数さん：2006/06/30(金) 06:40:46

当たり前ですが　エクセル，ＳＰＳＳ，ＳＡＳにもバグはあり
それに起因して，そのシステムを利用する会社に損害が生じても
ＭＳ社もＳＰＳＳ社もＳＡＳ社も，損害を賠償する積もりなんて
これっぽっちもありません．
契約書をよく読むと，絶対賠償しなくて済む様に，これでもかと
イロイロ書いてあります．だからその点は「実質」Ｒと同じです．

925 ：１３２人目の素数さん：2006/06/30(金) 10:34:42

ソフトの購入に支払った金額までなら補償してくれる可能性は
ありますが、「実質」Rと同じというのは正しいでしょうな。
ただ問題なのはそういう事態が発生した場合、システムを
構築した会社がそれはうちの問題ではないと言い逃れられること
にあるのでしょう。Rを使ってもその部分はうちには責任ないということを
相手の会社に納得してもらえばいいのですが、それは難しいのでは
ないかということです。

926 ：１３２人目の素数さん：2006/06/30(金) 21:17:12

>>924
賠償が受けられるかどうかは問題ではないんだよ。
SAS に由来するバグを理由に発注元が受注会社に賠償を求めることなど最初から出来ないから。
SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれないから、
普通に契約を結ぶ限りでは「責を負う」必要などない。
で、発注元の担当者も好きこのんで R の使用を要求したりしない。
賠償を得られようが得られまいが、不具合が発生した時点で自分のクビが飛ぶから。

927 ：１３２人目の素数さん：2006/07/01(土) 08:52:04

>発注元の担当者も好きこのんで R の使用を要求したりしない。

どっちにしろ賠償されないなら，発注コストが低く見積もれて
ソースがみられるRのほうが安心じゃん　

928 ：１３２人目の素数さん：2006/07/01(土) 09:42:40

社会に出てないのがすぐわかる

929 ：１３２人目の素数さん：2006/07/01(土) 10:30:25

SASの社員
or
SASの奴隷の電脳土方（低所得）

930 ：１３２人目の素数さん：2006/07/01(土) 17:13:02

>>927
担当者の立場をイメージできないのかな？

SAS や SPSS や S-plus といった統計パッケージソフトは、
営利企業が自社の社会的信頼をかけて作成しているため、
事実上の品質保証がある。品質の保証されたパッケージを使う限り、
バグが出てもその使用を指示した発注元の担当者の責任は問われない。
これは、OS として Windows や商用 Linux を使う場合と同じ。

で、R はその意味での品質の保証が無い（実際の品質とは関係ない）。
OS として Mona OS を使うのと同じ（ソースが見れるから安心？）。
R に由来するバグが出て業務に支障が生じたとき、その責はもちろん
「品質の保証が無い統計パッケージソフトを選択した」担当者にある。
会社組織や行政機構の一員なら、当然、しかるべき責任をとらされる。

当然ながら、生じた問題の責任を自分一人でとりきれる場合には、
R が選択肢に入ってくる。自然科学系の研究者（あるいは卒論執筆中の学生）で、
自分の研究のためにデータ解析をするような場合がこれ。
R の豊富なパッケージに利点を見いだせば、使用になんの躊躇も無い。
実際、両方使える者は（私を含めて）皆、目的に応じて使い分けているはず。

931 ：１３２人目の素数さん：2006/07/01(土) 20:22:54

>事実上の品質保証がある。

だからないって．そもそも保証って何だよ．
補償しない保証なら，おれがしてやるよ
中が見えないだろ．プロがミミズで作ったソーセージだろ

Rはオープンだからごまかしきなないだろ
だれでも中がみれるから，直ぐにへんなコードはとうたされるだろ

932 ：１３２人目の素数さん：2006/07/01(土) 22:41:41

面白いな。
発注元は自力でシステムも作れないし、統計ももちろん分からない
から外注なんだろ？受注を受けた方もRの全ての機能が必要な
システムでもないだろうに自分で組まずにRを使おうって言ってるんだよな。
どんな話し合いになるのかなあ。ｗ

933 ：１３２人目の素数さん：2006/07/01(土) 23:12:56

こういうコマンドを実行してください。
とか言うのかねw

934 ：１３２人目の素数さん：2006/07/01(土) 23:44:03

>>926

>SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれない

ここが微妙だな...
統計をまれにしか使わない客との契約でそれを納得してもらえるかどうか？
要求仕様が統計解析部分を含んだシステム全体としてのものだと、外部から調達した部分の
バグも自社の責任の範囲内とみなされるだろうな...

935 ：１３２人目の素数さん：2006/07/02(日) 00:22:01

>>931
>そもそも保証って何だよ．
「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。
三菱重工の部品を使ってロケットを組み立てたなら、その部品のせいで打ち上げに
失敗して人工衛星を壊しても、「三菱重工の部品を使った」ことは過失とは見なされない。
でも、泡沫メーカーの部品を使ったり、自社製造の部品を使い、そのせいで失敗したら、
部品の選択そのものが過失。訴えられ、おそらくは負ける。
あなたは認めない（認めたくない？）かも知れないけど、法廷では立派に物を言う「保証」だよ。

>補償しない保証なら，おれがしてやるよ
あなたには出来ない。
守るべき社会的信頼が無い者が何を言おうと・何をしようとそもそも保証に「ならない」から。

>>932
>発注元は自力でシステムも作れないし、統計ももちろん分からないから外注なんだろ？
少なくとも、製薬会社では違うね。統計で博士号取ってるような連中が担当者になって発注してるよ。
解析業務には波があるから、全部自社で解析するよりピーク時に外注した方が人件費が浮くんだよ。

>>934
契約書に免責条項として
「OS あるいは SAS に由来する不具合については、乙（＝受託会社）はその責を負わない。」
って書いておけば、大丈夫。普通、書くし、それがのめないような発注元は相手にしない。
ついで言うと、作った SAS プログラムを発注元に提供「しない」契約が普通。
データを受け取って、解析結果だけ納品するんだよ。

936 ：１３２人目の素数さん：2006/07/02(日) 05:37:10

>「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。
一流とか自分でいうな
実効が何もないんだからそれは自己満足．中身を見せずに社会的信頼といっても自己欺瞞
中身が見えているRのほうが清廉潔白

＞あなたには出来ない
ちゃんと読めよ　何も補償しないのは同じ（SASにもできない）
という文脈のレトリックにまともに答えてどうする
本当に社員か？

937 ：１３２人目の素数さん：2006/07/02(日) 10:19:35

>>936
>一流とか自分でいうな
例え私が三菱重工あるいはSAS社の社員だとしても、この説明の内容を変更する必要は感じないね。

>実効が何もないんだからそれは自己満足
発注元の担当者にとって、「業務に支障が出たとき、それに対する責任を負わずにすむ」
ことが社会的信頼のある製品を選択することの実効だ、と言っている。
一般論としてそれは認められない、というのならまともに反論してください。

>中身を見せずに社会的信頼といっても自己欺瞞
自己欺瞞って、SAS 社の？社会的信頼は、世間が企業（の製品）に対して付与するものだよ。
もちろん、「中身を見せない（見せる）」ことも、社会的信頼に反映される。
まあ、SAS 社がソースコードを公開しても、誰も読まないだろうけど。

>中身が見えているRのほうが清廉潔白
中身が見えている点において、ね。

>文脈のレトリックにまともに答えてどうする
まともに返すこと自体がレトリックだよ。

>本当に社員か？
民間企業の社員じゃないよ。

１．疑問なんだけど、R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる？
私はどちらにも利点・欠点があり、それゆえに今後も使いわけられていく、と思うのだけど。

２．R の欠点の一つ（もちろん、美点でもある）に開発・保守が非営利で行われている、ということがあり、
それが業務用途での採用の足かせになっている、という考えには同意できない？
すでにパッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途では広く使われて
いること、一般企業でフリーウェアの導入（メーラーとか）が困難なことについて、どういう理由があると思う？

938 ：１３２人目の素数さん：2006/07/02(日) 10:23:18

>>935
発注元が製薬メーカーだったらSAS以外の統計ソフトは認めないので
今回の事態は起こらないだろうな。そもそも君のいうとおり解析のみを
外注してシステムの外注はほとんどしないだろう。（よく使うものなら
自分たちで組むだろう。）
というわけでおれは製薬メーカーが発注元だとは思っていない。
それでもどういう契約をしたのかが基本になるのは確かだな。

939 ：１３２人目の素数さん：2006/07/02(日) 11:11:17

>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる
はい，そう思っています．今現在はオープンソースという思想がジワジワ浸透し始め
た時期（まだまだ少数派ですが）だと思っております．
１．お金をもらった社員がSASのために，ソース公開されない状況でかいたプログラム
２．自分が開発した手法，D論なんかで深く係わった手法を，同じ分野の
　　研究者が自分のコードを簡単に見られる状況で公開したプログラム
では後者のほうがシステムとして信じられるという，当たり前のことが認められる時代
が直ぐにくると思います．研究者は名誉を重んじます．

＞それが業務用途での採用の足かせになっている、という考えには同意できない？
今現在，採用の足かせであることは事実です

＞パッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途
では広く使われていること
こんな不合理なことはいつまでも続きはしません．企業は合目的だから（非合理的な保
守性も合目的だからで），オープンソースという思想が社会に半分くらい認知された時
点で，なだれを打ってオープンソース（Rとかリナックスとか）に移行すると思います．

＞発注元が製薬メーカーだったらSAS以外の統計ソフトは認めない

こんなの今だけ，大橋の世代が終われば，もっと合理的な若い世代はSASを支持しない．
支持する理由がない．無意味なバージョンアップ，無意味な新製品．SASも自分達の寿
命が長くないことを悟ってるから，非道な値上げで現世代から搾り取って終わりにしよ
うとしている．新しく大学でSASを導入するとこなんで皆無です（私は情報教育の学会
にも入ってます）今は過渡期です

940 ：１３２人目の素数さん：2006/07/02(日) 13:54:32

>>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる
>はい，そう思っています．
ご立派。R に心酔してるんだね。Robert Gentleman だって全面的に優れているとは思ってないだろうよ。

>大橋の世代が終われば，もっと合理的な若い世代はSASを支持しない．支持する理由がない．
O橋先生の世代で SAS を強力にサポートしてるのって、O橋先生だけじゃん...
次世代はH田先生あたりがあとを引き継ぐだろうから、きっとあまり変わらないよ。

そもそも日本は SAS 社から見れば世界の10%でしかないし、SAS は FDA 標準。
日本に R の時代が来るのは、アメリカの一般企業が SAS を捨ててから。
政治力の問題で、米国標準は世界標準だから。
で、MS とか SAS 社とか Oracle がつぶれると米国に税金が落ちなくなるから、
米国政府は国益のために最後まで自国のソフトウェア産業（国策産業！）を保護するだろう。

>SASも自分達の寿命が長くないことを悟ってるから
業績は右肩あがりみたいだね。
http://www.sas.com/corporate/report05/annualreport05.pdf

あと、MS 社は Windows のソースコードを開示したように、SAS 社も
「業績をあげるために必要と判断すれば」あっさり開示すると思うよ。
もちろん、オープンソースの理念とは別物だけど。

>新しく大学でSASを導入するとこなんで皆無です
主だった大学ではとっくに導入が済んでるだけでは？

941 ：１３２人目の素数さん：2006/07/02(日) 21:13:21

>>940
SASを授業で一斉に使えるだけのライセンスで契約している大学って
そんなにあるの？研究室単位では使っているところはあるだろうけどね。

942 ：１３２人目の素数さん：2006/07/02(日) 21:30:28

SASとRが本質としてどっちが優れているかなんて関係ない。

言い訳ができるのがどっちかというだけ。

943 ：１３２人目の素数さん：2006/07/03(月) 16:51:26

RとS-PLUSを比較するのは分かるがSASと比較する意味が全く分からん。
RなんてGUIインターフェースがまるっきり無いんだからそういう面では糞だろ？
SASみたいに矢印引っ張るだけで解析なんてRには到底できっこない。

何を勘違いしてるのやら。

944 ：１３２人目の素数さん：2006/07/03(月) 18:59:50

どうでもいいがな。
所詮は道具。

945 ：１３２人目の素数さん：2006/07/03(月) 22:11:27

>主だった大学ではとっくに導入が済んでるだけでは？

慶応は岸元
クビ（防人島流し）にしてSASからRに文系も理系も全面移行

946 ：１３２人目の素数さん：2006/07/04(火) 00:54:49

>>943
きみがＳＡＳもＲも素人なのは解った。

ま、俺はRとAccessで仕事したくないね。

947 ：１３２人目の素数さん：2006/07/04(火) 01:40:43

私は仕事自体したくありませんが、なにか？

948 ：１３２人目の素数さん：2006/07/04(火) 08:16:37

>>946
レッテル貼りしかできない厨房乙

949 ：１３２人目の素数さん：2006/07/05(水) 08:59:43

みなさん、

議論しているひまがあったら

T c l / T k がいらない G U I つくってくれませんか？

950 ：１３２人目の素数さん：2006/07/05(水) 10:57:38

>>949
Gtkを使えば？

951 ：１３２人目の素数さん：2006/07/05(水) 21:30:21

>>949
つess

952 ：１３２人目の素数さん：2006/07/05(水) 22:41:21

>>949
つJGR

...たしかにRcmdr以外は統計処理自体の初心者向けじゃないな...

953 ：１３２人目の素数さん：2006/07/06(木) 16:55:47

っつーかたった10万くらいのデータでバグるRをそこまで信用できないでしょ?
SAS vs. Rってコンテクストはナンセンスだと思うよ。
道具は所詮道具、と言ってる>>944が正しいと思う。
Rマンセーもいいけど、Rにそこまで｢心酔｣する理由も分からんです。
マニアは逆に一般化を遠ざけるよ。そこがRの弱点www

954 ：１３２人目の素数さん：2006/07/07(金) 13:10:00

Ｑ＆Ａ (中級者コース)の慶応大生の書き込みを見て、ふっと思ったのだけど、
Windows版ではpage()はサポートされていないの？
Linux版、Gtk版、MacOSX版でちゃんとあるのだけど。

955 ：１３２人目の素数さん：2006/07/07(金) 20:41:59

>>954
その「サポート」っていうのが何を意味するかわかんないけど
例えばpage("?")とか"?"オブジェクトの中身のページャ表示は
Windows版Rでも普通にできる。（ヘルプ閲覧用窓と同じのが開く）

でも、行列やベクトル等の数値オブジェクトはだだ書きされるから
それらの表示や確認には不向き。（列も行も見分けがつかなくなる）
で今、表計算ソフト風に閲覧できるedit(x)を慶応大生に勧めてきた。

956 ：１３２人目の素数さん：2006/07/09(日) 21:53:31

次スレです．

＝　統計解析フリーソフト　Ｒ　【第２章】　＝
http://science4.2ch.net/test/read.cgi/math/1152449095/l50

957 ：１３２人目の素数さん：2006/07/09(日) 23:53:43

いくらなんでも早すぎだろ。

こんなにペースの遅いスレなのに。

958 ：１３２人目の素数さん：2006/07/10(月) 13:41:50

二年三百九日。

959 ：１３２人目の素数さん：2006/07/13(木) 00:40:39

age

960 ：age：2006/07/16(日) 23:37:52

age

961 ：１３２人目の素数さん：2006/07/19(水) 15:08:59

SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?

962 ：１３２人目の素数さん：2006/07/19(水) 19:41:40

こういうこと書き込むのはＳＡＳの社員か
岸本のような元ＳＡＳ社員しかいねーよ
実際のユーザーはしいたげられてっからな

963 ：１３２人目の素数さん：2006/07/21(金) 18:40:25

grep()で、結果を反転させたいのだけど、helpを見てもそれらしいオプションがない。
要するに、grep --invert-match をしたいのだけど。正規表現を工夫してしのぐしかないの？

964 ：１３２人目の素数さん：2006/07/23(日) 02:17:20

>>963
txt[-grep("foo",txt)]
という感じではだめなのか？

965 ：１３２人目の素数さん：2006/07/24(月) 10:07:07

>>964
あなた天才だね。ありがとう。

966 ：１３２人目の素数さん：2006/07/24(月) 22:24:06

age

967 ：１３２人目の素数さん：2006/07/28(金) 18:03:20

351

968 ：１３２人目の素数さん：2006/07/29(土) 00:26:30

age

969 ：１３２人目の素数さん：2006/07/29(土) 11:49:38

データマネジメントの分野でのＲの効率的な勉強法を教えてください。

970 ：１３２人目の素数さん：2006/07/30(日) 11:29:52

http://www1.doshisha.ac.jp/~mjin/R/

971 ：１３２人目の素数さん：2006/07/30(日) 13:41:50

二年三百二十九日。

972 ：１３２人目の素数さん：2006/08/03(木) 23:48:29

age

973 ：１３２人目の素数さん：2006/08/06(日) 12:34:25

>> EXCELデータをRに読み込むときってどうしてます？
>> 私はRODBC使ってますが．
>１．
>範囲選択
>２．
>read.delim("clipboard")

これってどうよ？

974 ：１３２人目の素数さん：2006/08/07(月) 08:47:12

いんじゃね

975 ：１３２人目の素数さん：2006/08/07(月) 17:08:34

別に統計解析を信頼できるソフトで行うときに、
ディフェクトスタンダードなソフトなんて存在しない…。

…しなくなるといいな。

976 ：age：2006/08/11(金) 13:47:39

age

977 ：１３２人目の素数さん：2006/08/12(土) 01:47:22

w^3 = 1, w != 0 で，行列

[ 1 1 1 ]
[ 1 w w^2 ]
[ 1 w^2 w ]

の rank ってどうやって求めたらいいですか？

978 ：977：2006/08/12(土) 01:48:05

間違えた．w != 1 でした

979 ：909：2006/08/12(土) 14:40:52

ゆいさん､いらっしゃいますでしょうか？以前､「多値カテゴリ順序データの
プロビット回帰」に関してご教授いただきました909です｡その後､試行錯誤
しまして､うまくいったように思うのですが､本当にできているか不安でして
改めてお伺いしたくレスさせていただきました｡
データフレームをData､そこに含まれる従属変数をy､独立変数をx1,x2,x3と
した場合､以下の構文で大丈夫でしょうか？
記載に不足などがあるかもしれませんが､余裕がございましたら改めてお教え
いただけると幸いです｡勝手ばかりで申し訳ありませんが､よろしくお願いします｡

hcor <- function(data) hetcor(data, std.err=FALSE)$correlations

model.data <- specify.model()
y <- x1, lam1, NA
y <- x2, lam2, NA
y <- x3, lam3, NA
x1 <-> x1, NA, 1
x2 <-> x2, NA, 1
x3 <-> x3, NA, 1
y <-> y, the1, NA

R.data <- hcor(Data[,c("y","x1","x2","x3")])
sem.data <- sem(model.data, R.data, N=n)
summary(sem.data)

system.time(boot.data <- boot.sem(Data[,c("y","x1","x2","x3")], sem.data, R=1000, cov=hcor), gcFirst=TRUE)
summary(boot.data, type="norm")

980 ：１３２人目の素数さん：2006/08/12(土) 18:35:57

>975
こまかいけど「デファクト・スタンダード（de facto standard）」な。
ディフェクト（defect）は「欠陥」。

981 ：１３２人目の素数さん：2006/08/15(火) 12:35:31

cumsumのヘルプにある
cummin(c(3:1, 2:0, 4:2))
cummax(c(3:1, 2:0, 4:2))
って意味が分からない。
今夜もやもやして寝られそうにないので誰か教えて。

982 ：１３２人目の素数さん：2006/08/15(火) 18:09:04

> c(3:1, 2:0, 4:2)-> x
> x
[1] 3 2 1 2 1 0 4 3 2

これのminとmaxでしょ。

983 ：１３２人目の素数さん：2006/08/15(火) 21:32:45

>>982
質問の仕方が悪かったのかな。
3 2 1 2 1 0 4 3 2
3 2 1 1 1 0 0 0 0
3 3 3 3 3 3 4 4 4
1行目をどうすれば2行目または3行目になりますか。
あぁぁ、そうか、なるほど。やっと分かった。
でも、こんなのどんな使い道があるのだろうね。

984 ：１３２人目の素数さん：2006/08/16(水) 00:38:22

仮にその行列をxとすると
y <- x[1,]
x[1,] <- x[2,]
x[2,] <- y
で１行目と２行目入れ替え

985 ：１３２人目の素数さん：2006/08/16(水) 12:41:05

>>984
いや、その、>>981からの流れ（cummin()とcummax()の挙動）なんだけど。。。
c(3:1, 2:0, 4:2) → 3 2 1 2 1 0 4 3 2
cummin(c(3:1, 2:0, 4:2)) → 3 2 1 1 1 0 0 0 0
cummax(c(3:1, 2:0, 4:2)) → 3 3 3 3 3 3 4 4 4
で、質問はcummin()とcummax()の使い道。こんな時に便利とかある？

986 ：１３２人目の素数さん：2006/08/17(木) 12:45:50

二年三百四十六日二十三時間四分。

987 ：１３２人目の素数さん：2006/08/18(金) 01:29:03

>>985
それは新記録の挙動を自動的に生成するときぐらいかな。
（cumminは小さいほど新記録、cummaxは大きいほど新記録）

988 ：１３２人目の素数さん：2006/08/19(土) 01:57:18

＝　統計解析フリーソフト　Ｒ　【第２章】　＝
http://science4.2ch.net/test/read.cgi/math/1152449095/