= 統計解析フリーソフト R =

このエントリーをはてなブックマークに追加
1132人目の素数さん
R は統計計算とグラフィックスのためのフリーソフト(GNU-style copyleft)
です.簡単なデータ解析から非常に高度・専門的な統計解析まで,さま
ざまな解析が出来る優れたソフトです.またRはSやSplusに操作環境な
どが良く似ており, Sで動作するものはRでもほとんど(90%以上)変更な
しに動作します.

スレが無いから立ててみました.
2リンク集:03/09/04 13:45
R - 統計解析とグラフィックスの環境
http://datamining.tama.ac.jp/~yama/R/

Rの使い方
http://web.sfc.keio.ac.jp/~watanabe/r.htm

関数一覧(青木先生)
http://aoki2.si.gunma-u.ac.jp/R/

統計言語 R の関連ドキュメントの和訳
http://www.is.titech.ac.jp/~mase/R.html

R のコマンド集
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r2.html

統計言語 R の講義
http://genome.ag.saga-u.ac.jp/R/
3132人目の素数さん:03/09/04 13:47
3次元プロットって、こんな感じ以外には実現出来ないの?

x <- seq(-10, 10, length= 30)
y <- x
f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
z <- outer(x, y, f)
z[is.na(z)] <- 1
op <- par(bg = "white")
persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "blue")
4132人目の素数さん:03/09/10 15:34
ぶらくーら
5132人目の素数さん:03/09/17 19:34
SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?
6sage:03/09/18 02:42
sage
7sage:03/09/18 02:48
関数 lsfit() で y = X b + e (変数は全て行列)の b を
推定することができますよ.lsfit() の結果を abline() に
渡すことによって回帰直線を描くことも出来ます.
> x <- c(64,70,58,66,81,73,75,72,90,53)
> y <- c(177,175,162,176,184,170,179,177,188,157)
> z <- lsfit(x,y)
> plot(x,y)
> abline(z,col=2)
さらに,lsfit() による回帰の結果 z から,
> ls.diag(z)
とすることで,以下のような情報が得られます.
std.dev : 残差の標準偏差.
hat : h_{ii} of the hat matrix H .すなわち行列の対角成分.
std.res : 規準化残差.
stud.res : スチューデント化残差.
cooks : Cook の距離.
dfits : DFITS 統計量.
correlation : 回帰係数推定量の相関行列.
std.err : 回帰係数推定量の標準偏差.
cov.scaled : 係数行列の Scaled covariance matrix.
cov.unscaled : 定数項に対応する列を含めた計画行列を
QR 分解したときの ( t(R).R )^-1 すなわち ( t(x).x )^-1 .
cov.unscaled * std.dev^2 で回帰係数推定量の分散共分散行列
を求めることが出来る.
8to:sage:03/09/18 02:52
Rは以下のサイトからダウンロードできます.
http://datamining.tama.ac.jp/~yama/R/install.html

EXCELで統計解析を行った場合,以下のような不具合が
指摘されています.
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

といっても,Rにもエラーは山ほどあるんでしょうけど.
9132人目の素数さん:03/09/18 03:04
>>8

確か「これはバグじゃない、仕様なんだ」とMSが言い逃れしてたよな(w
ここのページも詳しい。

「租界Rの門前にて――統計言語「R」との極私的格闘記録」(三中信宏氏@農水省農業環境技術研)
http://cse.niaes.affrc.go.jp/minaka/R/R-top.html
115:03/09/18 18:05
レス有難うございます。説明がかなり不足してました。どうも最小自乗平均とlsfitは違うような感じです。
最小自乗平均というのは「線形混合モデル」という、個体内誤差と個体間誤差が存在する場合に行う分散分析モデルでよく登場します。
ホームページとしては http://www.yukms.com/biostat/download/sem_menu.html に統計セミナーのページがあり、例えば第8回セミナーの20〜27ページに出て来るデータとその解析が割と分かりやすいと思います。
このページではJMPとかいう統計ソフトで解析をしているのですが、この解析をRで再現できないかな、と思って一時期四苦八苦していました。(高いソフトはとても買えない)
1211:03/09/18 18:06
> Data1
RBC dose animal week R
1 807 0 1 0 1
2 815 0 1 4 1
3 810 0 1 13 1
4 646 0 2 0 2
5 667 0 2 4 2
6 717 0 2 13 2
7 695 0 3 0 3
8 774 0 3 4 3
9 780 0 3 13 3
10 672 0 4 0 4
11 742 0 4 4 4
12 769 0 4 13 4
13 730 30 9 0 1
14 670 30 9 4 1
15 722 30 9 13 1
16 826 30 10 0 2
17 766 30 10 4 2
18 780 30 10 13 2
19 785 30 11 0 3
20 772 30 11 4 3
21 771 30 11 13 3
22 653 30 12 0 4
23 606 30 12 4 4
24 612 30 12 13 4
1312:03/09/18 18:07
表5.1のデータをこんなデータフレームとして作成すると、2元配置分散分析(間違い)は
> summary(aov(RBC ~ dose * week, Data1))
で、3元配置分散分析(これも間違い)は
> summary(aov(RBC ~ (dose + week + R) ^ 2, Data1))
で、再現できます。そして正しい解析である線形混合モデルは、nlmeライブラリを読んで
> library(nlme)
> anova(lme(RBC ~ dose * week, random =~ 1 | animal, Data1))
で、ほぼ再現できます(dose に関するpの値がちょっと違うのはよく分かりませんが)。
しかし、図5.2、5.3の再現の仕方がよく分かりません(組み込みのメソッドはない?)。自作したいのですが技量が足りず。たぶんlsfitは線形モデル解析でしか使えないと思います

長文失礼。めんどくさい話なので読み飛ばしてくれて結構です。ともあれRは最重要アプリの1つ。
14132人目の素数さん:03/09/23 15:48
2元配置分散分析なら青木先生が関数を定義されてますね。
http://aoki2.si.gunma-u.ac.jp/R/twoway-anova.html
1512:03/09/24 16:51
>>14
そうですね。しかし、R(およびS)の標準的な考え方では
summary(aov()) あるいは anova(lm()) で分散分析は
行うのが通常かと。思います。何元配置でも同じような
式を書けば1行でできますんで。
16素人:03/09/24 19:05
2元配置分散分析(間違い)と3元配置分散分析(これも間違い)というのは、
どういう意味で「間違い」なのでしょうか?小生、間違いに気づかずに
普通にsummary(aov(...))で解析していたのでガクガクブルブルなのですが…。
1712:03/09/25 09:26
>>16
ええと... 「この例題のような、1個体から複数データを取った場合では
通常の二元配置分散分析を使ったり、個体番号を第3番目の因子として用
いた三元配置分散分析を使うのは間違い」という意味なのですが..。
上記のホームページのテキストに、「こんな場合に普通の2元や3元使って
んじゃねえよこのヴォケが!」というようなことが書いてあります。
しかし結構むずかしく書いてあるので、もうすこしやさしいホームページ
としては、「ハンバーガーショップで学ぶ楽しい統計学」
http://chiharu.cside4.jp/elearn/stat2002/INDEX.HTM
があります。
第7章(2要因被験者間)が普通の2元配置で
summary(aov(y ~ a * b)) または anova(lm(y ~ a * b))
第8章(2要因被験者内)が2因子とも被験者内での比較なので
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/a + person/b))) が正しい
第8章11応用問題(1要因被験者間、1要因被験者内)は
summary(aov(y ~ a * b)) は間違いで
summary(aov(y ~ a * b + Error(person/b))) が正しい
というふうになると思います。
なので、summary(aov())はError項を正しく指定すれば、被験者内要因があ
っても正しく解析できます。
anova(lm())ではこの解析は不可能で、anova(lme())を用いなくてはならな
いようです。その際にはnlmeライブラリを読み込む必要があります。
18132人目の素数さん:03/10/11 22:37
私は>>3 ではないですが、皆さんが3次元プロット、3次元の関数や密度を
どのように描いているのかは気になるところです。
>>18
全部読んでないけど
scatterplot3d
ってパッケージ知ってる?

18レスぐらい読めよって感じだけど読む気がしない・・・・
20132人目の素数さん:03/10/12 20:23
>18レスぐらい読めよって感じだけど

まあまあ。ところで普通のplotでscatterplotが出来るのに、
scatterplot3d ってのが見当たらないんですが…。
http://stat.ethz.ch/R-alpha/R-devel/doc/html/search/SearchEngine.html

3次元プロットはたぶん>>3 さんのようにするのが普通
(ヘルプに載ってるやりかた)なのでしょうが、
z <- outer(x, y, f)
ってのが気に食わないのでしょうかねぇ?>17
2120:03/10/12 20:25
3次元プロットって、以下の3つしか知らないのですが…。

image()
> x <- y <- seq(-4*pi, 4*pi, len=27)
> r <- sqrt(outer(x^2, y^2, "+"))
> image(z, axes = FALSE, main = "Math can be beautiful ...",
+ xlab = expression(cos(r^2) * e^{-r/6}))

persp()
> x <- seq(-10, 10, length= 30)
> y <- x
> f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
> z <- outer(x, y, f)
> z[is.na(z)] <- 1 # 関数 persp() はNA を受け付けない
> op <- par(bg = "white")
> persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = "lightblue")

contour()
> x <- -6:16
> op <- par(mfrow = c(2, 2))
> contour(outer(x, x), method = "edge", vfont = c("sans serif", "plain"))

他にもあるんですかねぇ?GNUPLOTみたいにplot3dがあってもおかしくないような…。
>>21
レスをよく読んでないんだけど。

ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/contrib/main/

にscatterplot3d
ってパッケージがあるからそれを使えばよし。
Rってそんなもん。どんなもんだ。
文章滅茶苦茶ですまん。読む気がなければ書く気にもなれん。
Rは好きなんだけど・・・悪気はない。すまん。
中澤 港:「Rによる統計解析の基礎」ピアソン・エデュケーション,
2003年10月15日初版第1刷,A5判,183pp.,ISBN4-89471-757-3,
1,800円+税
>>20
http://stat.ethz.ch/R-alpha/R-devel/doc/html/search/SearchEngine.html
はデフォルトで入っているパッケージ群だから後は必要に応じて自分でインストールせなならん。

http://hosho.ees.hokudai.ac.jp/~kato/unix/R.html
ほい、ここでも読み
RでGibbs samplingできますか?
26132人目の素数さん:03/10/15 23:36
>>17

レスどうもです!参考になりました!!
2721:03/10/15 23:42
>>24 さん、ありがとうございます。早速入れて
みました!副産物として>>25 さんの Gibbs sampling
ができるパッケージも発見しました。適当なフォ
ルダに保存してlibrary()で呼び出せば使えそう
です。

解説PDF
http://cran.r-project.org/doc/packages/negenes.pdf

パッケージ
http://cran.r-project.org/src/contrib/negenes_0.98-3.tar.gz
2821:03/10/15 23:45
あと>>22 さんにも感謝!(書き忘れてました…)
22=24だから気にするな。

なんかやる気が起きんのは仕事に疲れてるからだな・・・
↑独り言
>>24
通りすがりですが,
http://hosho.ees.hokudai.ac.jp/~kato/unix/R.html
は役に立ちました.

24さん,ありがとう.
31132人目の素数さん:03/10/18 17:20
24さん、イイ!

library(scatterplot3d) にある scatterplot3d() を利用する。

> data(trees)
> scatterplot3d(trees, type = "h", highlight.3d = TRUE, angle = 55, scale.y = 0.7, pch = 16)

が最高!
32節子さん:03/10/18 18:42
33132人目の素数さん:03/10/20 17:09
中澤 港:「Rによる統計解析の基礎」草稿?
http://phi.ypu.jp/statlib/stat.pdf

「Rを使って統計」の本だけど、「R自体の使い方」の本としては
使えなさそうですね。Rの付属マニュアル(PDF)は英語だし、その日本語
訳は「意味分かって訳してる?」っているレベルだし、統計をあまり
やっていない人がRの使い方を勉強する際にはこれも使えなさそう…。
個人的には>>32 さんが紹介した頁
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r2.html
のPDF版みたいなのが欲しいところですが。
34132人目の素数さん:03/10/22 20:18
じゃ、おねがいします。
35節子さん:03/10/23 20:56
>>33

作ろうか?
今日中にキタ━━━(゚∀゚)━━━━!!!!!があったら
pdfで書いてもいいけど。
3633じゃないけど:03/10/23 22:58
>>35
神キタ━━━━━(゚∀゚)━━━━━!!!!

いや、マジでおながいします。
37節子さん:03/10/23 23:42
>>36
んじゃあ、シコシコTeX打ちする。
論文の合間にでも書くんで、ボチボチと待っててくだされ。
38132人目の素数さん:03/10/25 00:18
すみません

最近Rを知りました。ところで、MathematicaとR、どっちが最強でつか?
39132人目の素数さん:03/10/25 00:39
使い慣れているMathematica

と、言ってみるテスト
40Mathematica:03/10/26 20:23
Rは微分や積分などの解析計算ができないです・・・。
あくまでRは統計解析用のソフト。ただ、代数系の計算
やデータの処理はMathematica(5と比較しても)なんか
比べ物にならない位、速いです。

まあ比べること自体が無理なような気が・・・。Mathematica
じゃヘボい統計計算しかできないし。
Matlabはどうよ?
Mapleし込みのシンボリック計算も出来るし、
行列演算もデータのハンドリングもOKだし。
42132人目の素数さん:03/10/27 02:41
>>40
Mathematicaの場合、データをインポートするだけでもえらい時間が掛かるね
精々数百キロ〜1メガ程度のデータなのにえらい時間が掛かるんだけど
Rの場合、ほとんど一瞬だった
なんとかせい、Mathematica!
43132人目の素数さん:03/10/27 18:32
確かにMatlabは行列計算に長けていますが、C(FORTRANも?)などで
計算部分の高速化を図っているのはRも同じです。
>>40 さんの話にもありますが、Rは高度な統計計算、最近(2000〜)
のアルゴリズムも平気で実装されているところに魅力があるわけでして、
統計パッケージの数が半端ではありません。
(逆にバグフィックスのチェックがあまりなされていないことになりますが)
しかも無料ですし!!
ただ、数式処理ソフトではないので数値誤差がでるのは仕方がないですね。
>>40 さんのご指摘どおり、Rは微分や積分などの解析計算が出来ないので

http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/23.html

みたいなことをしないといけませんし。(↑のプログラムはちと安っぽいですが)
というか、ここのページのPDFを勝手に作って怒られないんですかね?
ま、いいか。Rの精神からいけばオーケーか。
そもそもMatlabっておいくらですの?
45132人目の素数さん:03/10/27 21:05
>> Sで動作するものはRでもほとんど(90%以上)変更な
>>しに動作します.
すいかません。S知らないんでですけど
ぐらいて的にどこがちがうんですか?
長所。短所は?
すいません教えてください
46132人目の素数さん:03/10/27 22:12
R習わなくても、Excelで十分じゃん。
といったら、みんなから叩かれそう。。。でも自分の場合は
Excelで出来ること以上のことをやろうとしたことないので。
Rのメリットって、Excelにないマニアック(自分から見れば
だけど)な統計処理がいっぱい実装されているということ?
皆さんはRにしか出来ない事って、そんなに出くわすのですか?
でくわしまくそ
48132人目の素数さん:03/10/28 20:24
>47
どういうときに?
49132人目の素数さん:03/10/28 20:46
>>43
積分は標準でできますが?
ex)
> f<-function(x){exp(-x^2/2)/sqrt(2*pi)}
> integrate(f,-Inf,Inf)$value
とかやるとちゃんと1って返してくれるよ
混合効果モデル
一般化線形モデル
非線形モデル
ブートストラップ
が必要な時
51132人目の素数さん:03/10/29 19:27
まあ Excel もいろいろ問題は有るが
取っ掛かりとしては無難だと思うよ。

ん〜。1000点以下のデータ自体の
分析には手軽ではないでしょうか。

そのサンプル集団から母集団の推定等を
本格的にする頃には専用ソフトの方を
使えるレベルになっているでしょう。
別にデータの大きさとは関係ない
完全ランダムサンプリングでない場合とか
原因と結果が直線関係とみなせない場合は
すでにExcelは無用の長物。
オマエラ
http://www.amazon.co.jp/exec/obidos/ASIN/4431708219/qid=1067474340/
読んでるか?
Excelだめじゃんという煽りはしたくないのだが、
青木先生のページと、そこのリンク先も見てみてください。
http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

以下、私の考えです。
ただ計算するだけなら、まあいいと思うのですが、
1. 多変量解析にはVBAで書いたアドインソフトが沢山ありますが、
たとえ関数にバグがなくても、数値計算には誤差の集積を避けるために
いろいろノウハウがあり、数式のまんまVBAでつくってあるソフトはどうかな?
と思います。
2.最大の問題は、Excelの関数はどういう計算方法か、明らかにしてないところです。
たとえば、Mathematicaだったら、どういう計算方法か問い合わせすると、
この論文のこのアルゴリズムで、誰がC(など)で書いて発表したものを
使っていると返事がちゃんときます。
Rの場合、それはすっかり公表済みであることが大半です。

なにか分析して、論文に書いて印刷されて、後になって
スマソ、Excelのバグのせいでうそだった。
実は有意差ありませんでした なんて
大変なことになるのは避けたい。

ずいぶん前のことですが、Pentiumのバグのせいで、
いろんな方面で自分の論文の計算結果は大丈夫だったか??
ってちょっとしたパニックが起きました。
55132人目の素数さん:03/10/30 21:12
漏れExcel派なんですが、
そりゃみなさんの言うように、非線形なモデルやブートストラップはできないけど、
そして大量のデータを食わせることもできないけど、でも殆どの場合(統計の入門書
に出てくる程度)はExcelでなんとかなるし、そして現実に直面する問題も統計の
入門書に出てくる程度が殆どじゃないですか?
Excelで出来ない事はMathematicaでやるか、プログラムをガリガリ書いていたし。

何が便利かって、データを編集するのも、グラフ書くのも、色を変えたりするのも、
めちゃめちゃ簡単で分かりやすいじゃない。コマンドとか覚えなくても
いいじゃないですか。そういう“お手軽さ”が統計ソフトにはないから。
別にMSのまわし者ではないけどね。
要するに現実に直面する問題によるってこと。
漏れの場合入門書にちょうど出て来ない程度の問題が、仕事上は多いな。
>>55
の手におえなかった仕事が
>>56
のところに行く。
58132人目の素数さん:03/10/30 23:38
>>57
には仕事もこないと。
59132人目の素数さん:03/10/31 02:08
内部で何をやっているか気にならない人はEXCEL、
内部で何をやっているか気になる人はRなのでは?
>>54 さんのリンクにもありますが、ええ加減な計算をしといて、
それを仕様だと言い張るMSの内部仕様は信用できませんけど、ええ加減な
計算でも不具合が起こらない程度の計算しかしないのならEXCELで良いでしょう。

ところでRで積分できるんだったら微分は出来ます?
60sage:03/10/31 02:13
>なにか分析して、論文に書いて印刷されて、後になって
>スマソ、Excelのバグのせいでうそだった。
>実は有意差ありませんでした なんて
>大変なことになるのは避けたい。

EXCELで計算した時点でrejectされそう・・・。
回帰分析でR^2が負になるらしいね.2乗した値が負て...
62132人目の素数さん:03/10/31 03:41
>>60
Excelで出力したグラフが張り込まれてる論文って結構見るけど?
縄田和満 「Excelによる線形代数」(朝倉) という名著を読めばそんな偏見もふっ飛ぶさ.
最近はExcelで流体力学まで学べるのですよ.
Excelマンセー
>>63
だから「線形」じゃない計算はExcelじゃ難しいんだってばさ。
線形代数ならLispとかpythonもいいかもよ?
ExcelとRの比較って意味小さいよ。市場がちがうんだから。
漏れとしてはSASやJMP使ってる人の、Rとの比較が聞きたい
65132人目の素数さん:03/10/31 15:24
>>64
65535個以上の行データが扱えないExcelなんてRから見ればおもちゃだなw
6654:03/10/31 19:03
>>64
JMP良く使ってます。
この外れ値どれだ?みたいな探索的データ分析は得意ですね。
それから、変数の数がサンプル数よりも多いような
困ったケースでも、とにかく主成分分析できる。
もちろん、統計学的にはまずいのだが、
現実には、それでもとにかく主成分分析を
やって、代表的な変数に絞り込みをしたいときはある。
こういうケースは、普通につくってあるソフトだと、
逆行列が計算できなくて(と思う)、固有ベクトルが求められない。
SPSSはだめ。私がやってみたところ、Mathematicaではでます。
Rのprincompだと、計算をそもそもしません。
まあ、そんなんやらないというのが正しいのではあるが。

使い分けですか?
急ぐ分析レポート類で、定番の手法で分析するだけのときはJMP,
定番の手法でも、やっぱりJMPみたいなパッケージだとフレキシビリティ
たりないね。
自分の研究であれこれやってみるとき、また言うまでもないが
最新の手法を使ってみるときにはRですな。
>>66
おもろい&参考になる
68132人目の素数さん:03/11/01 11:15
>>66
私もJMPを愛用してます。
あとは因子分析さえ付けてくれれば文句無いんですが。
JMPいいなあ。
漏れは検定しかしないんだけど、JMPだと推定/逆推定で
Rじゃ出来ないことができるらしい。
Rだと逆推定は一般化線形モデルのbinomialでdose.p()がある
ぐらいで、それ以上のモデルだとbootstrap使わないと信頼区
間がだせん。
しかし、変数がサンプル数より多いような場合の主成分分析て
どうゆう計算方法でやってるのか、説明書に書いてあるの?
>Rのprincompだと、計算をそもそもしません。

>Rだと逆推定は一般化線形モデルのbinomialでdose.p()がある
>ぐらいで、それ以上のモデルだとbootstrap使わないと信頼区
>間がだせん。

あの・・・、全然そんなことないのですが・・・。
Rは自分で使うパッケージを使う分だけ入れるソフトなんですから。

http://cran.r-project.org/src/contrib/PACKAGES.html
>>70
線形混合モデルの逆推定とその信頼区間が出せるパッケージってある?
あったらすげーうれしいけど..。nlme内にはないとおもうが。
ふかし? >>70
やっぱりCIのある逆推定はdose.pだけじゃないかなあ
たのむよ〜
74132人目の素数さん:03/11/04 20:21
>>70
自分で探せってこと?英語で検索かけるのは面倒だが…。
75132人目の素数さん:03/11/05 02:07
あのー微分できる言語ってなんでしょうか?
ヘスケルでつか
>>60
EXCELで計算した時点でrejectされそう・・・。
>>62
Excelで出力したグラフが張り込まれてる論文って結構見るけど?

グラフじゃなくて関数使って計算させたらってことだろ?
といっても医学薬学関係の論文ならRでも(SASでやらないと)rejectされるだろうが.
まあSASとRを比較するのが間違いだが,強いて言えばSASは古すぎる.
古いがゆえに信頼性は高い(と思われている)が,計算するのに命令書きすぎ.
その点Rはプログラム作成も関数定義もその他諸々楽.それにタダだし.
欠点は上にもあるが,最新のアルゴリズムが搭載されているがゆえバグ多し.
Excel??内部で何やってるか分からない上にバグだらけな関数を使うほど
俺は自信家じゃない.SUMやソート,グラフを描く程度しか使わないのなら
EXCELで十分.セル形式ならRにも(貧相なのが...)あるし。

x <- read.table("sample.dat")
data.entry(x)

ところでJMPってSASを作ってる会社が出してるんだよね?
JMPってどうなの?使いやすいの?俺的には「使いやすくなったSAS」って
いうイメージがあるんだが.

>>71 >>72
自分で探せってことだろ?各々専門分野が違うんだし,>>70 が紹介している
nにはちゃんとpdfでリファレンスがついてるじゃん.

>>75
Mathematica,Maple,Mupad,Maxima...
あとRの関数D()かな?俺は使ったことないから「使える」かどうかは知らないけど.
77132人目の素数さん:03/11/07 02:33
へぇ〜
78132人目の素数さん:03/11/07 20:51
JMPの宣伝に必死だなw
79ど素人:03/11/14 18:31
やっぱり2元配置分散分析の計算方法がわからないです(泣)
63 48 44 76 82
54 62 56 58 74
57 57 47 70 75
のデータの分散分析表の作り方を教えていただけないでしょうかm(__)m
anova(lm())の使い方がよく分からないものですから…
80132人目の素数さん:03/11/14 20:51
81ど素人:03/11/14 23:55
ありがとうございました!!
青木先生は偉大です(><)

ちなみにanova(lm())を使って求めるやり方はどういう風に行えばいいのでしょうか???
82132人目の素数さん:03/11/15 09:24
>>81
>>15 が正しいでしょう。その前後も参照のこと。
83132人目の素数さん:03/11/15 19:43
>>80

lm()の使い方は大丈夫ですか?
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/44.html

上が分かってらっしゃるなら

?anova

で使い方を見れば分かりますよ。
8483:03/11/15 19:53
85132人目の素数さん:03/11/15 19:57
>>83

それって一元配置分散分析じゃないの?
86ど素人:03/11/17 00:12
なるほど。。うーん…
lmは線形モデルによる回帰を行うのですよね?
それでanovaは与えられた数値から分散分析表を求めるもの(?)でいいですよね?
目的変数と説明変数とわかっていればlm(目的変数~説明変数)で回帰係数が出せるのですが
63 48 44 76 82
54 62 56 58 74
57 57 47 70 75
のように目的変数がわからない(?)場合はlm(y~x)のyの部分はどうすればよいのでしょうか??
本当にど素人ですいません…。
87132人目の素数さん:03/11/17 17:02
>>49
感動しました!個人的には20へぇ!
88132人目の素数さん:03/11/17 17:50
>目的変数がわからない(?)

おっしゃりたいことは判ります(笑)。群同士の比較ですからね。
とりあえず>>12 さんが紹介している(↓このn最高)
http://chiharu.cside4.jp/elearn/stat2002/INDEX.HTM
でイメージを掴んでから、青木先生の説明
http://aoki2.si.gunma-u.ac.jp/lecture/TwoWayANOVA/TwoWay.html
を見られたらどうでしょう?すると
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/44.html#19
に書いてあることが何となくわかるような気がします。
89132人目の素数さん:03/11/17 17:59
Rの日本語化パッチがでました!
http://www.okada.jp.org/RWiki/index.php?R%A4%CE%C6%FC%CB%DC%B8%EC%B2%BD%A4%CA%A4%F3%A4%C7%A4%E2%B7%C7%BC%A8%C8%C4#content_1_2

ところで、RのGUIのメニューからCRANに繋いでパッケージをインスコする
方法は知っているのですが、
http://cran.r-project.org/src/contrib/PACKAGES.html
から取ってきたファイルのパッケージを呼び出すにはどうすれば良いのでしょう?
小生、WinXP使っていますが、パッケージが詰まっているフォルダに解凍した
ファイルを置いて library(パッケージ名) としてもエラーが出ます・・・。
「absolute error」

ってなんじゃらほい?
91132人目の素数さん:03/11/18 02:18
>>87
微分もできるよ
ex)
> D(expression(sin(x)),"x")
cos(x)
92132人目の素数さん:03/11/18 22:13
>>91
すげぇ!へぇへぇへぇへぇへぇへぇへぇ・・・
93132人目の素数さん:03/11/18 22:53
>>92
もうMathematicaは、い・ら・な・い!!
94ど素人:03/11/18 22:55
確かにすごいすねー。かなりつかえますねー。

>88
のページはまだ頑張って読んで勉強してまス(汗
>>94
確かに
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r.html
はRについて最もわかりやすい気がする
> D(expression(log(x)),"x")
1/x

> D(expression(3*x^5),"x")
3 * (5 * x^4)

へぇ。ただ、これ以上の具体的な使い方がワカラン。
あまり数式処理能力に期待なさると失望しますよ.
RはMathematicaではありません (MapleでもMatlabでもありません).
Rの本質とは関連が薄いのですから,「そんなのもあるんだ」程度に捉えておいた方が.
98('A`) R. ◆AInRnjuvGo :03/11/20 01:22
数式処理をフリーでやろうと思うなら,

Maxima
http://maxima.sourceforge.net/
Scilab
http://scilabsoft.inria.fr/
Octave
http://www.octave.org/

あたりが妥当では?
99悩める獣医:03/11/20 16:33
+じゃない「元祖」ニュー即から久方ぶりに専門板にきてみたら、間違えて
数学板をクリックしちまった。速攻タブ消そうかと思ったが、なんとなく
スレタイトル眺めてたら偶然このスレ発見。

こんなスレあったんだ。Rのグラフィックス表示で悩んでいたけど
このスレで紹介されてる
ttp://www.okada.jp.org/RWiki/
の参考実例集すっげーいいじゃん。こういう実例がほしかったの。

いやー今日はいい日だ。おまいらありがとう。

勉強してまたくるよ。ヽ( ・∀・)ノ●ウンコー
100132人目の素数さん:03/11/20 19:34
金持ちはS-PLUSを買え。
1011:03/11/20 20:28
>>96 >>97
データを入れたら自動的に解析結果を出力するような関数を作成してるときに、
たまに密度を微分したり、自分で作った密度を積分してp値を出したいときに使えません?
数値積分はまだしも、数値微分は凄まじく誤差が出ますから重宝しますよ。

>>99
仰るとおり、こんなページが出来たのならRの将来は明るいですよぉ〜!
http://www.okada.jp.org/RWiki/

>>100
勘弁してください、20万も払えないっすよ…。パッケージも普通に数万〜数十万しますし…。
102132人目の素数さん:03/11/20 20:30
>>95
来年2月になくなるらしい
103悩める獣医:03/11/21 01:25
というか、獣医ってもっとも統計から縁遠いんだよね。
5群10群あろうが明らかにノンパラであろうが、すべてstudentTだし

漏れ、最初にこのソフトさわったとき、なんだ?このdosみたいな画面はと
思った。恐る恐る>=2*4とかって入力したら、エラーでやがんの。
もうびびったね。正直。ウンコちびりそうになった。で思わず、ベーシックおもいだして
>print"うんこ”って入力したね。そしたら、得体の知れない文字と挙句にエラー
涙がでそうになったね。本当にこれつかえるのか?借金して素直にSPSS買おうかと
104悩める獣医:03/11/21 01:27
で、ようやくマニュアルよんだのね。日本語のpdf。でもちんぷんかんぷんなの。
ああわからない。どうしようとおもったさ。で、>>95のところみながら学んだのさ。
まだぜーんぜんだけど、なんとかなりそうには思えてきた。

で、な、最近texをやろうと思うのさ。獣医ってtexなんて論外の世界なんだけど
ね。これがまたわかんないわけさ。もうたすけてぇーって感じ。
まぁこんな感じだ。ヽ( ・∀・)ノ●ウンコー

というか、ここではhttpのhは抜かなくてもいいのか・・・・?
105132人目の素数さん:03/11/21 01:28
>>103
おまいみたいなのがいることにワラタ
106悩める獣医:03/11/21 01:38
>>105
いやーほめられちゃったよ。まいったな。
お礼にウンコやる
つ●

もうね、すごいんだよ。この業界。きっとみんなが聞いたら発狂するよ。
漏れはいやなの。ちゃんとしたいの。数式にあこがれてるの。
ちゃんと、正規検定とか、多群の比率を検定したいの。

と・・いうか・・・ひょっとして・・・カナーリ場違いなのか?漏れは・・・

イヤーン
おれは、S言語の本を一冊買った。緑色の表紙のやつ。
ツカミ程度の情報しか得られなかったけど、血肉にはなっていると思う。

やっぱ、最初はネットで情報漁るより、本一冊買うほうがためになるよ。
ある程度分かってきたら、ネットだけで勉強できるけどね。
108('A`) R. ◆AInRnjuvGo :03/11/21 01:48
109悩める獣医:03/11/21 02:01
というか、各統計専門のBBSは怖すぎて質問できねぇから
ちょっと質問していい?
可能な限り、自分で勉強はするからさ。回りはだーれもRなんて
つかってないのよ。マジで。

>>108
一応、>>95の教程はおわったつもりだけど、読んだほうがいいかな?
ある程度なら、何も見ずに計算できまつ。
ああベクトルはつかわなさそうなので飛ばしたんですけど・・・

というか、注文しちゃった。金ねぇのになぁ・・・
110132人目の素数さん:03/11/21 02:13
>>106
ってかおまい自体検定してもらったほうがいいかもなw
111132人目の素数さん:03/11/21 02:15
>>109
ってかRもSも本質的な同じなのだが・・・w
112悩める獣医:03/11/21 02:16
>>111
それはわかってますよー

>>110
数学板はきびしいね
(´・ω・`)
113132人目の素数さん:03/11/21 02:18
しかし、Rの書籍が出てからなんか急にRの認知度が高まった気がするんだけど、気のせい?
114悩める獣医:03/11/21 02:26
ttp://www.amazon.co.jp/exec/obidos/ASIN/4894717573/249-6424432-9345152
これでつか?

とりあえず購入しまーす。
115132人目の素数さん:03/11/21 02:35
>>114
購入しなくても著者のページに草稿があるよん
中澤 港「Rによる統計解析の基礎」
http://phi.ypu.jp/statlib/stat.pdf
116('A`) R. ◆AInRnjuvGo :03/11/21 02:35
>>113

RWikiにある記事を考慮すると,

まず

Rで統計はじめませんか
http://slashdot.jp/article.pl?sid=03/07/16/0123201&topic=58

で爆発する土台が出来て,
今回のRの本出版で爆発した,んでは?
117132人目の素数さん:03/11/21 02:40
わしはslashdotは見てないんだが書店はちょくちょく行ってる
書店で初めてRを知った人も多いと思うが、どうか?
118悩める獣医:03/11/21 02:46
>>115
げ・・・ありがとう。早速キャンセルします。

なんか、こんな夜中にありがとうね。
がんばるわ


ヽ( ・∀・)ノ●ウンコー
119132人目の素数さん:03/11/21 02:54
ウンチイラネw
120('A`) R. ◆AInRnjuvGo :03/11/21 03:04
>>117

そのような人も,多いと思います.
何にせよ,ユーザーが増えるのはいいことだと思います.
ところでみなさん、利用してるOSはWin?Linux?
>>121

MacOS X...
edit()がきれいでよいです。
123132人目の素数さん:03/11/21 22:28
Linux版Rは面構えがWin版とは違うのですね。
クノーピクス上ではじめて知りました。
124132人目の素数さん:03/11/21 22:29
Linux版Rは面構えがWin版とは違うのですね。
クノーピクス上ではじめて知りました。
125132人目の素数さん:03/11/21 23:31
SASって個人で使えねーの?
>>125

Webでは値段表とかでてませんが、1-2年前にどっかでみたときには,
まぁ普通の個人で手が出せるお値段ではなかったと思うです。
しかもたしか年間使用契約で買い取りはできなかったような。
SPSSとかS-PLUSのおねだんならなんとかなるかもしれませんが...SASを大学とかで
勉強しても就職先で実際に使用できなくて泣く人も多いかもね。
127132人目の素数さん:03/11/22 09:27

パッケージを増やすたびに値段が違うらしい
確か基本的なパッケージだけで年間契約15万円以上したかな
それだけで四則演算はできたはず
SASを個人使用したい奴なんかいるのか?
あんな糞ツール大規模データマネジメントしか使いようないべ。
129132人目の素数さん:03/11/22 19:58
>>128
同等なことがRで十分できるんだからS系を使うメリットはほとんどないと思われ
130132人目の素数さん:03/11/22 21:42
バージョンアップ版が出てます
R-1.8.1
http://cran.r-project.org/
131132人目の素数さん:03/11/23 01:47
SASをMXで流せ
132132人目の素数さん:03/11/25 00:30
age
論文を書く上で、審査員に解析したプログラムのソフト名を聞かれないんだったら
SASは要らないと思われ。パッケージの信頼性以外、使うメリット梨。SASはコマンド入力が面倒すぎ!
ようやくS-PLUSのパッケージ群も信頼性が出だしたが、いかんせん値段が…。けどS-PLUSが認知されだしたら
「学校や会社ではS-PLUS、家ではR」
ということが出来るメリットはあるかな。
134132人目の素数さん:03/11/26 02:13
>>130
なかまさん、もう日本語化パッチを作ってますね・・・。
http://www.okada.jp.org/RWiki/?R%C6%FC%CB%DC%B8%EC%B2%BD%A5%D7%A5%ED%A5%B8%A5%A7%A5%AF%A5%C8
135132人目の素数さん:03/11/27 06:33
136132人目の素数さん:03/11/27 20:46
>>135
おそらくここのnの和訳ですよね?
http://cran.r-project.org/src/contrib/PACKAGES.html
只今、↑から.tar.gzファイルを拾ってきて、以下のマニュアル
http://buran.u-gakugei.ac.jp/~mori/LEARN/R/R-admin-jp.v15.pdf
を見ながらパッケージをインストールしようと思っているのです
が、どうも上手くいきません…。updateじゃなくて圧縮ファイル
からインストールすることって出来ないんですかね?
>>136
suになってから,
# R CMD INSTALL hoge/hogehoge.tar.gz

まずは,man R CMD してみましょう。
>>137
>まずは,man R CMD してみましょう。
R CMD INSTALL --help
の誤りでした。
139136 <- 厨:03/11/28 20:54
すいません、OS書くのを忘れてました…。Win環境でRやってます。
UNIX or Linux ではないので、man が使えないんです…。
RjpWikiに行ってみたら?
Win版で
Alt+p
のサブメニューで解決できないのなら、
どのような状態にあるのでしょうか?
142132人目の素数さん:03/11/29 01:10
>>139
Windowsならupdateは超簡単だよ
RGuiのメニューで[Packages]から[update packages from CRAN]を選択すれば
自動的にアップデートされます。
base以外のパッケージを入れたい場合は同じ[Packages]から[Install package(s) from CRAN]
か[Install package(s) from zip files...]を選べばOKです。
143132人目の素数さん:03/11/29 21:55
>>35 >>37
(-Д-) PDFまだぁ〜?
描画がずっと速やなったやん。
1.8.1>1.7.1


145132人目の素数さん:03/11/30 15:56
すみません、質問です。

グラフを描く際、凡例中の数式に変数値を割り当てるにはどうすれば良いのでしょうか?
例えば
frame();legend(0,1,expression(frac(a,b),frac(c,d)),lty=c(1,1),y.intersp=2)
のように入力すると分数表示でa/bとc/dが縦に並んで表示されますが、このaなどの文字を
変数値で置き換えて表示させたいのですがどうやれば良いのでしょうか?

よろしくお願いいたします。
>>145
自分で新に関数を定義すればできると思います。
以下は直接の解ではないけど参考になれば。
myplot <- function(x){
xx <- length(x)
plot(x,main=c("number of samples:",xx))
}
y <- rnorm(100)
myplot(y)
>>145
146のつづき。
a,bに何を代入したいかにより,xx <- length の部分を書き改めましょう。
aがベクトルの合計値なら a <- sum(x)とかね。
ここからのポイントは,プロットしたいデータオブジェクトがどんなものなの
か,そのデータのどういう要素を用いて,a,b,c,dを定義したいのかどうか,
ということになりますね。

148132人目の素数さん:03/11/30 23:19
>>146-147
回答ありがとうございます。実はその方法だと凡例の中での数式に値を与えることは
できません。expression内でfracという分数を表現する数式が利用できるわけですが
そのときaやbは文字として認識されてしまうので、いくらexpressionの部分を関数で
定義しても結局expressionを使う限りにおいてはaやbの部分を数値に置き換えることは
できません。expression以外でfracのような数式表現が利用できて変数値も数式中に
利用できるような例があれば嬉しいのですが・・・
>>148
146です。
よく知りもせず口を挟みましたが,挟みついでに。
frac()の正体はなんでしょう?Rの関数ではないようですが。

>>147
MASSパッケージのfractions関数は使えそうでしょうか?
>>147
frac()が曲者なんで,正統な方法ではないと思われるが,下のような代入を応
用してはどうか?

> ex1 <- expression(frac(x,y))
> ex1
expression(frac(x, y))
> ex1[[1]]
frac(x, y)
> ex1[[1]][[2]]
x
> a <- 1
> b <- 2
> ex1[[1]][[2]] <- a #代入
> ex1[[1]][[3]] <- b #代入
> ex1
expression(frac(1, 2))
152136:03/12/01 17:54
frac()の話途中ですいませんが…、例えばscatterplot3dパッケージを
取ってきた際に、まず

.tar.gz -> zip

と圧縮形式を変えてから、Rのメニューから

Package -> Install from local .zip ...

を選択すると

> install.packages(choose.files('',filters=Filters[c('zip','All'),]), .libPaths()[1], CRAN = NULL)
updating HTML package descriptions

と出るので一見、上手くいったのかなと思いきや、

> local({pkg <- select.list(sort(.packages(all.available = TRUE)))
+ if(nchar(pkg)) library(pkg, character.only=TRUE)})
Error in testRversion(descfields) : This package has not been installed properly
See the Note in ?library

というエラーが出てしまいます。仕方がないので scatterplot3d.R を
直接読み込んでいる有様なのですが、よい善処法があればお教え願います。
>152
Windows版用ならこのあたりで入手できます。

ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN/bin/windows/contrib/1.8/scatterplot3d_0.3-14.zip


154132人目の素数さん:03/12/02 06:49
>>152
> .tar.gz -> zip
>
> と圧縮形式を変えてから、Rのメニューから
ってかこれ自体おかしいだろ
Rのメニュー[Package]から[Install Package(s) from CRAN...]を選択するのが
一番楽だと思うぞ。CRANにある好きなパッケージが一覧から選択して簡単にダウンロード
&インストールしてくれるわけだから。
155132人目の素数さん:03/12/02 06:54
>>154(続き)
一度インストールしたパッケージは次回からRのメニュー[Packages]から
[Load package...]を選択すれば一覧の中に表示されているのでそれを
選択して取り込むことができます。
156悩める獣医:03/12/02 11:43
だいぶパワーアップしてきた
157132人目の素数さん:03/12/03 11:14
>>149
epressionの中だけで利用できる数式表現で分数を表します。
>>145
自己解決しました。substituteを使えばできます。例えば、
expr<-substitute(paste(frac(a,b),sum(frac(c,k),k==1,n)),list(a=1,b=2,c=3,n=100))
として
frame();legend(0,1,expr,bty="n")
とかするとaやnが数値に置き換わった数式が表示できます。
158132人目の素数さん:03/12/03 12:57
159132人目の素数さん:03/12/03 21:29
>>153-155

解決しました!>>153 さんのファイルをDLしたら、普通にインストールできました。
***.tar.gz はwinでは使えないんですね。
160age:03/12/08 21:03
age
161132人目の素数さん:03/12/09 10:50
時系列に対して変量回帰を当てはめた場合の分散分析は
summary(aov(a ~ b + c + poly(d,3)))でいいんでしょうか?
(a:評価値、b,c:母数効果、d:時系列)
162132人目の素数さん:03/12/14 05:44
14
163132人目の素数さん:03/12/16 22:56
plot関数で
プロットの点(type='p')の大きさを変えることはできますか?

デフォルトでは大きすぎます。
>163
plot(....,pch=数字)ではいかがですか?
165132人目の素数さん:03/12/19 14:30
 任意小数に小数点以下何位まで含まれているか(精度)が知りたいです。
例えば12.2なら指数表記では122e-1だから1位。12.20は1220e-2なので2位。

 文字列に変換して小数点「.」の右側の文字数をカウントするのはおもしろくないので、
そのまま使える関数とかはありませんか?
167132人目の素数さん:03/12/21 20:37
Rで関数定義を行う際に、局所変数や局所的な配列が使いたいときってどうすればよいのでしょうか?
168132人目の素数さん:03/12/22 23:52
これって擬似逆行列とかって
求められますかね?

どうも因子分析できなくて
169132人目の素数さん:03/12/24 21:55
>>168
ここの「一般逆行列を求める方法(ムーア・ペンローズ型一般逆行列)」をご覧下さい。
http://www.sigmath.es.osaka-u.ac.jp/~n-funao/r/16.html#09
170132人目の素数さん:03/12/28 21:34
>>167
そんなことは気にしなくてよいはずです。
171132人目の素数さん:03/12/31 21:46
帰無仮説:ボブサップが曙に負ける
対立仮説:ボブサップが曙に負けない

を有意水準5%で検定したいのですが、どうすればよいでしょうか?
172132人目の素数さん:03/12/31 22:02
>>171
あと1時間半後に誰かがレスするんじゃない?
173132人目の素数さん:03/12/31 23:04
>>171
有意水準0.001%で検定しましたが,帰無仮説が棄却されました.
よって対立仮説が棄却され,「ボブサップが曙に負けない」と
結論付けられました.

それではよいお年を.
174132人目の素数さん:04/01/04 23:24
age
ここは棄却されまくりなスレでつね
176132人目の素数さん:04/01/12 21:38
LifeCycleSavings のデータを、変数srを目的変数として重回帰分析したら、寄与率が33%とか出た・・・

> data(LifeCycleSavings)
> ls.print(lsfit(LifeCycleSavings[,-1],LifeCycleSavings[,1]))
Residual Standard Error=3.8027
R-Square=0.3385
F-statistic (df=4, 45)=5.7557
p-value=8e-04

Estimate Std.Err t-value Pr(>|t|)
Intercept 28.5661 7.3545 3.8842 0.0003
pop15 -0.4612 0.1446 -3.1885 0.0026
pop75 -1.6915 1.0836 -1.5610 0.1255
dpi -0.0003 0.0009 -0.3618 0.7192
ddpi 0.4097 0.1962 2.0882 0.0425

レポートで出てるんだけど、考察書くとしたらどう書けばいいの?
「寄与率がこのように低くなってしまったのは、○○だからだと思われる」の○○って、どう書けば・・・
ちなみに、
sr・・・貯蓄額
pop15・・・15歳以下の人口比率
pop75・・・75歳以上の人口比率
dpi・・・可処分所得
ddpi・・・dpiの伸び率
177132人目の素数さん:04/01/13 18:00
>>176
ここには変数ごとのt-test結果が張っていないけど、
t-testで棄却されていない変数を落として重回帰を
やり直したらRの値が増えるんじゃない?
AICとかで測って変数を減らしてもいいだろうけど。
178132人目の素数さん:04/01/24 21:15
Rで多変量のスプライン回帰がやりたいのですが、いいパッケージありますかね?
普通のsplineは(x,y)の場合しかできないもので・・・。
160
180竹澤:04/02/02 10:48
>Rで多変量のスプライン回帰

 gcvpack.dll がRでもS-Plusでも使えます。
以下のWWWページの(114)で公開されています。

http://cse.naro.affrc.go.jp/takezawa/smooth-7.html
>>176
○○=「適切な変数を投入できなかった」

>>177
どんなクソ変数であっても,それを落としたときに
Rの値が増えることはあり得ないと思うが気のせい?
182132人目の素数さん:04/02/02 18:54
ほしゅ
183132人目の素数さん:04/02/02 18:55
ほっしゅ
184R-Tips”管理”人:04/02/03 22:11
私は節子さんではありませんが、論文の合間にシコシコTeX打ちして
R-TipsのPDF版を作りました。
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf
ついでにR-Tipsのhtmlも改訂しました(注:移転しています)。
http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
良かったら御覧下さい。
185132人目の素数さん:04/02/06 00:24
>>184
R初心者(統計自体始めたばかり)ですが、早速いただきました。
ありがとうございます。じっくり読ませていただきます。

大作ですので、プリントアウトだけでも一仕事ですな。w
Rのコマンドライン履歴って .Rhistory に格納されますよね.
長くなってきたらエディタとかで勝手に上の方を削ってしまって問題ないのでしょうか.
>186
試しに削ってみたけど大丈夫みたいだったよ
188186:04/02/07 17:50
>>187
やっぱり大丈夫ですか.私もやってみましたが,判断にはサンプルの数が必要だと思いまして.

どうでもよい変数を何度も表示したりしてると,
次にワークスペースを回復したときに履歴から重要な入力が辿り辛いんですよね.
189132人目の素数さん:04/02/08 22:30
>>184

キター!!!
190132人目の素数さん:04/02/10 22:19
3次元の2ベクトル a,b が張る平面を描画するプログラムをつくれますか?
191132人目の素数さん:04/02/11 00:26
使わないライブラリも全部入れて毎日アップデートするのが日課でつw
>190
scatterplot3dがお役に立つと思います。
>191
CRANからのアップデートは簡単でよろしいですな。んでも、新作ライブラリーはどうしてます?
194132人目の素数さん:04/02/19 21:37
RjpWikiをみる。

>>184

いいぞっ!
195132人目の素数さん:04/02/23 22:56
>>193

update.packages() で解決します。また
read.dcf(file=system.file("DESCRIPTION",package="tree"))
でパッケージの情報の取得が可能です。dcfはdebian control format の
事ですが、Windowsでも使えます。
196132人目の素数さん:04/02/27 11:48
あげ
197132人目の素数さん:04/02/28 14:18
ESS使ってる人いますか?
.emacs.elの中でどうやって設定しているのでしょう?

(load "usr/lib/..../lisp/ess-site")
で設定すると使いもしないのにいつも不要なバッファは生成されて困っています。

RというよりEmacsの質問になると思いますがアドバイスお願いします。
198132人目の素数さん:04/03/04 21:59
Emacs+ESS+Rを利用してます。emacsでRファイルを編集するとき、コメントマーク「#」の数により、その行の色を変更できると便利ですよね。
とりあえずの対処療法として、

M-x hi-lock-mode
M-x highlight-regexp [RET] ### [RET] hi-red-b
M-x highlight-regexp [RET] ## [RET] hi-green-b

などとしてます。(順序が大事)
889
200132人目の素数さん:04/03/09 03:54
200
sage
202132人目の素数さん:04/03/17 17:44
R統計システムについてのよくある質問
ttp://www.cbrc.jp/~tominaga/translations/R/FAQ.txt
やっぱりlisp-statでしょ
204132人目の素数さん:04/03/17 23:18
lisp-statとRは作者が一緒ですよ.
205132人目の素数さん:04/03/20 04:58
R 1.9.0 alpha 版が出ました!
206132人目の素数さん:04/03/26 03:10
>>205
おっ、出たの!で、どんな機能拡張があったの?
207132人目の素数さん:04/03/27 00:55
・計算速度がUP(MCMC 法の実行時間が R 1.8.1 より4倍(!?)近く早くなったとのコメント)
・アンダースコアを変数名に使えるようになる
・標準ライブラリの構成が大きく変わる

だそうです.
r
javaとの連携の情報,どこかにない?
R 1.9.0
>> 209

RjpWikiの「RとWebサービス」のRSOAPを使ってやるのがいまのところ
Java的には一番美しい方法かも。ほかはJNIっぽい...
1.9.0リリースキタ━━━━━━(゚∀゚)━━━━━━ !!!!!
とりあえずシコシコビルド中。
213132人目の素数さん:04/04/18 00:51
RでX11やX12等の季節調整ができる関数なんぞありますか?
214132人目の素数さん:04/04/20 22:57
時系列?なら ts パッケージがありますよ.
215132人目の素数さん:04/04/29 17:16
tsパッケージは少し弱い。
arima.predict さえない。
216132人目の素数さん:04/05/01 12:22
Rで待ち行列シミュレーションのプログラム書いた人いませんか?
R-Wikiの方ででも公開してください。おながいします。
217132人目の素数さん:04/05/01 22:54
218132人目の素数さん:04/05/08 19:43
The R Book 期待あげ
219132人目の素数さん:04/05/08 22:13
The R Book 楽しみにしてるんだが、いったいいつ出るのだ。
5月末には書店に並ぶと思われ <RjpWikiより
221219:04/05/09 00:11
>220
サンクス。今、見てきた。

> 出版時期: 5月末発売予定
> 出版社: 九天社
> 価格: 税込み3900円(本体価格3800円)の予定
> B5変型版/448頁(予定) CD-ROM付

むー、正直CD-ROMはイラナイ。
スレ違いスマソ。

MuPADに関する質問はどこでするのが最適ですか?
223132人目の素数さん:04/05/09 01:33
>221

本文中で使ってるデータとかが収録されててスグ試せるならいいかも >CD-ROM
224132人目の素数さん:04/05/11 00:56
>221

ならこれはどうよ?無料だし、もちろんCDはついてないし。
http://cwoweb2.bai.ne.jp/~jgb11101/files/r-tips.pdf
225221:04/05/12 00:46
>>224
いいねぇ。
R-Tipsのページは知ってたけど、PDF版もあったとは。

欲を言えば、多変量解析の部分をもっと充実させて欲しい。
因子分析とかk-means法のクラスタ分析とかSEMとか。
>>222
最強!!数学ソフトウェア(maple, mathcad etc)
http://science2.2ch.net/test/read.cgi/math/1051275230/

やや荒れ気味かも
227132人目の素数さん:04/05/21 00:31
>> 225

載ってるジャン。コマンド名さえあればヘルプを見ればいいっしょ。
228221:04/05/25 00:15
みなさん、The R Book は手に入りましたか?
229132人目の素数さん:04/05/25 00:35
池袋のジュンク堂で買ったよ。
230132人目の素数さん:04/05/26 13:52
思ったより分厚かったのと、立ち読みして読みやすかったので買いました。
皆さん顔写真入りで砂。
232132人目の素数さん:04/05/30 20:58
curve関数の質問です。

例えば指数分布関数
dexpを描画したいときにはどうすればいいのでしょうか?

イメージ的には

curve ( dexp(rate=3) )

としたいのですが・・・
こんな感じでしょうか?

curve(dexp, from=0, to=3)
234132人目の素数さん:04/05/30 22:00
>>233
レスありがとうございます。

ただ、それでは
dexp関数のパラメータ rate=3
を反映することが出来ていないと思うのですが・・・
235132人目の素数さん:04/05/31 00:12
失礼.

curve(dexp(x, 3), from=0, to=3)
おかげさまで出来ました。
[curve]と引数を与えないでソースを見てさらに納得しました。
待ち行列パッケージなんてあっても良さそうだね。
つくろかな。

もうあるような気もするが・・
238132人目の素数さん:04/06/02 17:33
初心者です。
Rの用語集とかないですか?
239132人目の素数さん:04/06/02 20:34
240238:04/06/03 16:02
>>239
ありがとうございます。
241132人目の素数さん:04/06/09 21:42
age
242132人目の素数さん:04/06/14 20:43
R 1.9.1 alpha が出ましたね.
243132人目の素数さん:04/06/17 17:34
関数の使い方は分かるんですが、
その仕組みや構造そのもの(例えば数式、理論など)を
知りたいときは何を見たら分かるのでしょうか?
244132人目の素数さん:04/06/18 00:25
(1) 関数名をそのまま入れる

> var

(2) ヘルプを見たり,ヘルプの参考文献を見たりする

> ?var
245助けてください・・:04/06/22 00:16
例数不揃いのときのNested-ANOVAってどうすればいいんでしょうか?
ヘルプ読んでもnested-anovaにヒットしない・・・
ネットでも例数が揃っている場合しか見つからないんです。

x y z
a i 3
a i 4
a j 4
a j 1
a j 6
b i 5
b i 2
b i 7
b j 3
b j 2

>summary(lm(z~x/y))
でやったら、SASとかSPSSと答えが微妙に違う・・・


246助けてください・・:04/06/22 00:36
すいません
summary(aov(z~x/y))の間違いです。どのみちダメでした。
247リンク集:04/06/23 00:08
WindowsのRでxgobiはどうやって入れたら良いのでしょう。
Xを立ち上げないと駄目?
249132人目の素数さん:04/06/27 14:48
>>248
こんな感じですか?
http://su10.sgu.ac.jp/~jin/R/08.html
250132人目の素数さん:04/07/06 18:26
187
Vine linux 2.95にR-1.9.1をソースからコンパイルしてインストールしました。

ところがRを実行し終了しても.Rhistoryが作成されず、入力履歴が残らないんですけど、
入力履歴を保存するようにするには何か設定が必要なのですか?
ちなみに.RDataはちゃんと保存されています。
>>251
自己レスです。
readline-develをインストールしてからRをbuildしなおすことで
解決できました。

お騒がせしました。
253132人目の素数さん:04/07/12 20:53
今日はシステムに対する世界観が変わりました。

x1 = 0.5 - 0.3
x2 = 0.3 - 0.1

x1 == x2
FALSE

になるのは仕方ないのでしょうか?
機械誤差というところまでは解ったのですが、
完全に理解しないと、この先やっていけない気がしました。

抽象的な質問ですがよろしければ、ご教授下さい。



255132人目の素数さん:04/07/12 22:50
>>253
R では == で実数を比較しない方が良いのでは?identical()を使って下さい.

> x1 = 0.5 - 0.3
> x2 = 0.3 - 0.1
> x1-x2
[1] 2.775558e-17
> identical(all.equal(x1,x2),TRUE)
[1] TRUE
256132人目の素数さん:04/07/13 14:06
257132人目の素数さん:04/07/28 08:54
621
>>253
システムに対する世界観が変わるほどの問題じゃないぞw
これはCでも同じ。普通は

x1 - x2 < 小さな数

として処理するところ。
259258:04/08/03 01:42
ぬお、絶対値付け忘れた。
260綺麗だなぁ:04/08/08 22:59
x <- seq(-10, 10, length= 200)
y <- x
f <- function(x,y) { r <- sqrt(x^2+y^2); 10 * sin(r)/r }
z <- outer(x, y, f)
z[is.na(z)] <- 1
persp(x, y, z, theta = 30, phi = 30, expand = 0.5, col = rainbow(200), border=NA)
261132人目の素数さん:04/08/11 22:29
今だ!R2.0.0ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ
262132人目の素数さん:04/08/14 02:19
"2004-08-14 01:03:12" といった文字列を整数にするには、どうしたらよいで
しょうか。as.Date()のようにフォーマットが指定できて、時間も処理できる
関数ってありますか?
μ秒も処理できるとなおよいです。
> ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16")
> t <- as.Date(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"


263132人目の素数さん:04/08/14 02:25
なんだかnlmeパッケージのアップデートが失敗するんですが
みなさんうまくいってますか?
264263:04/08/14 02:28
あっ、今やったらうまくいった!
昼やったときは途中でエラー出てたのに・・・
265132人目の素数さん:04/08/14 12:22
>>262

>"2004-08-14 01:03:12" といった文字列を整数にするには

「整数」の基準が良く分からないのですが,例えば1900年1月1日00:00:00を
基準にして何秒たっているかを秒で表示するということでしょうか?

> as.Date()のようにフォーマットが指定できて、時間も処理できる関数

の「フォーマットが指定」の意味が良く分からないのですが….
266132人目の素数さん:04/08/15 23:37
>>265
以下のstrptime()のようなもの。tが整数かどうかは、不明。
> ct <- c("2004-08-14 01:03:12", "2004-08-14 01:03:14", "2004-08-14 01:03:16")
> t <- as.Date(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 00:00:00" "2004-08-14 00:00:00" "2004-08-14 00:00:00"
> t <- strptime(ct, "%Y-%m-%d %H:%M:%S")
> format(t, "%Y-%m-%d %H:%M:%S")
[1] "2004-08-14 01:03:12" "2004-08-14 01:03:14" "2004-08-14 01:03:16"
267132人目の素数さん:04/08/22 00:11
age
268132人目の素数さん:04/08/29 17:17
890
269132人目の素数さん:04/09/05 07:10
182
270132人目の素数さん:04/09/10 05:57
559
271132人目の素数さん:04/09/10 06:26
272132人目の素数さん:04/09/15 03:59:17
思わぬ失敗
> a<-c(-5,1,-2,3,4)
> a[a>2]
とすると
[1] 3 4
となりaでa>2を満たすものが抽出されるけど、同じ調子で
> a[a<-2]
とするとaに2が代入され初期化されてしまう。正しくは
> a[a<(-2)]
としないとダメ。結果は
[1] -5
となる。
273132人目の素数さん:04/09/18 10:05:24
MUSASHIとRって相性良いと思う?
274132人目の素数さん:04/09/22 08:02:27
summary()の結果をファイルに落としたい時にはどうしたら良いの?

275132人目の素数さん:04/09/22 21:33:59
sink()
でよいかな。
276274:04/09/23 11:19:25
>275
Thanx! 助かりました!

sink("sink-examp.txt")
summary(x)
sink(NULL)
ですね.

?sinkのexampleにあるように"sink()"ではsink-ingが止まらず,
"sink(NULL)"しないとだめでした
[R-1.9.1 win32]
277132人目の素数さん:04/09/28 02:49:12
310
278132人目の素数さん:04/09/29 22:30:21
DBI パッケージとどのパッケージを組み合わせれば
PostgreSQLを扱えるのでしょうか・・・・・

いくら探してもPostgreSQL用パッケージだけが見つからないのです。
279132人目の素数さん:04/10/02 12:24:01
280132人目の素数さん:04/10/02 12:27:25
rpgsqlは開発が終わってますよね。

ふと思ったのですがRDBIとDBIは同一パッケージなのでしょうか?
281132人目の素数さん:04/10/02 12:28:58
いや、別物でした。
RDBIの後継がDBIになるわけで・・・
282132人目の素数さん:04/10/02 15:24:41
283132人目の素数さん:04/10/02 22:30:10
rdbiも古いのではないでしょうか?
それともpostgresと連携したければ、
dbiではなくrdbiを使わないといけないのでしょうか?
284132人目の素数さん:04/10/02 22:55:58
RODBCが汎用性からいえばよいのではないでしょうか。
The R Bookの第4章にいろいろ情報がありますね。
285132人目の素数さん:04/10/03 12:30:25
Linuxで使ってるので、ODBCには少し抵抗感があったりします。
しかし、dbiがpostgresqlをサポートしていないようなので
とりあえずODBCを使わせてもらうことにしました。

レスありがとうございました。
286132人目の素数さん:04/10/03 15:14:10
ESSの補完バッファが鬱陶しいのですが
役割が終わったら、役目を果たせなくても閉じてくれるような
設定にすることはできませんか?
287132人目の素数さん:04/10/04 22:11:52
モジュールのインストールがうまくいかないよ
最近インストールに失敗するモジュールが増えた?
288132人目の素数さん:04/10/08 00:20:51
いつの間にか、Help → HTML Help → Search Engine & Keywords が使えなくなってる。
WindowsXPのSP2のスクリプトブロックが原因かな、と思う。
でも、IEのセキュリティオプションで片っ端から「有効」に設定してもダメ。

誰か同じ問題に困って、解決出来たひと、います?
289132人目の素数さん:04/10/08 06:42:02

 R-2.0.0 キター----!
290132人目の素数さん:04/10/08 23:41:18
まじっすかワーイヽ(゚∀゚)メ(゚∀゚)メ(゚∀゚)ノワーイ

釣りじゃないよね(´・ω・`)
291132人目の素数さん:04/10/09 00:45:21
釣りじゃありませんっ!

なかまさんのサイト(Win,Vine)
http://r.nakama.ne.jp/R-2.0.0/
292132人目の素数さん:04/10/09 01:42:25
どう変わったのかな
調べる気力が起きん・・・('A`)
293132人目の素数さん:04/10/09 11:32:19
294132人目の素数さん:04/10/10 22:33:19
WindowsでESSを使うにはどうしたらいいんですか?
295132人目の素数さん:04/10/10 22:35:31
>>294
Meadowというエディタを入れれば使えるけど
そこまでしてESS使う必要ないと思うよ。
費用対効果が悪すぎる。*nix全般を覚える必要に迫られるから。

R-2.0はESSに負けないエディタが付属しているみたいだから,
そちらを調べたらどうでしょうか?
296132人目の素数さん:04/10/10 22:51:08
グニュー
297あぼーん:あぼーん
あぼーん
298LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 14:34:48
Re:>297 捏造すんな。
299132人目の素数さん:04/10/11 15:55:13
>>297-298 スレを荒らすな!自作自演はもうウンザリだ!
300LettersOfLiberty ◆rCz1Zr6hLw :04/10/11 17:32:13
Re:>299 お前は普段から汚いことしてるから私が自作自演していると思うんだろうな。
301132人目の素数さん:04/10/13 22:40:59
WinのRをインストールしました。
パッケージなどをダウンロードするために、
Rのショートカットを右クリックして、リンク先の最後に--internet2とつけたいのですが、
http://www.okada.jp.org/RWiki/index.php?cmd=read&page=Windows%C8%C7R%A4%CEFAQ&p=3 参照)
「パス名が無効です」というエラーがでてしまうは何故ですか?教えてください。
302132人目の素数さん:04/10/14 00:24:37
>>288
自己レス。
困ってたのは俺だけか...

明示的にJavaのランタイムをインストールしたらOKになった。

...今までいろんなPCで使ってきたけどJavaの存在を全く意識してなかった。
実はなにげにJava入れとったのかしらん。

ついでに、IEオプション詳細設定で、「マイコンピュータのファイルでの
アクティブコンテンツの実行を許可する」にチェックを入れておくと、
いちいち承認を求めてこないので、ややスッキリ。

R2.0.0 Patched / WindowsXPSP2でした。
303132人目の素数さん:04/10/14 07:31:33
復刊にご協力下さい。

竹内啓,柳井晴夫 多変量解析の基礎 東洋経済新報社
http://www.fukkan.com/vote.php3?no=22328

統計学を専門とする人ではなくとも、
多変量解析を使うときに手元に是非置いておきたい名著。
多変量解析の基礎理論がわかりやすくかつ体系的に厳密に展開されていきます。
多変量解析に関するこれだけの名著は未だに出ていないと思います。

よろしくお願いします。
304132人目の素数さん:04/10/15 11:58:06
>> 301
オプションはダブルクォーテーション ("")を一旦閉じてから書かないと駄目です。
つまり,
"C:\Program Files\R\rw2000\bin\Rgui.exe" --internet2
とすれば良いはず。
305132人目の素数さん:04/10/15 13:04:24
             /⌒ヽ,  ,/⌒丶、       ,-
       `,ヾ   /    ,;;iiiiiiiiiii;、   \   _ノソ´
        iカ /    ,;;´  ;lllllllllllllii、    \ iカ
        iサ'     ,;´  ,;;llllllllllllllllllllii、    fサ
         !カ、._  ,=ゞiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii!! __fカヘ.
       /  `ヾサ;三ミミミミミご彡彡彡ミヾサ`´ 'i、
       i'   ,._Ξミミミミミミき彡/////ii_   |
       |  ;カ≡|ヾヾヾミミミミミぶ、//巛iリ≡カi  |
        |  iサ  |l lヾヾシヾミミミミり|ii//三iリ `サi  |
       |  ,カ ,カll|l l lヾリリリリリ川川|爪ミミiリllカ、カi  |
        |  ;iサ,サ |l l l リリ川川川川|爪ミミiiリ サi サi  |
        |   iカ ;カ, |l l リリリリ川川川川l爪ミミilリ ,カi カi  |
       |  iサ ;サ, |リ リリ川川川川川l爪ミミiリ ,サi サi  |
       |  iサ ;iカ, | リ彡彡川川川川|爪ミミiリ ,カi :サ、 |
       ,i厂 iサ, |彡彡彡彡ノ|川川|爪ミミリ ,サi `ヘ、
      ,√  ,:カ, |彡彡彡彡ノ川川|ゞミミミリ  ,カi   `ヾ
     ´    ;サ,  |彡彡彡彡川川リゞミミリ  ,サi
         ;カ,  |彡彡彡彡リリリミミミシ   ,カi
         ,;サ,   |彡彡ノリリリリミミミシ    ,サi
        ;メ'´    i彡ノリリリリリゞミミシ     `ヘ、
       ;メ      ヾリリリリノ巛ゞシ       `ヘ、
      ;メ        ``十≡=十´         `ヘ、
                 ┃   ┃
                 |  |
                /     \
              /         \
             /            \
306301:04/10/15 21:32:17
>304
間にスペースが必要だったんですね。
目からウロコです。助かりました。
どうもありがとうございました!
307132人目の素数さん:04/10/24 03:40:38
589
308132人目の素数さん:04/10/30 12:01:20
153
309132人目の素数さん:04/11/04 03:10:40
RjpWikiQ&A(初心者コース)の冒頭にある
「 マニュアル : http://buran.u-gakugei.ac.jp/~mori/LEARNR Data Import/Export/R/ 」
がリンク切れなのだがどこへ行けばいいのだろう
310132人目の素数さん:04/11/04 10:14:51
なおしときました
311309:04/11/04 20:56:34
ありがとうございます>>310
312132人目の素数さん:04/11/09 03:20:07
287
313NK:04/11/11 16:56:35
バージョンを2.00にしてRODBCもバージョンを1.1−2に更新したら
今まででsqlSaveコマンドでACCESSに結果を書出していたのが、”Error in gsub
(pattern,replacement,x,ignore.case,extend invalid regular expression"
というエラーメッセージが出てきて動かなくなってしまいました。
どなたか、解決方法をご存知ないでしょうか?
314132人目の素数さん:04/11/15 19:53:43
608
315age:04/11/20 17:10:27
age
316132人目の素数さん:04/11/21 00:41:39
重回帰分析で、修整済みR^2が1に近づくとNANになっちゃうんですが
なぜですか?教えてエロい人
317132人目の素数さん:04/11/21 09:30:32
385
318132人目の素数さん:04/11/24 22:54:25
vine linux 3.0を使っています.
odesolveを使用したく,
odesolve_0.5-12.tar.gzをダウンロードしました.
$ R CMD INSTALL /path/to/odesolve_0.5-12.tar.gz
を実行しましたが,うまくいきません.
319132人目の素数さん:04/11/24 23:16:35
>>318
自己レスです.
>update.packages()
で解決しました.
320132人目の素数さん:04/12/01 14:01:05
glmmMLうまく入らないな
321132人目の素数さん:04/12/02 08:05:38
529
322132人目の素数さん:04/12/04 15:44:48
クラスタ分析てエクセルでどうやってやるんでしょうか。
初心者なのでわかりません。どなたか教えていただけないでしょうか。
323320:04/12/04 17:05:18
>>320解決
パッケージ入れるときは管理者じゃないといけないなんて・・・orz
それを先にいってれぼ

>>316
ver2.0.0のlmにはバグあるみたい
324132人目の素数さん:04/12/04 17:34:40
>>322
エクセル自体には、そのような高度な統計関数はないので、アドオンをインストールするか、
Rを使う。 Rはユーザーインターフェースは原始的だが、統計処理については非常に豊富で
パワフルで、正確と思う。 インストールして損するソフトとは思わないが。
325ECL:04/12/07 01:27:23
Rで三角ダイヤグラムを作図できるのでしょうか。
三角ダイヤグラムは、主に地学、金属学、化学などの分野で使われてる
正三角形の各辺を10等分して目盛を入れ、三成分系の組成をプロットし、
その図から組成比の変化などを検討するというやつで。
326132人目の素数さん:04/12/07 17:18:18
>>325
あらゆるグラフィックを比較的容易に自作できるのがRのウリなので、自作してみては?
案外、探し回るよりも早いかも。
327132人目の素数さん:04/12/07 23:20:35
328132人目の素数さん:04/12/10 20:39:56
x y z
1 1 2
2 4 5
4 2 5
...

とデータがあるとします。
この時、
persp( x , y , z , z_guess=TRUE )

等として z を補完してくれることはないのでしょうか?
回帰分析でzを補完するイメージです。
329132人目の素数さん:04/12/11 08:42:25
二つのデータをヒストグラムにして、それを重ねて表示させたいのですが
どうやったらよいでしょうか?
330132人目の素数さん:04/12/11 09:05:33
coplotってなんじゃらほい。
見方が解らないです。
331132人目の素数さん:04/12/13 03:14:18
>>328
パッケージ「あきま」なんかどうです?
332132人目の素数さん:04/12/14 21:54:30
データフレームからサンプルをn個抽出するにはどうすればいいのでしょうか?

sample ( data , 3 )

だと3列ランダムサンプリングされてしまいます。
333132人目の素数さん:04/12/15 01:26:58
>>332
データフレーム???
データフレームのどのデータからサンプリングするわけ?
それがわからなきゃそもそもできないだろが!
334132人目の素数さん:04/12/15 01:38:04
[File]→[Change Dir...]で指定される作業用ディレクトリは保存できないんでしょうか?
335132人目の素数さん:04/12/15 08:37:06
>>332

sample(as.matrix(dataframe),3)
336132人目の素数さん:04/12/15 20:56:30
>>334
起動時に引数で渡せば良い。
起動用のショートカットの「作業フォルダ」に望むパスを指定する。
337132人目の素数さん:04/12/15 21:34:34
>>335
それだと、数値属性の情報もカテゴリーデータの情報も失われてしまいますよね?
何かいい方法ないのでしょうか?
338132人目の素数さん:04/12/15 22:22:13
>>336
おかげさまでできました。
ありがとうございました。
339132人目の素数さん:04/12/15 22:31:57
>>337

colnamesの情報を残したまま抽出したいということでしょうか?
そうなるとデータそのものから抽出するより、座標を抽出して
対応するデータをとってきたほうがいいような。

n x mのデータフレームとしてi <- sample(1:(n*m),3)とかやって、
dataframe[i%/%m+1,i%%m+1]とか?
あとはiをみれば情報は残ってるはず
340132人目の素数さん:04/12/15 22:46:28
う〜ん、難しいです。

baseに入っているstate.x77を例に教えていただけないでしょうか?


state.x77[1:3,]
Population Income Illiteracy Life Exp Murder HS Grad Frost Area
Alabama 3615 3624 2.1 69.05 15.1 41.3 20 50708
Alaska 365 6315 1.5 69.31 11.3 66.7 152 566432
Arizona 2212 4530 1.8 70.55 7.8 58.1 15 113417

こういったデータフレームがあった時に、イメージとしては
sample( state.x77 , 2 )としたら
2オブザベーション返ってくる感じです。

あつかましいお願い申し訳ありません。
341132人目の素数さん:04/12/16 07:57:10
>>340

ちょっとやりたいことがはっきりしませんが...SAS語の「オブザベーション」と
同じ意味だとすると...
state.x77[sample(nrow(state.x77),3),]
ということ?
求めるデータのイメージを具体的に示してもらえれば答えやすいですが。
342初心者:04/12/21 23:58:27
質問です.
線形重回帰分析で予測値の信頼区間をプロットしたいのですが,
色々探したのですが,掲載されていませんでした・・・
どなたかご存知でしょうか?
非常に困っているので教えて下さい.
宜しくお願い致します.
343132人目の素数さん:04/12/22 21:47:38
344132人目の素数さん:04/12/24 01:44:05
>343
それって単回帰のページですよね
重回帰での信頼区間はそれだとでないような・・・
まあ、私も重回帰での信頼区間のだしかたを知らないのでなんともいえないのですが・・・

自分でがつがつ書くしかないんですかね〜
345132人目の素数さん:04/12/24 08:48:07
>>344

モデルをmlm として
predict(mlm, int="c")
ではいかが。
346345:04/12/24 08:56:28
補足: 単回帰も重回帰も、直線回帰であれば lm() でまったく区別なく扱えます。
ロジスティックとか、直線でない場合は glm() を。

参考書: Introductory Statistics with R (だれか翻訳してるかなぁ)
347132人目の素数さん:04/12/24 14:53:10
age
348348:04/12/28 05:23:53
>346
信頼区間の値がかなりばらついているから、
重回帰では使えないと思ってました。

参考書みて勉強してみます
ありがとうございました
349132人目の素数さん:04/12/30 22:12:08
poly

とは要するになんでしょ?
350132人目の素数さん:04/12/31 08:59:49
boxplot()で平均値を表示させることはできるのでしょうか?
351初心者:05/01/17 04:49:58
Rはフリードマン検定全部やってくれるのですか?
他の使い方もあるのでしょうか?
352132人目の素数さん:05/01/18 20:52:14
中心化移動平均を求めるには?

filter関数では無理ですよね?
353初心者:05/01/19 14:51:03
Rは数値を入れ込むのがめんどう・・・・エクセルの表でぱっとやってくれないの?
354132人目の素数さん:05/01/19 19:12:33
>>353
scan("hoge.csv")
355132人目の素数さん:05/01/19 19:43:14
>>353
read.csv("hoge.csv")
356132人目の素数さん:05/01/19 23:15:08
>>353
read.table("hoge.csv", sep=',')

この辺の使い分けは rjpwiki にも列挙してあるだけで自分で調べて欲しいという
ことになっていますね.そんなに重要なことはないのかな?
357132人目の素数さん:05/01/23 08:14:39
>>356
自分で調べるも何も、まんまな訳だが。
>>353
Excel上でRを使う方法があるよ。私はLinuxユーザだから試したことがないけどね。
OpenOffice.org Calc上で使えるようになったら、演習講義に採用するかも。
358132人目の素数さん:05/01/23 13:59:38
データ入力がexcelじゃ限界あるだろ
359132人目の素数さん:05/01/23 16:58:52
カーソルキーで移動できるターミナルのCSVエディタがあればなあ。
MSDOSのロータスみたいなので、式はなしでもいい。
そいうのしりませんか。
360132人目の素数さん:05/01/23 19:25:56
>>357
>Excel上でRを使う方法
マジっすか?
どっかに関連情報のリンクとかあったら教えていただきたいです。
361132人目の素数さん:05/01/23 19:52:57
>>359
それ、俺も欲しい
362132人目の素数さん:05/01/24 00:14:20
363132人目の素数さん:05/01/24 00:16:11
>>359,361

data.entry()
364360:05/01/24 08:31:49
>>362
うほっ。Wikiにあったとは…。ありがとうございました。
365132人目の素数さん:05/01/24 16:09:11
>>359
このスレ、ノウハウがない人が多いな。学生のたまり場になっているのかな。
コンソールで動作する表計算ソフトならあるけど、
sc ftp://ibiblio.org/pub/Linux/apps/financial/spreadsheet/!INDEX.html
これがCSVを吐いたかどうかは未確認。
emacs を -nw オプションをつけて起動するとコンソールモードになります。
それで、csv-modeになると、コンソール用csvエディタに変身するよ。
http://centaur.maths.qmw.ac.uk/Emacs/
366132人目の素数さん:05/01/24 23:16:01
>365
お前はききかじりじゃねえか
367132人目の素数さん:05/01/25 13:47:44
こんな関数ありますか?

hoge(f, a, b, c, d, ...) ==> f(f(f(f(a,b),c),d),...)

f (引数 2 つ) を適用した結果を引数の 1 番目,リストの次を 2 番目として
また f を適用し,,,という動作です.
368132人目の素数さん:05/01/25 17:21:14
>>366
>>365だけど、もちろん両方とも使ってみた上での発言だよ。emacsのCSVモードは日本
語に難があって、今は使ってない。まぁコンソールと言わずに、OpenOffice.org Calc ->
csvとした方が効率がよいと思うけど。

>>367
そんな関数というか、まんま書いたらいいと思うけど。
fuga <- function(x,y){x+y}
hoge <- function(f,x){
y <- x[1]
for (i in x[-1]) { y <- fuga(i,y) }
}
369132人目の素数さん:05/01/26 18:15:04
>>368
反応がないということは分かりにくかったか?
f(引数2つ) の例として f <- function(x,y){x+y}
という関数があったとして、
> f(2,3)
[1] 5
だな。で、
> x <- c(5,7,1,8,9,12)
というxがあったとして、f(f(f(f(f(5,7),1),8),9),12) を計算したいとする。
> y <-x[1]; (for (i in x[-1]) {y <- f(i,y)})
[1] 42
と書けば>>367の期待通りに結果になる。

370132人目の素数さん:05/01/26 22:46:43
>368
じゃあただのききかじりだな
371367:05/01/27 00:47:49
>>368
返事が遅れてすみません.
無いみたいなので自分で作ろうとしましたが,
まだ R に馴れていないので脱線し,そのままになっていました.

結局,まんましか思い浮かばず...

脱線中に困ったのですが,
mapply を 兼ねた apply はありませんか?

できれば apply( mat1, 1, function (m1, v1, v2) {...}, vec1, vec2 )

のようにしたいところを,

apply( cbind (vec1, vec2, mat), 1, function (m) { ... } )

というように,頭から 1 コずつ適用して欲しいベクトルも行列に混ぜないと
なりませんよね.
372132人目の素数さん:05/01/28 00:32:25
SASユーザです。教えて下さい。
行列計算用のパッケージ(SASではIMLなど)はありますでしょうか?
その中で、逆行列や最適化の計算はできるでしょうか?
373132人目の素数さん:05/01/28 00:58:44
374132人目の素数さん:05/01/29 11:53:29
plot ( x , log="xy" )

で対数軸にプロットしたいのですが、
軸が指数表記になってしまいます。5e-01

これを通常の十進表記にすることはできるのでしょうか?
375132人目の素数さん:05/01/31 20:24:41
grangerの因果性のテストができるパッケージなどあるのでしょうか?
376132人目の素数さん:05/02/16 13:12:06
666
377132人目の素数さん:05/02/17 21:19:51
もう一度質問させてもらいます。
時系列varモデル、grangerの因果性のテストができるパッケージなどあるのでしょうか?
378132人目の素数さん:05/02/20 03:16:37
379132人目の素数さん:05/02/28 22:47:13
345
380132人目の素数さん:05/03/08 12:13:08
>>215>>378
便乗質問
ついでにARIMAなども扱えるようなパッケージはあるのでしょうか?
381132人目の素数さん:05/03/08 14:17:04
age
382132人目の素数さん:05/03/09 00:59:30
arimaはデフォで使える。
varはarで可能。

grengerは?だれか教えて。
383132人目の素数さん:05/03/10 22:28:35
>>380
fBasicsはダメですか?
384132人目の素数さん:05/03/11 07:02:42
グランジャー因果はなかった希ガス
385132人目の素数さん:05/03/11 11:16:32
グランジャー因果って何ですか?グーぐるで「とは検索」しても出てこなかったのですが・・
386132人目の素数さん:05/03/11 11:20:50
ハースト指数ってどのモジュールから取れますか?
本家サイト検索しても出てこなかったので、無理でしょうか・・
387132人目の素数さん:05/03/11 11:35:28
日本地図ってデフォでついてたっけ?
388132人目の素数さん:05/03/11 23:41:25
389132人目の素数さん:05/03/12 12:30:57
グレンジャー因果が無いってのは致命的では?
実務上時系列で一番重要なものではないか。
390Cox回帰:05/03/12 17:05:03
matlabで生存時間解析を行いたいんですけど(COX回帰とか)、どこかに
サブルーチンはフリーで落ちていないでしょうか?
391132人目の素数さん:05/03/13 01:54:02
>>389
Rって「研究者が自分に必要なものを自作する世界」(R. Gentleman in ISM, [12, Mar. 2005])だから
今までに必要な人がいなくて作られてないってのは別に不自然じゃないと思うよ。

欲しければ自分で作ってRコミュニティに貢献してくださいな。

それとグレンジャー因果って本当に因果なの?個人的には時間差を持った相関にしか見えないん
だけどな。
392132人目の素数さん:05/03/13 01:58:58
それとGranger因果ってF検定してるだけだった希ガス
393132人目の素数さん:05/03/13 08:47:13
>時間差を持った相関にしか見えない

専門家にはそうにしか見えなくても良いんだよ。
手法の詳細はともあれ、実務上は時系列の因果関係を示せる指標が求められる。
ラグを考えないピアソン相関係数を示しただけじゃ偶に突っ込まれちゃうんだよね。

そうなると多少難しいグレンジャー因果が必要とされる。
394132人目の素数さん:05/03/13 14:55:38
>>393
回答あんがと。本来は相関でしかないものを確信犯的に因果と言っている人に文句は言わないよ〜
(似たようなことは俺もしてるし)

調べたけど、やっぱりF検定するだけだからGrangerのためにパッケージはいらんかもよ(←適当ですまん)
395132人目の素数さん:05/03/13 15:51:01
どなたかwaveslimを使って時系列のウェブレット分析してる方いますか?
ご丁寧にGDPなどのサンプルデータまで入っているのに使い方が分からないorz
コアプログラムも分からない・・
396132人目の素数さん:05/03/13 15:53:14
ロジスティック回帰分析を行うのにRではglm(一般化線型モデル)を
用いますが、見やすく出力してくれる関数等は存在するのでしょうか?

例えば偏回帰係数はオッズ比の自然対数ですが、これをオッズ比に戻すために
exp ( x )
信頼区間を求めるために
exp ( x + 1.96 * StdError)
等としますよね?

ちょっと手間がかかるので、もっとスマートな方法があるのではと思いました。
397132人目の素数さん:05/03/18 10:53:09
定数項を含まないGLMを推定したいのですが、GLM()でマニュアルにある通り
intercept=FALSE
と設定しても Error in glm.control(...) : unused argument(s) (intercept ...) 
と出てしまってうまくいきません。自分のモデルが悪いのかと思い、helpにある
モデル Dobson (1990) Page 93 で試したのですが同じでした。Rは標準インストール
しただけの状態で特にパッケージなどは入れていません。

私は何か勘違いをしているのでしょうか?もしご存知の方がいらしたら是非お教えください。
398397:05/03/18 12:03:53
397ですが、自己解決しました。マニュアルどおりのintercept=FALSEではうまくいかないのですが、
式を指定するところで、説明変数の最後に-1をつければ(e.g. y ~x1+x2+x3-1) よいようです。
お騒がせしました。
399132人目の素数さん:2005/03/23(水) 12:26:10
>>387
Splusの方のmapsにはあるらしいよ。
市町村合併で大変だろうけど。
>>388
素直にshapeファイルとmaptoolsを使った方がいろいろと小回りが利くと思うけど。。。
400132人目の素数さん:2005/03/24(木) 05:09:19
age
401132人目の素数さん:2005/03/28(月) 21:28:32
ヒストグラムの重ね書きはできますか?
402132人目の素数さん:2005/04/13(水) 06:31:02
874
403132人目の素数さん:2005/04/15(金) 00:52:35
>>401

x1 <- rnorm(100)
x2 <- rnorm(100)
hist(x1, xlim=c(-5,5), ylim=c(0,0.5), prob=T)
par(new=T)
hist(x2, xlim=c(-5,5), ylim=c(0,0.5), prob=T, col=2)
404132人目の素数さん:2005/04/18(月) 22:15:19
R -2.1.0.になりました
405132人目の素数さん:2005/04/18(月) 22:29:05
Rでアソシエーション分析なんてできますか?
406132人目の素数さん:2005/04/18(月) 23:11:35
Rで尖度と歪度を定義したいのですけど、どうすればいいのでしょうか?
一応こちら(ttp://aoki2.si.gunma-u.ac.jp/R/univariate.html)の方にそれらしきものは掲載されていたのですが、これはExcelからの読み込みを対象にしているようで、いまいち分かりません。
教えていただけると幸いです
407132人目の素数さん:2005/04/21(木) 00:56:15
>>406
詳しくはRWiki
http://www.okada.jp.org/RWiki/
で検索すれば出てきます。

Rメニューの[Packages]→[Install Package(s) from CRAN]から
e1071をインストールすればkurtosisやskewness等の統計関数が使えます。
408132人目の素数さん:2005/04/21(木) 03:04:48
>>407
ありがとうございます。e1071をインストールしたら統計関数がみれました。
409132人目の素数さん:2005/04/21(木) 20:43:07
v2.1

example関数にバグがあるね。
エラーになる。
410132人目の素数さん:2005/04/23(土) 07:13:25
>>409
どんな?使った範囲では問題ないけど。
411132人目の素数さん:2005/04/23(土) 11:20:47
v2.1
日本語環境がまだまだ中途半端に感じたので、ロケールをCに設定。
その上で、example関数を実行したら

which[x] ..not defined default value..
ISO????

のようなエラーが発生。正確には覚えていない。
今手元でテストできる環境にないのでスマソ。
412132人目の素数さん:2005/04/24(日) 13:12:01
グラフィック全般での質問ですが、軸の数字を小さく表示することはできますか?
413132人目の素数さん:2005/04/25(月) 11:29:15
plot(x,y,cex.axis=.8)
try
?par
414132人目の素数さん:2005/04/29(金) 21:17:23
Rをインストールするとき,
BLASライブラリのサポートを必要とした方がいいのでしょうか?
415132人目の素数さん:2005/04/29(金) 22:54:25
mean関数のtrim引数の動作が全く理解できません。
このtrim関数の意味を教えて下さい。よろしくお願いします。
416132人目の素数さん:2005/05/02(月) 23:07:37
まずい回答例

  まずい質問の模範的な例ですね。まず質問場所がまずい。
  自分が何をしたのか説明しないで、どうして赤の他人に問題がわかりますか。
417132人目の素数さん:2005/05/03(火) 06:21:40
age
418132人目の素数さん:2005/05/03(火) 07:58:24
回答者の知識レベルにも依るでしょ。

>>415
トリム平均でぐぐれ
419132人目の素数さん:2005/05/03(火) 23:48:28
>>416 シムラー!!! 2005-05-01 (日) 08:31:32のRwiki 、Rwiki
420132人目の素数さん:2005/05/05(木) 13:23:32
Rを独習中で、The R bookを使っているのですが、decomposeコマンドを使う際に
dataコマンドで、データセットを読み込むとありました。
しかし読み込みが出来ません。単に読み込む前に何か私がし忘れていることが
あるのでしょうか?
どなたか、教えていただけませんか?
421132人目の素数さん:2005/05/05(木) 13:43:41
data ( co2 )
#この時点で読み込みは完了している。

decompose ( co2 )
422132人目の素数さん:2005/05/05(木) 14:16:10
>>421

data(読み込みたいファイル)としても、
not foundと表示されるんです。
やはり、方法が間違っているのでしょうか?
423132人目の素数さん:2005/05/05(木) 14:47:46
一般のテキストファイルを読み込もうとしてるのなら、

help ( "read.table" )
help ( "scan" )
424132人目の素数さん:2005/05/05(木) 15:00:41
>>423
read.table("c:〜.txt")という風に、上の本に書いてあるようにして、
こっちのコマンドでは読み込みは正常に出来ているみたいです。
plot(〜)とすると、ちゃんと図になりますし。
しかし、dataコマンドの方は、notfoundと表示されます。
教えてくださったように、helpは二つとも見てみましたが、
read.tableの使い方はあっているようです。
目的は、Rを使って時系列分析をすることなんですが、
そこから前に進めなくて。
425132人目の素数さん:2005/05/06(金) 06:19:09
co2ってデータセットは普通にインストールすれば入っているものですから、
not foundになるのはちょっと変ですね。

本の付録についているCD-ROMに本に書いてあるコマンドを書いたファイルが
あるので、それをメモ帳か何かで開いてコピーして実行してみてはどうでしょう?
426132人目の素数さん:2005/05/06(金) 12:32:29
>>425
data(co2),decompose(co2)は上手いこといきました。なぜ、出来なかったのかは
分かりませんが、多分タイプミスだと思います。
ありがとうございます。
しかし、このco2のデータは元々入っているものですが、元々入っていない
私の作成したデータの場合はやはり上手いこといかないのですが・・・。
decompose(ファイル名)としても、
Time series has no or less than 3 periods!
と表示されるのです。初心者なので、本の通りに進めているのですが、
データは自分のものを使って分析したいと考えていますので。
何かし忘れていることがあるのでしょうか?
427132人目の素数さん:2005/05/06(金) 14:21:41
>>426
そのメッセージは、「データに含まれる時点(period)が3時点未満である」
と指摘していると思うのですが、その指摘自体は正しいですか?
Moving averages を使って解析する上で、少なくとも3時点ないと
だめなのではないかと思います。
428132人目の素数さん:2005/05/06(金) 14:40:04
>>427
その指摘自体が良く分からないのです。
私が使うデータは、円ドルレートのデータで、約2500日分のレートが入っています。
形式は、txtです。read.tableにより読み込んで、plotで描けば、レートの変動が
グラフになって表示されるので、3時点ということはないと思うのですが。
単に2500個のデータがあるだけではだめなのでしょうか?
429科学者の卵:2005/05/06(金) 15:49:47
私は、科学者の卵です。はじめて掲示板に書き込みます。
よろしく、お願いいたします。
ヨーロッパでは、品質管理の統計にCOV(私は聞いたことがない)という
手法か?、単位か?で表現することがあるそうですが、どなたかご存じでしょうか
教えてください
430132人目の素数さん:2005/05/06(金) 16:12:05
>>429
このへんじゃないかな?ググっただけなんで、アレだけんども・・・

Deming's red bead experiment and mechanical sampling
http://www.ingentaconnect.com/content/mcb/176/1998/00000003/00000003/art00005

楕円近似について(その5)
http://www.geocities.jp/ikuro_kotaro/koramu/daenkinji5.htm
431430:2005/05/06(金) 16:13:45
432BlackLightOfStar ◆ifsBJ/KedU :2005/05/06(金) 18:58:04
Re:>429 おそらくCOVは日本語でいう共分散のことだろう。covarianceの略。
433132人目の素数さん:2005/05/06(金) 20:20:11
>>428
そのデータは、「年」と「日」に分解されていますか?
period として年、season として日を認識させないといけないのでは。
co2 は、「年」と「月」という構造を持ってますよね。
434132人目の素数さん:2005/05/06(金) 21:45:32
>>433
分解されていません。co2の方は、確かに分解されていました。
しかし、どのようにすれば良いのでしょうか?
持っているThe R bookには載っていなくて。
私の使う為替レートは、年は1993〜2005で連続ですが、市場が開いていない日
があるので、抜けている日があるのですが。
435132人目の素数さん:2005/05/07(土) 08:13:56
436132人目の素数さん:2005/05/07(土) 08:52:08
>>435
ありがとうございます。今、早速そのページのようにしたら、本のように
上手い事出来ました。
自分の使っている本を書かれた方から直接教えて頂けるのは、本当に
嬉しい限りです。
本当にありがとうございました。
437132人目の素数さん:2005/05/07(土) 09:03:26
へぇ、矢野先生も2ch見てるのね。
先生、decompもいいけどX12を実装してください。

と匿名をいいことに無茶を言ってみる。
438132人目の素数さん:2005/05/15(日) 19:21:43
helpコマンドで良く出てくる「S3」とはなんでしょうか?
439132人目の素数さん:2005/05/16(月) 21:13:43
tsオブジェクトで月平均や年合計を簡単に計算する方法はあるのでしょうか?
440132人目の素数さん:2005/05/17(火) 07:32:59
>>439
aggregateで月平均や年合計を計算可能です。
441132人目の素数さん:2005/05/17(火) 22:31:51
>a
numeric(0)
>is.numeric(a)
[1] TRUE

ええええええええええええ
442132人目の素数さん:2005/05/18(水) 01:00:32
最頻値の出し方はどうすればよいのでしょう。
mode関数はRには備わってないようですが、、、。
443132人目の素数さん:2005/05/18(水) 14:02:00
突然失礼致します。

統計解析ソフトの「R」を使用して箱ひげ図を作図しています。
その際、外れ値を出力しないようにしたいのですが、うまくいきません。
どなたかご存知の方がいらっしゃいましたらアドバイスを頂けますと幸いです。

以下のページを参考にして、
http://epidemiology.md.tsukuba.ac.jp/ML/R-jp/20000912/224_3.html

データを読み込み、

x <- c(1:100, 1000)
boxplot(x,do.out=FALSE)

のようにして出力しているのですが、外れ値は出力されたままでした。
444132人目の素数さん:2005/05/18(水) 18:30:01
>>443
boxplot(x,outline=F)
じゃないの?
R 2.1.0 patchedでの話です。

?boxplot
でヘルプファイルが出ます。
確認してください。
445132人目の素数さん:2005/05/18(水) 20:09:56
希望するグラフができました。
本当にありがとうございました。
446132人目の素数さん:2005/05/18(水) 21:24:53
>>440
レスありがとうございます。
しかし、年合計はできたのですが、月平均の方法がわかりません。

どのようにやればいいのでしょうか?
447132人目の素数さん:2005/05/19(木) 20:54:36
"2 > 1" や"x == y"のような文字列を論理式として扱いたいんですが方法がわかりません。ご教授お願いします。
448447:2005/05/19(木) 21:49:10
一応、ファイルに出力→source()で実行って形で自己解決出来ましたが、よりよい方法があったら教えてください。
449132人目の素数さん:2005/05/20(金) 00:58:31
xx <- parse(text = "x+y")
x = 2; y<- 23; eval(xx)

symbol あるのにわざわざ文字列?

xx <- quote(x + 3)
x <- 33 ;eval(xx)
x <- -3 ;eval(xx)
450132人目の素数さん:2005/05/20(金) 01:09:53
クロージャもあるし
a <- function(x) {x == y}; y<-3; a(3)
451447:2005/05/20(金) 10:03:29
>>499,450
ありがとうございます。うまくいきました。
treeで作ったルールセットを分割して保存・実行したかったんです。
452132人目の素数さん:2005/05/22(日) 11:54:16
すみません、賢い2ちゃんねるのみなさんに質問です。

text<-"abcdefg"
regMatchPos("abcdefg","cde")

は、S-PLUSだと動くのに、
[,1] [,2]
[1,] 3 5

Rだと動かない
 Error: couldn't find function "regMatchPos"
理由を教えていただけないでしょうか。
「データによるプログラミング」にも似たような式が載っているのに不思議です。

453132人目の素数さん:2005/05/22(日) 12:05:20
賢くないから答えない
454132人目の素数さん:2005/05/22(日) 12:19:52
R Functions for Regular Expressions
* grep()
* regexpr()
* gsub()
* sub()
455132人目の素数さん:2005/05/22(日) 12:28:34
454さん

解決しました。ありがとうございます。
456132人目の素数さん:2005/05/30(月) 23:05:51
質問です。
例えば100個のベクトルに対してトリム平均で上下2%を取り除いた平均を求めるとします。
このとき、取り除いた上下2%のベクトルsを知る事ができるのでしょうか。
どなたかやり方をご存知であればご教示ください。
457132人目の素数さん:2005/05/31(火) 09:05:29
>>456
100個の2%ってことは、2個。
sortして、1番目と2番目と99番目と100番目が取り除いたものじゃないの?
458456:2005/05/31(火) 12:47:15
>>457
レスどうもです。一応検証してみました。
> a <- rnorm(100)
> mean(a,0.02) == mean(sort(a)[-c(1,2,99,100)])
[1] TRUE
> a <- rnorm(99)
> mean(a,0.02) == mean(sort(a)[-c(1,2,98,99)])
[1] FALSE
> mean(a,0.02) == mean(sort(a)[-c(1,99)])
[1] TRUE

上下2%の時、ベクトル100個では上下2個除いていて
99個のときは一個づつ除いてるみたいですね。
いや、Rがトリム平均を求める時にちゃんと上下2%を認識して弾いてるわけだから
自分でまた計算し直すのもアホらしいと思ったけどしょうがないですよね
そうですよね。
459132人目の素数さん:2005/06/02(木) 15:32:41
age
460誰か:2005/06/08(水) 08:45:59
3×3行列で 一行目5 53 50 ニ行目53 657 536 三行目50 536 558の逆行列を表計算ソフトで求めれますか?
461132人目の素数さん:2005/06/08(水) 11:19:14
スレ違い?
>>460
Excel でいいなら
一行目79310 -2774 -4442 ニ行目-2774 290 -30 三行目-4442 -30 476
の全体を27428 で割ったもの。
462132人目の素数さん:2005/06/08(水) 15:47:53
461さん、ありがとうございました。
463460:2005/06/08(水) 15:48:12
461さん、ありがとうございました。
464132人目の素数さん:2005/06/16(木) 15:22:45
MacOSX TigerにRcmdrが入りません。
何か必要なんでしょうか?
465132人目の素数さん:2005/06/17(金) 12:14:56
age
466たかの:2005/06/17(金) 19:51:08
初歩的な質問で,申し訳ありません.

CRANからRMySQLをダウンロードして,RGuiのパッケージから
「ローカルにあるZIPファイルからのパッケージのインストール」を実行しました.

library()で確認したところ,
「No title available (pre-2.0.0 install?) **~」
と表示されてしまい,使用する事ができません.
WindowsXPサービスパック1,R 2.1.0を使用しているのですが,
どなたかご教授頂けないでしょうか.
467132人目の素数さん:2005/06/21(火) 01:21:09
質問です。いまRの説明文を書いているのですが、
「C言語の構造体」=「R言語のリスト」っていう説明で、問題はありませんか?
468132人目の素数さん:2005/06/21(火) 14:47:39
問題オオアリだと思うが。
一つのリストにいろいろな型の値を入れられるという趣旨かなと想像するけど。
469132人目の素数さん:2005/06/21(火) 17:34:47
468さん

はい、そういうことを言いたいのですが、
467の言い方だとどこらへんがマズいですか?
470132人目の素数さん:2005/06/21(火) 20:50:10
C union ならいろいろな型を入れられる。
R の list はgeneric vector を作る関数だとマニュアルに書いてある。
471132人目の素数さん:2005/06/21(火) 21:52:13
R の list は、vectorやmatrixに名前(names()で参照)をつけて保存
するもので、同じ長さのvectorをいくつか束ねると dataframe に
なります。

Cのような機械語寄りの言語だと同様の概念はありませんが、
強いてたとえるならば、構造体というよりも、
void型のポインタの配列といったところでしょうか。

JavaやC++のSTLでいうところのコレクション系クラスがしっくり
きますね。
472132人目の素数さん:2005/06/22(水) 05:44:43
>471-472
ありがとうございました。勉強になります。
473132人目の素数さん:2005/06/22(水) 13:29:52
>>467
例の本ですか。がんばれ。
474132人目の素数さん:2005/06/22(水) 20:10:09
>>473さん
えーと? 僕が誰だかばれているとなると、ちょっとびっくりです。

ですががんばります。
いつか(今年末くらい?)、Rの世界に恩返ししたいので、よろしく。
475132人目の素数さん:2005/06/22(水) 21:22:13
>>467 がばれーー!
476132人目の素数さん:2005/06/22(水) 22:03:34
Rで基本統計量を出力するプログラムってどう書けばいいのですか?
プログラム例を教えてもらいたのですが・・・。
477132人目の素数さん:2005/06/22(水) 22:28:41
summary(matrix(c(1,2,3,4,5,6,7,8),nrow=4,ncol=2))
478473:2005/06/23(木) 15:10:37
>>474
かまかけがあたった(^o^;
RjpWikiの間○先生の書き込みでは出版予定は秋ということでしたが、のびたのね。
どこのどなたか存じ上げませんが、応援しています。
479sage:2005/06/23(木) 21:49:14
おお、○瀬先生関連でしたか。了解です。

まだ延びると決定したわけではないですが、なかなか進まないので、
どうせ遅れるであろうと、すこし遅めに言ってみました。

先生に教えていただくまで、
RjpWikiの存在を知らなかったくらいですから、
(「C言語の構造体」=「R言語のリスト」と言う時点で力量が知れている)
あまり期待できるようなものではありませんが、努力いたします。
それではおやすみなさい。
480132人目の素数さん:2005/06/23(木) 22:31:46
特定の数とそれ以外の複数の数から、特定の数のランクだけを取得したい
のですが、どうしたらいいでしょうか?

通常のRank関数だと、配列全てに対して表示されてきますが、特定の配列のみの
順位だけを知りたいのです。

よろしくお願いします
481132人目の素数さん:2005/06/23(木) 23:07:25
mat<- matrix(c(1,200,3,400,5,600),nrow=2)
rank(mat[2,])
tapply (mat, c(1,2,1,2,1,2), rank)
rankって線形代数のやつじゃないのか…
482132人目の素数さん:2005/06/24(金) 10:51:08
>>480
非常に泥臭い方法だけど、
> (x <- round(runif(5),2))
[1] 0.07 0.02 0.76 0.81 0.33
で、例えば0.81のランクを知りたかったとする。
> y <- cbind(x,rank(x))
> y[x == 0.81,2]
[1] 5
483132人目の素数さん:2005/06/24(金) 11:43:06
Rwikiも携帯から見れるように最新バージョンにアップしてほしいな
484484:2005/06/24(金) 20:41:31
√(484) = 22
485132人目の素数さん:2005/06/27(月) 16:26:21
ありがとうございます。参考になりました。
486132人目の素数さん:2005/06/28(火) 06:31:11
age
487132人目の素数さん:2005/06/28(火) 22:25:46
RからC言語で書いたプログラムは呼び出せるみたいだが、
逆にC言語で書いたプログラムからRを呼び出すことはできないの?
MatLabみたいに。
488132人目の素数さん:2005/06/29(水) 07:22:26
VBとかなからokでは?
489132人目の素数さん:2005/06/29(水) 10:49:44
VC++から呼び出したいんだよね。
誰か方法知らない?
490132人目の素数さん:2005/06/29(水) 20:49:09
491132人目の素数さん:2005/07/03(日) 09:04:06
NN、descision tree ができるのはわかりました。
ところでアソシエーションルールができるパッケージはないのでしょうか?
492132人目の素数さん:2005/07/10(日) 13:26:57
時系列分析で、ある過程がAR過程かMA過程のどちらに従うか、という
問題はどのようにRで対処すれば良いのでしょうか?
493132人目の素数さん:2005/07/12(火) 19:58:33
行列のベキを計算するのに、以下のような関数を定義したのですが、

power1 <- function(mat, n) {
    ei <- eigen(mat, symmetric=FALSE, EISPACK=TRUE);
    d <- diag(ei$values);
    u <- ei$vectors;
    return (u %*% (d^n) %*% Conj(t(u)));
}

これをテストすると、ぜんぜん違う結果になるんです。

> mat <- matrix(c(1,2,-2,3), 2, 2);
> power1(mat, 3)
                  [,1]   [,2]
[1,] -20+5.152129e-16i -17+0i
[2,]  37+3.209238e-17i -20+0i
> mat %*% mat %*% mat
     [,1] [,2]
[1,]  -19  -18
[2,]   18   -1

何か間違っているでしょうか?
494132人目の素数さん:2005/07/12(火) 23:46:16
octave と比べてみれば?
A=[1,-2;2,3];[ev,lbd]= eig(A);ev*(lbd.^3)/ev
495132人目の素数さん:2005/07/13(水) 15:14:39
for文中の値がsinkで出力できません.

例えば,

for (n in 1:10){
sink("hoge.txt")
x <- n * 2
x
 sink()}

または,

sink("hoge.txt")
for (n in 1:10){
x <- n * 2
x}
sink()

のどちらでも,出力先のファイルは作成されるものの,
xの値が出力されないっす.
自分としては,結構いろいろ調べたツモリですが,原因不明.
どこがいけないんでしょうか?誰か教えてください.
49631:2005/07/13(水) 16:44:31
>>495
sink("hoge.txt") 
for (n in 1:10){ 
x <- n * 2 
print(x)} 
sink()
497495:2005/07/13(水) 16:57:14
>31さん
ありがとうございます.
...自分のアホさ加減に耳から血が出そうですorz
498132人目の素数さん:2005/07/15(金) 00:08:32
いやー、Rは便利ですね。
データの扱いは簡単だし、基本的な関数は入ってるし、
わかんなかったらここに聞けば的確な答えが返ってくるし。
おかげで、Rばっかり使って、たまにCとかjava使わなきゃいけない羽目に
なったとき苦労しますw。
499132人目の素数さん:2005/07/15(金) 00:10:56
>>492
いろいろやってみて、2乗誤差とかみて決めるんじゃ駄目なの?
500132人目の素数さん:2005/07/15(金) 00:13:37
>>491
自分もそう思うんでアゲ
501132人目の素数さん:2005/07/15(金) 02:43:25
Rを自分のプログラムに組み込んで何かアプリケーション作った人っています?
502132人目の素数さん:2005/07/16(土) 22:55:57
なんか作って欲しい関数とかない?
503132人目の素数さん:2005/07/16(土) 23:33:52
なんか作って欲しい関数とかない?
504132人目の素数さん:2005/07/17(日) 00:54:39
萌えAA散布図を生成する関数。
505sage:2005/07/17(日) 00:59:23
よしキター
入力形式はどうするのがいい?
506132人目の素数さん:2005/07/17(日) 01:43:09
とりあえず萌え.jpgのバイナリを渡して忠実にその散布図化をRでしてくれれば一応使いものにはなる。
507132人目の素数さん:2005/07/17(日) 14:22:08
試行数が30で、成功確率が0.3の二項分布で、
成功数がx回以下となる確率を求める方法と、
その分布関数を図示する方法を教えてください。
調べても分かりませんでした。お願いします。
508132人目の素数さん:2005/07/17(日) 14:41:25
plot(1:30,pbinom(1:30,30,0.3))
509132人目の素数さん:2005/07/17(日) 15:42:57
>>508
ありがとうございます。確率はどのようにすれば求められるか教えていただけないでしょうか?
510132人目の素数さん:2005/07/17(日) 15:43:59
pbinom(x,30,0.3)
511132人目の素数さん:2005/07/17(日) 15:52:25
>>508
ありがとうございます!
何回も悪いんですが…
この二項分布を標準化して正規近似することによって、成功数がx回以下となる確率の
近似値を求め、それを図示する方法も教えていただけませんか(>_<)
512132人目の素数さん:2005/07/17(日) 16:13:49
plot(function(x){pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30))},0,30)
par(new=T)
plot(0:30,pbinom(0:30,30,0.3))

正規近似
pnorm(x,mean=0.3*30,sd=sqrt((1-0.3)*0.3*30))

何の宿題?
513132人目の素数さん:2005/07/17(日) 16:23:34
>>512
本当にありがとうございました。
友達の大学の宿題です。統計は習った事があるので出来るかと思ったら
全然分からなくて…。お騒がせしました(>_<)
514132人目の素数さん:2005/07/17(日) 16:44:27
S-PLUSの「labclust関数」に相当することを、R言語で実現したいのですが、
どうすればいいか、チエを貸していただけませんか?

以下のプログラムは、S-PLUSだと動くのですが、R日本語版だと、
最後の1行で
 > labclust(葉の位置,label=学生)
 Error: couldn't find function "labclust"
となって失敗してしまいます。
どうかよろしくお願いいたします。

-------------------------------------------------------------
学生<-c("芥川","菊池","島崎","太宰","夏目","樋口","森")
人数<-length(学生)
果物<-c("ぶどう","パイナップル","りんご","すいか","オレンジ","もも","バナナ","いちご","さくらんぼ","メロン")
果物数<-length(果物)
好み行列<-matrix(rep(seq(果物数),人数),果物数,人数)
好み行列<-apply(好み行列,2,"sample")
dimnames(好み行列)<-list(果物,学生)
好み行列
距離<-dist(t(好み行列),m="manhattan")
木の情報<-hclust(距離)
葉の位置<-plclust(木の情報,label=FALSE)
labclust(葉の位置,label=学生)
-------------------------------------------------------------
515132人目の素数さん:2005/07/17(日) 17:02:54
葉の位置<-plclust(木の情報,label=学生)
じゃだめなの?
516132人目の素数さん:2005/07/17(日) 18:17:35
>>515さん

あっさりできてしまいました!!
ありがとうございます!!
517132人目の素数さん:2005/07/19(火) 15:50:17
evaluation nested too deeply: infinite recursion / options(expression=)?

というエラーメッセージって入れ子構造が複雑すぎて無限再帰になっているという意味ですか?
要素数3000のデータから一つ選んでexp(x)に突っ込むってだけなのになぁ・・・
518132人目の素数さん:2005/07/19(火) 17:44:13
>>517
コードは?
519132人目の素数さん:2005/07/23(土) 10:52:13
eval.c に該当コード有り。evalのし過ぎ。
520132人目の素数さん:2005/07/23(土) 11:29:07
フィボナッチage
mfib <- function(n, x) {
if (n == 0)
x
else
mfib(n-1, matrix(c(1,1,1,0),2,2) %*% x )
}
mfib (4, matrix(c(1,0),2,1))
eigen(matrix(c(1,1,1,0),2,2))
521132人目の素数さん:2005/07/26(火) 02:05:01
identifyは、plotで出力するものにしかできないのでしょうか。
pairsで描画した散布図行列に対して、identifyを行いたいのですが。
identifyで不可能でしたら、そういうことが可能なパッケージがあれば教えていただけませんか。
あともしよろしければ、それを見つけたとき、どんな感じで検索かけたか教えていただけますか。
よろしくお願いします。
522132人目の素数さん:2005/07/26(火) 22:49:09
無いっぽいです。
523521:2005/07/27(水) 00:10:25
>> 522
ありがとうございます。
こうなったら、どうにかがんばって自作してみます。
(むりっぽいかも)
524132人目の素数さん:2005/08/09(火) 13:45:07
Rで4倍精度の計算はどうするのですか?
宜しくご教示お願い致します。
525132人目の素数さん:2005/08/14(日) 16:13:51
基本的なデータ操作のところでいまだに躓く.....
どこかにいい資料ないですかね?

DBからとってきたデータが

case_no, item, value

という並びでcase_noとitemがキーになっている2次元データなので、
解析にかけられるよう列方向にitemを並べたデータフレームを作りたい
だけなんですけど。
helpやRjpWikiやR-Tips(書籍)を見てもうまい方法を見つけられません。
526132人目の素数さん:2005/08/14(日) 17:28:00
>基本的なデータ操作のところでいまだに躓く.....
どこかにいい資料ないですかね?

これはたしかにそうおもうね
数こなすしかないんだろうけど


>DBからとってきたデータが

ってのはマトリクス?リスト?
527132人目の素数さん:2005/08/14(日) 17:37:16
>基本的なデータ操作のところでいまだに躓く.....

自分も同じ。
SASが手放せない。

良い資料が欲しいですね。

528525:2005/08/14(日) 22:35:01
同じように思っている方は多いんですね。
こういったところをしっかり書いた入門書が欲しいですね。

>ってのはマトリクス?リスト?

元はDBから抽出したタブ区切りテキストで、read.delim()で読み込んで
データフレームにしています。

元の問題ですが、とりあえず、itemでsplit()したものをcase_noでmerge()すると
いう方法でなんとかいけました。
ただ、いっぺんにはmerge()できないのでfor()を使っていたり、「ホントにこんな
面倒なことをしないとできないの?」という感じです。
529132人目の素数さん:2005/08/14(日) 23:28:10
そもそもRってデータマネジメントには向いていないのでは?
AWK、PERLを併用するしかないような気がする。

SQLでデータフレームを操れればまだ何とかなるような気もするが。
530132人目の素数さん:2005/08/15(月) 00:21:12
データフレームとして読み込むためにawkで下処理ってのはよくやる
RDBMを操るパッケージはCRANにいろいろあるからそれを使うのも一つの手かもしれない

で元の問題なんだけどどういうデータがどうなって欲しいのか理解できないので
データサンプルとコードを(問題なければ)見せてもらえればアドバイスできるかも
531お盆:2005/08/15(月) 08:45:54
初歩的なことですが,教えてください.
同一の100人を対象に,同じ調査を2回行いました.
途中で,解説を行い,解説前後の比較を行いたいと考えています.つまり,解説の効果の判定です.
一回目の正解は32人,2回目の正解は63人でした.これを統計的に解析する方法を教えてください.
簡単すぎて,手元の本に載っていないのです.
532132人目の素数さん:2005/08/15(月) 08:48:21
>>531
mcnemar.test?
533お盆:2005/08/15(月) 08:57:17
132人目の素数さん,レス,ありがとうございます.
統計学の基本知識も乏しいもので,場違いかもしれません.
困っているのは,あまりに簡単すぎて,統計学の本に載っていないことなのです.
というより,そもそも調査自体が単純すぎるのでしょうか?
教えてください.
534532:2005/08/15(月) 10:08:07
>>531
mcnemar testでググってください。
適合度検定を含め、統計の教科書には
スペースの関係もあり、載せられないですね。

χ二乗検定の自由度の計算自体も和書には
なく、Raoを持ち出さないとダメでした。
日本じゃ専門書売れないでしょうね。
Raoの訳書は今でも売っているのかな。

535525:2005/08/15(月) 11:39:08
>>530
このようなデータがあり、case_noとitemに現れる値は不定とします。
case_no,item,value
"CASE1","ITEM1",1
"CASE1","ITEM2"2
"CASE2","ITEM1",4
"CASE2","ITEM3",5
"CASE3","ITEM2",6
"CASE3","ITEM3"7

ここから、下のようなデータフレームを得たいのです。
$case_no,$ITEM1,$ITEM2,$ITEM3
CASE1,1,2,NA
CASE2,4,NA,5
CASE3,NA,6,7
536525:2005/08/15(月) 11:39:59
(続き)
試行錯誤の結果、出来たのはこんな感じです。

# ファイル読み込み
rawdata <- read.delim( ファイル名, header=TRUE )
# itemでデータ分割
items <- split( rawdata, rawdata["item"] )
# 結果のデータフレームを準備
frame <- data.frame( unique( rawdata["lot_id"] ) )
# 各itemをcase_noでマージ
for ( i in names(items) ) {
frame <- merge( frame, items[[i]][ c( "case_no", "value" ) ], by=c("case_no"), all=TRUE )
names( frame )[ length(frame) ] <- i
}
537132人目の素数さん:2005/08/15(月) 21:10:01
どっかのに使いやすくて制限がないスプレッドシート式のデータエディタねえかなあ
538お盆:2005/08/17(水) 17:06:12
132人目の素数さん

ありがとうございました.
書き込みできなくて,お礼が遅くなりました.
539132人目の素数さん:2005/08/17(水) 18:57:04
R初心者ですみません。
5万ケタ程度の表集計にRを導入したのですが、100桁ごとに平均をだしたいと思って四苦八苦しています。範囲集計、てどうやってやるんですか?
540132人目の素数さん:2005/08/17(水) 21:13:41
randuが始めから入ってたので使ってみた。
vec<-randu[,1]; mapply(function(x){y<-x*100;mean(vec[(y+1):(y+100)])}, 0:3)
541132人目の素数さん:2005/08/17(水) 23:05:23
HOGE <- function(func, mat, num, n, m) {
m<-m/num -1;
mapply(function(x){vec<-mat[,x];mapply(function(y){y<-y*num;func(vec[(y+1):(y+num)])},0:m)},1:n)
}
HOGE(mean, randu, 100, 3,400)
542132人目の素数さん:2005/08/18(木) 17:47:33
>>537
emacsのCSVモード
543132人目の素数さん:2005/08/18(木) 17:49:02
なんだか初心者が増えているみたいで。嬉しいな。裾野は広がっているって感じがする。
544132人目の素数さん:2005/08/18(木) 17:56:26
>>529
awkもperlも面倒なので、使い捨てシェルスクリプトを書いている。
cut paste cat grep sed tr sort diff head tail ぐらいで十分だ。今のところ。
545132人目の素数さん:2005/08/18(木) 21:29:11
>>544
おいおい、それらを駆使するぐらいなら
awk,perlの方がずっと楽だぞ。使えるならな。
546132人目の素数さん:2005/08/19(金) 07:31:25
>>543 ちょっとわかったやつが、初心者の質問の
言葉じりとかにからむ傾向が強いのも特徴。これがなければもっと広がるだろうな
547544:2005/08/19(金) 11:19:04
>>545
awkは使えないけど、perlは大分鍛えたつもりだが、やっぱりシェルスクリプトの方が
らく。主観の問題だろうけど、perlだと襟を正してデバックしながらやらなくちゃいけ
ない気がする。それなら、むしろRでgrep sub gsub regexpr substr strsplit pasteを
使ってRのスクリプトに加えちゃう。
548132人目の素数さん:2005/08/19(金) 23:04:26
csvライブラリを使ったrubyもおすすめ。
元CSV >> rubyで列単位で抽出・加工 >> Rのread.csv
のような使い方が便利。
549132人目の素数さん:2005/08/20(土) 01:07:39
>>547
Rのスクリプトに加えるってどんな感じっすか?
550132人目の素数さん:2005/08/20(土) 06:57:28
>>535
このような場合,RDBMSから抽出するときに,クロス集計をおこなってテーブ
ルの形式を変換するのが,常套手段かと。

元もとのテーブルをそのままR読み込み,それからクロス集計させても同じ結
果を得ることでしょうが。。。
551132人目の素数さん:2005/08/23(火) 20:14:30
だれかgrassと連携させてる使っている人います?
winでcygwin+grassからだとRを参照するのは無理なんかな〜
552132人目の素数さん:2005/08/24(水) 00:16:41
The GRASS PackageのGRASS.connect()に
get.cygwinstring()とset.cygwinstring(cygwin)というのがあるが,
詳しくはワカラソ.使った人おる?
553132人目の素数さん:2005/09/04(日) 13:41:30
二年。
554132人目の素数さん:2005/09/05(月) 18:11:30
age
555132人目の素数さん:2005/09/14(水) 18:32:31
556132人目の素数さん:2005/09/15(木) 11:13:11
R-help mailing list に話題が挙がってたね。
557132人目の素数さん:2005/09/15(木) 22:00:18
ベルヌイ分布
2項分布
ポアソン分布
正規分布
指数分布
ワイブル分布
の形状を把握、及びそれらの平均と分散を R を使って計算。。。

って出来る方います?
558132人目の素数さん:2005/09/15(木) 23:24:17
>>557

簡単だと思うけど...
学校の宿題?
559132人目の素数さん:2005/09/15(木) 23:37:55
>>558
はい、宿題です。
560132人目の素数さん:2005/09/16(金) 16:29:32
Rってmulti-threadな処理ってできますか?
561132人目の素数さん:2005/09/19(月) 19:27:16
>>559

それなら、自分で考えなさい。

>>560

R本体にはスレッドコントロールをするAPIはないような感じ。
マルチスレッド版のBLASを使うぐらいか。
R-helpにはRVPMっていう名前がでてきたけど、ぐぐってもひっかからない...
562560:2005/09/20(火) 12:10:34
>>561

レスどうもです。どうしてもマルチスレッドやりたい時は
perlからマルチスレッド立てて、perlからRを走らせるとか、、
が自分の思いつく方法なのかなぁ・・・ってできるんだろうか。
563132人目の素数さん:2005/09/22(木) 09:58:18
つまらん話だが、Rってググるとき困るよな。
もちっと特徴的な名前だったらよかったのに。
みんなどうやってる?
俺は「R 統計」とか。R言語と呼ばれる機会も意外と少ないし。

まあRjpWikiのおかげでググる必要あまりないっつーのもありますが。
感謝です。>>Rjp関係者
564132人目の素数さん:2005/09/22(木) 15:26:27
>>563

「R 時系列」とか「R 生存時間」とかより
「Rを 時系列」とか「Rで 生存時間」のほうが
若干良いような気はする。
565132人目の素数さん:2005/09/22(木) 22:04:55
R statistics
566132人目の素数さん:2005/09/23(金) 13:42:00
>>525
>helpやRjpWikiやR-Tips(書籍)を見てもうまい方法を見つけられません。

ネット版のR-Tipsはどうですか?
http://cse.naro.affrc.go.jp/takezawa/r-tips.pdf
93nからデータの基本的な扱い方が載っています.けど,あんまり詳しくないかなぁ・・・
567132人目の素数さん:2005/09/26(月) 09:42:52
二要因分散分析はできたんだけど、
そのあとのpost hoc testはどうやってやればいいの?
568132人目の素数さん:2005/09/26(月) 13:10:06
なかなか面白いページをみつけたよ。英語だけど。
http://www.brandonu.ca/zoology/rutherford/RBookWebSite/RBook_pdf.html

>>567
上記ページの"Multiple Comparisons"が参考になるんじゃない?
569132人目の素数さん:2005/09/27(火) 22:06:53 ID:0
例えば下記のデータで
x <- read.csv("test.csv")
for(i in c("A","B")){
 plot(x$i)
}
とするとどうもうまくいかない。
データフレームにしてfor(i in 1:2){x[,i]}
とすればいい話なんだが解決策どなたかご存知?
##テストデータ test.csv
year,A,B
1991,50,100
1992,40,300
1993,30,500

>>525
CRANのサイト内をググってもダメ?
あとはgoogleでfiletype:.R として拡張子指定でググルとかソースしか出てこないけど・・・
570132人目の素数さん:2005/09/27(火) 22:30:35 ID:0
>>569

for(i in c("A","B"))のままでも
plot(x$i) を plot(x[,i])にすれば通ると思うけど...
どううまくいかないのかがわからない...
571132人目の素数さん:2005/09/28(水) 17:32:03
>>579
あ”、間違えてた。すみません。
こないだは、うまくいかなかったのは
データのA=1991 B=1992 で、
for(i in c("1991","1992")){ ・・・
としたときだった。as.characterとか駆使したんだが・・・
572132人目の素数さん:2005/09/28(水) 21:44:23
やりたいことは、データフレームにyearで検索をかけたいということ?
grep()等もありうるけど、これでどうだろう?

cond <- is.na(x$year) # 結果が FALSE FALSE FALSEになれば別の式でもOk
for(i in c("1991","1992"))
cond <- cond | x$year == i
plot(x[cond,c("A","B")]
573132人目の素数さん:2005/09/30(金) 20:10:08
sjava わかる人いますか?
574132人目の素数さん:2005/10/02(日) 18:21:17
>>572
そんな感じですが、要はAを1991とかBを1992とか数値にした場合にForがまわらないということなのですが・・・
575132人目の素数さん:2005/10/04(火) 23:43:32
相関ルールを見つけるパッケージってありますか?
576132人目の素数さん:2005/10/05(水) 11:46:29
arules
577132人目の素数さん:2005/10/05(水) 11:49:26
578575:2005/10/05(水) 11:54:08
ありがとうございます
579132人目の素数さん:2005/10/05(水) 16:24:24
580132人目の素数さん:2005/10/08(土) 14:40:01
names と rownames の違いを教えてください
581132人目の素数さん:2005/10/08(土) 15:03:06
>>580
?names
?rownames
582132人目の素数さん:2005/10/12(水) 15:01:06
Rで定義されている関数内でどのような計算がされているのかが知りたく,
定義式を見てみたいのですがどうすれば見れるでしょうか?
具体的にはshapiro.testなのですが,
インストールフォルダ\library\stats
を探してみたのですが,説明文らしきものは見つかったのですが関数そのものは
見つかりませんでした
583132人目の素数さん:2005/10/12(水) 18:17:36
>>582
R 上で () をつけずに呼び出せばどう?
584132人目の素数さん:2005/10/12(水) 22:49:49
locate shapiro
grep shapiro `locate /usr/ |grep \\.R$`
or
grep shapiro `find /usr/ -name \*.R`
windowsならcygwin入れるべし。
585sage:2005/10/21(金) 16:43:48
>>582
583の方法でよいと思われる「shapiro.test」とするだけで・・・

あるリスト「 L 」内の同じ行列数の複数のデータフレーム同士の
平均を求めたいのですが、
mean(L[[1:3]])とはできないようで、いい方法あります?
とりあえず
(L[[1]]+L[[2]]+L[[3]])/3
とやればできるのだが、もっとうまいやり方がありそうですが・・・
586132人目の素数さん:2005/10/21(金) 16:44:52
しまった、あげちゃったOTL
587132人目の素数さん:2005/10/22(土) 09:56:20
>>585
mean(unlist(L)[1:3])

>もっとうまいやり方がありそうですが・・・
っと言って他人の力を借りるのは、Rくらいの言語を自力で作れるくらいになってからにしましょう。
もっとうまいやり方は Rを使わないという手も含めて無数にありますから。
588132人目の素数さん:2005/10/22(土) 11:16:06
改良
list.filter <- function (classListLis, classListFunc) {
classListLis[unlist(lapply(classListLis, classListFunc))]
}

list.asMatrixBy <- function (lis,func) {func(unlist(lapply(lis,func)))}
list.mean<- function (x){list.asMatrixBy(x,mean)}

list.mean(A[1:3])
list.mean(A[c(1,2,3)])
list.mean(list.filter(A, is.numeric))
589132人目の素数さん:2005/10/22(土) 16:55:31
先生ありがとうございます。
関数の作り方も含め勉強になります。
これを参考に自分で書いてみます。

590132人目の素数さん:2005/10/23(日) 00:28:10
dist関数でマハラノビス距離を求めることはできないのですか?
591132人目の素数さん:2005/10/23(日) 09:42:55
help(dist)
help(mahalanobis)
592132人目の素数さん:2005/10/23(日) 18:10:25
関数:f(x)を最小にするxを見つけたいんですが、どんな関数を使ったら、
早いでしょうか? (教えて君ですんません(鬱。)
593592:2005/10/23(日) 18:15:59
optim()とかそんなところでしょうか?
594587:2005/10/23(日) 23:10:35
「もっとうまいやり方」についてとやかく書いたのは、
綺麗で高速なプログラムの書き方を追及するよりも
自分の仕事をしっかりやりなさいって意味であり、
教えて君ですんませんって書けという意味ではありません。

>>592
「全ての集合」とか言うと論理が破綻するので、
x は doubleのvector とか言った方がよい。
optimでは微分系のが速いと思うけど問題によりけり。
595困ってます:2005/10/25(火) 21:55:40
知識が無くて困ってます
18.514.818.416.416.115.415.415.3
8項目の平均が16.287
標準偏差が1.422
です。
ばらつきの大きさがどの程度なのかを知りたいのですがどうすればよいでしょうか。
教えてください
596132人目の素数さん:2005/10/25(火) 22:53:50
1.422
597132人目の素数さん:2005/10/26(水) 16:40:58
>>595 箱ひげ図
598132人目の素数さん:2005/10/27(木) 13:03:55
>>595
ばらつきの大きさがどの程度なのかを知るための数値が標準偏差です。
数値をみて判断するのは、比較対照がない場合は主観です。
私の主観では、標準偏差が0.1程度ならほとんどが16のあたりに固まっている。ばらつきがない。
10ならかなりばらばら、1.422ならそれなりにばらばら。
599132人目の素数さん:2005/10/27(木) 14:25:49
hist()の間隔を指定したいのですが、breakes=c(0,1,2,3)とはできますが、
最大最小を気にせずこの間隔だけ(上記の例なら1)
を指定して描くことはできないでしょうか?
600132人目の素数さん:2005/10/29(土) 17:59:58
>>595
データが正規分布に従うと仮定してCritical Intervalを計算したよ。
95%で [15.098, 17.477] でした。
この範囲が母平均を含む確率が95%だよ、ということ。
観測平均が16.287だから、まぁそれなりなんじゃないかな、と。

(蛇足:標準偏差のCIは [0.94066, 2.8956] でした。)
601132人目の素数さん:2005/10/29(土) 19:58:25
>>600
:観測平均が16.287だから、まぁそれなりなんじゃないかな、と。
ちょっと意味不明。

shapiro.tstすると
Shapiro-Wilk normality test
data: x
W = 0.8322, p-value = 0.06263
ですね。
602132人目の素数さん:2005/10/30(日) 02:35:49
ワイブル分布のパラメータ推定で..非線形回帰か関数の最適化でいけるはずと思って
やってみたが(だから,コードといっても,要は分布関数にfitさせるだけなんだが),
optim()ではどうもうまく推定できなかった。非線形回帰では,初期値をある程度適当に
とれば,それなりにいい結果が得られるようであった。これで十分な精度かどうかは
不明だが,悪くはないと思う。なお,なんらかの確率密度関数に従うと思われるデータxの
近似曲線をプロットするだけなら,plot(density(x))とすればいい..
ttp://phi.ypu.jp/swtips/Rnewsarchives2.html
603132人目の素数さん:2005/10/31(月) 05:24:23
age
604132人目の素数さん:2005/11/11(金) 07:23:31
敷居が高いクソ統計ソフト、とか思っていたが、Rコマンダーってのを入れたら、感覚的に使いやすくなった感じがする。
Rユーザーがこれを宣伝しないのは何故?
605132人目の素数さん:2005/11/11(金) 09:45:20
606132人目の素数さん:2005/11/11(金) 23:38:38
WINのJGRやたら重かった
607132人目の素数さん:2005/11/12(土) 04:50:41
>>605

dクス。
ますます敷居が下がりました。
608132人目の素数さん:2005/11/12(土) 11:46:18
>>604
> Rユーザーがこれを宣伝しないのは何故
たぶん、慣れた人は使わないからじゃない?私の場合は、emacsからRを操作する方が効率がい
いし、生産性が高いから、emacs+essばかりになっている。Rユーザの多くは、「Rcmdrを使っ
ていない=紹介できない」という状態だと思うよ。
609132人目の素数さん:2005/11/12(土) 18:18:01
>>604
試しに計算センターのPCにインストールしたら、
起動するのみメチャ時間がかかり、とても講義に
使えませんでした。
610132人目の素数さん:2005/11/13(日) 01:58:23
>>609

確かにローディングはちょっと遅くなったが、こっちのパソコンではそれほど気にならなかった。
エクセルのローディングの方がはるかに時間が掛かる。
どの道、初心者向けとしてはRcmdrは悪くないと思う。
機能的に不満が募っていけば、その内RのCLIやりたくなってくるかも。

もうちょっと色々な機能をRcmdrのプルダウンに実装出来ればもっと良かった。
せめて『Live 2ch』くらいのボタン数とかあればなあ・・・・・・。
そーゆーの作って、エロイ人
611132人目の素数さん:2005/11/13(日) 07:01:48
だいたい100万個データを入れると、逝ってしまうのが多い
612132人目の素数さん:2005/11/13(日) 07:02:55
ベクタープロセッサーを搭載した、200個並列のマシンが必要です
613132人目の素数さん:2005/11/13(日) 11:19:04
200個並列って、半端な数だなー。
614132人目の素数さん:2005/11/14(月) 16:53:54
Rにはエクセルで言う『Solver』みたいな機能ありますか?
615132人目の素数さん :2005/11/23(水) 03:20:36
変数の数がケース数より多いデータはRでは主成分分析できないんですか?
princomp()ではエラーがでてしまいますね。

青木先生が公開されている、pca()、princomp2()もやっぱり同じようなエラーがでてしまいます。

Rwikiのリンクを参考に調べてみたんですが、うまい解決法が見つからなくて…。

prcomp()ではとりあえず分析してくれるのですが、princomp()との違いは何なの?


616132人目の素数さん:2005/11/26(土) 07:00:30
age
617132人目の素数さん:2005/11/28(月) 01:51:51
元々、変数の数がケース数より多いときって主成分分析できましたっけ?
618617:2005/11/28(月) 02:02:58
あ〜そうだ、線形独立なベクトルをケース数より多く作れないから、
変数の数がケース数より多いとだめなんじゃない?
619132人目の素数さん:2005/11/28(月) 02:33:31
転置したらどないですか
620132人目の素数さん:2005/11/28(月) 12:07:55
>>619
計算はできるだろうけど意味合いが変わらない?
621132人目の素数さん:2005/11/30(水) 14:03:01
>>614
optim
622132人目の素数さん:2005/11/30(水) 20:07:05
>>621

dクス
623132人目の素数さん:2005/12/06(火) 19:08:09
転置無用
624132人目の素数さん:2005/12/07(水) 19:10:27
age
625132人目の素数さん:2005/12/16(金) 22:52:00
Rはお節介で動きが読みにくい関数が多く感じる
626132人目の素数さん:2005/12/16(金) 23:29:42
具体的に
627132人目の素数さん:2005/12/17(土) 01:39:41
ANOVA、任意の2群に対してt検定をしたいのですが、オブジェクトがないと言われます。
CSVファイルからデータ入力はできました。
どうやら、objectとして認識して欲しい物が
objectとして認識されていない事が問題なのではないか。
というところまではわかりました。

私としては「AO」や「B0r」などがobjectとして認識されると有り難いのです。
その上で「AO」と「B0r」でt検定をしたいのです・・・
手入力も試みましたが、今度は表全体(x)をobjectとして認識させる方法?が分からずに困りました。
>>2のページは見たつもりです。
かなり格闘しましたが、暗雲が立ち込めています・・・
回答もしくはヒントを与えていただけると有り難いです。
628627:2005/12/17(土) 01:40:37
ちなみに
「str(x)」に対しては
`data.frame': 5 obs. of 12 variables:
$ A0 : num 63.6 64 63.9 61.5 63.1
$ A0r: num 53.2 61.7 54.5 53.9 53.8
・・・(中略)
$ B8 : num 85 85.3 87 87 85.7
$ B8r: num 77.1 75.2 76.5 77.8 78.3

「x」に対しては
A0 A0r A4 A4r A8 A8r B0 B0r B4 B4r B8 B8r
1 63.6 53.2 80.8 72.6 84.8 78.1 63.8 57.3 76.9 72.8 85.0 77.1
・・・(中略
5 63.1 53.8 80.8 73.1 86.1 76.9 60.2 55.6 77.1 73.1 85.7 78.3

「objects()」に対しては
[1] "x"

「A0」に対しては
エラー:object "A0" not found

「t.test(A0,B0)」に対しては、当然ですが
以下にエラーt.test(A0, B0) : object "A0" not found
と出力されます。
629132人目の素数さん:2005/12/17(土) 19:09:18
age
630627:2005/12/18(日) 01:17:19
>>627
自己レスですが、
A0 <- x$A0
などとする事で解決しました。
正攻法ではない気もしますが、、、
631132人目の素数さん:2005/12/18(日) 02:56:32
>>630
正攻法かどうかは知らないが
t.test(A0,B0,data=x)
とか、
attach(x)
t.test(A0,B0)
なんて方法もあるよ
632132人目の素数さん:2005/12/18(日) 23:15:24
>>630
ごめん。
t.test(A0,B0,data=x)
はだめだ。
t.test(データ ~ グループ化因子 , data=x)
じゃないと。
633627:2005/12/19(月) 00:49:53
>>632
レスありがとうございます。
データをどう認識してもらうかってのが苦戦してました。
attach()が便利そうですねぇ。一つ賢くなりました。
あと、検定の方はおかげさまでうまくいきました!!
本当にありがとうございました。
634132人目の素数さん:2006/01/02(月) 03:33:22
624
635132人目の素数さん:2006/01/06(金) 12:35:26
<- の代わりに = を使うと,何か問題が起こったりするんですか?
636132人目の素数さん:2006/01/07(土) 11:34:23
>>635
精神衛生上の問題だけじゃないの?
矢印の方が付値のイメージに合ってるかもしれないけど
オレは他の言語で慣れてるし、タイプしやすい「=」のが好き。

あと、「->」と「<-」の使い分け程度の差なんじゃないでしょうか。
637132人目の素数さん:2006/01/07(土) 14:52:16
あ、あと等号「==」と付値「=」の混同を防ぐためでもあるのかな。
638635:2006/01/09(月) 23:25:51
問題ないですよね。ありがとうございました
639132人目の素数さん:2006/01/10(火) 11:57:13
>>636
精神衛生上というのは同意。代入は <- で関数のオプションは = だとなんだか安心。
<- もESSだとアンダーバー1ストロークで入力できるので、私の場合は変わらない。
640132人目の素数さん:2006/01/15(日) 01:14:27
ESS (Emacs Speaks Statistics) なんていうものがあったんですね。
Emacs使いとしては嬉しい限り。早速使ってみます。
641132人目の素数さん:2006/01/15(日) 14:49:56
やっぱ無保証のソフトを信じすぎるのもアブナイね。
642132人目の素数さん:2006/01/16(月) 00:19:55
>>641

まぁソフトウェアにバグはつきもの。
そして、売り物でも使用許諾契約に「No Warranty」が明記されているものがほとんどだという罠。

SASでもSPSSでもS-PLUSでもRでも, WindowsでもLinuxでも, 信じすぎるのはまずい。
643132人目の素数さん:2006/01/16(月) 09:31:55
Rにチャレンジしようと思っているのですが、散布図行列を表示するまでを学べるサイトってないでしょうか?
R2.2にコマンダーを入れています。
Wikiは基本的に知識のある人向けみたいでしたので基本的な操作などのその手前で悩んでる人向けの
サイトが見つかりません。
644132人目の素数さん:2006/01/16(月) 09:35:24
質問なのにSAGEてました。スマソ
645132人目の素数さん:2006/01/16(月) 09:58:32
>>643

初心者向けの説明はある程度系統立てて執筆する必要があるから、メモ感覚で書き込めるWikiにはそぐわないのかもしれない。
Rcmdrの使い方というのはないかもしれないけど、R-Tipsがよいのでは。Commander自体の使い方は見ればわかるから、知りたいのは
おそらくデータフレームとは?みたいな部分だろうし。
最もお手軽にはじめたいなら、最近は入門書もたくさんあるので(Wikiのリンク集参照)読むべし。

646132人目の素数さん:2006/01/16(月) 10:44:16
>>643

『工学のためのデータサイエンス入門』のp.8に散布図行列表示の例アリ。
pairsのコマンドを使うみたい。
Rのおまけに付いてるデータで"airquality"ってデータがあるから、それで試して見ればイイと思う。
Rコマンダーでは、まず、

『データ』→『パッケージ内のデータ』→『アタッチされたパッケージからデータセットを読み込む』

でポップアップが出てくるから、そこでパッケージで『datasets』を選択、データセットで『airquality』
を選んでOKボタンをクリックして下さい。(かなり下の方にあります。Rでは大文字と小文字を識別
するので、大文字のA〜Zの表記のアトに小文字のa〜zが来ます。)
そしたらRコマンダー上でデータセットでairqualityが選択されている状態になる筈です。

そこでRコマンダー上のスクリプトウィンドウに次のコードを入力します。
(data(airquality, package="datasets")って表示されてるでしょうが、次の行から入力して構いません。)

pairs(airquality, panel = panel.smooth, main = "airquality data")

そして今書いたコードをマウスで選択して色を反転させて、右クリックボタンで『実行』を選びます。
そうすると散布図行列が表示される筈です。

多分これで上手くいく筈だと思います。

Rcmdrはヘンなバグがあって、R本体では問題なく動くコードがRcmdr上では動作しない場合もあるんで、
あんまり信用しすぎない方がいいでしょう。
Rcmdr上でも散布図行列のプルダウンメニューがありますが、こちらで試したところ、変数選択でのスクロール
ウィンドウが突如正常に動き出さない、と言ったような現象も見られました。



647132人目の素数さん:2006/01/16(月) 10:53:43
>>643

ついでに次のPDFがあります。

〜Rコマンダーについて〜
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf

これを読めば、基本的にRコマンダーの基本的な使い方が分かります。

tck何とか、の知識があれば、Rコマンダー自体カスタマイズできるそうなんですが、
生憎そっちは良く分かりません。
プルダウンメニューなんかもカスタマイズできるみたいなんですがね・・・・・・。
648132人目の素数さん:2006/01/16(月) 10:57:31
>>647

>基本的にRコマンダーの基本的な使い方

すいません。バグりました○| ̄|_
649132人目の素数さん:2006/01/16(月) 20:44:19
「基本的に基本的な」っていう日本語は基本的にくどいけど基本的な間違いではないかも。
http://www.google.com/search?q=%E5%9F%BA%E6%9C%AC%E7%9A%84%E3%81%AB%E5%9F%BA%E6%9C%AC%E7%9A%84%E3%81%AA
650132人目の素数さん:2006/01/16(月) 20:48:23
>>645
レスありがとうございます。
R-Tipsでテキストデータの読み込みから勉強していきます。

>>646-647
教えてあげた例できちんと表示できました。
Wikiの例を見ると、色分け表示も出来るみたいですしファイルを読み込むことが出来たら色々とチャレンジしてみます。

また壁にぶつかったら皆様よろしくお願いします。明日の夕方までを目標にがんがります。
651132人目の素数さん:2006/01/16(月) 21:04:44
>>649

○| ̄|_

>>650

Rcmdrですと、『データ』→『データのインポート』→『テキストファイルから』で大体のデータはインポートできます。
が、これもバグがあって、たまにデータフレームとして認識してもらえなかったり、またインポートされてもアタッチ
できなかったりします。この辺りRってかなり不安定なんですよね。

また参考PDFを紹介しておきます。

〜Rにデータを読み込ませる方法〜
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-data.pdf

〜Rのデータフレームについて〜
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-dataframe.pdf

〜データハンドリング・データ加工〜
http://cwoweb2.bai.ne.jp/~jgb11101/files/R-dataframe2.pdf
652132人目の素数さん:2006/01/16(月) 22:52:17
>>651
あっ、四苦八苦してたらレスがw

ありがとうございます。読んでチャレンジしてみます。

エクセルのファイルを読み込もうとしたらRODBCを使って色々と書かないといけないみたいなので、
CSVかプレーンテキストに変換しようとしてました。
653132人目の素数さん:2006/01/17(火) 00:25:54
>>652

RODBC使用されてるんですか。
RとExcelって相性悪くって一般ユーザーにはキツいですよね(笑)。
元々研究室でシコシコやる為に開発されてるトコがあるみたいなんで、Rは汎用ソフトとしては確かに
キツいニュアンスがありますよね。あんまり親切な設計ではないと僕も思います。

RODBC使わないでも、Excel側で『ファイル』→『名前を付けて保存』を選び、ファイルの種類をエクセル
ファイルではなくって、テキスト(タブ区切り)かCSV(タブ区切り)を選択して保存したあと、Rcmdrから
『テキストファイルをインポート』するのが一応常套手段だと思います。

他にもRExcel

http://www4.kcn.ne.jp/~felix/Softwares/R/RExcel.html

と言うのがあって、これはExcel上からRを操作できると言う謳い文句・・・・・・の筈なんですが、残念ながら
これもバグが多いようです(涙)。
僕のExcelにも実装しましたが、マトモに動いた例がありません(涙)。
654132人目の素数さん:2006/01/17(火) 00:50:08
普通にカンマ区切りファイル経由の受け渡しで困ったことがないので、
なぜここでつまづく人が多いのかわからない...
Excelのデータって一度インポートしたら、あとの加工やグラフ作成は全部Rのほうが
カンタンにできるから, XLSブックを直接読める必要はあんまりないと思うけど。
655132人目の素数さん:2006/01/17(火) 01:04:24
>>654

>>651でも書きましたけど、Rでのカンマ区切りファイルでも万全ではないのです。
656132人目の素数さん:2006/01/17(火) 01:05:15
↑あ、『カンマ区切りファイルの受け渡しでも』ですね。
657132人目の素数さん:2006/01/17(火) 01:44:04
>>655

具体的にどのようなファイルで、
「データフレームとして認識してもらえなかったり、
またインポートされてもアタッチできなかったり」
したことがありますか?まだそういう経験がないので勉強させてください。

また、bug report はされていますか?もしされたならばちょっとみてみたいので
R-develの番号を教えて下さい。
(そのあたりのソースをちょっといじってるもので...)
658132人目の素数さん:2006/01/17(火) 02:14:48
>>657

詳しくはRjpwiki

http://www.okada.jp.org/RWiki/index.php?%BD%E9%B5%E9%A3%D1%A1%F5%A3%C1%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6%281%29

の『CSVファイルのインポート』の項目をご覧下さい。
日本語化していないRの時代の話(?多分)なんですが、日本語化された今でもいまだに似たような事が起こります。
と言うより日本語ファイル名によって読めたり読めなかったりするようです。
エクセル等で顧客管理等をしてる場合、ファイル名を一々変更せねばならない手間を考えると不具合と言えると
思いますが・・・・・・。
あとセルに入力された日本語のデータなんかも『構文エラー』として認識されたりします。
いずれにせよ、Rcmdrの話なんで、657氏に有用な話かどうかは知りませんが・・・・・・。
659132人目の素数さん:2006/01/17(火) 08:02:37
>>658

やはり日本語の場合でしたか。
カンマ区切りファイルは文字コードの情報を持っていないし、Excelの専売特許と
いうわけでもないので、Windows環境でもShift_JISとUTF-8のテキストが混在するように
なった現在、どちらかなのかを明示的に指定(2.2.0以降だとできると思います)しないと
読めないのもやむを得ないかなと思います。文字コードの自動判定機能を日本語の場合だけ
入れるというのも不適切だし...
ファイル名も同様です。Win98/MeだとShift_JISで、2000/NTはUTF-8ですよね。でも98/Me
がShift_JISなのも日本だけの話だから、本家のコードに組み込むのもよくないし...

Officeのように、いつまでも日本語版、英語版、中国語版、韓国語版、ヨーロッパ版と
分けて使わなければならない状況よりは、多少文字コードの明示的指定の手間は増えるけれども
1つのバイナリですべての言語環境に対応できたほうがよいだろう、ということでこういう形に
なっているのだと思います。本来こういう文字コード変換はOS側でやってくれるべきものだから、
国際化時代以前のOSの限界なのかなぁと思ったり。

次期Officeの標準XMLフォーマットなら内部に文字コード情報を含んでいるから、Rでも
(最初はパッケージが何か必要かもしれませんが)そのまま読める期待は大です。

660132人目の素数さん:2006/01/17(火) 13:36:24
>>658
それは、Rの問題と言うより、データファイルの扱いの一般常識に欠けているのが原因だと思うけど。
HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。日本語ファイル名を読めたり読めなかったり違いは、想像するにShift-JISコードを使っ
ていて、文字の1バイト目にバックスラッシュ(円記号)がある場合でしょ。これを知らないとCGIを
書いているときにも文字化けで悩まされる。いわば、日本語文字コードの不具合。
まぁ、現実的な解として、kakasiでファイル名をローマ字に自動変換してからインポートするバッチ
ファイルをかませて、見かけは日本語ファイル名を指定してそのままインポートするようにすればよ
いのでは。もしくは、UTF8をファイル名の文字コードに採用しているWindows2000などに変更するとか。


661132人目の素数さん:2006/01/17(火) 14:03:17
>>659

なるほど。どっちかと言うとWindows側の問題なんですね。

>>660

>HTMLを書いたり、ftpでデータ交換したり、ファイルサーバを運営しても日本語ファイルの問題は
発生する。

ただし、言っておきますが、全員が全員HPを持ってたりファイルサーバを運営しているわけではないのです。
それを『一般常識』と言っちゃうのはどうかと思います。
逆に言うと、『そのぐらいの知識がなければRは使えない』と言うご意見ならRは単に『一般向けソフトではない』
と言った意味になります。
ファイルの互換性が高い方が『一般向け』ではあるのですから。
662132人目の素数さん:2006/01/17(火) 14:45:02
>>661
確かに一般常識というのは言い過ぎたかも知れないけど、一般的な国際的ソフトウェアを
扱う場合には知らないと苦労する知識だと思う。Rは世界の人々を対象とした一般向けで
あり、『日本人向けに特殊化されたソフトウェア』ではないと思う。あなたは、日本語を
使う特殊な人口集団向けのソフトウェアを『一般向けのソフト』とよぶのかい?
Rをあたかも『日本人向けに特殊化されたソフトウェア』として扱おうと無理をするとそれ
なりの知識が必要になる。

663659:2006/01/17(火) 15:42:00
>>662

おっしゃる通り、R好きとしては現在では日本語を扱うときのちょっとした不具合は
ある程度しょうがないものとして受け入れてほしい。
でも、日本人としては日本語のファイル名もコンテンツも全くシームレスにあつかえたほうが
確かに幸せ。
現状、WindowsもMacOS XもShift_JISの亡霊を引きずっているところが多少残っているし、
LinuxはX11をまだ切れないし、
海外ツールの本家バージョンでそのまま日本語がたいがい通る、というところにいきつくには
あと2,3年は必要なのかなぁ。
664132人目の素数さん:2006/01/19(木) 19:21:51
Rでの直交表実験の解析について教えてください。

分散分析表はaov(データ ~ . , データと計画行列のデータフレーム)で求まることはわかったのですが
1.このときの最適水準を求める方法
2.最適水準での母平均の点推定と区間推定
3.最適水準と他の水準との母平均の差の点推定と区間推定
の方法がわかりません。
これらを計算してくれるパッケージや関数はありますか?
665132人目の素数さん:2006/01/24(火) 03:33:40
学校の情報処理論というコンピューター演習の授業の宿題で、以下のキーワードを使って
データ予測のための統計と検定について150字程度で説明しなければならないんですが、
いまいちよくわかりません。 よければ誰か教えてください。

キーワード:基本統計量,検定
ポイント:
データを予測するまでの流れ
分析手法としての統計量
検定と予測の関係
666132人目の素数さん:2006/01/24(火) 11:32:26

>>665

宿題は自分で考えれ。統計の教科書を見ればすぐわかる。
Webで調べるなら「検定」だけだと少しつらいかな。「統計学的検定」で調べてみ。
667132人目の素数さん:2006/01/31(火) 23:45:22
非線形回帰のr^2値やF検定は可能?
もし可能ならその理論的根拠は?
例えば、回帰関数が意味がないとしたときに、ある既知分布に従う検定統計量が見つかる?
668132人目の素数さん:2006/02/05(日) 08:36:21
773
669132人目の素数さん:2006/02/17(金) 00:47:58
670132人目の素数さん:2006/02/17(金) 13:28:20
>>669
何を今頃。でも、この本は入門者にお薦め。
671132人目の素数さん:2006/02/22(水) 02:21:55
lmとpolyを組み合わせて1つ以上の変数に関する多項式を生成したうえであてはめを行えばよい。。。。。。。。ってどいうこと?
lm polyってなんね?
672132人目の素数さん:2006/02/22(水) 02:36:13
うーん、わからね
673132人目の素数さん:2006/02/22(水) 02:49:37
散布図をRcommanderから表示させると、データが100〜120の範囲にあるのに、
空白のデータを0と認識してしまいグラフがいびつな形になっていて使い物になりません。

空白のセルを0ではなく、NAとして認識させるにはどうすればいいのでしょうか?

元データはCSVファイルカンマ区切り、データが空白のセルはNAではなく完全に空白です。

データセットを取り込むときに空白に設定しても駄目でした。
674132人目の素数さん:2006/02/22(水) 03:19:06
predict.gamって何?
どこしらべてもわからん。
675132人目の素数さん:2006/02/22(水) 09:02:43
ガーン,図のなかに日本語使えるの
今日はじめて知りました.すごい,すごすぎる!
もうSASやめます.SPSSも捨てます.
Rについていきます.船尾さんの最新の
本読むまで,図に日本語つかえないと思っていた
私はアホですか?
676132人目の素数さん:2006/02/22(水) 11:53:53
>>675
いまどき、こんな人がいるんだ。まだまだ啓蒙不足だな。
図に日本語を使えるかどうかでいえば、ずいぶん昔から使えていたよ。
ただ、1文字1文字コード番号を指定するような感じで気軽には使えな
かったし、文字数も限られていた。
それから、PSfragを使えば日本語は全く問題がなかった。
677132人目の素数さん:2006/02/22(水) 11:55:05
>>674
RSiteSearch("predict.gam")
は実行してみた?
678673:2006/02/22(水) 19:38:12
相手してください。。。。。orz
679132人目の素数さん:2006/02/22(水) 23:54:46
>>673
コンマ区切りならテキストエディタで事前に
NAに変換しておくというのはだめなん?
680132人目の素数さん:2006/02/25(土) 23:35:29
>>673
相手しますよぉ〜^^.
データセットを読み込む際,「欠測の記号」が「NA」になっているのを「」(空白)に
してみては??
それか↓試してください.(Rcommanderでも,コマンド入力して実行できるはず)
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/40.html

>>674
↓??
http://cran.md.tsukuba.ac.jp/src/contrib/Descriptions/gam.html

>>676
おっしゃるとおり.でもPDFで出力した場合に日本語が文字化けする問題が
解消されたのは最近なのでは?(正式にはR2.3から??)
船尾さんの最新のR本に収録されているRなら問題ないみたいです.
681132人目の素数さん:2006/02/25(土) 23:37:18
>>673
相手し損ねた・・・.↓の間違い・・・.
http://cse.naro.affrc.go.jp/takezawa/r-tips/r/46.html#03
682132人目の素数さん:2006/02/26(日) 06:15:52
教えて下され
確率p=0.5からなる二項分布で信頼区間を95%としてその範囲が±0.01(pの±1%)となるには、試行回数nは何回必要になるのか、
求める式も知りたいです
関連のサイトをいろいろ見てみたのですが専門用語とか出てきて分かりません
あと確率pと試行nが設定された場合の推定範囲の求め方も知りたいです
お願いします
683132人目の素数さん:2006/02/27(月) 00:29:35
Rの2.21にRcommanderを使用しているのですが、散布図行列で左下に散布図、クロス部分にヒストグラム、
右上に相関係数を表示させるにはどのようにすればいいのでしょうか?

http://www.okada.jp.org/RWiki/index.php?cmd=read&page=%A5%B0%A5%E9%A5%D5%A5%A3%A5%C3%A5%AF%A5%B9%BB%B2%B9%CD%BC%C2%CE%E3%BD%B8%A1%A7%BB%B6%C9%DB%BF%DE%B9%D4%CE%F3
のサイトを参考に
pairs3 <- function () {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
png("pairs3.png") # png デバイスを開く
pairs(Dataset, panel=panel.smooth,
cex = 1.5, pch = 24, bg="light blue",
diag.panel=panel.hist, cex.labels = 2, font.labels=2,lower.panel=panel.smooth, upper.panel=panel.cor)
dev.off()
# postscript
}
などとやってみたのですが、駄目でした。
Rcommanderの散布図行列コマンドScatterplotにupper.panel=panel.corを追加したりもしたのですが、同じく駄目でした。

どなたかよろしくお願いします。
684132人目の素数さん:2006/02/27(月) 23:31:10
pairs3 <- function (Dataset) {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
panel.cor <- function(x, y, digits=2, prefix="", cex.cor)
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(0, 1, 0, 1)) # ユーザー領域変更
r <- abs(cor(x, y))
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep="")
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex * r+0.5)
}
# png("pairs3.png") # png デバイスを開く
pairs(Dataset, diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor)
}

こんな感じかな。例)pairs3(iris[,1:4])
685132人目の素数さん:2006/02/28(火) 16:44:48
>>684

レスありがとうございます。
きちんと動作しました。

教えて君で申し訳ないのですが、プロット点の色を変える方法と、プロットを丸ではなく、
点にする方法、平滑線ではなく最小二乗線にする方法を教えていただけないでしょうか?

Wikiを参考にしながら、"red"やpch = "."を挿入したりしてみたりしたのですが、うまく動作しなくて。。。

あともう一つなのですが、相関係数を計算するときに1000近いデータ中に一つでもデータに空白があると
>cov/cor 関数に欠損した観測値があります。
とエラーになってしまいます。
そのデータを削除すること以外で、このエラーを回避する方法がありましたら教えてください。
686684:2006/02/28(火) 19:56:24
>>685
ウィザードでないので複雑な図形制御は分からないです。
しかし、欠損値の解除は分かります。
>>684
r <- abs(cor(x, y, "complete.obs"))
とすればOKです。
687684:2006/02/28(火) 20:38:51
図形引数の受け渡しは分かりました。直した関数を載せます。
回帰直線を入れるにはpanel.smoothという関数を別途入れ替える必要がありそうで無理。
----------
pairs3<-function (Dataset, ...) {
oldpar <- par(no.readonly = TRUE) # 現在のグラフィックスパラメータ退避
on.exit(par(oldpar)) # (関数がエラー中断しても)パラメータ復帰
panel.hist <- function(x, ...) # ヒストグラムを描くための関数を定義
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(usr[1:2], 0, 1.5) ) # ユーザー領域座標情報を変更
h <- hist(x, plot = FALSE)
breaks <- h$breaks; nB <- length(breaks)
y <- h$counts; y <- y/max(y)
rect(breaks[-nB], 0, breaks[-1], y, col="cyan", ...)
}
panel.cor <- function(x, y, digits=2, prefix="", cex.cor, ...)
{ usr <- par("usr") # 現在のユーザー領域座標情報を得る
on.exit(par(usr)) # 関数終了時に usr パラメータ復帰
par(usr = c(0, 1, 0, 1)) # ユーザー領域変更
r <- abs(cor(x, y, "complete.obs"))
txt <- format(c(r, 0.123456789), digits=digits)[1]
txt <- paste(prefix, txt, sep="")
if(missing(cex.cor)) cex <- 0.5/strwidth(txt)
text(0.5, 0.5, txt, cex = cex * r+0.5)
}
# png("pairs3.png") # png デバイスを開く
pairs(Dataset, panel=panel.smooth, ...,
diag.panel=panel.hist, lower.panel=panel.smooth, upper.panel=panel.cor)
}
----------
例)pairs3(iris[,1:4], pch=24, bg = c("red", "green3", "blue")[unclass(iris$Species)])
688132人目の素数さん:2006/02/28(火) 23:14:36
回帰直線にするには、panel.lsfit (RjpWikiにある関数)をlower.panelに指定すればおkでは?

http://www.okada.jp.org/RWiki/index.php?pairs%CD%D1%20%B2%F3%B5%A2%C4%BE%C0%FE%A4%C4%A4%ADpanel

このpairs3もWikiに転載してほしいな..
689132人目の素数さん:2006/03/01(水) 23:42:59
>>686-688
レスありがとうございます。

欠損データがあっても相関値を求めることは>>686の方法で出来ました。
あと、最小二乗法の計算方法も>>688の方法でできました。

でも、色を変えることと、マークを丸から他のものに変えることはできませんでした。
pch="."やpch=3などと変えてみたのですが変わりませんでした。

色々とやっているのですがうまくいきません。
ここのところ聞きまくりなので、今晩四苦八苦してみます。
690684:2006/03/02(木) 07:22:04
>>688 サンクス!
>>687 にこのpanel.lsfitを組み込んでlower.panelをそのpanel.lsfitにすればOKみたいだね。

>>689 自分で考えるのも勉強になっていいと思うよ。


で、一晩経ったので、俺の見つけた答を書いておくと
panel.lsfitで

lines(xx,yy, col="red")
points(x,y, ...)

とすれば、>>687の例にも対応できて直線も赤になる。
また、最後のpairsでpanelの設定は要らないので取ってしまってもちゃんと動くようだ。
691132人目の素数さん:2006/03/02(木) 16:00:28
age
692132人目の素数さん:2006/03/02(木) 21:38:56
Scilab, Octaveは数式処理はほとんど無理
maximaのほかにRisa-Asirとかあった気が。
693692:2006/03/02(木) 21:42:01
すごい過去にレスしてしまった。
無視して下さい。
694132人目の素数さん:2006/03/02(木) 23:49:21
>>690
レスありがとうございます。
そちらの線もそうなのですが、実際の観測値が黒の丸になっているのでそれを変えようと
色々とやっているのですが、色も形も変えられないもので。。。
695132人目の素数さん:2006/03/02(木) 23:58:40
皆さんは、日次データの分析ってどうされてますか?
たとえば、金融時系列データだと土日の市場が開いていない期間のデータを
どう扱うかに苦慮しています。
パッケージのtserieを使っても、日次データなのでFrequency=365として
しまうと、土日含みになってしまいます。対応方法ってありますでしょうか?

696684:2006/03/03(金) 23:36:49
>>694
それも>>690で解決してますよ。pointsの ... がみそ。
697132人目の素数さん:2006/03/04(土) 18:31:13
Rで入力補完機能って無いのかね。
あると便利なんだけど。
698132人目の素数さん:2006/03/05(日) 01:59:53
ちょっとお伺いしたいんですが、ライブラリーのRmpiをインストールしようとすると、
ld; can't locate file for: -lcc_dynamic
と出て失敗してしまうのですが、なにか良い解決策はないでしょうか?
環境は 
MacOSX 10.4.5
CPU:G5
R 2.2.0
です。
699132人目の素数さん:2006/03/05(日) 06:05:11
>>698
buildでコケる時はソースを/tmpにでも展開してMakefileいじってまた固めて
R CMD INSTALL 固めたファイル
ってやってる。
当然アップデートの度にやる羽目になるがな。
700132人目の素数さん:2006/03/05(日) 17:15:51
>>697
ESSがあるから別にRが内部的に入力補完機能を持つ必要はないんじゃない?
701132人目の素数さん:2006/03/05(日) 23:32:16
>>698

Tiger特有の問題のような気がする。
sudo gcc_select 3.3
で直るかも。

>>697

Mac版(GUI)では標準で補完機能付き。WindowsならJGRで。
702132人目の素数さん:2006/03/06(月) 00:41:23
>>698
Rmpiって色々と躓く部分が多いから注意が必要
703132人目の素数さん:2006/03/06(月) 08:47:47
>>700
Win環境じゃ無理でしょ。
MeadowやらCygwinEmacs等は使いにくいし。

趣味や研究でやっている人以外はWin環境なんだから
そこら辺を考えてもらいたい。
704132人目の素数さん:2006/03/06(月) 18:39:20
>>703
> >>700
> Win環境じゃ無理でしょ。
> MeadowやらCygwinEmacs等は使いにくいし。
> 趣味や研究でやっている人以外はWin環境なんだから
> そこら辺を考えてもらいたい。
かんがえたくないんでしょうねぇ、きっと。「Win?へ〜んなものつかってんだねぇ〜」って感覚なんでしょうねぇ。
705132人目の素数さん:2006/03/06(月) 19:33:32
ソースは公開されてるんだから、自分で作れば良いのに。
706132人目の素数さん:2006/03/06(月) 20:48:50
>>703

JGR
http://stats.math.uni-augsburg.de/JGR/

いちどつかってみてください。
GUI部分は好みに応じていくつか選択肢があるほうがよいんじゃないかな。
707132人目の素数さん:2006/03/07(火) 07:56:23
>>706
Macでは日本語表示が出るようだけどWinでは出ないのですが、
無理ですか?(起動時のエラーを回避するのにも相当時間がかかった。)
708132人目の素数さん:2006/03/07(火) 21:24:32
> 趣味や研究でやっている人以外は...
研究または趣味のソフトじゃなかったのか。。。
Windowsユーザとかそんな底辺層にまでRが普及し始めているとは嬉しい限り。
でも、Windowsユーザが入力補完機能なんて言葉を知っているとは思えないんだが。
709697:2006/03/07(火) 21:33:00
微妙に荒れてますなw
結局FreeBSDにWindowsからESS+SSH転送+PC Xサーバ使ってます。
710132人目の素数さん:2006/03/07(火) 22:17:11
>>696
レスが遅れてすみません。

きちんと動作しました。ありがとうございました。
711132人目の素数さん:2006/03/08(水) 21:53:59
Widowsって2GB以上のメモリは使えないのでRがそのまま落ちるらしいけど、
MacOSXな人はどうですか?
712132人目の素数さん:2006/03/09(木) 00:04:23
> Windowsユーザとかそんな底辺層
> Windowsユーザが入力補完機能なんて言葉を知っているとは思えない

こんなこと思ってる、しかも2チョンに書き込んじゃうバカがいるんだね
自我が肥大してるな
713132人目の素数さん:2006/03/09(木) 21:32:12
言葉で表現されることと自我が肥大することとは別だ
714132人目の素数さん:2006/03/10(金) 00:54:31
Rのクライアント領域より大き目のグラフを作成する方法って無いでしょうか?
いつもは800*600のノートマシンで作業しているのですけど、これだとグラフが
小さすぎます。
できたら1000*1000程度の大きさのグラフを作成したいので。
715132人目の素数さん:2006/03/10(金) 04:12:55
>>714
png()とか使ってファイルに書き出す
716132人目の素数さん:2006/03/10(金) 08:44:44
>>715
ありがとうございました。
717132人目の素数さん:2006/03/10(金) 13:16:46
グラフの質問が連続してて申し訳ないけど、グラフにタイトルを入れるのはどうすればいいのでしょうか?
複数のグラフを表示するコマンドにTITLEの文を挿入したら最初のグラフのタイトルになっちゃいます。
718132人目の素数さん:2006/03/11(土) 03:11:59
719132人目の素数さん:2006/03/14(火) 01:07:23
すいません教えてください。
( y2 <- backsolve(r, x, transpose = TRUE))
transpose = TRUEとはどういう意味なのでしょうか?
720719:2006/03/14(火) 01:12:39
>>719
解決しました。
721132人目の素数さん:2006/03/18(土) 18:47:00
>713
はぁ?言葉で表現されること?
お前がそう世界を認識して書き込んでんだろ

バカなら黙ってれば?
722132人目の素数さん:2006/03/18(土) 22:22:30
ゆとり教育
723竹内まりや:2006/03/20(月) 08:12:00
ケンかはやめて♪
わたしのためーに♪
争わないーで♪
724132人目の素数さん:2006/03/21(火) 21:31:07
これでグラフ作るときは
エクセルとどちらが速いか、後々効率いいか、他人に任せれるか
と数分悩むことにしている。
725132人目の素数さん:2006/03/26(日) 14:56:34
726age:2006/03/27(月) 01:27:20
age
727132人目の素数さん:2006/03/28(火) 08:46:52
>>723
その歌ってすごい自意識過剰だよな。
けんかしている男二人って、
「その女が欲しい」んじゃなくて、
「この男に負けたくない」というだけだもんな。
映画タイタニックに出てきたローズの婚約者と同じ。
728竹内まりや:2006/03/28(火) 23:48:22
ケンかはやめて♪
わたしのためーに♪
争わないーで♪
729729:2006/03/29(水) 20:19:56
√(729) = 27
730age:2006/03/30(木) 00:32:48
age
731132人目の素数さん:2006/03/30(木) 02:50:18
sage
732132人目の素数さん:2006/03/30(木) 10:53:57
以前にこちらで教えていただいた配列行列を使っているのですが、
パラメーターを増やすと警告が出てしまいます。

pairs3(Dataset[,5:15], pch=24, col="blue",bg=c("red")[unclass(Dataset$Species)])
としていて[,5:13]だと問題ないのですが、5:15にすると、

警告:min の引数がに有限な値がありません:Inf を返します
警告:max の引数に有限な値がありません:-Inf を返します
以下にエラーplot.window(xlim, ylim, log, asp, ...) :
有限な 'xlim' の値が必要です

となってしまいます。

念のために空白のデータをすべて削除したり系列の名前を変更したりしたのですが駄目でした。
そもそもminやmaxと言う項目は追加していません。
新しく追加したのは、V Ave,V m_mと言う二つの項目でminやmaxは使っていないのですが・・・

これはどのようにすれば回避できるのでしょうか?
どなたか回避方法が分かりましたら教えてください。
733132人目の素数さん:2006/03/30(木) 10:54:29
配列行列じゃなくて散布図行列でした。失礼。
734132人目の素数さん:2006/03/30(木) 21:54:13
ごめんなさい。ゼロがオーになってました。
735age:2006/04/14(金) 00:30:32
あげ
736132人目の素数さん:2006/04/15(土) 20:24:38
うんこヌッシーだw
737132人目の素数さん:2006/04/24(月) 21:27:10
ユニックスでバッチでRが動くことは知ってるんですが
ウインドーズでもバッチで動くんでしょうか
738132人目の素数さん:2006/04/24(月) 21:31:22
動くはず。
Excelと連携させるソフトがあってそれが確かRをバッチで
呼び出して処理したたと思う。
739竹内均:2006/04/24(月) 23:41:40
ケンかはやめて♪
わたしのためーに♪
争わないーで♪
740132人目の素数さん:2006/04/25(火) 00:37:10
このスレであるなら「竹内啓」の方がよく似合う。
741132人目の素数さん:2006/04/25(火) 01:19:37
742132人目の素数さん:2006/04/25(火) 14:49:34
0.5-0.4-0.1でExcel同様、
変な値出るんですけど既出ですか?
743age:2006/04/26(水) 01:06:13
既出みたいなもんです.気になるならば以下のようにしてください.

> round(0.5-0.4-0.1)
[1] 0
744132人目の素数さん:2006/04/26(水) 04:23:44
> .3-.2-.1
[1] -2.775558e-17

なるほど。
745132人目の素数さん:2006/04/26(水) 06:06:25
>>744
それに2.775558e-17を足すと…
746737:2006/04/26(水) 06:37:10
>738
>動くはず。

書籍やどっかのHPでやり方を紹介してませんでしょうか
けっこうねちっこく探したのですがウインドウズでの
バッチの方法は見つかりませんでした.
747738:2006/04/27(木) 01:54:03
とりあえずなんらかのコマンドを順番に打ったファイルを
Rのbinフォルダに準備して(その名前をたとえばcommand.txtとする)
そこで次のようなコマンドを実行すると

R --no-save < command.txt

計算してくれるよ。余分な出力がつくから出力されたものを
何かに使うのならさらに処理がいるけど。
748738:2006/04/27(木) 09:29:18
>>747のつづき。
こんなとこ発見した。
http://www1.accsnet.ne.jp/~gen/R/batch.html
749742:2006/04/27(木) 18:38:24
>>743
やっぱそうですか。どうもです。
750132人目の素数さん:2006/04/28(金) 06:55:58
>747,748
ありがとうございました.心から感謝いたします.
751132人目の素数さん:2006/04/29(土) 10:28:59
もしかして一時期(1,2年前)と比べて人気が無くなってますか?
仕事で忙しくて情報にキャッチアップしていくのも辛くなってきた・・・・
752132人目の素数さん:2006/04/29(土) 11:43:49
>>751
新しい書籍も出て世間的には人気は上向きと言えるのでは
ないでしょうか。
環境が整ってきたことで逆にこのスレの進み具合が遅くなったと
思っています。
753132人目の素数さん:2006/05/03(水) 09:08:31
R・・・・

データが大きくなると使い物にならないのですが、
メモリを2Gぐらい積めば快適に使えるのでしょうか?

積めば積むほど大規模データを扱えると思って間違いないですか?
754132人目の素数さん:2006/05/03(水) 10:15:56
洗面器を使うかバケツを使うかってことだろう。
755132人目の素数さん:2006/05/03(水) 11:51:48
SAS欲しいなぁ
756132人目の素数さん:2006/05/03(水) 14:39:04
>753必要ないオブジェクトを解放すれば
結構使えますよ.100かける数万件は扱えてます.

>755SASのデータステップなんて
大域変数ばっかで,まともな仕事できないよ
なんてったってSASは構造化言語じゃないから
IML使うと倍も金取るし
757132人目の素数さん:2006/05/03(水) 15:28:06
>>756
仕事でRを使っているのですか?

>100かける数万件は扱えてます

私の業務ではまだまだ足りないので
将来的に数百万件×100ぐらいは使えるようになって欲しいです。

あと、業務では大域変数ばっかりだろうとSASは使い易いです。
代わりになる言語や環境があるなら紹介して欲しいです。

758132人目の素数さん:2006/05/03(水) 17:41:05
>>756, 757

Rはデータマイニング用アプリではなく統計解析プラットホームなので、
デフォルト状態では大規模データは苦手です。まぁパッケージをいろいろ駆使すれば
数百万件というものできないことはないのでしょうが...

SASはプログラミング言語ではなくて、定型業務向け簡易言語なので
プログラムが美しくないのは(歴史が古いこともあって)やむをえないでしょう。
最近はどちらかというとマイニング向けにしているようだし。

定型業務で超大規模データのマイニングをやるならSAS, 研究開発系業務で
インタラクティブにさまざまな解析を進めていくならばRというように住み分けが
できるのではないでしょうか。
759132人目の素数さん:2006/05/03(水) 19:13:14
Rで扱えるまでデータを小さくするのが大変なんですよね。
その目的でSASを使うのも馬鹿げているし...
Access、Perl、Awk
どれもいまいち...
760132人目の素数さん:2006/05/03(水) 19:50:28
MUSASHIとかどうなんでしょうか?
761132人目の素数さん:2006/05/03(水) 20:18:20
MUSASHIですか。
食わず嫌いかもしれませんがデータマイニングという、
大規模データハンドリングを前提としている世界に
XMLという冗長なデータフォーマットを持ってきている時点で二の足を踏んでしまいます。

失礼かもしれませんがいつ開発が止まるかもわかりませんし....
Wekaなんかでも開発がとまっているのではないでしょうか?
762132人目の素数さん:2006/05/03(水) 21:37:12
学校や会社にず〜っと在籍して,ず〜っとSASが使えるなら良いのですが,
その環境から放り出されたら,せっかく蓄えた知識が水泡と化しますからね...

あと,いつ開発が止まるかわからないソフトを使うのも良いのですが,
開発が止まっちゃったら,せっかく蓄えた知識が水泡と化しますからね...

後者はRも孕んでいる危険ですが,「多くの人が使っている」ので
他のソフトよりは危険率が小さいのではないでしょうか??

「フリー」であるのと「多くの人が使っている」というのがRの強みですよね.
763132人目の素数さん:2006/05/03(水) 21:50:24
Rの欠点はデータハンドリング、中でも大規模データの取り扱いが苦手な事だけだと思います。
764132人目の素数さん:2006/05/03(水) 22:27:44
>>762
学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。
あと、ユーザー数については、R は SAS はおろか、S-Plus の足下にも及ばないはず。

>>763
有償サポートがないので、業務用途に使いにくい(研究用途なら問題ないけど)。
765132人目の素数さん:2006/05/03(水) 22:34:19
>>764
s-plusは数百万×100変数ぐらいのデータを扱えるのですか?
766R好きです:2006/05/03(水) 22:41:17
>有償サポートがないので、業務用途に使いにくい

サポートしてくれるのは現バージョンと
1つ前のバージョンくらいだよ.
長年書き溜めたプログラムがバージョンアップして
動かなくなっても「サポート対象外」といわれる.
有償ソフトは下らないバージョンアップで
食いつないで,しかも上位コンパチとは限らないから
始末が悪い.
767132人目の素数さん:2006/05/03(水) 22:41:25
>>764

世界中のCRANから配布されているRのユーザー数をどのように把握したのかに
興味があるので、情報ソースを示してもらえませんか?
768R好きです:2006/05/03(水) 22:44:18
>Rの欠点はデータハンドリング、

オイラはSASもRも使うけど,Rのほうがハンドリング
ときだと思うぞ!百万件といったって
目的に応じて加工するのが主な仕事場わけで
グレップ使えるRのほうが協力じゃん
769R好きです:2006/05/03(水) 22:45:44
すみません.お酒飲んでるんで
タイプにミスが目立ちます
770R好きです:2006/05/03(水) 22:49:33
>学校・企業・研究機関から放り出されたら、統計・データ解析の知識も必要なくなるかと。

っていうか大学でSASならって,就職したらSASがない
という場合が困るんですよ.特に小さい組織だと
SASのアコギな値上げに付いていけない
その点R習っとけば,どこにいっても使い続けられる
ってことだと思います
771R好きです:2006/05/03(水) 22:54:49
>開発が止まっちゃったら,せっかく蓄えた知識が水泡と化しますからね...

これ意味分かりません.私が20年以上前に書いたTEXやS
のプログラムは今でも動きます.
クヌースは,これ以上TEXをいじらないといっている
Rもコアの部分は開発を止めてもいいと思う
TEXが相であるように,あとは世界中のボラティアの
パッケージにまかせればいい
上位互換でないコア部分のバージンアップは,もう
やめたほうがいいと思います.
772132人目の素数さん:2006/05/03(水) 23:03:42
RがSASよりデータハンドリングに優れているって事はありえませんから。
773132人目の素数さん:2006/05/03(水) 23:04:12
>>766
だから、常に最新版にアップデートし続けないといけない。最高(最悪?)のビジネスモデルかも。

>>767
まじめに調べるとすると、「試しにインストールしてみた」だけの人をカウントするかどうかが問題。
職業プログラマーの数だと圧倒的な差があると思う。
SASプログラマーの求人はあっても、Rプログラマーの求人は聞いたことないし。
大体、研究者が研究目的に「自分で」コーディングしちゃうから、Rプログラマーって独立した職業にならないんだろうけど。
あと、ユーザーコミュニティーの活動の活発さ(ヘビーユーザーの数)。
http://www.sas.com/offices/asiapacific/japan/news/press/200602/24.html
774132人目の素数さん:2006/05/03(水) 23:11:58
ッつーか誰かSASのクローン作らないかな(笑)?
SのクローンやSPSSのクローンとかあるんだから、SASのクローンあっても良さそうだけど。
ASAとか名前付けちゃって(笑)。
775R好きです:2006/05/03(水) 23:13:35
>RがSASよりデータハンドリングに優れているって事はありえませんから。

何故?
1.マイニングのハンドリングならグレップやサブのほうが軽くて有利
2.構造化言語で,バグが入りにくい
  (SASなんて変数管理が難しくて,大規模で継続的な仕事に
   向かない)
ちなみに私はSAS歴25年です(長ければいいてもんじゃあないですが)
776132人目の素数さん:2006/05/03(水) 23:14:21
Rは好きなのですが、実務でRが活かせる分野ってありますか?
アンケート分析ぐらいなら活かす事が出来ると思うのですがSPSSの方が楽ですよね。
777132人目の素数さん:2006/05/03(水) 23:18:29
>>770
SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。
あってもかなり研究指向が強く、採用が博士号もってること前提、とかになってそう。
あと、R は割と簡単に習得できる(C とか勉強したことあれば、楽勝)けど、
SAS は癖が強いので、研修うけないと習得が面倒です。大学で習えるのはラッキーかと。
778R好きです:2006/05/03(水) 23:27:24
>SAS は買えないけど統計解析はしなきゃならない、っていう組織はあまり無いと思いますよ。

えっSASの非情な,非常識な値上げ攻勢知らないんですか?
HPに定価を乗せずに,ワンtoワンマーケと称して
とんでもない値段(値上げ,それも毎年)吹っかけます
SPSS見たいにHPに定価が乗っていれば
ボラレル心配ないけど,SASは値上げについていけなくて
振り落とされる組織・大学多いんですよ
大学教育ではやめてるところ多いですよ
779132人目の素数さん:2006/05/03(水) 23:29:23
>>775
あなたは多分SASもRも素人だ。
特に実務経験がなさそう。
780132人目の素数さん:2006/05/03(水) 23:31:52
>ッつーか誰かSASのクローン作らないかな(笑)?

どこかがSASのクローンを作ってSASに訴えられなかったっけ?
ソースをそのまま利用したからだったかな?

781132人目の素数さん:2006/05/03(水) 23:36:36
>> 776

アンケート分析ぐらいならSPSSを使わなくてもExcelと、VBAの統計パッケージで十分な
ような気が...
研究が本職の人ならRを活かせると思いますが、データ処理が本職の人は、統計計算機能はあまり
なくて良いからクロス集計や条件抽出がとにかく高速な、しっかりしたRDBを基礎においた
システム(統計解析パッケージ、とは呼ばれていないかもしれないけど)を使ったほうがいい
のではないでしょうか。Cacheとかの強力DBがバックエンドにあるとよさげですね...

研究が本職の人は、いろんなモデルをデータと格闘しながら使っていかなければならないので、
インタラクティブな使い方に強いRは向いてると思います。
782132人目の素数さん:2006/05/03(水) 23:38:08
実務じゃないのね・・・
783R好きです:2006/05/03(水) 23:38:13
>Rは好きなのですが、実務でRが活かせる分野ってありますか?

活かせない分野ってあるんでしょうか?
構造化言語だから,使っているうちに
関数がたまって,ぐんぐん
どんな分野でも使いやすくなりますよ


>アンケート分析ぐらいなら活かす事が出来ると思うのですがSPSSの方が楽ですよね。

マウスでクリックというのは,小規模な(卒論)とかには
いいのですが,実務で条件を少しずつ変えて
何百枚も図を出したりするにはGUIのSPSSは
だめっすよ.CUIのRのほうが,本格的で大量の
出力にはむいてますよ.
784132人目の素数さん:2006/05/03(水) 23:39:16
SPSSもマクロがあるでしょ
785132人目の素数さん:2006/05/03(水) 23:39:48
製薬業界だと、オラクルクリニカルやリントライアルとSASを組み合わせて使ってますよ。
786132人目の素数さん:2006/05/03(水) 23:41:18
>> 777

...今風の職業プログラマ(VMSとかは知らない世代です)をしたことがある経験から
言うと、SASの文法は癖なんていうレベルではありません...もはやあれはプログラミング
言語とは呼べないと思います。昔はあれが普通だったのかもしれませんが.....

他に応用できない技術であるという点で、SASが出資している大学でないならば、
あれを「プログラミング」と称して教えるのだけは避けてもらいたい気持ちです。

787R好きです:2006/05/03(水) 23:43:29
完全に酔いが回ったので寝ます
2chには基本的に来ないのですが
今日は楽しかったです
おやすみなさい
788132人目の素数さん:2006/05/03(水) 23:44:09
おやすみなさい
789132人目の素数さん:2006/05/03(水) 23:46:08
確かにRの言語仕様は最高ですよね。
790132人目の素数さん:2006/05/03(水) 23:54:24
なんかスレのびてますが...

「統計」っていう日本語の意味が広がりすぎてるから議論になっちゃうのかなぁ、
と思いました。
単純集計とクロス表の解析がメインのマイニング的データ処理分野と、
少数例に対して数理モデルをつくっていく解析分野を、
どっちも「統計解析ソフト」でやろうとするからいけないような。

ちょっと不思議なのは製薬業界かな。
SASってWebとか見るとマイニング系アプリのように売ってるのに、
製薬業界ではそのデータ解析機能を頼りにして採用している??
業界の伝統、でしょうか...
791132人目の素数さん:2006/05/03(水) 23:56:42
>>783
実務、ですよ。(探索的な)研究なら R でいいですが、データ解析の実務。
金融業界、製薬業界、マーケティング会社等々、SAS や SPSS が業界標準になってるので、
R で解析した結果(あるいは書いたプログラム)を顧客(社内顧客含む)が受け取ってくれるか
どうかがまず問題になります。一人で業務を完結できるわけではないからね。

>>786
私もあれを「プログラミング言語」とは呼びたくないです。
コーディングがあれほど楽しくないものもないでしょう。
792132人目の素数さん:2006/05/03(水) 23:57:02
>>780

へえ、面白い。
ベル研生まれのSのクローンが訴えられなくって
大学生まれのSASのクローンが訴えられるのか。

しかし、西洋の大学は偉いなあ。商用ソフトにせよクローンにせよ
きちんと一般に技術的な貢献してるからなあ。
それに比べ日本の大学は・・・・・・
793132人目の素数さん:2006/05/04(木) 00:18:46
実務だと解析の前段階が大きな作業ウェイトを占める。
そのフェーズはSASなしでは考えられない。
S-plusやspssを導入している企業でもその為だけにSASを導入しているところが多い。
研究室の中のように綺麗で解析に都合の良いデータばかりを扱うわけにもいかないので・・・・

あとSASがデータマイニングを前面に押し出しているのは本当に最近の事だよ。
ルーツは言うまでも無く「統計」。
794132人目の素数さん:2006/05/04(木) 02:30:17
> 研究室の中のように綺麗で解析に都合の良いデータばかりを扱う
795132人目の素数さん:2006/05/04(木) 04:06:07
>>792
SとRの関係はUNIXとLinuxの関係と同じ(ソースは別物だけど互換性がある)じゃないの?
796132人目の素数さん:2006/05/04(木) 06:05:18
>>792
学校でRを勉強して企業に入ったら関数に保証のあるSを導入して欲しいってのが
Sのスタンスらしいよ。本にインタビューが載ってた。
797132人目の素数さん:2006/05/04(木) 07:00:48
>>794
よくわかる
798132人目の素数さん:2006/05/04(木) 07:56:24
>関数に保証のある

でも「補償」はしないから意味なしでしょう
如何なる損害も補償しないと宣言しています
1つ1つの関数の結果の正しさを「保証」しているというなら
基本部分の信頼性はRもSも同じレベルでしょう
バグを報告しても直ぐに直してくれるわけではないから
正確には結果の正しさも「保証」しているわけではないです
「保証」って何?と思います
799132人目の素数さん:2006/05/04(木) 08:04:16
S-PLUS 7 Working with Big Data

というのがありますね。
これを使うと行数に制限がないそうです。
Rも見習って欲しいものです。

自費で買うならS-PLUSかな。
800132人目の素数さん:2006/05/04(木) 08:21:39
ところで、S-PLUSの導入費用は?
801132人目の素数さん:2006/05/04(木) 09:50:58
>>798
仕事で使うにあたっては責任をなすりつける先があるのは重要だと思うが
802798:2006/05/04(木) 11:22:41
>801
やってごらんなさい.責任なんて絶対取りませんから
保証の有無の差なんてゼロです
803132人目の素数さん:2006/05/04(木) 11:38:36
この過疎スレに必死な奴がいる件について
804132人目の素数さん:2006/05/04(木) 11:49:29
Rの話題は何でも楽しいからいいよ。

>保証の有無の差なんてゼロです

確かにこれが現実だし。
805132人目の素数さん:2006/05/04(木) 12:14:17
うちの会社だとお偉方に導入を進言する時にフリーなのは受け入れられにくい
806132人目の素数さん:2006/05/04(木) 12:52:54
フリーなら勝手にいれてしまへ

フリーなら申請すればすぐに通るでしょ。
807132人目の素数さん:2006/05/04(木) 13:25:13
ちょっと問題だと思うのは。

SもRも動作保障しない意味では同じ

これはなるほど、と思う。

でもRマンセーがエクセル叩くの意味が分からないんだよね。

エクセルも計算ミス一杯あって困る、ってのは分かるんだけど、

統計解析専門ソフトが動作保障しないと言う話と大同小異と言えば言えなくもない。
808132人目の素数さん:2006/05/04(木) 13:26:53
>>796

はじめてのS-PLUS/R言語プログラミング

S/R関係でもっともわかりやすい入門書
809132人目の素数さん:2006/05/04(木) 15:27:32
>>808

データ解析環境「R」

R関係でもっともわかりやすい入門書
810132人目の素数さん:2006/05/04(木) 18:32:57
>>802
ちょっと勘違いをしてるのでは...
解析結果がおかしくてユーザーに損害が出ても保証しない、というのはもちろん R でも S-Plus でも同じ。
ただ、「メーカーも認めてる不具合なら仕方がない」となるか、「フリーウェアなんか使うからだ!」
になるかの違いは(担当部署にとって)極めて大きい。

>>806
それ、インストールの許可が出ただけ。「導入した」ことにはならない。
私物として持ち込んだ電卓と同じ扱いで、(業務手順書には現れない)検算ぐらいにしか使えない。
811万年ボケ:2006/05/04(木) 18:37:27
おはつです。

研究職でないのに、Rを使いたいなんて思うのは、クラージー??
高いソフトが買えないって言うのが本音、、、。

現場が忙しくて、なかなかスキルがあがらんのです、、、。

Rの入り口付近で、うろちょろしてます。

リタイヤしてからも、それまで覚えたRの知識が使えるチーズを探すのも、面白そうだけど、、、。
数年ぶりに自分の時間が持ててる万年ボケです。
812132人目の素数さん:2006/05/04(木) 18:58:48
いえす、ゆーあーくらーじー!!
ばっとあいあむくらーじーとぅ。
813万年ボケ:2006/05/04(木) 19:42:43
おー、さんきゅー べーりーまっち!

くらじー いず くれいじー で、くれいじー いず とっぷりーだー おぶ じゃぽーね??!

仕事柄、自分とこのエビデンスを解析しなきゃねーってなこともあるわけですよ。
品質工学的な手法もあるわけで、金をかけずに、安上がりに出来る方法はないか、貧乏人は探すわけですよ。
814132人目の素数さん:2006/05/04(木) 20:29:59
>>800

30万円くらい。
815132人目の素数さん:2006/05/04(木) 20:32:36
アメリカ製のソフトがこっちの販売会社で責任取れないのもしょーがない、ってばしょーがないよね。
多分中身いじる事出来ないでしょ?
日本人の為の日本人による日本製の統計ソフトが無い、ってのがどっちかと言えば問題がある気がする。
日本の統計学者って何やってんだろね?
816132人目の素数さん:2006/05/04(木) 21:30:02
810は非本質的な論拠がまかり通るアホな職場にいますな
スキルアップして転職しんしゃい
817132人目の素数さん:2006/05/04(木) 21:35:20
複数のソフトで計算して中を取ればいい
818132人目の素数さん:2006/05/04(木) 21:42:32
>>816
日本はそのアホな職場だらけな罠
819132人目の素数さん:2006/05/04(木) 21:43:46
>>816
例えばどこ?
一流どころのメーカーは全部「非本質的な論拠がまかり通るアホな職場」になると思うけど?
中小企業だと逆に「いいかげん」な仕事をしてても許される、ということはありそうだけど。
820132人目の素数さん:2006/05/04(木) 22:44:53
>一流どころのメーカーは全。。。

んなこたーない
あんたのスキルと比較して1流っていうこったろ
821132人目の素数さん:2006/05/04(木) 22:48:01
>>820
どこでもいいから例証してみて。
トヨタ、武田薬品、プルデンシャル(メーカーじゃないけど)、・・・
822132人目の素数さん:2006/05/04(木) 22:54:52
RよりOctaveの方が楽だけど
Octaveには「最小二乗法」のパッケージすら入って無い(forgeにはそれらしいのが入ってる…)
まあ単回帰ぐらい自分で書くし、重回帰だってOctaveなら10行ぐらいで書けるのだが
一般人が統計解析に使うのはどうだろうと思ってしまう
823132人目の素数さん:2006/05/04(木) 23:14:14
S-PLUSのENTERPRISE版が欲しくなった。
824132人目の素数さん:2006/05/05(金) 00:42:03
Octaveのpolyfitとかglsは最小自乗だよ。
ただ、octaveとかは数値計算ツールであって
統計用じゃないんでおすすめ出来ない。

欠損値とかうまくあつかえないはず。

825132人目の素数さん:2006/05/05(金) 01:00:39
OctaveってMATLABのクローンだっけ?
どこで手に入るの?
Rjp-wikiみたいなサポートサイトってあるの?
826132人目の素数さん:2006/05/05(金) 01:05:41
>>825
完全win版はこれ
http://www.math.mcgill.ca/loisel/octave-workshop/

Cygwin版はCygwinをフルインストールすると自動的に入る

Cygwin版でもいいけどCygwinのフルインストールはいやな人はこれ
http://sourceforge.net/project/showfiles.php?group_id=2888
827132人目の素数さん:2006/05/05(金) 01:09:25
828132人目の素数さん:2006/05/05(金) 01:43:23
>>826&827

dクス
829132人目の素数さん:2006/05/05(金) 01:58:49
>>821

>トヨタ、武田薬品、プルデンシャル(メーカーじゃないけど)、・・・

「武田薬品」という社名が出たので・・・.
FDA(Food & Drug Administration/米国食品医薬品局)は新薬の申請の際に
「SASのデータセットで」ということを要求しているようです.

http://www.jiten.com/dicmi/docs/x/13130s.htm

ですので,製薬業界では自動的に SAS を使わざるを得ない状況となっているようです...
830132人目の素数さん:2006/05/05(金) 06:15:47
>>829
つまり製薬業界は皆2流ってことかw
831132人目の素数さん:2006/05/05(金) 09:29:10
arules使っている人いますか?
832万年ボケ:2006/05/05(金) 11:57:11
>>831
windowsでも動く"weka"っていう、データマイニングのソフトがあるそうな。
http://www.weka-jp.info/から、ダウンロード可。メーリングリストもある。

使ったことないけど、クレージーな万年ボケは挑戦したくなる。
MUSASHIはLinuxだけど、これはWINもMacOSもある。
833132人目の素数さん:2006/05/05(金) 12:03:19
wekaはjavaで書かれているから遅いよ。

834132人目の素数さん:2006/05/05(金) 12:06:39
cor ( x ) の出力を
変数1 変数2 相関係数
VAR1 VAR2 0.03
VAR1 VAR3 0.14
VAR1 VAR4 0.23
VAR2 VAR3 0.74
VAR2 VAR4 0.59
...

のようにする事はできますか?
835132人目の素数さん:2006/05/05(金) 12:47:46
cor(x)から情報を抽出するんだジョー!
836132人目の素数さん:2006/05/06(土) 07:00:01
>>753

ホントだ。
10万件くらいデータぶち込めばかなりアヤシイですね。
明らかにバグります。
パソコン上のメモリが足りないのかな?
837132人目の素数さん:2006/05/06(土) 09:39:13
小規模データしか扱えないですよね。
どうにかならないものでしょうか・・・

上の難しい話を除いても実務で使える領域は限られている。
838132人目の素数さん:2006/05/06(土) 11:15:55
これだとハンドルできるデータ量はエクセルの方が多い感じですね。
まあ、エクセルも6万近いデータ入れれば確かにバグりますがwww。
やっぱノートじゃダメなのかなあ・・・・・・。
839132人目の素数さん:2006/05/06(土) 13:28:22
SASしかね
840132人目の素数さん:2006/05/06(土) 20:28:35
Fortran90使えよ
841132人目の素数さん:2006/05/06(土) 20:38:04
>>840
なにもわかってねぇ・・・
842132人目の素数さん:2006/05/06(土) 20:51:45
漢ならアセンブラ。 異議は認めません。
843132人目の素数さん:2006/05/06(土) 21:26:42
フォートランには山のようなサブルーチン資産もあるから、
コーディングする根性があれば大規模データ解析にはいいかも。
http://www.k2.dion.ne.jp/~sa-shibu/
SAS や R とは違って早いし。
844132人目の素数さん:2006/05/06(土) 21:28:24
>>843
干し草の山から針を探すのが面倒
845132人目の素数さん:2006/05/06(土) 22:23:25
>>841
Matlab使ってると、別にFortran90でも変わらないなという感じもする。
846132人目の素数さん:2006/05/07(日) 12:54:13
フォートランならCの方がいい
ただCは文字列操作が苦手
847132人目の素数さん:2006/05/07(日) 16:26:56
>>846
変数宣言したりポインタとか面倒にょ
その点、FORTRANは楽
文字列操作もライブラリ使えばいいし
848132人目の素数さん:2006/05/07(日) 18:27:51
FORTRANならC++の方が現実的だと思う。
システムに落とすときにFORTRANだと稟議が通らない気がする。
849132人目の素数さん:2006/05/07(日) 19:41:38
職場のカルチャー次第かな、と思う。
大学とか(国公立の)研究機関なら、FORTRAN の方が好まれそう。
C++ は使ったこともない、みたいな人がほとんどだったりして。
850132人目の素数さん:2006/05/07(日) 19:53:37
C++の統計のライブラリってどのくらい充実しているのかな?
当たり前だけどライブラリがないと何も出来ないから。

アメリカだと、エンジニアリング系の学生はmatlabとmathematicaを普通に使って、
他に必要とあれば専用のソフトを使う。 SASはビジネススクールや経済学部の
学生がよく使っていた。 C++は難しいし、普通は使わないですね。 
851132人目の素数さん:2006/05/13(土) 20:54:16
852132人目の素数さん:2006/05/18(木) 20:11:51
>815
HalWinとかって日本製じゃん。
853132人目の素数さん:2006/05/21(日) 08:51:34
解析フェーズになったら、SASよりS(R含む)の方がずっと使い易いですよね。

S-PLUS買いたいな。
854132人目の素数さん:2006/05/23(火) 00:00:53
しかもS−PlusはSASより維持費がずーっと安いぞ
855132人目の素数さん:2006/05/24(水) 00:01:10
Rは維持費がタダだぞ
856132人目の素数さん:2006/05/27(土) 08:14:59
Rは大規模データを扱えるようにしていく気があるのでしょうか?
今のままでは統計学習用途で終わってしまう気がします。
857132人目の素数さん:2006/05/27(土) 09:55:16
R で扱えない規模のデータって、どれぐらいの大きさ?
SAS の方が限界が低いと思ってたんだけど。
858132人目の素数さん:2006/05/27(土) 12:39:49
>>857
oioi....
859132人目の素数さん:2006/05/27(土) 13:43:45
Rは研究用、SASは業務用ですよ。
どちらが大きいデータセットを扱えるように設計されているかは判りますよね??
860132人目の素数さん:2006/05/27(土) 14:45:19
>>859
だから、具体的に比較してもらえない?
地震波「研究」もあれば、アンケート調査(臨床試験、でもいいけど)のデータ解析「業務」もあるし。
普通、前者には R、後者には SAS を選ぶよね。
861132人目の素数さん:2006/05/27(土) 16:39:33
>>856

ないんじゃない?
元々研究者用でしょう。
研究者=一般普及度が高い、ってワケではないでしょうから、
そう言った意味では、いくらRファンが「普及」を謳っても限界があると思う。
そもそも研究者が一般のニーズを良く理解している、とも思えないしね。
一般側としては「研究側」に合わせる努力ができる人しかこう言った特殊な
ソフトは使わんでしょ。
862132人目の素数さん:2006/05/27(土) 18:37:24
>>861
その開き直りスタンスをRは取ると・・・・
それじゃ駄目だ。俺の役には立てねぇ
863132人目の素数さん:2006/05/27(土) 19:07:59
1.データ解析業務従事者(臨床試験データ解析、マーケティング、・・・)
2.数学系研究者(数理統計学、計算機統計学、・・・)
3.非数学系研究者(数理経済学、遺伝子工学、生態学、地震工学、環境工学、気象工学、・・・)
4.卒論・修論のためにデータ解析をやる必要がある学生・院生
5.なぜかデータ解析を(一時的にでも)やる羽目になった非研究職の会社員

1は仕事で SAS か SPSS を使う(R を知っていようがいまいが)。
2や3は仕事の一部(データ解析、シミュレーション)で R を使う。

ここで言ってる「一般」って、4あるいは5、という理解でいいのかな?
864132人目の素数さん:2006/05/27(土) 19:34:03
>>863

多分。
ある意味Rって自慰ソフトだよね。
一般的には統計取る必要がある場面ってのが極めて少ないわけだし。
殆どのケースではExcelで間に合うしさ。
865132人目の素数さん:2006/05/27(土) 20:12:35
そこで大規模データ対応ですよ。
866132人目の素数さん:2006/05/27(土) 20:39:46
>>860
統計の世界にいてSASを知らないなんてもぐりだぞ
867132人目の素数さん:2006/05/27(土) 21:23:32
いっぱいデータ食わせたらメモリ消費が大変なことになりますたwwww
868132人目の素数さん:2006/05/27(土) 21:25:56
>>866
知ってるよ?SAS、仕事で使ってるし。R も詳しい方だと思う。
でも、どちらも大規模データが扱えなくて困った、という経験は無い(サンプルサイズで10万ぐらいまでだけど)。
で、SAS は変数が多い(マイクロアレイデータとか)と困難がある、という話を聞いたことがあるから、どうなんだろうって。
869132人目の素数さん:2006/05/27(土) 22:04:17
>>868
SASなら、500万件×200変数以上でも普通に扱えます。
Rだと10万件×20変数でもアップアップ。
870132人目の素数さん:2006/05/27(土) 22:06:34
メモリが256だと1万件でも辛くネ?
871132人目の素数さん:2006/05/27(土) 22:22:23
>>869
で、マイクロアレイデータとかだと5000変数だったりしますよね?
時系列でとった気象データだったりすると、もっと変数が多くなるわけで。
SAS はどこまで耐えられるのでしょうか?

実際に10万件(10万オブザーベーション)といったデータを扱う
領域にどんなものがあるか、ということに興味があるのです。
医学統計の実務をしているのですが、多くても1万件を超えたことがありません。

それと、500万件×200変数以上でも普通に扱えます、と言われますが、
ハードディスクにスワップされますよね?
相関係数求めたら、現実的な時間で結果がかえってきますか?

>>870
メモリ 256 だと、Windows なら SAS を立ち上げただけで挙動不審になるのでは?
872132人目の素数さん:2006/05/27(土) 22:43:31
ちょっと実験したくなって

x <- matrix(rnorm(1),2500000,50)

を実行したら、ブルースクリーン・・・・・


>>871
SASはハードディスクに直接I/Oをかけるのでメモリ量は基本的に関係ありません。
プログラム本体を格納できるだけのメモリがあればいい。基本的にだけど。
またそれでいてあの速度だから手放せない。

873132人目の素数さん:2006/05/27(土) 22:47:27
Rのメモリの使い方は体育会系って感じがしてある意味好きw
874132人目の素数さん:2006/05/27(土) 23:03:15
>>873
Rは完全に文科系。
体育会系というならSASでしょ。ガリガリ音を立てて計算をしている。

S-PLUS9も大容量データハンドルを謳っているけど、
ハードディスクに直接書き込むようになったのかな?
875132人目の素数さん:2006/05/27(土) 23:21:56
>>872
iMac G5 でやったら、20秒ぐらいでかえって来たよ。

> x[2500000,50]
[1] -0.0607673
876132人目の素数さん:2006/05/27(土) 23:41:12
>>872

> x <- matrix(rnorm(1),2500000,50)
警告:Reached total allocation of 734Mb: see help(memory.size)
警告:Reached total allocation of 734Mb: see help(memory.size)
エラー:サイズ 976562 Kb のベクトルを割り当てることができません
877132人目の素数さん:2006/05/28(日) 09:35:06
Rからwww上の圧縮ファイルをダウンロードする関数はありますか?
878132人目の素数さん:2006/05/28(日) 22:17:23
help ( download.file )
879132人目の素数さん:2006/05/28(日) 22:30:13
S-PLUS Enterprise Developer 版 っていくらするの?
10万で買えたら間違いなく買うんだけどな。

Big Data ライブラリがRにも欲しいね。
ttp://www.msi.co.jp/splus/products/V7/V70win.html
880132人目の素数さん:2006/05/28(日) 22:50:55
あの、基本的な質問で申し訳ないのですが、

S3やS4ってどういう意味ですか?
881132人目の素数さん:2006/05/29(月) 03:00:43
882132人目の素数さん:2006/06/02(金) 19:30:11
Rコンソール上では日本語で書き込みができるのにデータの読み込みをすると文字化け(エスケープ?)してしまいます。
R2.3.0、OSX10.4.6です。
読み込ませたのはカンマ区切りのcsvファイルとテキストファイルで、同じことをWinXPのRでやってみてもらったところ問題なく表示できていました。
対処法分かる方がいましたらお願いします。
883132人目の素数さん:2006/06/03(土) 19:58:31
文字コード変えてやってみた?
884132人目の素数さん:2006/06/03(土) 22:00:13
miで改行コードも含めていろいろ変えてみたんですがどうにもならなかったです・・・

ツールバーにあるので気になってたのですが、もしかしてこのパッケージってOSXではX11を通して動いてるんですかね?
だとしたらkinput2なんかを入れたりして日本語環境を構築しないとだめなんでしょうか?
885132人目の素数さん:2006/06/04(日) 00:46:57
>>882

Intel Mac miniで同じバージョンのRですが、UTF-8, 改行LFのCSVファイルが列名, データともに
問題なく読み込めていますよ。

>>884

X11はX11()デバイスを使うときだけ必要(Rcommanderとか使うとき)
基本的にCocoaアプリです。
886132人目の素数さん:2006/06/04(日) 07:09:34
>基本的にCocoaアプリ

ですよね、最初から日本語表示、入力ともにできてたので可能性は薄いと思ってました。
さきほど別のMacにRを入れてみてmiでファイルの文字コードを>>885にあるように変換してから読み込ませたところ問題なく表示できました。
インストール時の失敗かなにかなんでしょうか・・・再インストールも含めて試してみます。
887132人目の素数さん:2006/06/05(月) 08:39:41
SASは今までの惰性でしばらくは使用され続けるけれど
設計思想が古いから遠からず緩やかな死を迎えると思う
SAS社自身もそのことはよーく知っていてもう学生の教育に力はいれていない
(私の分野ではSASを採用している授業が周囲でどんどん減っている)
若いときSASで教育された今現役の人が年をとったらそれでおしまいになる
将来に向けて養成するんじゃなくて現世代から絞れるだけ搾り取る
というマーケを展開していることがそれを如実に示している.
888132人目の素数さん:2006/06/05(月) 09:39:48
>>886

システム環境設定の「言語環境」で、「書式」タブの「地域」が「日本」になっているかどうかも
確認したほうがよいでしょう。これが米国とかだと英語版相当の機能になるはず。

889132人目の素数さん:2006/06/05(月) 09:57:10
>>882
read.csv()でエンコードを指定できなかったけ?file()だけだったけ?
890132人目の素数さん:2006/06/05(月) 13:36:58
.Callの引数で "S_c_use_method"とは何物なのでしょうか.
後ろの引数に指定する関数のための「おまじない」みたいなものなのでしょうか?
891132人目の素数さん:2006/06/05(月) 20:01:10
>>887
SAS 社の売り上げはちょっと調べれば判るだろうけれど、まだまだ急成長を続けている。
SAS のトレーニングは、(昔は)宣伝のために SAS 社がサービスでやってただけ。
892132人目の素数さん:2006/06/05(月) 21:55:05
SAS/STATだけ見るとどうなんだろう?
893132人目の素数さん:2006/06/05(月) 23:19:03
>>887は学者かなんかでしょ?
マイニングもどきの統計ではSAS以外の選択肢は考えられない
894132人目の素数さん:2006/06/06(火) 05:30:29
>>893はSASの社員か,企業の電脳土方かなんかでしょ?
895132人目の素数さん:2006/06/06(火) 08:17:41
しかしさ、「R」って名前は不便だよ、google検索とかするときに
 R Anova
とかで検索しても、けっこう関係ないのばっかり。
Stata Anova
とかならStataの記事ばかりでてくるのによ。

R 検索で指定できねーよ、ばか。
896132人目の素数さん:2006/06/06(火) 08:23:24
R指定
897132人目の素数さん:2006/06/06(火) 11:46:35
それは「C」や「S」にも共通する。
まぁ、RSiteSearch()を使ってくれ。
898132人目の素数さん:2006/06/06(火) 19:33:17
>>895

R 統計

で結構出ます^^
899132人目の素数さん:2006/06/06(火) 22:32:11
Rの学校の宿題全く出来ないよぉ><
いみわかんなぃし。。。助けてぇ・・・
900132人目の素数さん:2006/06/06(火) 23:30:34
>>894
馬鹿だねぇ。
Rで済むようなセコイ仕事しかしてないから想像もできないのかな?
901132人目の素数さん:2006/06/06(火) 23:35:12
デジャヴ
902132人目の素数さん:2006/06/07(水) 00:08:04
>>900
>Rで済むようなセコイ仕事

ゲノム解析ってセコイ仕事??
903132人目の素数さん:2006/06/07(水) 00:19:17
せこい。井の中
904132人目の素数さん:2006/06/07(水) 01:13:21
重箱の角を突いくことが業績になるバイオインフォはニッチ産業
905132人目の素数さん:2006/06/07(水) 23:23:19
Rでゲノム解析は間違いなくセコイでしょ。

SASが使える環境なら間違いなくSASを選ぶよ。
906132人目の素数さん:2006/06/08(木) 00:32:15
>>905
業者さん乙w
907132人目の素数さん:2006/06/08(木) 11:21:23
1 名前:ひろゆき@どうやら管‎理人[] 投稿日:2006/06/08(木) 10:05:39
数学に素養のある住人の数学板離れの防止、
そして数学好きの新参者が寄りつきやすい環境を整備するために
数学板の諸悪の根源を排除しましょう。

最近大量に発生している数学と関係のない雑談を繰り返すコテハン、
これを減らしていかなければ今後数学板の存亡に影響が出てくることは間違いないでしょう。

そしてこれらのコテハンを発生・定着させている根源がスレタイにあるコテハンの人物であることがはっきりと分かりました。

数学とは無縁のこのコテハンを数学板から排除することが数学板の正しい活性化のための早道です。
数学好きの真面目な住人の皆様、どんどん訴えて参りましょう。
908GiantLeaves ◆6fN.Sojv5w :2006/06/08(木) 15:12:37
talk:>>907 人の脳を読む能力を悪用する奴を排除しないと結局悪くなるぞ。
909132人目の素数さん:2006/06/15(木) 04:01:21
教えていただきたいのですが,Rでカテゴリカル回帰分析(最適尺度法)は
どのようにすれば良いのでしょうか?
ググってみたり,http://www.okada.jp.org/RWiki/を調べたりしていた
のですが,結局分かりませんでした…。お手数をおかけしますが,ご教授
いただければ幸いです。
910132人目の素数さん:2006/06/16(金) 00:47:06
>>909
ぐぐってみたが、どうもカテゴリカル回帰というのはSPSSでしか
使わないみたいだね。カテゴリーの関連を知りたかったら
普通は林の数量化法を使うと思うけど国内専用だからなあ。
ぐぐった結果でもその2つがどの程度違うものなのかが
分からなかった。誰か知っている人がいたら教えてほしい。
911132人目の素数さん:2006/06/16(金) 06:19:25
>>909

数量化I類?
912132人目の素数さん:2006/06/16(金) 16:47:00
「くりかえし」というものを習い
計算が止まらなくて
ウインドーを閉じたことがあるが、
ウインドーを閉じずに計算をストップする方法は
あるのでしょう?
913132人目の素数さん:2006/06/16(金) 20:25:48
>>912

ESC(Windows/Mac)
Ctrl+C (Linux)

914909:2006/06/16(金) 23:10:46
お返事ありがとうございます。重要なことを書き忘れてました。

事情がありまして,従属変数が順位尺度,独立変数が間隔尺度なんです。
それで,それら変数をそのまま使うためにはどうしたものか…と考えていた
ところ,SPSSのカテゴリカル回帰分析なるものを見つけました。しかし,
SPSSのcategoriesは使えない状態でして,Rでなんとかならないかなぁと
考えて質問させていただきました。
(重)回帰分析・数量化I類の従属変数は量的変数でなければいけませんよね?
(…分析方法を考え直した方がいい気がしてきました。
915132人目の素数さん:2006/06/17(土) 00:43:26
>>914
ダミー変数を使ったら??
916132人目の素数さん:2006/06/17(土) 10:13:21
>>913
ありがとうございます。
917909さんへ:2006/06/17(土) 12:38:49
ゆいでーす. よろぴくね
ダミーさんでは,順序が表現できなくて,ゆい,悲しいな
あなたがぁ やりたいことをぉ 叶えてくれる分析法は
「多値カテゴリ順序データのプロビット(ロジスティック)回帰」だぴょん
名前が長いけど覚えてくれたぁ? やりかだけどぉ
SEMのMplus,EQS,とかぁ,LISRELがおすすめでーーす. うふっ!
Rだったらねぇ,SEMパッケージとpolycorパッケージを組み合わせてぇ
ブートストラップを行う方法がぁ そのまんま
SEMパッケージのEXにあるからぁ ソレソレーーって利用できちゃうわよ
ゆい,応援してるからぁ,くじけないで頑張ってね.約束よ!
918909:2006/06/20(火) 21:45:56
>>915,917
ありがとうございます。統計って,マジで奥が深いですね。

そうなんですよ。順位が勿体ないなぁと思って,どうしたものかなぁ…と思っていたんです。
Rにはまだまだ不慣れで時間はかかるかもしれませんが,頑張ってみます。
お忙しい中,ありがとうございました。
919132人目の素数さん:2006/06/20(火) 23:35:40
>>917

ワロタwwww
920132人目の素数さん:2006/06/22(木) 17:53:18
すごい基本的なことだと思うのですが、教えてください。
Mac OS X 10.4.6でRをターミナル上で使おうとしたのですが、
> options(device="Quartz")
> demo(graphics)
[中略]
> if (dev.cur() <= 1) get(getOption("device"))()
以下にエラーget(x, envir, mode, inherits) : 変数 "Quartz" は存在しません
> options(device="X11")
> demo(graphics)
[中略]
> if (dev.cur() <= 1) get(getOption("device"))()
以下にエラーX11(display, width, height, pointsize, if (is.null(gamma)) 1 else gamma, :
デバイス 'X11' を開始できません
追加情報: Warning message:
X11 ディスプレイ '' へのコネクションを開くことができません
となります。X11は起動してあります。どうすればターミナル上のRでグラフィックディバイスが
開くのでしょうか。
921132人目の素数さん:2006/06/29(木) 12:00:59
test
922132人目の素数さん:2006/06/29(木) 12:01:29
すみませんが、質問です。
GNU R の商用利用は、どの程度まで可能なのでしょうか?

1.社内の個人的業務処理
2.社内運用システムの作成
3.社外に納品するシステムの作成

できたら3.をやりたいと考えているのですが。

また、R で書いたスクリプトは、必ず公開しなければならないのでしょうか?
↓を見たのですが、どうもRがどういうカテゴリに属するのか、良く分かりません。
http://www.gnu.org/licenses/gpl-faq.ja.html#IfInterpreterIsGPL

923132人目の素数さん:2006/06/30(金) 00:33:03
>>922
GNU GPLのFAQを読んでみた感想。

Rで利用するスクリプトは個人(あるいは会社内)で
利用するだけならもちろん公開の義務はないでしょう。

商用利用の方ですが、外部プログラムとしてRを
呼んで作業をさせるだけでシステムそのものにはRが
含まれないなら問題はないと思われます。
しかし、システムの主たる目的がRがないと達成できない
ならRを広い意味で含むソフトウェアと考えられ、GPL違反と
言われるかもしれません。
# たとえば、特殊な用途に限っても統計解析をするソフト
# として裏でRが動くだけというものは市販はできないでしょう。

といっても上記のように独立した構造であり、
納入するのが1社だけで一般に市販することがないなら
問題がないように思うのですが、どうでしょうか?
# 当たり前ですが、Rに関わる部分は無保証であり、
# そのシステムを利用する会社に何らかの損害が生じて
# それが外部利用のRのせいであると分かっても
# あなたの会社が賠償するか相手の会社にそれは免責事項
# であると納得してもらう必要があります。
# そちらの方がはるかに問題だと思いますがね。
924132人目の素数さん:2006/06/30(金) 06:40:46
当たり前ですが エクセル,SPSS,SASにもバグはあり
それに起因して,そのシステムを利用する会社に損害が生じても
MS社もSPSS社もSAS社も,損害を賠償する積もりなんて
これっぽっちもありません.
契約書をよく読むと,絶対賠償しなくて済む様に,これでもかと
イロイロ書いてあります.だからその点は「実質」Rと同じです.
925132人目の素数さん:2006/06/30(金) 10:34:42
ソフトの購入に支払った金額までなら補償してくれる可能性は
ありますが、「実質」Rと同じというのは正しいでしょうな。
ただ問題なのはそういう事態が発生した場合、システムを
構築した会社がそれはうちの問題ではないと言い逃れられること
にあるのでしょう。Rを使ってもその部分はうちには責任ないということを
相手の会社に納得してもらえばいいのですが、それは難しいのでは
ないかということです。
926132人目の素数さん:2006/06/30(金) 21:17:12
>>924
賠償が受けられるかどうかは問題ではないんだよ。
SAS に由来するバグを理由に発注元が受注会社に賠償を求めることなど最初から出来ないから。
SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれないから、
普通に契約を結ぶ限りでは「責を負う」必要などない。
で、発注元の担当者も好きこのんで R の使用を要求したりしない。
賠償を得られようが得られまいが、不具合が発生した時点で自分のクビが飛ぶから。
927132人目の素数さん:2006/07/01(土) 08:52:04
>発注元の担当者も好きこのんで R の使用を要求したりしない。

どっちにしろ賠償されないなら,発注コストが低く見積もれて
ソースがみられるRのほうが安心じゃん 
928132人目の素数さん:2006/07/01(土) 09:42:40
社会に出てないのがすぐわかる
929132人目の素数さん:2006/07/01(土) 10:30:25
SASの社員
or
SASの奴隷の電脳土方(低所得)
930132人目の素数さん:2006/07/01(土) 17:13:02
>>927
担当者の立場をイメージできないのかな?

SAS や SPSS や S-plus といった統計パッケージソフトは、
営利企業が自社の社会的信頼をかけて作成しているため、
事実上の品質保証がある。品質の保証されたパッケージを使う限り、
バグが出てもその使用を指示した発注元の担当者の責任は問われない。
これは、OS として Windows や商用 Linux を使う場合と同じ。

で、R はその意味での品質の保証が無い(実際の品質とは関係ない)。
OS として Mona OS を使うのと同じ(ソースが見れるから安心?)。
R に由来するバグが出て業務に支障が生じたとき、その責はもちろん
「品質の保証が無い統計パッケージソフトを選択した」担当者にある。
会社組織や行政機構の一員なら、当然、しかるべき責任をとらされる。

当然ながら、生じた問題の責任を自分一人でとりきれる場合には、
R が選択肢に入ってくる。自然科学系の研究者(あるいは卒論執筆中の学生)で、
自分の研究のためにデータ解析をするような場合がこれ。
R の豊富なパッケージに利点を見いだせば、使用になんの躊躇も無い。
実際、両方使える者は(私を含めて)皆、目的に応じて使い分けているはず。
931132人目の素数さん:2006/07/01(土) 20:22:54
>事実上の品質保証がある。

だからないって.そもそも保証って何だよ.
補償しない保証なら,おれがしてやるよ
中が見えないだろ.プロがミミズで作ったソーセージだろ

Rはオープンだからごまかしきなないだろ
だれでも中がみれるから,直ぐにへんなコードはとうたされるだろ
932132人目の素数さん:2006/07/01(土) 22:41:41
面白いな。
発注元は自力でシステムも作れないし、統計ももちろん分からない
から外注なんだろ?受注を受けた方もRの全ての機能が必要な
システムでもないだろうに自分で組まずにRを使おうって言ってるんだよな。
どんな話し合いになるのかなあ。w
933132人目の素数さん:2006/07/01(土) 23:12:56
こういうコマンドを実行してください。
とか言うのかねw
934132人目の素数さん:2006/07/01(土) 23:44:03
>>926

>SAS のバグをディテクトすることは、受注会社が「当然行うべき品質の管理」に含まれない

ここが微妙だな...
統計をまれにしか使わない客との契約でそれを納得してもらえるかどうか?
要求仕様が統計解析部分を含んだシステム全体としてのものだと、外部から調達した部分の
バグも自社の責任の範囲内とみなされるだろうな...

935132人目の素数さん:2006/07/02(日) 00:22:01
>>931
>そもそも保証って何だよ.
「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。
三菱重工の部品を使ってロケットを組み立てたなら、その部品のせいで打ち上げに
失敗して人工衛星を壊しても、「三菱重工の部品を使った」ことは過失とは見なされない。
でも、泡沫メーカーの部品を使ったり、自社製造の部品を使い、そのせいで失敗したら、
部品の選択そのものが過失。訴えられ、おそらくは負ける。
あなたは認めない(認めたくない?)かも知れないけど、法廷では立派に物を言う「保証」だよ。

>補償しない保証なら,おれがしてやるよ
あなたには出来ない。
守るべき社会的信頼が無い者が何を言おうと・何をしようとそもそも保証に「ならない」から。

>>932
>発注元は自力でシステムも作れないし、統計ももちろん分からないから外注なんだろ?
少なくとも、製薬会社では違うね。統計で博士号取ってるような連中が担当者になって発注してるよ。
解析業務には波があるから、全部自社で解析するよりピーク時に外注した方が人件費が浮くんだよ。

>>934
契約書に免責条項として
「OS あるいは SAS に由来する不具合については、乙(=受託会社)はその責を負わない。」
って書いておけば、大丈夫。普通、書くし、それがのめないような発注元は相手にしない。
ついで言うと、作った SAS プログラムを発注元に提供「しない」契約が普通。
データを受け取って、解析結果だけ納品するんだよ。
936132人目の素数さん:2006/07/02(日) 05:37:10
>「一流の営利企業が自社の社会的信頼をかけていること」が保証になっている。
一流とか自分でいうな
実効が何もないんだからそれは自己満足.中身を見せずに社会的信頼といっても自己欺瞞
中身が見えているRのほうが清廉潔白

>あなたには出来ない
ちゃんと読めよ 何も補償しないのは同じ(SASにもできない)
という文脈のレトリックにまともに答えてどうする
本当に社員か?
937132人目の素数さん:2006/07/02(日) 10:19:35
>>936
>一流とか自分でいうな
例え私が三菱重工あるいはSAS社の社員だとしても、この説明の内容を変更する必要は感じないね。

>実効が何もないんだからそれは自己満足
発注元の担当者にとって、「業務に支障が出たとき、それに対する責任を負わずにすむ」
ことが社会的信頼のある製品を選択することの実効だ、と言っている。
一般論としてそれは認められない、というのならまともに反論してください。

>中身を見せずに社会的信頼といっても自己欺瞞
自己欺瞞って、SAS 社の?社会的信頼は、世間が企業(の製品)に対して付与するものだよ。
もちろん、「中身を見せない(見せる)」ことも、社会的信頼に反映される。
まあ、SAS 社がソースコードを公開しても、誰も読まないだろうけど。

>中身が見えているRのほうが清廉潔白
中身が見えている点において、ね。

>文脈のレトリックにまともに答えてどうする
まともに返すこと自体がレトリックだよ。

>本当に社員か?
民間企業の社員じゃないよ。

1.疑問なんだけど、R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる?
私はどちらにも利点・欠点があり、それゆえに今後も使いわけられていく、と思うのだけど。

2.R の欠点の一つ(もちろん、美点でもある)に開発・保守が非営利で行われている、ということがあり、
それが業務用途での採用の足かせになっている、という考えには同意できない?
すでにパッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途では広く使われて
いること、一般企業でフリーウェアの導入(メーラーとか)が困難なことについて、どういう理由があると思う?
938132人目の素数さん:2006/07/02(日) 10:23:18
>>935
発注元が製薬メーカーだったらSAS以外の統計ソフトは認めないので
今回の事態は起こらないだろうな。そもそも君のいうとおり解析のみを
外注してシステムの外注はほとんどしないだろう。(よく使うものなら
自分たちで組むだろう。)
というわけでおれは製薬メーカーが発注元だとは思っていない。
それでもどういう契約をしたのかが基本になるのは確かだな。
939132人目の素数さん:2006/07/02(日) 11:11:17
>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる
はい,そう思っています.今現在はオープンソースという思想がジワジワ浸透し始め
た時期(まだまだ少数派ですが)だと思っております.
1.お金をもらった社員がSASのために,ソース公開されない状況でかいたプログラム
2.自分が開発した手法,D論なんかで深く係わった手法を,同じ分野の
  研究者が自分のコードを簡単に見られる状況で公開したプログラム
では後者のほうがシステムとして信じられるという,当たり前のことが認められる時代
が直ぐにくると思います.研究者は名誉を重んじます.

>それが業務用途での採用の足かせになっている、という考えには同意できない?
今現在,採用の足かせであることは事実です

>パッケージの充実度でも足下にも及ばなくなった S-plus の方が R よりも業務用途
では広く使われていること
こんな不合理なことはいつまでも続きはしません.企業は合目的だから(非合理的な保
守性も合目的だからで),オープンソースという思想が社会に半分くらい認知された時
点で,なだれを打ってオープンソース(Rとかリナックスとか)に移行すると思います.

>発注元が製薬メーカーだったらSAS以外の統計ソフトは認めない

こんなの今だけ,大橋の世代が終われば,もっと合理的な若い世代はSASを支持しない.
支持する理由がない.無意味なバージョンアップ,無意味な新製品.SASも自分達の寿
命が長くないことを悟ってるから,非道な値上げで現世代から搾り取って終わりにしよ
うとしている.新しく大学でSASを導入するとこなんで皆無です(私は情報教育の学会
にも入ってます)今は過渡期です
940132人目の素数さん:2006/07/02(日) 13:54:32
>>R は SAS よりも「全面的に」優れており、いずれは SAS は淘汰されると考えてる
>はい,そう思っています.
ご立派。R に心酔してるんだね。Robert Gentleman だって全面的に優れているとは思ってないだろうよ。

>大橋の世代が終われば,もっと合理的な若い世代はSASを支持しない.支持する理由がない.
O橋先生の世代で SAS を強力にサポートしてるのって、O橋先生だけじゃん...
次世代はH田先生あたりがあとを引き継ぐだろうから、きっとあまり変わらないよ。

そもそも日本は SAS 社から見れば世界の10%でしかないし、SAS は FDA 標準。
日本に R の時代が来るのは、アメリカの一般企業が SAS を捨ててから。
政治力の問題で、米国標準は世界標準だから。
で、MS とか SAS 社 とか Oracle がつぶれると米国に税金が落ちなくなるから、
米国政府は国益のために最後まで自国のソフトウェア産業(国策産業!)を保護するだろう。

>SASも自分達の寿命が長くないことを悟ってるから
業績は右肩あがりみたいだね。
http://www.sas.com/corporate/report05/annualreport05.pdf

あと、MS 社は Windows のソースコードを開示したように、SAS 社も
「業績をあげるために必要と判断すれば」あっさり開示すると思うよ。
もちろん、オープンソースの理念とは別物だけど。

>新しく大学でSASを導入するとこなんで皆無です
主だった大学ではとっくに導入が済んでるだけでは?
941132人目の素数さん:2006/07/02(日) 21:13:21
>>940
SASを授業で一斉に使えるだけのライセンスで契約している大学って
そんなにあるの?研究室単位では使っているところはあるだろうけどね。
942132人目の素数さん:2006/07/02(日) 21:30:28
SASとRが本質としてどっちが優れているかなんて関係ない。

言い訳ができるのがどっちかというだけ。
943132人目の素数さん:2006/07/03(月) 16:51:26
RとS-PLUSを比較するのは分かるがSASと比較する意味が全く分からん。
RなんてGUIインターフェースがまるっきり無いんだからそういう面では糞だろ?
SASみたいに矢印引っ張るだけで解析なんてRには到底できっこない。

何を勘違いしてるのやら。
944132人目の素数さん:2006/07/03(月) 18:59:50
どうでもいいがな。
所詮は道具。
945132人目の素数さん:2006/07/03(月) 22:11:27
>主だった大学ではとっくに導入が済んでるだけでは?

慶応は岸元
クビ(防人島流し)にしてSASからRに文系も理系も全面移行
946132人目の素数さん:2006/07/04(火) 00:54:49
>>943
きみがSASもRも素人なのは解った。

ま、俺はRとAccessで仕事したくないね。
947132人目の素数さん:2006/07/04(火) 01:40:43
私は仕事自体したくありませんが、なにか?
948132人目の素数さん:2006/07/04(火) 08:16:37
>>946
レッテル貼りしかできない厨房乙
949132人目の素数さん:2006/07/05(水) 08:59:43
みなさん、

議論しているひまがあったら

T c l / T k が い ら な い G U I つ く っ て く れ ま せ ん か ?

950132人目の素数さん:2006/07/05(水) 10:57:38
>>949
Gtkを使えば?
951132人目の素数さん:2006/07/05(水) 21:30:21
>>949
つess
952132人目の素数さん:2006/07/05(水) 22:41:21
>>949
つJGR

...たしかにRcmdr以外は統計処理自体の初心者向けじゃないな...
953132人目の素数さん:2006/07/06(木) 16:55:47
っつーかたった10万くらいのデータでバグるRをそこまで信用できないでしょ?
SAS vs. Rってコンテクストはナンセンスだと思うよ。
道具は所詮道具、と言ってる>>944が正しいと思う。
Rマンセーもいいけど、Rにそこまで「心酔」する理由も分からんです。
マニアは逆に一般化を遠ざけるよ。そこがRの弱点www
954132人目の素数さん:2006/07/07(金) 13:10:00
Q&A (中級者コース)の慶応大生の書き込みを見て、ふっと思ったのだけど、
Windows版ではpage()はサポートされていないの?
Linux版、Gtk版、MacOSX版でちゃんとあるのだけど。
955132人目の素数さん:2006/07/07(金) 20:41:59
>>954
その「サポート」っていうのが何を意味するかわかんないけど
例えばpage("?")とか"?"オブジェクトの中身のページャ表示は
Windows版Rでも普通にできる。(ヘルプ閲覧用窓と同じのが開く)

でも、行列やベクトル等の数値オブジェクトはだだ書きされるから
それらの表示や確認には不向き。(列も行も見分けがつかなくなる)
で今、表計算ソフト風に閲覧できるedit(x)を慶応大生に勧めてきた。
956132人目の素数さん:2006/07/09(日) 21:53:31
次スレです.

= 統計解析フリーソフト R 【第2章】 =
http://science4.2ch.net/test/read.cgi/math/1152449095/l50
957132人目の素数さん:2006/07/09(日) 23:53:43
いくらなんでも早すぎだろ。

こんなにペースの遅いスレなのに。
958132人目の素数さん:2006/07/10(月) 13:41:50
二年三百九日。
959132人目の素数さん:2006/07/13(木) 00:40:39
age
960age:2006/07/16(日) 23:37:52
age
961132人目の素数さん:2006/07/19(水) 15:08:59
SASで出来る最小自乗平均(least squares means)とその標準誤差ってRで出来るかな?
962132人目の素数さん:2006/07/19(水) 19:41:40
こういうこと書き込むのはSASの社員か
岸本のような元SAS社員しかいねーよ
実際のユーザーはしいたげられてっからな
963132人目の素数さん:2006/07/21(金) 18:40:25
grep()で、結果を反転させたいのだけど、helpを見てもそれらしいオプションがない。
要するに、grep --invert-match をしたいのだけど。正規表現を工夫してしのぐしかないの?
964132人目の素数さん:2006/07/23(日) 02:17:20
>>963
txt[-grep("foo",txt)]
という感じではだめなのか?
965132人目の素数さん:2006/07/24(月) 10:07:07
>>964
あなた天才だね。ありがとう。
966132人目の素数さん:2006/07/24(月) 22:24:06
age
967132人目の素数さん:2006/07/28(金) 18:03:20
351
968132人目の素数さん:2006/07/29(土) 00:26:30
age
969132人目の素数さん:2006/07/29(土) 11:49:38
データマネジメントの分野でのRの効率的な勉強法を教えてください。
970132人目の素数さん:2006/07/30(日) 11:29:52
971132人目の素数さん:2006/07/30(日) 13:41:50
二年三百二十九日。
972132人目の素数さん:2006/08/03(木) 23:48:29
age
973132人目の素数さん:2006/08/06(日) 12:34:25
>> EXCELデータをRに読み込むときってどうしてます?
>> 私はRODBC使ってますが.
>1.
>範囲選択
>2.
>read.delim("clipboard")

これってどうよ?
974132人目の素数さん:2006/08/07(月) 08:47:12
いんじゃね
975132人目の素数さん:2006/08/07(月) 17:08:34
別に統計解析を信頼できるソフトで行うときに、
ディフェクトスタンダードなソフトなんて存在しない…。

…しなくなるといいな。
976age:2006/08/11(金) 13:47:39
age
977132人目の素数さん:2006/08/12(土) 01:47:22
w^3 = 1, w != 0 で,行列

[ 1 1 1 ]
[ 1 w w^2 ]
[ 1 w^2 w ]

の rank ってどうやって求めたらいいですか?
978977:2006/08/12(土) 01:48:05
間違えた.w != 1 でした
979909:2006/08/12(土) 14:40:52
ゆいさん、いらっしゃいますでしょうか?以前、「多値カテゴリ順序データの
プロビット回帰」に関してご教授いただきました909です。その後、試行錯誤
しまして、うまくいったように思うのですが、本当にできているか不安でして
改めてお伺いしたくレスさせていただきました。
データフレームをData、そこに含まれる従属変数をy、独立変数をx1,x2,x3と
した場合、以下の構文で大丈夫でしょうか?
記載に不足などがあるかもしれませんが、余裕がございましたら改めてお教え
いただけると幸いです。勝手ばかりで申し訳ありませんが、よろしくお願いします。

hcor <- function(data) hetcor(data, std.err=FALSE)$correlations

model.data <- specify.model()
y <- x1, lam1, NA
y <- x2, lam2, NA
y <- x3, lam3, NA
x1 <-> x1, NA, 1
x2 <-> x2, NA, 1
x3 <-> x3, NA, 1
y <-> y, the1, NA

R.data <- hcor(Data[,c("y","x1","x2","x3")])
sem.data <- sem(model.data, R.data, N=n)
summary(sem.data)

system.time(boot.data <- boot.sem(Data[,c("y","x1","x2","x3")], sem.data, R=1000, cov=hcor), gcFirst=TRUE)
summary(boot.data, type="norm")
980132人目の素数さん:2006/08/12(土) 18:35:57
>975
こまかいけど「デファクト・スタンダード(de facto standard)」な。
ディフェクト(defect)は「欠陥」。
981132人目の素数さん:2006/08/15(火) 12:35:31
cumsumのヘルプにある
cummin(c(3:1, 2:0, 4:2))
cummax(c(3:1, 2:0, 4:2))
って意味が分からない。
今夜もやもやして寝られそうにないので誰か教えて。
982132人目の素数さん:2006/08/15(火) 18:09:04
> c(3:1, 2:0, 4:2)-> x
> x
[1] 3 2 1 2 1 0 4 3 2

これのminとmaxでしょ。
983132人目の素数さん:2006/08/15(火) 21:32:45
>>982
質問の仕方が悪かったのかな。
3 2 1 2 1 0 4 3 2
3 2 1 1 1 0 0 0 0
3 3 3 3 3 3 4 4 4
1行目をどうすれば2行目または3行目になりますか。
あぁぁ、そうか、なるほど。やっと分かった。
でも、こんなのどんな使い道があるのだろうね。
984132人目の素数さん:2006/08/16(水) 00:38:22
仮にその行列をxとすると
y <- x[1,]
x[1,] <- x[2,]
x[2,] <- y
で1行目と2行目入れ替え
985132人目の素数さん:2006/08/16(水) 12:41:05
>>984
いや、その、>>981からの流れ(cummin()とcummax()の挙動)なんだけど。。。
c(3:1, 2:0, 4:2) → 3 2 1 2 1 0 4 3 2
cummin(c(3:1, 2:0, 4:2)) → 3 2 1 1 1 0 0 0 0
cummax(c(3:1, 2:0, 4:2)) → 3 3 3 3 3 3 4 4 4
で、質問はcummin()とcummax()の使い道。こんな時に便利とかある?
986132人目の素数さん:2006/08/17(木) 12:45:50
二年三百四十六日二十三時間四分。
987132人目の素数さん:2006/08/18(金) 01:29:03
>>985
それは新記録の挙動を自動的に生成するときぐらいかな。
(cumminは小さいほど新記録、cummaxは大きいほど新記録)
988132人目の素数さん
= 統計解析フリーソフト R 【第2章】 =
http://science4.2ch.net/test/read.cgi/math/1152449095/