1 :
デフォルトの名無しさん :
2006/10/15(日) 11:38:10
乙
改訂版だろ? 早く訳されたやつでないかな(・∀・)
Ahoをアホつって通じるかな
なんじゃ また構文解析か
14 :
デフォルトの名無しさん :2006/10/17(火) 10:45:19
15 :
デフォルトの名無しさん :2006/10/17(火) 10:52:24
>>12 あのね、今時そういうの流行らないの。
だいたい、同じようなものがいくらでも存在するのに、なんでそういうの作ろうと思ったわけ?
新規性がないんだよね。
いや、悪いとは言わないよ。
でも、これからのコンパイラ作りというのは、COINSやGCCのような
コンパイラインフラストラクチャ(COINSの用語を借りるなら)を利用して
最小限の労力で必要な部分だけを作るというように変わりつつあるのに、
君は今時そんなことをやってるんだねぇ。
>>16 だってほら、何かしようとする子って「やる気」がある子でしょ?
そういう子は先につぶしておかないと後々やっかいなんですよ。
19 :
12 :2006/10/17(火) 11:46:01
私が既存のどれを試したかはドキュメントにも書いた(
http://tinyurl.com/yzxbdl )。
新規性がないということも書いたよ。
コンパイラの開発者ではなく、職業プログラマが、道具として、
小さいパーサを必要なところで自由に使えるものを、
というコンセプトで作ったものです。
自分はコンパイラにも使うつもりだけど。
私だって何も制約がなければocamlyacc使うよ。
ocamlであるということ以外、特に不満ないし。
既存のパーサジェネレータと格闘したことあれば
わかってもらえると思うんだけどなあ。勘違いかな。
COINSにパーサジェネレータあるの? どこ?
web見るとJavaCC使ってるようだけど……
caper作ってから発見した(見落としてた)のは以下の二つ。
後者はJavaだけど。
glrParser( 全然知らなかった )
notavaCC ( javaに興味がなかった&名前がJavaCCに似てたんで無意識にスルーしてしまっていた )
20 :
15 :2006/10/17(火) 17:37:36
自分が何かを為す分のエネルギーを全部他人の足を引っ張ることに使って 何が悪いのさ。
>>19 あれ?もう一度みたんだけど、最初読んだとき、
>>15 が書かれる前だけど、と微妙に内容が変わってないか?
>>19 あんたが考えているようなものはすでにいろんな人がいろんな実装を作っていて、新しいものを作っても大抵は他の人がやってる事なんだよ、残念だけど。
20年以上も前なら人気があった分野だけど、今は
>>15 が言うように変わってきている。
23 :
12 :2006/10/17(火) 18:15:23
微妙に変わってるけど、ほとんど見た目とかリンクだけだと思うよ。 svnのdiffみる?
nScript改造した方が早かったのにね
>>15 少しは他人の仕事も認めてみてはどうだ?
昔、自分でやってみて失敗したから腹いせなのかねぇ
認めるって12を? この程度だと、高校の部活で作ったレベルだと思うけど。 はっきり言って何一つ面白くない。
レベル表現に中高が出てくるレスはどういうわけか説得力が無い 引くに引けないから逆撫でに終始してます、みたいな
高校生乙。 俺の勝ちだな。
>>28 一言多かったようだが、その態度は止めとけ。
その一言が、お前が認められない原因なのかもな。
作ってない奴よりは上だろうな 出来るけどやらないだけとかいう奴は論外 しかし面白くないという意見には100%同意
>>29 他人のふりして説教か。
つくづく負け犬というのは、まっとうな言論でまったく勝ち目がなくなってからが
「本腰の入れ所」なんだな。
消えろ、ゴミ。
>>31 本人のふりして煽りか。
つくづく負け犬というのは、まっとうな言論でまったく勝ち目がなくなってからが
「本腰の入れ所」なんだな。
消えろ、ゴミ。
33 :
12 :2006/10/17(火) 21:41:11
そんなことより鮫の話しようぜ
前スレのx86の命令表とかwikiにまとめてあるとうれしいなぁと 思いました。
それっぽっちの日本語も正しく書けないとは、 本当にゴミだな。
>>39 日本語にそれっぽちもあれっぽちもあるんですか?
ここではクラスとしての日本語とインスタンスとしての日本語を 区別する必要があって、39は前者、40は後者なわけだ。 40のスクリプトエンジンは、意味解析に難があるな。
>>40 文章もソースコードも、量が多いほど「きちんと成立させる」のは難しくなる。
逆に、たかが一行の内容の無いレスさえまともに書けないなんてのは論外。
こんなこと(量について言っているということ)さえ説明されなきゃわからないとは、
本当に頭が悪いんだな。
>>42 数行に渡る説明よりも、一行の方が分かり易いが?
>>43 唐突に関係ない新しい切り口を持ち出して、さも反論のように書かないように。
なんで急に書く話が読む話にすり替わるんだろう って書こうとしたら、当事者の反応の方が早かった。
キチガイはそろそろほっとくか・・ まあまあ楽しかったけどな。
お前ら釣られすぎw
49 :
デフォルトの名無しさん :2006/10/18(水) 20:15:11
いや、どうせならVB用のパーサジェネレータ作ってくれれば良かったのに、、、
50 :
12 :2006/10/18(水) 22:28:18
もうどうでもよさそうな話終わった?
>>49 VBって処理系無料?
無料だったら、exampleのhello0.hppをVBで記述したらどのようになるか
書いてみてくれれば、作れるかも。
無論人柱やってくれるなら、だけど。
>>50 せっかくがんばって作ったのに、みんなに叩かれてかわいそう・・;;
私は味方だからね・・
漏れもダウンロード済み。
53 :
12 :2006/10/18(水) 22:56:08
動かなかったらごめんね
55 :
12 :2006/10/18(水) 23:19:28
インスコはした VB、10年くらい前にやった気はするがまったく覚えてないんで、 どのような出力をしたらよいか (hello0.hppに相当するものはどのようになってほしいか)と わかりやすい入門サイトかなんかきぼんぬ それくれれば 週末にでもやってみる
VBか。俺は今よりもVB6(以前)の方が好きだったな。 できればそっちを作ってくれんか>12
57 :
12 :2006/10/18(水) 23:59:40
そんな違うの? まあhello0.hpp相当のものをくれたほうをやるよ 処理系タダならね
58 :
デフォルトの名無しさん :2006/10/19(木) 00:16:10
COINSってライセンスに制約あるの? なんかちょっと動かすごとに100円とか取られるイメージがある。
残念。タダじゃない。もう発売&生産停止の状態。 だが一部のファンの間で未だに根強い人気があるから、オークションとかで 激しく高値で取り扱われていたりする。 俺はたしかに好きだったが、離れてからだいぶ経つから「久々にものづくりに 勤しんでみますか」程度のノリで。パーサから構築するのはさすがに骨が折れるから どうしようと思っていたらたまたまこのスレを見掛けたもので。 そんなわけだから、まあ無理なら自分で組み上げてみるよ。サンクス^^
XMLSchemaのパーサ作りたいでつ でもでもEBNFとかなんもないでつよどうやってつくれば いいんでつかだれか助けてぉ?
MLRISC とか C-- とかはもうアクティブじゃないのかね。
x inW w2 ------------------ x inW w1 UNION w2 こんなふうに文法分数みたいに定義してあるのたまに見るけど これってどうやって解釈すればいいの?分母のルールを割るの?
>>62 えっと、これは数理論理学ではよくある書き方なんだけど、
上の式(or 命題 or 述語)が成り立つならば下も成り立つ
という意味。
二重線にすると、上から下が成り立つ、かつ、下から上も成り立つ(要するに同値)。
フラスコに精液を溜めようと思って、実際に半分ぐらいまで溜めたんですが、 使うときにフラスコからだそうと思ったら出なくなりました。 どうやって出したら良いでしょう?
66 :
12 :2006/10/19(木) 21:25:35
自作自演乙
いま、誰も知らないマニアックな言語のデータ構造を Cの構造体に修正するツール作成したいのですが、 ある言語体系のルールから 別の言語体系のルールに変換するような内容の論文とか 資料とかって知りませんか?
意訳: パーサが書けない僕でもなんか処理できちゃう魔法知りませんか
71 :
デフォルトの名無しさん :2006/10/20(金) 00:58:14
パーサーの先読みが1つがデフォルトなのは知ってますが、 少なすぎませんかね?
例えばLR(k)をLALR(1)にするとかってことか? つか先読み1つより大きくすると別の問題しょいこむだけだぜ
>>71 大体複雑なのが出来るだけだから、複雑になるリスクとの兼ね合い。
74 :
デフォルトの名無しさん :2006/10/20(金) 14:52:43
>>72 ,73
よく言われることだと思うけど、それほど複雑にならない気もする。
例えば、LALR(99)なんてのは論外としても
LALR(2)ぐらいならメリットの方が多いのではないかな?
ならそれでいいじゃないか? つべこべ議論する事じゃないと思うが?
お前こそつべこべいうなよ
すまなかった。
この2や99ではない、1ってのがミソなんだな。
>>78 "Zero-One-Infinity Rule" だね
80 :
デフォルトの名無しさん :2006/10/21(土) 00:08:42
シフトを続ければ、1も99も同じ
>>71 Packrat Parsingでは、無限長先読みができますよ、と
バナナ気持ちいいよバナナ
>>82 Parsecは確かに無限先読みが使えるけど、Packrat Parsingとは違うもの
Parsecは基本的にはLL(1) + Syntactic Predicate(Parsecで言うtryのこと)
Packrat Parsingのアルゴリズムは、基本的には再帰下降型Backtracking Parserで、
(入力開始位置、非終端記号)のペアに対して、一度計算したSemantic Valueを再計算
しないように記憶しておくことで入力文字数に対して線形オーダの計算量でできるように
効率化したもの
>>84 空間計算量はO(n^2)になりそうな気がするけどどう?
なんか、凄くレベルが高いなこのすれ。 俺的にはyaccの書き方に四苦八苦していて、gawkとかのお手本を勉強してたんだけど、 shift/reduce が沢山でていてちょっと安心した。 普通 shift/reduce や reduce/reduce って0に持って行くものだと思ってたけど、 現実は違うのかな?
yacc(happy)使うくらいならParsec使いたいな
>>85 非終端記号の個数mと入力文字数nに対して、空間計算量はO(mn)。で、
非終端記号の数は通常一定なので、大体O(n)と考えて良いと思う。
ただ、それでも莫大なメモリを消費することには変わりないので、
巨大なXMLファイルなどを解析するのは向いてない。
Java用のPackrat Parser GeneratorでRats!というのがあるので、
興味があれば使ってみれば良いかも。
ちなみに俺はyaccのようなbottom up parserの挙動はイメージしづらいんで、
あんまし好きじゃない。自分では、JavaCCのようなLL(k)
Parser Generatorをもっぱら使ってる。
>>86 reduce/reduce は0にしないとだめなんじゃないか?
True AWK の結果(↓) awkgram.y: conflicts: 43 shift/reduce, 85 reduce/reduce
92 :
デフォルトの名無しさん :2006/10/22(日) 21:23:58
コンパイラってどうやって作るの?
まず、HSPを卒業して他の言語を覚えることから始めないとダメだ。
,-、 ,.-、
./:::::\ /::::::ヽ
/::::::::::::;ゝ--──-- 、._/::::::::::::::|
/,.-‐''"´ \:::::::::::|
/ ヽ、::::|
/ ヽ|
l. l
.| ● |
l , , , ● l
` 、 (__人__丿 、、、 /
>>1 糞スレ
`ー 、__ /
/`'''ー‐‐──‐‐‐┬'''""´
./ ___ l __
l ./ / |/ |
`ー-< / ./ ./
`ー‐--{___/ゝ、,ノ
>>93 HSPでかけないアルゴリズムってあるの?
冗談でしょう
>>95 普段使ってないので言語仕様確認してみたけど、構造体定義や配列のネストが無い
みたいなんでコンパイラ内の中間構文木の処理なんかが相当苦労しそうな気がする。
何かでDLL作成して、それ以外をHSPで作成すれば問題ない。 ・・・・HSPってDLL読み込めるの? 使ったこと無いからわかんない。 (調べてない。) HSPを使う意味ね〜
>>86 本職で書いている訳では無いので、言語設計の文法は出来るだけシンプルなものにする方向
でしか書いてないけど、自分の場合はreduce/reduceは無効になっている構文が発生するので
無くす方向で、shift/reduceもログチェックして意図した通りの動作になっているか確認してる。
C++とか複雑過ぎるパーサ書く場合は知らない、awkは省略規則による例外文法が多いのかも
しれないけど類似のJavaScript程度の言語なら殆どshift/reduce無しで書ける筈だと思う。
(if文とtry文、オブジェクトリテラル構文で発生している程度
>>91 True awk ってえと bwkのとこにあるやつ?
とりあえず gawkの gawkgram.y をbisonに食わせたら
conflicts: 31 shift/reduce
だった。reduce/rdeuce conflict はこの状態だとないんだよね?
ところで、話は変わるんだが、C/C++用のParser Generator でLALRじゃなくてLL(k) Parser吐くタイプで良いの無いかな? ANTLRはなかなか良さげなんだけど、生成したパーザが ランタイムを必要とするのが、ちょっとイマイチ
蛇オナニーって気持ちいいって聞いたんですけど、やったことある人いませんか?
>>101 それだと reduce/reduce は無いことになるが、
そんなにも有るものなのか? shift/reduce conflict
>>105 該当ソースは見てないけど、省略表記が可能なルールを並べるとshift/reduceに
なるんで、awkみたいな構文糖的な文法の曖昧さが多いパーサだとその辺が引っか
かってるんじゃないかって気がする。
────────────────── ________
──---ァ--──--、___,,. イ______ ───── ___
'´ \ / _
ヽ /---- 二二二 ─
'. /  ̄ ̄ ___  ̄ ̄
`ヽ./ i/──── __ - ──
| ○ ○l _,,ィi⌒ヽ 二 __ 二  ̄
ヽ ___ /r‐-r''´ ノ.l |⌒ヽ ---
/`ヽ、 _厶'⌒_l { :| l |_  ̄ ̄ ̄ ── _
/ < ̄´ ,,_ゝ、_ノス,,_,ノ、_,,ノ》`!___ __
\ ';:,: :.ミ_ノ __
⌒⌒ヽ `';:;,\ ヘ.___  ̄ ̄
、 ) ̄} ̄ ̄ ̄ ̄ ̄ヾ |←
>>94 __ _
、_人_,ノ⌒)}─┐ .,,;:':;}#;;' ノ── __ ─
_,,ノ´ └───;イ;゚;' j/ ─
r‐'´ ..:;::','/;; ヽ、 ̄ ─── - _
ふーん、俺もいまだにコンパイラ本の読破に挫折し続けているから 読んでみるかなあ なお、コンパイラ本を読破はしたことないが コンパイラを作って事はある 読むより書くほうが簡単みたいな希ガス
設計に向いてないじゃないか。 コンパイラじゃなくてツールとかGUIとか作ってた方が今後のためだろうに。
>>109 そのタイトルを見ただけで不安を覚えるのは、俺だけじゃないはずだ。
いまどきのアセンブラプログラミングのことか・・・
処理系について、もうちょっとちゃんとした勉強をしようと思ったときの導入本としてはコンピュータサイエンス入門とかお勧めだけどなぁ。
yacc 使い始めたところなんですが、エラー処理がさっぱりわかりません。 再帰下降法のときは手書きだったしエラー処理はわかりやすかったんですが、 yacc使うと、なんというか、エラーが発生したときにどの生成文法のどの箇所でエラーが発生したのかわかりません。 例えば while-statement : 'while' '(' expression ')' '{' statements '}' ; という文法があったとして、 while x > 0 { .... } なら「'('が期待されてるけど見つからないよ」 while (x > 0) ... なら「'{' が期待されてるけど見つからないよ」 ということをしゃんと出力したいんですけど、参考になるページとかありましたらお願いします。
しゃん‐と 副 正しく整ったさま。きちんと。「つづら帽子を―着て」(狂言歌謡) 確定的であるさま。たしかに。浄、薩摩歌「―嫁入つて退ければよいものを」 姿勢・気力などがしっかりしているさま。「背筋を―伸ばす」「年に似ず―している」 【岩波書店 広辞苑第五版】
しゃきーーーん!
yaccから先の話しよーぜ
119 :
デフォルトの名無しさん :2006/10/26(木) 13:23:37
ANTRL age
120 :
デフォルトの名無しさん :2006/10/26(木) 19:23:06
ちょっと前にドラゴンブック買ったら米国で
>>8 ちょっと前にホップクロフトのオートマトン2nd.Ed.買ったら米国で3rd.Ed.
(´Å`)
lemon秀逸なデザインだがGPLだから用途が限られる。 caperに期待したいとこ。
caperって有名なの?
いまどきのプログラム言語の作り方 (単行本) 今から読んでレビューしてみる
>>121 ぐぐっても関係ないものばかり出て来る
126 :
12 :2006/10/28(土) 04:42:35
公開したばっかだよ
>>125 ざっとみてけど A=B+C と書けること以外、何が良いのかさっぱり分からんな
As a public service, Hwaci makes the following software available for free in source-code form. Most of the software here is covered by the GNU Public License. Lemonは例外でGPLではないのかな。
>129 それってソースどこ? lemonを含むSQLite自体がpublic domainだから、lemonもpublic domainの 扱いになっているみたいだけど…… fleshmeatのライセンスが間違っているような気がする。
>131 それだったら、lemon自体の説明には Both the source code to lemon itself and the code that lemon generates are in the public domain. と記載されているから、public domainと考えていいんじゃない? fleshmeatのは間違いと言うことで。
public domain だと copyright が守れ無い可能性があるのでは?
それは問題無い。
136 :
デフォルトの名無しさん :2006/10/29(日) 11:47:21
>>37 それ欲しがってたの俺ですけど、例のマニュアルに載ってる分は完成しました。
86系ってインテルだけじゃないし、インテルにしても種類があるので
それだけじゃぜんぜん足りないんだけど、まぁとりあえず出来たってことで。
,-、 ,.-、
./:::::\ /::::::ヽ
/::::::::::::;ゝ--──-- 、._/::::::::::::::|
/,.-‐''"´ \:::::::::::|
/ ヽ、::::|
/ ヽ|
l. l
.| ● |
l , , , ● l
` 、 (__人__丿 、、、 /
>>1 糞スレ
`ー 、__ /
/`'''ー‐‐──‐‐‐┬'''""´
./ ___ l __
l ./ / |/ |
`ー-< / ./ ./
`ー‐--{___/ゝ、,ノ
138 :
デフォルトの名無しさん :2006/10/30(月) 19:34:28
>>12 が煽られてる意味がまったくわからん。
>>12 乙。
こういうの欲しかった。
レモンだけど、bisonもライセンスの制約が全くないと思われるが、 はて?
coinsってライセンスの記述がサイトに無いけど、制限無しなの?
bisonて、bison本体はGPLじゃないの?lemonは本体もpublic domain
143 :
140 :2006/10/31(火) 19:43:04
>>142 その通りだけど、 bison自体をいじるのでなければGPLの縛りはない。
144 :
12 :2006/10/31(火) 21:45:13
まだ作ったばっかでバグとかあると思うから そのつもりでヨロピク 細かい仕様に関する突っ込み等も歓迎
12の自演がキモいレベルにきている件について突っ込みたい
EBNFとかABNFとか自分で記述して矛盾がないか確かめたいんですけど やっぱLispとか関数言語叩いて、自分でBNFを処理するプログラムを書く以外 方法ないでしょうかね?なんか、ぽちぽちっと定義して実行とかできないですかね?
>>146 矛盾っていうのが何を指しているのかがよくわからんが
構文規則がLL(1)に収まっているかとか、LALR(1)に収まっているかとか
を確かめたいだけなら、JavaCCなりANTLRなりyaccなりに文法定義ファイル
を処理させて、conflictが起きないか確かめればいいだけだと思うが
それでは駄目?
>>147 それすらも免土井のは染んだほうがいいですよねw
がんばってかきますw
どなたか
>>115 お願いします。
> yacc 使い始めたところなんですが、エラー処理がさっぱりわかりません。
> 再帰下降法のときは手書きだったしエラー処理はわかりやすかったんですが、
> yacc使うと、なんというか、エラーが発生したときにどの生成文法のどの箇所でエラーが発生したのかわかりません。
> 例えば
> while-statement : 'while' '(' expression ')' '{' statements '}'
> ;
> という文法があったとして、
> while x > 0 { .... } なら「'('が期待されてるけど見つからないよ」
> while (x > 0) ... なら「'{' が期待されてるけど見つからないよ」
> ということをしゃんと出力したいんですけど、参考になるページとかありましたらお願いします。
>>150 bison なら、verbose オプションをつけてパーサーを生成すれば
それでOKですよ。普通にyyerror()で目的の出力が得られます。
クロージャを実現する簡単なスタックマシンの例のソースとか ないでしょうか?
>152 スタックマシン上でクロージャを作る必要性ががさっぱりわからないのですが。
SECDマシンのことじゃまいか? Palm向けだけどLispMeのソースが読みやすいとおもた ほんとーはHendersonさんの『関数型プログラミング』がおぬぬめなんだけど絶版なのよね・・・
tinyschemeもSECD machineじゃないかな。 "SECD Machine" でぐぐれば解説は出てくるよ。
C++で実装したBasicのインタプリタってどっかにない?
その要求でぐぐったらすぐに出てきたぞ。質問する前に自分で探せ。
>>156 「IOCCC Basic Interpreter」でぐぐると短いソースが見つかるお( ^ω^)
>>157 探しても見つけられなかったから訊いたんだよ
>>159 サンクス
別のものだけど、それで検索したらいいのが見つかったよ
相当探し物が下手なんだな。
つまり めがね〜めがね〜ってやつだな?
ってよく読んだら160が見つけたのは25 linesじゃないのか ちっ
>>159 すげープルグラムだな。
読む気なくすよ。
166 :
デフォルトの名無しさん :2006/11/04(土) 04:58:10
BNF集があるといいのにな。
168 :
デフォルトの名無しさん :2006/11/04(土) 06:13:30
>>167 それは、資産100億のB・N・F氏(わら
170 :
デフォルトの名無しさん :2006/11/04(土) 11:34:29
【スクリプトをちょっと紹介させてください】
アドベンチャーゲーム用スクリプトシステム「MICoスクリプト」を開発しました。
軽いこと&商用ゲームでの使用可能な高性能を目指して設計しており
複雑な演出も簡単に作れるシステムです。
詳しい紹介は公開サイトにありますので、よろしければ使ってみてください。
公開サイト
http://mico.x0.com
うんこ
こんどはフリーズした…これでマジ商用目指してんの? サンプルのレベルでこんな簡単にぽろぽろ止まるようじゃ 販売されて一般のPCに入ったらとんでもないことになるぞ
ノートンが反応した
Not Found で落とせない……
まぁ、これはどう見ても 出来を知った赤の他人が「紹介」を称して晒してるんだろうな。
WIN専用ということで、捨てw
Win専用じゃないのってあったっけ?
>>170 商用利用(に限らずだけど)してもらうには開発環境が貧弱な気がする・・・
スクリプトのデバッグ方法ってあるのかな?
>>179 一応、吉里吉里が動かなかったっけ?
前にソース眺めたときにLinux用のソースを見た覚えが
そういや、すごく前の話 >15 >22 を見てて思ったんだけど、 ・LALR(1) ・C++コードを吐き出す - パーザーをオブジェクトとして扱える - namespaceで閉じている - マクロを使わない ・フリーな実装 て、>12以外にあったっけ? LL(∞)ならboost::spiritなんだろうけど。
183 :
デフォルトの名無しさん :2006/11/05(日) 16:20:29
>>170 WinXPマシン(2.53GHzのPentium4、1GBのメインRAM、128MBのVRAM)で
サンプルスクリプトを起動させてみたが、商用ゲームで使用可能な性能を
目指すなら、最低限これの倍以上は軽快に動いてほしい。
そうでないとユーザーとしてはマジでやってられん。
>>181 (確か)吉里吉里3はLinuxでも動くように開発されてるよ。
吉里吉里は良く出来てる。
動作がもう少し軽ければもっといいのにな。
>>182 本題からはずれるんだが、LL(∞)って用語は一般的なのか?
LL(*)というアルゴリズム(無限長先読みだけど、先読み文法が
正規言語に限定される)は前に調べたことがあるけど、
LL(∞)というのは、今まであまり聞いたこと無いもんで。
Applying a function pairwise to all data of two trees. Variable combine: forall (A: Set), (option A -> option A -> option A) -> t A -> t A -> t A. Hypothesis gcombine: forall (A: Set) (f: option A -> option A -> option A) (m1 m2: t A) (i: elt), f None None = None -> get i (combine f m1 m2) = f (get i m1) (get i m2). Hypothesis combine_commut: forall (A: Set) (f g: option A -> option A -> option A), (forall (i j: option A), f i j = g j i) -> forall (m1 m2: t A), combine f m1 m2 = combine g m2 m1. これってどの関数型言語?
そういえば、志古志古1000というのが無かったっけ?
190 :
デフォルトの名無しさん :2006/11/11(土) 16:00:06
「スモールコンパイラの製作で学ぶプログラムのしくみ」を 買ってしまった。 なんだこの本の内容?買って損した。 First(),Follow()の説明に自分でウソ書いてて気づいてなんだな。 ま、理解できてないまま本出すの勝手だけど、ウソ書いて 混乱させんじゃねーよ。全く。 Follow(S)に $ を加えるのはいいだが、 この著者は 終わりといいう意味の $ を '$'と混同してるんだ。 こっちが理解してやるのに疲れる。 誤記多いし。勘弁してよ〜。
その様子じゃ、理解出来てないまま非難してるのはお前だなぁ。
192 :
デフォルトの名無しさん :2006/11/11(土) 16:39:52
素直でよろしい。 これはとても大切。
パパ乙
コンパイラの本って少ないな。
りんごタソの本か? なかなか良かったぞ。
ぬめってます
200 :
152 :2006/11/12(日) 10:10:01
たまらんなw
202 :
デフォルトの名無しさん :2006/11/14(火) 00:36:34
ここに知ったかぶりをしている人は何人いるでしょうか?
ハァハァ
その名もSECDR-schemeというのがあったはずだが。
caper作った人まだみてる?
206 :
12 :2006/11/21(火) 22:31:05
たまにみてるよ 最近仕事忙しくてcaperいじってないけど
お仕事で使おうとして上司に 「caperだよね」 「自動生成だよね?」 って釘指されてワラタです
208 :
12 :2006/11/22(水) 07:26:03
まじで仕事に使うの チャレンジャーすぎw
設定ファイルの定数に数式入れたいだけだからね。 文字で書かれた簡単な数式をdoubleで計算とかそういうライブラリあるかと思ったら yaccやらbisonやらのサンプルばっかりで以外と見つからなくてさ。 ぶつくさいいながら再帰下降パーサ書くくらいならとおもって使わせてもらいました。
210 :
12 :2006/11/23(木) 12:14:56
ohそれはすばらしい バグや気に喰わない使用があったら教えてね
このスレでCoinsの話題って禁句?
log読んでたら>58 >148がスルーされてたから、駄目なのかなと 特に話題はないんだけど
58と148の関連性が全くワカラン
このスレでLISPの話題って禁句?
>>215 高度粘着性のキチガイを召喚する可能性が高いのでやめといたほうがいい
スレちがい。 実装の話ならOK。
いや実装の話でも止めてくれ
お前の事情なんざ知るか。 イヤならもっと面白い話題を振って乗っ取ってみろや。
実装の話は、そもそもついてこれるヤツがろくにいないだろ Lispに限らずな、コンパイラ作れるヤツがろくにいねえ
221 :
213 :2006/11/25(土) 16:47:39
ごめん、間違った。148じゃなくて>141
>>215 やめとけ、そのうちRuby坊も出て来るから。
>>220 いや、実装の話の方が実は簡単なんだよ。
その簡単な話よりさらに簡単な話しか 殆どのヤツはついて来れねえんじゃねえの? あとまあ、どこぞの誰かの作ってる糞言語の 実装の詳細なんぞ興味がないから、 ついていけても、食いつかねえってのもあるが
シグウィンというコンパイラを手に入れたのですが、ソケットヘッダがあるのに使えないのです。どなたかわかる人いませんか?また他に使い易い、コンパイラあったら教えてください。
その簡単な話よりさらに簡単な話しか 殆どのヤツはついて来れねえんじゃねえの? あとまあ、どこぞの誰かの作ってる糞言語の 実装の詳細なんぞ興味がないから、 ついていけても、食いつかねえってのもあるが
シグウィンというコンパイラを手に入れたのですが、ソケットヘッダがあるのに使えないのです。どなたかわかる人いませんか?また他に使い易い、コンパイラあったら教えてください。
ここはコンパイラの実装等をお話するスレで使い方のスレではないですお
データフロー解析のソースコード付き簡単説明が欲しいです。
>>230 それ、LispMeの論文の超適当かつ端折りまくりの日本語訳だろ。
SECD machineでぐぐるとそいつが上位でマッチするというのは害悪のような気がする。
その論文はoriginal SECD machineとLispMeの差分について述べてるんであって、
original SECD machine の仕様も押さえながら読まなきゃ理解できんぞ。
特にLDF (クロージャを作る操作) がそこには書いてないんだから。
ちょっとスレ違いかもしれないけど質問です。 今、プロトタイプベース(移譲中心)の俺言語を作っているんですけど、 ダイアモンド継承の処理の方法に悩んでいます。 ダイアモンド継承についての良さげな文献とかありません?
>>232 C++のD&Eを見れば、なんか参考になることが書いてあるかも。
234 :
232 :2006/12/10(日) 17:05:23
>233 見ました。良い本だよね。D&E 「vtblを間接参照する」までは載ってたけど、流石に同一仮想ベースクラスを 効率的に検索する実装までは載っていませんでした。 プロトタイプだと、下手すると変数を参照するたんびに移譲先を探さなきゃ いけないので、このあたりの処理は悩ましいですよね……
>>234 じゃ、そこらのC++コンパイラでvtblをどのように扱ってるか解析するのが近道かもね。
以前、ダイアモンド継承してるオブジェクトのデータ構造を調べたらなんかへんちくりんな構造してたけど。
プロトタイプベースでダイアモンド継承というのが理解できない。 プロトタイプベースってことは分裂+突然変異でオブジェクトができるんじゃないの?
二つをくっつければいいんだよ
238 :
デフォルトの名無しさん :2006/12/10(日) 22:59:47
>>232 うーむ。日本語でSECDマシンのいい解説があるといいのだけどなぁ。
ほかの英語の論文をちまちま訳しながら、勉強してるところです。
>236 ダイアモンド継承と言ったのはちょっとまずかったかな? 実際にはちょっと違います。 俺言語では、こんな感じで A <= B a| a| α<= β 参照aを持つオブジェクトAに委譲するオブジェクトBがある時、 Bからaを参照する場合は、参照先αをそのまま使わずに、αに委譲した プロキシβを作成してそれを参照するようにしています。 で、何が問題かというと、Aに同じオブジェクトを参照する参照が2つある場合、 A <=== B a|b a| |b α<= β | <=== β' こんな感じでBの参照aと参照bが別のプロキシになってしまいます。 C++のダイアモンド継承の問題もこんな感じだよね?
>説明の簡略化のため、マクロ、末尾再帰の最適化、継続などの実装は省きます。 それSchemeじゃねぇwwwwwwwww 普通にLispて言やいいじゃん
JavaScriptってほとんどschemeやん
(゚Д゚ )ハァ?
scheme with C's clothing?
246 :
230 :2006/12/14(木) 18:33:54
>>240 遅レスですが、それです。
HendersonのSECDマシンの実装は出来てるっぽいのだけど、
DUMとRAPの使い方がわかってるような、わかってないような。
JavaScriptだと、
function plus(a){ return a + 1; }(10);
が
(LDC (10) LDF (LD (1 . 1) LDC 1 SUB RTN) AP STOP)
となる。と言った感じの、まともに動くサンプルをつくりたいんだけど。
>>246 どうしてそこでSECDの本来のターゲットであるSchemeで考えないのか
とっても不思議なんだけど。
DUMとRAPの用途は、letrec。
そこまで自分のわかってないことがわかったなら、あとは
LispMeのソースを眺めてどういう風に使われるか見れば一発でしょ。
コンパイラとかSECDのコアとかなら、Palm依存のコードを除いて
手元のPCで実行できるようにするのもさして難しくはない。
動かさなきゃ理解できないようなものでもないが。
248 :
230 :2006/12/15(金) 15:14:25
SECDマニアのHendersonのプログラムをコンパイルして弄ってみたのだけど ((letrec a (a lambda (b) b)) 1) が (LDC (1) DUM LDC NIL LDF (LD (0.0) RTN) CONS LDF (LD (0.0) RTN) RAP AP STOP) ということでいいのかしら?とりあえず、思ったとおりに動いているのだけど。 letrec用途であることはわかるのだけど、自分で作って動かすとなると動かなくて。
coins verup
coins使ってる人っている?
いません
今時Javaって・・気が触れたとしか思えん
253 :
デフォルトの名無しさん :2006/12/16(土) 18:31:30
>>252 あなたなら、今なら何が、コンパイラを作るのにいいと思いますか?
Ruby か Haskell だろ
そーか? HaskellはともかくRubyは…… 作り始めはいいかも知らんが、だんだんチェックが欲しくなってくるから 型がルーズな言語はしんどいよ。
C++ boostあれば色んなことできるようになるし。
4年の間にどんなカルト宗教に洗脳されちゃったんだろう
適当になれた言語で一応動くものを作ったあと、自己記述化
261 :
デフォルトの名無しさん :2006/12/17(日) 03:09:43
しかし、処理系作るなんておまいらすごいですね。 自分も何れは、自分で設計したスクリプト言語のインタプリターでも作りたいと思ってるんだけど。 ところで、知ってる言語が、C/C++, VB, PHP, Ruby, BASIC なんだけど インタプリター実装に使う言語としては、この中だとどう考えても、C/C++ になるよね? あと、こういうのって、ある程度汎用的に使える様な構文解析エンジンみたいなのはフリーで良いのが公開されてる? それとも、Boostとかの正規表現ライブラリとか使って、自分で解析エンジンとかも製作するの?
bison, flex
ほほうー これでparserクラスとか作るわけかー いつか作ろう。
いまからbison+flexを覚えるくらいなら最初からantlrに取り組んだ方がいいと思う。 いろんな言語向けのコード生成できるし。
C++でお勧めありますか? 今はspiritでシコシコやってます。 まあ、Forthチックだから大したの要らないんだけど。
>>265 spiritを使う気になる環境ウラヤマシス
>>265 antlrじゃダメなの?処理系自体もC++で書いてあることが要件なのかな。
大袈裟なのが必要ないならcaperでいいんじゃない?
>>250 ソース拾ってきて、眺めて終了してしまってます。。。
もっと、面白い記事がネット上にあればなぁ、思います。
>>265 FORTHチックじゃ構文が分かち書きで切った部分が直接命令に還元されるって事かい?
なら構文解析コード使う事自体に意味がないだろう?
むしろできあがったコードの中身をJITでネイティブに落とすとかそっちの話の方がメインじゃないのかい?
来月のPOPLってどうよ?
GCCってもっと速くならないの?
GCCの何を速くしてほしいの?
coinsは遅くなったらしい。
中田先生がファビョってるようにしか見えない もっと落ち着いてメールして欲しい 公の場なんだから
たしかにメールの勢いはひどいが INFOがうざいのも事実。
あけおめ
COINSのMLどうなった? スレッドがぐちゃぐちゃで読む気がしないんだけど
COINSのMLってどうやったら読めるのですか?
COINS使いたいのですが、ヘッダのGCC拡張エラーになります ヘッダを入れかえるのは、パッケージ管理しているのでやりたくありません どう対処するのが一般的ですか? # FreeBSDでは問題無く動いてます
>>281 お前には想像力が無いことだけは解った。
想像力で補ってどうするよ。いくつ可能性があると思っているんだよ。 まずは >280 が 『回答者が回答するために必要な情報はなんだろう?』 と想像しろ。 自分の環境を特定しようとしないやつに質問する資格は無いわ。
285 :
283 :2007/01/08(月) 12:43:16
>284 お前は誰だよ。ちゃんと名乗れ。 これだからIDの無い板は……。技術系の板でID無しって腐ってるよな。 ただ正論言っているだけだよ。 現実世界と違って >280 に気を使う必要無いしな。 早い話、>280は質問の仕方を覚えないと技術系としてはやっていけないよということで。
>>285 鬱憤晴らしで初心者いびりがしたいだけだろう?
環境もワカラン、どのコンパイラつかってるのかもワカランでどうしろっての? 莫迦?
>>288 解らんことがあれば聞け。
ただそれだけだろ。
お前は普段の仕事で、解らんことがあるのでこの仕事はできません、なんて言うつもりか?
290 :
283 :2007/01/08(月) 13:21:34
>286 そりゃそうだ。こんなマヌケじゃなぁ…… >288 おまっ、それマジで言ってんの????? 「相手が根気良く確認してくれるのはなぜか?」ということ考えたことある? 確認する側にメリットがあるからじゃないか。 仕事なら『業務を遂行する=自分の業績に繋がる』というメリットがあるけど こんな匿名掲示板で根気良く確認しても何のメリットもねぇだろ。 逆に、質問する側は『疑問点を解消する』というメリットがある。 ある意味一方的な関係だ。 だから、こういうところでは回答者に積極的に協力しないとシカトされてお仕舞いなんだよ。 そんなに手取り足取り確認したけりゃCOINSのサポートに頼め。 COINS コンパイラ・インフラストラクチャ協会も無償奉仕みたいだから、>280みたいな 質問の仕方だと、「何いってんの、お前」というのをやんわりと言われるかもしれんがな。
仕事のような熱心さで、280の質問に答えてくれる人、 募集中というところかw
292 :
デフォルトの名無しさん :2007/01/08(月) 14:17:30
libc の header に gcc 拡張が使われていて coins が gcc 拡張を理解できないからエラーになるんだろ? いいじゃん glibc なんか捨てて *BSD 使えば
むしろsolarsiのでばんですよ
自分の質問の馬鹿さを指摘されたあと見せる無駄なエネルギーの半分でいいから、 元の質問文の練り込みに使えばいいのにな。
くっ、スルー力が足りないっ
299 :
デフォルトの名無しさん :2007/01/16(火) 21:56:39
中田先生の本、ちゃんとした日本語でわかりやすいね。 しかし数学家のせいか、変な数式化するやつには参るな A = {P,S}とか{a} = a |aa | aaa....とか
慣れれば普通だよ
パーサジェネレータとかって勉強するにはどういう本を探せばいいのでしょうか? いままで自作言語ばっかり書いてきたんですけど、パーサジェネレータってもんがあることを最近知りました。 でも、勉強しようにも難しくてサイトみてもよくわからない状態です。 なにかわかりやすいオススメ書籍とかないでしょうか?
中田先生の本はアレだな。理論の説明はいいんだけど、その理論を実際どういうときに使うのかもう少し詳しく書いてくれればもっとわかりやすくなるな。 できれば1つ1つの理論とC言語のコードを対にして書いてほしい。
コンパイラの構成と最適化を読んでいて再帰的下向き構文解析のところまで読んだのですが、 構文解析と字句解析の区別がよくわからないのです。 再帰的下向き構文解析だと、例えば B -> aAb は B(){ aを読む; A(); bを読む; } みたいになるのですが、 全ての生成規則を書いていくと 結局は字句解析がいらないことになってしまいませんか?
>>303 字句解析しないということは、文字単位で構文解析することになるけど、
f 一文字を読んで、予約語の for なのか、ただの識別子なのか判断つかないのが下向き構文解析だとちょっと困る。
LR構文解析の場合は、字句解析を分けた方がメモリや計算の手間がだいぶ減るような気がする(今の計算機だと大した差ではないけど)。
C++みたいに、文脈情報が無いと字句解析できない場合はわけない方がいいのかも。 最近流行? のcombinator parserも基本はわけないよね。
Lispなら(ry
>>306 あと、同じく最近流行?のPackrat Parserでも字句解析は分けないね。
個人的には、字句解析というのはあくまでLALRとかLLなどのよくある
構文解析アルゴリズムで処理できるようにするためであって、本質的には
要らないというか有害ですらあると思う。例えば、最近の言語だと文字列
(普通は字句解析で処理される)の中に式(構文解析で処理される)を埋め込む
ことができる言語が普通にあるが、こういうのは字句解析と構文解析が分かれて
いると非常に実現しにくい。
packrat parserって下降型のparserだっけ? 左再帰は大丈夫?
後戻りできるようなものを作ろうとすると、 字句解析と構文解析が分かれていたら非常にやりにくい。
ループ以外の左再帰って使う機会あるの?
>>309 左再帰はNG。そういうのは繰り返し(*)を使って書くのが定石。
右結合の演算子の場合は、右再帰で書くけど。
21世紀にもなったというのに、左再帰を人手で展開せなあかんのか… あれ、文法が汚くなるから嫌いなんだよな e ::= e + e | n が e ::= n (+ e)* になるのはつらい。
>>313 まあ、その辺はトレードオフということで
ちなみに、俺はトップダウンparsing的な発想がデフォだから
左再帰を人手で展開するというよりも、展開系がまず先に
思い浮かぶ
>>316 いや、自分にはこの↓説明がいかんかったです。
字句解析
ソースプログラムを、「字句(トークン)」の並びに分割する処理です。
構文解析
トークンの並びから、解析木を構築する処理です。
何度読んでもさっぱりわかりませんでした。
>>315 の本はこのわからん部分がわかるのでいいと思いました。
これが他とちょっと違う部分です。
318 :
デフォルトの名無しさん :2007/01/27(土) 02:38:38
>>317 理論抜きでもイイから、他のちっこいスクリプトをまねして、
とにかく一回でも、実装してみれば、
ああーんそうか、って納得できるんだけどね・・・。
パーサコンビネータの論文ありますか?
320 :
デフォルトの名無しさん :2007/01/27(土) 13:27:52
最適化って、結局はグラフの操作がメインになるんだけど、 あれは、ややこしいねぇ・・・ (プロトタイプ的に)ナイーブな実装をしようとしただけでも、 普通のグラフライブラリなんて殆ど役にたたないし・・・ 良いグラフライブラリがあれば、教えてください。
>>320 最適化って例えばどんなやつ?
それによって変わるような気がするけど。
>>321 "ほにゃららほにゃらら elimination" とか、
データフロー解析に絡む
あの一連のやつ。
>>322 フローグラフ上のデータフロー解析なら
自分で実装するのがたぶん一番楽。
データフロー方程式を解くシステムは昔からあったと思うけど
なんかいまいち流行ってないし。
最近はCTLモデル検査とかで最適化する人もいるらしい。
フローグラフ解析かぁ。 coins.flowあたりみればいいのかと思ったけど、さっぱりわからないです。 超簡単なソースどっかにないかなぁ。
>>324 coins.backend.ana.LiveVariableBitMap
とか結構簡単だと思われる。
>>323 手で書くのが難しいレベルの最適化って論理式で書けるの?
実行時間は?
>>326 データフロー方程式を解くのと同程度のことなら書けるらしい。
それ以上だとたぶん無理。
実行時間はデータフロー方程式解くのと同じくらいかと。
へー おもしろそうだね
329 :
324 :2007/02/03(土) 12:44:06
>>325 おおー、理解できる予感!!
「コンパイラの構成と最適化」を見ながらソース読んでみてます。
LiveVariableBitMapのBitMapはBitMapSetのことですよね。
BitMapSetクラスは単なる0か1かが入ってる配列の管理クラスみたいなもんと。
live variable 解析は「12.2.7 変数の生と死の解析」のこと。
この「変数の生と死の解析」の結果を使って「12.2.8 無用命令の削除」等が出来ると。
俺スクリプトがようやっと文字列結合まで回るようになった…… 誰か、クラス設計とかで参考になりそうな資料ご存知ですか? ……Rubyのクラスを参考にしようかな
>>333 そこのサイト並べ方がよろしくないね。
継承関係がわかるように入れ子で表示するとコレクションがどういう方向でできてるのかよくわかるのに。
smalltalkならクラスブラウザで眺めるだけでいいから必要感じないのかもしれんけど、知らない人が見たらたくさんあってパニック起こすだけじゃないかと思った。
つーわけで330は一度squeakを実行してみるよろし。
>334 「自由自在〜」持ってたので、それを参考にブラウズしてみました。 ……すごい数ですな。GUI系を飛ばして眺めてみます。
質問です。 スクリプト言語を作ろうと思って、まずはC++でC言語コンパイラ作ってるんですが、 typedefの処理に困っています。 ソースファイル内の全ての構文解析完了後に、 構文木をたどって意味解析処理の一部としてtypedefの解析をしています。 この方法だと構文解析機がtypedefで定義された型名を使用して変数を宣言しようとしたとき、 typedef定義された型名を型名として認識できません。 解決方法として2つを考えています ・構文解析中にtypedefを検出してtypedef定義テーブルを作成する ・構文解析を2回行う(1回目はtypedefを含めたシンボルの検出、2回目が本当の構文解析?) 皆さんどちらの手法でやっているのでしょうか。 それとも、こんな現象は発生しない?
有名な問題なのでぐぐれ。
>>303 その疑問はもっともだと思う。
字句解析と構文解析が別れている主な理由は、
yaccを真似たコンパイラ・コンパイラが多いことと、
字句解析には字句解析ならではの問題があるため。
他には、コンパイラの教科書でも字句解析と構文解析が分けられている
ことなんかが挙げられるかもしれない。
一般的に字句解析では、構文解析で使われるLR(k)やLALR(1)よりも
一段制約が多く、より高速に動作する正規表現という文法を使う。
普通こういうことは考えないけど、
正規表現はLALRなどのよく知られている文脈自由文法により常に表現可能で、
(逆は無理な場合がある)
原理的には字句解析を構文解析に組み込むことはできる。
ただし、現実の字句解析が教科書的で単純な方法で行われることは稀で
普通は予約語のマッチを一通り試した後、
どれにもマッチしない場合はそれを識別子として扱うという
バックトラック的な処理が必要になる。
これが普通のLALRなどではできないので、
よく知られたコンパイラ・コンパイラ、yaccやbisonなんかでは
字句解析と構文解析を一緒にやることは無理ではないかと思う。
また、速度的な観点から避けられることもある。
一昔前(yaccが作られたのは1970年代)は、
パソコンの性能が今では考えられないくらい低かったし、
理論の構築も進んでいなかったので
この二つを分けることが絶対に必要だった。
もうこの考え方は古いのかもね。
無理してやればできるんでないの? symbol ::= alphabet alpabet_or_digits 終端でない記号が爆発的に増えてコンパイルできなくなりそ。 遅延評価で空間量を時間量に置き換えてどうたらかな。
大まかに言うと字句解析は正則言語(⊆文脈自由言語)の解析、構文解析は文脈自由言語の解析なんだから、字句解析の部分も構文解析でできるに決まってるでしょ。 処理が二つに分かれている理由は、字句解析を有限オートマトン風に処理するアルゴリズムは、既知の構文解析のアルゴリズム(LL等)よりはるかに高速なこと。 それと構文解析木の底辺(=字句解析前の入力文字列)を字句解析で押し上げれば、構文解析の入力の個数を(定数分の一に過ぎないが)減らせること。 木構造の性質を考えれば、底辺の要素数は、木全体の底辺以外の全要素数より多くなるでしょ(ε生成を除去できることから)。 基本的には理論的な背景がある。
正規言語を受理するlexerを、文脈自由言語を受理するparserで置き換えることができる のは当然だが、これは今の話に余り関係ない。 字句解析-構文解析と処理をわけなかった時の一番の問題は、>338で言われている通り、 バックトラックもしくは予約語の最大長分の先読みが必要になること。 packrat parserはバックトラック演算子があるんだっけ?
>>341 packrat parsingではバックトラック演算子があるわけじゃなくて、
デフォルトの動作がバックトラック。つまり、
A | C
という式があった場合、まずAにマッチするかどうかを試して、失敗した場合Cを
試すという動作になる。ただ、これだけだと困る場合があるので、そういうときは
syntactic predicateという無限長の先読み演算子を併用することになる
なるほど。サンクス。 Cのparserでも書いてみるかな。
再帰下降構文解析をするときに、 深いところで起きたエラーを戻り値で次々と伝えて行くやりかたは かっこ悪いですよね?
例外はどうでっしゃろ?
そこでデータとして定義したステートマシンを各文法ごとに用意して スタックにそれのステートを積んで行き 本質的には再帰だけどループで実行できて エラーがあったときはただそのループを止めるだけ なんてのはどうでしょう ギャグで言ってます
人間bison! まさかコレが「件」って奴?
>>345 if( !is_ident(context) ){
throw syntax_error("hoge hoge");
}
こんな感じのプログラムが、カッコいいとは到底思えない俺がいる
再帰だとスタックを使い過ぎてオーバーフローしないだろうかと 不安だった、そういう時期が僕にもありました
Rubyのインタプリタはスタックオーバーフローで死んだりする……
どんだけスタック食いつぶすスクリプト書いたんだwww
>>352 Mac OS Xのデフォだと簡単に食いつぶす。
なのでulimitでスタックの制限をunlimitedにしなきゃならん。
>>354 スクリプトの実行でスタック食いつぶすなら再帰呼び出しすればいいだけだけど、インタプリタのスタックを食いつぶすってことは、やたら深いネストや式を自力で書くとか(もしくは何らかのプログラムでわざと生成?)しなきゃ無理ですな。
なるる
ちょっと質問良いですか? 行末に対してはセミコロンを省略しても良いようにしたいんですけど、 pnuts がやってるみたいに 『改行入れても良い部分を全部明示的に指定する』 よりもっとスマートな改行な方法あります? 当方 JFlex と Jay を用いております。
>>358 Pnutsのような方法以外だと、Lexerに改行を無視する状態と無視しない状態の
2つの状態を持たせて、ParserからLexerの状態を明示的に状態を遷移させる
という方法がある。ただ、それほど楽にはならないと思うけど。
>>358 つまりPnuts式はStatelessなlexerであり、lexerは楽できるけどParserがめんどい。
>>359 の方法はlexerがstatefulになって少し面倒くさくなるぶんparserがすこし楽になる。
トレードオフだな。
しかし昔に比べて過疎ってるな。
俺言語を造っている変態が減ったんだろ ……俺言語の設計ってけっこう楽しいけど、破綻しないように作るのはしんどいよね。
362 :
デフォルトの名無しさん :2007/03/18(日) 15:23:34
構造体についての実装方法が載っている良書を教えてもらえませんか? サンプルソースがあるとベターです どうもCのサブセットと言いつつ構造体を省いている本しか持ってないので・・・
別に何を悩むこともないと思うんだが。
磯Cでいいんでない?
それが関数の呼び出しで詰まりまして ある関数のreturnで構造体を返した場合ですが 呼び出し前に返値用のスタックを確保しておいて そこにreturnのときにコピーするようなまどろっこしい方法しか思いつきません。 それと、動的配列を有している構造体など どうしてるのかいなと思いまして
磯Cてなんですか?検索掛けたら考古学関連がでましたが・・・
動的配列のポインタを持っている構造体で無く? そのものを持っているのですか?
そこらがどう実現すればいいのか解らないのですが やりたいことは、 struct test { string s;←これを動的にしたい int i; } のような感じです
>磯C なるほどISoのことでしたか。 有り難うございます見てみます。
373 :
デフォルトの名無しさん :2007/03/18(日) 17:24:34
>>372 流れからして
>>362 のスクリプトにあるファーストオブジェクトだと思うが
動的にサイズが変わるんだとiへのオフセットも毎回変わるの?
>>370 普通
struct string {
size_t currentBufSize;
char *pStrBuf;
//なにやらいろいろ定義
};
とかなってないかえ?
日本語が扱えないと話にならないコンパイラを作ることになったのですが、 マルチバイト文字の扱いが一番楽なパーサジェネレータはどれですか? Unicode固定でいいです。 ・日本語を含む文字列を普通に解析できる ・文法定義中でも日本語が使える(\uxxxxのような書き方でなく) SableCCはどちらもいけるようですが、ドキュメントが貧弱なので不安です。 ANTLRは後者が駄目でした。
パーサと文字コードは全く関係ない。 字句解析コードも出力する機能があるタイプなら関係する。 たとえば私は今、lemonを使ってるけどトークン番号を渡すだけ。
rubyのraccは字句解析部分をrubyのパターンマッチで記述しているので日本語もいけそう。 構文解析やその他の部分で機能が十分かどうかは不明。
raccでHTML用のテンプレートエンジンを作ったけど、特に問題なしです。 ……まあ、UTF-8のみでOKなら、ダメ文字もバイト切れ目問題も無いから あんまり気にする必要が無いような気がするけど……
>>375 日本語はparserでなくlexerの方の問題では?
380 :
デフォルトの名無しさん :2007/03/21(水) 07:25:13
lexのもんだいだよな・・・
「可愛そうなジョージ、病気になる前まではソートルーチンもちゃんと動いていたのに・・・」
>>384 これなんだっけ!?すげーみたことあるんだけど・・・・
386 :
デフォルトの名無しさん :2007/03/21(水) 16:16:51
かわいそうなのはジョージじゃなくてソートルーチンなんだろ。
ジョージかわいいよジョージ
どうしてもMOTHERを連想する
MをとったらOTHER、他人です。
other単体では他人になりません。
another
bother
396 :
デフォルトの名無しさん :2007/03/28(水) 12:12:32
商用ゲームで使うスクリプトのコンパイラ・エンジンを作ることになったんですが、 そういったプログラムに関してはわからないことが多いので悩んでいます。 組み込み系言語のLuaを使うという選択肢もあるんですが、とりあえず自作する方向で勉強してます。 flex&bisonあたりは使うつもりなのですが、他にも使って便利なツールってあるでしょうか? 初心者はnasmとかalinkみたいなものを使った方がいいんでしょうか。
ANTLR
なぜLuaを使わないかの理由が知りたい。
何故インタプリタ型のLuaとコンパイラ型の言語設計(nasmなどを挙げている事から の類推)を並べているのか分からないのだけど、コンパイラ作るだけならパーサ ジェネレータ以外に必要なものは無いし、それ以上の補助ツールも無いと思う。 nativeに落とすのであればWindowsならcoffなどのフォーマット参照、コンソール なら各ベンダの資料とか、自前でニモニックを変換するのはかなり泥臭い話なんで 可能ならnasmとかを使う方が遥かにお手軽、最適化を自前実装するのでなければ、 期待できるコンパイラの性能にも拠るけどCとかにトランスレートする方が高速な 動作を期待できるかもしれない。 というかゲームの種類と環境でコンパイラなのかVM型のインタプリタとかで良い のか、デザイナー向け簡易スクリプトなのか汎用言語タイプなのか良く分からない。 単純に上から言われたのならもう少し何が欲しいのか詰めた方が良いんじゃないかと 心配してしまったのだけど。
BNFのコンフリクトを解決しやすいツールって何かないですか?
つ-vオプション
つ熟練者の直感
>>399 具体的なことを言えば、
社内のスクリプトのシステムを作っていた前任者が大分前に辞めてしまい、
いい加減作り直さなきゃね、という状況で自分がやることになり、
前任者の作ったものを解析した結果、
yac&lexを使い、自前ツールでアセンブリ言語に変換し、そこから先はnasm+alinkのようなツール(実際は別物)
でマシン語にしたものを実際のゲーム側で読み込んで使っていました。
それで、そういう方向でいろいろ調べているという状況です。
>>398 Luaは存在は知っているのですが、具体的なことはまだ知りません。
上記のような状況なので調べるものとしてLuaの優先順位が今は低いだけで、
一度しっかり調べて検討するつもりです。
>>403 >yac&lexを使い、自前ツールでアセンブリ言語に変換し、そこから先はnasm+alinkのようなツール(実際は別物)
>でマシン語にしたものを実際のゲーム側で読み込んで使っていました。
それは「スクリプトのシステム」ではなく、「コンパイラ」ではないかと・・・
難儀ですな、、、 自分がコンパイラ作った時はyaccで文単位で構文木を作ってそれをリストに格納、 ニモニック変換時は各文ごとに構文木を辿ってテンプレートに従ってコード出力、 言語に型システムがある場合はニモニック生成前に構文木を一旦辿って型の文脈 を決定、その後ニモニック生成ってカンジですた。 自分の場合スタック型VMだったんでレジスタ割付の最適化とかは知らない、アキュムレータ とメモリ間接に限定すれば簡単だけど、アセンブラがシンボル対応ならアドレス解決 は不要かな。 後はリファレンスカウンタまでならNativeでも比較的安易に作れるけどFull GCだと スタックや変数領域をどう扱うか、スレッドの管理までフレームワークを用意する 形なのである程度事前設計が要ると思う。 まぁ参考になるか分かりませんが、、、
もう前任者のはいったん捨てた方がいいかもシレン ちゃんとしたドキュメントがあるなら別だが
407 :
デフォルトの名無しさん :2007/03/29(木) 01:00:32
>>403 >でマシン語にしたものを実際のゲーム側で読み込んで使っていました。
ここまでやってるってことは、普通にインタプリタじゃパフォーマンスが足りないってことかな?
なら、CやC++言語へのトランスレータ作ったほうが簡単だし、
工数もかからないんじゃないかな。
俺は商業じゃないけど、EXCEL->C++へのトランスレータ作って使ってる。
場合によってはC++そのままの機能も埋め込めるし、既存言語に足りない機能足すだけだから、
それこそあっという間に完成するぞ。
ちなみにLuaのVMはJITを搭載しているから、他のスクリプト言語と比べてバフォーマンスはだいぶ高い。
>>404-409 返答ありがとうございます。参考になります。
>>408 最低限のレベルで要求されているのは、メモリや速度の面で問題ないということと、
前任者のスクリプトがCライクな仕様で、社内メンバーがそれに慣れているので
それに合わせなければなりません。
>>409 とりあえず、前任者のものをある程度理解できたのでこれからLuaを勉強しようと思ってます。
>>410 作りなおすってことは、前任者の作った言語に不満があるってこと?
どんな不満があるのか(機能が低い、言語使用が貧弱、とか)によっても
作り方が変わってくるんじゃないかと思う。
(トランスレータにするのか、インタープリタで間に合うのかとか…)
412 :
411 :2007/03/29(木) 16:27:10
訂正:言語使用 → 言語仕様
>>411 いくつか解決しなければいけない問題というのはあります。
トランスレータというほどじゃないですが、それを解決する方向で拡張するという案も確かにあります。
ですが、作った人間がすでに会社にいないので、理想を言えば新しいものを用意することでしょう。
自分が辞めれば結局同じことのループなので、Luaのようなものを使うのが会社にとっては一番いいことなのかもしれません。
LuaはCライクな言語じゃないようなので今はSquirrelを見ています。
ちうか速度面で劣化があっちゃまずいのならインタープリタじゃアレなんじゃね? 前任者さん版のスクリプトのおぼろげな仕様聞く感じ
>>414 まあ、マシン速度も昔に比べれば比較にならないくらい向上してるし、
どうしても速度的に問題があるなら、、その部分だけゲームエンジン本体に
直接機能追加すればいいから、そんなに問題になることはないんじゃないかな?
自社ツールなら、そこらへんどうとでもなる。
今までCライクなスクリプトだったなら、C言語へのトランスレータが簡単でパフォーマンスに
優れていると思うけど、フリーの汎用エンジンなら自社でメンテナンスしなくていいから
将来的な負担を考えると、悪くない選択かもね。
とはいえフリーのスクリプトエンジン使う場合、ライセンスをちゃんと確認しておかないと、
へたすりゃソースコード公開させられる羽目になるぞ。
>>409 LuaJITってLuaの大本にマージされたの?
>>410 >前任者のスクリプトがCライクな仕様で、社内メンバーがそれに慣れているので
メンバーにCを覚えさせたほうが速いんじゃね?
っていうか、そのスクリプトの「利点」って何なの?
>>413 >Squirrel
これ知らんかった。Luaもいいけど、これもよさげだね。さんくす。
419 :
デフォルトの名無しさん :2007/03/30(金) 15:13:21
> メンバーにCを覚えさせたほうが速いんじゃね? んなこたーねえw
>>419 そのスクリプトの仕様を見てみないと
なんとも言えないと思うが?
話を聞く限りでは、汗を生成していたんだろ?
実はそれ、ただのCコンパイラ(多少の独自拡張あり)かもよ。
ていうか話聞いてるとSystem4.0が思い浮かんでしょうがない
自動でマルチスレッド化、グリッド化 できるコンパイラないの?
423 :
デフォルトの名無しさん :2007/03/30(金) 19:00:27
Intel C++ Comipilerは?
>>424 ちょっと使ってみたことがあるが、スクリプトで動的メモリ割当てを使わない場合は
GCを切ることができたり、(再帰がなければ)スタックの最大長をコンパイル時に計算して、
スクリプトのロード時にVMに割当てるメモリを最小限に抑えたり、組込み機器向けにいい感じ。
スクリプトの文法としては、Cライクな手続き的記述に加え、状態遷移、イベント駆動的な
書き方が出来るのも面白い。
426 :
デフォルトの名無しさん :2007/04/01(日) 01:12:36
>>426 君は何年生? (どこの大学? 専門学校?)
それと与えられた宿題の内容も詳しく教えてくれた方が役に立つアドバイスができそう.
まずexample.cppをエディタで開いてみるところから始めよう.
社会人 一応全部見たが出力先がよく分からんから聞いた。煽りにレスしてしまった・・・
まぁ、あまりに青臭い煽りにはつい優しくしてあげたくなることもあるw
パーサはパースする物。 サンプルはパースするところまで。 VHDLを読んで解釈する、そして文法的には正しく読み込めたと表示。 その中身を変換して出力するのはパーサの仕事じゃない。
431 :
デフォルトの名無しさん :2007/04/01(日) 18:18:39
>>430 えーと、中身を解釈して構造はこうだったよ!と
吐き出してくれるものってないのでしょうか?
構造解析結果まで生成するものがパーサだと思っていたのに・・・
>>431 おいおい、今朝教えたパーサの知識を
早速こんな所で御開陳か?
>>430 の話は、要するにサンプルコードはパースはするけど、
内部的に生成した構文解析データの出力ルーチンは記述されていない
ってだけの話だろ。
>>432 すみませんが、もう煽りにレスはしません
いや、煽ってなどいない。 そもそもキミは質問に回答をもらった後で、 回答者に感謝の意を表しているかね?
435 :
427 :2007/04/01(日) 20:51:45
>>431 example.cpp(と,そこで使ってるverilogParser.yxx)は
* エラーがあったらyyerrorのassert(false)で異常終了
* なかったら返り値1で終了(←何考えてるんだ?)
ってだけのプログラムなのは読めば分かるだろ?
そもそも出力先を一つもfopenしてないしfstreamも使ってない
内部構造はyydesign->modulesにpush_backされてるから自分で文字列化しる
つまりverilogDesign.cpp内の各クラスにoperator string()を追加するんだよ
とりあえずverilogパーザなんて難しいものでなく逆ポーランド電卓から始めた方が w
フレームの最中申し訳ないが質問に答えてほしい。 今日、電車の中でふと疑問に思った。 様々なLispやOCamlみたいにevalを持つコンパイラの場合 実行コード中にインタプリタかコンパイラを持っているのですか ? FAQかも知れませんが教えてください。
>>436 実行コード中にインタプリタかコンパイラを持っています
>>436 Lispコンパイラとか言うときってスタンドアロンなバイナリファイルを吐くものでないことが多い気がする
対話環境(←コンパイラを含む巨大なプログラム)において関数を定義すると
その関数に対応するネイティブコードをコンパイラがメモリ上に構築してそれを実行,とか
そういうのだと作ったソフトの配布には使いづらい(そうでないものもある)
OcamlのToploopモジュールも,あれocamloptじゃ使えないんじゃないのか? (未確認)
439 :
436 :2007/04/01(日) 23:37:28
>>438 インクリメンタルなコンパイルのほうが将来性があると聞いて、そっち方面に
手をつけてるんだけど、↓の意味がわからない。コンパイラを含む分、サイズ
が多きくなるけど数メガ程度で、Windows でいったら DLL HELL を避けるため
に C ランタイムとかの DLL を添付程度のもんだとおもってるんだけど、
サイズ以外になにか問題ってある? Java や Lua の JIT とかも該当しそうだけど
> 対話環境(←コンパイラを含む巨大なプログラム)において関数を定義すると
> その関数に対応するネイティブコードをコンパイラがメモリ上に構築してそれを実行,とか
> そういうのだと作ったソフトの配布には使いづらい(そうでないものもある)
LexerとParserが分離できるかの問題じゃね? xml知ってるならDOMを実装するのにSAXが使われてたりするってのをイメージすると分かりやすいんだが。 字句解析が中のSAXパーサ、構文解析がDOMパーサ全体。 構文ツリーがDocumentノードって感じ。 分離するかしないかの問題でそれと同じだ。
サイズの問題さえ気しなけりゃ配布ソフトが字句解析器や構文解析器を備えてようが、 それが分離できるかできないかなんて関係なくない?
つーか対話環境ってそんな大きくなるもんかね?
REPLだけが対話環境とは限らんから、Visual Studioみたいな対話環境が ついてくるのかも知れないじゃんw
商用利用(ゲームとか)を考えると、ソースや開発環境をまるごと載っけてると 勝手に改変版のプログラムを売られる/配られるのが嫌だ。とかいうのはあるかも。
446 :
438 :2007/04/03(火) 00:07:09
>>440 とりあえずサイズの問題だけ考えてた
まぁ今時では気にしなくていいのかな?
こないだ見た例では,abenori氏のTeXインストーラがDLL版Rubyを同梱してたっけな
>>445 特にLispはリフレクション,イントロスペクション周りの機能が多いので
対話環境をそのままくっつけておくと
意図せずに内部を見られ,いじられてしまうことにつながりかねないよね
(それは強みの裏返しだが)
>>498 サイズの問題がメインなんだよね。まぁ、いじられたくないアプリなら対話環境の機能は殺したいよね。
JIT みたいなインクリメンタルなコンパイル機能に問題があるのかとガクブルしちまった。すまん。
Lisp 界隈では大抵コンパイラというのはソースをネイティブコードやバイトコードなどの実行形式に変換する
機能のことで、スタンドアロンなバイナリ作る機能とは独立してるみたいだね。うーむ、そーゆうのもアリなんだねぇ…。
>スタンドアロンなバイナリ作る機能 それはリンカとかローダとか(名前は何でもいいんだけど) 別のプログラムの役割では
極力ランタイムをmsvcrt.dll直にしてnativeに落とせば2KBぐらいから作れる。 VM上で動くのなら10〜20KBぐらいじゃないかな。 eval相当が必要かどうか。
ココで聞くべきことではないかもしれないけど 組み込み用(マイコンとかじゃなくLuaなどの方面)のCコンパイラ(スクリプトか?)があったような気がするんだけど 名前が思い出せない 知っている人はいますか? たしか、機械語を吐けるものだった気がします
これかな? LSI C 86
こっちかも libtcc
tccか… あれはいいものだ。
454 :
デフォルトの名無しさん :2007/04/17(火) 16:47:20
訳あって、(メトリクス計算プログラムを作るため)字句解析まで行いたいと思っている者です。 Javaで調べてみたところ、java.io.StreamTokenizerというAPIが自動で構文解析をやってくれるそうなのですが、 このスレ的にはStreamTokenizerの評価はいかがなものでしょうか? ちなみに、字句解析までのプログラムを(OS云々で面倒なので)Javaで作ろうと考えており、 扱う言語もとりあえずはJavaSE1.4あたりにする予定です。 できれば、StreamTokenizerを詳しく取り扱っている本とかを紹介していただけると助かります。
>>454 字句解析・構文解析・意味解析のそれぞれの意味の違いを知っていますか?
StreamTokenizerで扱えるトークンは ・ 数値 ・ ワード (英数字のつらなり、文字列定数、その他の記号) ・ 行末、ファイル末検出 * コメント記号(#等)以降行末まで読み飛ばし 程度。任意のトークンを追加登録する機能はない。 簡単な設定ファイル程度ならともかく Java言語の字句解析には機能不足だ。 Java言語の構文解析が目的ならば、 パーサ生成プログラムを使うって作るか、 ありもののパーサを探すのが良い。
459 :
454 :2007/04/17(火) 18:35:28
>>455-456 流石にそこは真っ先にチェックしてます。
>>457 すみません。字句解析と構文解析を逆に書いてました。
意味解析は今回は必要ないです。
>>458 と、なるとjavaccあたりで行うのが無難でしょうか?
構文解析抜きじゃ、メトリックを計れないでしょ
意味解析という言葉を持ち出している時点でネタ決定
>>461 教科書的には意味解析という言葉はある。
意味解析抜きじゃ、コードの質を計れないでしょ
464 :
デフォルトの名無しさん :2007/04/17(火) 21:14:04
すげーな 俺は字句解析と構文解析をわける意味も必要も境目も全く理解できんかった どう考えても構文解析までやらないとわからんトークンってある気がするっつうか そうでなくとも構文解析しながらのが略
字句解析した方がプログラムとしてまとまりがあってよい。
466 :
デフォルトの名無しさん :2007/04/17(火) 21:24:20
いや、構文解析までやんねーと字句に分けらんねーって話なんだけど
cモドキでプリプロセッサとcパートとインラインアセンブラを同時に解釈するような アホコンパイラを作ったときは字句解析と構文解析が交じり合って酷い目にあったな。
468 :
デフォルトの名無しさん :2007/04/17(火) 21:33:39
こんなん分けていいことないよね
470 :
デフォルトの名無しさん :2007/04/17(火) 21:50:26
いやだからさー 字句解析って構文になってない つまり前後をみないで文字単体で判断することになるわけじゃん これやりにくいぜー
という文法を作るとコンパイルが糞遅い言語が出来上がるわけですな。
472 :
デフォルトの名無しさん :2007/04/17(火) 21:57:40
文字っつうかトークン?
>>470 どんな文法でもトークンに分けられますよ。
だから、大丈夫です。
474 :
デフォルトの名無しさん :2007/04/17(火) 22:01:56
いやそれがさ 構文解析までしてみないとトークンとしてわけずらいもんがあるわけよ できるできないの話じゃなくてな
>>474 どの程度までを構文解析って言ってるのか曖昧
476 :
デフォルトの名無しさん :2007/04/17(火) 22:08:30
あいまいも糞も一回でもやってみりゃわかるでしょ わからない人とはお話ししませんw
いや、字句解析・構文解析ぐらいやったことあるけど、普通に棲み分けできるぞ?
>>474 > 構文解析までしてみないとトークンとしてわけずらいもんがあるわけよ
> できるできないの話じゃなくてな
それは多分、言語の文法の問題。
CやJavaレベルなら、構文解析までしなくても字句解析は普通に
出来ると思う。
どんな文法の言語の話?
例文希望。
こういう曖昧なのとかか? 決め打ちだと思うけど。 #include <stdio.h> int main() { int a = 3; printf("%d", a---3); }
・ゆるいJavaScriptのような、文の後の改行はセミコロン(の省略)とみなされ、 それ以外ではホワイトスペースとして飛ばされるケース(改行文字のトークン解釈が構文解析の状態に依存) ・文字列リテラル中に、埋め込みテンプレートのような感じでその言語の式が書けるケース(字句構造内に構文構造が存在する) etc.
>>480 あ〜そうか、君はちゃんとした教育を受けてないんだ。
我流だね?
482 :
デフォルトの名無しさん :2007/04/17(火) 23:26:10
>>479 そういうのもそうだな
あとダブルコーテーションの中身が豪勢なのも俺は嫌いだ
あとなんだったかな
なんかもっと個人的に微妙なんだけど凄く嫌なのあったんだけど忘れたw
今度メモってくる
誰か解決策知ってるかもしれんし
483 :
デフォルトの名無しさん :2007/04/17(火) 23:30:25
改行とかタブとか見えないのが構文に影響を与える言語早く廃れてほしい パイソンとかもう消えていいよ
>>479 a---3 は特に字句解析で困ることはなし。
マイナスが連続した場合の処理だけど、
1.1つめのマイナスを読み込む。
2.1文字先読みする。
3a.2で読んだ文字がマイナスなら演算子--(マイナスふたつ)と判断。
3b.2で読んだ文字がマイナス以外なら演算子-(マイナスひとつ)と判断。
ってだけで済む。
>>480 眠いから後でよく考えてみるけど、後者の文字列リテラル中に
言語の式が含まれると言っても、その言語の文法すべてを
含めることができるわけじゃない…んだよね?たぶん…
Cだとint *pで(3/*p)だとコメントのエラーになる。 構文解析の段階で字句まで処理しちゃうと 組み合わせの爆発的増大がおきるからやらんだろ。
487 :
デフォルトの名無しさん :2007/04/18(水) 00:06:18
構文まで踏み込まないとわからんトークンがあるから 俺は同時にやっちゃったほうがいいと思うけどね
/と*を別々に扱えば良いだけ。
489 :
なにこのスローモーな会話 :2007/04/18(水) 00:24:16
490 :
450 :2007/04/18(水) 00:29:34
空気
構文解析までしないとトークンに分けられないオレオレ言語の文法ってどんなのよ。 変数名に記号でも使えるのか?
>>493 いえ、彼は大天才です。ただ我々のような凡人には馬鹿にしか見えませんが。
LL文法に後からルールを追加する方法無いかな…… オートマトンを弄くるしか無いかな?
ホルホルしてデンパ垂れ流しか
>>488 そしたら / * がコメントの開始になるんじゃね?
>>478 >CやJavaレベルなら、構文解析までしなくても字句解析は普通に
>出来ると思う。
>
>どんな文法の言語の話?
>例文希望。
C の typedef で定義された型。
これは確かに「文字列」としては切り出せるが、その後
それがただの識別子であるか typedef された型であるかが
分からないと構文解析はできない
(普通この問題は、構文解析して得た情報を
字句解析側にフィードバックすることで対応している筈)。
3/*p コメント開始 3/ *p 正しい式
字句解析では、識別子を認識するだけ。 (変数名, 関数名, 構造体/共用体名, typedef名) 狭義の構文解析では、識別子が文法上正しい位置 に出現している事を認識するだけ。
>>503 まあな。
俺は誰かさんとは違って、
世の中の全てのCコンパイラのソースを
読んだ経験がある訳ではないからな。
俺が悪かった。
チラシの裏の落書きだと思って読み飛ばしてくれ。
(int)("foo", stdout) はキャストで、 (fputs)("foo", stdout) は関数呼び出しという問題のことでおk? この場合必要なのは意味解析から構文解析へのフィードバックであって、 字句解析は関係ないような。
より正確に言うと、文法上正しい位置に現れた識別子は、 その文法に従って変数名, 関数名, 構造体/共用体名, typedef名, … のいずれかの属性が付けられる (仮定される)。 例えば a = 3; // aは変数 b(); // bは関数 変数と仮定した識別子の定義と参照に矛盾がないことを チェックするのは意味解析フェーズの仕事。 typedef int integer; // 定義1:integerはtypedefされた型名 integer a; // 定義2:a は integer型変数 a(); // 参照:a は 関数名のはずだったが // 定義2と矛盾している→エラー
508 :
デフォルトの名無しさん :2007/04/18(水) 08:19:35
>>505 見たこともない話をくどくど言うのはビョーキ
>>506 いったい何処に意味解析の入る余地があるのか全然分からない。
もしかして、"int" という文字列を、
字句解析では int キーワードとして
認識しないつもりなのか?
頭悪すぎ。 intは予約語なので、字句解析レベルで認識可能。 (integer)("foo", stdout) ならば、 字句解析で integerは(関数戻り値の)型と仮定され、 意味解析で integerの型定義を確認する
511 :
510 :2007/04/18(水) 08:31:09
× 字句解析 ○ 意味解析 (integer)("foo", stdout) ならば、 字句解析で integerは単なる識別子 (変数名、関数名、typedef名、・・・)と認識され、 構文解析で (関数戻り値の)型と仮定され、 意味解析で integerの型定義を確認する
>>489 >
>>484 > 3---a
うん。だから、それは
「3」「−−」「−」[a」
の4つのトークンに解析されるから文法エラー。
>>512 まぁ、そのほうが身の為だよ。
(相手が自分で訂正したミスを意識し続ける奴って馬鹿にしか見えないから)
515 :
506 :2007/04/18(水) 09:47:30
>>509 (XXX)("foo", stdout)という形の式を見たときに、XXXが型名(予約語だけでなくtypedef名も含む)か
そうでないかを判断しないとこれ以上構文解析できない、ということを言いたかった。
>>510-511 何を言ってるかさっぱり分からん。
「(関数戻り値の)型」って何?
>>507 いい加減なことを言うな。
Cに関数名と変数名の構文的区別はない。
式 (XXXX)("foo", stdout) の処理方法 字句解析: XXXXは、(変数名、関数名、構造体/識別子、typedef名 のいずれかを表す)識別子トークンとして認識される。 構文解析: 式 (XXXX)("foo", stdout)は、 (少なくとも)2種類の解釈ができる。 解釈1. XXXXが関数名の場合 関数XXXXの呼び出しと解釈する。 XXXX("foo", stdout) と等価。 ("foo", stdout) は関数の引数と解釈する必要がある。 解釈2. XXXXが型名の場合 型XXXXへのキャスティングと解釈する。 ("foo", stdout) は式と解釈する必要がある。 意味解析: 識別子XXXXの定義を調べ、 構文解析フェーズのどの解釈が適切か判断する。 但し実際のCコンパイラは1パスでこれを処理するので、 構文解析フェーズで式(XXXX)("foo", stdout)を処理する前に、 XXXXは関数名もしくは型名として定義済みでなければならない。 (未定義のまま参照された場合、未定義エラーとなる)
頭が悪いから
字句解析時には識別子の種類 (変数名、関数名、構造体/識別子、typedef名) を判断する必要はない。
520 :
デフォルトの名無しさん :2007/04/18(水) 10:28:45
>>516 おまえの質疑応答はいつも高飛車だな
バカ丸出し
>>500 字句解析では、「コメントの開始」をトークンとして扱わない
ここはひどい揚足鶏スレですねw
>>523 > /* 〜 */ をスキップ、かな。
そういうのは構文解析の段階でするんじゃないかな
それなんて言語?
Cって、コメントはプリプロセスの段階で取り除かれるんじゃなかったっけ?
一ヶ月ぶりに覗いたがなんという成長の無いスレか
トークンの座談会の巻 謎の男「やあ伊藤君!」 伊藤君と呼ばれた女の子「そういう君は佐藤君か!」 佐藤君と呼ばれた男「斎藤君はまだ来ないのか?」 斎藤君と呼ばれたネカマ「俺なら既にいるがな!」 後藤君と名乗るネナベ「…俺をシカトするな!」
>>519 そうすると、構文解析で問題が出る。
例えば変数宣言の箇所で、
a b;
という記述があったとしても、
それが構文上正しいかどうかが分からない。
a が typedef 名ならば正しいが、
そうでないならば構文エラーだろ?
まあ、これを(無理やり)構文解析では ok として、
意味解析に押し付けるという主張もあるようだが、
もし本当にそんな設計をしたら、
まあ、多分グダグダになるだろうな。
だってそれじゃ、構文解析って
実質何の仕事もしてない事になってしまうもの。
・・・まるで、どこかの丸投げ SIer みたいな仕事のやり方だよ。
お前は日本語読解力に大きな問題がある事が判った。
>>531 「構文」エラーを判定するのは「構文」解析の仕事だと思うのだが?
>>533 >「構文」エラーを判定するのは「構文」解析の仕事だと思うのだが?
もちろん、そのとおり。
・・・で、一体何処に突っ込んでいるの?
おこちゃまむけせつめい (1)ていぎぶのしょり1 "typedef int a;" 字句解析くん: 予約語(typedef)、組込み型(int)、識別子(a) ";" キター 構文解析さん: typedef文キタワァ・・・組込み型(int)、型識別子(a) って感じ? 意味解析先生: 型テーブルに登録しときますね。 型識別子|型 --------+------------- a |int (2)ていぎぶのしょり2 a b; 字句解析くん: 識別子(a)、識別子(b)、";" キター 構文解析さん: 変数宣言みたいな感じぃ? でも 型(a)って定義されてるのかしら (意味解析先生: 型テーブルを見ればいいのに・・・) 構文解析さん: 型テーブルに型(a)って書いてあるわね じゃあ答は 型(a)、識別子(b) ね。 意味解析先生: (よしよし) 変数テーブルに登録しときますね。 変数識別子|型 -----------+------------- b |a
低レベルな人間の自作自演はいつまでたっても話が解決しないので、チョー笑える
そもそも「意味解析」って、入力データが "構文的に完全に正しい" という事が判明した「後」の話だろ? まず、そこら辺の常識、知ってるのか?
糖質か。スルー
意味解析持ち出したアフォに話を合わせといたら、 ついにアフォが自分の掘った穴にはまったなw 変数テーブルや型テーブルの管理は、 構文解析の仕事だよ yaccで言うと、BNFを構成するの それぞれの構文要素にアクションとして記述する
管理っつか、登録と参照ね
>>539 > 変数テーブルや型テーブルの管理は、
> 構文解析の仕事だよ
「ふつうは」それらは意味解析の仕事だよ
Cなどの言語では構文の都合上本来は意味解析でやるべき
仕事を構文解析でやらざるを得なくなってるだけ
そりゃもちろんyaccのアクションにそれらの仕事を押し込む
ことはできるけど、言語が複雑になればなるほど
そういうことするとメンテナンス性が下がる
それと、亀レスだが構文解析レベルでなければ処理しづらいトークンの
例としては、上でも誰かが挙げてた文字列リテラルの中に式を埋め込める
構文(Rubyの#{...}など)で十分だろう。この場合、字句解析器は埋め込み式の
ネスト構造を認識しなければならないので、字句解析と構文解析を完全に
分離するとうまく対処できない(字句解析では一般的に、正規表現を使って
トークンを表現するため)
542 :
デフォルトの名無しさん :2007/04/18(水) 22:30:02
字句くん:構ちゃんがいつも相談してもらってる先生って、ホントは構ちゃんの一人二役でしょ? ホンモノの意味先生は忙しいから、そんな雑務に付き合うわけないし 構文さん:当たりでーす てへへ
>>539 >変数テーブルや型テーブルの管理は、
>構文解析の仕事だよ
>yaccで言うと、BNFを構成するの
>それぞれの構文要素にアクションとして記述する
アクションとして記述する部分は構文解析の範疇じゃないだろ?
構文解析と言えば、
・構文的に正しいか否かを判別すること
yacc で言えば、{ } 内の処理が全くない状態で
parsing できるか否かを判別すること。
・正しい場合、それがどの構文形式かを一意に特定すること
>>517 >構文解析: 式 (XXXX)("foo", stdout)は、
>(少なくとも)2種類の解釈ができる。
こんなのダメダメ。実質、reduce/reduce conflict だろうが。
だろ?
545 :
デフォルトの名無しさん :2007/04/18(水) 22:33:40
> こんなのダメダメ。実質、reduce/reduce conflict だろうが。 それでは正しい解説をどうぞ。 ↓
>>534 字句解析に対して構文解析の仕事を要求しているように読解できたんでな。
まあ、漏れの読解力不足かもしらん
547 :
あらあらまたハッタリかな :2007/04/18(水) 22:35:49
> こんなのダメダメ。実質、reduce/reduce conflict だろうが。 それでは正しい解説をどうぞ。 ↓
>>537 C言語の場合は実質
>>517 ,
>>535 だろ。
それが気に入らないなら、
C言語使うのヤメるか、
自分でコンパイラ書けばいい。
毎度毎度のお話だが。
>>541 言語内のミニ言語(埋め込みSQL、Cのプリプロ、printfフォーマット等)なら
別の言語エンジンで解析するのがデフォだろ
eval絡みのリテラルなら、言語エンジンを再帰的に適用するとか。
>>547 もしかして、ダメダメだってことが
"本当に" 分かってないの?
BNF による ANSI C の定義なんて、ネット上に
いくらでも転がっているのに?
550 :
デフォルトの名無しさん :2007/04/18(水) 22:43:08
あのさぁ、素人向け解説にいちいちマジ突っ込みするのって、 それなんて名前の火病? このスレの惨状、レベルの低さを見てから、 ちゃんと回答を丁寧に示せ。お前の義務だ
551 :
逃げちゃダメだよ :2007/04/18(水) 22:43:44
> こんなのダメダメ。実質、reduce/reduce conflict だろうが。 それでは正しい解説をどうぞ。 ↓
>>550 話もろくにかみ合わない糖質相手にマジんなんな
火病だ(プゲラ
「gccでは二種類のトークン 識別子 と typedef型名 を扱っており、 字句解析と構文解析が連携して動作する」 きちっと言えばこれだけの話だろ。 ところでスレの話の本筋は意味解析がうんたらかたらになっちゃっている。 じゃあまず話の筋がおかしいって指摘したらどう? 物事を丁寧に説明できない人種には あまり関わりたくはないなあ
reduce/reduce conflictを避けたら、 lexical tie-inが必要になっちゃいましたぁ
>>555 こんな時間帯にここに常駐してる人間に
そんなクオリティを求めるのはムリだ
>555
>きちっと言えばこれだけの話だろ。
それは
>>555 の思い込みに過ぎない。
俺が言いたいのは「これが一般的な処理方法だ」という事。
559 :
デフォルトの名無しさん :2007/04/18(水) 23:06:15
あーうるせー 俺のいない間にスレ進み過ぎだろ 全部読むのに苦労したぜ 結局さ、字句解析と構文解析なんてわざわざ分けるだけ面倒なだけでしょ 俺が週末に趣味で作ってるスクリプト言語が完成するまで 反論は一切許さない このスレにくるたび最良の方法が目移りしてなかなか作業が進まない罠 年内に公開はもう無理だと思うw
> それは
>>555 の思い込みに過ぎない。
> 俺が言いたいのは「これが一般的な処理方法だ」という事。
「一般的」・・・これまた脳内でしょ
なんでいつもハッタリかますの?
字句くん: 構ちゃん、俺と結合しようぜ 構文さん: (結婚前はダメ ・・・でも身体が反応しちゃうの) 字句くん: あ”なんか身体に入ってきた・・・♂かよ!
>>548 >eval絡みのリテラル
具体的な例が思い付きません ><
先生、教えて下さい ><
>>560 ググってページ示すのがやっとで
内容理解できない人だからしようがないw
キーワード:ダメダメ 発言者: ダメダメ業務コンサル
>>560 まあな。
俺は誰かさんとは違って、
世の中の全てのCコンパイラのソースを
読んだ経験がある訳ではないからな。
俺が悪かった。
チラシの裏の落書きだと思って読み飛ばしてくれ。
結局LISPが最強ってことか。
キーワード:ダメダメ 発言者: ダメダメ業務コンサル 発言: まあな。 俺は誰かさんとは違って、 世の中の全てのCコンパイラのソースを 読んだ経験がある訳ではないからな。 俺が悪かった。 チラシの裏の落書きだと思って読み飛ばしてくれ。 Web石碑に登録完了しました
>>567 で、結局、意味解析に任せるのが
「正統派だ」ということでいいのか?
>>548 541だが、俺が例に出した式を埋め込める文字列リテラルというのは、
そのミニ言語がその言語自身なわけで、もう1つ言語エンジンを作るのは
無駄でしょ。しかも、その埋め込まれた式が構文的に間違っていたら
構文解析エラーを出す必要があるから、言語エンジンを再帰的に適用する
なんて方法でもダメ
で、実際はどうするかというと、状態付きLexerにして、ParserからLexerの状態を切り替えるか、
そもそもLexerとParserを分ける必要が無い構文解析アルゴリズム(Packrat Parsingなど)を
使うわけだ
>>568 宗教選択じゃねぇんだから、目的考えて自分で解決しろ。
スミスっぽい方が
>>569 に来てるから、相談したらどうよ。
>>569 > 構文解析エラーを出す必要があるから、言語エンジンを再帰的に適用する
> なんて方法でもダメ
ダメな理由をkwsk
572 :
570 :2007/04/18(水) 23:45:25
> 構文解析エラーを出す必要がある から > 言語エンジンを再帰的に適用する なんて方法もダメ 前段と後段がつながらないね。 エスケープ文字の問題? エスケープ文字を処理済みの式を 構文チェック・モードの言語エンジン (≒Lexer+Parser) で再帰的に処理して、構文解析エラーを出せば済む
左再帰を人手で除去するのがめんどい
>>572 すまん。よく考えてみると、言語エンジンを再帰的に
適用する方法で行ける気がしてきた。ただ、その方法は
煩雑になるんじゃないかなあ(特にParser Generator
を使う場合、面倒そうな気が)。
>>571 > Packrat Parsingで効率良いパーサ書けますって言いたいだけじゃないか、とw
まあ、半分くらいはそのような意図が無いでもない
> で具合はどうよ
これはどういう意味?
>>531 遅レスだが。
丸投げするような仕事は、
そもそもSIer内部で誰も興味ない
つまらない仕事だから丸投げ&ピンハネするだけだろう
本筋をちゃんと説明せず
関係ない話でお茶を濁すのは
醜いよ
> > で具合はどうよ > これはどういう意味? ェェェエエエエエエ そこでこっちに投げるか?普通 たとえば ・バックトラックやconflictを避けた素直なパーサを書きやすいか ・処理時間がリニアで高速か とかそんな話じゃなかったっけ ちゃんと見てないけど
なんでおまいら今日に限ってこんなにスレ消費が速いんだよwwwwwwwwww
>>576 ああ、そういう意味ね。具合はどうかという言葉の意味を
この場合どう取ったらいいかちとわからんかったもので
で、長文になるけど、Packrat Parsingに対するコメントとしては
・複雑な字句構造を持った言語のパーザは非常に書きやすい
・LL(k)やLR(k)と違って、選択される要素の並び順に意味があるので、
そこは注意する必要がある(A / B / CはA / C / Bとは意味が違う)
・単純な字句構造の言語だとかえって書きづらいことがある(空白文字や
コメントの処理も構文解析レベルで処理する必要があるため。ただ、
これは字句解析後のトークン列をPackrat Parsingで解析すればいい
という話もある)
・処理時間はリニアだけどLL(k)やLR(k)アルゴリズムに比べると低速な
ことが多い。ただ、これはナイーブなPackrat Parsingの話で、Parser Generator
を使うこと前提なら、Parser Generatorに色々な最適化を組み込むことはできる
と思う
・アルゴリズムの特性上、構文規則の書き方で性能がかなり変化する
(選択(/)が上から順番にマッチングを行うようになっているため)
e ::= x | n | e + e | e * e +, *は左結合で、優先度は* > + みたいな構文はpackrat parserではどう書けるの?
演算子順位文法かよ そんなん手書きでもできるだろ
残りもちゃんと読めよ。読み終わるまで夕食抜きな。
おまえら無駄に加速し過ぎる
>>582 おまんまんらめえー
らめなの!そんな太いの入るわけ無いじゃない!
500kバイトのソースファイルなんて私には無理!
い…いや!ひぃー
(ギチギチ)
あ…あたまがおかしくなっちゃうの…
もう駄目…オーバーフローして…しまう
「」さん…ごめん…げふ
>>579 基本的にはLL(k)の場合と同じく、左再帰を除去して、
優先順位ごとに構文規則を作る必要がある。
>>579 の例だと
こんな感じ
e ::= a ('+' a)*
a ::= p ('*' p)*
p ::= x | n
Packrat ParsingはParsing Expression Grammar(PEG)ベースの
構文解析アルゴリズムだから厳密には
e <- a ('+' a)*
a <- p ('*' p)*
p <- x / n
のようになるけど(<-とか/はPEGで使われる記法)
>585 なるほど。 parseして抽象構文木を作ろうとした時、元の文法だと自然にできるけど(e + eとか)、 packrat版だとやりづらそうだね。
えええええええ?記法が異なるだけじゃん。
彼女がエッチさせてくれません・・・ みなさん、エッチする前はどういう風に切り出していますか? アドバイスください
589 :
587 :2007/04/20(金) 20:25:40
なんだ、頭がおかしい人が来てるだけか
>>586 そうね。
ただ関数クロージャを使えば上手くやれる
592 :
デフォルトの名無しさん :2007/04/20(金) 20:40:15
キミの話にはいつも具体性がない。 アフォはアフォなりに、隅っこで小さくなってろ。
どんな解釈してるのやら。 基礎が無い奴って話が特異点だらけで萎えるな
おまえら、アンカーつけろよ。 誰が誰に言ってるのかさっぱりわからん。
ネカマ乙
実際にコードにするときはパーサコンビネータやらパーサジェネレータやらを使う訳で、 そのときに左結合の式を解析するための要素が用意されていればいいのだから、 実際にはそれほど問題じゃないかな?
Parsing Expression Grammars: A Recognition-Based Syntactic Foundation
http://pdos.csail.mit.edu/~baford/packrat/popl04/ http://pdos.csail.mit.edu/~baford/packrat/popl04/peg-popl04.pdf Abstract
For decades we have been using Chomsky's generative system of
grammars, particularly context-free grammars (CFGs) and regular
expressions (REs), to express the syntax of programming languages and
protocols. The power of generative grammars to express ambiguity is
crucial to their original purpose of modelling natural languages, but
this very power makes it unnecessarily difficult both to express and
to parse machine-oriented languages using CFGs. Parsing Expression
Grammars (PEGs) provide an alternative, recognition-based formal
foundation for describing machine-oriented syntax, which solves the
ambiguity problem by not introducing ambiguity in the first
place. Where CFGs express nondeterministic choice between
alternatives, PEGs instead use prioritized choice. PEGs address
frequently felt expressiveness limitations of CFGs and REs,
simplifying syntax definitions and making it unnecessary to separate
their lexical and hierarchical components. A linear-time parser can be
built for any PEG, avoiding both the complexity and fickleness of LR
parsers and the inefficiency of generalized CFG parsing. While PEGs
provide a rich set of operators for constructing grammars, they are
reducible to two minimal recognition schemas developed around 1970,
TS/TDPL and gTS/GTDPL, which are here proven equivalent in effective
recognition power.
>>597 そんな有名論文をいまさら貼って何がしたいんだ?
なんだよ。
>>585-586 のつながりがあまりに不自然だったんで、
なんか変な荒しかと目を疑っちまったよ。
(e + e)=左再帰除去の話ね。了解
発言は幼く、態度は横柄 こりゃとんだ学生さんだなw
基礎がないから、何もかもが特殊な話に見えるのだろう。 見ていて恥ずかしくなる。
たぶんここで聞くのがいいか判らないのですが、 自分で正規表現を実装してみようと思ったのですが、BNFみたいな仕様書はどこに あるのでしょうか?RFCの何千番台目ぐらいですかね?
底抜けのマヌケだと思った。
NFA ヌンチャク・ファイティング・アーツ 無形無限流ヌンチャク術を武道スポーツとして、 「誰にでも安全かつスマート」に指導しています。 NFAでは男性、女性、大人、子供と全てが活躍中! また、NFA精神と無形無限流の技法で、 他流派武器術大会にも積極的に参戦中です! 左動画 無形無限流演武 NFA代表 宏樹
>>604 DFA ドラゴン・ファ……
の方が強そうだぞ
>>602 特に仕様書というのはないと思う。
あるのは、PerlやRubyといった各言語ごとの仕様書。
PHPなんて2種類の正規表現が用意されているし。
RFCもないだろうから、好きなように実装すればいいと思うよ。
以上、自問自答でお送りしました
Internet Engineering Task Forceが正規表現の標準を決めるという発想に度肝を抜かれたw
POSIXで一応決まってなかったっけ
公開識別子 ISO/IEC 9945-2:1992//NOTATION POSIX Regular Expression Notation//EN は、 POSIX で規定されている正規表現という記法を表します。この公開識別子は ISO/IEC 10744:1997 で使われています。
ちょっと質問です。 C++で動的にルールを変更できるパーザて存在します? 自分でプッシュダウンオートマトン組むしか無いのかな……
>>612 パーサとコンパイラコンパイラを混同して無いか?
シチュエーションをきちんと説明しないあたり、 また意味ありげに素人妄想口走ってるだけだろ。
>>612 「動的にルールを変更」ってのは具体的にはどうしたいの?
こんなルールからこういうルールに変更したい、とか書いとけば
誰か答えてくれるかも…
>>612 がきちんと問題定義するまで、
ヒント与えちゃダメだよ >> All
こいつは問題定義を明確にせずに
議論をかき回す常習犯だからw
これくらいエスパーしてやれよ お前ら役立たずだな
ほら来た半島人
掲示板で乱射事件起こしまくりのチョンw
620 :
612 :2007/04/22(日) 11:57:00
あらら、なんかもめてますね。ごめん。 C++で俺言語作っているんだけど、どうせならForthやLispみたいにソース読み込み時の 挙動についても言語内に取り込んで拡張できるようにしたいなぁ、と考えたのが背景。 Lispのリードマクロとか、Forthみたいなスペース区切り必須にしてもいいけど、文脈自由文法に 対応できたらいいなぁ。でも、自分で動的に変更可能なLexer & parser作るのも大変だなぁ。 有り物でどっかないかな…… ということで質問しました。
個人的には字句解析と構文解析は分離していないと困る。 現実的外人の作ったスケルトンの上での文字コードサポートとか考えるとね。
Forthの例は知らないけど、 Lispのリードマクロはプリプロセッサ程度の事しか やってないんじゃないかな。 文法を動的に変更できる言語というと、 例えばXSD&XMLが思い浮かぶけど・・・ セマンティックへの対応付けまで考慮すると Lispみたいに自己記述可能な言語や、 JavaVMみたくByteCodeでセマンティックを記述可能な言語じゃないと 難しいような気もする。
>>621 それぞれの目的に合った方法を選択すれば良いのだと思う。
上の流れは、単に最近話題になっている
PEG(Parsing Expression Grammer)では
Lexer-Parser分離が不要っていいたかっただけなのだと思う。
Caper作った人待ちかな
lemonの問題点: ケーパーよろしこ。 ・衝突に厳しい ・tokenがunionなんでコンストラクタ/デストラクタが掛けない
動的な変更は、ユーザー定義の中置演算子を導入する等を行う方法と Dylan,Nemerle等のマクロが有名です。
なんか勘違いしてる雰囲気がする
要するに、動的パーサというよりは マクロ・プロセッサーが欲しいという事?
629 :
626 :2007/04/22(日) 21:31:16
動的パーサってことは、要するにマクロ・プロセッサー ってことなんじゃと思って書いきました。勘違いしてたらゴメン。 というか、動的パーサのいい方法あったら、 マクロプロセッサに使えそうなので俺も知りたいです。
長文どかどか書く奴がろくな事を言った試しがない。
> どっちにしろLexer&Perserは自分で組まなきゃいけないね。 Lispはそれはねぇな > > XSD&XML > 「タグを使った入れ子構造」というルールは変更できたっけ? タグを使った入れ子構造≒構文解析木 という標準的な解釈で、構文木の文法ルールを変更できるだけだよ。 常識ねぇな
>>630 んーと、「動的パーザ」って一般的な言葉なのかな…?
(無知ですまん)
で、630が欲しい機能は動的に制御構造を定義できることでいいのかな?
となると、Lispのリードマクロよりもdefmacroとかのほうに近いような…
Lispの場合、すべてがS式だから、リードマクロやdefmacro等で、
制御構造を定義できるけど(パーザはS式が読み込めればいいだけ
なので単純にできる)、C/C++などの系統の言語だと、制御構造を
動的に定義可能にするのはかなりむずい気がする。
最初から、言語の文法を考えるときに動的に拡張できる文法を
考えながらじゃないと無理なんじゃないかな。
LispにしろForthにしろ、もともとの文法が単純だから
制御構造の拡張なども出来るんだと思う。
> 今はboost::spiritで文法を書いているんだけど それってしょせん再帰下降文法だろ。 文法ノードを一個一個関数で書いてくだけだ。 ならその関数自体をスクリプトで書いて、 下位の文法要素の呼出組み替えられるようにすれば 文法カスタマイズ完成だな。 大した手間じゃねぇ〜じゃん
635 :
630 :2007/04/22(日) 22:14:25
>>633 変な勘違いすんな。
なんかやりてぇって言ってるのは
>>612 だ
よく読めスットコドッコイ。
ほんと半島人はガッついてて大変だな
>>631 ほんと長文書く奴来ると、
途端にレベルが低下するんだよな
>>636 長文書くヤツってようは自分の言いたいことも簡潔に
まとめることができない馬鹿だからねぇ、仕方ないよ。
長文書く奴がどうこう以前に、 このスレは一度たりともレベルが高くなったことがないと思うが。
みんなごめんね☆ 何か寂しくなっちゃってしってる事ぜんぶまとめて長文で書き込みしちゃいました。 反省したので明日ボウズにしてきます。 (;_;)
640 :
638 :2007/04/22(日) 22:38:49
みんなごめんね☆ 何か寂しくなっちゃって自分の内的な願望を書き込んじゃいました。 反省したので明日ボウズにしてきます。 (;_;)
642 :
626 :2007/04/22(日) 22:40:46
そ、それは、凄く核心的。 いわば、コンパイラ・インタプリタで動的に文法変えられるパーサライブラリですね。 リードマクロ発動を含む基本となる文法を定義してあとはインタプリタは知らせればOK ってあれば、いいなぁ。 再帰下降でちょちょって書いたパーサなら各文法の関数呼び出し部分を 関数ポインタを介して呼び出すようにしておいて、フックできたら、似たようなことできるかなぁ。
あれの動的文法生成インターフェイス、動的解釈テーブル構築エンジンって 他の言語にも使いまわせないのかねぇw
644 :
633 :2007/04/22(日) 22:41:28
>>635 勘違いでしたか。すまん。
>>612 とLispのリードマクロがどうも頭の中で結びつかなくて、
変な妄想がはいったみたい。
>>641 お前はいつこのスレでレベルの高さ感じたんだよ。
いってみろ。そうしたら節穴はお前だってことがはっきりするんで。
647 :
626 :2007/04/22(日) 22:44:02
648 :
626 :2007/04/22(日) 22:45:28
>>646 節穴なんですね。。。どうして?節穴なのでしょうか?
理想:comp.lang.compilers 現実:fj.news.usage
646は口が節穴なので、テキトーな口からでまかせが出るだけです。
とりあえず、俺自身の話はおいといて。 このスレにはパーサジェネレータ自分で書くレベルの人と、 なんかForth自慢やLisp知識自慢で満足しちゃえる程度のレベルの人が 混在している事が判った。 おもしろいよキミ達
652 :
デフォルトの名無しさん :2007/04/22(日) 22:48:37
すずきぃ、おまえやっぱレベル低いわ
スレのレベルが低いのはここにいる全員の責任だ。 みんな、共に精進していこうじゃないか。
レベルの高い人がタマにしか来なくて、 あとは貧民階級ばっかの気がする。(って変なの1人くらいか)
655 :
デフォルトの名無しさん :2007/04/22(日) 22:51:39
>>651 名言。いや、判っててネタ振りしてるのかと思ってたよ今まで
>>643 そうだね。とりあえずアレが一番の手がかりだ。
早速なかを確認してみるよ
LLパーサのカスタマイズ方法すら判らなかったとは傑作だな。 ソース読めてないんじゃないか、と。
LLはN.Worthのデータ+アルゴリズム・・・のPL/0で学んで、 その後は惰性で書けるようになるのがデフォだ ・・・ってboost::spiritの中の人もそれっぽい事ゆってたw
何でこんな荒れているんかね?騙りも出て来たし。これだからIDの無い板は…… GW前なのに5月病かね? >632 だから文法を弄りたいんだって。 >634 ちょ、オマ……。オートマトンを書き換えるのと手間変わらないんじゃない? >658 オートマトン組むLL perser generatorてC++であったっけ? 具体例は? >633 >「動的パーザ」って一般的な言葉なのかな…? いいや。そもそも見たことないから質問している訳で…… >defmacro defmacroは“ソースはS式”という前提があるけど、ここではそういう制限も無しにしたい、と いうのが背景にあります。 >LispにしろForthにしろ、もともとの文法が単純だから制御構造の拡張なども出来るんだと思う。 まあね。ただ、俺言語の文法&挙動定義も俺言語から指定できたらなぁ、と思って。 カスタマイズだけでもできるようになると面白いよね。 >642 そうそう、そんな感じ。 最初はForthみたいな文法だけど、その内(文法を上書きして)CなりRubyなりLispなりに 文法が変わっていく感じで。 >644 >635は荒しだから気にすんな。 Lispのリードマクロ = (S式じゃなくて)ソースを解釈する というイメージですな。
661 :
626 :2007/04/22(日) 23:31:40
どうせ、ワタシャ貧困層の馬鹿ですよ。うえーん(;_;)
LLにせよLRにせよ、与えられた文法規則からLookaheadを計算することによって 解析アルゴリズムの導出が可能になるわけで、動的に文法が変わったらLookahead計算し直し、 あるいはPackratやSyntactic Predicate等、任意長の先読みができるように最初からしておくとかしか無いわな。
>>660 って、もしかしてblogにASTの事書いてた人かな。
664 :
612 :2007/04/22(日) 23:40:07
>662 簡単にするんだったら ・受理状態じゃないと文法書き換え不可 ・その時のLookaheadはステ あたりかな?
665 :
612 :2007/04/22(日) 23:42:00
>663 違う、違う。誰と間違えているのか知らないけど、おいらじゃないよ。
あやしい…
>>660 >>662 お、なんか核心突けそうな人が来たー
>>660 >>634 否定して、
>>642 持ち上げるって事は、
「Forthライクになんとかしたい」って結論で固まってるのかな。
意図が判らない。
あと、
>>612 を読んで
caperの「動的文法生成インターフェイス、動的解釈テーブル構築エンジン」
ってのを改造できればいいのかな?と考えた。
なんか意図がつかみにくいスレだな
(プッシュダウン)オートマトンだから Forthマンセーって所か。 LALRパーサならプッシュダウンオートマトン使ってなかったっけ? (すげぇ不安になってきた・・・)
669 :
612 :2007/04/22(日) 23:49:46
>662 ……良く考えたら、そんな簡単な話じゃないな。 少なくとも、最上位のルールが受理状態でないとダメですな──うわ、かなり限定的だなぁ Lookaheadを捨てるだけでも何とかなりそうな気がするけど、どういう挙動になるか判らない……
670 :
635 :2007/04/22(日) 23:57:43
>>660 騙るつもりはなかったんだが、
スレ番読み間違えたようだ
その件はスマン。他には騙りなどしていないよーん
>>668 PDA(Push-down automaton)はただの概念上の、入力テープ上を逆戻りできなくて、テープを書き換えることもできないけど、スタックのついたチューリング機械。
LLはPDAのLeftmost derivationの順方向を、LRはPDAのRightmost derivationの逆方向をそれぞれシミュレートするアルゴリズム。
LALRはLRの改良版。
>>669 文法を途中で書き換えるっていうんじゃ、その度に構文解析表なりなんなりをまるごと構築しなおさないと。
少なくともPDAってのは静的な生成規則に基づいた機械だから、別の方法を使うなら、もはやPDAではないものになるんじゃないかと。
つーか、受理状態のときのみどうのこうのってのは、あんま意味がわからんが、いわゆるトップレベルでのみ文法操作が可能ってこと?
これって一種のリフレクションとも言えるよね。 オブジェクトレベル(解釈されるもの)であるソース文字列がメタレベル(解釈するもの)であるパーサの 解釈の仕方を動的に変更するという点で。 こういうシステムを作るときは、オブジェクトとメタの切り分けと、メタへのインタフェースをきっちり定義しないと ドツボにはまるだけ。 問題は、まだ構文木にもなっていない解析前の文字列が、パーサを変更できるほどの表現力を持てるかどうかだ。
673 :
668 :2007/04/23(月) 00:04:46
うん、それは判ってる(はず(汗))
あなたが仰るとおり、
>>669 が何故PDAに拘るのか、
それがよく判らないだけだ(はず(汗))
うーん、言語処理系に対するイメージってのは
人それぞれなんだなぁ。もっと人の発言を大切にしなきゃ(荒しは除外)
>>672 リードマクロ関数の書き換え程度の小さな文法変更ならともかく、
大規模な文法変更ってのは、あんま段階的にやるような類の話じゃないんじゃないかな。
カエルの変態じゃあるまいし。
コンパイラの世代みたいな感じで、
最初は核(つーか初期値)となるパーサで文法変更関数読んで、
構文木かVMコード内部に溜め込んで、
その関数実行したらどーんと文法変わるという
サナギ方式が使いやすいとオモタ
>>671 > PDA(Push-down automaton)はただの概念上の、入力テープ上を逆戻りできなくて、
> テープを書き換えることもできないけど、スタックのついたチューリング機械。
逆戻りも書き換えもできるだろ。
676 :
612 :2007/04/23(月) 00:27:33
>667
>>634 否定して、
>>642 持ち上げるって事は、
いや、否定してないよ。LLぐらいはサポートしたいから、最後の手段としては考えているけど……
>caperの「動的文法生成インターフェイス、動的解釈テーブル構築エンジン」
今から作るとしたら、caperをベースにするのが分かり易そうですな。
caperカスタマイズしてPDA吐き出すようにして、ルール変わるたんびに再構築
といった感じかな……さすがに遅そう……
それとも複数文法持てるようにして、切り替え命令で文法を切り替えるようにするとか。
>674の指摘している方法もいいね。
677 :
612 :2007/04/23(月) 00:29:27
>671 その度に構文解析表なりなんなりをまるごと構築しなおさないと。 やっぱりそうだよな……既にあるオートマトンにくっ付けるだけじゃダメそうだよね…… >もはやPDAではないもの PDAを元にオートマトンを書き換えるのならば、それはもうTMだよね。 ちなみに、PDAはTMじゃ無いよ。TM相当は2スタックマシンね。 >受理状態のときのみどうのこう 受理していない場合は受理しない可能性が残っているから、受理していない情報を元に オートマトンを組み換えるのは不味いよね。 決定性PDAなら単にエラーになるだけだけど、非決定性PDAだと他の受理状態の可能性が あるからね(バックトレースが発生して書き換え自体がキャンセルされる) >672 >ドツボにはまるだけ それはそうだね。ただ、趣味の俺言語なんで、馬鹿みたいな柔軟性を用意してみようかと…… >パーサを変更できるほどの表現力を持てるかどうかだ。 ここはForthみたいにImmediate属性を導入するという手もあるね。 そもそもコアの部分はソースを読み込む前に使用可能になっているから、そこから 組み上げていくのが良さそう。 >675 逆戻りも書き換えもできるだろ。 できないよ。できるとしたらTMか2スタックマシンのどっちかだね。 じゃ、そろそろ寝ます ノシ
>>675 堂々と嘘つくでねぇ。
思わず本棚から言語理論の本引っ張り出してきちまったよ。
679 :
675 :2007/04/23(月) 00:42:51
あいすんませんね 後でチェックし直しときます
動的な文法とやらを文脈依存文法で定義してみたらどうだろう?とか言ってみたりして
681 :
680 :2007/04/23(月) 01:14:39
と思ったけど、構文解析がPSPACE完全になっちまうか なんか制限つけたら軽くなるのかな?
なんかGW中の勉強にとLLパーサ(BNF?)自前で作りたいんだけど 何かいい課題になる題材ないでしょうか?
LISP最強
Lispパーサなんか作ってもたいした勉強にならんだろ
スレのレベルが急速に低下しました・・・
「このスレは一度たりともレベルが高くなったことがない」 とか思ってる人が暴れてるだけだろ スルーしておけ
人の所為にすんなボケw
しょうがないよ、現実を歪めてまで お前のせいではないと主張する理由が無いものw
↑全部こいつの妄想か。
孤軍奮闘w
692 :
626 :2007/04/24(火) 22:01:04
なんかしらんけど、俺が言いたかったのはこういうことでした。
var exp = function() {
var m;
if(m=str.match(/^[0-9]+/)) {
str = str.substring(m[0].length);
return m[0];
}
throw "error";
};
parse("1+2");
で1が戻るようなもので
var fact = exp;
exp = function() {
var c = fact(); var m;
while(m = str.match(/^\+/)|| m =str.match(/^\-/)) {
str = str.substring(m[0].length);
c = [m[0],c,fact()];
}
return c;
};
alert(parse("1+2"));
で、["+",1,2]がかえるように出来るというかんじ。
http://f38.aaa.livedoor.jp/~sakurai/cexp/aaa.html 実際動くのはこんな感じ。
何を言いたいの君は? 相変わらず話題とずれてるな
再帰下降パーサがやっと理解できました、 と言うだけの話なら「よく頑張りましたね」って ポジティブな方向に持ってけるんだけど、 おまえの場合スレ荒しまわって「このスレレベル低い」 までほざいた挙句に、いけしゃーしゃーと初心者発言開始するから 嫌われるんだよ。 いい加減にしとけクズ
目の前の人間と仮想敵をごっちゃにして わけのわからない呪文みたいな罵倒する奴増えたなぁ。
まあいいんじゃない?そんな仮想敵にムキにならなくても
このスレの現実は
匿名なら何やってもいいと思っている身元バレバレの性格破綻者も居れば、
このスレのお陰で再帰下降パーサ書けるようになった
>>626 も居るって事。
メデタシメデタシ
なんだ。桜井さんが来てたのか。
「このスレはレベルが低い」って言ってる人は、 本音としては「お前らレベル高すぎるから、もっと優しくしてくれ」と泣き言を言っているだけだろう。 素直にそう言えばいくらでも対処してくれる人が居るだろうに、 いちいち相手を高飛車に叩いて初心者質問を繰り返すから敬遠されるわけだが
どっちかというと、スレのレベルが低くなったとか言うアホが問題。
ねぇMatz、信仰者にもいろいろなタイプが居るんだね。
なんでmatzが出てきたの?
国内でも最高レベルの技術的知名度を持つ信仰者と 人間として最低レベルの信仰者が同じスレに存在する不思議さ それが2ちゃんねる
モデレーターがいて肩書き出す、そういう場でなくて 2ちゃんでなければならぬ理由は 直接民主制への夢を棄てるべきではないから。 2ちゃんでなければ意味がない。
そういう話は別の板でやってくれ。 お前の話はいつもズレズレなんだ
>>703 はっきり言っておまえ統合失調症だろ。
お前の会話や文章の支離滅裂さは
見ていて頭が痛くなる
706 :
612 :2007/04/25(水) 00:11:57
>680 それLBAじゃないと解釈できない……つうか万能TM作っているようなもんじゃない? そもそも有効な記法てあったっけ?
707 :
626 :2007/04/25(水) 01:05:34
>>693 再帰下降の出来上がったパーサを拡張するのに、
こういう風にやったらいいんでないってことの具体例を書いたのだけど。
>>694 ん?「このスレレベル低い」なんていったことないですよ。
凄いレベル高い人達が多くて、いつも怒られてると思ってたんですけど。
ほんとは、caperみたいなものが作れたらいいなぁ思ってるけど
作れないしわからないので、理解できる範囲で書いたのだけども。
匿名掲示板は知らないこと聞くにはありがいですが。
でも、それ以外は辛いことが多いですねぇ。
俺は、躁鬱病で統合失調障かも知れないとこまでいってしまってたり、
統合失調症で苦しんでる人もしってるから、辛い。
まぁ、2ch用語だから、ジョークなんだろうけど。
ちょうどいい、匿名でないコンパイラのこと話せる掲示板ってないのかなぁと
思う今日この頃ですよ。
この違和感はいったい何なんだろう。 例えるなら……そう、一人だけ全然違うこと喋ってるみたいな。
709 :
デフォルトの名無しさん :2007/04/25(水) 01:52:18
荒らしているのが一人だけというのがよくわかった
やったね!
711 :
612 :2007/04/25(水) 02:40:38
>707 再帰の関数をクロージャかオブジェクトにしてプラガプルにするのが王道じゃない? 突き詰めるとboost::spiritのオブジェクト版になると思うけど……
要するに、彼はようやく再帰下降パーサとは何か理解できたって事だ
713 :
626 :2007/04/25(水) 09:39:58
>>711 すでに、そういう概念あるんですね。
プラガプルって言う概念はググっても出てこないのでよくわからないんですけど。
ちゃんと話についていけるようになりたくて、ドラゴンブックみても、わからん。
鬱出し脳な、今日この頃です。笑
714 :
626 :2007/04/25(水) 10:07:14
plug ableってことで、挿入可能みたいなかんじですかね。
またリンク貼るだけのお前か。 何を主張したいのか、簡潔に要約しろ。
とても興味深いね。 ここでやっていたようなお話を Robert Grimm氏がxtc(eXTensible C)として 研究している、という事か。 Rats!に関してはどうよ?
>>716 「ちゃんと書かれていることはわかるけど、まだ自分には理解できない」
ページを持ってきて、自分もまたそのレベルにあるように見せるのはよくあることです。
初歩的な質問ですみません 文法G=(P,S) P={S→(L)|a L→L,S|S} これの終端記号って、”,”も含まれるんですか?
もう一つ 文法G=(P,S) P={S→AB A→aAb|b B→bBc|ε } の言語はどんなものか。 という問題なんですが、どう答えたらいいんでしょうか・・・問題の意味がよく分かりません
>>722 文字abcがどんな風にならんだ文法か、ってことじゃないかな…
ヒントだしすぎ?
言われてみれば、実に微妙な表現だなぁ……w
ごめんあんまり見てなかった。 動的なルールだけど、 caperは実際に起動時に動的なルール構築を行って 読み込みファイルの文法を定義しているので、 そのソース使いまわせばできるよ。 一応caperとは独立したものとして作ったので、 普通に切り出せると思う(確かlalr.hppとgrammar.hppだけあればよかったような)。 実際の文法定義例はcaper_cpg.[hc]ppのmaker_cpg_parser。 ただ文法定義のインターフェイスが 自分でもよく間違うようなあまりよくないものなので、 ちと工夫しないとまずいかも。 あと内部でSTLバリバリ使ってるので、それも注意。
>>723 つまりこの問題だと
a,b,cがこの順に複数個ずつ並んだ文 って感じでいいんですかね・・・
言語はどんなものってどういう問題なんだ(´・ω・`)
>>726 > 言語はどんなものってどういう問題なんだ(´・ω・`)
求められているのは、文法表記からどのような文法になってるのかを
読み取る能力。
この問題だと単に文字abcの並びでしかないが、このabcが
また別の文法ルールだとしたらどうだろう?
そしてその文法ルールには、さらに別の文法ルールが…
ってな感じでどんどん複雑な文法に接するようになると思うけど
今はまだはじめたばかりだろうから、焦らずじっくり取り組むといいと思う。
728 :
727 :2007/04/25(水) 23:30:40
追記。 最初から、if文や算術演算なんかの文法を教えるよりも 文字の並びという単純なところから教えるほうが 「if文とはなにか」「+-*/の演算の意味」なんかを 教えなくてもいいという利点があるのかな。たぶん。 すでになんらかの言語でプログラムしたことのある人にとっては かえって意味不明に感じるかも知れないけどね…
>>722 >>726 文字aがn回連続して並ぶというのをa^nと仮に表記するとして、
a^m b^(m + n + 1) c^n (m >= 0, n>= 0)
という条件を満たす言語。a,b,cが順に複数個並んだ文、だけだと条件が
不足してる
packrat parsingってLALR(1)と具体訂にどんな違いがあるの?
>>727 焦らずじっくりだと間に合わなかったりしてw
733 :
デフォルトの名無しさん :2007/04/26(木) 16:51:03
だいぶ今更な記事だな...
パーサー書くときのコーディングのテクニックが掲載された書籍は存在するのでしょうか。
今年ってコンパイラに関係する本って出版される予定ないんだな...
737 :
デフォルトの名無しさん :2007/04/27(金) 09:49:51
C/C++のプリプロセッサの構文やマクロ展開アルゴリズムが載ったページや本とかないでしょうか? あとVCとGCCで使えるマクロの違いが分かるものも探しています。 たとえば、↓のマクロはGCCでは使えて、VCでは使えません。 #define MSG(format, param...) printf(format, param); こんなのが分かるものを探しています。
Cのプリプロセッサ作りたいなら、このスレでもいいのでは? コーディングのテクニック載ってる本あったら買うだろうなぁ。
誰かの自作自演が始まると、 ガクッとレベルが低下するな このスレ
同意
まったくだ
仰る通り
>740はいつも正しいな
746 :
デフォルトの名無しさん :2007/04/27(金) 21:36:53
プリプロセッサのプログラミング解説と言えばカーニハンが書いた有名な本があるだろ…
747 :
745 :2007/04/27(金) 22:44:51
×マクロプロセッサ ○プリプロセッサ www
750 :
737 :2007/04/27(金) 23:30:10
いろいろと情報ありがとうございます。
C言語の仕様に則したプリプロセッサを作ろうと考えているのですが、
738のPredefined macroとかを見てると完全準拠は難しそうですね・・・
とりあえずたくさんのソースをパースしてみて
1つ1つクリアしていこうかと思います。
>>746 カーニハンの名著って「プログラミング言語C」でしょうか?
同じカーニハンの「プログラミング作法」では関数マクロは使うなみたいなことが
書いてあるらしい(Amazonより)のでプリプロセッサが嫌いなのかと思いました。
>>750 > 同じカーニハンの「プログラミング作法」では関数マクロは使うなみたいなことが
> 書いてあるらしい(Amazonより)のでプリプロセッサが嫌いなのかと思いました。
「プログラミング作法」のほうだと思う。
ただし、「プログラミング作法」に載ってるのはFortran用の
プリプロセッサーの話。
Cのプリプロセッサーではないので注意。
752 :
745 :2007/04/28(土) 01:00:12
753 :
612 :2007/04/28(土) 01:41:25
自己フォロー。 boost::spirit v1.8 にstored_parserなんていうのがありました。 正しく求めていたのですな。こんなことができました。ソースコードベタはり #include <iostream> #include <conio.h> #include <boost/spirit.hpp> #include <boost/spirit/dynamic.hpp> #include "main.hpp" using namespace boost::spirit; template<typename ScannerT> class TSetToken { public: TSetToken(boost::spirit::stored_rule<ScannerT>& target) : target_(target) {} void operator()(const char* begin, const char* end) const { target_ = target_.copy() | str_p(begin, end) ; }; private: boost::spirit::stored_rule<ScannerT>& target_; };
おっと、誤)stored_parser 正)stored_ruleですな。 struct TProgramGrammar : public grammar<TProgramGrammar> { template <typename ScannerT> struct definition { boost::spirit::stored_rule<ScannerT> program, block; definition(TProgramGrammar const& self) { program = +block ; block = '(' >> (+alpha_p)[TSetToken<ScannerT>(block)] >> ')' ; }; const stored_rule<ScannerT>& start() const { return program; } }; }; int main() { { TProgramGrammar p; std::cout << parse("a", p, space_p).full << std::endl; // false } { TProgramGrammar p; std::cout << parse("(a) a", p, space_p).full << std::endl; // true } std::cout << "Press any key" << std::endl; getchar(); return 0; }
>>736 Rubyの青木さんが「ふつうのコンパイラ」という本を昨年から書いているらしいよ
進捗はどうなってるのか知らんが
ドラゴンブックで十分
757 :
746 :2007/04/28(土) 06:55:39
答が判ってない癖に自作自演する奴が いつもスレを滅茶苦茶にするのだと思う
答えはわかってるが、素人に説明するのが面倒くさい
結論:プリプロセッサの作成方法が載っているカーニハンが書いた本は「ソフトウェアツール」。
>>737 趣味でCプリプロセッサを書いたことがあるが、規格を読みながらそのまま
実装していけば問題はないと思う。唯一迷うところがあるとすれば、マクロ展開によって
生成されたトークン列をどう扱うかの問題だけど、これは
「後続のトークン列の前に割り込ませる」(つまり入力ストリームに押し戻す)方法が
一番楽だと思う。(むしろ、この方法でないと正しい挙動をさせるのが難しい)
それから、標準準拠を目指すなら、
http://mcpp.sourceforge.net/index-jp.html mcpp -- a portable C preprocessor
に付属しているテストケースが非常に便利。
> 生成されたトークン列をどう扱うかの問題だけど、これは > 「後続のトークン列の前に割り込ませる」(つまり入力ストリームに押し戻す)方法が > 一番楽だと思う。(むしろ、この方法でないと正しい挙動をさせるのが難しい) 要するにそれって、プリプロセッサ処理を、言語本体の構文解析と同時にやるって話に聞こえますね
脳内なんじゃないの
764 :
763 :2007/04/28(土) 08:18:50
というかマクロの多重展開の話か
765 :
761 :2007/04/28(土) 08:24:28
>>762 なんでそうなるか良く分からん。単体として動作するプリプロセッサの話をしていたつもりだったんだが。
>>764 そう。特に、
#define A B(
#define B(x) [x]
A 4) /* => [4] */
みたいな変則的なマクロを処理するときに困らない。
俺はマクローリン展開ならできるぞ
NFAとかDNFをちょっと正しいか検証したいときってみんなどうしてますか?
つ 「大量のテスト」 適当なテストサンプルってあったっけ?
はぁ?状態遷移が決定的か非決定的か、なんて 文法見りゃ判るじゃん。
さあ、いつもの早合点くんが来ました
>767 そういや、DFAの間違いだよな >DNF
DFAの間違いなのかBNFの間違いなのか10分ほど悩んだ
オートマトンじゃないじゃない >BNF
BNFといえば逆張り
>>767 Emacs の re-builder とか。
テスト対象(ソースコード等)のバッファで ESC x re-builder RET
正規表現を書き込むと、逐次的にマッチする文字列がハイライトされる。
左隅解析ってなんすか?
777 :
デフォルトの名無しさん :2007/04/30(月) 14:37:47
boostでxbyakみたいなのありませんかね
状態遷移図をドローするツールって何かよさげなのないですか?
>>778 graphvizに同梱されてるツールの適当なやつでどうよ
もしかして,手描き?
アセンブラ? 環境依存はBoostの範疇外じゃね?
>>779 graphvizにそんなツールがあったのか。毎回めんでーなーふぅ
とか思いつつ、スクリプトでカタカタ書いてたよ。
スクリプトで書けるなら、そのスクリプトを生成するスクリプトを書けばいいじゃんと思った。
そろそろ構文解析専用スレたててもよさげ。
いらない。人いないのにスレ分けてどうするよ。
人はこの板にしては十分いるんじゃないの。 ・質問のほとんどは構文解析かそれ以前 ・よく荒れる 分離したらスレはもっとまったり穏やかに進むのではないかと思う。 ただいかんせんこのスレの名前が厨房ホイホイのようなものなので 逆にバックエンドを分離した方が幸せになるんじゃない。
>>786 そうは思わない。
=== 終了 ===
何が終了したのかわからないが
>>787 の2ch依存の件であろうか
ならばめでたい
789 :
デフォルトの名無しさん :2007/05/02(水) 13:23:34
ここに俺の亀頭落ちてなかった? おかしいなー、昨日買い換えたばっかりなのに・・・
>>788 要するに786が馬鹿すぎるから
この話はもうやめようねってことでしょうね(^_^;
791 :
612 :2007/05/02(水) 21:04:47
>>791 がんばって作らなくていいから設計書あげてくれない?
たぶんそのほうがいいもの湧いてくるよ
>>792 みもふたもないクレクレくんだとおもった
>792 いや……普通にPDA作っているだけだけど……。 イプシロンをバックトラッキングで実装しているので、機械越しに成功/失敗のパラメータを 渡しているけど、大した話じゃないよ。 実質250行ぐらいしかないんだから読め。 しょせんプロトタイプだし、設計書なんて作る方がタルいわ。
ふと思ったんだが、PDA知らないなんてこと無いよな? >792
自慢じゃないがしらないっすよ 俺GW坊とかいうレベルじゃねーほどDQN出汁 俺にもわかりやすーく教えてくれよなぁなぁ?褒めれば延びる子なんだぜ
段階を踏んでステップアップしてきなはれ
継続の注入は闘魂注入とどう違うんだ?
>>791 それくらい解かるもんブゥッゥゥ
カーソル型のAPIでパースしたいから継続使って状態をオブジェクト化するって
ことだよね?SAXのパーサとかそんな感じだよね。
>800 いや、boost::spiritだとパーザが継続待っている状態に夏ちまうんだけど、それだと俺言語の継続を 実装する上で色々と都合が悪いんだよね。なんで、プルパーザ化してステップ実行するようにしています。 SAXってイベント駆動じゃなかったっけ? StAXつうのがプルパーザみたい。
>>786 >・質問のほとんどは構文解析かそれ以前
ツリー作った後なんてほとんど問題なんておきないじゃん
C++の構文解析がむずかしいでぅ
>>803 具体的にどんな構文でつまってるのか書いてみたら?
生垣FSMって普通のFSMとどのように違うのですか?
あのー継続をCかC++で実装してみたいのですがぁ 参向になるソースなど知りませんでしょうか?
>>809 libcontなんか変なasmで書かれていてキモイのですが...
おまいら化粧水何使ってる?
愛液
エストのコンディショニングローションIII。 十分潤って、自分の肌には合ってるみたい。
815 :
812 :2007/05/04(金) 00:49:48
誤爆でした
ム板に女が居るということか?
居て悪いか
Continuation based C: C言語とアセンブラの中間に位置するプログラム言語。
C 言語との互換性を持つ 1pathのtiny compilerです。
現在は、i386, PowerPC, MIPS, ARM 用の出力を出します。
科学技術振興機構「機能と構成」のプロジェクトの一部でした。
http://sourceforge.jp/projects/cbc/
>>818 「スタック不要になるけど、GCが必須」という説明に吹いた覚えがある
>>818 中に人に聞こえないぐらいの距離(50m)ぐらいで
デラワロスって指さして笑ったことある。
821 :
612 :2007/05/05(土) 00:41:22
まいど。 結局、状態のコピーに対応するため>791を作り直しました。 ……どうも車輪の再発明している気がしてならんな。 どっかに途中経過をコピー可能/オートマトンを再構築可能なプルパーザ無いのかしらん……
つ「手書きパーサ」
やってられっか〜〜〜 >822 第一俺言語から弄れないだろ……
>>823 あんたに、何か新しいソフトウェアを作る資質は無い。
自分に使いやすい車輪は自分で作るしかないべさ 都合のいい車輪がそうそう転がってるわけがない
一方>827はホバークラフトを作った
827 :
デフォルトの名無しさん :2007/05/05(土) 12:05:32
え、オレ?(´д`;)
じゃあ俺ファイアースティングレイね。
わたし歩く
質疑応答が自作自演ぽく自己完結しちゃうから 一体何をやりたくて悩んでいるのか謎。 バックトラックが必要な文法を 再帰下降パーサで無理矢理処理しようとするから 継続が必要とか無茶な話になってるのとちゃうか?
継続ベースのスクリプト言語で、 文法を動的に変更可能にしたい ↓ pull parserが必要 って事か?
832 :
612 :2007/05/05(土) 16:36:07
その通り。 >831 他になんか良い実現方法ある?
一体何をしたくてboost::spiritをいじっているのか、 なんでpull parserが必要と結論したのか、 全く以って意味不明。 パーサの状態を記録/復元可能にしたいなら、 再帰下降ではなく、状態管理可能な状態遷移マシンを用意して その上で入力、遷移状態、出力を記録してけばいいだけだろ。
>>833 同意、
いずれにせよ、自動的なエラーリカバリーを入れないのであれば
ここで大騒ぎするほどのプログラムでもないと思うけどね。
835 :
612 :2007/05/05(土) 21:15:50
>833 欲しいのは>821で、理由は>831ですな。 boost::spiritはセマンティックアクションを実行するときにパーザが継続を待っている状態に なっちゃうので、パース俺言語の処理を中心にしようとすると何かと不便です。 #場合によってはパース途中で強制的に終了することもあるけれど、spiritでは対応できません >状態管理可能な状態遷移マシンを〜〜 そういうプルパーザのコンパイラコンパイラライブラリあるなら是非とも紹介してクレクレ。 >791みたいなクソ面倒臭いのを作り込まなくて済むんだったら助かるよ。
836 :
612 :2007/05/05(土) 21:17:51
うお、編集ミスった……失礼。 ×パース 俺言語の処理を中心にしようとすると何かと不便です。 ○パースではなく俺言語の処理を中心にしようとすると何かと不便です。
とりあえず説明する気がないのはよく判ったから スルーさせてもらうわ。
ええええ??そんなに判らん? >831あたりは判っていそうだけどな。 継続とかの概念が判っていればすぐ理解できそうな気がするけど…… スルーもいいけど、せっかくだからなんかパーザ作成ライブラリを紹介してくれよ。
相手したら後付の条件が山ほど出てきそうだな
ん?ライブラリの条件? >791みたいなやつで、もっと実績とか機能とかがあるやつだけど。 #設計がマトモなら言う事ない。 ・パース途中の経過をコピー可能 ・パース途中で文法を変更可能 (オートマトンのグラフを変更するとか) ・プルパーザ ・C or C++ ですな。
>>840 そこまでわかってて見つからないなら無いってこった。
自分でパーサ組め、って結論
>841-842 結局そこか! ギャース!!
844 :
デフォルトの名無しさん :2007/05/13(日) 17:22:44
「ふつうのコンパイラ」が出るらしいですね。 Javaで、C似な言語をつくるんだそうで、対象プラットフォームは、Linuxの予定らしい 俺みたいな万年初心者でも、コンパイラが作れるようになるんだろうか
>>844 普通にコードが書けるならドラゴン本とか読むだけで十分事足りるハズだよ。
もしも量が多くて読むのが苦痛って話ならどの本読んでもあんまり変わらない。
まじめな話どうして万年初心者などと言う単語を使うのかさっぱりわからん。
846 :
デフォルトの名無しさん :2007/05/13(日) 17:50:09
848 :
デフォルトの名無しさん :2007/05/13(日) 18:14:27
>>847 なんつーか、理論ばっかだったという記憶
むかーし高校時分に読んで、放り投げた覚えがある
そんな俺には、コンパイラ制作は夢なんです。
昔あきらめたことでも、今やろうとするとできるってことって良くあるよね
1つ1つ手順を追って、理詰めでやるんだ。
理論知らずに、直感的にMLコンパイラ作ってた大学時代 なぜ俺は作れたのか
>>852 車輪の再発明しながら進んだか、理屈を学習しながら進んだんだろ。
どっちもゴールは一緒だが達成感は前者の方がありそうだな、再発明だってしらなければ楽しくてしょうがないだろうし。
知っても値打ちはほとんどなかった罠
ぶっひゃあ
理論を知るのはいいことだろうけど実際には役に立たないからな。 日進月歩の技術革新の前には、覚えるより買うほうが早い。
そうだな。 買った方がいいんだろ。 だから労働者も消費物。 買われる奴隷なんだろな
勉強用にForthて良いと思うんだけど、どうかね?
考えるより作るほうが早く終わる、そんな言語
Forthは字句解析も構文解析も簡単すぎて、ある意味、勉強にならない。 でもVM系の言語つくるなら、多少はその面で役に立つ。 つぎはLispをつくって抽象構文木のいじり方を覚える。 と、言語の階層を昇っていけば、いつか、自分の言語を作れるようになるかもしれないし、 ならないかもしれない。 この方法の落とし穴は、多くの人が「Lisp最強じゃね?」 と、気付いて自分の言語をつくるのをやめてしまう点にある。
Lisp最強って否定はしないけど、 個人的にはLispで大規模なものは作りたくない^^
MLのアセンブラだからな 「LISP最強」は「アセンブラ最強」って言ってるのと同じだ
アセンブラ最強!
バックトラックありの再帰降下パーサは指数時間かかるけど、実用にならないほど遅い? 普通の文法なら、実際のところそれほど深いバックトラックはされない気がするんだけど。
GCC4も手書きの再帰下降パーサだそうだし、もんだいないんじゃない?
普通の文法でも、バックトラックをまったく気にしないで書いて、 バックトラックしまくりになると、やっぱりめちゃくちゃ遅くなるよ。 適当にバックトラックがなるべく起こらないようにすると瞬時に終わるようになった。
よし、ちょっくらForth83のインタプリタ作ってくる。
関係ない話題で申し訳ないけど、今日好きな子の名前を下の名前で呼んで良い許可が出た 明日から下の名前で呼ぶことになるけど、口を開くたびにドキドキしそう なんかアドバイスください
あらかじめしゃべる言葉をコンパイルしておけ
何かがNGワードにひっかかってるな どーでもいいけど
>>864 よっぽど変な文法にしない限り、実用にならない程遅いってことは無い
http://home.swipnet.se/redz/roman/pubs.htm にある
Parsing Expression Grammar as a primitive recursive-descent parser with backtracking
という論文では、実際にバックトラックありのただの再帰下降構文解析でJava 5のパーザを
書いてみたら、実用的な速度(おおむね線形時間)になったという事が紹介されている
Java5の構文の振舞いが元々良いから速い、と読めたけど 変な文法が具体的になんなのか知りたい
>>866 必要な所だけバックトラックするなら十分実用的なんだね。thx.
>>871 これって lexer も含めてパーザに突っ込んでるの?
単純な再帰降下パーザがそんな力業に耐えられるとは知らんかった。
ただ、正しい入力が与えられたときにほぼ線形時間なのは、個人的には
当たり前だと思うんだよな。
バックトラックが問題になるのって、構文解析に失敗するような入力が
来たときだと思うので、その辺が気になる。
PEGはstatelessなのが残念。 状態(文脈依存情報、Cの場合ならsymbol table)を持てるparser combinatorって ないかな。
解析結果と状態のペアをmemoizeして、次に呼び出された時に状態が新しくなっていたら再解析する、 みたいなやり方をすればstatefulにできるかな。 当然必要な再計算コストは避けられないし、メモリ使用量が輪をかけて増えるがな。
PEG っつーのは BNF に ! と & が増えた奴、と思っていいの?
BNFの | に相当する / の順番に意味がある点も違う。例えば、BNFにおいて、 A ::= B | C; は A::= C | B; は同じ意味だが、PEGにおいて A = B / C; は A = C / B; は異なる。
878 :
612 :2007/05/19(土) 22:44:52
PEGて、/のお陰で再帰下降で素直に組めるな。 結局 >791もPEGになった。再帰下降じゃなくてスタックだけど。 >873 >バックトラックが問題になるのって、構文解析に失敗するような入力が そこは文法次第だと思う。そのあたりは従来型正規表現エンジンなんかと同じですな。 逆に、正しい入力が与えられてもバックトラックがたくさん発生して遅くなることもあるしね。
879 :
612 :2007/05/20(日) 14:18:37
881 :
612 :2007/05/20(日) 17:21:57
ちょこっと。 おいらはそれをForth + プロトタイプ でやろうとしている。 ただ、構文解析 --> 実行のところの意味が上手く整理できないんだよな…… ForthみたいにImmediatelyeを導入するのもスマートじゃないし。
うお、typoった。 Immediatelye --> Immediate
883 :
デフォルトの名無しさん :2007/05/20(日) 18:18:38
>>880 smalltalkみたいなpepsiがあって、shemeみたいなcokeがある、と。
cokeは文法が定義できるのが特徴?
pepsiがC言語関数が呼べるsmalltalk?
884 :
デフォルトの名無しさん :2007/05/25(金) 19:56:39
中学生とか嘘くせえけど
暇と情熱と勢いでなんとかしちゃう中学生ってたまにいるよ BASICでcoffを吐くクロスコンパイラ作っちゃった中学生だっている 俺の弟のことだけど まぁどうでもいいか
>なでしこ以外にも、他の言語を心得ており、HTMLがなでしこの次に得意であり、Perlが第3位(かも)。ベクターにも多彩な作品を残している。 しかし、ここはモロ中学生でほほえましいな。 他の言語を心得ていると豪語して、それがHTMLってのは衝撃的発言。 「ベクターにも多彩な作品を残している。」他人事かよ!
>作文がど苦手 だめじゃんw
889 :
デフォルトの名無しさん :2007/05/26(土) 13:27:37
ワロタ 微笑ましくてよいな
おちんちんおっきした ショタの才能あるのかな
892 :
デフォルトの名無しさん :2007/05/26(土) 15:26:26
全員まとめてこいよ。 ボコボコにしてやんよ。 ∧_∧ ( ・ω・)=つ≡つ (っ ≡つ=つ ./ ) ババババ ( / ̄∪
>>892 坊主、もうちょっと上からたたいてくれんか、最近肩がこっていかんのじゃ
>>893 チ○コアタック!
∧_∧
( ・ω・)
( ) ババババ
./ =つ≡つ
( / ̄∪
おや、こんなところにウィニーが
896 :
デフォルトの名無しさん :2007/05/26(土) 20:03:35
C言語を学び始めようと思ってるんですが Vistaで動作するコンパイラって何かありますか?
VC2005EXPRESSION
ちょっと聞きたいのですが 生垣オートマトンってどのようなオートマトンを指すのでしょうか? 性質がいまいちどのようなものを意味するのか理解できません。
生け垣オートマトンだとRelax系の論文とか文章あたればいいんじゃないのか? Relaxなら日本発だから日本語の文献あるじゃろ?
「文法構造」じゃ無いな……「文書構造」だな。
コンパイラが吐くコードってコンパイラや言語ごとに特徴が出るのかなあ・・・
まったく一緒だったら怖いわ
すべてS式になります
<チラ裏> なんというか色んな人が俺言語作ってるから、他人と被らない名称を考えるだけでも一苦労だなぁ…… </チラ裏>
>>903 十分長いコードがあれば、言語やコンパイラが特定できる。
俺言語なら特定不可能 デバッグ不可な偽装コードも入れちゃうよ!
910 :
デフォルトの名無しさん :2007/05/30(水) 17:13:00
IsDelphiみたいなので特定されるということ?
911 :
デフォルトの名無しさん :2007/06/06(水) 06:46:58
ANTLR3でAST操る解かりやすいサンプルってありますか? 公式のだともうちょっと情報欲しいと思ってしまう。
913 :
だれか :2007/06/14(木) 01:07:55
antlr3.0のantのbuild成功する人いる 俺の環境じゃ54行目がおかしいぞこの黄色いエテコウ ってでやがる まじむかつく
日本語でおk
antlr3でASTってどうやって作るの(C言語でね) 情報少なすぎる
>>916 それ大した情報書いてなくて
著者におめーサポート料金ガバガバ入ってるからって
駄本書くんじゃねーよ糞がってメール出しておいた。
返事を今待っている
Graphviz の話題が出たんで質問なんだけど、 Graphviz って Windows で使うと expat や zlib や libpng なんかの dll を呼び出すよね。 しかもソース見るとかなり古いバージョンに依存しているらしい。 すでに自分のプログラム動かすために新しいバージョンの それらの dll が入っているので競合しそうなんだけど、 みんなどうやって回避しているの? これがいわゆる DLL 地獄って奴?
>>918 DLLを入れるってどこに入れてんの?
まさかwindowsフォルダ?
Graphviz の Windows インストーラでインストールすると DLL を含めてバイナリは C:\Program Files\ATT\Graphviz\bin に配置されて、さらに PATH 環境変数にこのディレクトリが 加えられます。
ttp://msdn2.microsoft.com/ja-jp/library/7d83bc18 (VS.80).aspx
> DLLの検索順序
> 1. 実行中のプロセスの実行形式モジュールがあるフォルダ。
> 2. 現在のフォルダ。
> 3. Windows システム フォルダ。このフォルダへのパスは、GetSystemDirectory 関数が取得します。
> 4. Windows ディレクトリ。このフォルダへのパスは、GetWindowsDirectory 関数が取得します。
> 5. 環境変数 PATH 内に記述されたフォルダ。
なので、Graphvizを実行するときはそれと同じフォルダにあるDLLが使われる。
パスを環境変数に登録するのはコマンドラインから使いやすくする、
もしくは他のプログラムからGraphvizを実行できるようにするため。
自前のプログラムでは自前のDLLを別に置いて、PATHやなんかを上手く設定すればおk。
antlr3.0 とC言語でASTパースするサンプル置いてるとこない?
最近 ANTLR が妙に人気だな。どこかで特集か何かされたのか?
Cのサンプルがまともに出力されないAntlr3がそんなに いいのか疑問w ASTのAPIバグバグw そんなAntlr3がいいっていうのはJAVA房だけw
wikipediaによるとANTLRはLL法の構文解析機を生成する そしてヨーロピアンが好む java厨=ヨーロピアン
ヨーロピアン。 ロイヤルミルクティーと生ハムメロンか。
さて、そろそろ左再帰の除去にかかるか。 ロイヤルミルクティーと生ハムメロンで潤いながら。
ANTLR3Cで使う方法教えろ そろそろキレるぞ
+lhacaに脆弱性見つかる
>>930 これぐらいなら解かるのですが...
僕を本当に怒らせたいのですか?
待てばCで利用出来るのがリリースされるんじゃね?って話
きのみじけぇやろうだな。
934 :
デフォルトの名無しさん :2007/07/11(水) 17:17:25
C#で作ったアプリ上で動くスクリプト言語を作りたいのですが、 パーサジェネレータはBison/Flex(C言語 or C++)しか使ったことがありません。 C#で使える手ごろなパーサジェネレータか、 Bison/Flexで作ったパーサをC#のアプリ上で動作させる方法はないでしょうか? (ANTLRは挫折してしまいました。)
レスthxです。 ちょっと見てみたけど使い方がよくわかりませんでした。 (というか情報がほとんどありませんでした。) FlexがUnicode扱えればC++/CLIという手もあるのに・・・
まあ調べる気力のない人がスクリプト言語なんか作ろうとしても 周りが迷惑するだけだし、あなたが挫折したことで世の中が 少し平和になるという意味では正解かもしれないね。 さようなら。
>>936 まあ調べる気力のない人がスクリプト言語なんか作ろうとしても
周りが迷惑するだけだし、あなたが挫折したことで世の中が
少し平和になるという意味では正解かもしれないね。
さようなら。
>>934 > C#で使える手ごろなパーサジェネレータか、
mono用のJay(Java用yaccの一種)なら、C#に対応してたはず…
もし漏れが何かの間違いでユーザになるようなアプリなら、 COM Interop で JScript 使ってほしいのココロ
クレクレ乙
>>936 UNICODEを C++/CLI のライブラリで MBCS に変換して使えばいいんじゃ・・・
まあ調べる気力のない人がスクリプト言語なんか作ろうとしても 周りが迷惑するだけだし、あなたが挫折したことで世の中が 少し平和になるという意味では正解かもしれないね。 さようなら。
まあ調べる気力のない人がスクリプト言語なんか作ろうとしても 周りが迷惑するだけだし、あなたが挫折したことで世の中が 少し平和になるという意味では正解かもしれないね。 さようなら。
946 :
612 :2007/07/22(日) 04:14:18
947 :
デフォルトの名無しさん :2007/07/27(金) 00:53:41
948 :
デフォルトの名無しさん :2007/07/27(金) 16:52:36
パーザってもっと書きやすくならんの? 複数のマークアップ言語やプログラミング言語が混在するファイルのパーザを書きたいんだが、 調べたらあまりにもめんどくさすぎるぞ。
そんなにめんどくさいかなぁ flex+bisonでサクっと書けるっしょ
複数の混在だからflex+bisonは向かないような。 書き易くだと先読みを一杯してくれるのが良いだろう。
javacc で作った構文解析器を jay で書き直しているんですが、 void Foo(String args) : {} {} ↑ これって yacc ではどういう風に書けば良いのですか?
yaccってLALR1じゃなかったっけ? 拡張はあるかも知れんが
簡易言語を作るなら、コンパイラでバイトコード生成とかではなく、 JSPみたいにソースコード生成(してコンパイル)する方が、 ライブラリとかも活用できて楽じゃないかという気がしますが、 どんなものでしょうか?
いいと思うよ。
>>953 そりゃ、あれか?
俺のC言語のソースを入れるとタブを
スペースN(定義ファイルから設定可)に変換したC言語のソースを
出力してくれるプログラムみたいな奴か?
\ │ / / ̄\ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ─( ゚ ∀ ゚ )< ティムティム ティムティム! \_/ \_________ / │ \ ∩ ∧ ∧ / ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄  ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄\∩ ∧ ∧ \( ゚∀゚)< ティムティム ティムティム! ティムティム〜〜! >( ゚∀゚ )/ | / \__________ ________/ | 〈 | | / /\_」 / /\」  ̄ / /  ̄
腐ったマンコみたいな匂いのするマクロか
>>949 複数言語混在する場合は、複数の字句規則を状況によって
切り替える必要があるから、LexerベースのLL(k)およびLALR(k)
は不向き。PEGベースのパーザジェネレータがあればそれを
使うのが良いかも
boost::spiritとかかね。 PEGベースのって、他に何かあったっけ?(C or C++で)
PEGってなんじゃい
自国通貨の交換比率を他国の特定の通貨と連動させること 固定相場制の一種
少しは調べろ。さもなきゃしね。 >960 PEG = Parsing Expression Grammar
>>962 "PEGベース" もしくは "PEG base" でググってみてからモノを言え。
俺単語使うなアホ。さもなきゃしね。
965 :
962 :2007/08/15(水) 01:26:09
お前は誰だ >963。>960じゃねぇだろうな。 >960で聞いているのは一体なんだ? 誰が“PEGベース”の話をしているんだ? ところで次スレどうする?テンプレに追加するのある?
yacc+lexのモデルで複数言語の混在が支障をきたすのは リエントラントでないからであって LL/LRうんぬんは直接関係ないだろ。
>>967 ちょと考えてみればわかるけど、リエントラントかどうかは全然関係無い。
複数の言語が混在するようなプログラミング言語だと、その言語ごとに
字句規則が全然異なる可能性があるでしょ。で、それをcontextによって
切り替えるのがめどいって話。一応、lexだとlexerに状態を持たせて
それを遷移させることができるけど、構文レベルである箇所に来た
ときに字句規則を切り替えると言ったことは書けないし。
複雑に思うのは複雑に考えているからだ
そう
相変わらず古いの? 買った人いますか?
タイガー本には遠く及ばない
そらそうよ
タイガー本って?
☆サ☆ガ☆ッ☆ト☆
アパカッ て何を言わすんだおまえは
>>974 タイガー本って今でも買えたっけ?
少なくともMLあたりはダメだったような気がするけど。
980 :
デフォルトの名無しさん :2007/08/31(金) 13:12:46
質問です 自分である言語(企業秘密)のコンパイラを作ることになったのですが、 皆目見当がつきません。有益なサイトあるいは書籍をご紹介ください。 英文可です。お願いします。
PLがこのザマじゃ示しがつかんのです。お願いします。納期は9月末 です。
>>982 おう、ありがとう。役に立ちそうだ。ありがとう!
PL学園野球強いよね
多分無理だろうな・・・ 一応コメント、コンパイラとバーチャルマシンって本が簡単だと思う。
PLがそんなザマじゃ 俺も無理だと思う
つかコンパイラ書ける人速攻で雇えよ
オープンソースのその秘密の言語用コンパイラをパクればいいんじゃないの?
皆様 おかげさまで何とか機能設計(ポンチ絵)ができました。 何とかなりそうです。YaccとLexのソースを入手したのでパクリます。 ありがとうございました。
パクリますとかアホかwwwww
Yacc や Lex があればコンパイラが書けると思っている人ってまだいるのかな ま、そんな「コンパイラ」もあることはあるけどね
(´-`).。oO( yaccやlexのソースをパクってどうするんだろう・・・ )
ネタもいい加減にしやがれって感じだわな
994 :
デフォルトの名無しさん :2007/09/01(土) 08:56:57
すみません。それがネタではないのです。YaccやLexをパクるってのは 勘違いでこれらはツールですね。 まったくどあほなPL(35歳)メンバ5人のチームです。 FPGAコンパイラだそうです。わけわかめです。 チーム内の人間はだれもコンパイラ設計経験なし。俺だけXMLパーサーを 作ったことがありコンパイラもできるだろうと勝手に上司に思い込まれて てんぱってます。
納期間違えてました。来年の9月末です。 これからもここでいろいろと質問しますので鳥つけます。 よろしくっす!
>>991 じゃあ何があればいいですか?YaccとLexではどうにもならない
領域もあるんですか?
>>995 おまいのトリップunkomanだろwwwwwwwwwwwwwwwwww
やっぱLISP最強
999 :
バカPL ◆2q5jeL6s4M :2007/09/01(土) 09:22:54
>>997 どうしてわかったの?るせーボケ
【祝】
Windows上でYaccやLexをうごかすことに成功しました!
1000 :
バカPL ◆2q5jeL6s4M :2007/09/01(土) 09:23:43
1000GET!
1001 :
1001 :
Over 1000 Thread このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。