形態素解析と日本語処理

このエントリーをはてなブックマークに追加
419デフォルトの名無しさん:2009/12/12(土) 15:47:47
俺は趣味で気になって除いてる
420デフォルトの名無しさん:2009/12/12(土) 16:09:36
専攻はシステムプログラミング系。
自然言語処理は学部の授業で取った。
421デフォルトの名無しさん:2009/12/12(土) 18:10:44
統計解析
422デフォルトの名無しさん:2010/04/10(土) 13:46:49
>>416
今更ではあるけどWinとかで使ってて
辞書の文字コードSHIFT-JISにしてないからじゃないかね。
423デフォルトの名無しさん:2010/04/26(月) 17:33:11
お、このスレ生きてたか。嬉しい
424デフォルトの名無しさん:2010/05/31(月) 12:04:18
自然言語処理スレッド その3
http://pc12.2ch.net/test/read.cgi/tech/1235129481/
425デフォルトの名無しさん:2010/07/07(水) 14:33:28
MeCabを自作アプリに組み込んで配布したいんだけど
libmecab.dllだけをアプリのフォルダにコピーして動かしても動くんだけど
ipdic辞書の場所は環境変数か何かに入ってるのかな?
辞書も一緒にアプリに組み込みたい場合はどうすれば?
426デフォルトの名無しさん:2010/07/07(水) 14:46:41
事故解決
mecab_new2で指定するのね
427デフォルトの名無しさん:2010/07/09(金) 08:04:06
形態素解析したいんだけど
chasenよりmecabを使う人のほうが多い?
428デフォルトの名無しさん:2010/07/09(金) 08:18:39
chasenを選ぶ意味がわかんない
429デフォルトの名無しさん:2010/07/09(金) 21:43:12
mecabはchasenの上級バージョンなんだが
430デフォルトの名無しさん:2010/07/09(金) 22:35:35
そうなのか
普通にmecab使うわ
さんくす
431名無しさん@そうだ選挙に行こう:2010/07/10(土) 08:06:21
いや普通に別のものだろ
432名無しさん@そうだ選挙に行こう:2010/07/10(土) 09:53:09
使用している計算法は別物だが、mecabにあってchasenにも付けられるのにchasenについてない機能がmecabにはある。
433デフォルトの名無しさん:2010/07/14(水) 12:07:21
ある文章中に形容詞+名詞となってるものの個数を数えたいんだけど
mecab使えばすぐできる?
434デフォルトの名無しさん:2010/07/15(木) 01:44:25
mecabでnodeのリストを得る。
nodeには品詞情報としてそれが形容詞であるとか、名詞であるとかいろいろ値が入っているので
それらをチェックして個数を数えればすぐできる。
435デフォルトの名無しさん:2010/07/15(木) 08:50:11
「動詞+ない」とか「動詞+たい」は
形容詞に数えていいのか?
準体助詞の「の」は名詞に入れていいのか?
「最近は梅干のしょっぱいのが売ってない」
の「梅干のしょっぱいの」は「しょっぱい梅干」を
含意するがどうだ?
436デフォルトの名無しさん:2010/07/15(木) 08:54:19
「逢いたいの」の「の」が
準体助詞の「の」ではなくて
強意の終助詞「の」だとかいうのは
文脈追わないとムリなので、
目的が分かると判断しやすい。
437デフォルトの名無しさん:2010/07/20(火) 15:36:17
Natural Language Processing with Pythonってどう?
5月頃に和訳でるって聞いたから待ってたけど、全然来ないから買おうと思うんだが
今までC++ばっかでpythonやってないんだけど、これとは別にpythonを勉強したほうがいいんだろうか
438デフォルトの名無しさん:2010/07/20(火) 15:57:26
>>436
文脈追わなくても使用頻度とマルコフ統計を取れば分かるでしょ
辞書ばりばりの形態素解析なんてもう時代遅れだよ
439デフォルトの名無しさん:2010/07/20(火) 18:02:20
>>438
最尤候補はわかる。
実際にどっちかはわからん。
440デフォルトの名無しさん:2010/07/20(火) 18:11:34
>>438
> もう時代遅れだよ
ジジイじゃあるめぇし、安心したがるなよ。
技術の話ってのは、ややこしくややこしくしてった方が、
最終的に得るものが多いんだぜ?
「燈下探索症候群」っつー言葉もあるわけで、
競合しそうな技術にはそれなりに目配りしとくもんだ。
441デフォルトの名無しさん:2010/07/20(火) 18:27:46
新しい手法を知ると、ちょっとでも古い手法を「時代遅れ」とか言いたがるのはむしろ若い人じゃないかな?

> 競合しそうな技術にはそれなりに目配りしとくもんだ。
これには同意。
たとえば、JUMANの結果のほうが使いやすい場合もある。
442デフォルトの名無しさん:2010/07/20(火) 21:11:46
どんな手法が適切かはアプリケーションの種類に依存する。
全文検索だけが目的なら、マルコフ解析のような統計的手法だけで足りるかもしれないが、
談話理解や日英翻訳が目的なら、辞書による形態要素解析の技術は必須になる。

たぶん>>438は全文検索しか頭の浮かばない人で、若いとか年寄りとかいうよりも、
ちょっと可哀想な人なのだと思われる。
443デフォルトの名無しさん:2010/07/20(火) 21:14:37
>>442
そういうことはまともに翻訳出来る翻訳機を発明してから言ってよw
444デフォルトの名無しさん:2010/07/20(火) 21:29:58
>>442がまともに使える(ゴミを拾わない)全文検索機を発明してくれたら考えとくよ
445デフォルトの名無しさん:2010/07/20(火) 22:36:38
>>441
> 新しい手法を知ると、ちょっとでも古い手法を
> 「時代遅れ」とか言いたがるのはむしろ若い人じゃないかな?
いやすまん、言葉が足りなかった。
若いクセに精神がジジイになっとる奴が、
「時代遅れ」とか言いたがるわけよ。
「昔はよかったが、今はもうダメだ」という
昔を生きてた人間と、
「今はいいが、昔はもうダメだ」という
今を生きてる人間というのは、
同じように精神的にジジイだっちゅーこと。
446デフォルトの名無しさん:2010/09/17(金) 23:34:05
上げる 書き込む
終了
447デフォルトの名無しさん:2010/09/17(金) 23:40:26
それちゃうちゃうちゃう?
いやちゃうちゃうちゃうんちゃう?
448デフォルトの名無しさん:2010/09/18(土) 08:07:21
ちゃうちゃうちゃうちゃうちゃうんちゃう?
449デフォルトの名無しさん:2010/09/18(土) 09:08:04
うらにわにはにわにわにはにわがいる
   __,‐"~~`‐、
 .( (^|:: ● ●|-、
  ヽ]::::.....● ..|^) )
 ....... |::::::.......  [ノ
........... ~‐:::;;:::::‐"
450デフォルトの名無しさん:2010/09/18(土) 09:44:45
それはハニーだw
451デフォルトの名無しさん:2010/09/18(土) 13:30:02
おまえら楽しそうだなw
452デフォルトの名無しさん:2010/10/11(月) 19:11:23
すっごい馬鹿な質問かもしれないけど、
文節が同じなら文節に含まれる形態素列も完全に同じものになるんでしょうか?
453デフォルトの名無しさん:2010/10/11(月) 19:21:32
>>452
完全に同一な文章だよね?なんで違う形態素があると思えるの
454デフォルトの名無しさん:2010/10/11(月) 19:55:15
日本語独特の曖昧な文法とか? 副詞なのか助動詞+助詞なのか、文節は同じだけど分類がわかんねーとか?
……いや、それでも無理があるか。
455デフォルトの名無しさん:2010/11/05(金) 13:46:56
>>452
今更誰も見ていないだろうけど・・・
その前後の文節によって、形態素解析が違ったものになる
ことはありうる。
456天使 ◆uL5esZLBSE :2011/07/06(水) 04:39:52.21
>>455
------------------
<<<<<<<<<<<< 今更誰も見ていないだろうけど・・・ >>>>>>>>>>>>(キリッッキリッッッ!キリ!!!!!!
----
<<<<<<<< その前後の文節によって、形態素解析が違ったものになる >>>>>>>>(キリッッ!!!!キリッッッ!キリッッッ!!!ッッ!!!
--(キリッ!キリッッッ!きリッッ
--
<<<<<<<<<<<<< ことはありうる。 >>>>>>>>>>>>>(キリ!!キリッッ!キリ!!!!キリッッ!!!!!
-------(キリッッ!


放射性廃棄物のほうがマシ
457デフォルトの名無しさん:2011/07/29(金) 21:01:44.01
いまさら人工知能や形態素解析について勉強しようと思ったんだけど
どこも下火な感じなのかね
458デフォルトの名無しさん:2011/07/30(土) 09:10:50.49
研究のブームは過ぎた感もあるけど、たとえば、日本語の過去の膨大な文献を
機械可読にして知識ベース化とかはまだまだこれからだし、やることはあると思うね。
459デフォルトの名無しさん:2011/08/10(水) 20:21:55.63
どなたか記事を解析できる方はいませんか?
東てる美の記事です。http://blog-imgs-16-origin.fc2.com/o/l/d/oldhonn/060911ee.jpg
前張りって一度付けてしまうと、それに慣れてしまうからそれを取って演技
することはちょっと恥ずかしいわネ!・・・・。


460デフォルトの名無しさん:2011/08/10(水) 20:49:27.61
それは画像処理じゃないか?
461デフォルトの名無しさん:2011/11/28(月) 18:50:33.51
人工知能の勉強しようと思ったが資料が全然ないのね
462デフォルトの名無しさん:2011/12/02(金) 22:03:01.66
文章や段落またがった係り受けとかって無理?
大量にデータがあればできんの?
463デフォルトの名無しさん:2011/12/03(土) 15:16:07.93
無理じゃないとは思うけど、基本的に、場所が離ればなれになってる構造ほど扱いにくい
ことは確かね。
464デフォルトの名無しさん:2011/12/13(火) 23:35:16.69
日本語処理ってことはテキストマイニングだと思うんですが、
皆さんはC++、Perl、Python、Rなど言語は何を使っていますか?

また、最近ではどの言語が一番いいのでしょうか?
465デフォルトの名無しさん:2011/12/14(水) 00:11:31.28
Python
466デフォルトの名無しさん:2011/12/14(水) 22:24:05.50
Java
467デフォルトの名無しさん:2011/12/14(水) 22:37:19.82
テキストマイニングをRでってあるけど、Rは流石にオーバー?
468デフォルトの名無しさん
ぜんぶ無料なんだから試してみればいいじゃん
使える引出しが多いといいこともあるよ