【IT/機械学習】精度95%以上! ソースコードは指紋、作者はほぼ特定できる©2ch.net
たしかに癖ってあるし、perlとかは社内の誰が書いたか分かりやすい
66 :
名無しのひみつ@転載は禁止:2015/02/12(木) 11:55:58.14 ID:lM4CxvgH
67 :
名無しのひみつ@転載は禁止:2015/02/12(木) 12:16:20.01 ID:ZBWRr3oE
>>14 あったあったw
そもそもDNAは相関があるんで通常のガウス分布による確率計算は適用不可なのに
いまだにバカがバカをさらしているw
精度ってクロスバリデーション込み?
69 :
名無しのひみつ@転載は禁止:2015/02/12(木) 12:37:40.40 ID:KUaP+4y+
1人の人が全てのソースを記述すれば特定できると思いますが、
実際の開発現場では複数の人が、一つのファイルどころか、
1つの関数、1つのメソッドを編集したりしているので
誰のソースか特定できないと思いますけどね。
>>1 >>当局がハッカーを見つけたり、 オンライン詐欺の犯人を特定したり、という使い方です
この記事を書いた人は素人?
ソースを難読化すれば特定できない。
(ハッカーが難読化のことを知らないわけがない)
70 :
名無しのひみつ@転載は禁止:2015/02/12(木) 12:41:39.21 ID:YbVdJkwQ
>>4 漏らすんじゃない。
自分のだと意図的に痕跡を残したいんだよ。
城を作った大工が…と同じ。
?
WEBは自由、オープンソースっていう文化があるからなぁ。
ガチガチの他業界とは違うんだよ
やべw
コメントに顔文字使うからすぐ特定されるわw
<k>コメントってこんな感じにかくんだっけ?</>
74 :
名無しのひみつ@転載は禁止:2015/02/12(木) 14:19:39.25 ID:R1O7RvYV
バイナリになったらわからないだろ。ハッカーが
ウイルスにソースコード同梱とか考えにくい
75 :
名無しのひみつ@転載は禁止:2015/02/12(木) 14:57:09.47 ID:W6GWA3pn
最近はコーディング規約厳しいからわかりづらいんじゃないかなぁ
76 :
【 ショック・ドクトリン アベノミクス 】 @転載は禁止:2015/02/12(木) 16:24:44.39 ID:wTULGSfE
>>1 過去最大のバラマキ歳出で
借金を増やして、
GPIFを外債外株で溶かして、
議員数削減も行わず、
公務員の給与は増やし、
既得権益解体と称して
日本解体外資への売国を進め、
尖閣諸島を中国に売渡し、
外国人労働者という名で事実上の移民政策、
特定秘密法案、TPP、国家戦略特区、地方分権分断、
外国人だけ消費税全額免税
富裕層優遇、
サラリーマン首切法で非正規拡大、
女性活用という名の
少子化加速日本人削減政策、
金目似非安全神話で
放射能バラマキ原発再稼働、
ヘイトスピーチ禁止法(人権擁護法)による言論統制、
在日外国人優遇政策、
集団的自衛権で中東派兵韓国防衛など
日本解体売国政策を進めているように見える…。
Webページに仕込むようなのならソースは見れるんじゃないの
78 :
名無しのひみつ@転載は禁止:2015/02/12(木) 17:55:08.02 ID:aod2aU0k
※ただしPerlに限る
>>78 意味わからん
Perl のソースが送られて来るとか、どこのサイトよ
誰が書いたところかわかりやすくなるんで、問題起きた時にその部分書いた人を呼び出しやすくなるんかな?
派遣で使ってた人呼び出して問題解決してもらうとか?
81 :
名無しのひみつ@転載は禁止:2015/02/12(木) 19:27:39.31 ID:skerT2hw
Hello, World!
>>80 今時派遣含めて SCM で管理してるだろ
hagee world
84 :
名無しのひみつ@転載は禁止:2015/02/12(木) 21:08:46.42 ID:v4DneXdb
先頭に作成者名入れされられるから誰が書いたかはっきりわかんだね。
だいたい他人の作ったライブラリ組み合わせてるからなあ
86 :
名無しのひみつ@転載は禁止:2015/02/12(木) 21:47:36.11 ID:RK8txZuP
大手のIT会社は開発規約作ってやるからコピペSEばかりだよな
2chの書き込みも100回書き込み分ぐらい解析すれば、かなり特定の人物を絞り込めるんじゃないだろうか。
88 :
名無しのひみつ@転載は禁止:2015/02/12(木) 22:48:22.17 ID:skerT2hw
おまえらって存在感消すの得意そうだもんな
89 :
名無しのひみつ@転載は禁止:2015/02/12(木) 23:04:49.39 ID:z9+g3TLf
ほほぉ、このソースも 'LINT' が書いたソースだな
コイツいったいどれだけのソース書いてるんだ?
入室する度に
『では、フィボナッチ数列を出力するプログラムを作ってください』
とか言われるのか。
>>69 複数人で開発してると、あーここはあいつが書いたコードだなというのはだいたいわかる。
2chのレスでも特定できそう
同一人物が書いたと分かれば、細切れの個人情報が集まってくしな
たまには文体とか語彙を変えたほうがいいのかもしれない
94 :
名無しのひみつ@転載は禁止:2015/02/14(土) 21:04:13.86 ID:bHd7Fl0N
Goも使ったことが無いアホども
95 :
名無しのひみつ@転載は禁止:2015/02/14(土) 21:35:29.86 ID:wRJW2L5h
次からは手袋して左手で書く
96 :
名無しのひみつ@転載は禁止:2015/02/14(土) 21:37:59.25 ID:XavSs3Dy
信じるなよこんな話w
97 :
名無しのひみつ@転載は禁止:2015/02/14(土) 22:04:16.74 ID:njgARX1l
98 :
名無しのひみつ@転載は禁止:2015/02/14(土) 22:09:37.19 ID:xu7FgQkO
どうしよう
2chに「おっぱい揉みたい」って書いたのが全部俺のせいにされてしまう
>>98 大丈夫だ
俺もいるから
あっ、揉みたいじゃなくてなめたいだったっけ...
大規模開発で人の個性が出るようなら、それはコントロールが足りない
コーディング規約でしばるのが当然
101 :
名無しのひみつ@転載は禁止:2015/02/15(日) 11:14:28.51 ID:7L4YJs2p
音楽家バッハの作品の特徴を抽出してそれっぽい音楽を作るという研究は
もう50年以上前から行なわれている。いかにもそれらしい音楽ができる
レベルになっては居るが、やはりまだ作品としては凡である。
ソースコードの癖や傾向、小説から文体なりを統計的に抜き出すソフトSが
あったとして、そのSで得られた統計情報を元に作品を模写する文体模写
とかソースコード模倣ができるシステムMができたとするならば、
第三者がソースコードなり小説なりをMを用いて書いてやれは
統計的鑑定ソフトSにかけたら、模倣元のものであると推定するだろう。
つまりMを使って贋作を作っても、鑑定ソフトSではそれが贋作とは
判定されない、見分けが付かないわけだ。このようにつまらない話しである。
本当に価値があるのは、見本を見せてやるとそれに基づいて学習して
見本を書いた人のように創造的で価値のあるものを新規に作り出せる
ソフトGである。文体やスタイルなどの形を真似るだけのMでは、
それは伝統芸能になるだけだ。
>>25 学生に課題与えてプログラム書かせたのを
研究に流用してんじゃねえの
103 :
名無しのひみつ@転載は禁止:2015/02/15(日) 11:35:06.77 ID:wwlmminR
リバースエンジニアリングして出たコードじゃ特定無理っしょ?
104 :
名無しのひみつ@転載は禁止:2015/02/15(日) 11:39:02.92 ID:/BygC1M2
あれ?命名規則とかコメントの書き方って開発グループで統一するだろ?
>>69 何も知らない素人だけど
難読化ってのは余計にクセが出そうな気がするよ
107 :
名無しのひみつ@転載は禁止:2015/02/17(火) 12:19:21.22 ID:cVX3gAIw
新たな冤罪の温床
108 :
名無しのひみつ@転載は禁止:2015/02/17(火) 20:06:32.18 ID:ub9VxVN4
109 :
名無しのひみつ@転載は禁止:2015/02/17(火) 23:35:53.60 ID:evltz93l
コンパイラではエラーが出ないように、正しいコードをランダムに変更を
加えてバグを入れるソースコード処理ソフトを作ったら、仕事が増えるな。
ところどころ数字を変えたり、同じ型の変数と入れかえたり、
条件分岐の条件を入れ替えたり、よく似た変数名の変数を入れ替えたりするとか。
10万行のソースに指定した個数のバグをランダムに入れて、さあ何個あるか
間違い探しをしましょうというゲームに使えると思う。
タイトルの中に本文が全部埋め込まれているメールはオカンのメールってわかるようなもんか。
111 :
名無しのひみつ@転載は禁止:2015/02/24(火) 18:31:11.20 ID:+xxBPIBO
そのうち、「これはわたしが作りました」という写真入りの生産者画像が
埋め込まれるようになるのか。北海道産のジャガイモのように。
100人の内、5人が間違うのか・・・
証拠には使えんね
他人のソースのコピペに徹する俺に隙は無かった