【マイナー必見】ソロマイニングに対応したよ【高速化Part4】
最新版(KlausT-8.21-mod-r17) >>990
https://1drv.ms/u/s!Aud1FauQ46vHh295NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh255NYbLOB2bQlOt
1 :名無し名誉名人教士:2018/01/15 09:17:28 (6年前) 0.19584695MONA/13人
ソロマイニングに対応したよ~♪(Pascal、Maxwell、Kepler対応、Voltaは暫定対応、Fermiは2.2.3-CUDA8のみ)
ソロマイニング対応バージョン(2.2.3-mod-r1/2.2.4-mod-r1)
https://1drv.ms/u/s!Aud1FauQ46vHhzR5NYbLOB2bQlOt
ソロマイニング未対応バージョン(KlausT-8.18-mod-r1)
https://1drv.ms/u/s!Aud1FauQ46vHhzl5NYbLOB2bQlOt
ソースコードはこちら
2.2.3-mod-r1(VisualStudio 2013 & CUDA8バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhzZ5NYbLOB2bQlOt
2.2.4-mod-r1(VisualStudio 2013 & CUDA9.1バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhzd5NYbLOB2bQlOt
2.2.4-mod-r1(VisualStudio 2017 & CUDA9.1バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhzV5NYbLOB2bQlOt
KlausT-8.18-mod-r1
https://1drv.ms/u/s!Aud1FauQ46vHhzh5NYbLOB2bQlOt
2 :名無し名誉名人教士:2018/01/15 09:17:43 (6年前) 0MONA/0人
前スレ
【マイナー必見】ソロマイニングに対応したよ【高速化Part3】
http://askmona.org/5596
前々スレ
【マイナー必見】ソロマイニングに対応したよ【高速化Part2】
http://askmona.org/4673
前々々スレ
【マイナー必見】Lyra2REv2を高速化したよ
http://askmona.org/4314
3 :名無し名誉名人教士:2018/01/15 09:17:56 (6年前) 0MONA/0人
cpuminerも高速化してみたのでアップ(Lyra2REv2のみ高速化)
cpuminer mod-r8
https://1drv.ms/u/s!Aud1FauQ46vHhxwfOL0Uqaj_Ks4D
4 :にゃんこ初段錬士:2018/01/15 10:42:02 (6年前) 0MONA/0人
乙!
5 :だれかさん七段教士:2018/01/15 23:19:19 (6年前) 0MONA/0人
乙です
先程Part3が1000になった
久々に2.2.4-modr1(2017&CUDA9.1)を使ったら、今までハッシュレートが22MH/sだったのが23MH/sに!
1MH/sの差だけどやっぱり少し嬉しいw
6 :かぷろらくたむ四段:2018/01/16 00:16:05 (6年前) 0MONA/0人
乙です
7 :かぷろらくたむ四段:2018/01/16 00:17:27 (6年前) 0MONA/0人
そういえばここのccminer使ってるとタスクマネージャ上では使用率20%なのにafterburnerで見たら100%だった
8 :Taku3no二級:2018/01/16 00:37:45 (6年前) 0MONA/0人
>>7
多分Copyの値を参照してる。
エンジン(初期状態では3Dって書いてあると思う)をクリックしてCompute_0を選ぶと100%稼働しているのがわかると思う。
9 :名無し名誉名人教士:2018/01/16 06:29:08 (6年前) 0MONA/0人
高速化考察 Fermi & Kepler編
・シェアードメモリ48kB+L1キャッシュ16kB=64kB
現状、シェアードメモリ48kBのみ使用し、48kB÷384B÷32コア=4並列
・FermiはWarpスケジューラが16スレッド×2なので、レイテンシの隠ぺいはできてる…かな?
・KeplerはWarpスケジューラが32スレッド×4で、スケジューラ数分は起動できるが、コアをすべて使用できていない。
そこで、L1キャッシュまで有効に使用できたら、64kB÷384B÷32コア≒5並列
となり、いくらか改善できそう。
L1キャッシュ16kB÷合計64kB=1/4なので、for文で4周している部分を1つだけグローバルメモリで確保すれば、L1キャッシュを使用できる。
これで、Keplerは高速化できる…かな?
10 :名無し名誉名人教士:2018/01/16 06:56:11 (6年前) 0MONA/0人
高速化考察 Maxwell編
・Maxwell(750/750Ti)はシェアードメモリ64kB+L1キャッシュ/Texキャッシュ24kB=88kB
現状、シェアードメモリ64kBのみ使用し、64kB÷384B÷32コア≒5並列
・Maxwell(GTX9xx)はシェアードメモリ96kB+L1キャッシュ/Texキャッシュ24kB=120kB
現状、シェアードメモリ96kBのみ使用し、96kB÷384B÷32コア=8並列
・MaxwellはWarpスケジューラが32スレッド×4で、750/750Tiではレイテンシを隠ぺいするほどではない。GTX9xxは辛うじて2命令スケジュールができる。
・L1キャッシュまで有効に使用できたら、
(750/750Ti)88kB÷384B÷32コア≒7並列
(GTX9xx)120kB÷384B÷32コア=10並列
となるので、有利に働く…のかな?
(750/750Ti)L1キャッシュ24kB÷合計64kB=0.375
(GTX9xx)L1キャッシュ24kB÷合計96kB=0.25
なので、GTX9xxはKeplerと同様。750/750Tiはfor文中の3回ループ(毎回案ロールしている部分)を1つだけグローバルメモリで確保すれば、L1キャッシュを使用できる。
速くなるかは疑問だが…
11 :名無し名誉名人教士:2018/01/16 08:34:10 (6年前) 0MONA/0人
高速化考察 Pascal編
・Pascalはシェアードメモリ96kB+L1キャッシュ/Texキャッシュ48kB=144kB
現状、シェアードメモリ96kBのみ使用し、96kB÷384B÷32コア=8並列
・PascalはWarpスケジューラが32スレッド×4で、辛うじて2命令スケジュールができる。
・L1キャッシュまで有効に使用できたら、144kB÷384B÷32コア=12並列
となるので、Warpスケジューラに3命令入り、レイテンシの隠ぺいの面でより良くなる。…はずなんだけど、既に2命令でレイテンシ隠ぺいしているから、それほどの効果はないのかな?むしろ、オーバーヘッドがあって遅くなる(前回実験より)
12 :かぷろらくたむ四段:2018/01/16 10:17:09 (6年前) 0MONA/0人
>>8
見たらなってました
ありがとうございます
13 :名無しさん:2018/01/16 13:46:24 (6年前) 0MONA/0人
zpoolを使ってマイニングしようとしてるんだけどどれ選んだらいいんですかね
14 :ヌコッティ六段:2018/01/16 13:54:46 (6年前) 0MONA/0人
>>13
何をマイニングしようとしてるかによるけれども、zpool.caは管理者が20%ほどfeeを抜いていた、という噂があるので、別のプールの方がいいと思う。
https://bitcointalk.org/index.php?topic=1951402.0
15 :名無しさん:2018/01/16 14:34:42 (6年前) 0MONA/0人
>>14
モナコイン掘るつもり
温水プールに変えてみたがyesが連続したかと思えばboooooまみれになったりするがコレは仕様でいいんよな?
16 :Lostboyさん:2018/01/16 15:06:15 (6年前) 0MONA/0人
>>14
2.2-mod-r2 で掘ってる?
17 :名無しさん:2018/01/16 15:16:45 (6年前) 0MONA/0人
>>16
2.2.4-mod-r1で全く動かなかったからdjm34で掘ってます
18 :名前はまだ無い一級:2018/01/16 17:04:19 (6年前) 0MONA/0人
こちらのは基本的にlyra2v2のみなのでしょうか?
Scryptやcryptonightなどを試してみようと思ったのですが…
19 :だれかさん七段教士:2018/01/16 17:08:56 (6年前) 0MONA/0人
ScryptはASIC以外絶対に赤字なんでやめよう、もしくはNicehashか何か使おう
Cryptonightは別途それ用のマイナーあるんで入れると良いかもです
20 :名無し二級:2018/01/16 17:43:37 (6年前) 0MONA/0人
>>15
うちの環境だと温水ではbooooはほとんど出ないよ。ごくまれに出るけど。
むしろVIPのほうが多いな。
21 :さ҉҉ば҉҉ち҉҉ゃ҉ん七段教士:2018/01/16 20:14:30 (6年前) 0MONA/0人
>>19
DualMinerUSB2で黒字にできますか?
22 :だれかさん七段教士:2018/01/16 20:39:02 (6年前) 0MONA/0人
>>21
古いASICも赤字になるんじゃない?
新しいASICとかどんどん出てるし・・・
と言うだけなら誰でもできるので計算してみたらほんのわずか黒字。
PCを使いつつ・・・という使用法なら有りかもしれない。
これで計算した
https://www.nicehash.com/profitability-calculator/custom?e=0.21¤cy=JPY&power=1.5&cost=0&algo0=0.07&algo1=0&algo2=0.00&algo3=0.00&algo4=0.00&algo5=0.00&algo6=0.00&algo7=0.00&algo8=0.00&algo9=0.00&algo10=0.00&algo11=0.00&algo12=0.00&algo13=0.00&algo14=0.00&algo15=0.00&algo16=0.00&algo17=0.00&algo18=0.00&algo19=0.00&algo20=0.00&algo21=0.00&algo22=0.00&algo23=0.00&algo24=0.00&algo25=0.00&algo26=0.00&algo27=0.00&algo28=0.00&algo29=0.00
23 :名無し#三段:2018/01/16 22:42:57 (6年前) 0MONA/0人
現状GTX1080が集大成のような完成度すぎて次のシリーズAmpereはどうみえるかな
GDDR6はHBM2より量産が楽だろうしそろそろ発表あっても良いと思うのだが・・・自動車部門で忙しいのか?
というかこれ以上CUDAコア数増やせるの
24 :かぷろらくたむ四段:2018/01/18 11:46:24 (6年前) 0MONA/0人
suprnovaプールで掘ってるけどやはりプールによって掘れる効率が違ったりするのでしょうか
25 :SilverFoxさん:2018/01/21 02:55:21 (6年前) 0MONA/0人
違うよ
26 :Ama一級錬士:2018/01/21 06:58:32 (6年前) 0MONA/0人
音痴でも大丈夫!?
27 :774mona初段:2018/01/21 08:00:46 (6年前) 0MONA/0人
コピーアンドペーストが出来ればやれます。
グラボ増設や電源などハード部分になると自作能力が必要になります。
28 :S A I 四段錬士:2018/01/21 14:08:57 (6年前) 0MONA/0人
VIPで掘ってるけどcmd上のハッシュレートで計算した(diffは変動を加味しておおよその平均値で計算)
理論値の70-80%ってとこかなー
29 :だれかさん七段教士:2018/01/21 14:29:42 (6年前) 0MONA/0人
平均値と言っても・・・
結構Difficultyが動くときは動くから、うーん
自分は結局なんだかんだどのプールもあんまり理論値から離れない数値が出たんだよなぁ、計算がちょい違うのかもしれないけど。
(昔の話だから宛にならない可能性はある)
30 :名無し一級:2018/01/21 14:48:08 (6年前) 0MONA/0人
他プールと比較して極端に差が出るってことはなさそう
ただワーカー多くてハッシュレート高いプールほど分け前が少ない分ブロック発見が多いからブレが少ないっていう印象
31 :ろん一級:2018/01/21 15:06:48 (6年前) 0MONA/0人
どなたかも報告していたようでしたが、KlausT-8.18-mod-r1は動作がおかしいかも?
数日使用してますが、クライアント側がyay出していてもプール側でShareが増えないことがままありますね。
32 :S A I 四段錬士:2018/01/21 15:39:32 (6年前) 0MONA/0人
後謎なのが普通にyes出てるのにメールで10分以上応答がありませんって来るんだよなぁ
33 :かぷろらくたむ四段:2018/01/21 20:43:04 (6年前) 0MONA/0人
GTX1060で掘ってて22-23MH/sで0.14mona/日位なのですが理論値はどのくらいなのでしょうか
34 :パペポ三段:2018/01/21 20:52:17 (6年前) 0MONA/0人
>33
理論値は判らんが、
同じGTX1060で掘ってるけど、25MH/s前後で0.25~0.3mona/日位掘れてるから、
少ないとは思うなあ
35 :かぷろらくたむ四段:2018/01/21 21:12:04 (6年前) 0MONA/0人
総量はプールの差がでかそう
オーバークロックと化されてますか?
36 :だれかさん七段教士:2018/01/21 21:12:15 (6年前) 0MONA/0人
差は通常はプールの運によるものじゃなかろうか・・・
Invalidなシェアが多いとかが無いならば。
37 :パペポ三段:2018/01/21 21:20:34 (6年前) 0MONA/0人
>35
特に触ってないけど、
MSI Afterburnerでpower limitを80%に下げてる。
100%にしても1MH/sも変わらなかったので…
38 :名無し一級:2018/01/21 21:26:55 (6年前) 0MONA/0人
>>33
23MH/sで0.23monaくらいは掘れてるし少ないな…
プールが不安定とか…?
39 :かぷろらくたむ四段:2018/01/21 21:47:05 (6年前) 0MONA/0人
なるほど
とりあえずほかのプールに登録して試してみます
HDMIケーブルをマザーボード側にさして試します
40 :名前はまだ無い一級:2018/01/21 22:21:32 (6年前) 0MONA/0人
少し前にも書かれていますが、KlausT-8.18-mod-r1がうまく動いているときとそうでないときがあります。
前のバージョンを試してみようかとも思ったのですが、OneDriveにはたくさんあって…。
どういう順で並んでるのでしょうか?適当にダウンロードしてみたら単にソースのようでした。
41 :名無し名誉名人教士:2018/01/22 06:06:49 (6年前) 0MONA/0人
>>40
数字で始まっているファイルがバイナリです。(KlausTは例外)
詳細は前スレを漁ってください。
42 :名無し名誉名人教士:2018/01/22 14:01:58 (6年前) 0.00118763MONA/2人
現在、どうにかL1キャッシュを使えないかと考察中。
演算の一部をグローバルメモリに確保してやってみると、
キャッシュがきいてるのか、若干遅くなる程度のものだった。
…で、よく調べてみると、L1キャッシュはコンパイラオプションにより、
「読み込み」をキャッシュする…らしい。
ってことは、書き込みはキャッシュしない(L2キャッシュに書き込まれる)ってことだね…ダメじゃん…
まあ、冷静に考えると、グローバルメモリはどのコアからもアクセスする可能性があるから、(SMごとに独立している)L1キャッシュでは都合が悪く、(全SMで共用している)L2キャッシュが都合がいいわけで…
…じゃあ、スレッド間でやり取りしないローカルメモリなら、L1にキャッシュされるんじゃね?
ってなわけで、試行錯誤は続きます。
43 :名無し名誉名人教士:2018/01/22 14:08:06 (6年前) 0MONA/0人
>>42 補足
ここで言うローカルメモリは、OpenCLのLocal Memoryとは違い、「レジスタが足りない場合に確保されるデバイス上(ボード上)のメモリ」のこと。
OpenCLのLocal MemoryはCUDAのシェアードメモリに該当します。
CUDAのローカルメモリ = OpenCLのPrivate Memory
CUDAのシェアードメモリ = OpenCLのLocal Memory
なんか、ややこしいな…
44 :名無し二級:2018/01/22 22:11:49 (6年前) 0MONA/0人
1080Ti一枚でのんびりモナコイン掘ってるけど、
ハッシュレートが安定しないんだよね
こういうもの?
45 :KomugikoMan二段錬士:2018/01/22 22:17:56 (6年前) 0.00114114MONA/1人
>>44
掘ってる間裏作業してるのでは?あとマイナーの人数変動したら上下してるかも
46 :monaholic初段:2018/01/22 22:51:48 (6年前) 0.00114114MONA/1人
>>44
プールでの数値表示はそういうものですよ
47 :名無し名誉名人教士:2018/01/22 23:59:29 (6年前) 0.12104197MONA/13人
実験的ビルドその3
・とりあえず、ローカルメモリを確保して、積極的にL1キャッシュを使ってみた。
(48kB÷(48kB+96kB)=1/3のため、配列48個中16個をローカルメモリ、残りをシェアードメモリで確保。)
なお、Pascal以外では(Volta含む)では遅くなる公算が高いです。(L1キャッシュが少ないため)
今後の課題ですね…
・KlausT版の初期設定を移植。より細かいスレッド数設定を行った。
・Voltaのシェアードメモリの確保量を最大にした。
ソロマイニング対応バージョン(2.2.4-mod-r2)
https://1drv.ms/u/s!Aud1FauQ46vHhzt5NYbLOB2bQlOt
ソースコードはこちら
2.2.4-mod-r2(VisualStudio 2017 & CUDA9.1バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhzp5NYbLOB2bQlOt
48 :名無し一級:2018/01/23 00:38:56 (6年前) 0MONA/0人
>>47
早速使わせてもらいました!
GPU #0: GeForce GTX 1080, 47.88 MH/s
GPU #0: 1702 MHz 377.85 kH/W 126W 55C FAN 65% PL65% コア+50 メモリ+100
GPU #1: GeForce GTX 1060 6GB, 23.86 MH/s
GPU #1: 1675 MHz 289.60 kH/W 82W 54C FAN 65% PL70% コア+50 メモリ+100
まだ15分くらいですが2~2.5%くらいハッシュレート上がりました
このまま一晩掘らせてみます(OC値は適当)
49 :名無し二級:2018/01/23 01:17:35 (6年前) 0MONA/0人
>>45
>>46
裏で作業は特にしてないからそういうものなのか
>>47
感謝感激
以下CentOSでR1からR2へ移行した様子
なかなかステキ
GPU #0: GeForce GTX 1080 Ti, 64.91 MH/s
↓
GPU #0: GeForce GTX 1080 Ti, 66.87 MH/s
50 :かぷろらくたむ四段:2018/01/23 01:47:43 (6年前) 0MONA/0人
>>47
さっそく使わせていただきました
GTX1060 3GB (OCなし)で23MH/s→24MH/sになりました
51 :名無し名誉名人教士:2018/01/23 06:24:21 (6年前) 0MONA/0人
r2でPascal以外はどうなるか…?
やってみた人、報告希望。だぶん遅くなると思うけど…
今後の改造予定
2.2.4-mod-r3 ⇒ Pascal以外を元に戻す。具体的にはCompute_61以外。(Tesla P100もL1キャッシュが小さいので元に戻す。)
2.2.4-mod-r4 ⇒ 第1世代Maxwell以下、Tesla P100、VoltaでL1キャッシュを全力で使ってみる。(第2世代Maxwellは分岐が増えるので使わない。具体的にはGTX 980Ti~950。L1キャッシュが小さすぎる…)
52 :名無し一級:2018/01/23 07:53:25 (6年前) 0MONA/0人
>>48 を一晩動かした結果、ハッシュレート2.8%上がってました
VIP PoolとASIC Poolが5時間以上ブロック見つけてないけど何かあった…?
53 :ろん一級:2018/01/23 08:12:06 (6年前) 0.0000039MONA/1人
色々試してみたいけど、週末になりそう。
>>52
昨日は温水とLAが半日出なかったし、へーきへーき
54 :名無し二級:2018/01/23 08:25:25 (6年前) 0MONA/0人
新しいバージョン使ったら報告どおり0.5%~1.5%位ハッシュ上がりましたね。
というか多枚数使ってるけどハッシュの数値がそろった感じ。
これCUDA9対応バージョンとか出たらもっとハッシュ上がるのかな?
>>52 >>53
VIPも昨日はいつもより少なめな感じでしたよ。
で、日付変わった今日見たら2:00ごろから掘り当ててない
55 :名無し一級:2018/01/23 08:26:42 (6年前) 0MONA/0人
>>53
そういうものか…
実績比2000%超えは初めて見たから焦った…
56 :名無し二級:2018/01/23 08:43:56 (6年前) 0MONA/0人
温水8:00台3連荘w
57 :あにき二段:2018/01/23 13:29:59 (6年前) 0MONA/0人
サブ機で運用している750tiのハッシュレートは2.2.4-mod-r2で
GPU #1: GeForce GTX 750 Ti, 7183.56 kH/s
と10%近く伸びました。
ドライバ390.65 OC+87 メモリ-300 PL77 気温4度での検証です。
58 :site三段:2018/01/23 14:53:11 (6年前) 0MONA/0人
59 :名無し二級:2018/01/23 16:58:24 (6年前) 0MONA/0人
ふと思ったんだけど
960とかでハッシュ上がるならRXだとどうなるだろう?
60 :Lostboyさん:2018/01/23 17:24:52 (6年前) 0MONA/0人
GTX1060、GTX1080 ともに ccminer-2.2-mod-r2-CUDA9 から 2.2.4-mod-r2 に変えたら、それぞれ 1.2MH/s ぐらい増えた!
ありがたやー!
61 :PEPSIMAN(パス忘四段錬士:2018/01/23 17:28:59 (6年前) 0MONA/0人
>>59
CCminerはNVIDIA専用だったと思う。
62 :名無しのロリコン三級:2018/01/23 17:29:24 (6年前) 0MONA/0人
お疲れ様です。
かなりいい感じです!!
63 :名無し名誉名人教士:2018/01/23 18:11:12 (6年前) 0MONA/0人
>>57 >>58
あれ?Maxwellでも速くなってる?
今の構成だと、確実にL1から溢れるはずなんだが…
だったら、まだPascalは速くなる余地がある!?
最適化プロセスを見直さなきゃならんかね?
64 :名無し名誉名人教士:2018/01/23 18:23:12 (6年前) 0.10267228MONA/4人
とりあえず、現状確認
・Pascal環境にて、グローバルメモリを確保した最適化を試みるも失敗。(自環境のGTX1060で26.5MH/s⇒26.0MH/s)
・同様にローカルメモリを確保した最適化を実行。効果が得られた。(自環境のGTX1060で26.5MH/s⇒27.5MH/s)
・Pascalにおいて、48kBのL1キャッシュを使いきる構成で最適化を行ったため、Maxwell環境(24kBのL1キャッシュ)では効果は得られないと予想したが、逆に効果があった。
・Maxwell環境ではL2キャッシュまでアクセスしているものと予測。これを利用したうえで速度が上がっていると考えられる。
・1060と960でL1キャッシュの環境が異なるにもかかわらず、速度上昇は同程度。⇒L1キャッシュの効果が得られず、L2キャッシュの効果で速度上昇が得られている。
・グローバルメモリとローカルメモリでは、ローカルメモリの方が速い⇒グローバルメモリでは書き込みキャッシュが得られないが、ローカルメモリでは書き込みキャッシュが利いていると予想できる。
・シェアードメモリで足りない分をL2キャッシュの許す範囲のローカルメモリで確保し、カーネル起動数優先にすれば、最適化に寄与するのではないだろうか…?
65 :名無し名誉名人教士:2018/01/23 18:33:07 (6年前) 0.00114114MONA/1人
とりあえず、L2キャッシュ考察
Nvidia Titan X/Titan Xp:L2 3MB⇒1コア当たり0.857kB
GTX1080Ti:L2 2.75MB⇒1コア当たり0.785kB
GTX1080/1070:L2 2MB⇒1コア当たり0.8kB(GTX1080にて計算)
GTX1060:L2 1.5MB⇒1コア当たり1.2kB(6GB版にて計算)
GTX1050Ti/1050:L2 1MB⇒1コア当たり1.33kB(GTX1050Tiにて計算)
GT1030:L2 512kB⇒1コア当たり1.33kB
GTX Titan X/GTX980Ti:L2 3MB⇒1コア当たり1.0kB(GTX Titan Xにて計算)
GTX980:L2 2MB⇒1コア当たり1.0kB
GTX970:L2 1.75MB⇒1コア当たり1.07kB
GTX960/950:L2 1MB⇒1コア当たり1kB(GTX960にて計算)
GTX750Ti/750:L2 2MB⇒1コア当たり3.2kB(GTX750Tiにて計算)
66 :名無し名誉名人教士:2018/01/23 18:44:51 (6年前) 0.00114114MONA/1人
lyra2v2ではレジスタの制約から最大Warp数が12なので、計算上、L2キャッシュに全部収まるサイズは、
384バイト/スレッド×(12Warp/SM×32コア/Warp÷128コア/SM)=1152バイト/スレッド
となる。
>>65 から、1152バイト=1.125kB以上確保できるのはGTX1060/1050/1050Ti、GTX750Ti/750
こいつらはL2で全部完結できるんだ…
ちょっと試してみるか…
67 :ittou四段教士:2018/01/23 19:28:53 (6年前) 0MONA/0人
がっつりレートが上がりましたね。
[2018-01-23 19:24:26] GPU #0: 1987 MHz 264.04 kH/W 211W 51C FAN 5%
[2018-01-23 19:24:36] GPU #1: EVGA GTX 1080, 55.66 MH/s
[2018-01-23 19:24:39] GPU #0: EVGA GTX 1080, 55.95 MH/s
[2018-01-23 19:24:47] GPU #1: EVGA GTX 1080, 55.52 MH/s
[2018-01-23 19:24:47] accepted: 52/52 (diff 0.582), 111.36 MH/s yes!
[2018-01-23 19:24:49] accepted: 53/53 (diff 1.190), 111.35 MH/s yes!
[2018-01-23 19:25:05] lyra2v2 block 1225340, diff 27981.457
[2018-01-23 19:25:31] GPU #1: 1973 MHz 266.56 kH/W 208W 56C FAN 20%
68 :名無し四段:2018/01/23 19:52:36 (6年前) 0MONA/0人
KlausT-8.18-r1
[2018-01-23 19:31:16] GPU #0: GeForce GTX 750 Ti, 6384.46 kH/s
[2018-01-23 19:32:40] GPU #0: GeForce GTX 1050 Ti, 13.43 MH/s
2.2.4-mod-r2
[2018-01-23 19:47:10] GPU #0: GeForce GTX 750 Ti, 6814.43 kH/s
[2018-01-23 19:47:39] GPU #0: GeForce GTX 1050 Ti, 14.07 MH/s
69 :ぬこさん:2018/01/23 21:04:19 (6年前) 0MONA/0人
>>47
macOS High Sierra 10.13.2 でビルドして動作しましたので報告です。
2.2.4-mod-r2
[2018-01-23 20:55:13] GPU #0: GeForce GT 1030, 6985.54 kH/s
70 :名無し名誉名人教士:2018/01/23 22:35:46 (6年前) 0.11214114MONA/4人
実験的ビルドその4(GTX750Ti/GTX750向け)
・とりあえず、GTX750Ti/GTX750でも12warp起動するように調整した。
・Pascalでは遅くなった。
・L2キャッシュが潤沢で、シェアードメモリが少ないGTX750Ti/GTX750でどの様な振る舞いをするか調べてみたい。
ソロマイニング対応バージョン(2.2.4-mod-r3)
https://1drv.ms/u/s!Aud1FauQ46vHhzx5NYbLOB2bQlOt
GTX750Ti/GTX750を持っている方は実験をお願いします。
(その他の方は2.2.4-mod-r2の方が速いと思います)
71 :STARR初段錬士:2018/01/23 22:38:02 (6年前) 0.039MONA/1人
2.2.4-mod-r2
GTX1080*5
6時間起動後、misaligned addressに…
取り敢えずr1に戻しました。
72 :名無し名誉名人教士:2018/01/23 22:47:04 (6年前) 0.00114114MONA/1人
GTX750Ti/GTX750の場合、シェアードメモリが64kBしかなく、
12Warp起動するためには、ローカルメモリで80kBを確保する必要がある。
そのため、1/3をシェアードメモリ(128バイト)で、残り2/3をローカルメモリ(256バイト)で確保する。
128バイト×32スレッド/warp×12warp=48kBをシェアードメモリで確保し、(最大64kB)
256バイト×32スレッド/warp×12warp=96kBをローカルメモリで確保する。
L1キャッシュは24kBのため、全然足りないが、
L2キャッシュは2MBあり、1コアあたり3.2kB、32コアあたり102.4kBで十分確保できてると思う。
73 :鰯二段:2018/01/23 22:51:17 (6年前) 0MONA/0人
ちなみに名人が推奨するドライバのバージョンなどはありますでしょうか?
一応測定環境は可能な限り公開したほうがいいと思いますので……
74 :サンタさん:2018/01/23 22:55:46 (6年前) 0MONA/0人
教えてください。
2.2.4-mod-r2を実行すると[the code execution cannot proceed because ]
Windows 10
GTX1080
75 :名無し名誉名人教士:2018/01/23 22:56:42 (6年前) 0.00114228MONA/2人
>>71
報告乙
misalignedってことは、スレッド数は中途半端で変なアドレスから開始したのが悪さしてるかな?
だとすると、初期設定値を小数にしたのが原因かしら?次回更新時は設定値を整数に戻すことにしよう…
-i 22 を付けて起動したら、もしかしたら改善するかも?
76 :名無し名誉名人教士:2018/01/23 23:02:28 (6年前) 0.0001MONA/1人
>>73
バージョンは気にしていなかったな…
バージョン違いで速度は確認していないです。
とりあえず、私の環境は388.19ですね。
77 :サンタさん:2018/01/23 23:04:04 (6年前) 0MONA/0人
すいません、途中で送ってしまった。。。
教えてください。
2.2.4-mod-r2を実行すると[the code execution cannot proceed because VCRUNTIME140.dll was not found.. ]が出ます。
[2.2-mod-r2-CUDA9]からVCRUNTIME140.dllをコピーしてきた後は、
[Application error - Application was not able to start correctly 0x000007b]が出ます。
環境は, Windows 10, GTX1080, Cuda9からCuda9.1にアップグレードした直後, ソロマイニング用
まだWindowsでは使えないでしょうか?
78 :名無し名誉名人教士:2018/01/23 23:05:39 (6年前) 0.0039MONA/1人
>>74
C++のランタイムが入っていないっぽい…
https://www.visualstudio.com/ja/downloads/?q=#other-ja
このページの一番下のリンク
「Visual Studio 2017 の Microsoft Visual C++ 再頒布可能パッケージ」のx64版を入れてみよう。
79 :名無し名誉名人教士:2018/01/23 23:08:20 (6年前) 0MONA/0人
>>77
ひょっとしたら、VCRUNTIME140.dllの同梱間違えたかな…
ちなみに2.2からコピーしたVCRUNTIME140.dllはx86版なので、多分無理…
80 :No name二級:2018/01/23 23:13:41 (6年前) 0MONA/0人
>>47
ソースからubuntu 1704でビルドして使わせてもらいました。
当方、1080と1070Tiを使ってますが、今までハズレコアだと思っていたグラボで10%以上のハッシュ数増です。驚きましたw
ただ違うアルゴリズムで使わせていただいるので、lyra2v2以外でも成果上がってますよーというご報告です。
81 :鰯二段:2018/01/23 23:17:19 (6年前) 0MONA/0人
>>70
GTX745(GTX750からCUを1削減したOEM品、GPU-Zを参照)ですが参考までに報告です。ドライバは最新の390.45
2.2.4-r2
2.2.4-r3
当方の環境では200khほど向上しています
82 :サンタさん:2018/01/23 23:18:36 (6年前) 0MONA/0人
>>78
動きました。大感謝です。
83 :Trish-G四段教士:2018/01/23 23:53:23 (6年前) 0MONA/0人
2.2.4-r2 速くなった。
1050Ti
84 :おはぎゃー二段:2018/01/24 00:15:04 (6年前) 0MONA/0人
>>70
GTX 1080Ti 2枚で運用
2.2.4-mod-r2
[2018-01-24 00:09:05] GPU #0: MSI GTX 1080 Ti, 71.46 MH/s
[2018-01-24 00:09:13] GPU #1: MSI GTX 1080 Ti, 71.06 MH/s
2.2.4-mod-r3
[2018-01-24 00:11:49] GPU #0: MSI GTX 1080 Ti, 50.75 MH/s
[2018-01-24 00:11:47] GPU #1: MSI GTX 1080 Ti, 50.57 MH/s
自分の環境では差が大きかったです。
何か欲しい情報があったら言ってください。
85 :STARR初段錬士:2018/01/24 00:43:32 (6年前) 0MONA/0人
>>75
確かに-iオプションつけてなかったですね。
23時頃から"-i 22"で起動させました。
取り敢えず朝まで監視してみます。
86 :名無し二級:2018/01/24 00:56:32 (6年前) 0MONA/0人
1080x5、1080tix1の環境で14時頃から2.2.4-r2を回してるけど
ふとさっき簡易電力計見たらアイドル状態の数値だった。
で、bat見ると普通にハッシュ出てたんだけど
これ何が起因してるんだろ?
電力アイドル状態で普通にハッシュ掘れるんなら
これほどおいしいことないけどw
87 :名無し二級:2018/01/24 01:15:04 (6年前) 0MONA/0人
ちなみに2.2.4-r2のbat立ち上げ直しても電力計の数値は変わらず、
2.2-r2で立ち上げなおしたら通常の消費電力に戻った。
再度2.2.4-r2立ち上げたら通常の消費電力に戻ったんだよね・・・
メモリ回りとかに起因してたりする?
88 :あにき二段:2018/01/24 03:35:48 (6年前) 0MONA/0人
2.2.4-mod-r3
GPU #1: GeForce GTX 750 Ti, 7624.12 kH/s
GPU #1: 1211 MHz 262.58 kH/W 29W 31C FAN 40%
その他設定は
>>57
と同様です。さらに速くなっています。
89 :名無し四段:2018/01/24 06:52:59 (6年前) 0MONA/0人
2.2.4-mod-r2
[2018-01-24 06:22:36] GPU #0: GeForce GTX 750 Ti, 6801.57 kH/s
[2018-01-24 06:23:56] GPU #0: GeForce GTX 1050 Ti, 13.56 MH/s
2.2.4-mod-r3
[2018-01-24 06:49:53] GPU #0: GeForce GTX 750 Ti, 6973.30 kH/s
[2018-01-24 06:49:49] GPU #0: GeForce GTX 1050 Ti, 12.53 MH/s
90 :名無し名誉名人教士:2018/01/24 08:06:12 (6年前) 0MONA/0人
ここまでの最適化をまとめると…
・warp数は可能な限り増やす。レジスタ数で限界があるので、その数値までL1、L2キャッシュを使ってでも増やす。
・L2に入りきらない場合、速度が急激に落ちるので、キャッシュ使用量は注意。L2キャッシュは割りと汚染されるっぽいので、半分くらいの容量で見積もっておく。(さじ加減は今後の課題)
これって、OpenCLでも応用できるか?
91 :名無し名誉名人教士:2018/01/24 08:13:33 (6年前) 0MONA/0人
消費電力についてはよくわからん…
理屈で考えると、メモリアクセスの待ち時間が減り、単位時間あたりの演算数が増えるので、消費電力は増えると思うんだが…
まあ、シェアードメモリよりL2キャッシュの方が消費電力は小さい、ってことなら可能性はあるのか?
92 :ヌコッティ六段:2018/01/24 08:27:40 (6年前) 0MONA/0人
>>75
いつもccminer-2.2-mod-r2-CUDA9を-i 22.2でやっててここ2ヶ月>>71のメッセージは出てない。
あのエラーはOCしているときに出るメッセージだと思う。
93 :STARR初段錬士:2018/01/24 09:46:30 (6年前) 0.00114114MONA/1人
>>92
OCし過ぎると該当のエラーが出ますが、2.2-mod-r2で1ヶ月以上起動させておりました(Base+166MHz PL70)
直前は2.2.4-mod-r1で200時間以上連続起動です。
OCは余裕を持って設定していたのですが、OCが原因だとするとOC値を低くして動作させることが出来ても、ハッシュレートの上昇は残念ながらあまり期待出来なくなってしまいますね。
安定性にも疑問が残ってしまいますので、今回は実績のある2.2.4-mod-r1に戻すことにしました。
シビアにOCされている方がいらっしゃったら試してみて欲しいところです。
94 :Marimoさん:2018/01/24 09:57:17 (6年前) 0MONA/0人
GTX760ですけど-i 17で2.2.4-mod-r1と比べてr3の方は4670KH/s→5500KH/sぐらいまで早くなっているのでkepler系でも早くなりますね。r2はr1と大差はなかったです。
95 :名無しさん:2018/01/24 10:30:15 (6年前) 0MONA/0人
2.2.4-mod-r2を動かしてみると
GPU #0: no kernel image is available for execution on the deviceと表示され、
r1の2013x64だとGPU #0: invalid configuration argumentとエラーメッセージが表示されるケースって何が原因なんですかね
Windows10でGTX960です。GeforceExperienceで最新ドライバーをインストール済みです。
96 :名無し名誉名人教士:2018/01/24 10:37:48 (6年前) 0MONA/0人
シェアードメモリ、Warp数を勘案したうえで、
・Fermi、Kepler(GK1xx、GK2xx)、第1世代Maxwell(GM1xx)は1/3をシェアードメモリ、2/3をローカルメモリ(L2キャッシュ)で確保する。
・第2世代Maxwell(GM2xx)、Pascal、Voltaは2/3をシェアードメモリ、1/3をローカルメモリ(L1キャッシュ)で確保する。
このイメージで考える。
安定性についてはよくわからない…
とりあえず、r1からの変更点を元に戻したうえで、上記改造をやってみようかな…(戻せるかな…?)
97 :MaineCoon一級:2018/01/24 11:01:09 (6年前) 0MONA/0人
2.2-mod-r2
[2018-01-24 10:50:28] GPU #0: MSI GTX 970, 20.13 MH/s
[2018-01-24 10:50:28] accepted: 22/22 (diff 0.136), 20.19 MH/s yes!
2.2.4-mod-r2
[2018-01-24 10:58:21] GPU #0: MSI GTX 970, 20.23 MH/s
[2018-01-24 10:58:21] GPU #0: 1234 MHz 144.72 kH/W 139W 61C FAN 43%
[2018-01-24 10:58:21] accepted: 45/45 (diff 0.045), 20.12 MH/s yes!
[2018-01-24 10:58:23] accepted: 46/46 (diff 0.149), 20.13 MH/s yes!
2.2.4-mod-r3
[2018-01-24 10:44:52] GPU #0: 1226 MHz 133.38 kH/W 139W 60C FAN 41%
[2018-01-24 10:45:12] GPU #0: MSI GTX 970, 18.57 MH/s
[2018-01-24 10:45:12] accepted: 34/35 (diff 0.140), 18.55 MH/s yes!
[2018-01-24 10:45:23] accepted: 35/36 (diff 0.064), 18.54 MH/s yes!
98 :MaineCoon一級:2018/01/24 11:08:12 (6年前) 0MONA/0人
PL=71%で回してます。
その他は変更していないのに
クロックが少し違うので
温度やハッシュ値に影響している??
99 :ヌコッティ六段:2018/01/24 11:49:55 (6年前) 0MONA/0人
>>93
他のアルゴリズム(Equihash)で大丈夫な設定がlyra2rev2だと上のようなメッセージが出たりしたのでようわからんですね。
なお+200/+200/PL85%で回して様子見中です。
100 :名無しさん:2018/01/24 17:37:15 (6年前) 0MONA/0人
>>70のマイナーをgtx660ti(コアクロック+150、メモリークロック+200のOC済み)で使ってみました
・2.2.4-mod-r2 4351kh/s
・2.2.4-mod-r3 4999kh/s
体感ですがr3は以下のエラーが結構でちゃいますね(OCに起因するエラーだと思いますが…)
・an illegal memory access was
encountered
・unspecified launch failure
私の環境では2.2-mod-r2が1番安定してますねー
101 :rdm二段:2018/01/25 04:29:29 (6年前) 0MONA/0人
2.2.4-mod-r2
TITAN X(Pascal) PL120% core+200/mem+0
起動時は+2MH/s程度であったが、徐々に垂れてきて+1MH/s程度
もう少し回してみます。
102 :名無しさん:2018/01/25 17:35:08 (6年前) 0MONA/0人
Zotac GTX750 Ti
2.2.4-mod-r2
GPU #1: Zotac GTX 750 Ti, 7071.34 kH/s
2.2.4-mod-r3
GPU #1: Zotac GTX 750 Ti, 7346.32 kH/s
うちの場合は、1030と同居してるので、r2とr3でPascal遅くなって差し引き0ってところですね。
2.2-modから比べれば、0.5~1M上がってます
103 :5時です五段:2018/01/25 17:54:21 (6年前) 0MONA/0人
vippool1位やべえなw2.27GHw
104 :さくら007一級錬士:2018/01/25 18:53:11 (6年前) 0MONA/0人
GTX 1060 3GB
2.2.4-mod-r2 25.10MH/s
ccminer-x64-2.2.3-cuda9 23.5MH/s
性能アップしたが、6時間ぐらいたつとパソコンが落ちます。
2.2.3のときは、まったく問題はなかった。。。
105 :名無し二級:2018/01/25 19:02:07 (6年前) 0MONA/0人
>>104
うちは一定時間回してるとハッシュレートの谷が出てくるなぁ。
2.2-Cuda9の時はなかった動きだなぁ。
もっともこれがマイナーじゃなくてプールの問題なのか、あるいはうちの環境の問題なのか切り分けできてないけど
106 :光の名無し二段:2018/01/25 19:02:46 (6年前) 0MONA/0人
転がってたZotac GTX650をしばらく前から動かしてますが
r3 1700kH/sほど
r1 1400kH/sくらい
OCもPLも弄ってないです
ド安定
107 :名無しさん:2018/01/25 19:11:13 (6年前) 0MONA/0人
>>100
追記
gtx660tiをコアクロック+110、メモリークロック+160まで下げてOCしてみたところ、2.2.4-mod-r3でも24時間安定稼働するようになりました。
ハッシュレートは4860kh/s程でています。
温度が2.2-mod-r2の時と比べ10℃程上がってますね。グラボを性能ギリギリまで使ってる感が凄い
108 :イニシャルK一級:2018/01/25 19:35:42 (6年前) 0MONA/0人
掲示板テーマの本題から少し逸れてしまうかもしれませんが、ご容赦下さい。
このスレッドをチェックされている方には無関係ではないと思います。
仮想通貨の納税に関して、次のような活動を発足された方がいます。
賛同される方は署名してみてはいかがでしょうか。
私もとりあえず賛同しました。
https://www.change.org/p/国税庁-仮想通貨-暗号通貨-売買利益への課税を-株取引と同じ申告分離課税へ?utm_medium=email&utm_source=petition_signer_receipt&utm_campaign=triggered&share_context=signature_receipt&recruiter=851657218&j=229263&sfmc_sub=596818241&l=32_HTML&u=41927559&mid=7233052&jb=306958
109 :イニシャルK一級:2018/01/25 19:36:41 (6年前) 0MONA/0人
↑すみません、リンク上手く貼れていないようです。
URLすべてコピペで開けるようです。
お手数おかけします。
110 :さくら007一級錬士:2018/01/25 20:33:31 (6年前) 0MONA/0人
仮想通貨は最大55%課税されるからね
FXなどは20%ぐらいなのですごい差ですよねえ
まあ、損益は通算されるそうなので、今年損しても助かりますが。
税金の問題は悩ましいですねえ
はっきりいうと、年収ある人は仮想通貨やっても半分以上税金とられると魅力なくなりますねえ
111 :名無し二級:2018/01/25 23:14:42 (6年前) 0MONA/0人
マイニングしてる人ならマイニングマシンもそれを管理するPCも買って
実質経費にすればいいんだけどね。
きちんと帳面残しとけば大丈夫なはずだけどね。仮想通貨を買った場合も
おそらく管理や取引するPCも経費として認められると思うけどねぇ?
今まで使ってたPC?
ヤフオクでポイーでしょ。
ヤフオクでの利益は個人が使っていた不要物の少数売却なら生活動産だろうから
非課税だろうし
112 :ウィンザーノット六段:2018/01/25 23:46:00 (6年前) 0MONA/0人
スレチなんであれですが、、
>>108
とか言いながらUSDTにして利益の繰り延べするんでしょう?
暗号通貨と暗号通貨間の課税がイケてないってのは一定の理解は有るけれども、脱税出来るガバガバ税法もどうかと思うんですよ。
そもそもモナコインは投機でも仮想通貨間の基軸通貨も目指してなくて、1000±500円くらいでまったりしてくれていればそれでいいって人も多いと思うよ。
>>110
損益通算っていうのは年度単位で他の所得と通算することだよ。
>>111
10万未満のPCとかゴミだとおもうんですが…
113 :ittou四段教士:2018/01/25 23:59:29 (6年前) 0MONA/0人
2.2.4-mod-r2
安定して動作してます。1080x2のUbuntu16.04。
レートが上がったからか、若干コア温度が上がった気がします。
今51℃くらい。水冷にて。
夏は冷却考えないとやばそう。
114 :名無し二級:2018/01/26 00:49:30 (6年前) 0MONA/0人
>>112
どこから10万以下って数字が?
115 :Trish-G四段教士:2018/01/26 02:00:48 (6年前) 0MONA/0人
>>114
10万円超えると一括で経費にできないからじゃないですかね。
まぁ、10万円以下の部品を組み合わせてPC作ればいいのですけど。
116 :名無し二級:2018/01/26 03:19:12 (6年前) 0MONA/0人
>>115
事業者の場合は消耗品の概念がありますからわかるんですけど
個人の雑所得の場合は消耗品やらなんやらの概念はないはずなんですけどね。
雑”所得”なんでプラスになった分だけ申告すればいいはずなんです。
でなければ、仮に数年に分けて減価償却した際に、
翌年度分の赤字を損金として税務署が認めるのか?という話になるので。
ちなみに事業者で青色申告していれば30万程度までは少額一括償却できるんですけどね。
117 :ぬこさん:2018/01/26 12:56:23 (6年前) 0MONA/0人
±100kH/sくらい波があるみたいですね。
ウチだとGT1030で最高値が下記です(2.2.4-mod-r2)
[2018-01-26 12:22:18] GPU #0: GeForce GT 1030, 7220.85 kH/s
118 :No name二級:2018/01/26 13:26:30 (6年前) 0MONA/0人
ヤフオクでの売却も雑所得扱いで、年間20万以上は課税対象に含まれると税務署の回答だったと思う。前から。
119 :名無し名誉名人教士:2018/01/26 19:23:11 (6年前) 0MONA/0人
手持ちのグラボで試してみた。
GTX1060(Compute Capability 6.1)
r1:26.24MH/s 120W 218.7kH/W
r2:26.95MH/s 121W 222.7kH/W
r3:24.81MH/s 122W 203.4kH/W
GTX960(Compute Capability 5.2)
r1:13.59MH/s 96W 141.6kH/W
r2:14.05MH/s 110W 127.7kH/W
r3:12.41MH/s 108W 114.9kH/W
120 :名無し名誉名人教士:2018/01/26 19:23:29 (6年前) 0MONA/0人
>>119 つづき
GTX750(Compute Capability 5.0)
r1:5033.22kH/s 19W 264.9kH/W
r2:5683.69kH/s 23W 247.1kH/W
r3:5926.18kH/s 25W 237.0kH/W
GT710(Compute Capability 3.5)
r1:681.85kH/s
r2:755.01kH/s
r3:907.04kH/s
121 :名無し名誉名人教士:2018/01/26 19:26:07 (6年前) 0MONA/0人
誰か、Compute Capability 7.0、6.0で試せませんかね?(無茶)
Compute Capability 3.0は>>106で動作報告あり
122 :名無し二級:2018/01/26 20:11:23 (6年前) 0MONA/0人
>>118
国税局のHP ttps://www.nta.go.jp/taxanswer/joto/3105.htm の
4 所得税の課税されない譲渡所得 の (1) 生活用動産の譲渡による所得 に
「家具、じゅう器、通勤用の自動車、衣服などの生活に通常必要な動産の譲渡による所得です。」
ってあるんだよね。
要はヤフオクで得た20万円が、まるまるプラスの所得なら申告しなさいって事だととらえられる。
例えば100万円で買ったものがヤフオクで120万円で売れたなら20万円の所得だからその分を申告しろ、と。
もし100万円で買ったものがヤフオクで20万で売れたんなら実質80万の損失だからこの場合は申告不要なはずなんだ。
123 :名無し二級:2018/01/26 20:11:58 (6年前) 0MONA/0人
つづき
これが事業者の納税申告なら損金として認められるから内訳を全部申告しなきゃいけないけど
個人の雑所得の申告の場合は所得額の記入欄しかないから、去年の損金とか申告できないのよね。
(実際雑所得の場合前年度の損金は認められないはず。)
ただ、これがサラリーマン等の勤め人ではなくて、山林や土地を自営で売買する業者の場合、
事業所得としての申告欄がない場合に雑所得で申告したら
もしかしたら損金やら赤字の繰り越しやらが認められるかもしれないけど
そういう事業者が必要な備品は雑所得での経費でなく
本業の経費で申告するだろうから問題にならないかもしれない。
この辺は税理士に聞くしかないね。
まぁ税理士にも考え方が違う場合もあるから税理士の答えがパーフェクトってわけでもないんだけどね。
124 :名無し四段:2018/01/26 20:58:12 (6年前) 0.00000114MONA/1人
税金の話はスレ違いなので
↓こちらでお願いします
【税金】国税庁 ビットコイン
http://askmona.org/5708
【悲報】マイニングで税金が発生する模様
http://askmona.org/7097
125 :名無し名誉名人教士:2018/01/26 22:49:36 (6年前) 1.27678526MONA/19人
色々工夫してみました。一応の完成形ってことで…
2.2.4-mod-r4
・GTX9xx以降で使用するメモリの1/3をローカルメモリで確保し、L1キャッシュを有効利用できるようにした。(2.2.4-mod-r2相当)
・それ以前のGPUで使用するメモリの2/3をローカルメモリで確保し、L2キャッシュを有効利用できるようにした。(2.2.4-mod-r3相当)
・CUDA8でも同様の改造を行い、Fermiでも高速化できるようにした。(Fermiは本バージョンでゴールしていいよね…?)
・--ecoオプションにて、以前のカーネルで掘れるようにした。消費電力上昇が嫌な人向け。(2.2.4-mod-r1相当)
ソロマイニング対応バージョン(2.2.4-mod-r4)
https://1drv.ms/u/s!Aud1FauQ46vHhz95NYbLOB2bQlOt
ソースコードはこちら
2.2.4-mod-r4(VisualStudio 2017 & CUDA9.1バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhz15NYbLOB2bQlOt
2.2.3-mod-r4(VisualStudio 2013 & CUDA8バージョン)
https://1drv.ms/u/s!Aud1FauQ46vHhz55NYbLOB2bQlOt
126 :名無し二級:2018/01/26 23:06:58 (6年前) 0MONA/0人
>>124
スレ汚し申し訳ない
127 :名無し二級:2018/01/26 23:15:18 (6年前) 0MONA/0人
>>125
DLさせていただいて試してみたのですがbatが開かないですぐ落ちるのですが
原因は何でしょう?
128 :名無し二級:2018/01/26 23:20:02 (6年前) 0MONA/0人
>>125
>>127自己解決しました。
実行ファイル名がbatファイルのexe名がccminer.exeのままでした。
今回同封されたexeファイル名で書き直したら動きました。
129 :エビ天国さん:2018/01/27 03:47:57 (6年前) 0MONA/0人
>>125
早速使わせていただいてます。r4安定してます。
GPU #0: 1838 MHz 220.17 kH/W 117W 77C FAN 74%
GPU #0: MSI GTX 1060 6GB, 26.04 MH/s
130 :名無し#三段:2018/01/27 05:51:06 (6年前) 0MONA/0人
>>125
素晴らしい。使わせていただきますよ~
131 :名無しnさん:2018/01/27 16:51:36 (6年前) 0MONA/0人
2.2.4-mod-r4 入れてみました。
GTX1050Ti 15.30MH/s → 16.10MH/s
安定してます。素晴らしいです。
132 :さくら007一級錬士:2018/01/27 17:46:31 (6年前) 0MONA/0人
2.2.4-mod-r4安定しています
GTX1060 3GBモデル
22.5から24MH/sこえ
最高です
133 :monamiさん:2018/01/27 20:04:58 (6年前) 0MONA/0人
2.2.4-mod-r4使わせてもらいました!
1070Ti 46.5MH/s→46.75MH/s
134 :名無し初段:2018/01/27 21:07:14 (6年前) 0MONA/0人
>>131 自分も1050Tiだけど r4にして14.5~14.7くらいなので羨ましい・・・・
135 :マルコフ連鎖四段:2018/01/27 21:50:52 (6年前) 0MONA/0人
2.2.4-mod-r4
GPU #0: 1405 MHz 173.78 MH/W 0W 64C FAN 28%
GPU #0: GeForce GTX 1050 Ti, 12.04 MH/s
これでもよくなってる。驚異の0W運用。
136 :名無しnさん:2018/01/27 22:41:35 (6年前) 0MONA/0人
>>134 AfterburnerでOCしてます。
137 :S A I 四段錬士:2018/01/27 23:22:19 (6年前) 0MONA/0人
GPU #0: 1618 MHz 295.04 kH/W 117W 63C FAN 41%
GPU #0: GeForce GTX 1070, 34.82 MH/s
r2からr4にしまして凡そですが1GPUあたり1Mh程良くなった?
感じですね
ただ以前の消費電力は確認してないのでwあたりの効率は不明
138 :名無し一級:2018/01/28 00:41:21 (6年前) 0MONA/0人
>>125
使わせてもらいました
GPU #1: GeForce GTX 1060 6GB, 23.99 MH/s
GPU #0: GeForce GTX 1080, 48.04 MH/s
r2より1~2%上がりました
139 :名無しさん:2018/01/28 01:12:05 (6年前) 0MONA/0人
>>125 いただきます
ccminer-2.2.4-mod-r2
GPU #0: 1572 MHz 409.62 kH/W 152W 47C FAN 65%
GPU #1: 1558 MHz 398.71 kH/W 155W 41C FAN 65%
GPU #0: MSI GTX 1080 Ti, 62.54 MH/s
GPU #1: MSI GTX 1080 Ti, 62.07 MH/s
ccminer-2.2-mod-r2-CUDA9
GPU #0: MSI GTX 1080 Ti, 64.51 MH/s
GPU #1: MSI GTX 1080 Ti, 64.62 MH/s
いずれも PL60% コア+180 メモリ+110
2.2.4系は2.2と比べて2MH/s程低くなるんですよね
それでも、kH/Wが見える安心感
140 :名無し二級:2018/01/28 01:57:06 (6年前) 0MONA/0人
>>125
4GPUで210~211だったのが214に改善しました
ありがとうございます
141 :名無しのマイナー初段:2018/01/28 15:35:09 (6年前) 0MONA/0人
>>125
8GPU(GTX1080Tix5,GTX1080x3)全てで1MH/s向上しました!
モナげしときますね。
142 :名無し名誉名人教士:2018/01/28 19:12:59 (6年前) 0MONA/0人
>>139
2.2系は32bit版なのよね…
過去スレでもあったけど、32bit版と比べて64bit版は少し遅いんだよね…
(Linuxではその現象は無いらしい…私は試してないけど)
そして、CUDA9.1は32bit版をVisualStudio2013環境じゃないと吐き出せない…
…32bit版も作るべき?
143 :名無し名誉名人教士:2018/01/28 19:22:33 (6年前) 0MONA/0人
ボトルネックがLyra2からcubehashに変わったため、これ以上Lyra2を改善しても、それほどハッシュレートが伸びないと予想される…
cubehashの高速化は、以前、できる限りのことはしてみたんだがね…
・cubehashは32個のuint32_tの加算、ローテーション、入れ替え、xorを1セットとして、2セット×164回繰り返している。演算自体は大したことないが、回数が多く、単純に時間がかかっている。
・基本的に入れ替え用のレジスタが必要なだけで、特にメモリアクセスが必要ない。(使用レジスタ数もかなり少ない)
・入れ替えについては、演算をアンロールしたついでに排除した(効果はあったのだろうか…?)
これを踏まえたうえで、なんかいいアイディアはないだろうか…?
144 :Rankoshi初段:2018/01/28 20:23:56 (6年前) 0MONA/0人
>>125
いつもありがとうございます。
1070は既出だけど、安定したんで報告します。
2.2.4-mod-r4
GPU #0: 1974 MHz 267.50 kH/W 153W 60C FAN 70%
GPU #0: GeForce GTX 1070, 41.35 MH/s
2.2-mod-r2-CUDA9から変更したとき、6時間ぐらいで発生するunknown errorに悩まされていたんだけど、
PowerLimit75%→80%に上げたら改善しました(電気食う?)。
145 :名無し二級:2018/01/28 21:01:28 (6年前) 0MONA/0人
マルチになりますが、温水に書き込んでしまったので、誘導で質問させてください。
http://askmona.org/4168#res_938
のレスです
マイニングの先輩方よろしくお願いします。
いまはCUDAのAPIのPATHと足りないものを中心に調べてます。
146 :かぷろらくたむ四段:2018/01/28 21:10:49 (6年前) 0MONA/0人
r2を使っててしばらくするとハッシュレートが下がるやつって部屋の気温が低いと下がり幅が少ない気がする
147 :きさらぎ八段錬士:2018/01/28 21:12:06 (6年前) 0.00004649MONA/1人
>>145
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7
これはどうです?
148 :ittou四段教士:2018/01/28 21:19:48 (6年前) 0.00001111MONA/1人
>>145
ドライバが古いとかエスパーしてみる。
149 :名無し二級:2018/01/28 21:43:48 (6年前) 0MONA/0人
>>147,148
cuda-repo-rhel7-9.1.85-1.x86_64.rpm
cuda_9.1.85_387.26_linux.run
NVIDIA-Linux-x86_64-384.111
あざます!
一応いろいろUSBに入れてあるんですが、見たら↑のファイルでした
いまの環境だと何が入るのかわかりにくかったのでリポジトリでやってます
cudaはリポジトリとrunファイルどちらがいいのでしょうか?
導入手順等はこことか参考にしてました
https://help.sakura.ad.jp/hc/ja/articles/115000122721
150 :名無しnanashi三級:2018/01/28 22:00:48 (6年前) 0MONA/0人
2.2mod-r2
1070×1
980×1
980は結構温度上昇します65℃から75℃
1070は安定してます。
151 :ななしーさん一級:2018/01/28 22:08:48 (6年前) 0.00005MONA/1人
>>149
cuda repoにあるドライバが対応してないのか、同じような状況になりました。NVIDIA-Linux-x86_64-384.111 入れた後に runファイル実行でよいかと。
152 :名無し二級:2018/01/28 22:24:25 (6年前) 0MONA/0人
>>151
過去に試したインストールのログをにらめっこしてたら
To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-9.1/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
っていうの見つけたので、全部削除してやり直してみます!
153 :名無し二級:2018/01/29 01:17:39 (6年前) 0MONA/0人
>>151
いけました(*´Д`*)
ありがとうございました
154 :光の名無し二段:2018/01/29 13:34:01 (6年前) 0MONA/0人
2.2.4 r4
[2018-01-29 13:26:17] accepted: 18/18 (diff 0.005), 1746.02 kH/s yes!
[2018-01-29 13:26:53] GPU #0: Zotac GTX 650, 1753.64 kH/s
[2018-01-29 13:26:53] GPU #0: 1058 MHz 52C FAN 21%
こんどはちゃんとコピペしてきた
155 :アンサンブラー三段:2018/01/30 04:58:47 (6年前) 0MONA/0人
2.2.4-mod-r4 をWindows10で運用しています。
導入して2回だけですが、なんのメッセージもなしにいきなり終了するようです。
ドライバーは最新、OCなども行っていません。プールは温水です。
おそらくなんのヒントにならないと思いますが、終了時のメッセージです。
[2018-01-30 04:02:00] GPU #0: MSI GTX 1060 6GB, 27.11 MH/s
[2018-01-30 04:02:01] accepted: 801/801 (diff 0.309), 27.06 MH/s yes!
[2018-01-30 04:02:04] Stratum difficulty set to 15.9963 (0.06249)
D:\API\ccminer-lyra-binaries>pause
続行するには何かキーを押してください . . .
156 :さくら007一級錬士:2018/01/30 21:09:26 (6年前) 0MONA/0人
>>155
機器の温度が100度超えてるのでは?
1万回以上 acceptedしても問題ないですよ~
157 :アンサンブラー三段:2018/01/30 22:29:15 (6年前) 0MONA/0人
>>156
長すぎたんでカットしちゃったんですが、画面内のログでは56度になってたので、おそらく温度の問題ではないと思います。
そもそも、エラーログなどがないので、やはり環境の問題の可能性が高いですね・・・
私の環境でも3000回は超えたのを確認した事があるので、回数とかの問題ではないとは思うのですが・・・
もし、続くようだったら、BATからpauseはずして、生存確認ツールでもつくってそこから動かそうかな・・・
158 :さくら007一級錬士:2018/01/30 22:51:49 (6年前) 0.00114114MONA/1人
>>157
自分だけ安定しないのは、原因探すのが大変ですね
私も以前のバージョンで落ちた時に、温度とかみて100度近くになっていてCPUファンが壊れていることにきがつきました
新しいCPUファンに変えてからは普通に動くようになったんですが
普通は常に100%の高負荷状態で運用することがないのでいろいろでてきますね
-t 4とかにして負荷下げてみたらどんなかんじですかね
159 :アンサンブラー三段:2018/01/31 15:16:19 (6年前) 0MONA/0人
>>158
ご指摘のとおり、-t4つけて動かしたところ
[2018-01-31 15:13:34] GPU T1: result for 451cbfb3 does not validate on CPU!
のようなエラー?ではなさそうですが、メッセージが大量に発生し、速度が大幅(1/50程度)に低下しました。
もともとのスレッド数がわからないのですが、4スレッドはあまりにも少ない数だったのでしょうか?
まぁ、なんにせよ、この速度ではとても常用する事はできないので、20分ほど動かしてあきらめました(;^_^A
160 :tako一級:2018/01/31 17:49:09 (6年前) 0.00114114MONA/1人
>>159
-tってCPU向けのコマンドだったような?
--intensity ccminerで検索すると情報色々出てくるのでどうぞ
うちは普段使いするPCなら-i16から18位にしてます
数値が高すぎてもダメなので、放置するPCでも20から22の間で安定する数値を選ぶと良いかもしれないです
161 :名無しさん:2018/01/31 20:59:56 (6年前) 0MONA/0人
ローカルでは240MH/sくらいだがプール上では180MH/sで安定するのはそんなもんかしら?
調べてもこれと言った解決法出てこないしいくつかプール変えても180MH/sのままだからもうダメポ・・・
162 :アンサンブラー三段:2018/01/31 21:09:47 (6年前) 0MONA/0人
>>160
ここの書き込みをみてて、ふと疑問におもったんですが、-iオプションでスレッドの数?を制限してパワーを制限するのと、Afterbunerなどでパワーリミットを制限するのって、どちらがいいのでしょうか?(もしくは、パワー制限したうえで、iオプションを使うのでしょうか?)
もしかしたら、まったく的外れな質問かもしれませんが、採掘歴2週間なのでご容赦くださいorz
163 :megane2001初段:2018/01/31 21:15:58 (6年前) 0.0039MONA/1人
>>162
-iだとminerだけの制限
Afterburnerだとminer以外のアプリケーションも影響受ける
自分はAfterburnerで軽く制限したうえで、PC使ってないときは-iなしのバッチ、PC使ってるときは-iで制限したバッチ、という具合にしてる
ま、参考まで
164 :tako一級:2018/01/31 21:24:40 (6年前) 0.0039MONA/1人
>>162
自分はAfterburnerでパワーリミット制限した上で、-iオプション使ってます
-iオプションは、GPUの優先度設定みたいなものと考えてます
数値を下げればデスクトップの描写が滑らかになる一方で、ハッシュレートを犠牲にするような感じで
使い方に合わせて色々試すと、謎のエラーも回避出来るかもしれません
165 :名無しさん:2018/01/31 21:38:30 (6年前) 0.0039MONA/1人
>>161
KlausT-8.18-r1なら解決する可能性があるので使ってみてくれませんか
自分の環境だと2.2.4-mod-r4だとプール上のハッシュレートがローカルより15%程度低くなって、KlausT-8.18-r1だとローカルとプール側でほぼ一致します
166 :shiroinu三級:2018/01/31 23:39:06 (6年前) 0MONA/0人
>>165 私も同じ状況でしたがKlausT-8.18-r1にしたら明らかにpoolでのハッシュレート上がってます
謎どうしてでしょう…
167 :名無し二級:2018/02/01 17:23:34 (6年前) 0MONA/0人
>>KlausT-8.18-r1
表示上で落ちているハッシュレートが一致するというのは、ブロック辺りの採掘量も増えてるいうことですか?
168 :名無し二級:2018/02/01 20:05:26 (6年前) 0MONA/0人
うちでKlausTでやってみたけどメモリエラーで落ちるんだよね・・・
iオプションで18とかまで下げれば動くんだけど
そうすると結局ハッシュ自体落ちちゃうんだよんぁ・・・
仮想メモリ容量ふんだんにとって-i19.2とかが限界だわ
169 :名無しさん:2018/02/01 23:45:40 (6年前) 0.00011411MONA/1人
>>167
質問が不明瞭に感じるので、少し詳しく書きますごめんなさい
私の環境ではKlausT-8.18-r1を使用した場合、同じintensityで2.2.4-mod-r4を使用するよりも、cmd.exe上に表示されるハッシュレートは落ちます。
しかし、プールに表示されるユーザハッシュレートはKlausT-8.18-r1の方が高くなり、KlausT-8.18-r1を使用した方が、ブロックあたりの採掘量が多くなります。
プールに表示されるユーザハッシュレートは、2.2.4-mod-r4を使用している場合、cmd.exe上に表示されているハッシュレートよりも明らかに低い値になります。
KlausT-8.18-r1を使用した場合のプールに表示されるユーザハッシュレートはcmd.exe上に表示されているハッシュレートとほぼ一致すると言う状況です。
170 :検証担四段:2018/02/02 01:20:16 (6年前) 0MONA/0人
>>169
うちの環境でも同じような結果が得られています。
トランザクションのMONA数も1割~2割程度多く受け取っていますね。
171 :名無し二級:2018/02/02 14:37:39 (6年前) 0MONA/0人
>>169
なるほど、ありがとうございます。聞き方が微妙でしたねw
マシン上でハッシュレートが落ちてもプールの表示で目減りしないから逆転すると。
しかも実際にブロック発見毎の採掘量も増えているんですね。
これは>>1さんに聞いたほうが良さそうな感じかな……。
172 :だれかさん七段教士:2018/02/02 15:47:48 (6年前) 0MONA/0人
これ、全く同じ難易度(固定難易度)で24時間採掘してみてシェア提出の回数を測らないとどっちが優位か言えないんじゃなかろうか・・・?
自分はそこまでやる気は無いから2.2.4-mod-r2使ってるけど・・・
173 :名無し三段:2018/02/03 02:09:13 (6年前) 0MONA/0人
名無し名人に質問いいでしょうか?
lyra2REv2.cu
>if (vhash[7] <= Htarg && fulltest(vhash, ptarget)) {
cuda_bmw256.cu
>if (((uint64_t*)message)[7] <= pTarget[3])
改造元ソースもそうなんですけど、cpu側で32bitで比較してるのに、gpu側で64bitで比較してる理由が思いつかないんですが、知ってたら教えてください。
174 :名無し名誉名人教士:2018/02/03 10:41:01 (6年前) 0MONA/0人
>>173
GPU側では、時間短縮のため64bitのみ比較しています。(32bitでも良いんだけどね…)
CPU側では、256bitがちゃんと合っているか確かめるためにfulltestを行っています。
(とはいえ、いまのDiffなら64bitで十分じゃないかな?)
175 :名無し二級:2018/02/03 11:59:25 (6年前) 0MONA/0人
>>172
どちらが優位という話ではなく、プール上の表示通りに"実際に落ちている"なら、何か問題がある可能性はないのかしら?って疑問浮かびません?
何か問題があるなら修正すれば2.2.4-mod-r2の性能アップってことになるのでは?
プールマイニングはそういうものという理由でも構いませんが、それならなぜ表示上で落ちるのか理由が知りたいですね。
納得できる理由が使う側としてはなんでもいいですし。
176 :名無し二級:2018/02/03 12:04:28 (6年前) 0MONA/0人
>>175
個人的な推測の域でしかないけどアクセプトして送ってる情報量の差じゃね?
177 :だれかさん七段教士:2018/02/03 15:09:53 (6年前) 0MONA/0人
>>175
これ良くある質問だから、多分過去ログとかにもあるから本来なら漁ってほしいんだけど・・・
プール側ハッシュレートは、提出されたシェアを元にした”推定”ハッシュレートだから、プール側ハッシュレートは真のハッシュレートじゃないよ
コマンドプロンプト等で表示される奴は真のハッシュレートだろうけど。
だから自分はプール側ハッシュレート何て気にしない。
178 :ヌコッティ六段:2018/02/03 15:56:47 (6年前) 0MONA/0人
>>175
プール上のハッシュレートは、例えばハッシュ計算したら確率的に10億分の一で見つかる問題を出す。
この問題はもしかしたら1秒で解けるかもしれないし60秒かかるかもしれない。
プール上とCLI上で差分が出る理由は大きく3つあって、1. 確率 2. 問題の更新 3. 遅延
1. 確率的に10秒で解ける問題が数十秒かかっちゃった時、これは時間をかければ収束するはず。
2. 問題の更新は、計算していたら他のプールがハッシュを見つけて、問題が変わった時。計算していて未提出のシェアは無駄になる。
3. 遅延はシェアを提出してからプールに届くまでの時間。数十~数百msなんだけれどもこの間に問題が更新されると無駄になる。
179 :名無しモナー( ´∀`)三級:2018/02/03 16:45:36 (6年前) 0MONA/0人
これまでccminer-2.2-mod-r2-CUDA9を使っていた者です。
r4を導入したのですがbatが開かなくてすぐに落ちてしまいます。プールは温水を使っているのですが、普通にbatファイルを書き直しても動かず、温水のbatファイルの書き方通りにしたりといろいろしてみても動きませんでした...
どうやったら動くでしょうか?教えていただけるとありがたいです。
一応batファイルの中には↓のように書きました(動かなかった)
batファイル名は一度RunMe.batにしてみましたが動きませんでした。
ccminer.exe -a lyra2v2 -o stratum+tcp://onsui-monacoin.xyz:3032 -u aaausubbb.kansai -p vvvv0098
180 :名無し三段:2018/02/03 16:54:14 (6年前) 0.00111111MONA/1人
>>179
呼び出すexeがccminer.exeからccminer_2.2.4_CUDA91_VS2017_x64.exeに変わってるからそこを変えればいけるはず?
181 :名無しモナー( ´∀`)三級:2018/02/03 17:05:49 (6年前) 0MONA/0人
>>180
ccminer.exeをccminer_2.2.4_CUDA91_VS2017_x64.exe変えたら動きました!
ありがとうございます!
182 :IloveRingo四段:2018/02/03 17:05:50 (6年前) 0MONA/0人
>>180
それ
183 :minitonyさん:2018/02/03 17:40:53 (6年前) 0MONA/0人
175さんはハッシュレートに差があることを問題にしているのでは
なく、性能アップの余地について関心があるんですよね。
KlausTのccminerはローカルのハッシュレートを少し犠牲にして
プール側に仕事をたくさん伝達できる、何か性能アップの秘密が
あるんじゃないかと。(私は分かりませんが)
話はそれますが、昨年末ExcavatorでMONAを掘った時の設定をブログに
書いてます。
https://plaza.rakuten.co.jp/minitony/diary/20171209/
ローカル表示のハッシュレートは追求できるかもしれません。
184 :だれかさん七段教士:2018/02/03 18:41:35 (6年前) 0MONA/0人
>>183
ローカルのハッシュレートを犠牲にしたらシェアを提出できる回数減るけど・・・
結局は確率上の問題だからね・・・
自分はこう考える、KlausTのを使った時にたまたま運が良くシェア提出の回数が多く、その時のプール側表示ハッシュレートを見てKlausTのほうが良いと思っているのではないか、とね。
シェア自体も、結局は実際のブロック難易度より低い仮想ブロックを掘らせ、それが提出できたら、大体この程度のハッシュレートを出しているだろうっていうものに過ぎない。
そりゃ運良くシェアを多く提出できた時にプール見りゃ表示ハッシュレートは高いだろうよ。
185 :minitonyさん:2018/02/03 21:15:05 (6年前) 0MONA/0人
とりあえず、私には検証実績も予定もありません。あしからずです。
186 :だれかさん七段教士:2018/02/03 21:21:56 (6年前) 0MONA/0人
実は私も検証してないですし、今後する気も無いです・・・
検証して証明する以外に実際の答は出ないんですが、
多分これをやる意味のある人は100台ぐらいGPU持ってる人でしょうな・・・
自分はそこまで持ってないし、クラウドマイナーだから実機の人が何しようが本当はどうでも良いっちゃどうでも良いのかもしれないけど・・・w
187 :名無しさん:2018/02/03 22:08:26 (6年前) 0MONA/0人
>>168
プロセスを監視するbatファイルを作って落ちたら再起動させるさせるようにすればいいですよ。
188 :名無し二級:2018/02/03 23:02:51 (6年前) 0MONA/0人
>>186
やっとこ帰宅しました。
とりあえずプログラムの差による検証はないみたいですね(ソースでわかるもの……?)
異常のあるなし関係なく、そん時そん時の推定だからプール上の表示はブレブレで当たり前ということなんですね。
とりあえず無心でマイニングしてみます。
あとハッシュレートで検索してたんですが、シェアで調べたら似た様な話題発見しました(汁)
暇なときに1から念入りに読み込んでみます。(まずそうするべきでしたが)
色々な説明ありがとうございました。
189 :名無しさん:2018/02/04 23:15:22 (6年前) 0MONA/0人
何もエラーログ吐かずに終了するの俺もよくなるんですが、
batの最後でbat自身を呼び出すようにして無限ループで無理やり動かしてる
そのうち壊れそうで怖い
温度は70度ぐらいだし-iオプションを極端に下げても発生するんですよね
mod-r1、r2、r4どれでも起こるし、
他に何か対策ありますかね…
190 :さくら007一級錬士:2018/02/04 23:36:14 (6年前) 0MONA/0人
私は6年前に購入したパソコンに
当時GTX460がのってたものを
GTX1060 3GBに変更して使っています
2.2.4-modを24時間体制で稼働させてますがR4になって一度もエラーで落ちたことないです。
パソコンが壊れてるのではないでしょうか。
私のパソコンも70超えてます。
CPUもcore7i 860で化石みたいな代物ですが、bitzenyも掘らせてもらってます。CPUは90度超えてます。
こんな状態でも24時間放置稼働可能ですよ~
夏場はどうなるか心配ですがね
191 :miner五段:2018/02/04 23:37:03 (6年前) 0MONA/0人
>>190
CPU90度越えは怖いのでは?
192 :さくら007一級錬士:2018/02/04 23:38:19 (6年前) 0MONA/0人
ちなみに私のパソコンは速度制限はかけてない
フルパワーで24時間です!
BTOで購入した普通のディスクトップパソコン(6年前12万円ぐらい)です。
193 :名無し二級:2018/02/05 00:32:03 (6年前) 0MONA/0人
>>189
グラボに起因するエラーだとエラーのメッセージ出たりするけど
そういうのは一切なし?
もし問題の切り分けするのなら一度グラボのクロック下げたり
iオプション下げて安定稼働するかどうか試してみたら?
194 :アンサンブラー三段:2018/02/05 02:57:16 (6年前) 0MONA/0人
>>189
たいした消費量ではないんですが、BATの再起呼び出しだとメモリ開放が行われないので、メインメモリがどんどん消費されていきます。
頻度はそれほどでもないんですが、たまーに手動で完全に停止させる事をやったほうがいいと思います。
ちなみに私は、プールやワーカー、iオプションの数値の切り替えなども行えるプロセス管理ツールを作りました。
VBの開発環境がないんで、さくっとAccessでつくっちゃったんで微妙ですが(;^_^A
それつくってから、まだ一度も落ちないとゆう・・・
自動起動回数のカウントとか作りこんだのにw
ちなみに、気がの功名なのか、1060 6G の場合、i21だと最速じゃなくて、i22で最速になって、若干ハッシュレートがあがったとゆうおまけがつきました。
195 :ittou四段教士:2018/02/05 12:13:43 (6年前) 0MONA/0人
水冷で最近60℃近く行くようになったので、ラジエータを大掃除した。
40℃切るようになった。
掃除は大切ですな。
196 :名無し二級:2018/02/05 14:03:36 (6年前) 0MONA/0人
>>190
CPUクーラーを今すぐグレードアップした方がいい気がします!
197 :鰯二段:2018/02/05 15:38:00 (6年前) 0MONA/0人
CPUクーラーも大切ですが、VRMの冷却も忘れないようにしてください……
特にまな板でサイドフローを使っているとマザーボードに負荷がかかって発火の原因になるかもです
198 :名無し二段:2018/02/05 18:47:22 (6年前) 0MONA/0人
51%攻撃もう少しですね
http://mona-coin.com/
199 :名無し一級:2018/02/05 19:54:06 (6年前) 0MONA/0人
diff10万近くなってる…
200 :名無しさん:2018/02/05 21:18:26 (6年前) 0MONA/0人
>>193
ほんとに何もなかったかのように止まるだけなんですよね
まだ始めたばかりなので設定いじくりまわして色々やってみますー
>>194
それは知らなかった!気をつけます。
ありがとうございます
201 :名無し六段教士:2018/02/06 11:34:52 (6年前) 0MONA/0人
家の中にGT 220があったから掘ってみようかと思ってドライバ入れて、Cudaも入れたけどグラボがcudaに対応してないって出てくる…対応してるはずなんだけどなぁ…
202 :名無し名誉名人教士:2018/02/06 12:02:19 (6年前) 0MONA/0人
>>201
GT220はFermiより古いので動作しません。
どうしても必要な場合はかなり古いバージョンに手を出す必要があります。
なお、Fermiより古いGPUは以下の理由によりお勧めしません。
・シェアードメモリが16kBしか確保できない。そのため、1Warpしか起動できず、レイテンシの隠ぺいができない。
・L1/L2キャッシュを搭載していないため、ローカルメモリは全て低速なメモリへアクセスすることになります。
・(Fermi含む)スレッド間のデータのやり取りにWarpShuffleが使用できず、シェアードメモリを経由する必要がある。(レジスタ退避⇒転送⇒レジスタ復帰、の3プロセス必要となる)
・(初期型Kepler含む)ローテーション処理にFunnelShiftが使用できず、複数命令に分解する必要がある。(右シフト⇒左シフト⇒OR処理)
・(GeForce 8800 GTS初期型/8800 GTX/8800 Ultraのみ)atomicExchが使用できず、データの上書き(データ破壊)が発生する恐れがある。
203 :名無し名誉名人教士:2018/02/06 12:07:04 (6年前) 0MONA/0人
>>201
ちなみに、テスト環境を整えようとGT210を買ったのは苦い思い出…
GT610(Fermi)、GT710(Kepler後期型)も購入済み。もはやテスト用にしか使えません…
204 :鰯二段:2018/02/06 13:25:39 (6年前) 0MONA/0人
9800GTシリーズ末期からGTX1~300番台のリネーム祭り、Fermi、nvidiaはKepler登場まで劣勢でしたからねー……
それでもFermiのDx12対応とか旧世代のサポートを継続するのは意地があるというか、根性があると思います
FermiアーキテクチャのTeslaが未だにスパコン業界で使われているからでしょうかね?
205 :名無しさん:2018/02/08 22:24:53 (6年前) 0MONA/0人
とうとう、Windows Defenderでもはねられるようになってきた・・・
206 :名無し初段:2018/02/09 20:50:51 (6年前) 0MONA/0人
1050Tiだけじゃ力不足を感じてたのと
1060 3GBの展示品が処分価格であったので調達
2枚指してマイナーはr4使って
2枚で38.2MH/sくらいですねー
こんなものかな?
207 :だれかさん七段教士:2018/02/09 20:55:24 (6年前) 0MONA/0人
自分は1060 3GBが1枚だけど、24MH/s出る・・・
ちょっと低くない・・・?
208 :名無し初段:2018/02/09 21:28:26 (6年前) 0MONA/0人
書き忘れてた 1050Ti+1060の2枚指しです・・・・・
209 :Rankoshi初段:2018/02/09 22:13:32 (6年前) 0MONA/0人
1050TiのSM数は6つで、1060 3GBの3分の2しかないので
24MHz/s * 2/3 + 24MH/s ≒ 40MH/sぐらいじゃない
http://www.4gamer.net/games/251/G025177/20161022012/
210 :だれかさん七段教士:2018/02/10 17:15:52 (6年前) 0MONA/0人
あ、そうか、1060と1050Tiなら大丈夫だわ
1060が2枚だと勝手に勘違い・・・
失礼致しました。
211 :検証担四段:2018/02/13 13:13:38 (6年前) 0.00114114MONA/1人
>>170です。>>165さんの疑問を実機を使って検証してみました。
検証方法はGTX1060を二枚用意して直挿しし、
2.2.4-mod-r4とKlausT-8.18-r1をGPU指定コマンドを用いてそれぞれ一枚ずつ同時に24時間採掘
GPUの石の影響を排除するため、24時間後にGPU指定コマンドを入れ替えてもう一度24時間採掘しました。
検証期間は2/11の昼12時から2/13の昼12時までです。
マイニングプールは温水プール様のメインアカウントとサブアカウントを使用しました。
GPUはZOTAC AMP ED. PL70% OC175MHzです。
結果として、
マイナー上のハッシュレートは2.2.4-mod-r1の方が1~2%高く表示されるが
プール上のハッシュレート及びトランザクションはKlausT-8.18-r1の方が10~20%高くなる。
となりました。
検証結果をまとめたもの(と言うか羅列)を貼りたいのですけど画像ってどうやってアップロードすればよいのでしょうか?
212 :アンサンブラー三段:2018/02/13 13:29:50 (6年前) 0.00114114MONA/1人
>>211
AskMona初心者講座
https://askmona.org/689
ここに画像の張り方が説明してありまーす。
213 :検証担四段:2018/02/13 14:27:01 (6年前) 1.37666829MONA/7人
>>212 ありがとうございます
1日目の結果
https://imgur.com/cR44VXz
2日目の結果
https://imgur.com/LzK8nxm
トランザクションの比較
https://imgur.com/UXvIlra
左が2.2.4、右がKlausT-8です。
ワーカー上のハッシュレートは大きく違いませんがプール上のハッシュレートグラフ及びトランザクションは無視できないほど乖離しています。
なぜでしょう。。。?
214 :Trish-G四段教士:2018/02/13 18:08:49 (6年前) 0MONA/0人
>>213
検証お疲れ様です。素晴らしい検証手法ですね。
たしかに有意に差があるみたいですね。
ハッシュレートは高いのにスループットが悪いというのはどこかにボトルネックがありそうですね。
マイナーに栄光あれ!
215 :さぎり二段:2018/02/13 18:24:41 (6年前) 0MONA/0人
単位計算が2^10と10^3に差異が出てしまっているとか安直に思い付きましたが、
マイナーによって違うって普通ないですよねー。
GHashでも7.4%位しか差異でませんし。
216 :ittou四段教士:2018/02/13 18:53:11 (6年前) 0MONA/0人
うちの環境だと何故かKlausTは動かないので、検証出来ないな。。。
217 :名無し四段:2018/02/13 20:49:02 (6年前) 0MONA/0人
>>213
検証乙です
記録は残してませんが
半日づつの稼働でプール(温水)側でのハッシュレートグラフに変化があったのは自分も確認してます
原因が特定出来ればいいけど、いかんせん知識が追い付かない
218 :名無し二級:2018/02/13 21:48:07 (6年前) 0MONA/0人
検証乙。
>>186の興味が欠片もないのに口出してるのと確率云々で黙らせようとしてるのが今になって笑えてきた
仕組みのせいなのかたまたま(笑)なのかしらんけど、性能アップの余地が本当にあるといいな
219 :名無し名誉名人教士:2018/02/13 22:36:34 (6年前) 0.0057121MONA/5人
検証結果がKlausT優勢だったので、ベースをそちらにしてみました。
KlausT-8.20-mod-r1
https://1drv.ms/u/s!Aud1FauQ46vHh0N5NYbLOB2bQlOt
ソースコードはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh0J5NYbLOB2bQlOt
220 :名無し名誉名人教士:2018/02/13 22:50:42 (6年前) 0MONA/0人
今回はソロマイニングも実装しました。
ただ、ブロック掘り当てまでは確認していないので、自己責任でどうぞ…
あと、ecoモードも搭載しました。(--eco)
これを使うと、2.2.4-r1相当のコードで掘れるようになります。
(電力効率がいいみたいなので、一応搭載しています。)
なお、Fermiの方は申し訳ありませんが、前バージョンをお使いください。
本家KlausTがFermiに対応していないようでしたので…
221 :takeo_3841三段:2018/02/13 23:43:22 (6年前) 0MONA/0人
>>219 いつもありがとうございます。
早速使ってみましたが、-d 1指定でGTX1060を選んでbatを起動すると下記エラーが出てマイニング出来ませんでした。
GPU #1: Cuda error in func 'bmw256_cpu_hash_32' at line 309 : an illegal memory access was encountered.
-d 0でGTX1080を使うと問題なし、-dオプションを使わず1080と1060同時にマイニングに使うとエラーは出ませんでした。ccminer-KlausT-8.18-r1でこのエラーは出ませんでした。
環境はWin10Home64bit グラボはGTX1060(映像出力)とGTX1080、vippool 初期diff16
222 :名無し名誉名人教士:2018/02/14 06:35:47 (6年前) 0MONA/0人
>>221
なんでだろう…
bmw256は8.18から変えてないんだけどな…
223 :名無し一級:2018/02/14 07:49:14 (6年前) 0.00000001MONA/1人
>>219
使わせてもらいました
GPU #0: GeForce GTX 1080, 48.06 MH/s
GPU #1: GeForce GTX 1060 6GB, 23.67 MH/s
2.2.4-mod-r4に比べてマイナー上では1%ほどレート下がりましたが、プール上では明らかに上がってますね…(23:30あたりから
224 :名無し三段:2018/02/14 10:29:14 (6年前) 0.00000001MONA/1人
俺の所も >>221 と同じ事象が起きたな
0:GTX1080ti
1:GTX1060
2:GTX1070
で、-d 0以外がエラー
225 :だれかさん七段教士:2018/02/14 10:50:57 (6年前) 0MONA/0人
ふむ・・・流石に実験されたとなるとそれは正直に自分が間違っていたことを認めざるを得ない。申し訳無い。
>>218
まぁそう言わないでくれ・・・
226 :だれかさん七段教士:2018/02/14 10:50:57 (6年前) 0MONA/0人
ふむ・・・流石に実験されたとなるとそれは正直に自分が間違っていたことを認めざるを得ない。申し訳無い。
>>218
まぁそう言わないでくれ・・・
227 :だれかさん七段教士:2018/02/14 10:54:16 (6年前) 0MONA/0人
ミスって二重投稿した上に途中だったので。
一応、黙らせようとしたつもりはないし、興味が欠片もないわけではないということは言っておく。興味があるからこそ発言していたわけであって。
しかし、そうなると今度はなぜハッシュレートの表示が高いほうが性能が悪いかの疑問があるところ。流石に24時間実験したとなると確実にKlausTのほうが良いことにはなる。
シェアが多く反映されているとなると本当はそっちのほうがハッシュレートが高いのではないかと考えざるを得ないレベルになってくる・・・
228 :名無し二級:2018/02/14 11:35:53 (6年前) 0MONA/0人
うちで>>219試してみたけど
やっぱり-iオプション付けるとbat落ちるからiオプション外したら動きましたね。
でもbat上の数値は2.2.4の方が3割以上上ですね。
仮にプール上のハッシュが1割上がってもbat上で3割落ちてるので
うちだと2.2.4の方がいいのかなぁ?と。
あと、2.2.4使うとタスクマネージャ上のGPU使用率は20%くらいなんですが
KlausT-8.20-mod-r1だと98%とかになりますね。
229 :だれかさん七段教士:2018/02/14 11:41:06 (6年前) 0MONA/0人
ちょい自分も実験してみる・・・
ただし、採掘機械がメインPCだから1時間ずつしかできないけど、
"同じ時間採掘させ、その時掘っていた全ブロックのシェアの合計"
が、どちらのほうが高いかやってみる。
(もちろん、シェアが混じらないよう掘るブロックは別々にしておく)
尚、KlausT-8.18も、2.2.4-mod-r2も同じ-iオプションでやってみます。
仮に2.2.4-mod-r2のほうが低い値が出たとしてもちゃんと公開する。
流石にここまでされたら自分も確かめたくなってきた。勝ち負けとかじゃなくて興味本位でね。
230 :名無し二級:2018/02/14 12:21:09 (6年前) 0MONA/0人
うちの環境(CPU celeron G3930 / mem 4GB / GPU 1080-x6,1080ti-x1,1050-x1)での違いを書いてみる。
bat上ハッシュ / 2.2.4-mod-r2 約330Mh / KlausT-8.20-mod-r1 約260Mh
タスクマネージャGPU使用率 / 2.2.4-mod-r2 約20~22% / KlausT-8.20-mod-r1 約98~100%
プール上(温水)上のハッシュ / 2.2.4-mod-r2 約180Mh~約480Mh / KlausT-8.20-mod-r1 約260Mh~約330Mh
簡易電力計消費電力 / 2.2.4-mod-r2 約1150W前後 / KlausT-8.20-mod-r1 約1050W前後
GPU温度 / 2.2.4-mod-r2 約75℃前後 / KlausT-8.20-mod-r1 約50℃前後
なんかこう書くとハードの使い方に違いがあるのかな?
まさかGPUだけじゃなくCPUやメインメモリの影響あったりする?
231 :ittou四段教士:2018/02/14 12:24:08 (6年前) 0MONA/0人
ちょっとUbuntu16で試してみたけど、エラーが出て掘れない。
[2018-02-14 12:21:23] GPU #1: EVGA GTX 1080, 55.95 MH/s
[2018-02-14 12:21:23] GPU #0: EVGA GTX 1080, 55.61 MH/s
[2018-02-14 12:21:28] GPU #0: result does not validate on CPU!
[2018-02-14 12:21:29] GPU #0: result does not validate on CPU!
Klaus版、動かないなぁ。何が悪いんだろう。
232 :ittou四段教士:2018/02/14 12:29:12 (6年前) 0MONA/0人
https://github.com/KlausT/ccminer/issues/84
ここで話題がある。あなたのシステムが悪いとか言われてる・・・まぢか?
233 :ittou四段教士:2018/02/14 12:41:01 (6年前) 0MONA/0人
-iを調整してもNG。--ecoを付けてもNG。
また2.2.4-mod-r2に戻ろう。。。
LinuxでKlaus版動かしている人、居ますか?
234 :ittou四段教士:2018/02/14 12:55:43 (6年前) 0.00114114MONA/1人
--no-cpu-verify付けたら動きました。
https://github.com/KlausT/ccminer/issues/69
235 :にゃんこ初段錬士:2018/02/14 15:35:24 (6年前) 0MONA/0人
win7 1070一枚 温水プール
KlausT-8.20-mod-r1 使わせてもらいました。ありがとうございます
ワーカ情報のハッシュレートは上がりました。ついでにブロックも発見!
おま環かもしれませんが2.2.4-mod-r4よりCPUのワットが10W低下
236 :名無し二級:2018/02/14 15:52:24 (6年前) 0MONA/0人
>>235
うちもKlausT-8.20-mod-r1だと若干消費電力下がりましたね。
237 :名無しさん:2018/02/14 16:33:51 (6年前) 0MONA/0人
1060x1,1070x3,1070Tix2,1080x1,1080Tix1
これで>>230 さんと同じようなハッシュレートです。
きになったのがこの表示
[2018-02-14 16:03:24] GPU #0: GeForce GTX 1080 Ti, 41.01 MH/s
[2018-02-14 16:03:24] GPU #0: GeForce GTX 1080 Ti, 35.23 MH/s
1070Ti以上のハッシュレートが下がり表示頻度が増えました。
1080と1080Tiは連続して表示されることが多いです。
2.2.4-mod-r4で 63だったのが KlausT-8.20-mod-r1 で41+35 であってるなら
プール20%増しの理由になるかと。
238 :だれかさん七段教士:2018/02/14 17:17:38 (6年前) 0.00114114MONA/1人
というわけで1時間ずつで測ってみたら本当にKlausT-8.18のほうがシェアが何故か多く提出できてた。-iオプションは同じ値を使用しており、メモリ周波数等は同じ値であることを確認している。
KlausTのシェア合計及びコマンドプロンプト画面
mod-2.2.4-r2のシェア合計及びコマンドプロンプト画面
ただし、今回難易度を固定せずにvardiffで測ってしまったので、次はLAPoolで固定難易度で測ってみる・・・(固定にしたほうが恐らくは精度が向上する。)
とりあえずそれは明日やる。
でもそうすると本当に不思議だ。なぜハッシュレートが出てないほうが多くのシェアを提出できるのか。1時間ならともかく24時間もやったならば確実に運によるばらつきは排除されたと見てよいのだが・・・
239 :だれかさん七段教士:2018/02/14 17:19:12 (6年前) 0MONA/0人
あ、ついでに、
KlausTのシェア合計が4751
2.2.4-mod-r2のシェア合計が3429
です。
やっぱり面倒がらずに自分でやってみるものだな・・・
240 :名無しさん:2018/02/14 19:36:55 (6年前) 0MONA/0人
アフターバーナー上で見てもKlausTではGPU使用率100%近くまで安定して出ますね
2.2.4-mod-r2までのマイナーだと使用率はほぼ99%なんですけど0%まで落ち込む瞬間が約5分間で10回近く出るので安定してるとは言い難いのかな?
また、>>230でも触れらてますがタスクマネージャーで使用率を見てみると、私の環境でも2.2.4-mod-r2では20%なのに対しKlausTではほぼ100%の値が出ています。
グラボはgtx1050です
241 :名無しさん:2018/02/14 19:55:10 (6年前) 0MONA/0人
タスクマネージャーの件は>>7で触れられてましたね…すみません
それと、gtx660で起動するとエラーが出てダメですね
Cuda error in func 'cubehash256_cpu_hash_32' at line 279 : invalid argument.
stopping 1 threads
restarting GPUs
Stratum connection interrupted
こんなエラーが出るんですが…Keplerは対応してないんですかね?もし対応してないことが今までに言及されてたら申し訳ないです
242 :ittou四段教士:2018/02/14 20:59:07 (6年前) 0MONA/0人
うーん。確かにKlaus版の方がプールでのレートは出ているんだけど、booooが増えたので精神衛生上宜しくないかなぁ。
ちょっと--ecoで試してみよう。
243 :名無し三段:2018/02/15 01:13:06 (6年前) 0MONA/0人
どこらへんがネックでこの事象が起きてるんかなぁ
244 :検証担四段:2018/02/15 08:51:46 (6年前) 0MONA/0人
もなげしてくださった方ありがとうございます。
シェア数までは見てなかったですね。次やるときはそれも確認してみます。
プールの統計上で表示されるランキングのシェア数って、ブロック発見ごとにリセットされるのでしょうか?
245 :sinono初段:2018/02/15 10:32:45 (6年前) 0MONA/0人
アップデートありがとうございます。
KlausT-8.20-mod-r1だとハッシュレートがKlausT-8.18-r1より落ちてしまいます(1080で41MHz→31MHz)
1070は2%ほど上がりました。
私の環境のせいだと思いますが謎ですね。
246 :名無し二級:2018/02/15 11:57:31 (6年前) 0MONA/0人
KlausT-8.18-r1やってみたけど確かにKlausT-8.20-mod-r1よりかはbat上のハッシュは上がった。(KlausT-8.20-mod-r1 31MH / KlausT-8.18-r1 41MH)
だけどプール上でのハッシュはあんまり振るわなかったなぁ。
うちだとやっぱり2.2.4-mod-r4のほうが波はあるけどハッシュ高めだなぁ・・
(プール上平均 2.2.4-mod-r4 290Mh / KlausT-8.18-r1 240Mh)
ただしbat上のハッシュとプール上のハッシュの開きが少ないのはKlausTだねぇ。
でもKlausT-8.18-r1はセキュリティでウィルス反応出ちゃうね。
KlausT-8.20-mod-r1だと出ないんだけどなぁ。
247 :だれかさん七段教士:2018/02/15 13:10:46 (6年前) 0MONA/0人
ブロック発見毎に(Orphanでも可)シェアが0に戻ります。
発見済みのブロックのシェアを確認すれば良いです。StatisticsのRoundのところに発見済みブロックのシェア数が書いてある
1時間ならこれで良いけど、24時間となるとブロック発見数も多く結構大変かもしれないけど・・・
248 :名無しさん:2018/02/15 16:28:31 (6年前) 0MONA/0人
KlausT-8.20-mod-r1ですが、GPUを指定する-dのオプションがうまく動かないですね。
KlausT-8.18-r1や2.2.4-mod-r4は全く問題ないんですが。
249 :名無し名誉名人教士:2018/02/15 20:52:37 (6年前) 0MONA/0人
>>248
私の環境では確認できないんですよね…
どうしたものか…
250 :nasaya二段:2018/02/15 22:24:46 (6年前) 0MONA/0人
ソロマイニング始めたいんですけど、受け取りアドレスはウォレットからじゃないとダメなんでしょうか?直接bitflyerとかのアドレスに送り付けることは可能でしょうか?
251 :ぐり七段教士:2018/02/16 14:47:15 (6年前) 0MONA/0人
OneDrive は、コンピューターに悪影響を与える可能性のあるウイルスが ccminer-KlausT-8.20-mod-r1.zip に含まれていることを検出したため、ダウンロードを中止しました。
と出てしまって >>1 のKlausT-8.20-mod-r1が落とせないので2.2.4-mod-r1を使わせていただいてます。
今週WindowsUpdateでマイニングPCを再起動したついでに2.2-mod-r1から更新してます。
252 :アンサンブラー三段:2018/02/17 05:59:37 (6年前) 0MONA/0人
>>251
もともとウィルス認定されてたんだけど、OneDriveからダウンロードされるファイルもチェックされるようになってますね。
今後、マイナーソフトの配布方法を考えないといけないって事ですかねぇ
253 :鰯二段:2018/02/17 12:03:19 (6年前) 0MONA/0人
Githubでの配布に戻されるのも一つの手段ではないかと
nicehashminerlegacyの同梱ccminerとして採用されていることですし、これを利用してモナの存在を拡散できればと思った瞬間でした
254 :名無し二級:2018/02/19 16:10:58 (6年前) 0MONA/0人
2.2.5ってどうなんでしょ?
255 :名無し名誉名人教士:2018/02/20 06:57:04 (6年前) 0.00114114MONA/1人
久々の更新
cpuminer mod-r9
https://1drv.ms/u/s!Aud1FauQ46vHh0R5NYbLOB2bQlOt
更新履歴(概略)
・neoscryptの高速化
・yescryptでSSE2を使う
256 :検証担四段:2018/02/20 08:15:04 (6年前) 0MONA/0人
ハッシュレートとシェアの比較を試みたのですが
家の環境ですとKlausT-8.20-mod-r1がうまく動かないですね。
マイナー起動後数分でパソコン自体がフリーズします。
新しいバージョンがリリースされたらもう一度やってみます
257 :名無し二級:2018/02/20 18:19:25 (6年前) 0MONA/0人
あぁ・・・
Win10のセキュリティ、勝手に2.2.4-mod-r4消してくれやがる・・・
除外指定めんどくせぇなぁ・・・
258 :名無しさん:2018/02/20 20:15:53 (6年前) 0MONA/0人
こっちのマカフィーさんも、ディレクトリ移動させると
駆除しましたと得意げに報告してくれます。
259 :ねずみ五段:2018/02/22 09:37:06 (6年前) 0MONA/0人
KlausT-8.20-mod-r1がonedriveでウイルスと判定されてダウンロードできなくなっていますよ
260 :モナキンパンプアップ二級:2018/02/22 14:40:46 (6年前) 0.04150298MONA/3人
数日前に非力なマイニングを始め、今日askmonaに登録しました。無知な私ですので皆様よろしくおねがいします。
261 :モナキンパンプアップ二級:2018/02/22 22:53:58 (6年前) 0MONA/0人
おお!お礼が遅れてしまい申しわけありません。なんて素敵な4649!
262 :ひげたま二級:2018/02/22 23:09:17 (6年前) 0.00004649MONA/1人
設定間違っているのかなぁって思いながら、20日目にして初ソロマイニング成功(*'ω'*)
263 :名無しさん:2018/02/22 23:44:48 (6年前) 0MONA/0人
今日はじめてマイニングを始めてみました。
最新版のものはウィルス判定されて落とせなかったので、落とせる古いバージョンのものを使用して悪戦苦闘すること数時間、ようやくyes!の文字を拝めました。
マカフィーさん、ドヤ顔で隔離しました報告しないでくださいよ…。
決していいスペックのPCではありませんが、コツコツと掘っていこうと思いますので、よろしくお願いします。
264 :名無しさん:2018/02/23 00:35:33 (6年前) 0MONA/0人
2年くらい前、いろんなとこからマイニングソフトをゲットしてたけど、ことごとくウイルス警告をくらって、断念しかけた淡い思い出。
たしか、ここAsk Monaでマイニングソフトそのものがウイルス判定食らってて、過去に誰かが他所様のPCで勝手にマイニングさせてた経緯からそうなってるって知って、やっと理解できた。
というか今、流行中らしいですね。
抗ウイルスを調教するのは面倒だけど、やむなしかな
265 :PerlLove初段:2018/02/23 03:33:51 (6年前) 0MONA/0人
>>259
ウイルス判定されるのは本当に困りますよね。
ちょっと負荷かけちゃうのですけど、複数ファイルを同時ダウンロードしようとするとすり抜けることが出来るので、とりあえずその方法で今日のところはダウンロードすることが出来るよ?
266 :PerlLove初段:2018/02/23 03:37:22 (6年前) 0MONA/0人
>>265
あら昔は出来たのにダメだった・・・
ちょっと何処かほかのところにアップ待ちですね
267 :かぷろらくたむ四段:2018/02/23 17:56:20 (6年前) 0MONA/0人
どのあたりのGPUならマイニングだけで黒字にできるのだろうか
268 :名無し三級:2018/02/24 00:59:56 (6年前) 0MONA/0人
ウィルス判定されても、そのファイル自体は削除されないで検疫フォルダに移されているだけだから、元に戻す処理をすれば復活できるよ。
269 :ぐり七段教士:2018/02/24 01:25:29 (6年前) 0MONA/0人
>>268
落としてからアンチウイルスソフトに削除されたならそうなのですが
KlausT-8.20-mod-r1は落とす前にサーバー(OneDrive)側でウイルス認定されて
今はダウンロードが開始できない状態なんです。
270 :名無し二級:2018/02/24 09:25:46 (6年前) 0MONA/0人
>>267
毎月の黒字だけでいい&今だけなら1050tix6とかで行ける。
でも電気代引くと月千円位~3千円しか黒字にならないから
グラボ代回収まで考えると長い道のりになる・・・
今後は掘りにくくなるだろうから
3か月後にこれが維持できるかはわかんないけどね
271 :えむにゃん二段:2018/02/24 09:55:35 (6年前) 0MONA/0人
AndroidのアプリのMinerGateって
死んでるの?
起動しても動かないんだが
272 :名無しさん:2018/02/24 12:13:23 (6年前) 0MONA/0人
Electrum mona 使ってしようとしているのですが、
monacoin.confの場所をElectrum-MONAに変えるだけじゃできませんでした。
どうすればよいか誰か教えてください。
273 :あ熱帯います七段教士:2018/02/25 03:02:34 (6年前) 0MONA/0人
https://askmona.org/6680?n=1000#res_110
今グラボが入手困難ですが、ELSA (エルザ) GD1070-8GERTST 1070TiのグラボをBitcoin/Monacoinで買いたい人いますか? 5台集まったら仕入れてみます。
274 :名無し二級:2018/02/25 22:14:10 (6年前) 0MONA/0人
1070tiだと正直優位性に立てない能力なので入手できる価格によるんじゃないですかね?
消費電力、ハッシュレートかんがみて割安なら買いたいという人はいるでしょうけど・・・
275 :あ熱帯います七段教士:2018/02/25 23:54:42 (6年前) 0MONA/0人
最初は1080/1080tiを探したのですが、うちの仕入れているところも売り切れのままです(> <;
今の価格は、◯さんの価格[在庫切れ]より1.9%割安です。たいして安くないです(^^;
276 :名無しさん:2018/02/26 20:00:06 (6年前) 0MONA/0人
こんばんは
Win10+4GB+Celeronで1000W弱ぶんのGPU動かしてみてるんですが、ハッシュが安定せず低い値をうろうろしてるのはCPUがなんらかのネックになってる可能性ありますか・・・?(稼働率を見る限り限界いってるのはCPUくらいなので)
277 :名無し四段教士:2018/02/26 21:35:48 (6年前) 0MONA/0人
Win10+8GB+CeleronG3900で8GPUですが、まぁまぁ安定してます。メモリかも。
278 :名無し二級:2018/02/26 23:36:15 (6年前) 0MONA/0人
うちも4GBでハッシュうろうろするときと安定するときがありますね。
ただもう一台リグがあって、こっちはDDR3で4GBのi3なんですが
ハッシュ超ど安定なんですよね・・・
やっぱりCPUとメモリも重要なのかもしれないですね・・・
279 :名無し#三段:2018/02/27 06:57:15 (6年前) 0MONA/0人
LGA775のCeleronだったらちょっと分からない・・その場合マザボがネックかも
SSDの仮想メモリを採用GPU最大のメモリ以上(1080tiなら12288MB)にして
GPU1枚づつ試せば何枚目から不安定かわかるのでは?
供給ケーブルを6pin→8pin×4とかたこ足にしてたらワット不足で不安定になるよ
280 :S A I 四段錬士:2018/02/28 04:04:10 (6年前) 0MONA/0人
>>279
LGA775のセレロンはwin10に出来ない様な・・・
俺はC2Dの6600 と6300でwin10に出来なくて
C2Qの9650だけかろうじて10にアプデ出来たよ
281 :鰯二段:2018/02/28 15:14:56 (6年前) 0MONA/0人
10のCPU要件は7モードのためのVTとSSE2でしたっけ
あと何かあったような気もしますが……
282 :鰯二段:2018/02/28 15:28:05 (6年前) 0MONA/0人
気になったので調べてみました
32Bit版であれば物理アドレス拡張、MX、SSE2だけで通るみたいです
64Bit版ですと上記に加えてCMPXCHG16B、PrefetchW、LAHF/SAHF命令が必須との事です
https://msdn.microsoft.com/ja-jp/library/windows/hardware/dn915086(v=vs.85).aspx
特にPrefetchWについては3Dnow系統の命令なのでIntelでは古いモデルだと一部対応していないプロセッサがある……らしいです
C2D 6600でも32Bit版ならインストールできそうですが今更32Bit版というのも変ですねぇ。個人的にはYMF754を使いたいので98あたりを入れた予備役PCを一台置いておきたいのですが懐とスペースがががが
283 :ききょうさん:2018/03/01 16:00:06 (6年前) 0MONA/0人
https://www.dropbox.com/s/ado8q9mul20ma1x/cpuminer-multi-decred-r8-linuxfix1.zip
これの入手方法をご存知の方教えてください
284 :名無しさん:2018/03/02 18:49:22 (6年前) 0MONA/0人
>>276
適当なメモリ差して8GBにしたら解消しました!
なおG3930です
285 :名無しさん:2018/03/02 19:10:11 (6年前) 0MONA/0人
>>283
わかりかねます
そちらのバージョンでなければダメなのでしたら意味がありませんが
cpuminer-multiの改良版がcpuminer-optだと記憶しています
optのリンク
https://github.com/JayDDee/cpuminer-opt/releases
286 :ききょうさん:2018/03/02 19:31:03 (6年前) 0MONA/0人
>>285
回答ありがとうございます
cpuminer-optは現在使用していまして、Linux上で動作比較を実施したいと考えています
287 :nasaya二段:2018/03/04 20:21:20 (6年前) 0MONA/0人
ソロマイニング始めたんですが、これで掘れてるんでしょうか?
またmonacoin coreはずっと開いておかないとダメなんでしょうか?
288 :名無し四段教士:2018/03/04 20:30:04 (6年前) 0MONA/0人
>>284
おめでとうございます。
「マイニングならCPUやメモリは最低限で良い」と言われていますが、メモリに関しては8GB必要な場合があるんですね。
289 :名無し二級:2018/03/04 21:45:51 (6年前) 0MONA/0人
>>288
タスクマネージャ見るとマイニングしてるだけで2GB位は食っちゃうんですよねぇ・・・
これべブラウザ立ち上げたりするともう3GB超えちゃいますからね。
4GBだと足りないことはないけど余裕もないですね。。
CPUもG3930で50%くらい使ってますね。
これでWindowsアップデートとか自動で入ってくるともう100パー近くなります。
ちなみに第四世代のi3でもマイニングしてますがこちらは20%前後で動いてますね。
予算にもよるでしょうけど、同じTDPならi3の方がたぶん幸せですね。
290 :名無し三級:2018/03/04 22:01:42 (6年前) 0.00003939MONA/1人
>287
掘れていないです。
プログラムは正常に動作しています。
気長に待つしかないですね。おそらくのハッシュレートだと3~4か月に1回、成功するかどうかでしょう。
291 :nasaya二段:2018/03/04 22:11:10 (6年前) 0MONA/0人
>>290
ありがとうございます!
そんなもんなんですね。。。
プールマイニングの時は、3か月で4回掘れてたのでもっと掘れると思ってました。。。気長にやっていきます!
292 :あ熱帯います七段教士:2018/03/05 00:19:51 (6年前) 0MONA/0人
Amazonで探しても、1080/1080Tiは、発送まで1~2ヶ月待ちとしか書いてなくて全部入荷待ちなんですね(^^;
293 :rdm二段:2018/03/05 09:21:16 (6年前) 0MONA/0人
メモリの量よりデュアルチャンネルにするため2枚ささないと。
294 :名無し三段:2018/03/06 00:10:15 (6年前) 0MONA/0人
KlausT版はなんでウイルス検出されるんだろうなー
使う勇気がなかなかw
295 :ろん一級:2018/03/06 00:31:50 (6年前) 0MONA/0人
>>294
マイナーがマルウエアとして使われてしまったためだろう。
どうしてもバイナリ配布物は信用しきれないため、自分でビルドするのがいいのかなあ。
# まったく別物だが、自分で書いた何の害もないはずのコードをVSでビルドしたら出来たexeがウィルス認定されて消されたことがあるw
296 :たけたけ二級:2018/03/07 12:20:18 (6年前) 0.00114114MONA/1人
はじめまして
今までnicehashで掘っていましたがこちらの有志様が作って頂いたccminerでMONAを掘り始めました。
メインPCのGTX970で24時間予定で採算考えずに掘ります!
マイニング初心者ですが宜しくお願いいたします。
297 :しがない高専生二級:2018/03/08 15:28:43 (6年前) 0.00114114MONA/1人
すいませんが、250wの電源で1060動かしている方いますか?
常時マイニングするわけではないですが、空き時間にマイニングしようと思っているので・・・・
298 :ビッグウェーブ二段:2018/03/08 20:34:08 (6年前) 0MONA/0人
>>297
動かしたことないけど、動くんじゃないかなぁ。1060って120Wでしょ?
マイニングしながらCPUぶん回すと結構ギリギリになるかもしれんけど。
不安だったらAfterBunerで1060のパワーリミット絞ればいいんじゃないかな。
299 :ittou四段教士:2018/03/08 20:38:51 (6年前) 0MONA/0人
わっとパフォーマンスは悪くなりそうですね。
出来れば電源容量の半分くらいで運用したいところ。
300 :Rankoshi初段:2018/03/08 21:04:23 (6年前) 0MONA/0人
>>297
前に300wのBronze電源で動かしてました(A10 7860K+1060 6GB)
250wでもCPU電力高いのじゃなければ、動くと思う。
部品が劣化してW出力落ちたりするのが怖いのと、
6pinがないと、12Vから変換かまさなきゃいけないから、正直微妙
301 :木村@MONA店五段錬士:2018/03/08 21:06:08 (6年前) 0MONA/0人
>>297
何年使ったパソコン?
動かしたことないけど不安定になりそう
2年以上使った電源なら多分無理
新品ならぎりぎり行けるかも
パワーリミットは必須
302 :名無しさん:2018/03/10 18:35:26 (6年前) 0MONA/0人
>>125 のファイルがonedriveでウイルス認定されていてダウンロードできません.....おのれゲイツ:-(
303 :名無し初段:2018/03/16 06:08:05 (6年前) 0MONA/0人
KlausT-8.20-mod-r1を使わせていただきたいのですが、アップロードされているOne drive側でウイルス判定食らってダウンロードが出来ない状況です> <
お時間ある時にどこかあげ直して頂けると嬉しいです。
マジゲイツ... :-<
304 :名無し名誉名人教士:2018/03/16 23:16:48 (6年前) 0.06690346MONA/12人
久々の大仕事です!
KlausT-8.21-mod-r1
https://1drv.ms/u/s!Aud1FauQ46vHh0Z5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh0V5NYbLOB2bQlOt
更新内容(8.20-mod-r1⇒8.21-mod-r1)
・開発ベースをKlausT-8.21に変更
・yescrypt / yescryptr8 に対応
・yescryptr16はうまくいかなかった…
…えーっと…誰得?
まあ、GPUマイナーの一部がそっちに流れれば、MONAが少しは掘りやすくなるわけで…
305 :名無し名誉名人教士:2018/03/17 00:09:23 (6年前) 0MONA/0人
306 :ittou四段教士:2018/03/17 01:13:38 (6年前) 0MONA/0人
>>304
Linuxでビルドこけますね。一つ前のバージョンは行けたのですが。
ccminer-ccminer.o: 関数 `miner_thread(void*)' 内:
ccminer.cpp:(.text+0x3d42): `scanhash_yescryptr16(int, unsigned int*, unsigned int*, unsigned int, unsigned int*)' に対する定義されていない参照です
ccminer.cpp:(.text+0x3d63): `scanhash_yescryptr8(int, unsigned int*, unsigned int*, unsigned int, unsigned int*)' に対する定義されていない参照です
ccminer.cpp:(.text+0x3d84): `scanhash_yescrypt(int, unsigned int*, unsigned int*, unsigned int, unsigned int*)' に対する定義されていない参照です
collect2: error: ld returned 1 exit status
Makefile:832: ターゲット 'ccminer' のレシピで失敗しました
make[2]: *** [ccminer] エラー 1
make[2]: ディレクトリ '/home/ittou/meiyo/ccminer-KlausT-8.21-mod-r1' から出ます
Makefile:1463: ターゲット 'all-recursive' のレシピで失敗しました
make[1]: *** [all-recursive] エラー 1
make[1]: ディレクトリ '/home/ittou/meiyo/ccminer-KlausT-8.21-mod-r1' から出ます
Makefile:515: ターゲット 'all' のレシピで失敗しました
make: *** [all] エラー 2
307 :名無し名誉名人教士:2018/03/17 01:31:36 (6年前) 0MONA/0人
>>306
そういえば、linuxのことを考えていませんでしたね…
ファイルが増えているので、それを記述すれば行ける…んじゃないかな❓
308 :名無し名誉名人教士:2018/03/17 08:42:12 (6年前) 0MONA/0人
>>306
Makefile.am内のccminer_SOURCESに
yescrypt/yescrypt.cu yescrypt/cuda_yescrypt.cu
を記述すればいいのかな?
309 :名無し名誉名人教士:2018/03/17 08:47:49 (6年前) 0MONA/0人
>>308 追記
sph/yescrypt-opt.c sph/yescrypt-common.c sph/sha256_Y.c
も追加で…
310 :名無し名誉名人教士:2018/03/17 08:52:34 (6年前) 0.00114114MONA/1人
>>308 >>309 修正
色々足りないし、間違いもあり。
これで…
Makefile.am内のccminer_SOURCESに
yescrypt/yescrypt.cu yescrypt/cuda_yescrypt.cu
sph/yescrypt.h sph/yescrypt-platform.h sph/yescrypt-opt.c sph/yescrypt-common.c
を追記。
311 :名無し名誉名人教士:2018/03/17 08:54:04 (6年前) 0MONA/0人
Keplerではyescrypt系はエラーを吐くみたい。何が悪いのか…
312 :名無しさん:2018/03/17 11:51:26 (6年前) 0MONA/0人
>>304
乙です!
ccminer-KlausT-8.18-r1に比べて、速度向上してますね
Windows10 pro, GTX1080で、最大で0.5MH/sぐらい上昇してます
313 :かぷろらくたむ四段:2018/03/17 11:59:30 (6年前) 0MONA/0人
>>305を見て速いなあと思ったけど消費電力当たりの速さだとまだ上位のCPUのほうが上ですかね
314 :名無し名誉名人教士:2018/03/17 13:01:10 (6年前) 0MONA/0人
>>313
実際の消費電力はTDPの65%くらいなんだよね…
GTX1060なら、120Wの65%で78Wくらい(GPUのみ。CPU、メモリなどは除く)。
315 :名無しさん:2018/03/17 14:36:58 (6年前) 0MONA/0人
>>304
Kotoで試してみようとしたのですがinvalid addressとエラーが出てしまいます。Monacoinでは動くみたいなのですがアドレスの文字数の違いなのかな?
316 :モナンゲリオン三級:2018/03/17 16:00:14 (6年前) 0MONA/0人
>>304
KlausT-8.21-mod-r1でvippoolにて利用していますが、
起動後すぐにコインが落ちてきてしばらくすると(1時間以上)yey!!は出てます掘れなくなり、いったん終了して再度KlausT-8.21-mod-r1を起動させるとすぐにまたコインが落ちてきて・・となります。
OS:Windows10 GPU:GTX1080を利用
何か考えられることありますでしょうか?
317 :名無しさん:2018/03/17 16:05:11 (6年前) 0MONA/0人
ウイルス対策ソフトの除外フォルダにマイナーのフォルダを書いておくとか
318 :モナンゲリオン三級:2018/03/17 16:08:44 (6年前) 0MONA/0人
>>317
それは、やってます。
319 :ittou四段教士:2018/03/17 20:36:04 (6年前) 0MONA/0人
>>310
昨晩、yescryptを追加してたんですが、>>308で力尽きて寝ました。
sph/sha256_Y.cは元から入ってますね。これ追加しちゃうと関数複数回定義でエラーになります。というかなりました。
Keplerに関しては持ってないので分かりませんね。。。
320 :Taku3no二級:2018/03/17 22:52:52 (6年前) 0MONA/0人
お世話になっています。不具合を確認したので報告させていただきます。
複数GPUがある環境で、-d オプションを前から詰めるように指定しないとメモリアクセスエラーが発生します。具体的なオプションごとの挙動は次の通りでした
正常動作確認 [0][0,1][0,1,2][指定なし]
不正動作確認 [1][2][1,2][0,2]
当方の環境は以下の通りです。
OS:Windows10 Home ver1709
CPU:Core i5-4440
Mem:8GB
GPU#0:GeForce GTX 1070 Ti(パリット製)
GPU#1:MSI GTX 1060 3GB
GPU#2:ASUS GTX 1060 6GB
実行時のログは下にあります。
https://pastebin.com/KXgU3002
321 :ぬこさん:2018/03/17 23:08:23 (6年前) 0MONA/0人
>>304
yescryptr8しばらく回すとエラーで落ちますね。
GTX1070です。
原因の切り分け方がわからないのでおま環かもしれませんが、念のため報告まで。
GPU #0: Cuda error in func 'yescryptr8_cpu_hash_32' at line 1435 : unspecified launch failure.
322 :ittou四段教士:2018/03/17 23:12:57 (6年前) 0MONA/0人
-d 1はLinuxでもNGですね。
>>321
bitzenyを掘られてるんでしょうか?
323 :名無しさん:2018/03/17 23:30:51 (6年前) 0MONA/0人
どなたか、現在KlausT-8.21-mod-r1の実行ファイルをダウンロードできますか?
おま環なのか、必ず53%あたりの進捗でダウンロード失敗するんですが
324 :ittou四段教士:2018/03/17 23:50:36 (6年前) 0MONA/0人
ダウンロード出来ますね。
ウイルス扱いされているとか?
325 :名無しさん:2018/03/18 00:49:05 (6年前) 0MONA/0人
>>324
確認ありがとうございます。
条件見直して もう一回やってみます。
326 :ぬこさん:2018/03/18 01:01:20 (6年前) 0MONA/0人
>>322
ですです
327 :名無しさん:2018/03/18 01:06:40 (6年前) 0MONA/0人
onedriveのウイルス扱いされているファイルは自分のアカウントの場所にコピーしてからコピー先からダウンロードしようとするとウイルス判定があってもダウンロード出来るようですよ。
328 :名無しさん:2018/03/18 01:29:52 (6年前) 0MONA/0人
結果的にダウンロードできました。ありがとうございます
原因がよくわからなかったので、セーフモード、ウイルスのアクティブスキャンオフで再現させてみました。
・常用しているfirefoxはonedriveがうまく表示されない
・edgeでダウンロードすると323と同じ結果
・chromeでも同様に失敗、がリジューム機能で何度も再開する事で成功
おそらく、通信速度が最大でも1Mbpsという「おま環」が主因だと思います。
お騒がせしました
329 :sl二段:2018/03/18 15:51:29 (6年前) 0MONA/0人
win10、GTX1060_6g一枚のみの環境で、yescryptかつintensityオプションを使うとillegal memory accessとかout of memoryとかが発生してしまいますね。
指定しなければ動作するのですが、はてさて
330 :名無しさん:2018/03/18 16:45:43 (6年前) 0MONA/0人
>>304
遅ればせながら導入してみました
速度向上してていい感じです!
331 :CT9W七段:2018/03/18 17:52:42 (6年前) 0MONA/0人
>>329
試してみたらGTX980でも同様でした。
332 :名無し二級:2018/03/18 22:59:18 (6年前) 0MONA/0人
>>329
うちのKlausT-8.18、1050tix6の環境でも
1週間に1回程度の頻度でillegal memory accessで止まりますね。
たぶんiオプション外せば普通に動くのかもしれないですね。
333 :名無し二級:2018/03/18 23:42:46 (6年前) 0MONA/0人
KlausT-8.21-mod-r1を今試してみてるけど
端末bat上の数値もあんまりだしプール上のハッシュもだめだぁ・・・
うちだと8.18が一番いいかも・・・
334 :sinono初段:2018/03/18 23:53:54 (6年前) 0MONA/0人
8.21早速使わせていただきましたが、ハッシュが半分になってしまいます
8.18だと正常動作します
おま環だと思いますがご報告まで
335 :名無し名誉名人教士:2018/03/19 09:01:15 (6年前) 0.01MONA/1人
>>329
illegal memory accessは別として…
out of memoryの場合、-iオプションの数値が大きすぎて発生するエラーになります。
(解説)
yescryptは1スレッドあたり134,176バイトのメモリを使用します。
GTX1060(6GB)で-iを指定しない場合、3840スレッド(-i 11.875相当)で起動します。
この場合、134,176×3840=515,235,840バイト≒491.37MBを確保します。これなら、画面出力に使っているGPUだとしても問題なく確保できる容量と考えられます。
もし、-i 18(Lyra2REv2とかで指定する値)とか指定した場合、
134,176×2^18=35,173,433,344バイト≒32.76GBとなり、普通のGPUでは到底確保できないメモリ使用量になってしまいます。
どんなに搭載メモリが大きくても-i 16程度が限度と考えます。
(メモリ量一覧)
-i 11⇒262.0625MB -i 12⇒524.125MB
-i 13⇒1.024GB -i 14⇒2.047GB
-i 15⇒4.095GB -i 16⇒8.189GB
336 :名無し名誉名人教士:2018/03/19 09:10:40 (6年前) 0MONA/0人
unspecified launch failureが出る場合、
これは、要因が複数あり、
①ローカルメモリが領域外のアクセスをしている。
②(ループや再帰関数などにより)スタックが不足している。
③カーネルが一定時間終了しない。
などが要因としてあげられる。(私もあまり分かっていない)
①、②はそれなりに対策した。ただ、スレッド数がコア数の整数倍にならない場合は、もしかしたら上手くいかないカモ…
③は-iを小さくして運用すれば上手く行く(のかな?)。
337 :sl二段:2018/03/20 01:17:23 (6年前) 0MONA/0人
>>335
分かりやすい解説ありがとうございます。
ご指摘の通り、Lyra2REv2の時のintensityオプション数値を用いていた為に、メモリエラーが発生していました。
338 :MaineCoon一級:2018/03/20 01:43:30 (6年前) 0MONA/0人
KlausT-8.21-mod-r1 使わせて頂きました。
1080tiが5枚の環境です。
-dオプションで怒られるのは既出ですが、、、
yescryptr8での-iオプションで適当な数字を入れると急激にレートが落ちました。
スレッドメモリ量の倍数を計算指定するのが当たり前??
wmaにて2時間ほどフル稼働してみましたがGPU使用率も安定していました。
vipプールでMona掘りしてみましたが、プールでのレート表示や報酬が物凄く良いです。
フル稼働ではGPU使用率が波打ってしまいましたが
これは空きスロットからのゴーストノイズが入る周波数距離みたいなので
おま環だと思います。
339 :名無し名誉名人教士:2018/03/20 06:46:49 (6年前) 0MONA/0人
>>338
例)yescryptでコア数1024、スレッド数2049の場合(スレッド数が整数倍ではない場合)
1周目:1024スレッドを並列演算
2周目:1024スレッドを並列演算
3周目:残り1スレッドを演算
となるため、コアの利用効率が悪くなります。(これは極端な例ですが…)
ゴーストノイズ…確かに周波数が高いですものね…
PCIe 3.0で8.0GHzなので、3×10^8[m/s]÷8×10^9[Hz(=/s)]=0.0375[m]となり、3.75cmで1クロックとなり、確かにノイズになりそう…
PCIe 1.1の場合は2.5GHzなので、3×10^8[m/s]÷2.5×10^9[Hz(=/s)]=0.12[m]で、ノイズの影響は少なくなりそうかな?だからマイニング向けにはPCIe 1.1の方がいいのか…
340 :MaineCoon一級:2018/03/20 11:36:52 (6年前) 0MONA/0人
>339
ありがとうございます。
と、いう事は・・・・
(実装メモリ量) / (1スレッドのメモリ使用量) >= (実装できる最大スレッド数)
ここで
(実装したいスレッド数)を(CUDAコア数)の整数倍に丸め込み調節して
2 ^ (X) = (実装したいスレッド数)
となる値(X)を-iオプションで指定すると
良い事があったりする?となりますが
この対数値を求めるにあたって精度や目安、コツはありますか?
何度もすいません。
(yescrypt: 134,176byte Lyra2REv2: 1,536byte)
341 :名無し名誉名人教士:2018/03/20 12:12:31 (6年前) 0.00003939MONA/1人
>>340 普通の対数計算とは異なり、整数部分と小数部分を分けて考えます。
スレッド数1280の場合
①スレッド数に最も近い2の累乗は2^10=1024⇒-iの整数部分は10になる
②(スレッド数)-1024=256
③256÷1024=0.25⇒-iの小数部分は.25になる。
④(①)+(③)=10.25
スレッド数2176の場合
①スレッド数に最も近い2の累乗は2^11=2048⇒-iの整数部分は11になる
②(スレッド数)-2048=128
③128÷2048=0.0625⇒-iの小数部分は.0625になる。
④(①)+(③)=11.0625
342 :MaineCoon一級:2018/03/20 18:52:01 (6年前) 0MONA/0人
>>341
関数電卓を目の前にして計算結果が違うので頭を抱えていました。
ありがとうございます!これでintensity値を算出できます。
画面出力するGPUの使用率を97%ぐらいにして余裕を持たせないと
20時間ぐらいでNvidiaドライバ経由でWin10カーネルが
吹き飛んで強制再起動になっていました。
PCIeバス上のエラー訂正にパワーを浪費してパンクしてたみたいです。
GPU使用率、コアクロックが大きく揺らぐのは要注意です。
(今はPL=64% クロック類は±0)
再計算してBitzenyのCPUマイナー勢にリベンジです!(違
yescryptとLyra2REv2ではスレッドのメモリ使用量が87倍も違うんですね。
スレッドの利用は計画的に
343 :名無し二級:2018/03/20 20:03:19 (6年前) 0MONA/0人
yescryptってASIC対策でメモリガチ食いするんでしたっけ?
344 :MaineCoon一級:2018/03/21 19:16:27 (6年前) 0MONA/0人
intensity値が算出できるようになったので色々と試してみたところ、気になった所があります。
1080ti(CUDA 3,584基 :11GB)とyescryptにて
CUDA数(3584基)を1セットとして「使用するスレッド数」をカウント。PL=64%
1セット時(3584th,i=11.875)と2セット時(7168th,i=12.75)は約9.5KH/s
3セット時(i=13.3125)に急激にレートが上がって13.91KH/s
4セット時,5セット時は約12KH/sと少し落ちて
6セット時(i=14.3125)には盛り返して13.85KH/s
と、3の倍数セットの時はスコアが良くなりました。
14セット時(i=15.53125,6.2701GB,57%)は数回acceptされた後にunspecified...で落ちました。
15セット時(i=15.640625,6.7179GB,61.07%)は最初からunspecified...でした。
345 :MaineCoon一級:2018/03/21 19:23:54 (6年前) 0MONA/0人
メモリ使用量は全容量の半分以下にした方が安定するのかも?と
Layra2Rev2でも1024セット(i=21.75,3670016th,5.25GB,47.72%)で現在様子見中です。
どうなんでしょうね?
それと
算出したintensity値が物凄く細かい小数になっても
1スレッド単位まで指定出来るのに感動しました。
346 :名菜師初段錬士:2018/03/21 20:30:01 (6年前) 0MONA/0人
CUDA9.1じゃなくて
CUDA9用が欲しいです。
347 :名無し名誉名人教士:2018/03/21 22:35:07 (6年前) 0.00736281MONA/5人
誰得更新第二弾
KlausT-8.21-mod-r2
https://1drv.ms/u/s!Aud1FauQ46vHh0h5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh0d5NYbLOB2bQlOt
更新内容(8.21-mod-r1⇒8.21-mod-r2)
・-iの調整をミスったのを修正
・yescryptr16 / yescryptr32 に対応。正直CPUと大差ないです。
・yescrypt / yescryptr8 でKeplerに暫定対応。(GT710にて動作確認)
これで、Bitzeny、Yenten、WAVIがGPUで掘れる!(いや、CPUでも十分掘れるけどね…)
348 :名無し名誉名人教士:2018/03/21 22:36:37 (6年前) 0MONA/0人
あ、またLinux向けの更新を忘れた…
349 :ななもな四段:2018/03/22 00:08:06 (6年前) 0MONA/0人
yescriptr16試しました。
GTX1080ti 5台のリグで11kH/sでました。
350 :名無し初段:2018/03/22 01:53:06 (6年前) 0MONA/0人
ダメだー GPUで動かそうと頑張ってみるも何やってもboooo連発
351 :名無しv2三級:2018/03/22 03:18:13 (6年前) 0MONA/0人
>>350
-a yescrypt ではなく
-a yescryptr8 にするとyayがでます。
352 :名無し名誉名人教士:2018/03/22 06:23:23 (6年前) 0MONA/0人
>>348 訂正
いつの間にかに(たぶん>>310あたりで)Linux向け修正をしていた。Linuxユーザの方、本当にこれで動くか教えてほしい…
Makefile.amに以下を追記した
yescrypt/yescrypt.cu yescrypt/cuda_yescrypt.cu \
sph/yescrypt.h sph/yescrypt-platform.h sph/yescrypt-opt.c sph/yescrypt-common.c \
353 :CT9W七段:2018/03/22 07:55:45 (6年前) 0MONA/0人
>>347
-i 指定が反映されず固定値(11)となっております。
環境はGTX980です。
354 :CT9W七段:2018/03/22 07:57:29 (6年前) 0MONA/0人
>>353
書き忘れました、yescryptです。
355 :ハムちゃん二段錬士:2018/03/22 08:40:26 (6年前) 0MONA/0人
1060 3GBだと-i反映される
というかr32は-i10以下にしないとエラーで止まってしまうね
-10でcudaスレッドが1024しか使ってないのにカクカクしまくり
356 :名無し名誉名人教士:2018/03/22 08:54:13 (6年前) 0MONA/0人
>>353
-i 12以上でも11になりますか?
yescrypt/yescryptr8/yescryptr16/yescryptr32では、-iをどのような設定にしても、スレッド数はGPUのコア数の倍数になるように設定しています。(CUDAコアの休眠を防ぐため)
GTX980は2048コアなので、-i 11以下にはならないようになっています。
GTX980の場合、
設定値-i 10:2^10=1024スレッド⇒2048スレッドに補正(-i 11相当)
設定値-i 11:2^11=2048スレッド⇒設定値そのまま
設定値-i 11.5:2^11×(1+0.5)=3072スレッド⇒2048スレッドに補正(-i 11相当)
設定値-i 12:2^12=4096スレッド⇒設定値そのまま
設定値-i 13.625:2^13×(1+0.625)=13312スレッド⇒12288スレッドに補正(-i 13.5相当)
中途半端なコア数にしてもパフォーマンスが低下するだけですので…
357 :名無し名誉名人教士:2018/03/22 09:04:45 (6年前) 0MONA/0人
>>356 訂正
yescryptではこの通りに動くのですが、
yescryptr8/yescryptr16/yescryptr32では、その記述をミスって-iが自由に設定できるっぽいね…
ソース弄る気があるなら、scanhash_yescryptr8/scanhash_yescryptr16/scanhash_yescryptr32内の
uint32_t throughput = min(throughputmax, max_nonce - first_nonce);
を
throughputmax = (throughputmax / CUDAcore_count) * CUDAcore_count;
if (throughputmax == 0) throughputmax = CUDAcore_count;
の下に持っていくと目的の動きをするはず。(2行下に移動する)
358 :名無し名誉名人教士:2018/03/22 09:05:57 (6年前) 0MONA/0人
>>357 補足
あと、-iを自由に設定したいなら、
throughputmax = (throughputmax / CUDAcore_count) * CUDAcore_count;
if (throughputmax == 0) throughputmax = CUDAcore_count;
の2行を削除することで実現できます。
359 :rdm二段:2018/03/22 12:59:25 (6年前) 0MONA/0人
ubuntu16.04でビルドしたいのですがソースをいじったことが無いので
どのように変更すればいいのでしょうか?
360 :名無しさん:2018/03/22 15:42:47 (6年前) 0MONA/0人
viとかじゃダメ?(もう存在しないのかな)
windowsでいうメモ帳あたりで十分と思ってた。
逆にビルドがさっぱりわからん
361 :リグ初心者初段:2018/03/22 17:18:10 (6年前) 0MONA/0人
>>359
yescrypt.cuの245行付近、400行付近、555付近を>>357参考に書き換えかな?
方法はviでもパッチ作るでもなんでもw
362 :rdm二段:2018/03/22 21:12:08 (6年前) 0MONA/0人
とりあえず難しそうなのでやめました。
ありがとうございます。
所で、そのままビルドして回してるんですが、
22~23kH/sで頭打ちになってそれ以上ハッシュが上がらないんですが、
何か設定とかいるんでしょうか?
それともPCIEの速度が影響しますか?
363 :rdm二段:2018/03/22 21:13:49 (6年前) 0MONA/0人
書き洩らしました。yescryptr8です。
364 :名無し四段:2018/03/22 21:14:19 (6年前) 0MONA/0人
>>347
Yenten好きな俺得更新ありがとう!!
ということでyescryptr16を1070tiで試してみました
intensityは自動設定で12.781(7296threads)です
luckypoolのCPU infoを見ると
比較対象はE5-2683v3、E-2620v4、1950Xあたりでしょうか
(スリッパは組んでみたいなと思い色々調べてましたが、Xeonのことは正直よく分からない)
消費電力はnvidia-smi読みで90w前後
コアクロックが上限張り付きなのが気になるところではありますが...
365 :名菜師初段錬士:2018/03/22 21:48:21 (6年前) 0MONA/0人
何時惚れんでしょう?
Based on pooler cpuminer 2.3.2 and the tpruvot@github fork
CUDA support by Christian Buchner, Christian H. and DJM34
Includes optimizations implemented by sp-hash, klaust, tpruvot and tsiv.
[2018-03-22 21:43:22] Starting Stratum on
・・・
[2018-03-22 21:43:22] block height 1171443, 3 transactions
[2018-03-22 21:43:25] Using intensity 7.500 (192 threads)
[2018-03-22 21:43:26] Received new yescryptr8 block header
[2018-03-22 21:43:26] block height 1171443, 3 transactions
・・・
[2018-03-22 21:44:38] GPU #0: GeForce GT 640M LE, 92.30 H/s
366 :名菜師初段錬士:2018/03/22 21:50:55 (6年前) 0MONA/0人
おっ少し惚れた
[2018-03-22 21:45:47] GPU #0: GeForce GT 640M LE, 92.26 H/s
[2018-03-22 21:45:47] accepted: 1/1 (100.00%), 92.28 H/s yay!!!
[2018-03-22 21:46:18] GPU #0: GeForce GT 640M LE, 92.25 H/s
[2018-03-22 21:46:18] accepted: 2/2 (100.00%), 92.27 H/s yay!!!
[2018-03-22 21:46:32] Received new yescryptr8 block header
[2018-03-22 21:46:32] block height 1171445, 4 transactions
[2018-03-22 21:47:31] Received new yescryptr8 block header
[2018-03-22 21:47:31] block height 1171445, 4 transactions
[2018-03-22 21:48:31] Received new yescryptr8 block header
[2018-03-22 21:48:31] block height 1171445, 4 transactions
[2018-03-22 21:49:11] GPU #0: GeForce GT 640M LE, 92.29 H/s
[2018-03-22 21:49:15] accepted: 2/3 (66.67%), 92.27 H/s booooo
367 :rdm二段:2018/03/22 21:53:37 (6年前) 0MONA/0人
各カードとも半分以下のハッシュしか出てないみたいです。
PLは180wに設定しています。
368 :rdm二段:2018/03/22 21:58:21 (6年前) 0MONA/0人
スイマセン。解決しました。
バックグラウンドで別のプロセスが動いていました。
369 :名無し名誉名人教士:2018/03/22 23:05:20 (6年前) 1.00124114MONA/3人
誰得更新第三弾。今回はバグフィックス。
KlausT-8.21-mod-r3
https://1drv.ms/u/s!Aud1FauQ46vHh0p5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh0l5NYbLOB2bQlOt
更新内容(8.21-mod-r2⇒8.21-mod-r3)
・-iの調整をミスったのを再修正(>>357の修正)。スレッド数がコア数の整数倍になるように調整。(Keplerはコア数の半分に対して整数倍。Keplerはシェアードメモリが少ないので、半分休眠させています。)
・yescrypt / yescryptr8 / yescryptr16 / yescryptr32 のループ数を見直し。ついでに調整しやすくした。(ソースを弄る人向け)
ループ数を多くすることで、カーネルの実行時間を短くしています。これにより、タイムアウトを回避しています。(その代わり、カーネルを複数回起動するので、トータルの実行時間は若干遅くなる。でも、ほぼ誤差の範囲。)
yescryptr32では、GPUによってはメモリ不足の可能性あり。その場合は-iオプションで調整してください…
現状はパフォーマンス優先でスレッド数を設定しています。(GTX1060で動作確認済み)
370 :名菜師初段錬士:2018/03/22 23:10:00 (6年前) 0MONA/0人
>>347
Keplerは誰得というぐらいおそいんでしょうぁぁか
371 :名無し名誉名人教士:2018/03/22 23:19:25 (6年前) 0MONA/0人
>>370
Keplerは、シェアードメモリが192コアあたり48kBしか確保できない。
yescrypt系は32コアあたり16kBのシェアードメモリを必要とするため、96コア分しか用意できないことになります。(同一性能のMaxwellと比較して速度が1/2になる)
他にも、動作クロックやらL2キャッシュやらで差を付けられる…
372 :CT9W七段:2018/03/23 00:55:24 (6年前) 0MONA/0人
>>356
理解できました、ありがとうございます!
-i 12 4096スレッドでの動作を確認しました。
後ほどmod-r3も試してみますね。
373 :CT9W七段:2018/03/23 02:35:30 (6年前) 0MONA/0人
mod-r3 yescrypt
GTX980で-i未指定の場合、i13.5(12288スレッド)でした。
-i 11指定(2048スレッド)の方が400H/sほど高ハッシュレートです。
374 :名無し名誉名人教士:2018/03/23 06:16:36 (6年前) 0MONA/0人
>>373
Maxwellはコア数の1倍の方が速いのか…
375 :リグ初心者初段:2018/03/23 07:33:59 (6年前) 0MONA/0人
>>373
うちの960さんは自動(12.5)と手動(10)でほぼ誤差範囲しか違わなかったよ。
それでも、手動のほうが10H/くらい高いかも
376 :名無し名誉名人教士:2018/03/23 10:23:17 (6年前) 0MONA/0人
ちなみに、スレッド間のデータ転送さえ何とかなれば、
OpenCLでも同じようにできるはず。
誰かやる人いないかな…?
377 :pukupukuman一級:2018/03/23 13:49:00 (6年前) 0MONA/0人
同じGPUなのになんでこんなにハッシュレートに違いがでるんだろう。
1060同士のGPU#0とGPU#5とか、1050Ti同士なのに#1だけやけにハッシュレート高かったり。
個体差でこんなに差がひらくものなの?
[2018-03-23 13:42:35] GPU #2: GeForce GTX 1050 Ti, 9981.11 kH/s
[2018-03-23 13:42:35] GPU #6: GeForce GTX 1050 Ti, 10.32 MH/s
[2018-03-23 13:42:35] GPU #0: GeForce GTX 1060 3GB, 18.92 MH/s
[2018-03-23 13:42:35] GPU #7: GeForce GTX 1050 Ti, 10.24 MH/s
[2018-03-23 13:42:35] GPU #4: GeForce GTX 1050 Ti, 10.10 MH/s
[2018-03-23 13:42:35] GPU #1: GeForce GTX 1050 Ti, 14.09 MH/s
[2018-03-23 13:42:35] GPU #3: GeForce GTX 1050 Ti, 10.00 MH/s
[2018-03-23 13:42:35] GPU #5: GeForce GTX 1060 3GB, 13.82 MH/s
[2018-03-23 13:42:41] GPU #1: GeForce GTX 1050 Ti, 14.03 MH/s
ちなみに1060はPL60%、1050TiはPL85%にしてる。
378 :名無し名誉名人教士:2018/03/23 13:55:49 (6年前) 0.00000011MONA/1人
>>377
GPU #1だけエラー出している気がする。
-iオプションを下げる必要があるかな?
または、cuda_yescrypt.cu内のloop_count値を増やして再コンパイルするか…
(loop_count値は2の累乗の値を使用すること!)
379 :pukupukuman一級:2018/03/23 14:13:30 (6年前) 0MONA/0人
>>378
返信ありがとう!
でも、iオプションとか再コンパイルとか、よくわかってない自分の頭では
アドバイスを活かせそうにないや…
とりあえず、極端に遅くなってるわけじゃないなら
このまま様子みてみますw
380 :名無し名誉名人教士:2018/03/23 14:27:27 (6年前) 0MONA/0人
>>379
エラーを出していたら、そのGPUが掘った分は全てRejectされるはず…
GTX1050Tiは768コア、GTX1060(3GB)は1152コアなので…
-i 11.125,10.5,10.5,10.5,10.5,10.5,10.5,10.5
をコマンドラインに追加してみよう。
(GTX1060×1、GTX1050Ti×7を想定)
381 :名無し名誉名人教士:2018/03/23 16:25:10 (6年前) 0MONA/0人
>>380 訂正
>>377を良く見ると、GTX1060×2、GTX1050Ti×6だったね…
-i 11.125,10.5,10.5,10.5,10.5,11.125,10.5,10.5
こんな感じかな?
382 :名無し名誉名人教士:2018/03/23 16:27:06 (6年前) 0.00000011MONA/1人
>>381 さらに訂正
…ってか、このハッシュレートはYescryptじゃないね…ごめん、勘違い。
ここまでのことは忘れてくれ…
ってか、なんでこんなにハッシュレートが違うんだろう…
383 :pukupukuman一級:2018/03/23 18:52:48 (6年前) 0MONA/0人
>>380
>>381
>>382
すみません!こちらこそ説明不足でした。
KlausT-8.21-mod-r3でアルゴリズムはLYRA2REv2です。
NicehashMiner2でLYRA2REv2を掘ると8GPU合計で137MH/sですが、
KlausT-8.21-mod-r3だと104MH/sです。
うちのもう一台のリグ(GTX1060x2)で試したところ、
Nicehashとccminerのハッシュレートに大差はなく、
GPU間のバラツキもありませんでした。
うーん、なんで8GPUリグとccminerの組み合わせの時だけバラツキがでるのか…うちの環境固有なの何かがあるのかもしれません。
384 :名無し侍二段:2018/03/24 01:44:42 (6年前) 0.00114114MONA/1人
零細マイニングを始め、今日askmonaに登録しました。
あまりマイニングについての知識はないので皆様よろしくおねがいします。
とりあえず環境は
i5 8400
DDR4 8GB
GTX1060 6GB(PL55%~60%※温度を55℃超えないよう注意しています)
GTX1050(PL70%で同上)
でGPUではナイスハッシュを、CPUではBitZeny掘っている感じです。
まぁ、利益は・・・お小遣い程度ってところでしょうか?
次の新しいグラボとか気になるんですけどね・・・手に入るかどうか心配ですね
385 :名菜師初段錬士:2018/03/24 08:54:49 (6年前) 0MONA/0人
cuda9.0版がほしいです。
本当だれとくなんでだすが。
386 :名無しさん:2018/03/24 18:52:50 (6年前) 0MONA/0人
KlausT-8.21-mod-r3でLYRA2REv2をVIP POOLで掘ってますが
突如CUDAエラーが出て止まってしまいます。
古いバージョンを使っても同様です。
-iオプションはつけてません。
GPU #1: Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
GPU #3: Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
GPU #2: Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
[2018-03-24 18:48:20] stopping 4 threads
GPU #0: Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
387 :ittou四段教士:2018/03/24 20:57:13 (6年前) 0MONA/0人
KlausT-8.21-mod-r3 Ubuntu16でビルドOKです。
とりあえず差し替えて動作中。
388 :名無しさん:2018/03/25 00:38:38 (6年前) 0MONA/0人
386です
自己レスですが CUDA9.1ドライバ最新版を入れたら治りました・・・
389 :名無し名誉名人教士:2018/03/25 15:18:37 (6年前) 1.51143781MONA/7人
誰得更新第四弾。今回は高速化してるはず。
KlausT-8.21-mod-r4
https://1drv.ms/u/s!Aud1FauQ46vHh0x5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh0t5NYbLOB2bQlOt
更新内容(8.21-mod-r3⇒8.21-mod-r4)
・yescrypt系のメモリ読み込みをL1キャッシュ経由にした。(インラインアセンブラでキャッシュオプション付きの読込命令、書込命令を使用)
そのままだと、グローバルメモリはL1キャッシュを経由せず、L2キャッシュ経由の読み書きを行います。そのため、L1キャッシュがほぼ役立たず状態になっていました。(ローカルメモリならL1経由の読み書きができるのですが…)
今回の変更で、無理やりL1キャッシュを経由して読み書きを行い、高速化を試みています。L1キャッシュ率が40%程度ですので、まずまずの効果を発揮しているかと…
390 :ittou四段教士:2018/03/25 15:26:21 (6年前) 0MONA/0人
ビルドしてみまする。
391 :ittou四段教士:2018/03/25 16:57:29 (6年前) 0MONA/0人
Ubuntu mona掘りOK 1080x2で112.2M
同じくzeny掘りOK 24.8k
zeny初めて掘ってみたので、このレートがどうなのかは分かんない
ただzenyの方はboooが出ない@LA。モナの方は相変わらずboooが3割前後でる。
392 :MONAちょび二段:2018/03/25 19:28:35 (6年前) 0MONA/0人
>>391
Ubuntuでビルドは特に問題なくできました?
ethosだからなのかな...
GPUでyescrypt掘ってみたい^^
393 :ittou四段教士:2018/03/25 19:46:01 (6年前) 0MONA/0人
Ubuntuは問題無いですね。
1. 解凍する
2. 出来たdirに降りる
3. chmod +x *.sh
4. ./autogen.sh
5. ./configure
6. ./build.sh
394 :名無し二級:2018/03/25 19:51:41 (6年前) 0MONA/0人
初投稿になります、よろしくお願いいたします。
第四弾でのBitZeny GPUマイニングですが、うちでは
・Windows上のGTX1070Tiが約9.2KH/s→約10.7kH/s
・Ubuntu上のGTX1070が約7.3kH/s→約8.5kH/s
と、共に約16%高速化されました。ありがとうございます!
Ubuntuでのビルドは、第三弾ではさくっと通りましたが、
第四弾では自分の手違いなのか、すんなり通らなかったので、
第三弾のMakefileとの差分からCCASFLAGS, CFLGAS, CUDA_CFLAGS, CUDA_LIBS, CXXFLAGSのオプションをconfigure時に加えてあげたら
makeが通りました。
395 :名無し二級:2018/03/25 19:55:16 (6年前) 0MONA/0人
ありゃ、やはりすんなり通るのが普通なんですね、お恥ずかしい...
396 :名無し二級:2018/03/25 19:58:35 (6年前) 0MONA/0人
chmod +x *.shしてbuild.shに託せば良かったんですね...
今試したら普通にコンパイル進んでいます、ありがとうございました!
397 :ittou四段教士:2018/03/25 19:59:44 (6年前) 0MONA/0人
あれ?うちのr3とr4はパス以外差分無いけどなぁ。
398 :ittou四段教士:2018/03/25 20:03:07 (6年前) 0MONA/0人
makeでも行けるんだろうけど、configure.shの中で指定しているフラグを付けてあげないと多分通らない。configure.shを読んでからmakeしてるのがbuild.sh
399 :名無し四段:2018/03/25 20:58:50 (6年前) 0MONA/0人
>>389
いつもながら俺得更新ありがとう!!!
1070tiでyescryptr16をr3とr4で比較
intensityは自動設定で両方とも12.781(7296threads)
KlausT-8.21-mod-r3
KlausT-8.21-mod-r4
俺環だけどCPUコア1個分性能向上yay!!!
400 :名無し二級:2018/03/25 21:02:27 (6年前) 0MONA/0人
端末で打ったコマンドの履歴を遡ったら、configure.shではなくてconfigureの方を走らせていました...
configure.shを走らせて出来るMakefileはr3と同等で、makeでもコンパイル進んでいます...お騒がせしました!
401 :ittou四段教士:2018/03/25 21:17:57 (6年前) 0MONA/0人
configureで良いと思います。追加でconfigure.shが必要そうとうだけで。
何でconfigure;makeじゃないのか、ドキュメント読んでないので分かりませんが、build.shからconfigure.shを読んでいるようですので。
402 :名無し二級:2018/03/25 22:07:58 (6年前) 0MONA/0人
確かに、build.shの中を見たらautogen.shしてconfigure.shしてmakeしてくれているので、解凍して chmod +x *.shしたら、いきなり./build.shでOKっぽいですね。
ありがとうございました!
403 :MONAちょび二段:2018/03/25 22:54:30 (6年前) 0MONA/0人
ethosはUbuntu14.04ベースなのでCUDA9.1は無理そう...
ビルドするとCUDA関連でエラーを吐くので
明日、素直にUbuntu16.04インストールしなおしてやってみます
それにしても、名無し名誉名人さんいつもありがとう!
404 :ハムちゃん二段錬士:2018/03/26 08:36:42 (6年前) 0MONA/0人
r2は動いてるんだけどr3以降は落ちちゃう
405 :名無し名誉名人教士:2018/03/26 09:30:59 (6年前) 0MONA/0人
>>404
yescryptr32かな?
このアルゴリズムは1054752バイトメモリを必要とする。(ローカルメモリ分は知らない)
そのため、一部GPUではメモリ不足になる可能性があります。
GTX1060(6GB)の場合、3840スレッド×1054752バイト=3.772GB(6GBを十分下回っているのでOK)
GTX1060(3GB)の場合、3456スレッド×1054752バイト=3.018GB(3GBを上回っているのでNG)
GTX1050Ti(4GB)の場合、2304スレッド×1054752バイト=2.263GB(4GBを十分下回っているのでOK)
GTX1050(2GB)の場合、1920スレッド×1054752バイト=1.886GB(2GBを下回っているが、ギリギリなのでNGの可能性大)
406 :名無し名誉名人教士:2018/03/26 09:42:32 (6年前) 0.00114114MONA/1人
>>405 Pascal世代のyescryptr32まとめ
確実にアウト⇒GTX1060(3GB)
容量ギリギリ(おそらくアウト)⇒TitanXp、GTX1080Ti、GTX1080、GTX1050
多分セーフ(画面出力に使用している場合はもしくは…)⇒TitanX
メモリ的には問題なし⇒GTX1070Ti、GTX1070、GTX1060(6GB)、GTX1050Ti、GT1030
基本的にコア数の3倍(6倍、9倍…)のスレッド数がパフォーマンスがいいので(なぜかはよくわからん)
-iを小さくすれば動作は大丈夫だろうけど、パフォーマンス低下が予想されます。
407 :名無し名誉名人教士:2018/03/26 09:47:33 (6年前) 0MONA/0人
Maxwellの場合は、
TitanX、GTX960(4GB)、GTX750Ti(4GB)
は問題ないけど、それ以外はアウトだな…
…これだけアウトが多いなら、なんか対策立てなきゃならんかね?
408 :名無し名誉名人教士:2018/03/26 11:12:43 (6年前) 0.00228228MONA/2人
yescrypt系のGPU耐性考察
yescryptは大量のメモリを使用、さらにメモリをランダムアクセスするアルゴリズムとなっています。
yescryptのパラメータを(N,r,p)と記述する場合、(pは要るのか?)
yescrypt/yescryptr8は(2048,8,1)
yescryptr16は(4096,16,1)
yescryptr32は(4096,32,1)
となります。
使用メモリはB、S、Vの3種類(XYも使っているが、失くすことも可能なので除外)。
B(128×r×p[byte/thread])⇒hashデータの保存領域。
S(8192×p[byte/thread])⇒演算用データ保存領域(主にランダムアクセスに使用)。
V(128×r×N[byte/thread])⇒演算用データ保存領域(超大容量…がゆえに、ほぼシーケンシャルアクセスが可能)。
yescrypt/yescryptr8はB[1,024]、S[8,192]、V[2,097,152]
yescryptr16はB[2,048]、S[8,192]、V[8,388,608]
yescryptr32はB[4,096]、S[8,192]、V[16,777,216]
を1スレッドごとに用意しなければならないため、GPUには不向きなアルゴリズムとされている。
409 :名無し名誉名人教士:2018/03/26 11:13:27 (6年前) 0.00114114MONA/1人
>>408 つづき
yescryptの各演算を分析すると、
1st step:sha256系の処理。データを逐次演算するため分割不可。メモリは少量。Bのみ使用。
2nd step:smix処理(1回目)。Sの生成を担当。64回処理。演算は4分割可能(16分割は不可)。B、Sを使用。
3rd step:smix処理(2回目)。Vの生成を担当。N回処理。演算は4分割可能。無理すれば16分割も可。B、S、Vを使用。
4th step:smix処理(3回目)。生成されたS、Vで(N÷3)回処理。演算は4分割可能。無理すれば16分割も可。B、S、Vを使用。
5th step:smix処理(4回目)。(N÷3)の端数調整。0回or2回処理。演算は4分割可能。無理すれば16分割も可。B、S、Vを使用。
6th step:sha256系の処理。データを逐次演算するため分割不可。メモリは少量。Bのみ使用。
となっています。ここで、各変数に着目すると、
B⇒分割不可、S⇒4分割可能、V⇒16分割可能
であり、分割を前提とすると、メモリ使用量を1/4、1/16にすることができる。つまり…
yescrypt/yescryptr8はB[1,024]、S[2,048]、V[131,072]⇒合計134,144バイト
yescryptr16はB[2,048]、S[2,048]、V[524,288]⇒合計528,384バイト
yescryptr32はB[4,096]、S[2,048]、V[1,048,576]⇒合計1,054,720バイト
で済ませることが可能となる。
410 :名無し名誉名人教士:2018/03/26 11:13:57 (6年前) 0.00114114MONA/1人
>>409 つづき
CUDAは様々なメモリがある。
・レジスタ:各スレッドごと独立したデータを保持。1スレッドあたり最大255個(1020バイト)使用可能だが、80個以下にした方が高速。
・ローカルメモリ:各スレッドごと独立したデータを保持。レジスタが足りないときに使用。低速なメモリに確保するが、キャッシュが利くので小容量であれば遅くはない。大容量も可能だが、その場合は低速。
・シェアードメモリ:1warp=32スレッドで共通したデータを保持。L1キャッシュ、レジスタと同等の速度を持つメモリ。Keplerでは48kB、第1世代Maxwell、TeslaP100では64kB、第2世代Maxwell以降(TeslaP100を除く)は96kB確保できる。
・グローバルメモリ:全スレッドで共通したデータを保持。低速だが大容量。キャッシュは利くが、全スレッドで共通利用のため、キャッシュヒット率は低め。カーネル間のデータ渡しはこれ1択。
・コンスタントメモリ:全スレッドで共通したデータを保持。変更できないが、キャッシュは利き、高速に利用可能。16,384バイト固定容量。
B、S、Vはグローバルメモリを使用するため、どうしても遅くなる。しかし、これを別のメモリに変更できれば高速化が図れる。
Bはカーネル間転送のためグローバルメモリ1択。Vは大容量のためグローバルメモリがいい。
Sは2,048バイト(4分割)×8並列=16,384バイト(32スレッドあたり)となり、シェアードメモリに転送が可能となる。各処理の最初に転送する必要があるが、ランダムアクセスが多いため、十分な効果が見込める。
これにより、メモリのランダムアクセスが多いことによるGPU耐性がほぼ無効化されたことになる。
411 :名無し名誉名人教士:2018/03/26 11:14:40 (6年前) 0.00039MONA/1人
>>410 つづき
次にメモリ容量について。
yescrypt/yescryptr8は合計134,144バイト
yescryptr16は合計528,384バイト
yescryptr32は合計1,054,720バイト
これによりGPUごとの使用メモリを算出する。(モデルとしてGTX1060の3GBモデルを使用)
スレッド数はGPUのパフォーマンスが(なぜか)良くなる、コア数の3倍=3,456スレッドとする。
yescrypt/yescryptr8の場合、134,144バイト×3,456スレッド=463,601,664バイト≒442.125 MB
yescryptr16の場合、528,384バイト×3,456スレッド=1,826,095,104バイト≒1.701 GB
yescryptr32の場合、1,054,720バイト×3,456スレッド=3,652,190,208バイト≒3.401 GB
なので、yescryptr32では容量オーバーで最適なスレッド数では起動できない。(コア数の2倍までなら起動可能)
現状のGPUで十分起動できるyescrypt/yescryptr8/yescryptr16は、GPU耐性を回避し、運用可能であると考えられる。
メモリ容量の圧縮をしていなければ、メモリ量が少ないyescryptでも運用できない容量だったので、分割できるアルゴリズムであったことがGPU耐性を回避できた要因であったとも考えられます。
また、このアルゴリズムで使用するメモリのうち、Sはランダムアクセスが多く、GPUに不向きな運用方法だったので、これが少しでも多かったら、GPU耐性は維持できたのではないかとも考えられます。
412 :さくさん:2018/03/26 14:14:26 (6年前) 0MONA/0人
GPUすごい。10k超えてるわ。→思わずプール立てたので、うちで掘ってみて。http://51.15.137.154:8080/
413 :ハムちゃん二段錬士:2018/03/26 22:24:39 (6年前) 0MONA/0人
>>405
GTX1060 3GBでyescryptr16ですが不安定だけどr4動きました
原因はcuda9.1入れてなかったことでした
ただr2が750H/sに対しr4が540H/sしか出ていないです
まあr2が動くのでいいかな
414 :MaineCoon一級:2018/03/27 00:31:39 (6年前) 0.00039MONA/1人
「小さな単純計算(アフィン変換)を並行して大量に処理できるデバイス」に対して
大量のデータを用いる事によって対抗してみたものの
近年のメモリ大容量化と高速化、アルゴリズム故にその性質からアルゴリズム化されて攻略される。
元組込屋として複雑な心境です。
何はともあれ、これで一区切り付いたと思います。お疲れさまでした。
これから先はメモリやバス間での「データ転送効率」がボトルネックになると思います。
最適なスレッド数といった「重箱の隅」ですね。
複数枚のカードを載せているとPCIeバス上でデータ衝突を起こしてお互いに譲らず。
ロックがかかって番犬に噛まれて強制リセットするみたいです。
しかもWatchDOGはWin10カーネルとZ270の二匹から噛みつかれているみたいです。
生成スレッド数が多くなれば演算結果をPCIeバス上に載せるタイミングが重複する確率は高くなりますし
載せてるカードの数が多ければ同時タイミングになる確率も増えてしまいます。
Z270のPCIeデータリンク層がそこまで排他処理をしてるとは思えないんですよね。
415 :kaiten初段:2018/03/27 12:49:15 (6年前) 0MONA/0人
>>408
偉業! だよね?
よくわかってないけど。
416 :takeo_3841三段:2018/03/28 00:48:18 (6年前) 0MONA/0人
>>405
いつもありがとうございます。
GTX1060 6GBでyescryptr32を掘ってます。KlausT-8.21-mod-r2では問題なかったのですが、mod-r3はまったくマイニングできず、mod-r4は1時間から3時間で止まります。
417 :名無し名誉名人教士:2018/03/28 06:48:50 (6年前) 0MONA/0人
>>416
ループ回数調整を攻めすぎたかな?
mod-r4はyescrypt32のループ4096回を4分割で調整しています。(GTX750は8分割、Keplerは16分割)
mod-r2はGPU関係なく16分割していた。
やはり、分割数を増やす必要ありそうだね。
現状は、-iオプションでスレッド数を減らしてみて…
ところで、分割数をコマンドラインから調整できるようにすべきかな?(yescrypt用のオプション)
418 :名無し名誉名人教士:2018/03/29 21:22:26 (6年前) 0.51597596MONA/5人
誰得更新第五弾。(まだやるのかよ…)
KlausT-8.21-mod-r5
https://1drv.ms/u/s!Aud1FauQ46vHh055NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh015NYbLOB2bQlOt
更新内容(8.21-mod-r4⇒8.21-mod-r5)
・yescryptr16/yescryptr32のループ回数を増やした。
r4ではループ回数は攻めすぎてたので、>>416のようなエラーがでる。
r5ではそれを調整した(具体的にはr2とr4の中間くらい)。これでダメなら、r2相当に再調整だな…
・自動設定でメモリ容量を参照して最適値を設定するようにした。
-iの自動設定ではメモリ不足の可能性があったので、自動設定にメモリ容量を参照するように変更した。
具体的には、メモリ容量から512MBを引いて(映像出力用)、残りで確保できるかをチェック。確保できない場合はスレッド数を減らすようにした。
(スレッド数がコア数と同数になってもエラーが出る場合は、事実上そのGPUでは掘れないことになる)
419 :名無し名誉名人教士:2018/03/29 21:53:59 (6年前) 0.00114114MONA/1人
>>418 の修正でyescrypt/yescryptr8で少しミスってた…
yescrypt/yescryptr8を掘る人はmod-r4を使ってください。
mod-r5ではスレッド数が半分になっています。(まあ、それほど影響はないと思うが…)
420 :名無し名誉名人教士:2018/03/29 22:05:54 (6年前) 0MONA/0人
yescrypt/yescryptr8でr5の方が速いなら、そのままにするけど…
421 :名無詞四段:2018/03/29 22:23:46 (6年前) 0MONA/0人
>>419
こういった姿勢が、本当に凄い。
422 :名無し二級:2018/03/29 23:31:02 (6年前) 0MONA/0人
第五弾、更新ありがとうございます!
うちのUbuntu上のGTX1070(100W制限)は8.49kH/s→8.57kH/sと微増、
Win8.1上のGTX1070Tiは10.7kH/s→11.03kH/sと3%ほど速くなりました。
あと、Ubuntu上でnvidia-smi -plでW制限掛けるのは守られますが、
Win8.1環境でAfterBurnerにてPL 75%とか絞っても、
GPUクロックを見ている感じでは、振り切って全力出している!?ようです。
423 :名無し名誉名人教士:2018/03/29 23:56:34 (6年前) 0MONA/0人
>>422
yescrypt/yescryptr8のスレッド数はコア数の6倍に調整していた。
今回のミスでコア数の3倍になったわけだが、そのほうが速いのか…
それとは関係ないけど、今回の更新で64bitのmad演算(a×b+c)を使ってみた。まあ、効果は皆無だけどね…
424 :ななもな四段:2018/03/30 08:37:13 (6年前) 0MONA/0人
すごいです・・・
425 :ハムちゃん二段錬士:2018/03/30 08:45:39 (6年前) 0MONA/0人
GTX1060 3GB yescryptr16
r2→r5で750H/sから860H/sになりました
ありがとうございます
426 :takeo_3841三段:2018/03/30 12:47:11 (6年前) 0MONA/0人
GTX1060 6GB yescryptr32 mod-r5でハッシュレート1%下がり(OCで585H/s)ましたが15時間連続動作してます。ありがとう!
427 :名無し侍二段:2018/03/30 15:27:33 (6年前) 0MONA/0人
素人的な質問ですいません。
KlausT-8.21-mod-r4 yescryptr8で掘っているんですが、yescryptr16とyescryptr32ってどう違うんですか?
演算させる量が違うって考えればいいのでしょうか?
428 :名無し名誉名人教士:2018/03/30 15:40:17 (6年前) 0.00004649MONA/1人
>>427
各アルゴリズムは概ねデータ数とループ回数(=中間データの数)の違いがあります。
uint32_t型のデータで考えると、(データ1個あたり4バイト)
yescrypt/yescryptr8は256個のデータを生成し、データそれぞれに対して2048通りの中間データを使用して演算する。
yescryptr16は512個のデータを生成し、データそれぞれに対して4096通りの中間データを使用して演算する。
yescryptr32は1024個のデータを生成し、データそれぞれに対して4096通りの中間データを使用して演算する。
yescryptr32になると、1スレッドあたり、メモリを1MB(+α)ほど用意する必要があります。
429 :名無し侍二段:2018/03/30 19:39:38 (6年前) 0MONA/0人
>>428
回答ありがとうございます!
なるほど、生成データ数が違うんですね~!
参考になりました!ありがとうございます!
430 :ittou四段教士:2018/03/30 23:42:08 (6年前) 0MONA/0人
r5早速ビルドしてみまする。
431 :ittou四段教士:2018/03/31 00:26:45 (6年前) 0MONA/0人
Ubuntuにてbuild成功。
もなとZenyで動作中。
432 :モナンゲリオン三級:2018/03/31 02:36:04 (6年前) 0MONA/0人
>>428
KlausT-8.21-mod-r5もKeplerで使えますか?
>yescrypt / yescryptr8 でKeplerに暫定対応。(GT710にて動作確認)
あと、KlausT-8.21-mod-r5でKOTO・BitZenyのプールで使えるのですか?
それともソロですか?
Windows10+GT710でうさぎコイン発掘所で使ってみましたが、ワーカーのハッシュが表示されずエラーは出ませんが全く掘れません↓これで合ってますでしょうか?
ccminer.exe -a yescrypt -o stratum+tcp://bitzeny.bunnymining.work:19333 -u *** -p ***
433 :名無し三級:2018/03/31 07:51:38 (6年前) 0MONA/0人
>>432
BitZenyならyescryptr8にしないと駄目じゃない?
434 :名無し名誉名人教士:2018/03/31 14:28:28 (6年前) 0.39885456MONA/6人
誰得更新第六弾。(徐々に迷走してきた)
KlausT-8.21-mod-r6
https://1drv.ms/u/s!Aud1FauQ46vHh1B5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh095NYbLOB2bQlOt
更新内容(8.21-mod-r5⇒8.21-mod-r6)
・yescrypt/yescryptr8/yescryptr32のメモリ配置を修正
これにより、キャッシュヒット率が変わる(…かもね?)
yescryptr16では、これをやると逆に遅くなったので、変更なし。
・スレッド数自動設定のバグを修正
動作自体は変わらず、よりシンプルに設定できるようにした
・yescryptr16のアンロールを排除
アンロールしないほうが速いっぽいので修正。
yescryptr32はすでにアンロール排除済み。yescrypt/yescryptr8はアンロールはあったほうがいい。
435 :ittou四段教士:2018/03/31 15:47:37 (6年前) 0MONA/0人
ubuntu OK.
1080x2にてzeny 26.76kH/s
436 :名無し初段:2018/03/31 16:57:41 (6年前) 0MONA/0人
>>434
R4→R6 yescrypt
1050Ti Core 1608MHZ MEM 3654MHZ 3030H/s→3295H/s
ありがとうございます!!
437 :名無し二級:2018/03/31 16:57:50 (6年前) 0MONA/0人
第六弾、更新ありがとうございます!
うちのUbuntu上のGTX1070(100W制限)はr5で8.57kH/sがr6で9.25kH/sに、
Win8.1上のGTX1070Tiはr5で11.03kH/sがr6で11.96kH/sと、
共に約8%ほど速くなりました。
迷走なんてとんでもないです、着実に速くなっております!!
438 :名無し名誉名人教士:2018/03/31 18:55:37 (6年前) 0MONA/0人
GTX1060(6GB)でやってみた。
yescryptr8
yescryptr16
yescryptr32
439 :名無し四段:2018/03/31 19:58:46 (6年前) 0MONA/0人
>>434
r5で満足してたのにさらに俺得更新感謝!感謝!
1070tiでYenten(yescryptr16)
r5
r6
nvidia-smi読みだけど
r4からr5では消費電力変わらず(90w)
r5からr6で消費電力が90W→120Wに上昇
全力発揮まではもう少し?
440 :モナンゲリオン三級:2018/03/31 21:37:35 (6年前) 0MONA/0人
>>433
yescryptr8でも同じでした(T.T)
441 :名無し名誉名人教士:2018/03/31 22:06:22 (6年前) 0MONA/0人
>>440
GT710はハッシュレートが低すぎるためおすすめできませんが…
yescryptr8で、ポートは19332でやれば大丈夫なはず。
19333だとdiffが大きすぎてほとんど掘れない。
442 :かぷろらくたむ四段:2018/03/31 23:17:48 (6年前) 0MONA/0人
CPUでマイニングしよう!の方ってここの名誉名人さんですか?
443 :名無し名誉名人教士:2018/04/01 14:58:38 (6年前) 0MONA/0人
誰得更新第七弾。(四月馬鹿企画?)
KlausT-8.21-mod-r7
https://1drv.ms/u/s!Aud1FauQ46vHh1J5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1F5NYbLOB2bQlOt
更新内容(8.21-mod-r6⇒8.21-mod-r7)
・yescryptr16v2に対応
WAVIフォークのPPTPってコインが掘れる…らしい?
多分、四月馬鹿企画だと思う。
割と簡単に作れるので、乗っかってみた。
444 :名無し名誉名人教士:2018/04/01 15:02:22 (6年前) 0MONA/0人
>>443 の更新は、yescryptr16v2が必要な人以外は必要ありません。
面倒な人はそのまま8.21-mod-r6をお使いください。
445 :名無し名誉名人教士:2018/04/01 19:22:14 (6年前) 0.00114114MONA/1人
446 :CT9W七段:2018/04/01 22:25:29 (6年前) 0MONA/0人
yescryptr16v2(PPTP)
8.21-mod-r7(GTX980)
9986番をポート開放済
ずっとこの画面のまま...。
447 :名無し四段:2018/04/01 22:42:57 (6年前) 0.00000039MONA/1人
>>446
それで動いてると思いますが
--no-cpu-verifyオプション付けといた方がいいと思う
オプションなしだとyay!!!出たのに掘れなかった・・・
逆にオプション付けたらboooooなのに掘れてるってね何が何だかw
とにかく掘りにくいみたいなので気長にがんばりましょう!!
448 :CT9W七段:2018/04/01 22:50:53 (6年前) 0MONA/0人
>>447
情報ありがとうございます。
オプションを追加して一晩掘ってみます。
449 :名無し名誉名人教士:2018/04/01 22:58:12 (6年前) 0MONA/0人
>>447
私の書いたコードは--no-cpu-verifyなんて想定していなかったよ…
多分、--no-cpu-verifyをつけてもCPUチェックは入ると思う。
450 :ittou四段教士:2018/04/01 22:59:06 (6年前) 0MONA/0人
PPTP掘り方教えて欲しい
451 :名無し四段:2018/04/01 23:08:34 (6年前) 0.00114114MONA/1人
>>449
そうなのか
Yenten掘りでもたまに出るから気になってたんだけど
たまたま一発目に当たってしまったって事か
>>450
ソロマイニングはここ↓を参考に
https://askmona.org/4673
452 :ittou四段教士:2018/04/01 23:18:39 (6年前) 0MONA/0人
>>451
そうか。プールじゃないのね。ソロ初めてですわ。
rpcportは9986でWin,マイナーはUbuntu。Winのポートはtcpの受信9986を空ければ良いかと思ったのですが、延々こんな感じ。
[2018-04-01 23:15:53] json_rpc_call failed, retry after 20 seconds
[2018-04-01 23:16:13] HTTP request failed: Failed to connect to 192.168.0.100 port 9986: Connection refused
453 :名無し四段:2018/04/01 23:30:18 (6年前) 0MONA/0人
>>452
qtは起動してる?
プールと違ってソロマイニングはウォレットがサーバーになるから
常に立ち上げておく必要があります
454 :名無し初段:2018/04/01 23:38:01 (6年前) 0MONA/0人
エイプリルフールのネタを掘るなんて・・・
さては普段採掘なんてしてねーなオメーらw
普通のパソコン1台では1日数十円とかだしなw
455 :ittou四段教士:2018/04/01 23:38:57 (6年前) 0MONA/0人
qtがwin10で、Win側はFW無しにしているけど、念の為送受信のTCP9986のルールを追加して、QTは立ち上げたまま。同期は終了している。
マイナー側からnetcat -w 10 WIN10のIP 9986
で返事が無いので、ポートが空いてないのかも。
WinのPORTを空ける方法が間違ってるんだろうか。FW無効なんだけど・・・
linuxなら簡単なんだけど、Winは詳しく無くて。
456 :ittou四段教士:2018/04/01 23:50:21 (6年前) 0MONA/0人
行けたかも。
[2018-04-01 23:49:22] Current block is 151
[2018-04-01 23:49:22] Using intensity 12.875 (7680 threads)
[2018-04-01 23:49:22] Using intensity 12.875 (7680 threads)
457 :ittou四段教士:2018/04/02 00:16:07 (6年前) 0MONA/0人
confファイルの置き場所を間違えていたようです。
QTからconf表示してみたら、空っぽのファイルがw
これ、一晩明けたら少しは掘れているんだろうか?
[2018-04-02 00:04:41] GPU #1: EVGA GTX 1080, 601.73 H/s
[2018-04-02 00:04:41] Current block is 160
[2018-04-02 00:08:42] GPU #0: EVGA GTX 1080, 601.57 H/s
458 :名無し名誉名人教士:2018/04/02 07:29:58 (6年前) 0MONA/0人
yescryptr16v2は、以下の違いがあります。
・パラメータが(N,r,p)=(4096,16,4)
yescryptr16では(4096,16,1)だった。
p=4になったことで、カーネル間転送量が4倍になります。
…しかし、中間データ量は変わっていないため、メモリ使用量はほとんどそのままです。
ループ数が4倍になっただけなので、ハッシュレートはyescryptr16の約4分の1になります。
・keyが”Client Key”から”PPTPPubKey”に変更
…文字数は変わらず、体勢に影響なし。変更が面倒だな…
変更点はこれだけ
459 :CT9W七段:2018/04/02 07:47:26 (6年前) 0MONA/0人
yescryptr16v2掘れました
460 :ittou四段教士:2018/04/02 08:43:49 (6年前) 0MONA/0人
私も掘れていました。
しかし、これ、いつまで掘ろう?
461 :名無し名誉名人教士:2018/04/02 08:46:22 (6年前) 0MONA/0人
ああ、yescrypt亜種ってだけで勢いでマイナー作ったからな…
その後のことは考えてなかったよ…
462 :CT9W七段:2018/04/02 09:05:40 (6年前) 0MONA/0人
CPU向けの新アルゴリズムをCPUマイナー出現前にGPUで掘れた事実だけで満足しちゃいました
463 :名無し名誉名人教士:2018/04/02 09:43:55 (6年前) 0MONA/0人
とりあえず、四月馬鹿企画は楽しめたかな?(油を注いでなんだけど…)
464 :ittou四段教士:2018/04/02 19:14:30 (6年前) 0MONA/0人
PPTPのプールが出来ましたね。
モナのDiffが高すぎてお手上げなので、あれこれ掘ってみる。
465 :名無し名誉名人教士:2018/04/02 20:05:15 (6年前) 0.0001MONA/1人
>>464
掘り始めたらプールが落ちたぞwww
466 :TP911さん:2018/04/02 21:37:00 (6年前) 0.0001MONA/1人
Hello, I tried to start solo by following the article provided above, but the display was "boom". How can I solve it?
467 :CT9W七段:2018/04/02 21:48:46 (6年前) 0.0001MONA/1人
>>465
21時頃に復旧しています。
468 :ittou四段教士:2018/04/02 22:29:03 (6年前) 0MONA/0人
>>465
行けるところまでソロで頑張って見ようかと。
>>466
I am also showing booooo. However, booooo seems to actually be mined. How about checking your wallet transaction once?
469 :TP911さん:2018/04/02 22:32:53 (6年前) 0MONA/0人
No, I try to mine other coins, all data is "boom" (fast)
470 :takeo_3841三段:2018/04/02 22:33:51 (6年前) 0MONA/0人
素早いminer対応感謝!
ネットハッシュレート下がってきてるのに1060だと全然掘れないなぁ
24時間で90PPTP
471 :名無しさん:2018/04/03 22:12:29 (6年前) 0MONA/0人
Lyra2Zoin - Lyra2(2, 330, 256)がGPU採掘できないということですがどういう原理で他のLyra2と違うんだろう
472 :名無し名誉名人教士:2018/04/03 22:43:18 (6年前) 0MONA/0人
>>471
Lyra2REが(1,8,8)、Lyra2REv2が(1,4,4)、Lyra2Zが(8,8,8)、
Lyra2(2,330,256)がどれだけGPUに不向きか…
単純計算で1スレッドあたり96バイト×330×256≒8MB?
(ソース詳しく読んでないから知らんけど…)
GTX1060(6GB)で考えると、8MB×1280スレッド=10240MB
4スレッド分割ができるとしても、10240÷4=2560MB
…ひでぇ
473 :名無し二級:2018/04/04 22:33:21 (6年前) 0MONA/0人
GTX960Mで円天掘ったけど226.60 H/sだった
安価ゲーミングノートならi7HQで掘った方が早いけどCPU使いたくない時に使うのなら良さそう
474 :名無し二級:2018/04/05 18:34:05 (6年前) 0MONA/0人
i7-6700HQとGTX960Mの安価ゲーミングノートで一日円天掘ったら約6枚でCPUだけで回したら4枚程だった
数年前のでこれだから今の安価ゲーミングノートだったら7~8枚は掘れると思う
メインでやるものではないけど参考にしてください
475 :ittou四段教士:2018/04/05 18:53:39 (6年前) 0MONA/0人
PPTPが1000超えた。これで満足。
476 :名無し名誉名人教士:2018/04/05 21:23:42 (6年前) 0.00736242MONA/4人
誰得更新第八弾。今回は速くなってない(逆に遅くなった?)
KlausT-8.21-mod-r8
https://1drv.ms/u/s!Aud1FauQ46vHh1R5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1N5NYbLOB2bQlOt
更新内容(8.21-mod-r7⇒8.21-mod-r8)
・煩雑だったコードをスリムにした。
各パラメータ共通で計算できるようにした。それにより、複数コードをひとまとめにして、ファイルサイズを小さくした。
また、コンパイルに必要な時間も縮まったかな?
・パラメータを指定できるようにした。(keyにスペースがある場合はうまくいかない…)
--yescrypt-param、--yescrypt-keyオプションを追加。様々なパラメータに対応できるようにした。
例)Kotoを掘る場合:--yescrypt-param=2048,4,1
Waviを掘る場合:--yescrypt-param=4096,32,1 --yescrypt-key=WaviBanana
477 :名無し名誉名人教士:2018/04/05 21:24:29 (6年前) 0MONA/0人
まあ、今回の変更はパラメータ実験用ですね…
478 :金髪ツインテールさん:2018/04/06 00:07:00 (6年前) 0MONA/0人
1050tiだけど、r8で遅くなった
479 :名無し二級:2018/04/06 02:55:46 (6年前) 0MONA/0人
更新ありがとうございます!
うちのGTX1070と1070TiのBitZeny掘りは、r6→r8で1%前後とかですが
ほんのり速くなりました。
ちょうど実験用にK-NOMPでプールを立てたところだったので、初めてkoto掘りを試したのですが、
reject reason low difficulty share of... とかでboooooになってしまいました。
2~3カ所、公開されているK-NOMP系プールでも試してみましたが、
メッセージは同様でした。
放置してどうなるかは試していません...
(自前プールもCPUでKoto公式配布v2.4マイナーなら掘れています)
480 :名無し名誉名人教士:2018/04/06 04:16:28 (6年前) 0MONA/0人
>>479
あれ?掘れたぞ?
ccminer.exe -a yescrypt -o stratum+tcp://okoto.xyz:51000 -u k1******(アドレス)******************
ちなみに、--yescrypt-param=2048,8,1を付けてもちゃんと掘れた。
>>476補足
--yescrypt-param、--yescrypt-keyオプションは-a yescryptのときしか働きません。
481 :名無し名誉名人教士:2018/04/06 06:43:25 (6年前) 0.00899464MONA/2人
GPU耐性考察
・メモリ使用量
GPUはコア数が多いため、メモリ量が相対的に少なくなる。
GTX1080を例に挙げると、8GB÷2560コア=3.2MB/コアとなり、1コアあたり3.2MBまでしか使えない。それ以上にメモリ量を増やすことで、GPUでは対応できないアルゴリズムになる。
問題点としては、CPU側も演算が遅くなってしまうこと。
poolを運営する場合、アルゴリズム指定ミスなど、正常でないハッシュが送られる場合がある。この時、ハッシュの確認をpool側CPUで対応するが、演算が遅いと対応しきれなくなってしまう(yescryptr32のpoolにLyra2REv2のハッシュが送られると…)。なので、演算が極端に遅いアルゴリズムはpool堀りで利用すべきではない。(あくまでも私の意見)
・メモリのランダムアクセス
GPUのメモリはランダムアクセスに向いていない。そのため、メモリのランダムアクセスを多発させることで、GPU耐性を持たせることができる。
ただ、メモリ量が少ない場合はGPUのシェアードメモリ内に収まってしまうので、ランダムアクセスに対応してしまう。
Pascalの場合、シェアードメモリ96kB÷128コア×16並列=12kBになる。yescrypt系は8kB(各パラメータで共通)なので、シェアードメモリに収まっている。
482 :名無し名誉名人教士:2018/04/06 07:10:19 (6年前) 0.00003MONA/1人
>>481続き
一方、CPUの場合はコア数が少ないため、1コアあたりのキャッシュが大きく、ランダムアクセスには向いている。
Corei7 7700Kの場合は、L2キャッシュ256kB/コア÷2スレッド/コア=128kB/スレッドなので、
12kB~128kBの間でランダムアクセスを行う場合は、GPU耐性を有していると考えられる。
(L3キャッシュまで視野に入れると、8MB÷8スレッド=1MBまで可能)
結論、メモリ量を増やさずに、ランダムアクセスを増やそうぜ!
64kBもあれば大丈夫かな?
483 :名無し二級:2018/04/06 07:12:56 (6年前) 0.0001MONA/1人
おはようございます、早朝kotoが掘れないでいた素人です。
今確認したところ、
-a yescryptr8 --yescrypt-param=2048,4,1
になっていましたので、
-a yescrypt --yescrypt-param=2048,8,1
に直したところ、yay!!!を拝めました!
もちろん -a yescrypt だけでも掘れました。
...もっと色々試してから書き込めば良かった...orz
お騒がせしましたm(_ _)m
484 :名無し二級:2018/04/06 15:29:07 (6年前) 0MONA/0人
>>482
面白い考察
けどGPU耐性あるけど、ASIC耐性が無いアルゴリズムとかにならないの?
485 :名無し名誉名人教士:2018/04/06 20:15:54 (6年前) 0MONA/0人
>>484
それってあり得るの?
486 :名無し四段教士:2018/04/08 01:50:29 (6年前) 0MONA/0人
1050tiでもi7 4770の倍以上掘れるんですね、凄い!!
487 :名無し二段:2018/04/08 12:05:50 (6年前) 0MONA/0人
kotodのノードを立ててccminerを使ってソロ掘りしてますが、採掘成功しても表示がboooo!になってることが多いです。
これは他の人もほぼ同時くらいに採掘成功していて一瞬遅れていたためにbooooになってるんでしょうか?yayとbooooの表示の条件の違いが分かりません。
488 :猿股初段:2018/04/09 09:36:41 (6年前) 0MONA/0人
「"2.2.4-mod-r4.zip" にはウイルスが含まれています」
OneDriveのウイルスウキャンに引っ掛かってダウンロード出来ないのは、どうしたら良いのでしょう。。
489 :モナンゲリオン三級:2018/04/09 12:26:51 (6年前) 0MONA/0人
>>488
当方は以下の方法で回避しています。
デスクトップにダウンロード用のフォルダを作る
Windows Defenderを開く
ウィルスと脅威の防止を開く
ウィルスと脅威の防止の設定を開く
除外の追加または削除を開く
除外の追加で先ほど作ったフォルダを指定
その後DLするとひっかからないです。
490 :猿股初段:2018/04/09 14:57:17 (6年前) 0MONA/0人
>>489
ご回答ありがとうございます。
Norton入れてるからか、そもそもWindows Defenderは無効になっていました。
だうんろーど後にPC側でウイルスチェックに引っ掛かると言うよりも、ダウンロード前にOneDrive側でウイルスチェックに引っ掛かっている印象でした。
-r1は引っ掛からないのですが-r4になると引っ掛かってしまいます。
https://imgur.com/a/S7Kbv
491 :猿股初段:2018/04/09 15:00:27 (6年前) 0MONA/0人
492 :鰯二段:2018/04/09 20:38:40 (6年前) 0MONA/0人
Fermiのサポートが終了とのニュースがありました。
比較的最近のローエンドまで使用されていたアーキテクチャだけに残念ですねー
493 :名無しさん:2018/04/11 23:27:56 (6年前) 0MONA/0人
Monaのマイニングもここで質問してかまいませんか?
494 :名無し二級:2018/04/12 00:00:05 (6年前) 0MONA/0人
>>493
本来askMonaなんだよなぁ・・・
495 :名無し二段:2018/04/12 00:12:34 (6年前) 0MONA/0人
KAMIKAZE
496 :名無し三級:2018/04/12 00:43:01 (6年前) 0MONA/0人
すいません初心者の質問です。
VIP Poolでモナコインを掘ってみたいですが
ここの奴はrem プールマイニングの場合
ccminer.exe -a lyra2v2 -o (IPアドレス):(ポート) -u (ユーザ名) -p (パスワード)
と書いてありました。
でもvippoolではccminer.exe -a lyra2v2 -o stratum+tcp://stratum1.vippool.net:8888 -u Weblogin.WorkerName -p WorkerPasswordがマイニングソフト設定になってました。
何をどう変えればいいのでしょうか?
保存するときは名前は何でもいいのでしょうか?
497 :さ҉҉ば҉҉ち҉҉ゃ҉ん七段教士:2018/04/12 01:01:43 (6年前) 0MONA/0人
>>496
vippoolにログインして
左にあるメニューの
アカウント>ワーカーを開いて
ワーカーの項目を -u に、パスワードの欄を -p の後のところと書き換えればいいです
登録してない場合は登録して(真顔
498 :名無し三級:2018/04/12 01:13:58 (6年前) 0MONA/0人
>>497
回答ありがとうございます。
そこまで行けたんですが、どうしても開いた瞬間に閉じてしまいます。
ウイルスソフトは外していますが、ここから先が行けないのです。
499 :名無しさん:2018/04/12 04:28:27 (6年前) 0MONA/0人
>>498
batファイルがminerとは別の場所にあると適当に推測してみる。
次の行にpauseを追記してみてはどうでしょうか。
ウインドウが閉じずにエラーの特定がしやすいと思います。
500 :名無しさん:2018/04/12 04:41:47 (6年前) 0.01MONA/1人
>>498
あとは、minerの名前を間違っていませんか?
単にccminer.exeではなくccminer〇〇.exeの場合もあります。
501 :名無し三級:2018/04/12 04:49:26 (6年前) 0MONA/0人
>>499
申し訳ないです。
本当に無知なのですがその二つはどれのことを指すのでしょうか?
pauseを追記してみたところ
'ccminer.exe' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
と表示されました。
ファイル内はこんな感じです。
502 :猿股初段:2018/04/12 09:01:50 (6年前) 0.01889464MONA/2人
500の方の仰る通りでは?
添附のスクリーンショットの左下にフォルダ内のファイル名写ってますが、
ccminer_2.2.4_CUDA91_VS2013_x86.exe
ccminer_2.2.4_CUDA91_VS2017_x64.exe
とかになってますよね?
ccminerのままでは「そんな名前のファイルは存在しません」となってしまいます。
まずお使いのOSが32bit(x86)か64bitかで絞り込めるんで、あとはGPUの新旧でCUDA変わってくると思うんですが、色々batファイル内の実行ファイル(.exe)の名前を色々変えてて試してみるとか。
ちなみにbatファイル内の拡張子(.exe)の表記は有っても無くてもOK。
お使いのエクスプローラーは拡張子を非表示の設定にされているみたいですが。
503 :名無し三級:2018/04/12 09:13:38 (6年前) 0MONA/0人
>>500
>>502
名前を指定してやらないといけなかったんですね!
理解しました!
ありがとうございます!動き出しました!
504 :名無しさん:2018/04/12 20:08:20 (6年前) 0MONA/0人
Mona掘ってると熱くなりすぎるのですがどなたか対策教えてください
お願いします
505 :名無し侍二段:2018/04/12 20:47:16 (6年前) 0MONA/0人
>>504
アフターバーナーとかでパワー絞っていますか?
506 :ittou四段教士:2018/04/12 20:49:49 (6年前) 0MONA/0人
GPU温度49℃になってる。そろそろやばい。
507 :名無し侍二段:2018/04/12 20:52:10 (6年前) 0.0001MONA/1人
>>506
GPU50℃くらいなら割と問題ないと思いますよ。
流石に60℃超えると怖いですが・・・(南国エアコン無しなのですぐ50℃いきますよ)
508 :名無しさん:2018/04/12 20:56:51 (6年前) 0MONA/0人
温度は60~70度ですね、、、
>>505
補償対象外になってしまうんですよね?
できれば避けたいのですが、、、
509 :ittou四段教士:2018/04/12 21:18:44 (6年前) 0MONA/0人
>>506
ポンプがMax60℃なので。。。
今日は暑かった。
510 :ittou四段教士:2018/04/12 21:19:05 (6年前) 0MONA/0人
>>507
アンカ間違えた。
511 :名無し侍二段:2018/04/12 21:46:14 (6年前) 0.0001MONA/1人
>>508
OCではなくパワーリミッターだから多分補償対象だとは思いますよ?
MSIとかのメーカーからソフトが出てるわけですし・・・
パワー絞るだけなら補償範囲ないかなぁとは思いますけどねぇ。(自己責任で)
まぁ、60~70は怖いですね。できれば60以下が理想的かと思います。
>>509
水冷ですか・・・?自分は空冷です。
512 :さまようよろい五段範士:2018/04/12 22:25:43 (6年前) 0MONA/0人
GPUは80~85度だけどFANが60%なのでまだまだ余裕なのかなと思ってる
513 :ittou四段教士:2018/04/12 23:23:51 (6年前) 0MONA/0人
>>511
勢いで初GPU、初水冷で、1080を2台と水冷一式と電源を輸入した。
それまでGPUはMatroxだったのに。
無茶しやがって。。。
514 :アンサンブラー三段:2018/04/12 23:36:40 (6年前) 0MONA/0人
温度をさげるだけなら、アフターバーナーでクロックしぼったり消費電力を絞るのが一番簡単ですが、-i オプションでスレッド数を少なくするのも効きますね。
とうぜんハッシュは下がりますが、アフターバーナーを使いたくないならそうゆう手もあると思います。
515 :名無し二級:2018/04/13 01:49:04 (6年前) 0MONA/0人
79℃行ってる。
怖いものは何もない(汗
516 :名無し初段:2018/04/13 01:59:23 (6年前) 0MONA/0人
1060 3GB だけど
サイドパネル外して100%で動かすと大体70度くらいになるんで
65%にリミットかけてファンを60%くらいで動かして55~58℃くらいで動かしてますな。
これで大体21.5MH/s程度で動いてる
これから暑くなるから扇風機直当てかマイニング自体辞めてしまうか悩ましいところです。
517 :名無し三級:2018/04/13 03:18:46 (6年前) 0MONA/0人
おおう...モナコイン一日かけて0.2とは...
赤字じゃないか
518 :名無し一級:2018/04/13 03:32:04 (6年前) 0MONA/0人
部屋暑くなると1080を65%で動かしてるやつが65℃くらいまで上がっちゃうけど、窓開けると花粉がつらい
519 :名無し侍二段:2018/04/13 15:11:54 (6年前) 0MONA/0人
>>516
PL無しで回すと熱量やばいですよねーまぁ、その分速度は出るのですが。
南国なんでPL60%の1060でも60℃は行きますよー
まぁ、この間まで1050と1060 6GBで回してましたが、ヤフオクで売り飛ばして1080に乗り換えましたね。
室温26~27℃デュアルディスプレイで1080PL58で50℃くらいですね
売り飛ばしてハイエンド乗り換えたり資金作るなら中古相場高めの今がチャンスかもしれません。
多分118xシリーズが出たらもっと中古が出回ると思うので・・・
>>517
正直今の現状だとGOXありましたがナイスハッシュで稼ぐのが一番効率よいかもしれませんねぇ(こだわりなければですが)
520 :のん五段:2018/04/13 15:28:33 (6年前) 0MONA/0人
おま環かもしれないのですがr8にてyescryptマイニング中に
JSON key 'data' not found
JSON invalid data
といったエラーが出てまた
[2018-04-13 15:18:01] GPU #0: ASUS GTX 1080 Ti, 17.63 kH/s
のような感じで戻るのですが、大量にエラーログが出るときがあるのですがJSON key 'data' not foundはウォレット側に問題があるのでしょうか?
(引数:ccminer.exe -a yescrypt -o ローカル別マシンIP -u *** -p ***)
CPUMinerでは正常に採掘できています。
521 :名無しさん:2018/04/13 23:43:31 (6年前) 0MONA/0人
>>511
電圧一番下にしたのに65℃だ、、、
522 :名無し侍二段:2018/04/14 00:11:54 (6年前) 0MONA/0人
>>521
となるとケースのエアフロ―の問題ですねぇ・・・
窒息状態や窒息系のケース使っていると熱が逃げず温度が上昇傾向になりますね。
少なくとも5℃くらいは変わりますねw
ゲーミング系の放熱性がいい奴だと結構冷えますよ~
523 :名無しさん:2018/04/14 23:10:59 (6年前) 0MONA/0人
20分ほど実行しているのですがなかなかyayになりません
どなたかおたすけください
524 :名無し侍二段:2018/04/15 01:51:54 (6年前) 0MONA/0人
>>523
GPU掘りです?CPU堀です?(あと通貨なんでしょい)
割と最初のbatファイル書き間違いだったりすることが多いですよ。
525 :名無し四段:2018/04/15 12:39:20 (6年前) 0MONA/0人
夏が来る
名人のマイナーでクリナイ掘ってみたいな(*´д`*)ボソ
526 :名無しさん:2018/04/15 13:59:57 (6年前) 0MONA/0人
>>524
GPUのMonaです
13時間放置してもだめでした、
5200.30k/Hsとか表示されるんですけどね、、、
一度だけyayになったりしっかり掘れてたりまったく掘れなかったりで困ってます
使用してるpoolはvippoolです
ccminer.exe -a lyra2v2 -o stratum+tcp://vippool.net:8888 -u u*******.user1 -p 5555
527 :名無し侍二段:2018/04/15 15:26:18 (6年前) 0MONA/0人
>>526
user1のとこがワーカー名として適用しているなら大丈夫かなぁとはおもいますけどね
あとはbatファイルの名前に日本語とか入れていません?
528 :名無しさん:2018/04/15 21:39:56 (6年前) 0MONA/0人
>>527
ワーカー名もあってますしbatファイルに日本語は使ってません
529 :名無しさん:2018/04/15 21:48:46 (6年前) 0MONA/0人
>>527
Difficultyを下げたらいけました
ご迷惑おかけしました
530 :名無しさん:2018/04/15 22:02:18 (6年前) 0MONA/0人
>>514
-iの使い方教えてもらえませんか?
531 :名無しさん:2018/04/15 22:43:08 (6年前) 0MONA/0人
次は30分ほどたつとマイニングソフトが止まってしまいました
CMDは開いたままでマイニングソフトのみフリーズ状態です
GPU使用率が0%になっていました
532 :名無しさん:2018/04/16 11:44:26 (6年前) 0MONA/0人
すいません。今日2.2.4-mod-r4.zipをダウンロードしようとしたら、HTTP403エラーみたいなのが出てダウンロードができないので 、ほかのファイルと複数ダウンロードしてみたら2.2.4-mod-r4.zipという名前のテキストファイルがダウウンロードされていました。
中を開いたら、
We detected that this file contains a virus that could harm your computer and stopped the download.
https://onedrive.live.com/?cid=c7abe390ab1575e7&id=C7ABE390AB1575E7!959&authKey=!AHk1hss4HZtCU60
と書かれているのですが、2.2.4-mod-r4.zipは使えないのでしょうか?
あと、KlausT-8.21-mod-r6のほうでもソロマイニングできるのでしょうか?
違いが良く分からなくて申し訳ありません。φ(..)メモメモ
533 :名無し名誉名人教士:2018/04/16 16:57:12 (6年前) 0MONA/0人
>>471 Lyra2Z(2,330,256)のGPU考察 (timeCost=2,Row=330,Col=256)
・メモリの容量問題
メモリを1スレッドあたり330×256×12×sizeof(uint64_t)=8110080バイト(7.73MB)使用する。
(Lyra2RE/Lyra2Zは6144バイト、Lyra2REv2は1536バイト)
GTX1080を例にすると、2560コア全てを動かすと19800MB≒19.34GBのメモリが必要になる。
ただ、Lyra2系は4スレッド分割が可能なため、19800MB÷4=4950MBとなり、一応確保できそうだ。(十分な並列数は確保できない)
無理して16スレッド分割をした場合(メモリアクセス時は4スレッド休眠)、19800MB÷16=1237.5MBとなり、この場合は十分な並列数を確保できる。
・メモリのランダムアクセス問題
メモリアクセスは1Row、1スレッドあたり、256×sizeof(uint64_t)=2048バイトを3セットアクセスする。(128スレッドあたり576kB、2560スレッドあたり360MB)
ただ、このアクセスがランダムアクセスになるため、十分な速度が得られないことが予想される。
対応としては事前にキャッシュしておくことが考えられるが、このアクセスを全てキャッシュに納めるためには、L1キャッシュ(128スレッドあたり24kB)、L2キャッシュ(2560スレッドあたり3MB)では到底足りない。
そこで、シェアードメモリ(128スレッドあたり96kB)を利用することを考える。
これでも容量が足りないため、カーネル内の256回ループを8分割(32回ループを8回実行)にすることを考える。この場合、576kB÷8=72kB(32スレッドあたり18kBとして確保する)となり、キャッシュとしての役割を果たすことが可能。(要するに手動キャッシュ)
第1世代Maxwellはシェアードメモリ64kBなので、16分割。
Keplerはシェアードメモリ48kB(192スレッドあたり)なので、64分割となる。(ここまでくると、正しく動くか不安になる…)
534 :名無し名誉名人教士:2018/04/16 16:57:46 (6年前) 0MONA/0人
>>533 こうやって見ると、なんか作れそうな気がしてきたな…
535 :名無し名誉名人教士:2018/04/16 17:03:04 (6年前) 0MONA/0人
通常のLyra2の構成(厳密には違うけど…)
for(tau=1…timeCost){
for(r=0…(row-1)){
state^=Mem(rowa)+Mem(prev)
round_lyra()
Mem(r)^=state(0,1,2,…,10,11)
Mem(rowa)^=state(11,0,1,…,9,10)
}}
536 :名無し名誉名人教士:2018/04/16 17:05:31 (6年前) 0MONA/0人
>>535 間違えた。こっちで…
for(tau=1…timeCost){
for(c=0…(col-1)){
state[c]^=Mem(rowa,c)+Mem(prev,c)
round_lyra(state)
Mem(r,c)^=state[0,1,2,…,10,11]
Mem(rowa,c)^=state[11,0,1,…,9,10]
}}
537 :名無し名誉名人教士:2018/04/16 17:08:51 (6年前) 0MONA/0人
>>536 これを、こう改造する。
for(tau=1…timeCost){
for(c=0…(col/8-1)){
(シェアードメモリに読み込み(キャッシュ))
for(i=0…7)){
state[c*8+i]^=Shared(rowa,i)+Shared(prev,i)
round_lyra(state)
Shared(r,i)^=state[0,1,2,…,10,11]
Shared(rowa,i)^=state[11,0,1,…,9,10]
}}}
538 :名無し名誉名人教士:2018/04/16 17:09:28 (6年前) 0MONA/0人
>>537
あ、キャッシュの書き戻しを忘れた…
539 :名無し名誉名人教士:2018/04/16 17:11:35 (6年前) 0MONA/0人
ちなみに…
Lyra2REv2はメモリ丸ごとシェアードメモリに入る。
Lyra2RE/Lyra2Zは第1世代Maxwellでシェアードメモリには入りきらなくなるため、L2キャッシュから読みだすことになる。
540 :アンサンブラー三段:2018/04/16 20:26:38 (6年前) 0MONA/0人
>>350
教えるといっても、ただ数字を指定するだけなので・・・
1080つかってるなら、デフォルトは21.5(だっけかな?)なので、それ以下にすれば負荷がかるくなります。
適当に数字をいれて、ねらった温度になるまで数字を小さくしてみるといいと思います。
すごい大きな数字をいれるとかえって遅くなるんで、はじめは15とか10とかにして様子をみてみるといいかもしれません。
541 :アンサンブラー三段:2018/04/17 22:31:54 (6年前) 0MONA/0人
>>540
一日たって気が付いた、上のアンカは
>>530
ですよね(;^_^A
542 :名無し名誉名人教士:2018/04/21 09:25:16 (6年前) 0MONA/0人
実験的にやってみた
無理かな~…って思ったけど、案外速かった?
543 :名無し名誉名人教士:2018/04/21 09:39:11 (6年前) 0MONA/0人
>>542
調整したら噴いたwww
544 :名無し二級:2018/04/21 11:40:43 (6年前) 0MONA/0人
>>543
すごいですね。ご自分でソースを書き直されたものでマイニングしたということですよね。
545 :CT9W七段:2018/04/21 12:38:24 (6年前) 0MONA/0人
YescryptR24も気になっています。
何が違うのだろう?
546 :名無し名誉名人教士:2018/04/21 13:22:52 (6年前) 0MONA/0人
>>545
>>476のmod-r8で
-a yescrypt --yescrypt-param=4096,24,1 --yescrypt-key=Jagaricoin
のオプションを入れれば掘れる…かなぁ…
(ソースを見ると、"JagaricoinR"になっているけど、10文字しか使わないからJagaricoinでいいっぽいけど…)
547 :名無し名誉名人教士:2018/04/21 14:26:34 (6年前) 0.04014114MONA/2人
誰得更新第九弾。今回はLyra2z330(Lyra2Zoin)
KlausT-8.21-mod-r9
https://1drv.ms/u/s!Aud1FauQ46vHh1Z5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1V5NYbLOB2bQlOt
更新内容(8.21-mod-r8⇒8.21-mod-r9)
・Lyra2z330(Lyra2Zoin)に対応
思ったより速くなりました…
オプションは
-a lyra2z330
でお願いします。
548 :名無し二級:2018/04/21 17:46:41 (6年前) 0MONA/0人
本当にありがとうございます。
ubuntu16.0.4でコンパイルしたところ、
lyra2/lyra2REv2.cu(62): error: identifier "FALSE" is undefined
と出てしまいます。
lyla2/lyra2Rev2.cuの62行目を修正して(間違った修正かもしれません)パスさせてやると、
ccminer-ccminer.o: 関数 `miner_thread(void*)' 内:
ccminer.cpp:(.text+0x3962): `scanhash_lyra2z330(int, unsigned int*, unsigned int*, unsigned int, unsigned int*)' に対する定義されていない参照です。
でコンパイルできませんでした。。。。どこに定義すれば良いのでしょう。
すみません。もし暇があったら教えてください。
549 :名無し名誉名人教士:2018/04/21 18:33:03 (6年前) 0MONA/0人
>>548
FALSEを0に、TRUEを1に書き換えればおk
550 :ittou四段教士:2018/04/21 18:42:14 (6年前) 0MONA/0人
これってC99対応してるかとか、そういった話でしょうか?
551 :名無し二級:2018/04/21 18:55:06 (6年前) 0MONA/0人
>>549 ありがとうございます。はい、それはやってみたのですが、リンク時に
ccminer-ccminer.o: 関数 `miner_thread(void*)' 内:
ccminer.cpp:(.text+0x3962): `scanhash_lyra2z330(int, unsigned int*, unsigned int*, unsigned int, unsigned int*)' に対する定義されていない参照です。と出てしまうのです。
もう少し頑張ってみます。
552 :ittou四段教士:2018/04/21 18:59:11 (6年前) 0MONA/0人
>>551
同じー
553 :ittou四段教士:2018/04/21 19:06:52 (6年前) 0MONA/0人
Makefile.inに抜けが有るんだろうか。。。
554 :ittou四段教士:2018/04/21 19:10:50 (6年前) 0MONA/0人
Makefile.inにcuda_lyra2Z330が無いですね。追加で行けるかな。
555 :CT9W七段:2018/04/21 19:11:55 (6年前) 0MONA/0人
>>546
いけました!ありがとうございます。
556 :名無し二級:2018/04/21 19:18:26 (6年前) 0MONA/0人
>>553僕もやっとそれを発見しました。僕も追加してみます。
557 :ittou四段教士:2018/04/21 19:48:08 (6年前) 0MONA/0人
Makefile.amの方だった。inは生成される方かな
558 :ittou四段教士:2018/04/21 20:54:53 (6年前) 0MONA/0人
ビルド通りますた。
cuda_lyra2Z330.cu
lyra2Z330.cu
上2つをMakefile.amに追加。
同上2つのFALSEを0に書き換え。
なお動作確認はしてません(ぉぃ
559 :名無し二級:2018/04/21 21:24:10 (6年前) 0MONA/0人
>>548です。
>>547の神
>>558
ありがとうございます。無事にコンパイル通りました。
560 :名無し名誉名人教士:2018/04/23 10:06:32 (6年前) 0MONA/0人
今回の更新はLyra2(2,330,256)です。(Lyra2Z330またはLyra2Zoinとも呼ばれる?)
当初目標はCore i7-6700Kの816H/s…
変更履歴としては…
①とりあえずコードそのままに作ってみる(正常に動作せず)
②CPUコードと比較した結果、CPUコードにバグと思しき部分を見つけ、GPUに反映。(この時点でGTX1060で約400H/sと、お話にならない…)
③L1キャッシュの積極利用(Yescryptでやった方法)。これにより、約600H/sに改善。
④プリフェッチによる先読みの実行。これにより、約900H/sに改善。目標値を超える。
⑤メモリに余裕があったので、スレッド数を調整(実装コア数の3倍のスレッド数)。これにより、約1700H/sに改善。
561 :名無し名誉名人教士:2018/04/23 10:12:55 (6年前) 0MONA/0人
>>560 ②のバグについて
CPUコード内で、こんなコードがあった。(以下はバグ部分を抜きだしたもの)
int64_t row=0;
int64_t step=-1;
int64_t nRows=330;
row=(row+step)%nRows;
おそらく、row=329と出力してほしいものと思うが、実際の動作はrow=15となる。
内部的には、(0-1) % 330=0xFFFFFFFFFFFFFFFF % 330=15 となっているみたい…
GPUコードはint64_tではなく、uint32_tで、しかもstep=-1をstep=nRows-1に変えていたため、なかなかうまくいかなかった…
(まあ、思い込みで作ったってのもあるんだけど…)
562 :名無し名誉名人教士:2018/04/23 10:22:15 (6年前) 0MONA/0人
>>560 ④のプリフェッチについて
汎用命令では用意されていないが、PTXコードにprefetch.globalなんて命令がある。これをインラインアセンブラで記述することにより、先読みを実装することができる。
実コードは1順先読みを行っている。2順先読みも試したが、1順のときと変化が無かった。
なお、先読みは読み込み以外の命令が多い場合に効果があり、Lyra2系は読み込み後即演算となるため、有効に働く。
Yescrypt系の場合はメモリ読み書きが大半を占め、読み込み後の演算は僅かなため、先読みがあまり有効に働かない…
563 :名無し名誉名人教士:2018/04/23 10:31:57 (6年前) 0MONA/0人
>>560 ⑤のメモリ容量について
・Lyra2(2,330,256)は、中間データとして330×256×sizeof(uint64_t)×12=8110080バイト(約7.73MB)のメモリが必要となる。
GTX1060(6GB)でそのまま実装した場合、1280コア×7.73MB=9894.4MBとなり、6GBでは到底確保しきれない容量となっている。
・以前から行っているLyra2の4分割演算を実施した場合、メモリ容量は1/4にすることができるため、9894.4MB÷4=2473.6MBとなり、何とか確保はできそう…(一部GPUでは容量オーバーになる)
・今回、Lyra2を無理やり16分割演算を実施した。(メモリアクセス時16コア中4コアが休眠状態になるが…)
これにより、メモリ容量は9894.4MB÷16=618.4MBとなり、ほとんどのGPUで十分確保できる容量になった。
また、コア数の3倍起動することで、618.4MB×3=1855.2MBとなる。この程度なら問題ないと判断して、デフォルトスレッド数をコア数の3倍とした。
564 :名無し名誉名人教士:2018/04/23 10:34:08 (6年前) 0MONA/0人
Pascal世代ではGTX1060(3GB)がメモリ条件が最も厳しいため、これで動作するなら、大丈夫…かな?
565 :skyacross999さん:2018/04/24 13:40:24 (6年前) 0MONA/0人
CCマイナー起動すると
BTCとZCOINの
donaetion address アドレス
が出るのですが、これは何でしょうか?
566 :アンサンブラー三段:2018/04/24 14:27:45 (6年前) 0MONA/0人
>>565
そのものずばり寄付してねっていう意味でしょう。
強制力はないですが、できるなら感謝の気持ちをこめて寄付してはそうでしょうか?
ただ、私はmonaしか掘ってないので、そちらのはおくれませんがmod版の作者さんである名無し名誉名人さんに感謝の気持ちを込めて投げ銭させていただいております。
ちなみに、KlausT版ではそのメッセージはでません。
まぁ、作者さんが違うからかな?よくわかりませんがw
567 :名無し名誉名人教士:2018/04/24 15:54:03 (6年前) 0.04789464MONA/2人
>>565 >>566
補足すると、ここで改造しているマイナーは、donation周りは書き換えていないので、そのアドレスに送っても私には届きません。
Fork元に届くんじゃないかな?
568 :名無し名誉名人教士:2018/04/24 21:11:28 (6年前) 0MONA/0人
>>567 補足
そもそもdonationアドレスを変えるつもりは全くないです。
0.00889464MONAが届いていたので一応…
569 :鍋焼きうどんさん:2018/04/25 01:17:38 (6年前) 0MONA/0人
MONA掘るのに最も安定しているのはどのバージョン?
安定重視で続けたいのだけど...
570 :名無し二級:2018/04/25 02:16:22 (6年前) 0MONA/0人
>>569
基本的にどれも安定しています。安定という定義にもよりますが。
本当は、自分で確かめて作者へレポートして感謝の意を表すべきことです。
571 :名無しさん:2018/04/25 03:11:48 (6年前) 0MONA/0人
Zoin対応おめでとうございます
試しに回してみましたがpoolに表示してるhashrateが手元の表示と乖離大なのはそんなもんなんでしょうかね?
poolはオフィシャルらしい zoin.netabuse.net
1080Ti 65% 手元3800H/s poolの表示は0.2kH/s
1070 65% 手元2800H/s poolは0.15kH/s
572 :名無し名誉名人教士:2018/04/25 07:21:53 (6年前) 0MONA/0人
>>571
そんなに違う?
プールのハッシュレートは一定時間の平均値のため、ある程度の時間を掘らないとちゃんとした値は出ませんよ。
また、difficultyが小さ過ぎると採掘効率は悪くなります。
573 :名無しさん:2018/04/25 22:29:48 (6年前) 0MONA/0人
>>572
pool hashが平均ってのは理解してます。あれから1日さらに放置しましたが変化なしですね。
diffはpoolがstratum鯖なので自動設定だと思うんですが…
確かにやたら小さいと値が返ってきてますね。0.00633803とかでセットされてます
poolのせいっぽいので別のpoolで試してまたご報告しますね
574 :名無し一級:2018/04/27 17:35:04 (6年前) 0MONA/0人
>>546
JagaricoinR掘れるか試してみたけど
GPU #0: result does not validate on CPU!
が出てきてどうやらうまくいってないっぽいです。
575 :ittou四段教士:2018/04/27 20:15:57 (6年前) 0MONA/0人
>>574
検索していきなり出てくる対策じゃ駄目?
576 :CT9W七段:2018/04/28 04:49:16 (6年前) 0MONA/0人
>>546
>>555
>>574
訂正報告し忘れていました。すみません。
ソロマイニングに挑んでいたのでエラーに気づかなかったの。
GPU #0: result does not validate on CPU! に対して、
--no-cpu-verify オプションを付けたら回避可能かと思いきや、
大量のRejectログが溜まるだけでした。
577 :名無し一級:2018/04/28 13:26:39 (6年前) 0MONA/0人
cpuminerのソース見ても、
(N,r,p) = (4096,24,1)と
"JagaricoinR"
のとこ以外違い見つけられない。
作者を疑うわけではないが
KrausT-8.21-r8が r=24 に対応してない可能性を考えてソース見てくる。
むしろ作者いつもありがとう。お世話になっております。
578 :名無し一級:2018/04/28 14:05:40 (6年前) 0MONA/0人
>>577 自己レス
r=24だと3の倍数だから、「2の累乗をrで割ってintに代入」している箇所があるかと思って探したのですが私には見つけられませんでした。
役立たずで申し訳ない。
賢い人よろしくお願いいたします。
579 :名無し一級:2018/04/28 14:25:10 (6年前) 0MONA/0人
>>577 >>578 また自己レス
ちなみになんでそこを探したかというと
rを1から32まで試して、動くのが
r=4,8,16,32だけだったからです。
どうでもいいですがr=2はccminer自体が落ちましたので多分別のエラー。
580 :takeo_3841三段:2018/04/28 20:27:37 (6年前) 0MONA/0人
いつもありがとうございます。
zoin掘ってみました。poolの表示だと、
2200H/sなのに880H/sのCPUとshareが変わらないようです。
実際に掘れる量の違いはまだ確認出来てません。
worker1がGTX1060 6GB、worker2がi7-6700K(cpuminer-opt 3.8.8)
掘り始めてから2時間経過後にスクリーンショット撮影
581 :名無し名誉名人教士:2018/04/28 20:49:27 (6年前) 0MONA/0人
>>579
x[k] ^= x[(k + r * 2 - 1) & (r * 2 - 1)];
これが悪いみたいだね…
x[k] ^= x[(k + r * 2 - 1) % (r * 2)];
なら動くと思う…
けど、それだと他が遅くなりそうだな…
別の方法を考えてみるよ。
582 :名無し名誉名人教士:2018/04/28 21:08:17 (6年前) 0MONA/0人
>>579
現状は、
第2世代Maxwell以降は、N × r ≧ 16384 なら成功
第1世代Maxwellは、N × r ≧ 8192 なら成功
Keplerは、N × r ≧ 4096 なら成功
loop_count = N * r / 16384;
が0になったらエラーになるね、これ…
loop_count = max(N * r / 16384,1);
ならうまくいくかな?
583 :由利子初段:2018/04/28 22:05:25 (6年前) 0MONA/0人
もなこいんください1
584 :名無し名誉名人教士:2018/04/29 09:05:36 (6年前) 0.00342342MONA/3人
誰得更新第十弾。今回はyescryptのバグフィックス
KlausT-8.21-mod-r10
https://1drv.ms/u/s!Aud1FauQ46vHh1h5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1d5NYbLOB2bQlOt
更新内容(8.21-mod-r9⇒8.21-mod-r10)
・yescryptのパラメータで、r=4,8,16,32,64,128以外でうまくいかない問題を修正。
>>581のように修正すると、演算が遅くなりそうだった。そこで、前値を保存して、再参照することで割り算を省略した。
また、ループ数が0になる場合があったので、max関数で最小値が1になるように修正。
・yescryptr24を追加
-a yescryptr24を指定することで、JagariCoinRに対応。
-a yescrypt --yescrypt-param=4096,24,1 --yescrypt-key=Jagaricoinでも同様に掘ることができます。
585 :名無し名誉名人教士:2018/04/29 09:10:25 (6年前) 0MONA/0人
>>584 補足
今回は一応Makefile.amを修正してみた。たぶんLinuxでもコンパイルできるんじゃないかな?
あと、試験的にLyra2Zを追記してみた。(tpruvotバージョンでは搭載されていた)
Lyra2Z330をパラメータ変更しただけなので、遅いですね~
どうにか汎用化できればいいんだけど…
586 :ぐり七段教士:2018/04/29 18:29:09 (6年前) 0MONA/0人
>>576
試しにKlausT-8.21-mod-r10使って >>546 のオプションのまま
-a yescrypt --yescrypt-param=4096,24,1 --yescrypt-key=Jagaricoin
でプールマイニングしてみましたが、PL80の1080Tiと1080の2枚構成で
3337~3343 H/sで安定して動きました。
掘ってる人、60人ちょいと少ないからちょっと動かしただけなのに
プールシェアの2位に入ってしまったw
587 :ぐり七段教士:2018/04/29 18:36:45 (6年前) 0MONA/0人
あ゛あ゛あ゛~、r10の更新内容しっかり読んで無かった。
>>584
の通り -a yescryptr24 だけで良かったんですね。(´・ω・`)
588 :名無し名誉名人教士:2018/04/29 18:39:30 (6年前) 0MONA/0人
>>586
-a yescryptr24でも掘れるようになってるはず
589 :名無し名誉名人教士:2018/04/29 18:40:39 (6年前) 0MONA/0人
おっと、ちょっとコメ遅かった…
590 :名無し二級:2018/04/29 23:41:35 (6年前) 0MONA/0人
>>584ありがとうございます。
ubuntu16.04でコンパイルしてみました。
lyra2/lyra2REv2.cu(44): warning: variable "ctx_bmw" was declared but never referenced
1 error detected in the compilation of "/tmp/tmpxft_000011eb_00000000-13_lyra2REv2.compute_70.cpp1.ii".
Makefile:1969: ターゲット 'lyra2/lyra2REv2.o' のレシピで失敗しました
になります。
なぜエラーなのか、これから調査してみます。
591 :名無し二級:2018/04/30 00:01:12 (6年前) 0MONA/0人
>>590です。
お騒がせしました。単純に
>>549
のご指摘で解決する問題でした。
問題なくコンパイルできます。
592 :名無しさん:2018/04/30 08:39:35 (6年前) 0MONA/0人
GTX1080でプールMONA堀り、KlausT-8.18-r1を使用させてもらっていますがKlausT-8.20-mod-r1以降のバージョンだとハッシュレートが落ちてしまいます。
KlausT-8.18-r1:40-42MHz
KlausT-8.20-mod-r1~KlausT-8.21-mod-r10:26-31MHz
・Windows10 Pro 64bit
・試したドライバは388.19と388.31
・CUDA9.1インストール済み
・オプション設定無し(試しにiオプションで23に設定するも変化なし)
考えられる原因が何かありますでしょうか?
ご教示いただけると助かります。
593 :かけだしマイナー三級:2018/04/30 09:26:03 (6年前) 0.01MONA/1人
>>592
こっちでも普段使っている2.2 mod-r2と、KlausT-8.21-mod-r10で計測してみました。個人的には、2.2 mod-r2が安定してハッシュレート出る感じがします。
Windows10 Pro 64bit
ドライバ 388.19
CUDAインストールなし。ccminerのオプションなし
[AfterBurnerの設定あり]
GTX1080 PL60 CPU+140 MEMORY-10
GTX1070Ti PL60 CPU+120 MEMORY-10
[ccminer 2.2 mod-r2]
GTX1080 41.15MH/s
GTX1070Ti 41.29MH/s
[ccminer-KlausT-8.21-r10]
GTX1080 38.84MH/s
GTX1070Ti 40.72MH/s
594 :名無し名誉名人教士:2018/04/30 15:20:00 (6年前) 0MONA/0人
>>593
2.2系は表示ハッシュレートとプール上ハッシュレートの乖離が大きかったので、開発ベースをこっちに移したんだけど…
そのあたりはどうでしょうか?
595 :okoto一級:2018/04/30 16:29:15 (6年前) 0MONA/0人
yescrypt作者がGPUマイナーの考察してるようです。
名無し名誉名人の連絡先知りたいらしいです。
http://lists.openwall.net/phc-discussions/2018/04/28/1
596 :名無し名誉名人教士:2018/04/30 18:30:20 (6年前) 0MONA/0人
>>595
連絡先を教えても、英語がさっぱりわからんからな…どうしたもんか…
(Google翻訳してもよくわからん…)
ってか、作者もよくここを見つけたものだね…
597 :774さん:2018/04/30 19:57:09 (6年前) 0MONA/0人
あんたすげえ人だったんだな・・・
598 :かけだしマイナー三級:2018/04/30 21:48:02 (6年前) 0MONA/0人
>>594
592です。短時間ですが、プールのハッシュレートを比較しました。
2.2 mod-r2
local pool
81.41MH/s 57.58MH/s
KlausT-8.21-r10]
local pool
79.40MH/s 63.96MH/s
確かに、2.2はローカルで表示しているハッシュレートよりもプール側のハッシュレートが低くなるようです。
599 :暇つぶしに堀り掘りさん:2018/04/30 22:07:41 (6年前) 0.01MONA/1人
>>592
GTX1080 2枚差しでVIPプールのハッシュ
KlausT-8.21-mod-r10 で計測
Windows10 Pro 64bit
ドライバ 391.35
CUDAインストールなし。ccminerのオプション -i19
[AfterBurnerの設定あり]
GTX1080×2 PL70 TL 70 MEMORY-502
[ccminer-KlausT-8.21-r10]
GPU #0 GTX1080 45.18MH/s プライマリーディスプレイ
GPU #1 GTX1080 46.51MH/s マイニングのみ
600 :暇つぶしに堀り掘りさん:2018/04/30 22:08:40 (6年前) 0MONA/0人
あまり関係ないかもしれませんがGPU温度上がってません?
MSI純正空冷ファンで、ケースを空けて、サーキュレーター直あて
3月末(室温18℃付近)で稼働だとGPU温度54度付近
4月に入り室温22℃を超え始めたら、68℃付近まで上昇し
ハッシュが5%程落ちました
GW入って簡易水冷を2枚に付けたんですが
GPU温度54℃でハッシュも戻りました
601 :暇つぶしに堀り掘りさん:2018/04/30 22:13:11 (6年前) 0MONA/0人
すみません、>>599
GTX1080 2枚差しでVIPプールのハッシュ
間違い訂正です、ローカルのハッシュです
602 :名無し名誉名人教士:2018/04/30 22:42:43 (6年前) 0.22648256MONA/6人
誰得更新第十一弾。今回はLyra2RE、Lyra2Z周りとyescrypt/yescryptr8
KlausT-8.21-mod-r11
https://1drv.ms/u/s!Aud1FauQ46vHh1p5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1l5NYbLOB2bQlOt
更新内容(8.21-mod-r10⇒8.21-mod-r11)
・前回のyescryptパラメータ問題の修正をyescryptr8にも反映させた。
この更新で若干速くなったっぽいので、r8にも反映させないと損だよね…
・Lyra2REの追加
Lyra2Zができるのに、Lyra2REができないなんてのも変なので、実装した。
・Lyra2系の処理の見直し
Lyra2系はSharedメモリ使用4-Way型、Globalメモリ使用4-Way型、Globalメモリ使用16-Way型があり、GPUにより最適解が異なるので、正しい処理を選択できるようにした。
603 :sinono初段:2018/04/30 23:41:49 (6年前) 0MONA/0人
名前変わってますが592です
>>593
>>592
環境教えていただきありがとうございます。
CUDAの有無以外似た環境ですね。
ABの数値を同じにして起動しましたがハッシュは低いまま変わらず…。
プールも変更してみましたが同じでした。
ちなみにAB数値変更前はこんな感じでした。
GTX1080 PL85 CPU+150 MEMORY-502 GPU温度58-60℃
>>600
GPUの温度は58-60℃なので大丈夫かと思います。
604 :sinono初段:2018/04/30 23:43:38 (6年前) 0MONA/0人
>>599
すみません、アンカーミスでした
自分にアンカーしてどうする…。
605 :暇つぶしに堀り掘りさん:2018/05/01 00:17:37 (6年前) 0MONA/0人
>>603
PL85で、58-60℃って低いですね~羨ましい・・・
標準ファン?リファレンスファン?
2.2 modから、KlausT-8.21系では+5%ぐらいの
ハッシュ値向上はありましたが
KlausT-8.21-r1~10では、当方の環境では、ハッシュの数値は殆ど変化無かったですが
r3ぐらいからbooooの出現率が劇的に減りました
606 :名無し二級:2018/05/01 00:59:53 (6年前) 0MONA/0人
>>602ありがとうございます。
Ubuntu16.04でですが、r10->r11でyescryptが少し早くなりました。
gtx1080で12.24kH/s(r10)->12.68kH/s(r11)。
607 :sinono初段:2018/05/01 01:21:59 (6年前) 0MONA/0人
>>605
GPUはASUS TURBO-GTX1080-8GでABのFSは60-80%に設定しています。
好んで外排気使ってますが割と良い感じです。
booooに関しては私の環境ではどのverも特に出なかったと記憶しています。
とりあえずCUDA削除してみますね。
608 :暇つぶしに堀り掘りさん:2018/05/01 02:12:43 (6年前) 0MONA/0人
最後に余談ですが・・・当方、普段使いのPCでデュアルディスプレイ環境
モニター1(GTX1080 GPU#0)モニター2(CPUグラフィック)
ネトゲとエンコ用に使う事があるので
マイニング専用になっている、GPU#1だけでマイニングできるよう
-dオプションを使いたかったのですが
#0と#1の2個のどちらかを選ぶ場合、過去スレにもありましたが
#0しか指定でず、マイニング専用の#1は指定きなかったので
試しに、#1にディスプレイを繋いで-d0にしたら
GPU1個でもマイニングはできましたが
PC起動時にBIOS設定が出来なくなった?ので
繋ぎ方を戻したのですが、そしたらハッシュが下がりました
#1のGPUを一度取り外しPC起動、その後もう一度
#1を取り付けたらハッシュが元々の数値より各GPU
1.00 MH/s上昇しました・・・
ハッシュは繊細ですね(笑
609 :sinono初段:2018/05/01 10:12:28 (6年前) 0MONA/0人
CUDA削除、ドライバを391.35に変更してもハッシュレートは低いままですね…
。
>>608
ライザー不良が原因でしたがリグ再起動の度にハッシュが乱高下とか本当に繊細です。
610 :金ツイin日本橋さん:2018/05/01 22:04:39 (6年前) 0.00004649MONA/1人
みなさん、はじめまして。
最近、マイニングに興味が出て
ここを見て勉強させていただきました。
Ubutu16.04+CUDA9.1+2.2.4-mod-r1+1050ti1枚の
環境で初めて見ました。
今日初めて動かしてみたけど、初めて掘れたときは
うれしかった。
611 :名無しさん:2018/05/02 10:01:04 (6年前) 0MONA/0人
>>602
いつもソースの提供ありがとうございます。
Linuxでのコンパイルエラーを、報告させていただきます。
OS: Debian 9.4 64bit
CUDA: 9.1
Source: KlausT-8.21-mod-r11
"lyra2/lyra2Z330.cu"の102行目の"FALSE"を"false"に変更するとエラーが解消されました。
612 :名無しさん:2018/05/02 10:01:14 (6年前) 0MONA/0人
=====エラーメッセージここから=====
nvcc -gencode=arch=compute_61,code=sm_61 -gencode=arch=compute_60,code=sm_60 -gencode=arch=compute_52,code=sm_52 -gencode=arch=compute_50,code=sm_50 -gencode=arch=compute_37,code=sm_37 -gencode=arch=compute_35,code=sm_35 -gencode=arch=compute_30,code=sm_30 -gencode=arch=compute_70,code=sm_70 -I/usr/local/cuda/include -I. --maxrregcount=128 -o lyra2/lyra2Z330.o -c lyra2/lyra2Z330.cu
lyra2/lyra2Z330.cu(102): error: identifier "FALSE" is undefined
1 error detected in the compilation of "/tmp/tmpxft_000014eb_00000000-13_lyra2Z330.compute_70.cpp1.ii".
Makefile:1973: ターゲット 'lyra2/lyra2Z330.o' のレシピで失敗しました
make[2]: *** [lyra2/lyra2Z330.o] エラー 1
make[2]: ディレクトリ '/home/kenya/downloads/ccminer-KlausT-8.21-mod-r11' から出ます
Makefile:1525: ターゲット 'all-recursive' のレシピで失敗しました
make[1]: *** [all-recursive] エラー 1
make[1]: ディレクトリ '/home/kenya/downloads/ccminer-KlausT-8.21-mod-r11' から出ます
Makefile:524: ターゲット 'all' のレシピで失敗しました
make: *** [all] エラー 2
=====エラーメッセージここまで=====
613 :かけだしマイナー三級:2018/05/02 15:31:29 (6年前) 0MONA/0人
みなさん、モナコインはどこのプールで掘っていますか?
今いろいろ試しているところですが、現状はこんな感じです。
KlausT-8.21-mod-r11
GTX1080, GTX1070Ti
ローカルの平均ハッシュレート 78.76MH/s
MPH 0.54583743 MONA/day
VIP 0.46301916 MONA/day
※MPHはAutoExchangeで両替先をmonacoinに設定の上、stratum+tcp://hub.miningpoolhub.com:20593を指定
614 :ittou四段教士:2018/05/02 19:13:42 (6年前) 0MONA/0人
615 :名無し先生一級:2018/05/02 22:08:46 (6年前) 0MONA/0人
質問させてください。2台のリグでMONAをマイニングしているのですが、
PC_Aは1080TI 1枚当たり64MH/sで
PC_Bは1080TI 1枚当たり55MH/sしか出ません。各PCの構成は
-----PC_A-----
CPU:i3-8100 メモリ:8GB マザー:Z370-PLUS GAMING GPU:1080TI*4
-----PC_B-----
CPU:i3-7100 メモリ:8GB マザー:H110 Pro BTC+ GPU:1080TI*4
電源は両方とも1350Wで同じもので、導入ソフトもすべて同じです。
何がボトルネックになっているのでしょうか…
616 :名無し#三段:2018/05/02 23:19:52 (6年前) 0.05MONA/1人
>>615
単純にPC_Bの方がGPU同士の間隔が狭いとか風通しが良くないとかで熱がたまってることはないですよね・・・?
マザーが違うので省電力モードが発生していたりファンの回転数が違うとかあるかもしれないですね
電源タップを使用していて定格容量15Aだったりするとそもそも両方に十分な電流が供給できない可能性があります。
ワットモニターで確認してください
617 :ろん一級:2018/05/02 23:51:32 (6年前) 0.05MONA/1人
>>615
PC_Bの方で使っている延長ケーブル(ボード)を変えて試してみて。
以前の報告でも速度が出ないのはケーブルかボードかの不良だった人がいたので。
618 :アンサンブラー三段:2018/05/03 16:13:15 (6年前) 0.05MONA/1人
>>615
H110 Pro BTC+ でググると出てくるのですが、私も同じことが起こったので、おそらくそれかな・・・
PCIEの接続を、Auto から Gen1 に変更してみてください。
すでにやってたらごめんなさい><
619 :名無し先生一級:2018/05/03 18:52:05 (6年前) 0MONA/0人
615です。皆様回答ありがとうございます。
>>616
風通しは十分確保してあるので温度も大丈夫でした。電源関係も1ブレーカーに対して1電源という供給をしているので問題はないです。一応入れ替えてみましたが結果は同じでした。
>>617
電源ケーブルを含めすべてのケーブルを新しいものと差し替えましたが結果は同じでした。
620 :名無し先生一級:2018/05/03 19:00:29 (6年前) 0MONA/0人
>>618
H110ProBTC+のBiosもいろいろといじってみました。
1GPUでPCIEをGen2からGen1に変更したところ51Mh/sから68Mh/sまで
一気に上昇しました。しかし、GPUを増やしていったところ
・1GPU 68MH/s
・2GPU 62MH/s
・3GPU 58MH/s
・4GPU 54MH/s
とふやせばハッシュが減る結果になってしまいました。
この症状わかる方いたら教えていただけると助かります。
621 :名無し先生一級:2018/05/03 19:04:44 (6年前) 0MONA/0人
問題の切り分けのためいろいろと入れ替えては測定を繰り返しました。
【GPU入れ替え】
PC_Aに乗せ換えると速度が上がり、PC_AのGPUもPC_Bだと遅くなりました。
【メモリ入れ替え・増設】
特に変化はなく遅いままでした。
【電源の入れ替え】
同じ型の新しい電源と入れ替えましたが同じでした。
【電源の増設】
電源2台で供給させても同じ結果でした。
【リグの入れ替え】
リグ自体も入れ替えてみましたが、意味はなかったです。
【BIOSのアップデート】
変化ありませんでした。
【マザーの入れ替え】
新しいH110proBTC+と入れ替えました。結果は全く同じでした。
622 :アンサンブラー三段:2018/05/03 20:17:07 (6年前) 0.15MONA/2人
>>620
私の場合は無印1080が6枚なのですが、1枚構成と6枚構成にするにあたり、若干の速度が低下しています。
1枚構成の時は 48MH/s ほど出ていましたが、6枚構成にしたところ、46MH/s ほどまで低下しました。(Gen2やAuto設定の時は 40MH/s ほどでした)
また、低下のパターンは1枚単位ではなく、全体で低下しました(1枚づつ増やすような事はしなかったので、3枚だったらどうなのかは不明です)
また、他の方の事例で、他MBですが、3枚構成までは低下しなかったけれど、4枚から急激にハッシュが減るとゆう事例があり、その場蒼はメモリを 4G から 8G にする事で解決したようです。今回の場合は、すでに 8G なので、その件もクリアできてると思います。
あと、きになったのは、ライザーのさし方です。
私の場合、黒色のソケットにだけ刺していますが、どのように刺していますか?白ソケットを使うと結果が換わるかも!?
あと、気になったのは 1080 のカードでも、メーカーやモデルが違うと挙動が変わってくる件です。同一メーカーの同一モデルは似た挙動をしますが、そこはどうでしょうか?
以上、気になる事をダラダラと書きつらねてみました。
乱筆失礼いたします。
623 :名無し先生一級:2018/05/03 23:52:47 (6年前) 0MONA/0人
>>622
黒のソケットですか!? こちらは白のソケットだけに刺しています。
もしかしたらそれが原因!?
しかし、黒のソケットにGPUを刺しても、BIOS上では認識していますが
Windows10上では認識してくれないのです。
何かBIOS上の設定があるのですかねぇ…
624 :名無し先生一級:2018/05/04 00:01:26 (6年前) 0MONA/0人
同じ1080TIを2枚刺したZ9PE-D16では
「ccminer-KlausT-8.21-mod-r11」で
68.5~70.2MH/s出ています。
おそらくこのマザーボードでも枚数を増やすとハッシュレートが
落ちそうですね。
ハッシュレートを落とさずに枚数を増やす方法が見つかるといいのですが、
いろいろと調べてみます。
625 :アンサンブラー三段:2018/05/04 00:23:22 (6年前) 0.1MONA/1人
>>623
これも、先人の知恵なのですが、Win10でのグラボの認識はOSに任せるのではなく、nVidiaのドライバーを再インストールする事によって認識させるといいです。
おそらく、BIOSで認識してるのであれば、ドライバを入れなおす事で認識されると思います。
626 :名無し名誉名人教士:2018/05/04 08:30:47 (6年前) 0MONA/0人
誰得更新第十一弾修正版。今回はLinuxのエラー修正
(Windowsバイナリは変更ないので>>602を使ってください)
KlausT-8.21-mod-r11-fix(ソース)
https://1drv.ms/u/s!Aud1FauQ46vHh1t5NYbLOB2bQlOt
更新内容(8.21-mod-r11⇒8.21-mod-r11-fix)
・Linux環境にてFALSEが定義されていない問題を修正
…動作確認していないけど、これで動くはずです。
627 :名無し先生一級:2018/05/04 09:02:01 (6年前) 0.1MONA/1人
>>625
H110ProBTC+の黒のソケットに1080TIを刺して
Windows10のドライバを再インストールしてみました。
無事グラフィックボードを認識でき、測定したら
1枚当たり約 69MH/s 出るようになりました。
4枚刺してもほとんどハッシュ低下は起こりませんでした。
問題解決できました。たくさんのアドバイスありがとうございました。
628 :アンサンブラー三段:2018/05/04 21:04:51 (6年前) 0MONA/0人
>>627
無事に解決できてなによりです♪
しかし、Tiのハッシュはすごいですねー
Ti4枚と無印6枚がほとんど同じハッシュ!
値段が下がってくれればぜひ乗り換えたいですねw
629 :名無しさん:2018/05/04 22:34:15 (6年前) 0MONA/0人
https://hakaisha.net/comparisons/asic
ASICの収益もすごいよ!
データは毎日自動更新だよー
630 :sinono初段:2018/05/07 13:25:47 (6年前) 0MONA/0人
>>622
>>625
>>627
上で質問させていただいたものですが、書き込みの通りに設定変更したら見事ハッシュレートが戻りました!
感謝感謝です
631 :アンサンブラー三段:2018/05/07 13:39:10 (6年前) 0MONA/0人
>>630
ここにも、副次的に治った方がいた♪
いやいや、お力になれたようで何よりです。
632 :ろん一級:2018/05/07 19:33:21 (6年前) 0MONA/0人
解決して何より。
スロットの問題もあるのねぇ φ(・ω・ )メモメモ
633 :金ツイin日本橋さん:2018/05/07 20:59:23 (6年前) 0MONA/0人
ethOSが高いので、自分でこんなの作ってみました。
<iframe width="560" height="315" src="youtube.com/embed/2id2gHpk5hE?ecver=1" frameborder="0" allow="autoplay; encrypted-media" allowfullscreen></iframe>
動画撮ったことないので
画像が汚いのは勘弁してください。
634 :金ツイin日本橋さん:2018/05/07 21:16:53 (6年前) 0.00000114MONA/1人
上手く動画が貼れなかったようだ。
これで上手くいくかな。
動画を見る
635 :名無しさん:2018/05/08 18:02:25 (6年前) 0MONA/0人
>>626
報告おくれましたがLinuxで確認できました
636 :名無し先生一級:2018/05/09 23:51:02 (6年前) 0MONA/0人
KlausT-8.21-modシリーズについて質問させてください。
少し古いGPUを使ってマイニングしようとしたのですが
GTX980TIは動きます。しかし、GTX980とGTX680をKlausT-8.21-modで
起動させるとエラーが出て止まってしまいます。
<GTX980のエラー>
Cuda error in func 'cubehash256_cpu_hash_32' at line 279 : invalid argument.
<GTX680のエラー>
Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
ccminer-2.2.4-mod-r4だと一応動きます。ただし短時間でエラー落ちします。
起動時に何か指定をしないといけないのでしょうか。
637 :名無し二級:2018/05/12 20:59:16 (6年前) 0MONA/0人
「"2.2.4-mod-r4.zip" にはウイルスが含まれています」
OneDriveのウイルスウキャンに引っ掛かってダウンロード出来ないのは、どうしたら良いのでしょう。
(ダウンロード前にOneDrive側でウイルスチェックに引っ掛かっているかんじです)
638 :名無し二級:2018/05/12 22:00:37 (6年前) 0.1MONA/1人
>>637
>>327からの流れを参考にしてみてはいかがでしょうか。
最悪でもソースを落として自分でコンパイルすれば大丈夫と思います。
639 :名無し二級:2018/05/13 01:48:31 (6年前) 0MONA/0人
いろいろためしましたが、自分には無理でした
あきらめモードです、ってか、あきらめるかな
640 :ittou四段教士:2018/05/13 02:37:30 (6年前) 0MONA/0人
>>639
落とせたけど、どこかにUPしようか?
641 :ittou四段教士:2018/05/13 02:40:38 (6年前) 0MONA/0人
と思ったら隣のr3だったorz
642 :名無し二級:2018/05/13 03:53:08 (6年前) 0MONA/0人
>>639 そんなすぐ諦めないでください。楽しいですよ。
r4でないとダメなんですか?
>>638ですが、ccminer-KlausT-8.21-mod-r4.zipであれば
一応持っていますが、どこかにupしましょうか。
過去の話ですが、Macでのダウンロードだと問題なかったので。。
643 :名無し二級:2018/05/13 04:17:33 (6年前) 0MONA/0人
あ、KlausTではなかったですね。間違えましたすみません。
644 :アンサンブラー三段:2018/05/13 04:44:41 (6年前) 0MONA/0人
>>639
>>602 にある KlausT-8.21-mod-r11 は、まだウィルス認定されてないみたいだから、それなら落とせるはずだけど、それじゃダメなの?
2.2.4-mod-r4.zip も持ってるけれど、どうしても欲しいなら、どこかにUpするけど?(ってか、本来なら名無し名誉名人さんから直接もらうほうがいいんだろうけれど・・・)
645 :名無しのOSSAN十段錬士:2018/05/13 16:32:05 (6年前) 0MONA/0人
いかん、マイクロソフトのディフェンダーが敵になってきた!
いあ、なってしまった!
646 :名無しのOSSAN十段錬士:2018/05/13 16:35:19 (6年前) 0MONA/0人
聞くことしか能がなくって申し訳ないですが、シーシーでのZenyソロのやりかた教えてほしいのですが、ConfとINFの中身とか・・・どう作っていいのかわかりません。プールはできたのですが。
647 :アンサンブラー三段:2018/05/13 17:20:56 (6年前) 0MONA/0人
>>645
Avast!をディフェンダーを殺すためだけにインストールするといいですよ。
市販品でもいいけれど、無料ですから。 あ、フォルダごと非検査対象に指定してくださいね。
いま、使ってないので調べられませんが、2か所くらい設定するところがあったはずです。
648 :名無しさん:2018/05/13 21:20:00 (6年前) 0MONA/0人
>>646
「BitZenyの総合案内所 ソロマイニング」で検索してみては どうでしょう
649 :名無しのOSSAN十段錬士:2018/05/14 00:34:39 (6年前) 0MONA/0人
[2018-05-14 00:33:42] HTTP request failed: Failed to connect to localhost port 9302: Connection refused
[2018-05-14 00:33:42] json_rpc_call failed, retry after 20 seconds
てでました・・・・・。ConfとBatがあっていないのかな・・・。
650 :名無しのOSSAN十段錬士:2018/05/14 02:51:28 (6年前) 0MONA/0人
>>649
ミスりました
>>648
のエラー?が出て止まっています・・・。基本はモナとおなじようにならべてつくったんですが・・・・。真似事だけじゃダメだったようです。
651 :名無し二級:2018/05/14 09:34:27 (6年前) 0MONA/0人
>>649
Windowsですかlinuxですか?
localhostのport:9302は開いていますか?
もしWindowsなら一度、firewallを全てoffにして、上手くいったら
firewallをもう一度onにしてそのポートを開けてあげれば良いと思います。
linuxならどのlinuxかによりますがiptablesの編集でそのポートを開けてあげれば良いです。
見当違いな話だったらごめんなさい。
652 :名無しのOSSAN十段錬士:2018/05/15 22:09:26 (6年前) 0MONA/0人
>>651
なるほど、ありがとうございます。
ちょっとやってみますね。
因みに、win10 64bit proです。
653 :電気代がペイ出来てるw五段:2018/05/16 08:24:38 (6年前) 0MONA/0人
お久しぶりです
①現在はMONA採掘にはccminer-KlausT-8.21-r11と2.0-rc3-mod-r4どちらを使うべきでしょうか?
②現在のMONAの一日の採掘量の計算方法はどうするべきでしょうか?
よろしくお願いします
654 :ゆたの~三段:2018/05/16 09:11:42 (6年前) 0.1MONA/1人
>>653
2に関してだけ。
実測で計算してます。
エクセルでシート作って、マイニング開始時(例8:00)に時間と開始前時のプール残高(例10)入力します。
終了時にその時間(25:00)を入力します。
翌日同様のことをします(開始時プール残高例11.7)
エクセルで1時間当たりの採掘量を計算させると0.1もな/時間という結果が出ます。
これ毎日繰り返してますw
出ないときは0.03モナ/時間というときも・・・
なお300mh/sくらいのハッシュレートです。
655 :電気代がペイ出来てるw五段:2018/05/16 14:10:14 (6年前) 0MONA/0人
>>654
ありがとう
656 :だれかさん七段教士:2018/05/16 16:38:07 (6年前) 0.05MONA/1人
https://whattomine.com/coins/148-mona-lyra2rev2
ここに任意の数値を入れたほうが多分いろいろと楽な気がする
電気代計算もまた可能。
英語でもなんとかなるなら多分こっちのほうが優秀・・・?
657 :7743一級:2018/05/16 16:44:14 (6年前) 0.05MONA/1人
ここはどうでしょう?
モナコインマイニング収益計算
http://monacoin.trance-cat.com/monacoin-profitability-calculator.php
658 :電気代がペイ出来てるw五段:2018/05/16 19:21:37 (6年前) 0MONA/0人
659 :電気代がペイ出来てるw五段:2018/05/16 19:24:19 (6年前) 0MONA/0人
計算上プラスでしたけどw割に合わないことが判明
ありがとうございます
660 :名無しさん:2018/05/16 20:15:23 (6年前) 0MONA/0人
>>650
バッチファイルの中
ccminer -a yescryptr8 -o 127.0.0.1:9302 -u hogehoge -p mogemoge --no-longpoll --no-getwork --coinbase-addr=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
bitzeny.confの中
rpcuser=hogehoge
rpcpassword=mogemoge
rpcallowip=127.0.0.1
rpcport=9302
daemon=1
server=1
gen=0
で、こちらは稼働できました。
設定に差異がなさそうなら、ポート開放の件が正解かと
661 :新米エージェントさん:2018/05/17 01:36:37 (6年前) 0MONA/0人
ソロで44MH/s(GTX1080 PL60%)で1か月経過して採掘できません。
理論上、どれくらいの期間で採掘できるか計算方法をわかるかた教えてください。
そろそろ掘り当てたい
662 :目指せ北海道三段錬士:2018/05/17 05:19:31 (6年前) 0.00000001MONA/1人
>>661
上の657の計算式に入れてみると、44MH/sで1ヶ月に6MONA程度。現在1ブロック25MONAですから、ソロだと4ヶ月に一回くらい掘れるかもしれないという計算になりますね。
663 :名無しさん:2018/05/18 23:14:26 (6年前) 0MONA/0人
KlausT-8.18-r1で、GTX1080(NEB1080H15P2-1040G,PL45%,TL65C,-i 18.25,ディスプレイ兼用)にて38~40MH/sでプールマイニングしています。
オカルトみたいな質問になりますけど、
ハッシュレートを稼ぐ方向ではなく、暗号アルゴリズムに攻撃を仕掛けたような(もしくは山師的な読みのある)マイニングソフトって
あるのでしょうか?
というのもここ一ヶ月位ですが、
プール内のブロック発見者で上位につけてる方がいて、ダッシュボード上での発見者の欄でもかなりの頻度(7,8回かな?)で見かけるので、
参考にシェア数を確認してみたのですが、自分のグラポの70%のシェア程度でした。
自分の環境だと1年マイニングしても発見は平均3,4ブロックぐらいだと思うので、マイニングソフトに秘密でもあるのかなと
664 :名無し二級:2018/05/19 04:23:09 (6年前) 0MONA/0人
>>663
それ私もちょっと気になってて
先々週~先週あたりに、ランキングには入ってない方が結構な頻度でブロック掘り当ててたんですよね。
でも実はハッシュ能力だけじゃないような気がするんですよね。
というのもうちには2台リグがありまして、1台は平均400Mhほど、
もう一台は平均90Mhほどなのですが、90Mhのリグの方が400Mhのリグよりも多くブロック掘り当ててるんですよね・・・
あと、とあるプールで掘っているのですが、400Mhという能力の割に
Diffが低い時時の方がハッシュが落ちるんですよね・・・
逆にdiff13万とかの時の方が400Mhはおろか500Mhに到達するようなときもあって・・・
665 :アンサンブラー三段:2018/05/19 18:59:38 (6年前) 0MONA/0人
>>664
プールのハッシュは計測開始時から一定時間内に提出されたシェアの量から算出されます。
かりに、高Diffのブロックを割り当てられて、計測タイミングをオーバーするような計算をしたとします。
そうすると、一回の提出で、計測タイミング一回以上の時間をかけて計算した結果が、あるタイミングで提出される事になります。
そうすると、一時的に非常に高いハッシュが表示される事になり、今回のようなあり得ない値をだす事になります。
また、低Diffの場合、プールとクライアントの通信時間分は実作業がとまっているので、そのぶんだけハッシュが下がるので、適正Diffがわりあてられないと、本来の能力より少なく表示される事になるのは、オカルトでもタイミングの問題でもなく、オーバーヘッドの問題になります。
統計情報にあるグラフをみると、もっと長いスパンでのハッシュレートでの表示になるため、実ハッシュレートに近い値が表示されているはずです。
それでも、けっこうブレがあったりするんですけれどね・・・
666 :名無し名誉名人教士:2018/05/19 22:01:08 (6年前) 0.00116336MONA/2人
CUDA9.2が出てたので、やってみたんだが、速度はほとんど変わらず。
これはupする必要はないよね?
CUDA9.2でvisualstudio2017のver15.7まで対応。
visualstudioのアップデートもできたので、cpuminerでAVX512を試せるな~
(まだ対応CPUを持ってないが…)
667 :ヌコッティ六段:2018/05/22 21:42:03 (6年前) 0MONA/0人
>>663
>暗号アルゴリズムに攻撃を仕掛けた、あるいは山師的な読み
これは、仮に成功するとハッシュ関数そのものへの攻撃となるので、あり得ないと思われます。
PPLNS/PPSにおいて、そのような事象が発生している場合、下記のような
原因も考えられます。
・ 該当ユーザーが使用しているマイニングツールのコードが誤っており、Diffを誤認している。
そのため、Acceptされるshareが少なくなり、ブロック発見とハッシュレートの比率がおかしく見える。
・ プールの運営者がブロック発見時に意図的に他のユーザーに付け替えている。
他にもありますかね?
668 :名無しさん:2018/05/23 01:13:01 (6年前) 0MONA/0人
>>667
やっぱり、あり得ないですかね。
概算すらできてませんが、おそらく数百MH/sからGH/sオーダーに届くくらいのハッシュパワーだと思うけど、
>・ 該当ユーザーが使用しているマイニングツールのコードが誤っており、Diffを誤認している。
> そのため、Acceptされるshareが少なくなり、ブロック発見とハッシュレートの比率がおかしく見える。
これで1060の定格ぐらいのシェア量になっちゃってるのかも。
失礼しました。
669 :upwinさん:2018/05/23 08:45:50 (6年前) 0MONA/0人
>>636
テストしましたが、
GTX680で、KlausT-8.21-mod-r11は、
普通に動きます。
1.76-r10.zipあたりで、一度
起動してみて下さい。
起動すると思いますが・・・
670 :名無しのOSSAN十段錬士:2018/05/24 22:40:37 (6年前) 0MONA/0人
>>636
電源容量足りてないとかも考えられますね、消費電力680はでかいですし。
671 :名無しさん:2018/05/24 23:28:42 (6年前) 0MONA/0人
モナはここ数日Difficultyが小さくなっているのでマイニングチャンスだと思っている。
672 :名無しさん:2018/05/24 23:30:20 (6年前) 0MONA/0人
知らない間に攻撃食らって巻き戻しまで発生してたなんて知らなかったわ。
673 :名無し侍二段:2018/05/24 23:37:09 (6年前) 0MONA/0人
>>670
あとは熱問題もあるんじゃないですか?
680知り合いから貰いましたが現行と比べると爆熱ですよ。
まぁ、680かなり電気食うからリミッターはかけたほうがいいですよね
674 :暗号通貨はいいよなおじ初段:2018/05/25 14:53:20 (6年前) 0MONA/0人
マイニングはいいよなぁ~wwwwwwwwアハハハハwwwwww
675 :Monazaemonさん:2018/05/25 17:41:45 (6年前) 0MONA/0人
Quadroでも差はないものでしょうか?
例えばちょっと特殊ですがQuadro GP100メモリが異なるのでよりハッシュレートが上がるとか…
でも最適化されていなければだめですかね…
676 :名無し侍二段:2018/05/25 18:14:16 (6年前) 0MONA/0人
Quadro GP100・・・凄い高価ですね。
実際使ったことはないですが、テストしてみたい気もしますね(もとは絶対にとれなさそうですが)
仕事で持ってて使えるのだったら試してみるくらいの価値はあるかとはおもいますが・・・
677 :Monazaemonさん:2018/05/25 18:34:45 (6年前) 0MONA/0人
自営でいまGP100 Dual構成なんですが使用するのが結構先になってしまって遊んでいるので試してみたのですが一枚あたり54Mhz程度だったんです。もう少し良い数字出ると思ったのですがやはり最適化されないとダメなんですかねぇ…
仕事柄他にもQuadroが余りまくってまして…
678 :名無し侍二段:2018/05/25 19:05:26 (6年前) 0MONA/0人
>>677
1080Tiと同等かちょい下くらいですねぇ・・・
まぁ、モナではなく他の通貨を試してみるといいのではないかとは思います。
一応通貨によって得意不得意とかもありますし、プールによっても速度とか変わってきますからね。
自分はナイスハッシュでEquihash(dtsm)を1080で掘っていますけど、ぼちぼち効率がいいみたいです。
そちらを試してみてはいかがでしょうか?
679 :Monazaemonさん:2018/05/25 21:55:23 (6年前) 0.00114114MONA/1人
>>678
ありがとうございます。そうですよね。しばらく時間もありますので色々と試してみます!
680 :名無し二級:2018/05/26 03:45:17 (6年前) 0MONA/0人
>>677
クアドロがあまりまくって遊んでるなら働かせてもいいんじゃないですかね?
ただしgeforceと比較してコストメリットは全くないですので
新規で買いあさってマイニングしても永遠に減価回収できないんじゃないですかね?
もっともクアドロに適したマイナーソフトがでれば別ですが・・・
681 :Monazaemonさん:2018/05/26 10:43:46 (6年前) 0MONA/0人
>>680
Quadroに適したマイナー、、、たしかに需要も少なさそうですし、存在しないですよね。。。
余っているQuadroでKlausT modを使わせて頂いて試してみます!
682 :名無し名誉名人教士:2018/05/26 14:52:50 (6年前) 0MONA/0人
QuadroはGeforceと同性能ですよ(少なくとも整数演算は)
TeslaはGP100だけは有利かな?(でも、大差なし)
683 :Monazaemonさん:2018/05/26 17:18:16 (6年前) 0MONA/0人
>>682
同じコアですしそうですよね…
早速GP100 Dual 試させて頂いたのですが合わせて122Mhzでした。ただP5000と比べるとaccepted yayの表示が早い気が…
気のせいでしょうか?
684 :さ҉҉ば҉҉ち҉҉ゃ҉ん七段教士:2018/05/26 20:53:55 (6年前) 0MONA/0人
あんま詳しくないんであれだけどGP100ってのでZenyとか掘ったらどうなるんです?
685 :Monazaemonさん:2018/05/26 21:39:23 (6年前) 0MONA/0人
最近KlausT modで対応されたのはみたのですが効率は同じなのかな?と思っています。MonaファンなのでマイニングはMonaしかやっておらず試してはいないのですが…
GP100はメモリがGeforceや他のQuadroと違って高速なHBM2が使われているので少しは恩恵があるかと思っていたのですが余り差は無さそうでした。
マイナーが最適化されると少しは変わるかもしれないですが私もその辺り素人でして…
686 :猿股初段:2018/05/27 23:13:40 (6年前) 0MONA/0人
すごいなー、Quadro K420 2GBで掘ってる私と次元が違う!Σ( ̄□ ̄;)
687 :名無し名誉名人教士:2018/05/28 09:50:15 (6年前) 0MONA/0人
HBM2最適化の考察
GP100、Voltaに搭載されているHBM2はバンド幅4,096bitまたは3,072bitの広帯域メモリで、低クロックでも高速に動作します。
ただ、バンド幅の広さが悪影響する場面もあります。4,096bitのバンド幅から、1スレッド当たりの読み込みを考えると、
4,096bit÷8÷32コア=16byte
なので、最適な読み込み単位を16byteとなります。(スレッド粒度を64にすれば、半分の8byteで済むかもしれんな…)
なので、8byteをアクセスする場合、メモリ帯域が実質半分になります。
(L2キャッシュには入るので、そこまで影響はないと思うが…)
なお、Lyra2REv2ではシェアードメモリを使用してグローバルメモリへのアクセスを回避しているため、メモリの差異によるパフォーマンス差はほとんどありません。
メモリ使用量の多いYescryptやLyra2z330(Lyra2zoin)などは高速メモリの恩恵はあるかもね…?
1コアあたりのメモリ帯域は、
Tesla P100 ⇒ 3584コア、メモリ帯域720GB/s ⇒ 205.7MB/s/コア
GTX1080Ti ⇒ 3584コア、メモリ帯域484GB/s ⇒ 138.3MB/s/コア
Titan V ⇒ 5120コア、メモリ帯域652.8GB/s ⇒ 130.6MB/s/コア
…あれ?Titan Vの方が1コアあたりのメモリ速度が遅い?
688 :Monazaemonさん:2018/05/28 17:16:42 (6年前) 0MONA/0人
>>687
考察ありがとうございます!非常に参考になりました。Mona堀りの場合はメモリスピードの恩恵はほとんどないんですね…生粋のモナラーなので残念です。。。
やはりQuadro はminingに関してはGeFoceと性能が変わらないので需要もないですね。
689 :アンサンブラー三段:2018/05/29 01:02:23 (6年前) 0MONA/0人
名無し名誉名人様へ(名指しで失礼いたします)
このたび、1080Tiを購入し、パフォーマンスのテストなどを行っているのですが、-iオプションのデフォルトについて質問があります。
1080も1080Tiも、無指定で動かすと22.5が選ばれるようです。
CUDAの数が違うので、最適なスレッド数も違うと思われますが、1080Tiの最適なすレッド数っていくつなのでしょうか?
0.5刻みで数値を探るくらいの事はできるのですが、スレッド数から計算する”計算上の最適値”が知りたいです。
名無し名誉名人様にかぎらず、お詳しいかた、おしえてください m(__)m
690 :名無し名誉名人教士:2018/05/29 06:26:42 (6年前) 0MONA/0人
>>689
前スレ >>297 >>298で書いたが(当時は-iを整数で設定していた)、
設定値の計算は10fps程度の画面描写になるように調整します。
-i設定値=log2(ハッシュレート[MH/s]×0.1[s]×1,000,000[/M])
GTX1080Ti:log2(58.05[MH/s]×0.1[s]×1,000,000[/M])=22.47
(58.05MH/sは実験値ではなく、他のGPUからの換算値です)
ただ、cubehashを2回、Lyra2の2pass目と、時間のかかるカーネルが3分割されているため、logの中身は3倍程度にしてもいいかな?
691 :名無し名誉名人教士:2018/05/29 08:45:34 (6年前) 0MONA/0人
>>690 補足
-iオプションは整数部分と小数部分で挙動が異なり、厳密なlog計算にはなりません。
整数部分をA、小数部分をBとすると(-i 23.5の場合、A=23、B=0.5)、
スレッド数=(1 + B)×2^A
となります。
そのため、設定値の厳密計算は
T=58.05[MH/s]×0.1[s]×1,000,000[/M]=5805000[H]
A=Int(log2(T))=Int(log2(5805000[H]))=22
B=T ÷ 2^A - 1=5805000[H] ÷ 2^22[H] - 1≒0.384
となり、計算値としては22.384となります。(まあ、対数計算でも大差ないよね?)
なお、>>690の「logの中身は3倍程度」については、-iオプションに1.5を加算すればいいので、試してみてください。(まあ、速くなるかは分かりませんが…)
また、ワッパ重視の場合は-iを設定し直す必要があるかと思います。
692 :アンサンブラー三段:2018/05/29 09:52:42 (6年前) 0MONA/0人
>>690
名無し名誉名人様ありがとうございます。
当方の環境ですと、-i未指定(22.5が指定されます)時のハッシュ値が69.0~69.5程度の値が出ます。
>>690>>691の話を聞く前でしたので、0.5刻みで22.5・23.0・23.5・・・と指定していったところ、23.0と23.5の数値がほぼ同で、一番いい数値69.5~70.0になり、上限が23.0あたりだと思われます。
>>690の計算をすると、どちらのハッシュ値でも22.73となりましたので、それを指定したところ、23.0を指定した時より数値が落ちる結果になりました。
プラス1.5し24.22とした所、こちらでもハッシュ値が低下しました。
そこで質問です。
・-iの規定値はハッシュから出しているとの事ですが、Lyra2系とyescrypt系では求め方が違うようですが、実行スレッドの数は、CUDAのユニット数などが影響しないのでしょうか?
・上の質問にかかわりますが、ハッシュ値は-iオプションの指定で変わってきます。卵が先なのか、鶏が先なのか・・・無限参照が起ってしましませんか?
実測値の最適値はでたのですが、どうなんでしょうか?
693 :名無し名誉名人教士:2018/05/29 10:41:12 (6年前) 0.39114114MONA/2人
>>692
・yescrypt系はメモリ量によりスレッド数に制限があります。そのため、スレッド数をそれほど増やすことができません。
当方で実験してみた結果、コア数の3倍のスレッド数でパフォーマンスが良く、コア数の2倍、コア数の4倍でパフォーマンス低下がみられたため、
コア数の3倍を標準としています。
・-iの計算は確かに無限ループっぽいですが、
-iを細かく変更しても、ハッシュレートにそれほどの差が無く、2~3ループくらいで最適値(の近傍の値)は算出できると思います。
それでも不満な場合は試行錯誤ですね…
Lyra2REv2のデフォルト値はかなり前(前々スレあたりだったかな?)から設定していた数値を流用しているため、現状のハッシュレートとは合わない部分もあるかもしれません。(オーバークロック品やPL値でも変わりますしね…)
しかし、-iの設定を知らない人でもそこそこ掘れる設定値にはしているつもりです。
それと、当方にある実験用GPUはGTX1080,GTX1060,GTX980,GTX750,GT710なので(GT630,GT210もあるが、既に引退済み)、それ以外の動作確認はできません。(現在PCに接続しているのはGTX1060とGTX750の2枚のみ)
ですので、これらのGPUからコア数、動作周波数による換算値からの推定しかできません。(商売でやってるわけではないので、そこら辺は勘弁していただきたい…)
694 :アンサンブラー三段:2018/05/29 18:41:00 (6年前) 0MONA/0人
>>693
計算方法がLyra2系はまったく違うとゆう事がわかりました。
やはり、最適な-i値は出さないとダメっぽいですね・・・
しかも、0.5刻みくらいで最適値だせますね。
毎回、ご説明ありがとうございます、本当に勉強になりました。
695 :MaineCoon一級:2018/05/30 23:46:27 (6年前) 0MONA/0人
酒を飲みながらの横槍で申し訳ありませんが、参考になればと思い書き込みます。
前出の「スレッド数をCuda数の倍数にしてi値を計算する」から
私の環境(1080Ti)限定にて計算した結果を書きます。
layra2Rev2の場合
cuda数の1024セット(i=21.75)が理想であると考えますが
NiceHashではなぜかT=3125248(i=21.490234375)が指定されています。
もはや誤差範囲で判断が付きません。
yescryptの場合
色々なcuda倍数を試した結果、cuda9セットのT=32256(i=14.96875)が最適でした。
次点が3セットのi=13.3125です。
難易度で変化するので厳密には分かりません。
696 :MaineCoon一級:2018/05/31 00:09:16 (6年前) 0MONA/0人
ここまで試して気になった点は
afterburnerの値を見るに
バス使用率が異常に上がっていてるが気にまりました。
レーン数やPCIeのGenを変更とかありますが
純粋にGPUとCPU間でのデータ転送がボトルネックに見えました。
バス制御権の掌握といったセマフォ制御、その次はネット通信速度が足枷になってくると思います。
私的環境の余談ですがRyzen2700+X470環境にて1080Tiを3枚搭載すると
データ転送に問題があるらしくUSB関連でカーネルクラッシュする時があります。
「メモリに難有り」を優先順位や見た目のレーン数で回避しても高負荷時にはクラッシュします。
RISCでの「NOP命令の使い方」みたいに重箱の隅をつつくレベルになっていますね。
697 :名無し一級:2018/06/02 03:26:39 (6年前) 0MONA/0人
>>666
CUDA9.2で試してみたいのですがアップしていただけませんか?
698 :名無し四段:2018/06/03 21:55:51 (6年前) 0.00004649MONA/1人
なんか新しいマイナー来てる
https://bitcointalk.org/index.php?topic=4129696.0
Devfee1%だけど
名人のKlausT-8.18-r1比でハッシュレート5%アップ
CryptoDredge0.2.0
KlausT-8.18-r1
699 :さ҉҉ば҉҉ち҉҉ゃ҉ん七段教士:2018/06/04 02:24:28 (6年前) 0MONA/0人
>>698
5%アップっていうか
前も言われてるけどプールとの乖離値はどうなんですか?
結果より多く表示されてるとかがないってわからないと乗り換えれない
700 :アンサンブラー三段:2018/06/04 02:28:03 (6年前) 0MONA/0人
>>698
比べてるものが悪いと思う・・・
KlausT-8.18-r1 と 最新のKlausT-8.21-r11だと5%以上アップしてると思います。
あと、>>699でいわれてるとおり、フールの値と、どれくらい違うかが重要だと思います。
701 :名無八段教士:2018/06/04 09:21:52 (6年前) 0.00398549MONA/2人
>>698
実際に回したらプールではこんな感じになった。6~7%アップくらいか。
https://light.dotup.org/uploda/light.dotup.org529556.jpg
マイナーが吐き出す数字とほぼ同水準なので大きな嘘はついてなさそう。
1時間に1回Devfeeタイムが入る。
702 :名無し四段:2018/06/04 20:55:31 (6年前) 0MONA/0人
>>699
>>700
おま環だけど最新版が必ずしもベストとは限らないのですよ
ccminer-KlausT-8.21-r11
プール側のレートは>>701(ありがとう!!)が検証してくれたみたいなので省略
ただソースが公開されてないし
何仕込まれてるか分からないので
使うなら自己責任でお願いします
703 :名無し四段:2018/06/04 20:56:12 (6年前) 0MONA/0人
あと接続先がNicehashだと
ERROR - Too small extranonce2 size
でダメっぽい
まぁ、今後に期待ということで
704 :名無八段教士:2018/06/04 21:01:40 (6年前) 0MONA/0人
ハッシュレートに大きな変動はなくこのまんまで動いている感じ。
画面の限りだとDevfeeタイム以外はちゃんと掘ってるように見える。
実際に軽く回して数字に有意な差があるようなら考えてみてもいいのかも。
705 :名無八段教士:2018/06/04 21:05:04 (6年前) 0MONA/0人
>>702
Devfeeアリだから仕方ないのでしょうけどソース無いのは確かに怖いですね。
ただ回してみてそれなりの数字が出るのは分かりました。
706 :名無し四段:2018/06/04 21:25:28 (6年前) 0MONA/0人
>>705
マイナー開発者がHPまで用意してるのは初めて見たのでびっくりです
Ginco(今日初めて聞いた)がモンゴルでマイニング始めたり
vippoolでIIJがマイニング始めたように
資本を持ってるところが続々と参入し始めたようですね
仮想通貨の発展を考えれば喜ばしいことですが
個人マイナーはどこまで戦えるのか・・・
707 :名無しさん:2018/06/05 06:36:25 (6年前) 0MONA/0人
CryptoDredge 「Avr」Kh/sで有るべき箇所もMh/sで表示するバグ有るね。
4500Mh/sとか…
708 :名無八段教士:2018/06/05 12:51:36 (6年前) 0MONA/0人
CryptoDredge v0.2.1 released
Fix bug with NiceHash pool
Improve Lyra2REv2
>>703の修正だろうか。
Lyra2REv2にも言及があるけど果たして。
709 :名無し四段:2018/06/05 21:29:28 (6年前) 0MONA/0人
>>708
v0.2.1でNiceHashでも掘れるようになりました
Lyra2REv2のハッシュレートはうちの環境だと微増ですね(+0.5Mh/sぐらい)
それでも
ハッシュレートがあがる=PL下げても現状を維持できる
だと思うので、これからの季節重要だと思います
ただ今のところAwesomeMinerで使えないのが
自分的には痛いところです
710 :名無八段教士:2018/06/06 15:18:51 (6年前) 0MONA/0人
v0.2.1 releasedの後のコメントが不評ですな。
動かねぇ、遅いからバージョン戻した、Linux対応はよ……。
逆に言えば本当に速いなら使うぞという期待の表れでもありますが。
711 :名無しさん:2018/06/07 21:43:38 (6年前) 0MONA/0人
初書き込みさせて頂きます。
前までEHTを掘っていた初心者なのですが・・・
現状MSI Radeon RX 580 GAMING X 8Gが5枚あるのですが、今は何を掘るのがいいのでしょうか?
何方か教えて頂けませんか。
712 :電気代がペイ出来てるw五段:2018/06/07 22:40:56 (6年前) 0MONA/0人
迷っている時間が惜しいので、とりあえず
NiceHash で回して
その間に調べる!
713 :名無し四段教士:2018/06/09 02:21:00 (6年前) 0MONA/0人
NiceHashが掘ってる通貨が効率良いってことになりそうですが。
ですが、似たような構成のリグで掘ってる通貨が異なることもあるので真実は闇の中。
714 :名無しさん:2018/06/09 18:17:57 (6年前) 0MONA/0人
回答ありがとうございます!
とりあえず、NiceHashで回してみました。
現状1日400~500円程なんですね
電気代ペイ出来るかできないかくらいですね><
715 :名無し四段:2018/06/10 19:21:00 (6年前) 0MONA/0人
CryptoDredge 0.3.0
・Add --log option to log output to file
・Add --no-color option to force color off
・Improve Lyra2REv2
・Fix reconnect bug with NiceHash pool
・Other minor fixes
Lyra2REv2
716 :名無し四段:2018/06/11 21:14:54 (6年前) 0.00114114MONA/1人
CryptoDredge、Lyra2REv2最速を謳いだしたね
MPHのグラフなのであれだが
poolにもちゃんと届いてるっぽい
717 :rdm二段:2018/06/20 13:03:40 (6年前) 0MONA/0人
TitanX(pascal)で10MH以上あがったんだけど大丈夫かなこれ・・
一応devfee1%ってなってるみたいだけど。
718 :名無し四段:2018/06/26 21:53:01 (6年前) 0.00232877MONA/3人
スレ違いかな?と思いつつ、情報共有のため投稿します。
ここでは紹介していませんが
Delosminierがマルウェアであるという報告が上がっています
https://www.reddit.com/r/gpumining/comments/8titv8/preliminary_reports_of_delosminer_x16sx16r/
情報をあさったかぎりでは今のところx16系がターゲットみたいですが
ダウンロードした時点でアウトっぽい?
(ウォレットをハックされて、残高が5k-10kの条件を満たすとハッカーに自動送金される?)
ダウンロードかつ試し堀りまでした自分は今のところ被害にあってませんが
とりあえずローカルに置いてるコインは別のウォレットに避難しました。
あと、CNlargementってやつも裏でmoneroを掘らせているらしいので注意です。
皆さんもお気をつけて
719 :えっくすさん:2018/07/02 10:11:53 (6年前) 0MONA/0人
最新バージョンを入れたら凄く良くなりました。
GTX1080 1枚
44MH/s➡47MS/s
boooが出なくなりました。
もうすこしデーターをとりたいと思います。
720 :名無し名誉名人教士:2018/07/03 08:52:43 (6年前) 0.00014649MONA/2人
ミニ四駆に夢中な間に新しいマイナーが出ていたのか…
まだ速くできる余地があるってことで、これは朗報なのかな?
さて、Lyra2REv2の改造プランは有るにはあるんだが…
・複数カーネルを纏める
現状、bleak256&keccak256、cubehash256、Lyra2(1st)、Lyra2(2nd、4way)、Lyra2(3st)、skein256、cubehash256、bmw256、の8カーネル構成になっており、各カーネル間転送にグローバルメモリを使用しています。
これらのカーネルを纏める事ができれば、グローバルメモリの使用を減らして高速化が図れるのではないか…な?
とりあえず、cubehash256とLyra2(1st)、Lyra2(3st)とskein256、cubehash256とbmw256、これらを纏められれば多少マシになるのかな~?
・ローカルメモリの使用回避
どうも、skein256、bmw256はローカルメモリを使ってるような気がする…
これを回避できれば、速くなるんじゃね?
でも、ローカルメモリはキャッシュが利いてるんだよね…どうなんだろ?
721 :名無し名誉名人教士:2018/07/03 13:13:25 (6年前) 0.00004649MONA/1人
カーネル内のループがキャッシュラインを跨いだ場合、オーバーヘッドが大きくなると思う…(GT200でInstruction Cacheが4kBらしいが、それ以外の詳細資料が見つからない…)
ループの始点、終点が同一キャッシュライン内になるように調節すれば速くなるのかな?
この場合、NOP命令やジャンプ命令とか挟む必要もあるのかな?
722 :名無し四段:2018/07/03 21:10:24 (6年前) 0MONA/0人
>>720
名人召喚キタ(・∀・)コレ
>>まだ速くできる余地があるってことで、これは朗報なのかな?
って考え方が出来るのがとても素敵だと思います
マイナー改造にはすごく興味があるので勉強してみたいんだけど、
ハードの仕様まで知る必要がありそうで何から手を付けていいのかさっぱりですわ・・・
723 :ぐり七段教士:2018/07/04 08:36:21 (6年前) 0MONA/0人
1st、2nd、3st …に飛びつきたくなるw
よく分かってないですが、1つのVGAで複数カーネルが動いているのを、
複数VGAで1カーネルずつにするって逆に効率悪いものなのでしょうか?
724 :名無し名誉名人教士:2018/07/04 08:49:33 (6年前) 0MONA/0人
>>723
スペルミスは済まんかったwww単純なコピーによる修正忘れ
アルゴリズムを順番に起動する必要があるので、カーネルの並列化はできないのですよ…
(neoscryptは可能だけど、あまり効果は見られなかった)
725 :名無し四段:2018/07/04 20:47:46 (6年前) 0MONA/0人
CryptoDredgeを使うと
同時に起動してるcpuminerのハッシューレートが落ちるんだけど
何かしてるのかな?
タスクマネージャー見ても、あからさまなリソース消費は確認出来ないのだけど・・・
726 :名菜師初段錬士:2018/07/04 23:04:15 (6年前) 0MONA/0人
同じGPUつかうならあたりまえ?
727 :ぐり七段教士:2018/07/05 15:25:50 (6年前) 0MONA/0人
>>725
マイニングソフトがGPUだけを使う設定でも、そのソフト自体をOSで管理している以上
起動しているソフトが増えればCPUはOS動かしてるんだしメインメモリも使うし
少なからず影響が出るのでは?
728 :takeo_3841三段:2018/07/05 16:12:56 (6年前) 0MONA/0人
CryptoDredge 0.4.0までだとずっと無限ループで動かなかったのが
0.6.0にすると初めて動いた
GTX1060 6GB P/L 100% OCなし Lyra2REv2 30.01MH/sです
729 :MaineCoon一級:2018/07/05 16:23:11 (6年前) 0MONA/0人
メモリ再展開は結構なクロック数を消費するハズです。
Nvidiaドライバあたりが隠蔽化していると思われるので意識する事は無いと思いますが
デバイス準備完了までは安全の為にNOPで埋めてあるのが通説です。
全カーネル容量がワークメモリ内に収まっているに越したことはないと思います。
メモリアクセス違反は
変数をメモリアドレス固定で指定出来れば可能かも?
高速アクセス出来るメモリ空間を知ってないといけませんし
ヤバい領域を触るとCPU自体がいきなり落ちる危険性があります。
言葉遊びかもしれませんが
通常はローカルメモリの方が速いハズです。
レジスタメモリに指定出来れば良いと言われますが
レジスタの速度差を体感したことはありませんでした。
なによりもレジスタはあっても数が少なすぎる。
730 :MaineCoon一級:2018/07/05 16:24:41 (6年前) 0MONA/0人
個人的によくやっていたのは
1.関数コールを少なくする為にインラインで極力ベタ書き(スタック回避)
2.分岐予測を有効にするために分岐割合を集計して
記述順序を変更(1と同じくjump命令回避)
3.部分的に機械語に分解して最適化
お高いコンパイラは1と2を意識しなくても良いらしいですが
パイプラインとの兼ね合いもあるので、どこまで信用できるかは分かりません。
3はやりだすとキリがないです。
731 :名無し四段:2018/07/05 20:48:20 (6年前) 0MONA/0人
>>727
同じ環境でcpuminer+名人ccminerだと
cpuminerのハッシュレートは維持出来ているので
あれ?って思ったんです
何か悪さしてるとかじゃなくて
cpuを補助的に使ってハッシュレートを稼いでたりしてるのかな?って疑問が湧いたので
(素人ゆえ技術的に可能なのかどうかは分かりませんが)
732 :金髪ツインテールさん:2018/07/08 00:43:51 (6年前) 0MONA/0人
>>731
cpuminerではないけども、xmr-stakで同じ現象おきるので
常時タスクマネージャー起動してます。これで何故か回避出来てます
タスクマネージャー立ち上げてないとハッシュレートは半分落ちます
733 :名無し名誉名人教士:2018/07/10 08:36:31 (6年前) 0MONA/0人
いろいろ試行錯誤してみると、a ? b : c は分岐ダイバージェンスを発生させないみたいだね。PTXではselp命令を使うみたい(ジャンプは使わない)。
if文をこれに置き換えられれば速くなる?
734 :MaineCoon一級:2018/07/10 13:22:03 (6年前) 0.039MONA/1人
分岐内部のスキップされるステップ数がjump命令でのペナより少なければ有効ですよね。
https://news.mynavi.jp/article/architecture-349/
もし、私が設計者であればif文でもselp命令を極力吐くようにしてスレッド処理に特化させると思います。
と、いうか読んだ感じだとなってるような気がします。
スキップ数を監視して長い場合はjump命令に置き換えるかもしれません。
最終的には簡単な処理をwhile文で回して実行時間を比較してみるしかないかと・・・
キャッシュミス、バーストの原因って他に何がありましたっけ?
735 :名無し名誉名人教士:2018/07/10 13:35:50 (6年前) 0MONA/0人
>>734
selp命令が使えると、シェアードメモリじゃなくてレジスタを使えそうな気がする…これって有効かな?
#pragma unroll
for(uint32_t j = 0; j < 3; j++) {
if(rowa<2) {
tmp[j] = rowa==0 ? state0[i*3+j] : state1[i*3+j];
} else {
tmp[j] = rowa==2 ? state2[i*3+j] : state3[i*3+j];
}
}
みたいな感じで…
ただ、これをやる場合は全力でunrollする必要があるので、カーネルが巨大になる懸念がある。
(unrollしないとレジスタではなくローカルメモリに確保される)
736 :名無し名誉名人教士:2018/07/10 13:40:55 (6年前) 0MONA/0人
>>735 続き
あと、シェアードメモリを使用しないならば、TPB=256の起動でレジスタを255個確保できる。
(KeplerはTPB=384で170個、FermiはTPB=144で227個)
これでレイテンシが隠ぺいできればいいんだけど…
737 :MaineCoon一級:2018/07/10 15:21:02 (6年前) 0MONA/0人
今、自分で挙げておいたページを改めて見回して「Nvidia-GPUって特化した石」だと驚いています。
まだ流し読み程度なので石の癖を理解できていません。
レジスタ変数の使用に制約があるのですか?
ちょっとよく理解できていません。
見た感じどこが問題なのか分かりません。
比較用にselp命令を使わない例文をお願いします。
ループ文のunrollは部分的でも容量が許す限り使われるのが良いと思います。
これも手書きでベタ貼りをよくやりました。
完全にunrollすると良い事が沢山あります。
中途半端な展開でもループ最後尾から最初へPC値設定、j++処理、比較処理が展開数分減少します。
カウント関数jの処理を追加しても知れてますのでループネストの奥深くだととても美味しいです。
738 :名無し名誉名人教士:2018/07/10 16:08:09 (6年前) 0MONA/0人
>>737
SMあたりのレジスタ数がFermiでは32768個、Kepler以降は65536個あります。
それをブロックあたりのスレッド数(TPB)で割ると、使用可能なレジスタ数になります。(ただし、スレッドあたりのレジスタ数の上限は255個)
Maxwell以降はSMあたりのコア数が128なので、128の整数倍の256をTPBとすれば、65536÷256=256となり、上限の255個を使用できる。
KeplerではSMあたりのコア数が192なので、TPB=384として、65536÷384≒170 で、レジスタ数は170個。
Fermi(後期型?)ではSMあたりのコア数が48なので、TPB=144として、32768÷144≒227 で、レジスタ数は227個。
なお、シェアードメモリを使用する場合、レジスタ数よりもシェアードメモリでTPBの上限が決まります。
シェアードメモリの上限はブロックあたり48kB。32スレッドあたりのシェアードメモリ使用量が12kBなので、48kB÷12kB=4となり、4×32スレッド=128スレッドになります。(ただし、Maxwell以降は96kBのシェアードメモリを持ち、2Warp起動できるので、実質256スレッドでの運用だね…変わらないじゃんwwww)
739 :MaineCoon一級:2018/07/10 17:35:47 (6年前) 0MONA/0人
「レジスタファイル」と巨大過ぎて気持ち悪いですが容量計算に問題は無いと思います。
行けると思います。
アクセスに必要な空クロックに他の処理をねじ込めればさらに効果的なんですが
そこまでの制御は難しいですね。
問題はコンパイラがその辺をどこまで面倒を見てくれるのか?でしょうか
740 :MaineCoon一級:2018/07/10 19:17:33 (6年前) 0MONA/0人
>>735
今頃気づいたので「遅ぇよ!」って言われそうですが
配列ではなくポインタでアクセスにすればunrollしなくてもレジスタ扱いしてくれるのではないでしょうか?
毎回オフセット計算してアドレスを求めているので
コンパイラにレジスタを使う意味がないと判断されてるかもしれません。
展開すれば最適化でポインタ加算だけで済むのでシンプルに見えます。
741 :名無し名誉名人教士:2018/07/11 11:43:12 (6年前) 0MONA/0人
>>740
レジスタは扱いとしてはx86のレジスタと変わりませんので、ポインタアクセスもできません。
x86(SSE)で例えると…
xmm0,xmm1,xmm2,xmm3にそれぞれデータが入っていて、
eaxの値が0の時はxmm0
eaxの値が1の時はxmm1
eaxの値が2の時はxmm2
eaxの値が3の時はxmm3
をそれぞれ参照するような感じかな?(メモリならアドレスでアクセスできるが…)
742 :名無し名誉名人教士:2018/07/11 12:04:40 (6年前) 0.00114114MONA/1人
今までの改造履歴で考えると…
・Maxwell(後期型)以降でシェアードメモリを減らして(3分の1削減)、ローカルメモリ(L1キャッシュ)を一部使ったら若干速くなった。
・でも、減らしすぎたら(3分の2削減)遅くなった。
・Maxwell(前期型)ではシェアードメモリを思いっきり減らした方が(3分の2削減)、速かった。
これを分析すると…
・Maxwell(後期型)以降ではシェアードメモリが96kBあり、1スレッドあたり384バイト使っていたため、96kB÷384÷32=8Warpで運用していた。
・シェアードメモリを3分の1削減にすることで、96kB÷(384×2/3)÷32=12Warp
・シェアードメモリを3分の2削減にすることで、96kB÷(384×1/3)÷32=24Warp
・でも、レジスタ数から24Warpも起動できず、性能が低下する…
・Maxwell(前期型)ではシェアードメモリが64kBあり、1スレッドあたり384バイト使っていたため、64kB÷384÷32=5Warpで運用していた。
・シェアードメモリを3分の2削減にすることで、64kB÷(384×1/3)÷32=16Warp
・(偶然ですが…)1スレッドあたりのレジスタ数が128個以下のため、16Warp起動でき、高速化につながった
こんな感じかな?
743 :名無し名誉名人教士:2018/07/11 12:11:19 (6年前) 0MONA/0人
全てレジスタでソースを書きなおして実験してみた。
分岐を可能な限り減らしても、24.5MH/s(GTX1060 6GB)と従来より遅くなった。
1スレッドあたり196個のレジスタを使用していたため、Warp数が少なくなり、遅くなったと考えられる。
とりあえず、>>742と併せて、16Warpを目標に改造してみようか…
(シェアードメモリを半分にする)
744 :名無しさん:2018/07/11 16:21:03 (6年前) 0MONA/0人
Cryply (CRP)ってコインがYescryptR16 からYespower と宣うアルゴに変更してGPU耐性を強めたと豪語しておりますが、これはGPUで掘れそうですか?
https://github.com/cryply/yespower
745 :名無し名誉名人教士:2018/07/11 17:33:47 (6年前) 0MONA/0人
>>744
シェアードメモリの使用量を増やしたみたいだね…
単純に作ると、1スレッドあたり96kバイト使うみたい。16並列で行けると仮定しても6144バイトなので、入りきらない…根本的に方法を考えないと無理かな?
746 :名無しさん:2018/07/11 23:12:45 (6年前) 0MONA/0人
>>745
マイニングしてみてもハシュレートはYescryptR16より若干遅くなるだけでWAVIみたいに2倍、PPTPみたいに4倍遅くなることはないので結構優れたアルゴかもしれません。
747 :名無し一級:2018/07/13 17:35:01 (6年前) 0MONA/0人
Azureの無料枠で遊んでみた
https://imgur.com/a/xw7ZmAB
748 :ittou四段教士:2018/07/17 22:32:23 (6年前) 0MONA/0人
最近Ultra96なるFPGAを手に入れて、絶賛勉強中なのですが、CPUマイニングよりは効率良くなるのか気になるところです。C/C++で書いたものが、そのまま(全部では無いものの)ハードウェア化します。
別の用途でしばらくマイニングに使う予定は無いのですが、久し振りに楽し気なハードウェアです。
749 :MaineCoon一級:2018/07/19 09:56:07 (6年前) 0MONA/0人
>>741
「レジスタ制御は出来ない」と、話に出てくるように「register指定子」は
コンパイラ様へのお伺いなのでしょっちゅう無視されます。
ちょっとした事でレジスタを使用してくれたりと気分屋ですから
どのように機嫌を取れば良いのかは難しいです。
かなり広いエリアが用意されているので何かコツがあるとは思うのですが。。。
750 :ピヨピヨ( ˘ω˘ )三段:2018/07/22 23:46:53 (6年前) 0.40618228MONA/4人
Radeon用だけどLyclminerという新しいソフトも出てる。
ソースコードも公開されてるし、どうもLyra2rev2だとRadeon最速のような。
https://github.com/CryptoGraphics/lyclMiner
(Redditだとハッシュレートが
Vega64で 75mh/s
R580で 42mh/s
280Xで 23mh/s
程と記されてます。)
751 :名無し四段:2018/07/23 00:49:44 (6年前) 0MONA/0人
>>750
情報サンクス
ちょっと試してみました
RX580、CC:1200MHz/900mV、MC:2150MHz/900mV、BIOSはMOD済み
mkxminerよりはハッシュレート出るみたいだけど
消費電力高め?(HWMonitor読みで110Wほど)
752 :名無し名誉名人教士:2018/07/23 10:56:38 (6年前) 0MONA/0人
>>750
devfee無いならこれがAMD最速か?
ソース見たけど、>>743で試した方法と一緒に見える…
AMDはレジスタが高速なのか?
(それとも、ローカルメモリ(CUDAのシェアードメモリに相当)が遅いのか?)
試しに、今までのを無しにして、これをCUDAにそのまま移植してみましょうかね?
753 :sinono初段:2018/07/23 18:19:06 (6年前) 0MONA/0人
lyclMiner015.zipにcmdファイルやbatファイルがなく手こずっています。
readmeのQuick start guideは確認したのですが、lyclMiner.confが見当たりません…。
不勉強で申し訳ありませんが、もしよろしければ起動までの手順をご教示願えませんでしょうか。
754 :名無し一級:2018/07/23 19:03:23 (6年前) 0.01MONA/1人
手元にAMDグラボなくて申し訳ないんだが
Windowsなら
lyclMiner -g lyclMiner.conf
で作成されるって書いてあるけど
ソース落としたりしてないかな
755 :名無し四段:2018/07/23 20:18:59 (6年前) 0.01MONA/1人
>>753
Windowsならマイナーと同じフォルダに
↓これでbatファイルを作って実行
lyclMiner -g lycMiner.conf
pause
lyclMiner.confが自動生成されるので
Connectionの部分を自分の使ってるプールの設定に書き換える
confファイルが出来たらlyclMiner.exeを実行すれば採掘始まるはず
confファイルの一番下はデバイス毎の設定かな?
自分は特にいじらずに動きました
756 :名無し四段:2018/07/23 20:38:31 (6年前) 0MONA/0人
SAPPHIRE NITRO+ RX580 デフォルトクロック
確かにハッシュレート出るけど、電力消費と温度的に今の季節には厳しいかな・・・
757 :sinono初段:2018/07/23 23:04:52 (6年前) 0MONA/0人
>>754
>>755
無事起動できました!
わかりやすい解説感謝です。
758 :ピヨピヨ( ˘ω˘ )三段:2018/07/23 23:19:55 (6年前) 0MONA/0人
普段1080tiでMona掘ってるけど、久しぶりにR290をつなげて確かめてみた。
MKXminer:20MH/s程
Lyclminer:24-24.5MH/s程
になったから、こちらの環境では20%程速度が上がったことになった。
(消費電力は測定してないから不明)
MKXminerたまにDevFeeセッションでコケて掘れなくなることを考えると、
Lyclminerの方がいいな、Radeonだと。
759 :ピヨピヨ( ˘ω˘ )三段:2018/07/23 23:26:19 (6年前) 0MONA/0人
758続き
R290 FanSpeedを上げてGPUClockが温度上昇で下がらないようにしたら
Lyclminerで31MH/sまで速度が上がった。
760 :ittou四段教士:2018/07/24 08:33:38 (6年前) 0.000001MONA/1人
GTX1180はそれほどワッパ高くないのかな。8月末の噂が。
https://www.digitaltrends.com/computing/nvidia-new-geforce-cards-start-arriving-end-of-august/
761 :名無し名誉名人教士:2018/07/24 08:47:07 (6年前) 0.10002222MONA/2人
Lyclminerのソースを見てCUDAで組んでみたけど、やっぱり遅くなった…(GTX1060で20MH/s程度)
どうも、レジスタが最適化されてないっぽいんだよな…
762 :ろん一級:2018/07/24 21:18:19 (6年前) 0MONA/0人
>>760
3ヶ月で1160-1180Tiまでが出そろうなら、待ってもいいね。
763 :名無し名誉名人教士:2018/08/06 08:49:20 (6年前) 0MONA/0人
どうやら、maxrregcountオプションは無視されて、__launch_bounds__でレジスタが最適化される模様…
__launch_bounds__(256,4)
とした場合、「ブロックあたりのスレッド数を(最大)256、同時起動するブロック数を(最小)4とする」
って意味みたい。つまり、256×4=1024スレッド起動するってことのようだ。
ここで、レジスタについてみてみると、SMあたりのレジスタ数は65536個(Kepler以降)。1024スレッド起動する場合、
65536個 ÷ 1024スレッド = 64個/スレッド
となり、カーネルのレジスタ数が64個に制限されるようだ。
これはいろいろ試せそうだな…
764 :名無し名誉名人教士:2018/08/06 09:04:30 (6年前) 0MONA/0人
Lyra2REv2は現状、シェアードメモリを1スレッドあたり384バイト使用している。そのため、(GTX9シリーズ、GTX10シリーズの場合)96kB/SM÷384バイト/スレッド=256スレッド/SMを同時起動できる。
このとき、レジスタ数で見ると、65536個/SM ÷ 256スレッド/SM = 255個/スレッド となり、レジスタ数を減らしたところで、性能には全く影響が無いようだ…
ここで、シェアードメモリの使用量を変更した場合を見てみると…
シェアードメモリを2/3にする⇒96kB/SM÷256バイト/スレッド=384スレッド/SM、65536個/SM ÷ 384スレッド/SM = 170個/スレッド
シェアードメモリを1/2にする⇒96kB/SM÷192バイト/スレッド=512スレッド/SM、65536個/SM ÷ 512スレッド/SM = 128個/スレッド
シェアードメモリを1/3にする⇒96kB/SM÷128バイト/スレッド=768スレッド/SM、65536個/SM ÷ 768スレッド/SM = 85個/スレッド
なので、シェアードメモリを制限すればスレッド数を増やせる。ただし、レジスタ数の制約を受け、レジスタが溢れた場合はローカルメモリにアクセスし、逆に遅くなる。
全部レジスタで演算した場合、シェアードメモリの制約が無くなるが、
uint2 state[4] ← 8個
uint2 Matrix[48] ← 96個
のレジスタが必要なので、512スレッド/SMが限界のようだ…
候補としては優先度の高い順に、①シェアードメモリを1/3にする、②シェアードメモリを1/2にする、③全てレジスタで確保する、④シェアードメモリを2/3にする
で考える。
765 :名無し名誉名人教士:2018/08/06 10:46:10 (6年前) 0MONA/0人
>>764 追記
「①シェアードメモリを1/3にする」はレジスタ数が85個に収まりそうもなく、メインループでローカルメモリへアクセスしそうなので、無理っぽい…
「②シェアードメモリを1/2にする」が妥当な線かもしれないな。
766 :名無し名誉名人教士:2018/08/06 10:54:00 (6年前) 0MONA/0人
>>764 追検証
GTX750Ti/750、GP100の場合、
シェアードメモリを1/3にする⇒64kB/SM÷128バイト/スレッド=512スレッド/SM、65536個/SM ÷ 512スレッド/SM = 128個/スレッド
Keplerの場合(192コア/SM)
シェアードメモリを1/3にする⇒48kB/SM÷128バイト/スレッド=384スレッド/SM、65536個/SM ÷ 384スレッド/SM = 170個/スレッド
これならいける気がする…
767 :名無し名誉名人教士:2018/08/06 21:51:52 (6年前) 0.11525514MONA/2人
>>764の通りやってみたら行けた
でも、GTX750でエラーが出るの…(多分、Keplerも同様)
>>766も取り込んでみるので、もうしばらく待っててください…
768 :名無し三級:2018/08/07 20:25:35 (6年前) 0MONA/0人
最近少しだけCryptDredgeに浮気していたのだけど
マイナー上&プール上のハッシュレートはccminerより向上しているものの
Poolで実際の収支を見たら以前より減ってておろっ?ってなった。
1時間おきに発生するdevfee(1%と言ってはいるが)の採掘がPPLNS的にかなり影響してるのかもしれない
なんとなくだけど
769 :名無し名誉名人教士:2018/08/07 23:01:44 (6年前) 0.11688623MONA/9人
久々の更新。ただし、今回は若干バグを内包しています。(見つけられなかった…)
KlausT-8.21-mod-r12
https://1drv.ms/u/s!Aud1FauQ46vHh115NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh1x5NYbLOB2bQlOt
更新内容(8.21-mod-r11⇒8.21-mod-r12)
・Lyra2REv2のパフォーマンスの向上
シェアードメモリの使い方を変えてみたら、案外速くなったので…
現状、Pascalではうまくいったんだが、第一世代Maxwellではうまくいかない…(当方、GTX1060、GTX750にて確認)
まあ、本気のユーザはPascal使っているだろうから、問題ないでしょう。
だれか、直せる方がおりましたら、情報ください…
770 :重久三級:2018/08/08 03:45:34 (6年前) 0MONA/0人
1080で50弱だったのが60手前ぐらいまでハッシュレートがあがりました!
OC次第ではr11での1080TIぐらいになるかも??
771 :リグ初心者初段:2018/08/08 13:02:33 (6年前) 0MONA/0人
r12試してみました。
1080TIで84MH/s出ました
CryptoDredge 0.8.3が85MH/s出てるので
最速の座奪還までもうちょっとですかね?
(devfee1%引いたら同じくらいっていう)
※マイナーでの表示しかみてないので、poolその他で結果が変わる可能性があります。
772 :名無し名誉名人教士:2018/08/08 13:46:46 (6年前) 0MONA/0人
>>771
同じくらいですか~
CryptoDredgeも同じやり方をしているかもしれませんね…?
773 :名無し四段教士:2018/08/08 15:06:56 (6年前) 0MONA/0人
日曜日に試させていただきます!
774 :Chariot三段:2018/08/08 21:51:10 (6年前) 0MONA/0人
すみません、部外者です。
以前GTX1060でマイニングしていましたが、採算悪化で撤退しました。
モナコインの相場が相当下がってますが、
この状況でもモナコインのマイニングは利益出るんでしょうか?
775 :名無し四段:2018/08/08 21:51:58 (6年前) 0MONA/0人
>>769
いつもながら更新ありがとう!!
テスト結果を貼らせてもらいます
1070tiをPL50、オプション無しでそれぞれ10分ほど起動した結果です
KlausT-8.21-mod-r11
KlausT-8.21-mod-r12
CryptoDredge0.8.3(CUDA9.2)
みんなが言うほどハッシュレートが伸びないんだけど設定が悪いんだろうか・・・
776 :名無し四段:2018/08/08 21:52:24 (6年前) 0MONA/0人
777 :名無し四段:2018/08/08 22:02:48 (6年前) 0.00004649MONA/1人
>>774
結果だけを求めるなら今は無し
過程を楽しめるなら今も有り
だと思ってます
778 :リグ初心者初段:2018/08/08 22:27:12 (6年前) 0.003939MONA/1人
>>775
PLで制限すると減衰率がCryptoDredgeより高い感じ。
779 :ittou四段教士:2018/08/08 22:42:31 (6年前) 0MONA/0人
117MHz→127MHz@1080x2
久し振りに豪快に上がりました。
凄いです。
780 :iijiiさん:2018/08/08 23:43:39 (6年前) 0MONA/0人
r12でハッシュレートめっちゃ伸びました。
1080:42MH/s + 1060 6GB:22MH/s×2 = 86MH/s
が
1080:50MH/s + 1060 6GB:25MH/s×2 = 100MH/s
になりました。
すべて電力60%運用です。
781 :ピヨピヨ( ˘ω˘ )三段:2018/08/09 01:06:23 (6年前) 0.003939MONA/1人
>>778
自宅の環境(1080ti)だと
PL65で設定したときのGPU powerをHWMonitorで見ると
CryptoDredgeだと63-67%の範囲で変動して平均が65%程になるのに対して、
mod-r12だと50-70%と激しく変動して、平均も55-60%程と設定値よりPLが低くなりました。
782 :ぐり七段教士:2018/08/09 11:58:50 (6年前) 0MONA/0人
1080と1080Tiでまったり設定で105MH/sでやってましたが、
r12に差し替えただけで127MH/sになりました。すごいですね。
783 :名無し四段:2018/08/09 21:55:19 (6年前) 0MONA/0人
>>778
>>781
を検証してみました
■PL100
KlausT-8.21-mod-r11
KlausT-8.21-mod-r12(一回目はエラー吐いて止まってしまった)
CryptoDredge0.8.3(CUDA9.2)
784 :名無し四段:2018/08/09 21:58:11 (6年前) 0MONA/0人
>>783のつづき
■PL75
KlausT-8.21-mod-r11
KlausT-8.21-mod-r12
CryptoDredge0.8.3(CUDA9.2)
785 :名無し四段:2018/08/09 22:30:55 (6年前) 0MONA/0人
>>784のつづき
■PL50
KlausT-8.21-mod-r11
KlausT-8.21-mod-r12
CryptoDredge0.8.3(CUDA9.2)
786 :名無し四段:2018/08/09 22:33:35 (6年前) 0MONA/0人
■今日学んだ教訓
・GPUはとにかく冷やせ
・ワッパ(電気代)考えたら全力は駄目よ、と
r12はまだじゃじゃ馬っぽいね
CryptoDredge0.8.3でワッパ見れるようになったから
PLの最適解探すのも面白そうだな
787 :名無し名誉名人教士:2018/08/14 19:28:17 (6年前) 0MONA/0人
現状>>769では、シェアードメモリ1/2モードと1/3モードを実装しています。
なぜか、1/3モードは(というか、旧GPUでは)うまくいかないんですよね…
当方の実験結果では、
GTX750(第一世代Maxwell)では動作はするけど、大半が”result does not validate on CPU!”メッセージになる。(たまにYey!!が出る)
GT710(Kepler)では途中で落ちる。(an illegal memory access was encountered のエラーがでる)
GTX1060(Pascal)で1/3モードを動かすと、ちゃんと動作する。
…なんだこれ?
788 :名無し二級:2018/08/15 01:35:02 (6年前) 0MONA/0人
illegal memoryのエラーが出たときって
iオプションでガツンと下げると(i14とかにしちゃう)
動いたりするけどその手の類の問題ではない感じですかね?
789 :名無し名誉名人教士:2018/08/15 08:29:54 (6年前) 0MONA/0人
>>788
-i 10 まで下げたけど、ダメだった…(GT710)
従来の方式だと、Keplerでは1SMあたり128スレッドで動いていた。(1SMあたり192コアなので、全力を出せていない)
今回は1SMあたり384スレッド突っ込めるので、1コアあたり2並列いける。全力を出せる上に、レイテンシの隠蔽もできる…って考えだったんだけどね…
Keplerは全力出せないのだろうか…?
790 :名無し二級:2018/08/16 06:07:40 (6年前) 0MONA/0人
>>789
マシン構成が違うと思うので何とも言えないのですが
以前ウチ、KlausT-8.18-mod-r1でiオプション下げないと「illegal memory」エラーが出てたんですよね。
(i16とかでやっと動いてた)
今はi22とかでも全然動いてるんですが、変更した内容は
・マザーボードのメモリを4GBがら8GBにした。
・アフターバーナーでPLを65%程度まで絞った。
これだけなんですよ。
もしかするとオンボメモリの影響もあったりするんじゃないですかね?・・・
791 :鰯二段:2018/08/16 11:48:25 (6年前) 0MONA/0人
Quadro RTXが発表されましたね
CUDAコアの設計がかなり変わってるみたいですので、マイナー側の対応が分かれそうですね……
792 :重久三級:2018/08/16 12:30:12 (6年前) 0MONA/0人
GTXもピーキーな感じになるんですかねー
793 :名無し二級:2018/08/16 17:29:24 (6年前) 0MONA/0人
Quadro RTX 8000
:4608 CUDA Cores,576 Tensor Cores(10G Rays/s)
:グラフィックスメモリ容量48GB(GDDR6)
:メーカー想定売価1万ドル(税別)
1万ドル・・・
794 :名無八段教士:2018/08/17 11:12:20 (6年前) 0.00001024MONA/1人
次のGeForceはGTX 20X0?いやRTX 20X0?という話が出てますね。
動画を見る
795 :名無し四段教士:2018/08/18 11:02:25 (6年前) 0MONA/0人
俺、冬のボーナスでたらRTX2080Tiを2機買ってnVLinkで繋ぐんだ。。。
・マイナーがturingに対応しない
・nVLinkだけで6マソするとかマジか?
・そもそもボーナスが出ない定期
やな未来しか思い描けない(;∀;)
796 :ジョンタイター二段:2018/08/18 18:37:51 (6年前) 0MONA/0人
>>794
仮想通貨支払いでしかも分割払いが可能になったら買ってもいいよ!?
797 :名無し名誉名人教士:2018/08/18 20:47:30 (6年前) 0MONA/0人
>>795
Monacoinを掘るだけなら、nVLinkは不要ですよ~
(メモリアクセスがほとんどないので)
メモリを食いつぶすアルゴリズムなら…
798 :鰯二段:2018/08/19 23:08:28 (6年前) 0MONA/0人
GDDR6とnVLinkで差をつけろ!
……と思いましたが、HMBで何かが飛躍的に加速した話も聞かないですしねぇ
799 :名無し侍二段:2018/08/21 20:14:13 (6年前) 0MONA/0人
RTX20シリーズが発表されましたね。
RTX2080Ti
マイニング兼ゲーミングとしてTitanVと同等かそれ以上の収益を出してくれるとよいのですが・・・
とりあえず買ってみたいと思います!
800 :名無し名誉名人教士:2018/08/22 09:29:24 (6年前) 0.00114114MONA/1人
Monacoinマイニングに必要なデータを挙げると…
RTX2080Ti CUDAコア:4352、ブーストクロック:1545MHz、TDP 260W(999ドル)
RTX2080 CUDAコア:2944、ブーストクロック:1710MHz、TDP 225W (699ドル)
RTX2070 CUDAコア:2304、ブーストクロック:1620MHz、TDP 175W (499ドル)
参考
GTX1080Ti CUDAコア:3584、ブーストクロック:1582MHz、TDP 250W(699ドル)
GTX1080 CUDAコア:2560、ブーストクロック:1733MHz、TDP 180W(499ドル?)
GTX1070Ti CUDAコア:2432、ブーストクロック:1683MHz、TDP 180W(449ドル)
GTX1070 CUDAコア:1920、ブーストクロック:1683MHz、TDP 150W
(379ドル?)
2080Tiだけぶっ飛んでるな…同価格帯ならむしろ遅くなる?
801 :名無し名誉名人教士:2018/08/22 09:55:10 (6年前) 0.00114114MONA/1人
古いデータの使いまわしだけど…
主なGPUのハッシュレート (Lyra2REv2のハッシュレート推定値)
GTX1060 23.39MH/s
GTX1070 35.88MH/s
GTX1070Ti 43.99MH/s
GTX1080 47.68MH/s
GTX1080Ti 58.05MH/s
RTX2070 40.11MH/s(NEW!!)
RTX2080 54.10MH/s(NEW!!)
RTX2080Ti 72.26MH/s(NEW!!)
(いずれも換算値)
802 :名無し四段教士:2018/08/22 10:54:44 (6年前) 0MONA/0人
全くの素人なので馬鹿な疑問かもですが、RTXのTensorコアやRTコアをマイニングに使えない
803 :名無し四段教士:2018/08/22 10:55:32 (6年前) 0MONA/0人
のでしょうか?
切れたゴメンなさい。
804 :名無し名誉名人教士:2018/08/22 11:55:27 (6年前) 0.00114114MONA/1人
>>802
整数演算なので、Tensorは使えません…
RTコアは知らんが、多分これも浮動小数演算だから無理じゃないかな?
805 :名無し侍二段:2018/08/22 12:21:35 (6年前) 0MONA/0人
>>801
この推定値通りだとすると新型のTiの演算力はかなりやばいですね・・・
1枚くらい無理して買ってもマイニングとゲーミングでしばらくやって逝けそうですわ。
1080現在3枚稼働だとして1枚売却し、頭金として2080Tiにつっこめば10万割れそうですね。
806 :名無し二級:2018/08/23 09:02:25 (6年前) 0MONA/0人
個人的には1080以上のグラボで掘ってるなら
すぐに変えるメリットは薄く感じるなぁ・・・
1050とかで掘ってるなら変えたくなるだろうけど。
807 :名無八段教士:2018/08/23 10:43:00 (6年前) 0MONA/0人
発表の際にほぼリアルタイムレイトレーシングのことしか言わなかったですし
ゲーム目的で買うにもマイニング目的で買うにも前世代からの乗換に微妙だと言われているのは現時点ではやむなし
実際に発売されて初物を買った人の実際の声を聞くまではそこまで盛り上がらないのかなと
Pascalが性能的にも消費電力的にも値段的にも分かりやすく魅力的だったのでその反動もあるにせよ
808 :名無し名誉名人教士:2018/08/23 11:16:18 (6年前) 0MONA/0人
マイナーのテスト用にRTX2070を1枚用意すべきかね?
809 :名無八段教士:2018/08/23 19:42:34 (6年前) 0MONA/0人
GeForce RTX 2080はGTX 1080比で1.5~2倍のゲーム性能。NVIDIAが情報を公開
https://pc.watch.impress.co.jp/docs/news/1139261.html
レイトレとかどうでもいいから従来のゲームはどうなんだよと散々言われまくったのでしぶしぶ出した感はあるデータ
でもこのグラフを鵜呑みにすればそれなりに凄くなっているらしい
これを見てやっぱり買うという声が上がっているのは喜ばしい話
810 :名無し四段教士:2018/08/23 20:07:09 (6年前) 0MONA/0人
>>809
まだまだ油断しないぞー。ユーザーがベンチ回したら期待はずれでズコーって展開もあるかもだし。
811 :鰯二段:2018/08/24 14:06:46 (6年前) 0MONA/0人
レイトレーシングがハードウェア処理できるからといってすぐに対応APIだのゲームエンジンが普及するわけでもないですからね
テッセレーションもRadeon HD2000シリーズの頃にはすでに実装されてましたが、普及したのはDx11世代以後ですからねー
我々としては12nmFinFETによるワッパの向上とRTコアTensorコアの使いみち……CUDAコアにモナを、Tensorには浮動小数点や整数演算で掘れる通貨を掘らせるようなデュアルマイナーなどを考える良い機会なのでしょう
……ところで噂に上がってたVoltaの下位モデルやAmpereコアはどこに行ったんでしょうかねぇ?
812 :名無し四段教士:2018/08/24 16:42:11 (6年前) 0MONA/0人
Ampereさんは7nmかも?
マイニング用のボード出してくれないかな。。。
813 :名無し名誉名人教士:2018/08/24 16:47:57 (6年前) 0MONA/0人
>>812
それだったら、整数専用のボードが出たらいいな…
814 :鰯二段:2018/08/24 21:08:14 (6年前) 0MONA/0人
nvidiaがRTXの情報を追加開示していますが、やっぱり世界中から「CUDAコア単位で見た性能向上幅は低い」という指摘があるみたいですね
Pascal比2倍の性能の理屈としては
「FXAAなどのポストプロセッシング処理をRTコアやTensorコアで行うのでCUDAコアがアンチエイジングから開放される。結果として4Kでも60FPS余裕だよ」
とのことですが……
いくらAIとFXAAを組み合わせてもMSAAは必須でしょうし、現在のグラボ市場にはマイニング需要が根底にありますからねぇ
Tensorコアのみのディープラーニング専用Teslaが出ないということは整数演算にも少なからずCUDAコアが関与しないといけないのでしょう
以前マイニング専用GPUコアの開発という噂もありましたが、なかなか前途多難です
815 :名無し名誉名人教士:2018/08/24 23:43:27 (6年前) 0.22925514MONA/3人
Kepler、Maxwellで安定したので、うp。
KlausT-8.21-mod-r13
https://1drv.ms/u/s!Aud1FauQ46vHh195NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh155NYbLOB2bQlOt
更新内容(8.21-mod-r12⇒8.21-mod-r13)
・Lyra2REv2のsm分岐方法を変更。-dオプションを使用したときに動作しないバグを修正。
・RTXシリーズに簡易対応。>>801の換算値から-iオプションのデフォルト値を設定。(シェアードメモリ1/2モード)
・Keplerにて、オールレジスタの方が速かったので変更。
これにより、以下の3モードを実装した形に…
Pascal(GP100以外)、Maxwell(GTX9xx)⇒シェアードメモリ1/2、レジスタ1/2
Pascal(GP100)、Maxwell(GTX750/750Ti)⇒シェアードメモリ1/3、レジスタ2/3
Kepler⇒オールレジスタ
816 :名無し名誉名人教士:2018/08/24 23:48:08 (6年前) 0MONA/0人
>>815の実験結果
GTX750⇒7.64MH/s
GT710⇒1.06MH/s
GT710で1MH/sの大台を突破!
817 :名無し名誉名人教士:2018/08/24 23:48:54 (6年前) 0MONA/0人
818 :名無し名誉名人教士:2018/08/24 23:50:07 (6年前) 0.00114114MONA/1人
RTXシリーズで動作確認ができれば、もうゴールしていいよね?
819 :名無し名誉名人教士:2018/08/25 09:04:02 (6年前) 0.00114114MONA/1人
久々のハッシュレート考察
>>815、GTX1060(1280コア、Boost 1847MHz)で30.4MH/sだったので、
GTX1080Ti:30.4MH/s×(3584/1280)×(1582/1847)=72.9MH/s
GTX1080:30.4MH/s×(2560/1280)×(1733/1847)=57.0MH/s
GTX1070Ti:30.4MH/s×(2432/1280)×(1683/1847)=52.6MH/s
GTX1070:30.4MH/s×(1920/1280)×(1683/1847)=41.6MH/s
GTX1060(6GB):30.4MH/s×(1280/1280)×(1708/1847)=28.1MH/s
GTX1060(3GB):30.4MH/s×(1152/1280)×(1708/1847)=25.3MH/s
GTX1050Ti:30.4MH/s×(768/1280)×(1392/1847)=13.7MH/s
GTX1050(3GB):30.4MH/s×(768/1280)×(1518/1847)=15.0MH/s
GTX1050(2GB):30.4MH/s×(640/1280)×(1455/1847)=12.0MH/s
820 :名無し名誉名人教士:2018/08/25 09:13:56 (6年前) 0.00114114MONA/1人
>>819 つづき
GTX980Ti:30.4MH/s×(2816/1280)×(1075/1847)=38.9MH/s
GTX980:30.4MH/s×(2048/1280)×(1216/1847)=32.0MH/s
GTX970:30.4MH/s×(1664/1280)×(1178/1847)=25.2MH/s
GTX960:30.4MH/s×(1024/1280)×(1178/1847)=15.5MH/s
GTX950:30.4MH/s×(768/1280)×(1188/1847)=11.7MH/s
>>815、GTX750(512コア、Boost 1137MHz)で7.64MH/sだったので、
GTX750Ti:7.64MH/s×(640/512)×(1085/1137)=9.11MH/s
GTX750:7.64MH/s×(512/512)×(1085/1137)=7.29MH/s
821 :名無し名誉名人教士:2018/08/25 09:25:01 (6年前) 0.00114114MONA/1人
>>820 つづき
NVIDIA TITAN Xp:30.4MH/s×(3840/1280)×(1582/1847)=78.1MH/s
NVIDIA TITAN X:30.4MH/s×(3584/1280)×(1531/1847)=70.6MH/s
GTX Titan X:30.4MH/s×(3072/1280)×(1075/1847)=42.5MH/s
>>815、GT710(192コア、954MHz)で1.06MH/sだったので、
GTX Titan Z:1.06MH/s×(5760/192)×(876/954)=23.5MH/s
GTX Titan Black:1.06MH/s×(2880/192)×(980/954)=42.5MH/s
GTX Titan:1.06MH/s×(2688/192)×(876/954)=13.6MH/s
822 :名無し名誉名人教士:2018/08/25 09:25:58 (6年前) 0.00114114MONA/1人
>>821 修正
GTX Titan Black:1.06MH/s×(2880/192)×(980/954)=16.3MH/s
823 :名無し名誉名人教士:2018/08/25 09:33:26 (6年前) 0.00114114MONA/1人
>>821 つづき
GT710:1.06MH/s
GT720:1.06MH/s×(192/192)×(797/954)=885kH/s
GT730:1.06MH/s×(384/192)×(902/954)=2.00MH/s
GT740:1.06MH/s×(384/192)×(993/954)=2.21MH/s
GTX760:1.06MH/s×(1152/192)×(1033/954)=6.89MH/s
GTX770:1.06MH/s×(1536/192)×(1085/954)=9.64MH/s
GTX780:1.06MH/s×(2304/192)×(900/954)=12.0MH/s
GTX780Ti:1.06MH/s×(2880/192)×(928/954)=15.5MH/s
824 :名無し名誉名人教士:2018/08/25 09:43:45 (6年前) 0.00114114MONA/1人
GT630:1.06MH/s×(384/192)×(902/954)=2.00MH/s
GT640(旧):1.06MH/s×(384/192)×(900/954)=2.00MH/s
GT640(新):1.06MH/s×(384/192)×(1046/954)=2.32MH/s
GTX650:1.06MH/s×(384/192)×(1058/954)=2.35MH/s
GTX650Ti:1.06MH/s×(768/192)×(928/954)=4.12MH/s
GTX660:1.06MH/s×(960/192)×(1033/954)=5.74MH/s
GTX660Ti:1.06MH/s×(1344/192)×(980/954)=7.62MH/s
GTX670:1.06MH/s×(1344/192)×(980/954)=7.62MH/s
GTX680:1.06MH/s×(1536/192)×(1058/954)=9.40MH/s
GTX690:1.06MH/s×(3072/192)×(1019/954)=18.1MH/s
825 :名無し名誉名人教士:2018/08/25 09:58:41 (6年前) 1.00114114MONA/2人
RTX2080Ti:30.4MH/s×(4352/1280)×(1545/1847)=86.5MH/s
RTX2080:30.4MH/s×(2944/1280)×(1710/1847)=64.7MH/s
RTX2070:30.4MH/s×(2304/1280)×(1620/1847)=48.0MH/s
Titan V:30.4MH/s×(5120/1280)×(1455/1847)=95.8MH/s
826 :名無し六段教士:2018/08/25 12:22:11 (6年前) 0MONA/0人
仕事速すぎるwww
827 :くろねこ四段:2018/08/25 13:29:08 (6年前) 0MONA/0人
仕事はぇーーー!!!!
どうしてそんなに早いの?なんで?
828 :名無し名誉名人教士:2018/08/25 15:01:18 (6年前) 0MONA/0人
>>826 >>827
ハッシュレート考察はコア数と動作周波数から換算しているだけですよ~
あと、-iオプションのデフォルト値は、GPU名で決まります。
GPU名に"2080"と"Ti"があればRTX2080Tiとして設定します。(発売前なので動作確認ができていませんが…)
あと、RTXシリーズのSMの構成やシェアードメモリ容量などわからない部分もあるので、もしかしたら、更なる高速化ができるかも?
829 :鰯二段:2018/08/26 20:44:54 (6年前) 0.39MONA/1人
未確定情報ですが、シェアードメモリの増量と高速化が行われているみたいですよ
L2は2.7倍なので最適化によってはかなり良くなるかもです
https://videocardz.com/newz/nvidia-upgrades-l1-and-l2-caches-for-turing
830 :名無し名誉名人教士:2018/08/26 21:31:50 (6年前) 0.39MONA/1人
>>829
この情報(別ページも含む)だと、GP100に近い構成みたいだね…
4608コア(Quadro?)で72SMなので、4608コア÷72SM=64コア/SMになる。
(Pascal(GP100以外)が128コア/SM、GP100が64コア/SM)
だとすると、シェアードメモリ1/3モードにしないといけないかな?(現状はシェアードメモリ1/2モード)
シェアードメモリ分割式ってことは、Voltaの設定で行けるのか?
それとも、新しいCUDAToolkitが出て、新関数を使うのか?
831 :名無し名誉名人教士:2018/08/26 22:48:55 (6年前) 0MONA/0人
どうやら、CUDA 10が出るようだ…
https://developer.nvidia.com/announcing-cuda-toolkit-10
さて、どんな感じになるのかな…
832 :名無し名誉名人教士:2018/08/27 12:51:19 (6年前) 0MONA/0人
GPUの世代から見るLyra2REv2の制約事項(忘備録)
・Fermi世代(CUDA8でコンパイルする必要あり)
レジスタモード:TPB=96、BPM=5が可能。(シェアードメモリを102バイトまで使用可能)
シェアードメモリ1/3モード:TPB=96、BPM=4。
シェアードメモリ1/2モード:TPB=96、BPM=2。
従来方式:TPB=96、BPM=1。
なお、従来方式以外はレジスタ不足のため、ローカルメモリへのアクセスが発生する。
・Kepler 第一世代
レジスタモード:TPB=192、BPM=5が可能。(シェアードメモリを38バイトまで使用可能)
シェアードメモリ1/3モード:TPB=192、BPM=2。
シェアードメモリ1/2モード:TPB=192、BPM=1。
従来方式:TPB=128、BPM=1。(GPUの3分の1が休眠状態)
なお、従来方式以外はレジスタ不足のため、ローカルメモリへのアクセスが発生する。
833 :名無し名誉名人教士:2018/08/27 12:52:09 (6年前) 0MONA/0人
GPUの世代から見るLyra2REv2の制約事項(忘備録)
・Kepler 第二世代
以降の世代ではレジスタ不足は事実上発生しない。
レジスタモード:TPB=192、BPM=2が可能。(シェアードメモリを128バイトまで使用可能)
シェアードメモリ1/3モード:TPB=192、BPM=2。
シェアードメモリ1/2モード:TPB=192、BPM=1。
従来方式:TPB=128、BPM=1。(GPUの3分の1が休眠状態)
・Maxwell 第一世代
レジスタモード:TPB=128、BPM=3が可能。(シェアードメモリを170バイトまで使用可能)
シェアードメモリ1/3モード:TPB=128、BPM=3。
シェアードメモリ1/2モード:TPB=128、BPM=2。
従来方式:TPB=128、BPM=1。
834 :名無し名誉名人教士:2018/08/27 12:52:41 (6年前) 0MONA/0人
GPUの世代から見るLyra2REv2の制約事項(忘備録)
・Maxwell 第二世代、Pascal(GP100以外)、Volta
レジスタモード:TPB=128、BPM=3が可能。(シェアードメモリを256バイトまで使用可能)
シェアードメモリ1/3モード:TPB=128、BPM=3。
シェアードメモリ1/2モード:TPB=128、BPM=3。
従来方式:TPB=128、BPM=2。
・Pascal(GP100)、Turing
レジスタモード:TPB=64、BPM=6が可能。(シェアードメモリを170バイトまで使用可能)
シェアードメモリ1/3モード:TPB=64、BPM=6。
シェアードメモリ1/2モード:TPB=64、BPM=6。
従来方式:TPB=64、BPM=2。
835 :名無し名誉名人教士:2018/08/27 12:54:02 (6年前) 0MONA/0人
>>834訂正
・Pascal(GP100)、Turing
シェアードメモリ1/2モード:TPB=64、BPM=5。
836 :名無し名誉名人教士:2018/08/27 13:01:53 (6年前) 0MONA/0人
実験してみた感じだと、BPM=2まではシェアードメモリよりもレジスタの方が速そうだ。だけど、BPM=3以上を確保できるなら、シェアードメモリの方が速いみたいだ。
なので、選ぶべきモードは…
Fermi世代、Kepler 第一世代:シェアードメモリ1/3モード(そもそもレジスタが足りていない…)
Kepler 第二世代:レジスタモード
Maxwell 第一世代:シェアードメモリ1/3モード
Maxwell 第二世代、Pascal(GP100以外)、Volta:シェアードメモリ1/2モード
Pascal(GP100)、Turingは、BPMが十分大きいため、1/3モードと1/2モードはどちらが速いかは判断付かない…なので、実験して速かった方を採用する。
よし、RTXシリーズが出ても、これですぐに対応できるな…
(なお、現状はシェアードメモリ1/2モードで動きます)
837 :盗掘者さん:2018/08/27 23:04:42 (6年前) 0MONA/0人
https://news.mynavi.jp/article/20180827-684930/
MSIですが、予約価格出ましたね
・GeForce RTX 2080 Ti GAMING X TRIO」が税別174,800円(税込188,784円)
・GeForce RTX 2080 GAMING X TRIO」が税別124,800円(税込134,784円)
18万って・・・
1000番台が2枚買えちゃう!!
838 :あ熱帯います七段教士:2018/08/27 23:51:41 (6年前) 0MONA/0人
うちだと、送料+税込み価格で、銀行振り込み、もしくは仮想通貨払い前提
ASUS DUAL-RTX2080TI-O11G 182000円(送料+税込み)
ASUS DUAL-RTX2080-O8G 128000円(送料+税込み)
4週間+α後ぐらい到着で予約販売できるけど(最安値?)
需要ありますか?
839 :名無し侍二段:2018/08/28 00:24:48 (6年前) 0MONA/0人
早速ですが、ASUSのRTX2080Ti予約しましたよ~
購入金額は秘密ですが・・・w
840 :あ熱帯います七段教士:2018/08/28 00:42:52 (6年前) 0MONA/0人
内緒=やすいのかな?
http://news.kakaku.com/prdnews/cd=pc/ctcd=0550/id=76932/
検索して価格.comの口コミ最安値よりは安かったのでとりあえず良しとします(^^;
841 :名無し侍二段:2018/08/28 00:51:38 (6年前) 0MONA/0人
>>840
現金限定ですがおかげで結構安かったですね。
せめてクレジットカード対応してくれれば・・・って思いますw
842 :あ熱帯います七段教士:2018/08/28 01:02:07 (6年前) 0MONA/0人
クレジット会社は3.6%~とか必要なので、取り分が販売店より大きいとかよくわからないこともあります(^^;
カード会社だと上乗せNGなので、現金取引限定する店舗が多くなります。paypalだと、明示すれば価格にカード含めて手数料上乗せOKなので選んでいる人も結構います。
843 :名無し侍二段:2018/08/28 01:09:44 (6年前) 0MONA/0人
ですよねぇ、クレジットだと手数料がわけわからんレベルでってことになるから現金取引限定が多くなりますよねぇ。(特に仕入れ業者は)
ペイパルは上乗せおkなんですねぇ!知らなかったですw
844 :あ熱帯います七段教士:2018/08/28 01:49:09 (6年前) 0MONA/0人
検索するとpaypalはokというもの見つかると思います。
契約も色々融通が効いて、うちのはpaypal入らなくてもカードが使えるという契約になっています。(デフォルトは入ってなくてもその場で加入すれば使えるという契約)
ちなみに、うちが購入したpaypal用のゲートウェイ(課金コントロールソフト)は、手数料上乗せ設定が最初からできるようになってました。
845 :名無し名誉名人教士:2018/08/28 06:16:51 (6年前) 0MONA/0人
金額見ると、心が折れるな…
846 :ittou四段教士:2018/08/28 08:29:34 (6年前) 0MONA/0人
EVGAで行くつもり。クレジット手数料はそんなに変わらないし、サポート手厚いし。ただ、初期ロットの購入には失敗しました(もう無い)。
847 :名無し四段教士:2018/08/28 08:45:42 (6年前) 0.00114114MONA/1人
小官もEVGAを狙っています。米尼で2080Tiの3ファンか出るまで待機中。
848 :ittou四段教士:2018/08/28 12:24:05 (6年前) 0MONA/0人
EVGAの1080を1台手放すかなぁ。水冷ヘッドとか無駄になるのが何とも。
849 :名無し侍二段:2018/08/28 12:33:30 (6年前) 0MONA/0人
無名の私ですが、現金一括のみでRTX2080Ti 175000円で手配できそうですが・・・誰か需要ありますかね?
850 :名無し侍二段:2018/08/28 12:44:58 (6年前) 0MONA/0人
あっ・・・もう予約締め切ってる・・・
851 :あ熱帯います七段教士:2018/08/28 13:41:20 (6年前) 0MONA/0人
>>838
あっという間に受付終了しました(^^;
852 :あ熱帯います七段教士:2018/08/28 14:58:56 (6年前) 0MONA/0人
仕入先に確認しましたが、同機種についてはもう発売開始後とのこと。
別メーカの確保できたら予約可能にするとのことでしたが、欲しい人沢山いるので、瞬殺されそう。
掲示板に書いて...という反応速度では無理そう(^^;
853 :名無し侍二段:2018/08/28 16:27:00 (6年前) 0MONA/0人
ストックしておかないと無理そうですねぇ・・・
854 :名無し侍二段:2018/08/28 16:29:40 (6年前) 0MONA/0人
そういえばスレ違いですが、RTX2080TiをCPUボトルネックしにくくするにはどこらへんのCPU使えばいいんですかね?
今は予算無くてi5 8400使ってるんですけれど。
855 :ピヨピヨ( ˘ω˘ )三段:2018/08/28 22:24:01 (6年前) 0MONA/0人
2080tiと同時にPCの更新を予定しているなら、
アメリカAmazonの2080ti搭載PCを購入するのもありなのか?
送料込みで2800$ほどするが・・・
https://www.amazon.com/CYBERPOWERPC-GXiVR8340A-i7-8700K-GeForce-802-11AC/dp/B07GG6HRL4/ref=sr_1_2?ie=UTF8&qid=1535462501&sr=8-2&keywords=2080ti
856 :ピヨピヨ( ˘ω˘ )三段:2018/08/28 22:33:41 (6年前) 0MONA/0人
ちなみにPaypalやアメリカAmazonでのクレジットカード購入では、
決済通貨はJPYでなくUSDを使った方がよいです。
(USD/JPY交換レートはクレジットカード会社の方が良いため)
857 :名無し侍二段:2018/08/28 22:48:39 (6年前) 0MONA/0人
>>856
流石に2800$は買えないですねぇ・・・
まぁ、理想は8700Kといったところですかね?
まぁ、でもi5でもそこそこ性能は発揮できるでしょう。多分
とりあえず現状維持ですかねぇ。
858 :ピヨピヨ( ˘ω˘ )三段:2018/08/28 23:14:44 (6年前) 0MONA/0人
>>857
こっちはi5 2500Kで1080ti使ってます。(TBで4.5GHzでますが)
昔の世代のCPUのため最新のに比べるとFPSは落ちますが、ゲームをする分には特に困ってないので、i5 8400だと十分だと思いますよ。
859 :名無し侍二段:2018/08/28 23:47:42 (6年前) 0MONA/0人
>>858
なるほど、情報ありです!
じゃあとりあえずこのまま様子見してみますかねぇ。
また数年したらメモリ規格変わるとか変わらないとかという話が上がってるみたいなんで当分はこのままでいきますかねぇ。
860 :名無し名誉名人教士:2018/08/29 11:05:28 (6年前) 0MONA/0人
なんか、新GPU買う人が結構いる見たいやね~
正直、その金額だと買う気が起きないが…
CUDA10が出たら、すぐに新版が出せると思うので(変なエラーがなければですが…)、更新したら、テストをお願いできるだろうか…?(先着で何名かには、Mona撒き予定)
新GPUはGP100(Tesla P100、Quadro GP100)に構造が似ていて、>>825より高速化できる可能性があるため、計算方法の違いによる速度の比較をしたいと思います。
(レジスタモード、シェアードメモリ1/2モード、シェアードメモリ1/3モードの3バージョンを計画中。おそらくシェアードメモリ1/3モードが1番速くなるんじゃないかな?)
861 :名無し名誉名人教士:2018/08/29 11:15:22 (6年前) 0MONA/0人
>>860 詳細
・シェアードメモリ1/3モード
第一世代Maxwellと同じ計算モード。シェアードメモリの容量より、64kB/SM÷(64スレッド/ブロック×128Byte/スレッド)=8ブロック/SM となる。
十分にレイテンシを隠蔽でき、速度向上が期待できる。
・シェアードメモリ1/2モード
Pascal、Maxwellと同じ計算モード。シェアードメモリの容量より、64kB/SM÷(64スレッド/ブロック×192Byte/スレッド)≒5ブロック/SM となる。
十分にレイテンシを隠蔽できているなら、これでも十分速度が出る。
・レジスタモード
Keplerと同じ計算モード。シェアードメモリを全く使わない。レジスタの容量より、65536reg/SM÷(64スレッド/ブロック×180reg/スレッド)≒5ブロック/SM となる。
1コアあたりのレジスタ数が増加しているため、ブロック数を増やせる。こちらでも速度が見込めそう…
862 :名無し名誉名人教士:2018/08/29 11:18:13 (6年前) 0MONA/0人
参考:Pascalで>>861と同様の検討を行うと…
・シェアードメモリ1/3モード
96kB/SM÷(128スレッド/ブロック×128Byte/スレッド)=6ブロック/SM
・シェアードメモリ1/2モード
96kB/SM÷(128スレッド/ブロック×192Byte/スレッド)=4ブロック/SM
・レジスタモード
65536reg/SM÷(128スレッド/ブロック×180reg/スレッド≒2ブロック/SM
863 :名無し名誉名人教士:2018/08/29 11:22:50 (6年前) 0MONA/0人
>>862 補足
シェアードメモリ使用時のレジスタ数による上限値
65536reg/SM÷(128スレッド/ブロック×128reg/スレッド)=4ブロック/SM
これにより、1/3モードと1/2モードでブロック数の差が発生しない。
なお、>>861のレジスタ数による上限値は
65536reg/SM÷(64スレッド/ブロック×128reg/スレッド)=8ブロック/SM
なので、新GPUでは、1/3モードと1/2モードで違いが出る見込み。
864 :ittou四段教士:2018/08/29 19:19:01 (6年前) 0MONA/0人
EVGAで$800。ちょっと高いな。
865 :ななし二級:2018/09/01 00:15:34 (6年前) 0MONA/0人
最新版(KlausT-8.21-mod-r13)
1080Tiで動かしたいのですがbatファイルを開いた瞬間にウインドウが消えてうまく動かないのですが
解決法分かる方居ませんか?
batファイルはCPUマイナーのbatファイルの中身をコピペしてccminer.exeに置き換えてます
866 :ittou四段教士:2018/09/01 07:33:43 (6年前) 0.00039MONA/1人
コマンドラインで実行するか、pause書いて停止させるかしてエラーメッセージを見る。
867 :ななし二級:2018/09/01 09:42:32 (6年前) 0.00114114MONA/1人
ドライバーをアップデートしたら出来るようになりました
868 :リグ初心者初段:2018/09/01 10:22:49 (6年前) 0MONA/0人
>>867
無事動いたようでよかったです。
KlausT-8.21-mod-r13はVS2017とcuda9.2の環境でビルドされているので、
VC++2017再頒布可能パッケージとかcuda9.2対応ドライバとか入れてあげると動くと思います。
GeForce 397.31 Driver以降からcuda9.2対応なので最近のドライバ入れてないと動かないと思います。
cuda toolkitは動かすだけなら必要ありません。
VC++の再頒布可能パッケージはいらないかも?
869 :あ熱帯います七段教士:2018/09/02 14:02:14 (6年前) 0MONA/0人
2080tiは予約完了ばかりだけど、2080はまだ予約枠がある。
きっとマイナーが予約しているんですね(^^;
870 :ジョンタイター二段:2018/09/03 20:50:50 (6年前) 0MONA/0人
仮想通貨で儲けた分で新しいグラボ購入・・・という野望が・・・orz
_ノ乙(、ン、)_グッタリ…
871 :あ熱帯います七段教士:2018/09/05 21:59:45 (6年前) 0MONA/0人
>>838
2080tiを送料+税込みで182000円と書きましたが、本日のamazon最安値は398000円で倍の値段になっますね(^^;
普段パソコンを扱っているようではないショップでした。超高額セドリなんですかねぇ...
872 :名無し名誉名人教士:2018/09/05 23:23:04 (6年前) 0MONA/0人
2080Ti高すぎだろ…
ワッパが良くてもイニシャルが高すぎると手出しができんよ…
873 :名無し侍二段:2018/09/06 01:35:07 (6年前) 0MONA/0人
スタートダッシュが肝心なんですよねぇ・・・
とはいえ密林のたまにあるぼったくり価格はやばすぎですよ。
まぁ、どこにでもそういう商法ありますからねぇしかたないのかなぁとはおもいますが。
874 :重久三級:2018/09/07 17:46:06 (6年前) 0MONA/0人
インターナショナルショッピング利用すればいいんでは?
875 :重久三級:2018/09/07 17:47:14 (6年前) 0MONA/0人
シッピングか
876 :ピヨピヨ( ˘ω˘ )三段:2018/09/08 01:57:46 (6年前) 0MONA/0人
>871のぼったくり2080tiよりも
>855の2080ti搭載2800$パソの方がおまけもてんこ盛りついててはるかにおとくですねwww
877 :鰯二段:2018/09/13 22:29:30 (6年前) 0MONA/0人
ニューラルネットワーク演算専用のTesla T4が発表されましたね
マイニングには無関係かもしれませんが、TDP75WのTurningがあるというのは一つのトピックなのではないでしょうか
878 :名無し名誉名人教士:2018/09/15 16:02:31 (6年前) 0.01118763MONA/3人
Turingの詳細が公開されましたね。
マイニングに両影響する内容は…
・SMが64コアになった(GTX10xxは128コア)
これにより、レジスタ容量の増大、シェアードメモリの使い方が変わる、などの影響が出る。(>>860 のとおり、3バージョンを試験的に公開予定)
・L2キャッシュの増量(GTX10xxの2倍)
キャッシュヒット率が高くなるので、メモリを使うアルゴリズムに有利に働く。
・Tensorコア(Volta以降で搭載)
Tensorコアはマイニングには使えない。そのため、マイニング時の消費電力はTDPよりも低くなると思われる。(TDPはTensorを使うことも想定しているはず…)
なので、Pascalの同ランク品とそれほど消費電力は変わらないと想定。
逆に悪影響のものは…
・イニシャルコストが高すぎる
GTX10xxシリーズ(実勢価格)と比較して、1ランク上の価格設定になっているため、同価格帯でみると、それほど性能は上がってなさそう…
GTX1080⇒RTX2070、GTX1080Ti⇒RTX2080、TitanXp⇒RTX2080Ti、みたいな状況かな?そして、TitanVは別格…
879 :名無し名誉名人教士:2018/09/15 16:03:25 (6年前) 0MONA/0人
>>878
誤:両影響
正:良影響
880 :名無し四段教士:2018/09/15 22:55:46 (6年前) 0MONA/0人
お値段は徐々に下がるのではないかと勝手に想像中。
1000ドルちょっとになったらTi買う!
881 :鰯二段:2018/09/15 23:01:03 (6年前) 0MONA/0人
詳細を読みましたが、TU102コア(RTX2080)とTU104以下ではL2キャッシュの容量が異なりますね
CUDAコアの設計は同じ(と思う)ので、TensorコアやRTコアの兼ね合いで変動するのでしょうか……将来的に2070tiなどが出たときに仕様があべこべになりそうで不安です
882 :(´・ω・`)二段:2018/09/15 23:23:39 (6年前) 0MONA/0人
GTC行って革ジャンがTuring発表するの見てきました(`・ω・´)
AI(というかDLというべきか)中心のカンファレンスであれだけ人と企業が集まることを考えると,
やっぱり今後しばらくのnvidiaの方針として, ゲーミング性能強化はRT性能伸ばす方向以外は力入れない予感がしますね.
883 :モナキンパンプアップ二級:2018/09/16 20:34:32 (6年前) 0MONA/0人
こんにちは。他でも書いたのですがお答えいただけなかったのでこちらでも聞かせてください。モナコインバージョン0.16.2のリリースというニュースを見つけました。
https://crypto.watch.impress.co.jp/docs/news/1143089.html
ここに「更新を強く推奨」とありますが、私たち個人が何かする必要はあるのでしょうか。無知ですみません。教えていただけると嬉しいです。
884 :モナリオン三級:2018/09/16 21:37:55 (6年前) 0.0039MONA/1人
ウォレット更新しるってことじゃないの?
885 :名無し四段教士:2018/09/16 22:28:33 (6年前) 0MONA/0人
Monacoin Core(ウォレット)更新せねば。
微々たる量しか入っていませんが、1μモナを笑う者は1μモナに泣くのです。
886 :モナキンパンプアップ二級:2018/09/17 00:08:02 (6年前) 0MONA/0人
>>884
なるほど、そういうことでしたか。すっきりしました!ありがとうございます。
887 :Xubuntuマイナーさん:2018/09/17 18:33:07 (6年前) 0MONA/0人
どうしても自己解決できないので教えて下さい。
涼しくなってきたので、久しぶりにマイニングを再開しました。
お休み中にリリース頂いていたKlausT-8.21-mod-r13のソースコードを、Xubuntu上でコンパイルして利用してみたのですが、KlausT-8.21-mod-r11に比べてシステムのload averageが異様に高くなります。
ccminerを動かしっぱなしにしていると、
KlausT-8.21-mod-r11 load averageが1.0(論理CPUコア1つ分)に収束
KlausT-8.21-mod-r13 load averageが4.0(全論理コア分)食いつぶす。
これのせいなのか、KlausT-8.21-mod-r13を動かしっぱなしにすると、およそ2日程でccminerが無応答になります。
(何も出力しなくなる。KlausT-8.21-mod-r11だと発生しない。)
888 :Xubuntuマイナーさん:2018/09/17 18:33:22 (6年前) 0MONA/0人
(つづき)
リソースを消費しているのは「kworker/x.x」(x.xは数字で毎回変わる)なので、
http://seesaawiki.jp/w/kou1okada/d/20171229: Linux - kworker CPU ٤
を参考にperfで確認したところ、「kworker/x.x」のシンボルは「_nv028680rm」となっていました。
889 :Xubuntuマイナーさん:2018/09/17 18:33:39 (6年前) 0MONA/0人
(つづき)
当方の環境は、
Intel P55 + Core i3 540(2C4T)
メモリ 4GB
GTX1060-3G 4枚
Linux xxxxxx 4.15.0-34-generic #37~16.04.1-Ubuntu SMP Tue Aug 28 10:44:06 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux
nvidiaドライバ: nvidia-396
CUDA: 9.2
です。何か解決のヒントを頂けないでしょうか?
宜しくお願いします。(連投すみません)
890 :MaineCoon一級:2018/09/19 14:57:57 (6年前) 0MONA/0人
いよいよRTX20xxシリーズの発売となりました。
皆様、ご予約はお済でしょうか?
私は金額的に手が出ないので様子見です。
マイニングへの影響を発売直前に好き勝手にエスパーしてみます。
ハッシュ(解)算出時間が短い方が良いものの、同時に炊けるスレッド数とのバランスが難しいので
SM数の変更が大きく影響してくると思います。
2080Tiは高額な割にワッパが悪そうなので不評に
2080(無印)や後発で出てくると思われる2070Tiなどの方が評判が良くなるとエスパー予想。
お金が無くて買えないから妬んでる訳では、、、訳では、、、ぐす
891 :名無し名誉名人教士:2018/09/19 15:57:57 (6年前) 0MONA/0人
>>890
TensorもRTコアも使わないし、CUDAコアもFloat演算用とInt演算用で分かれているので、消費電力はTDPより少なくなりそうです。
それなりのワッパが期待できるんじゃないかな?
ってか、CUDA10がまだ来ない…
これが来ないと、マイニングでRTXシリーズの性能を引き出せないんじゃないかと…
892 :あ熱帯います七段教士:2018/09/19 16:33:04 (6年前) 0MONA/0人
GeForce RTX 2080 GAMING X TRIO TIじゃないけど、予約価格¥123,800-(税別、送料込)で買えるけど、今の市場価格だとコスパはTIなしの方が良いですね。
これもCUDA10待ちですか?
893 :なむやん七段教士:2018/09/19 16:54:44 (6年前) 0MONA/0人
MinerとCoindやPoolとの間で交わされる通信について規格書はどこかにころがっていません?知りませんか?TCPのJSON-RPCだというのはわかっていますが
RequestとResponseの対応関係がわかると非常にありがたい....
894 :名無し名誉名人教士:2018/09/19 17:03:35 (6年前) 0MONA/0人
>>892
CUDA9.2では、Turingのコードが吐けないんだよ…
なので、Titan Vと同じコードを走らせることになるんだけど、TuringはGTX750/750TiやTesla P100のコードのほうが速くなりそうなんだよね…
これをどうするか…(無理すればできるとは思うが…)
あと、シェアードメモリの32kB、64kBの切り替えをどうするかが問題。Titan Vと同じやり方ならCUDA9.2でもいいんだけどね…
895 :MaineCoon一級:2018/09/19 17:18:42 (6年前) 0MONA/0人
>>891
表現を間違えてました。
×ワットパフォーマンス → 〇コストパフォーマンス
購入価格に対しての採掘量がイマイチなのは1080Ti以上になると思います。
しかし新しいCUDAで大化けするかも知れませんね。
今は亡きSA〇YO製のDVD制御チップでも組込みをやってましたが
こいつが
使わない回路を削除していないのでチップ自体が無駄にデカく
その部分に製造時に付着したゴミが悪さをしてくれたりと使えない子でした。
未使用部分にも電力とクロック供給しっぱなしだったみたい。。。
Nvidiaに限ってそんな事はありませんよね?
どうであれ、発売が楽しみです
896 :名無し名誉名人教士:2018/09/20 10:05:29 (6年前) 0MONA/0人
CUDA Toolkit 10.0 がキターーーーーーー!
帰ったら早速やってみます。
897 :名無し名誉名人教士:2018/09/20 10:39:13 (6年前) 0MONA/0人
CUDA Toolkit 10.0をザッと調べてみた。
①sm_75でTuring向けのコードを吐ける。
②シェアードメモリの切替はVoltaと同じ方式でいける。
③RTコアはCUDAでは使えないっぽい。
④TensorコアがINT4、INT8に拡張された………が、マイニング用途では使い道が無い。
⑤Ubuntu 18.04向けがダウンロードできるみたい。
とりあえず、インストールさえ何とかなれば行けるかな?
898 :ジョンタイター二段:2018/09/20 22:10:44 (6年前) 0MONA/0人
cuda toolkit 10 の具合はどうなってます?
やった方レポよろ~
899 :名無八段教士:2018/09/20 22:25:07 (6年前) 0MONA/0人
旧世代となったPascalちゃんのPCの環境がCUDA10世代になっても
9世代のマイナーは10に最適化されてないだけでとりあえずは動いているし
判断は10対応のマイナーが出揃ってからという
900 :名無し名誉名人教士:2018/09/20 22:47:13 (6年前) 0MONA/0人
Cuda10インストールできないwww
なぜかエラーで止まる…
と、いうわけで、CUDA9.2のまま無理矢理Turingに対応させてみた(環境がないので、動作確認はしていません)
KlausT-8.21-mod-r14-pre
https://1drv.ms/u/s!Aud1FauQ46vHh2B5NYbLOB2bQlOt
バイナリが3種類入っているので、RTXシリーズをお持ちの方、どれが速いか検証していただけないでしょうか?(できればr13との比較も)
901 :名無八段教士:2018/09/20 23:18:51 (6年前) 0MONA/0人
CUDAのインストールって何か良く分かんないけどへそ曲げますよね
バージョン上げるとかパッチ当てる時は毎回CUDAとGeforce関係全部uninstallして入れ直す儀式ですけどそれでもたまに止まってたりするという
902 :名無し名誉名人教士:2018/09/21 07:02:25 (6年前) 0MONA/0人
>>900はミスってた…
改めてTuring対応実験版をうpします。(相変わらず環境がないので、動作確認はしていません)
KlausT-8.21-mod-r14-pre2
https://1drv.ms/u/s!Aud1FauQ46vHh2F5NYbLOB2bQlOt
Turing対応の代償として、Voltaではうまく動かないと思う…
早くCUDA10環境を構築しないと…
903 :重久三級:2018/09/21 11:29:39 (6年前) 0MONA/0人
最新のグラフィックドライバがないと怒られるとかですかね?
904 :site三段:2018/09/23 11:21:02 (6年前) 0MONA/0人
いつの間にか960でも3MH/sくらい上がってた。やべぇ
905 :名無八段教士:2018/09/23 11:56:14 (6年前) 0MONA/0人
20が高くて品薄なので改めて10への駆け込み需要が急増してますな。
20が無ければ出来ないコトが現時点ではまだまだ限られますし。。
906 :あ熱帯います七段教士:2018/09/27 11:32:07 (6年前) 0MONA/0人
2080ti 本日27日発売だったんですが、02:00頃みたら完売でした(^^;
GeForce RTX 2080 Ti GAMING X TRIO [PCIExp 11GB] 194,279円(税別)
DUAL-RTX2080TI-O11G [PCIExp 11GB] 169,800円(税別)
amazon転売屋さんよりは安いけど、高いですね。
907 :名無し四段教士:2018/09/27 12:28:39 (6年前) 0MONA/0人
999ドルって話はどこにいったの(゜Д゜≡゜Д゜)?
908 :あ熱帯います七段教士:2018/09/27 17:55:47 (6年前) 0MONA/0人
999ドルは2080では?
GV-N2080WF3OC-8GC 118,980円(税別)
DUAL-RTX2080-O8G [PCIExp 8GB] 119,800円(税別)
GeForce RTX 2080 VENTUS 8G OC 119,800円(税別)
GV-N2080GAMING OC-8GC 121,980円(税別)
GeForce RTX 2080 GAMING X TRIO [PCIExp 8GB] 124,800円(税別)
こっちは全部買えます。↑ 送料込です。消費税別で1000円引き。
909 :名無し四段教士:2018/09/27 21:26:41 (6年前) 0MONA/0人
忘れちゃいけない過去報道
「RTX2080Tiは999$」
大切な事なのでもう一回言います。
「9月20日発売の予定で、価格はRTX2070が499ドル(約5万5000円)から、RTX2080が699ドルから、RTX2080 Tiが999ドルから。」
プラマイ10%以外では買わないぞ!!
910 :名無し四段教士:2018/09/27 21:28:36 (6年前) 0.00114114MONA/1人
すみません。「プラス10%以上なら買わないぞ!」の間違いでした。さーせん。
911 :あ熱帯います七段教士:2018/09/28 02:24:54 (6年前) 0MONA/0人
現地は20日でも、日本の発売未定。値段は予約販売価格$1,199、通常価格は$999になるというのが2018/08/20に発表されていますよ。https://www.engadget.com/2018/08/20/nvidias-rtx-2080ti/
912 :名無し四段教士:2018/09/28 07:35:13 (6年前) 0MONA/0人
ご祝儀相場が一段落したら999ドル付近で買えるようになりますように、米尼で。
913 :名無し名誉名人教士:2018/09/29 14:17:03 (6年前) 0.11525514MONA/2人
ようやくCUDA10でコンパイルできた…
KlausT-8.21-mod-r14-pre3
https://1drv.ms/u/s!Aud1FauQ46vHh2J5NYbLOB2bQlOt
これでTuringもVoltaもいけるんじゃないかな?
RTXシリーズを購入した方、動作確認をお願い致します。
(1/3モード、1/2モード、Regモード、の3タイプのファイルが入っています。)
でも、CUDA10を指定すると上手くいかなかった…
今回はCUDA9.2のTargetのまま、ディレクトリ指定を10.0のものに変えてやってみた…とりあえず、SM7.5も吐いてるみたいだから、大丈夫だよね?
914 :名無八段教士:2018/09/29 15:41:25 (6年前) 0.39MONA/1人
>>913
お疲れ様です。。CUDA10じゃじゃ馬ですね。
ターゲットではないGTX1050Tiなので肝心のRTX用の処理の確認は出来ないのですけど3つとも走ったのは確認しました。
5分で平均取ったらr13(15.48MH/s)やr14-pre2(15.29MH/s)よりr14-pre3(15.59MH/s)の方が若干ハッシュレートが高いという嬉しいおまけがありました。(PL:80%)
915 :名無し四段教士:2018/09/29 17:26:57 (6年前) 0MONA/0人
いつにたったら$999の通常化価格になるのやら。
カスクやその取り巻き連中にはウンザリですよ。。。
916 :site三段:2018/09/30 15:36:22 (6年前) 0MONA/0人
いいかんじ
https://imgur.com/64H7ub8
917 :Mr.招待人さん:2018/09/30 16:24:39 (6年前) 0MONA/0人
【仮想通貨、敗北経験者のみ限定】
本気で株式取引で月に300万以上稼ぎたい奴は連絡くれたら
極秘サイトへ無料招待するからマジで稼ぎたい奴だけ来い。
只、5人限定な。
virtualcurrency777stocktraders777@neko2.net
918 :名無し三級:2018/09/30 20:44:03 (6年前) 0MONA/0人
ここで公開されていた「ccminer-KlausT-8.21-mod-r13」をビルドしてbitzeny(yescryptr8)掘ってるんだけど、ハッシュが190H/sしか出てないんだけどこんなもんなの?
使用環境
OS : ubuntu18.04.1LTS
CUDA : CUDA9.1
CPU : C2D E8400
GPU : GTX650
Memory : 5GB
919 :名無し名誉名人教士:2018/09/30 21:07:26 (6年前) 0MONA/0人
>>918
GTX650なら、そのくらいじゃないかな?
920 :名無し三級:2018/09/30 21:25:12 (6年前) 0MONA/0人
>>919
C2Dの方がハッシュ出てるから疑問に思って聞いてみたんだけどそんなこともあるのか
921 :名無し四段教士:2018/10/02 17:43:20 (6年前) 0MONA/0人
>>920
RTX2080に換装するときが来たんですよ、きっと。一緒に値下がりを待ちましょう。
922 :名無し三級:2018/10/02 20:21:58 (6年前) 0MONA/0人
>>921
母艦のGTX1070で値下がりまで耐える。。。
923 :ジョンタイター二段:2018/10/03 07:16:01 (6年前) 0MONA/0人
1080 が値下がるのはいつだろうと小一時間。。。
924 :名無し二級:2018/10/05 10:40:41 (6年前) 0MONA/0人
1080がいつ下がるかとか2080tiはどうだとかなんかどうでもよくなってきた・・・
だってASIC出てきたっぽいもの・・・
とあるプールのトップ、48GHくらいある・・・
どう考えたってグラボ代回収できないよこれ。
925 :名無し侍二段:2018/10/05 12:41:49 (6年前) 0MONA/0人
RTX2080Tiびっくりするほど速いなぁ・・・
プールによって速度は変わるのだろうけど、PL50%で70MH/s台はすごいことなんではなかろうか・・・?
下手したら1080TiのPL90%クラスで採掘してるのを上回るからなぁ・・・
926 :リグ初心者初段:2018/10/05 13:26:30 (6年前) 0MONA/0人
PL50で70台って70後半?
うちの1080Tiさんはr13のPL60で73MH/s出てるけど・・・。
(OCモデルだからMAXの消費電力がリファレンスより高くて多めに出てるかもだけど)
2080Ti微妙な気がする。
消費電力の実測はどんなかんじなの?
927 :名無し侍二段:2018/10/05 15:17:59 (6年前) 0MONA/0人
>>92
70前半ですかねぇ
PC以外にも色々繋げているから電力に関してはなんともいえませんが、200wいくか行かないかって感じですね。(ワットチェッカー使ってましてこの時HDD使用していたのでちょっと消費電力高めに出てます)
マシン単体で余計な物をはずして、なんだかんだ消費電力下げれば、
180w~100wまで下げれるんじゃないかなぁとは思いますけどね。
1080よりちょっと消費電力減った感じでしょうか?
928 :名無し侍二段:2018/10/05 15:18:33 (6年前) 0MONA/0人
訂正1080PL70%クラスよりは多分減ってるはずです。
929 :名無し名誉名人教士:2018/10/05 20:24:41 (6年前) 0MONA/0人
>>928
できれば、mod-r14-pre3を試してみて欲しい(>>913)
1/3モード、1/2モード、Regモードのどれが速いか確認したいので…
(そもそも動作するかの確認もできていない…)
930 :名無し侍二段:2018/10/05 21:13:23 (6年前) 3.9MONA/1人
mod-r14-pre3 RTX2080Ti(ASUS)でやってみました。
ノーマル?無印は70MH/s前半(72~71前後)
ハーフは何故か動作せず?これは設定が悪かったのか?
Regは79~78MH/s前後で動作
いずれもアフターバーナーPL50%での動作ですね。
ccminer_Half.exe -a lyra2v2 (以下略
でいれているはずですが、なぜか動作せず
コピペして入れ替えたはずだが、なぜ動かないんだろうか?ドライバ更新来てたからそれしないとダメなのかな?
931 :名無し名誉名人教士:2018/10/05 21:38:09 (6年前) 0MONA/0人
>>930
1/2モードでは動作しない…ですか…
まあ、おそらく1/3モードの方が速いだろうけど。
それよりも、Regモードの方が速いのか…動作確認ありがとう!
932 :名無し名誉名人教士:2018/10/05 22:05:45 (6年前) 0MONA/0人
最適化結論
Kepler(CUDA8ならFermiも)⇒Regモード
Maxwell(1st Gen)⇒1/3モード
Maxwell(2st Gen)⇒1/2モード
Pascal(GP100)⇒Regモード
Pascal(other)⇒1/2モード
Volta⇒1/2モード
Turing⇒Regモード
これでr14を作ってみよう。
933 :名無し名誉名人教士:2018/10/05 23:39:30 (6年前) 0.114MONA/1人
動作報告があったので、作ってみた。
KlausT-8.21-mod-r14
https://1drv.ms/u/s!Aud1FauQ46vHh2R5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh2V5NYbLOB2bQlOt
更新内容(8.21-mod-r13⇒8.21-mod-r14)
・Turingに対応
・cubehashをちょっと改造。速くなった…のか?誤差の範囲のような気も…
934 :名無し四段教士:2018/10/06 14:19:59 (6年前) 0MONA/0人
今のところ次のような感じ?
GTX1080 50MH/s前後
RTX2080Ti 85MH/s前後
935 :ジョンタイター二段:2018/10/06 15:13:59 (6年前) 0MONA/0人
+1MH/sほど若干速くなったよ!?
これって、誤差範囲かぁ? でも気分的に早くなった気がするので良しとしようか!?
936 :リグ初心者初段:2018/10/06 21:44:41 (6年前) 0MONA/0人
>>933
乙
Driver 416.16
()内nvidiaInspector参照
r14 1080Ti PL100 lyra2v2 83MH/s (core 1800MHz Power 300W)
r14 1080Ti PL60 lyra2v2 73.4MH/s (core 1570MHz Power 180W)
r14 1080Ti PL50 lyra2v2 65.4MH/s (core 1420MHz Power 150W)
937 :名無し侍二段:2018/10/08 00:20:31 (6年前) 0MONA/0人
KlausT-8.21-mod-r14 RTX2080Ti(ASUS)
前回アフターバーナーPL50で79MH/s前後だったわけですが、
ついに80MH/sオーバーしちゃいましたよ。(めちゃはえー)
電力消費は確認してませんが・・・1080Tiとほぼ似たような状態でしかもRTX2080TiのPL50なら1080TiのPL100より大幅に消費電力削減になっているのでは・・・?
938 :名無し四段教士:2018/10/08 17:48:33 (6年前) 0MONA/0人
ワッパのRTX2080Ti
コスパのGTX1080Ti
939 :名無し名誉名人教士:2018/10/09 10:32:46 (6年前) 0MONA/0人
ここで、Fermiのために(というか、ソース整理のため)、一度CUDA8でビルドしてみようかね?
でも、WarpShuffle(Kepler以降)、FunnelShift(Kepler 2nd Gen以降)を使っているから、一通り見直しかける必要がありそう…
(特にYescryptやLyra2Zoinまわり、neoscryptにも使われてるっぽい…)
940 :名無し四段教士:2018/10/12 07:42:02 (6年前) 0MONA/0人
がんばって下さいー!数枚しかグラボないけど細々と掘ってます。
941 :名無し名誉名人教士:2018/10/14 09:31:45 (6年前) 0.0114114MONA/1人
Fermiに再度対応してみた。
KlausT-8.23-mod-r1
https://1drv.ms/u/s!Aud1FauQ46vHh2d5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh2Z5NYbLOB2bQlOt
更新内容(8.21-mod-r14⇒8.23-mod-r1)
・各アルゴリズムをFermiに対応。CUDA8で作ったので、運用する場合はそちらで…(動作未確認)
更新内容(KlausT-8.23⇒8.23-mod-r1)
・Monacoinのソロマイニングに対応。
・Lyra2REv2の高速化
・Lyra2Z、Lyra2Zoin(Lyra2z330)、yescrypt系に対応。ただし、Lyra2Zは他のマイナーの方が速いかな?
・NeoscryptをFermiで動くようにした。(動作未確認)
942 :名無し四段教士:2018/10/14 11:26:59 (6年前) 0MONA/0人
おつかれさまです! 来週にでも試してみたいと思います。
943 :名無し名誉名人教士:2018/10/14 13:46:41 (6年前) 0MONA/0人
>>942
速くはなってないと思うよ…
944 :リグ初心者初段:2018/10/14 14:13:45 (6年前) 0MONA/0人
>>941
乙
GTX580
yescrypt:
[2018-10-14 13:08:35] Using intensity 9.000 (512 threads)
GPU #0: Cuda error in func 'yescrypt_cpu_hash_32' at line 1253 : an illegal memory access was encountered.
[2018-10-14 13:08:40] Stratum connection interrupted
neoscrypt:
[2018-10-14 13:10:21] GPU #0: this gpu is not supported
[2018-10-14 13:10:21] Stratum connection interrupted
lyra2v2:
[2018-10-14 13:12:06] Using intensity 19.50 (786432 threads)
GPU #0: Cuda error in func 'bmw256_cpu_hash_32' at line 311 : an illegal memory access was encountered.
560Tiでも同様でした。
945 :名無し名誉名人教士:2018/10/14 17:41:37 (6年前) 0.004649MONA/1人
>>944
ああ、どれもうまくいってない…
ここまでうまくいかないと、動作環境から作って確認しないとな…
今週は出張なので、来週やってみるよ。
946 :名無し四段教士:2018/10/15 08:02:01 (6年前) 0MONA/0人
>>945
出張おつかれさまであります。
947 :名無し名誉名人教士:2018/10/20 13:40:18 (6年前) 0MONA/0人
WarpShuffleをミスってた…
修正したスクショがこちら(GT610にて300kH/s)
948 :名無し四段教士:2018/10/21 20:52:55 (6年前) 0MONA/0人
KlausT-8.21-mod-r14が調子よすぎるのでしばらくこのまま使用させていただきます。
時間の都合で新しいの試せなかったですスミマセン。
949 :名無し名誉名人教士:2018/10/22 06:05:57 (6年前) 0MONA/0人
>>948
基本的には同じコードですよ
ただ、Fermi向けはバグだらけみたいで…
950 :名無し名誉名人教士:2018/10/22 09:20:50 (6年前) 0MONA/0人
Fermi現状確認
Lyra2REv2:簡単なミスだったみたい。直したら動いた。
neoscrypt:"this gpu is not supported"メッセージは消せる。でも、その場合、"an illegal memory access was encountered"が出て正常に走らない…
yescrypt:"an illegal memory access was encountered"が出て正常に走らない…
Lyra2Zoin(その他Lyra系):試してないけど、たぶん"an illegal memory access was encountered"が出るんだろうな…
どうも、メモリを大量に使うアルゴリズムでエラーが出るみたいだね…
メモリアクセスを見直さないと…
("unspecified launch failure"じゃなくて良かった…かな?)
951 :名無し名誉名人教士:2018/10/24 14:59:28 (6年前) 0MONA/0人
>>950
改めて現状報告
・Lyra2REv2は問題なく動作した。
・neoscrypt,yescrypt,Lyra2Zoin(その他Lyra系)はFermiでシェアードメモリを確保していなかったためエラーを出していた。
WarpShuffle命令がないため、シェアードメモリで代用していたんだが、そもそも確保していなければエラーを吐くしかないわな…
・ついでにneoscryptの高速化案を思いついたので実行中。
GT610 5.1kH/s⇒10.3kH/sに高速化した。その他ではまだ試していない。
ってか、そもそもneoscryptでまともに使えるプールを知らないwww
952 :pecadol.pool三級:2018/10/24 16:33:36 (6年前) 0.039MONA/1人
なんかneoscryptとかみえたんで
https://pool.pecadol.xyz/
neoscryptで出たばっかのコインCryptoPlay追加しました。
<https://bitcointalk.org/index.php?topic=5054678.0>
-a neoscrypt -o stratum+tcp://pool.pecadol.xyz:4233 -u <CTP_WALLET_ADDRESS> -p c=CTP
953 :名無し名誉名人教士:2018/10/24 21:52:02 (6年前) 0MONA/0人
GT610でyescryptr8⇒54.5H/s
めっちゃ遅い…
954 :名無し名誉名人教士:2018/10/24 22:17:16 (6年前) 0MONA/0人
GT610でLyra2Z330⇒55.1H/s
とりあえず、一通りは試せたかな?
955 :名無し名誉名人教士:2018/10/25 08:53:22 (6年前) 0MONA/0人
GT610で一通り動いたので、ほかで動かそうとしたら、GTX1060でうまくいかなかった。neoscryptで正しい数値が出ないようだ…
align無視の読み込みをFunnelShiftを使っているんだが、ずらし無しのとき(ソース内ではbitbuf=0のとき、FunnelShiftではshift=32として扱う)に計算ミスしているんだよね…
なお、Fermiでは正常動作したので、多分、ここだと思うんだけど…
うpはもうちょっとだけ待ってほしい…
956 :名無し名誉名人教士:2018/10/25 09:59:25 (6年前) 0MONA/0人
>>955の問題、原因を見つけた。
__funnelshift_r()関数を使っているのですが、これの説明を見ると…
Concatenate hi : lo, shift right by shift & 31 bits, return the least significant 32 bits.
と書いてあった。
どうやらshift=32にすると、32ビットシフトするのではなく、シフト無しの動作をするようだ…
この影響で、bitbuf=0のとき、上位32bitが欲しいのに、下位32bitが返ってくる事態に…
__funnelshift_rc()関数なら、
Concatenate hi : lo, shift right by min(shift, 32) bits, return the least significant 32 bits.
と書いてあるので、shift=32のときに、32ビットシフトするので大丈夫っぽいね。これに書き換えるよ。
957 :名無し名誉名人教士:2018/10/25 11:34:46 (6年前) 0MONA/0人
Voltaについてちょっと勘違いしていた…
今まで、Voltaは128コア/SM×40SM=5120コアだと思っていた。
だけど、よく調べてみると、64コア/SM×80SM=5120コアらしい。
これって、Pascal(GP100)、Turingに近い構成なんだね…
ってことは、Lyra2REv2の最適化手法も間違っていたことになる。
VoltaもPascal(GP100)、Turingと同じくRegモードのほうがいいのかもしれない。
(シェアードメモリがTuringの1.5倍あるので、なんともいえない。環境がないので試せない…)
958 :名無し名誉名人教士:2018/10/25 23:09:39 (6年前) 0.0001MONA/1人
one driveがいっぱいになったので、古いデータは退避しました。
具体的には、1.8以前のデータはダウンロードできなくなっています。
959 :名無し名誉名人教士:2018/10/26 06:25:27 (6年前) 0.01255254MONA/2人
Fermiで動作確認&修正しました。
KlausT-8.23-mod-r1-fix
https://1drv.ms/u/s!Aud1FauQ46vHh2l5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh2h5NYbLOB2bQlOt
更新内容(8.23-mod-r1⇒8.23-mod-r1-fix)
・各アルゴリズムをFermiのバグを修正。
・neoscryptを高速化(ローカルメモリを排除したので、速くなっていると思うよ。多分。)
・VoltaにおけるLyra2REv2の最適化。Turingと同じRegモードに変更
960 :名無し名誉名人教士:2018/10/26 06:31:25 (6年前) 0MONA/0人
>>960 追記
ついでにneoscryptの初期値選択をLyra2REv2と同じ方式に変更。未知のGPUにもとりあえず対応できるようにした。
yescryptとLyra2Z330はメモリ量で初期値を選択しているので、そのままでもいいかな?
961 :名無し名誉名人教士:2018/10/26 06:32:03 (6年前) 0MONA/0人
おっと、安価ミスwww
>>959ですね。
962 :リグ初心者初段:2018/10/26 13:03:14 (6年前) 0MONA/0人
>>959
おつ
うちの環境だけかもしれませんが、
KlausT-8.23-mod-r1-fixをGTX580と560Tiで回したところ、ハッシュ計算するけど、1回目のログが表示された瞬間落ちます。
各アルゴ試しましたが全部同様。
963 :名無し名誉名人教士:2018/10/27 09:37:13 (6年前) 0MONA/0人
>>962
うーん、どうも8.23で起こる現象みたい…
8.21に戻してやってみるか?
964 :名無し名誉名人教士:2018/10/27 11:48:45 (6年前) 0.003939MONA/1人
8.23は断念。8.21で作り直し。
KlausT-8.21-mod-r15
https://1drv.ms/u/s!Aud1FauQ46vHh2t5NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh2p5NYbLOB2bQlOt
更新内容(8.23-mod-r1-fix⇒8.21-mod-r15)
・開発ベースを8.21に戻した。
更新内容(8.21-mod-r14-fix⇒8.21-mod-r15)
・各アルゴリズムをFermiに対応。CUDA8で作ったので、運用する場合はそちらで…
・neoscryptを高速化(若干?)
・VoltaにおけるLyra2REv2の最適化。Turingと同じRegモードに変更
965 :リグ初心者初段:2018/10/27 17:16:47 (6年前) 0MONA/0人
>>964
乙
GTX570にて10分放置で問題ないこと確認しました。
966 :7743一級:2018/10/28 11:07:54 (6年前) 0MONA/0人
KlausT-8.21-mod-r15をソースからbuildしてみたのですが
./neoscryptの下に
cuda_neoscrypt_tpruvot.cu
cuda_vector_tpruvot.cuh
cuda_vector_uint2x4.cuh
が無いと叱られます。
r14からコピーしてみましたが、通りませんでした。
967 :名無し名誉名人教士:2018/10/28 12:12:34 (6年前) 0.0039MONA/1人
>>966
linux向けの修正を忘れてた
Makefile.amから
cuda_neoscrypt_tpruvot.cu
cuda_vector_tpruvot.cuh
cuda_vector_uint2x4.cuh
の記述を消してください。
これらのファイルは不要になりました。
968 :7743一級:2018/10/28 14:07:37 (6年前) 0MONA/0人
ご教示ありがとうございました。
無事buildできました。
969 :mydreamさん:2018/10/28 22:45:52 (6年前) 0MONA/0人
>>964
初めまして
まさかのGT1030で実行できました!
プールサイトから見ても正常に動いてるようです
ありがとうございます
970 :名無し名誉名人教士:2018/10/28 23:48:18 (6年前) 0.1MONA/1人
neoscryptが納得いかなかったので、改造してみた。
KlausT-8.21-mod-r16
https://1drv.ms/u/s!Aud1FauQ46vHh215NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh2x5NYbLOB2bQlOt
更新内容(8.21-mod-r15⇒8.21-mod-r16)
・neoscryptでMaxwell以降のコードを変えてみた。
lyra2系と同様の4-way分割を一旦やめてみたら(1-way化)、速くなった。
ただ、当初はGTX1080でパフォーマンスが出なかったことに起因する修正だったので、これでGTX1080以降が遅くなる懸念もある。
・neoscryptでL1キャッシュを使ってみた。
グローバルメモリへの読み書きをL1キャッシュを通すよう、明示的に指示するようにした。4-way分割では微妙な変化だが、1-wayでは効果がありそう。
971 :名無し名誉名人教士:2018/10/29 06:18:56 (6年前) 0MONA/0人
>>970
更新内容追加
・Linux向けにMakefile.amを修正
arch=compute_70,code=sm_70の追加と、neoscryptで要らなくなったファイルの削除を実施した。(>>967の修正)
972 :名無し名誉名人教士:2018/10/29 06:34:54 (6年前) 0.002MONA/1人
neoscryptパフォーマンス考察
1-wayと4-wayでの違いを考える。
1.シェアードメモリ使用の際のデータ使用量が1/4になる
2.1度にアクセスするメモリ量が少ない
3.演算にWarpShuffleを使うため、同期に時間がかかる。
この中で1.はシェアードメモリを使用していないので恩恵なし。
2.はGTX1080でパフォーマンス改善の主要因だと思う。
3.はLyra系の場合は演算が少ないため影響は少ない。しかし、neoscryptでは演算が多いため、速度低下の要因にもなりかねない。
こうやってまとめると、4-wayのメリットが薄いな…
973 :名無し名誉名人教士:2018/10/29 08:42:38 (6年前) 0.002MONA/1人
neoscryptパフォーマンス考察 その2
L1キャッシュの利用を考える。
Kepler以降、L1キャッシュはローカルメモリのみ働き、グローバルメモリでは無効となっている。(L2キャッシュは有効)
そのため、48kB(Maxwellは24kB)のL1キャッシュが使えていなかった。
今回(r15,r16)、グローバルメモリアクセスを明示的にL1キャッシュを経由する命令に置き換えた(インラインアセンブラ使用)。
効果としては、①書き込みと演算を同時進行させる、②一度読み書きしたデータの再利用の高速化、が期待できる。
ここで、1-wayでは演算量が4倍の時間がかかるため、①の同時進行の効果が大きい。
また、1-wayでは1スレッドあたりのメモリアクセス量が大きくなるので、②のデータの再利用の効率も高くなる。(1スレッドでメモリアドレスが連続していることが望ましい)
>>972と併せて、Maxwell以降で1-wayに変更した。なお、Kepler以前ではL1キャッシュが遅いためか、4-wayの方が速かったので、4-wayのままにしている。
974 :7743一級:2018/10/29 11:15:39 (6年前) 0MONA/0人
configureファイルが作成されず、buildが進みません。
r16-srcですが、Makefile.am 64行目行末の"\"が不要のようです。
削除して只今build中。
さて、無事に通るかな?
975 :7743一級:2018/10/29 12:10:32 (6年前) 0MONA/0人
無事通りました。
976 :リグ初心者初段:2018/10/29 13:44:23 (6年前) 0.39MONA/1人
>>970
乙
neoscrypt@1080Ti
r15
1515kH/s
r16
620kH/s
という感じで速度落ち込みました。
977 :名無し名誉名人教士:2018/10/29 18:35:50 (6年前) 0MONA/0人
>>976
速度が落ちたか…
GTX1060は速くなったんだけどな…
原因究明できるかなー?
978 :名無し名誉名人教士:2018/10/30 00:49:26 (6年前) 0MONA/0人
とりあえず現状報告
シェアードメモリを(無駄に)48kB確保したら速くなった。(GTX1080Tiで1730kH/s)
だけどGTX1060で若干遅くなった…
どうしろと?
979 :名無し名誉名人教士:2018/10/30 11:31:11 (6年前) 0MONA/0人
neoscryptの動作状況
GTX1080Ti(SharedMemoryなし⇒16warp起動):600kH/sくらい
GTX1080Ti(SharedMemory32kB⇒12warp起動):900kH/sくらい
GTX1080Ti(SharedMemory48kB⇒8warp起動):1730kH/sくらい
GTX1060(SharedMemoryなし⇒16warp起動):750kH/sくらい
GTX1060(SharedMemory32kB⇒12warp起動):700kH/sくらい
GTX1060(SharedMemory48kB⇒8warp起動):600kH/sくらい
たぶん、L2キャッシュが関係しているんじゃないかな?
980 :名無し名誉名人教士:2018/10/30 11:39:52 (6年前) 0MONA/0人
GTX1080Tiは3584コア(28SM×128コア/SM)、L2キャッシュ2.75MBの構成となっている。
・SharedMemory無しの場合、16warp起動する。1warp=32スレッド/SMで、28SMなので、14336スレッドを1度に動作する。
1スレッドあたり256バイト同時に書き込むため、256バイト×14336スレッド=3.5MB となり、L2キャッシュからあふれてしまう。
(256バイト×128ループすべてをキャッシュに収めるのは当然不可能)
・SharedMemory32kBの場合、12warp起動するため、10752スレッドを1度に動作する。
1スレッドあたり256バイト同時に書き込むため、256バイト×10752スレッド=2.625MB となり、L2キャッシュに一応収まる。
・SharedMemory48kBの場合、8warp起動するため、7168スレッドを1度に動作する。
1スレッドあたり256バイト同時に書き込むため、256バイト×7168スレッド=1.75MB となり、L2キャッシュに十分収まる。
981 :名無し名誉名人教士:2018/10/30 11:47:44 (6年前) 0MONA/0人
GTX1060は1280コア(10SM×128コア/SM)、L2キャッシュ2MBの構成となっている。
・SharedMemory無しの場合、16warp起動するため、5120スレッドを1度に動作する。
1スレッドあたり256バイト同時に書き込むため、256バイト×5120スレッド=1.25MB となり、L2キャッシュに収まる。
GTX1070は1920コア(15SM×128コア/SM)、L2キャッシュ2MBの構成となっている。
・SharedMemory無しの場合、16warp起動するため、7680スレッドを1度に動作する。
1スレッドあたり256バイト同時に書き込むため、256バイト×7680スレッド=1.875MB となり、L2キャッシュにギリギリ収まる。
このあたりが境界線かな?
982 :名無し名誉名人教士:2018/10/30 11:51:37 (6年前) 0MONA/0人
どうも、L2キャッシュに余裕を見込まないと速度が落ちるみたいだね…
とりあえず、L2キャッシュサイズをcudaDevAttrL2CacheSizeで取得できるみたいだし、L2キャッシュ2割減でシェアードメモリ(ダミー)を検討してみようかね?
983 :ジョンタイター二段:2018/10/30 12:00:22 (6年前) 0MONA/0人
トピックタイトルに違和感を感じた小一時間
984 :名無し名誉名人教士:2018/10/30 13:34:45 (6年前) 0MONA/0人
>>983
ソロマイニングには一応対応しているんだけどな。
まあ、今は高速化に傾倒しているが…
985 :名無し名誉名人教士:2018/10/30 13:41:57 (6年前) 0MONA/0人
>>973 の検討でKeplerの見解は違ったようだ。
当方で確認したGT710では、192コア、L2キャッシュ128kBとのこと。>>981と同様の検討をすると…
SharedMemoryなしで18warp起動する。(32×18=576スレッド)
256バイト×576スレッド=144kBとなり、L2キャッシュからあふれてしまう。
SharedMemoryを約5kB確保すれば、12warp起動するので、(16kB×3≒5461バイト)
256バイト×384スレッド=96kBとなり、L2キャッシュに収まる…かな?
986 :ジョンタイター二段:2018/10/30 13:46:26 (6年前) 0MONA/0人
>>984
トピックタイトルの下(副題?)の事を言いたかった・・・
旨い書き方ができなくてすまん(*- -)(*_ _)ペコリ
987 :名無し名誉名人教士:2018/10/30 14:10:56 (6年前) 0MONA/0人
>>986
とりあえず、neoscryptがうまくいったら書き換える。
現状はGTX1060、GTX1050Ti、GTX1050、GTX1030、GTX950、GTX750Ti、GTX750ではr16、それ以外はr15が速いかな?(Kepler,Fermiは変わらず)
988 :名無し名誉名人教士:2018/10/30 20:34:57 (6年前) 0MONA/0人
989 :名無し名誉名人教士:2018/10/30 21:17:54 (6年前) 0MONA/0人
990 :名無し名誉名人教士:2018/10/30 22:28:12 (6年前) 0.002MONA/1人
neoscryptはこれでいいなか?
KlausT-8.21-mod-r17
https://1drv.ms/u/s!Aud1FauQ46vHh295NYbLOB2bQlOt
ソースはこちら
https://1drv.ms/u/s!Aud1FauQ46vHh255NYbLOB2bQlOt
更新内容(8.21-mod-r16⇒8.21-mod-r17)
・neoscryptでダミーのシェアードメモリを確保して、L2キャッシュを有効利用できるように調整。
991 :名無し名誉名人教士:2018/10/30 22:33:44 (6年前) 0MONA/0人
次スレ
【マイナー必見】ソロマイニングに対応したよ【高速化Part5】
https://askmona.org/11245
992 :名無し名誉名人教士:2018/10/31 06:31:23 (6年前) 0MONA/0人
最後にハッシュレートまとめ(Lyra2REv2)
GTX1060(1280コア、Boost 1847MHz)で30.4MH/sだったので、
GTX1080Ti:30.4MH/s×(3584/1280)×(1582/1847)=72.9MH/s
GTX1080:30.4MH/s×(2560/1280)×(1733/1847)=57.0MH/s
GTX1070Ti:30.4MH/s×(2432/1280)×(1683/1847)=52.6MH/s
GTX1070:30.4MH/s×(1920/1280)×(1683/1847)=41.6MH/s
GTX1060(6GB):30.4MH/s×(1280/1280)×(1708/1847)=28.1MH/s
GTX1060(3GB):30.4MH/s×(1152/1280)×(1708/1847)=25.3MH/s
GTX1050Ti:30.4MH/s×(768/1280)×(1392/1847)=13.7MH/s
GTX1050(3GB):30.4MH/s×(768/1280)×(1518/1847)=15.0MH/s
GTX1050(2GB):30.4MH/s×(640/1280)×(1455/1847)=12.0MH/s
993 :名無し名誉名人教士:2018/10/31 06:31:50 (6年前) 0MONA/0人
>>992 つづき
GTX980Ti:30.4MH/s×(2816/1280)×(1075/1847)=38.9MH/s
GTX980:30.4MH/s×(2048/1280)×(1216/1847)=32.0MH/s
GTX970:30.4MH/s×(1664/1280)×(1178/1847)=25.2MH/s
GTX960:30.4MH/s×(1024/1280)×(1178/1847)=15.5MH/s
GTX950:30.4MH/s×(768/1280)×(1188/1847)=11.7MH/s
GTX750(512コア、Boost 1137MHz)で7.64MH/sだったので、
GTX750Ti:7.64MH/s×(640/512)×(1085/1137)=9.11MH/s
GTX750:7.64MH/s×(512/512)×(1085/1137)=7.29MH/s
994 :名無し名誉名人教士:2018/10/31 06:32:30 (6年前) 0MONA/0人
>>993 つづき
NVIDIA TITAN Xp:30.4MH/s×(3840/1280)×(1582/1847)=78.1MH/s
NVIDIA TITAN X:30.4MH/s×(3584/1280)×(1531/1847)=70.6MH/s
GTX Titan X:30.4MH/s×(3072/1280)×(1075/1847)=42.5MH/s
GT710(192コア、954MHz)で1.06MH/sだったので、
GTX Titan Z:1.06MH/s×(5760/192)×(876/954)=23.5MH/s
GTX Titan Black:1.06MH/s×(2880/192)×(980/954)=16.3MH/s
GTX Titan:1.06MH/s×(2688/192)×(876/954)=13.6MH/s
995 :名無し名誉名人教士:2018/10/31 06:32:58 (6年前) 0MONA/0人
>>994 つづき
GT710:1.06MH/s
GT720:1.06MH/s×(192/192)×(797/954)=885kH/s
GT730:1.06MH/s×(384/192)×(902/954)=2.00MH/s
GT740:1.06MH/s×(384/192)×(993/954)=2.21MH/s
GTX760:1.06MH/s×(1152/192)×(1033/954)=6.89MH/s
GTX770:1.06MH/s×(1536/192)×(1085/954)=9.64MH/s
GTX780:1.06MH/s×(2304/192)×(900/954)=12.0MH/s
GTX780Ti:1.06MH/s×(2880/192)×(928/954)=15.5MH/s
996 :名無し名誉名人教士:2018/10/31 06:33:41 (6年前) 0MONA/0人
>>995 つづき
GT630:1.06MH/s×(384/192)×(902/954)=2.00MH/s
GT640(旧):1.06MH/s×(384/192)×(900/954)=2.00MH/s
GT640(新):1.06MH/s×(384/192)×(1046/954)=2.32MH/s
GTX650:1.06MH/s×(384/192)×(1058/954)=2.35MH/s
GTX650Ti:1.06MH/s×(768/192)×(928/954)=4.12MH/s
GTX660:1.06MH/s×(960/192)×(1033/954)=5.74MH/s
GTX660Ti:1.06MH/s×(1344/192)×(980/954)=7.62MH/s
GTX670:1.06MH/s×(1344/192)×(980/954)=7.62MH/s
GTX680:1.06MH/s×(1536/192)×(1058/954)=9.40MH/s
GTX690:1.06MH/s×(3072/192)×(1019/954)=18.1MH/s
997 :名無し名誉名人教士:2018/10/31 06:34:10 (6年前) 0MONA/0人
>>997 つづき
RTX2080Ti(PL50、4352コア、1220MHz)で78.5MH/sだったので、
RTX2080Ti:78.5MH/s×(4352/4352)×(1545/1220)=99.4MH/s
RTX2080:78.5MH/s×(2944/4352)×(1710/1220)=74.4MH/s
RTX2070:78.5MH/s×(2304/4352)×(1620/1220)=55.2MH/s
Titan V:78.5MH/s×(5120/4352)×(1455/1220)=110.1MH/s
998 :名無し名誉名人教士:2018/10/31 06:34:50 (6年前) 0MONA/0人
999 :名無し四段教士:2018/10/31 08:28:40 (6年前) 0MONA/0人
>>998
乙カレー&埋め
1000 :名無し六段教士:2018/10/31 16:31:57 (6年前) 0MONA/0人
>>998
乙です&1000踏み踏み
1001 :
このトピックは1000を超えました。もう書けないので、新しいトピックを作ってくださいです。。。
お気に入り
新規登録してMONAをもらえた
本サイトはAsk Mona 3.0に移行しましたが、登録すると昔のAsk Monaで遊ぶことができます。