とりあえず実用レベルに
CRSはとりあえず実用レベルまでは高速化しました.
- 予め値が入りそうな場所に入れ物を作っておく
- 予測が外れて何もないところにアクセスしようとしたら普通に作る
- 完成した時点で0が入った要素を検索して取り除く
という方式で実装.
ついでにマトリックスが明らかに密になる部分は,一度にまとめて確保.配列のコピーはBLASルーチンを使うなど重箱の隅を最適化し続けてようやっとまともな時間で動くようになりました.とりあえずBLASが速すぎる.
投稿者 | CASPAR003 |
投稿時刻 | 00:11 |
カテゴリー | 雑記 |
コメント | 0 件 |
トラックバック | 0 件 |
記事へのリンク | http://www.caspar003.info/delta/archive/2011/10/30/0011.html |
コメント
- 投稿者
トラックバック
- トラックバック