00001
00002
00003
00004
00005
00006
00007 #include <typeinfo>
00008
00009 #ifndef SIZE
00010 #define SIZE 1000000
00011 #endif
00012
00013 #ifndef NNZPERCOL
00014 #define NNZPERCOL 6
00015 #endif
00016
00017 #ifndef REPEAT
00018 #define REPEAT 1
00019 #endif
00020
00021 #include <algorithm>
00022 #include "BenchTimer.h"
00023 #include "BenchSparseUtil.h"
00024
00025 #ifndef NBTRIES
00026 #define NBTRIES 1
00027 #endif
00028
00029 #define BENCH(X) \
00030 timer.reset(); \
00031 for (int _j=0; _j<NBTRIES; ++_j) { \
00032 timer.start(); \
00033 for (int _k=0; _k<REPEAT; ++_k) { \
00034 X \
00035 } timer.stop(); }
00036
00037
00038
00039
00040
00041
00042
00043
00044
00045
00046
00047
00048
00049
00050
00051
00052
00053
00054
00055
00056
00057
00058
00059
00060
00061
00062 #ifdef CSPARSE
00063 cs* cs_sorted_multiply(const cs* a, const cs* b)
00064 {
00065
00066
00067 cs* A = cs_transpose(a, 1);
00068 cs* B = cs_transpose(b, 1);
00069 cs* D = cs_multiply(B,A);
00070 cs_spfree (A) ;
00071 cs_spfree (B) ;
00072 cs_dropzeros (D) ;
00073 cs* C = cs_transpose (D, 1) ;
00074 cs_spfree (D) ;
00075 return C;
00076
00077
00078
00079
00080 }
00081
00082 cs* cs_sorted_multiply2(const cs* a, const cs* b)
00083 {
00084 cs* D = cs_multiply(a,b);
00085 cs* E = cs_transpose(D,1);
00086 cs_spfree(D);
00087 cs* C = cs_transpose(E,1);
00088 cs_spfree(E);
00089 return C;
00090 }
00091 #endif
00092
00093 void bench_sort();
00094
00095 int main(int argc, char *argv[])
00096 {
00097
00098
00099 int rows = SIZE;
00100 int cols = SIZE;
00101 float density = DENSITY;
00102
00103 EigenSparseMatrix sm1(rows,cols), sm2(rows,cols), sm3(rows,cols), sm4(rows,cols);
00104
00105 BenchTimer timer;
00106 for (int nnzPerCol = NNZPERCOL; nnzPerCol>1; nnzPerCol/=1.1)
00107 {
00108 sm1.setZero();
00109 sm2.setZero();
00110 fillMatrix2(nnzPerCol, rows, cols, sm1);
00111 fillMatrix2(nnzPerCol, rows, cols, sm2);
00112
00113
00114
00115 #ifdef DENSEMATRIX
00116 {
00117 std::cout << "Eigen Dense\t" << nnzPerCol << "%\n";
00118 DenseMatrix m1(rows,cols), m2(rows,cols), m3(rows,cols);
00119 eiToDense(sm1, m1);
00120 eiToDense(sm2, m2);
00121
00122 timer.reset();
00123 timer.start();
00124 for (int k=0; k<REPEAT; ++k)
00125 m3 = m1 * m2;
00126 timer.stop();
00127 std::cout << " a * b:\t" << timer.value() << endl;
00128
00129 timer.reset();
00130 timer.start();
00131 for (int k=0; k<REPEAT; ++k)
00132 m3 = m1.transpose() * m2;
00133 timer.stop();
00134 std::cout << " a' * b:\t" << timer.value() << endl;
00135
00136 timer.reset();
00137 timer.start();
00138 for (int k=0; k<REPEAT; ++k)
00139 m3 = m1.transpose() * m2.transpose();
00140 timer.stop();
00141 std::cout << " a' * b':\t" << timer.value() << endl;
00142
00143 timer.reset();
00144 timer.start();
00145 for (int k=0; k<REPEAT; ++k)
00146 m3 = m1 * m2.transpose();
00147 timer.stop();
00148 std::cout << " a * b':\t" << timer.value() << endl;
00149 }
00150 #endif
00151
00152
00153 {
00154 std::cout << "Eigen sparse\t" << sm1.nonZeros()/(float(sm1.rows())*float(sm1.cols()))*100 << "% * "
00155 << sm2.nonZeros()/(float(sm2.rows())*float(sm2.cols()))*100 << "%\n";
00156
00157 BENCH(sm3 = sm1 * sm2; )
00158 std::cout << " a * b:\t" << timer.value() << endl;
00159
00160
00161
00162
00163
00164
00165
00166
00167
00168
00169
00170
00171
00172
00173
00174
00175
00176
00177
00178
00179
00180
00181
00182
00183 }
00184
00185
00186
00187
00188
00189
00190
00191
00192
00193
00194
00195
00196
00197
00198
00199
00200
00201
00202
00203
00204
00205
00206
00207
00208
00209
00210
00211
00212
00213
00214
00215
00216
00217
00218
00219
00220
00221
00222
00223
00224 #ifdef CSPARSE
00225 {
00226 std::cout << "CSparse \t" << nnzPerCol << "%\n";
00227 cs *m1, *m2, *m3;
00228 eiToCSparse(sm1, m1);
00229 eiToCSparse(sm2, m2);
00230
00231
00232
00233
00234 BENCH(
00235 {
00236 m3 = cs_sorted_multiply(m1, m2);
00237 if (!m3)
00238 {
00239 std::cerr << "cs_multiply failed\n";
00240
00241 }
00242
00243 cs_spfree(m3);
00244 }
00245 );
00246
00247 std::cout << " a * b:\t" << timer.value() << endl;
00248
00249
00250
00251 }
00252 #endif
00253
00254 #ifndef NOUBLAS
00255 {
00256 std::cout << "ublas\t" << nnzPerCol << "%\n";
00257 UblasMatrix m1(rows,cols), m2(rows,cols), m3(rows,cols);
00258 eiToUblas(sm1, m1);
00259 eiToUblas(sm2, m2);
00260
00261 BENCH(boost::numeric::ublas::prod(m1, m2, m3););
00262
00263
00264
00265
00266
00267 std::cout << " a * b:\t" << timer.value() << endl;
00268 }
00269 #endif
00270
00271
00272 #ifndef NOGMM
00273 {
00274 std::cout << "GMM++ sparse\t" << nnzPerCol << "%\n";
00275 GmmDynSparse gmmT3(rows,cols);
00276 GmmSparse m1(rows,cols), m2(rows,cols), m3(rows,cols);
00277 eiToGmm(sm1, m1);
00278 eiToGmm(sm2, m2);
00279
00280 timer.reset();
00281 timer.start();
00282 for (int k=0; k<REPEAT; ++k)
00283 gmm::mult(m1, m2, gmmT3);
00284 timer.stop();
00285 std::cout << " a * b:\t" << timer.value() << endl;
00286
00287
00288
00289
00290
00291
00292
00293
00294
00295
00296
00297
00298
00299
00300
00301
00302
00303
00304
00305
00306
00307
00308
00309
00310
00311
00312
00313
00314
00315 }
00316 #endif
00317
00318
00319 #ifndef NOMTL
00320 {
00321 std::cout << "MTL4\t" << nnzPerCol << "%\n";
00322 MtlSparse m1(rows,cols), m2(rows,cols), m3(rows,cols);
00323 eiToMtl(sm1, m1);
00324 eiToMtl(sm2, m2);
00325
00326 timer.reset();
00327 timer.start();
00328 for (int k=0; k<REPEAT; ++k)
00329 m3 = m1 * m2;
00330 timer.stop();
00331 std::cout << " a * b:\t" << timer.value() << endl;
00332
00333
00334
00335
00336
00337
00338
00339
00340
00341
00342
00343
00344
00345
00346
00347
00348
00349
00350
00351
00352
00353 }
00354 #endif
00355
00356 std::cout << "\n\n";
00357 }
00358
00359 return 0;
00360 }
00361
00362
00363