Donate To Seti@HomeSeti@Home optimized science apps and information
 
Welcome, Guest. Please login or register.
18 Jun 2013, 10:32:32 pm

Login with username, password and session length
 
» Home
» Forums
» Downloads
» FAQ
» News

» Search site
 
 
 
If you've registered already but never got your activation email, please click here.
 
 
Seti@Home optimized science apps and information  |  Optimized Seti@Home apps  |  Discussion Forum  |  Topic: AVX Optimized App Development 0 Members and 0 Guests are viewing this topic. « previous next »
Pages: 1 ... 7 8 [9] 10 11 Go Down Print
Author Topic: AVX Optimized App Development  (Read 34931 times)
PatrickV2
Knight o' The Round Table
***
Offline Offline

Posts: 136



Re: AVX Optimized App Development
« Reply #120 on: 15 May 2012, 01:13:54 pm »

I will have an Ivy Bridge i7-3770 based PC (Z77 mainboard) available for a (short) while in the near future.

Is there any interest in running this benchmark/test-tool on that config?

Regards, Patrick.
Logged
Josef W. Segur
Janitor o' the Board
Knight who says 'Ni!'
*****
Offline Offline

Posts: 2551


Re: AVX Optimized App Development
« Reply #121 on: 15 May 2012, 11:07:29 pm »

Yes, please! The broader the range of systems tested the better. If you'd run both the J45 test attached to message 37870 and whatever the latest Chirponly version is at that time, it would be a help.
                                                                Joe
Logged
Josef W. Segur
Janitor o' the Board
Knight who says 'Ni!'
*****
Offline Offline

Posts: 2551


Re: AVX Optimized App Development
« Reply #122 on: 16 May 2012, 11:24:49 am »

The FMA4 a variant produced about a 5% speedup by reducing the number of floating point instructions in the inner loop by ~11%. That's good, but confirms that getting the data transferred still needs improvement. For J51 I'm trying the TLB priming again, but without block prefetching. The i variant for AVX is modified from the h variant, and the changes were merged to the b variant for AVX+FMA4.

Edit: Attachment removed, see later post for current version
                                                         Joe
« Last Edit: 18 May 2012, 07:52:25 pm by Josef W. Segur » Logged
arkayn
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 1066


Aaaarrrrgggghhhh


WWW
Re: AVX Optimized App Development
« Reply #123 on: 16 May 2012, 11:58:06 am »

FX-4100
BOINC running on 460

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009009 0.00000  test
                   fpu_ChirpData 0.018200 0.00000  test
               fpu_opt_ChirpData 0.008752 0.00000  test
             sse1_ChirpData_ak8e 0.007503 0.00000  test
              sse2_ChirpData_ak8 0.004782 0.00000  test
              sse3_ChirpData_ak8 0.004801 0.00000  test
                 avx_ChirpData_a 0.003903 0.00000  test
                 avx_ChirpData_b 0.003902 0.00000  test
                 avx_ChirpData_c 0.004298 0.00000  test
                 avx_ChirpData_d 0.004136 0.00000  test
                 avx_ChirpData_e 0.003988 0.00000  test
                 avx_ChirpData_f 0.003865 0.00000  test
                 avx_ChirpData_g 0.003858 0.00000  test
                 avx_ChirpData_h 0.004558 0.00000  test
                 avx_ChirpData_i 0.004006 0.00000  test
            avx_fma4_ChirpData_a 0.003524 0.00000  test
            avx_fma4_ChirpData_b 0.060127 0.50095  test
            avx_fma4_ChirpData_a 0.003524 0.00000  choice

            Second run

                     v_ChirpData 0.009023 0.00000  test
                   fpu_ChirpData 0.018034 0.00000  test
               fpu_opt_ChirpData 0.008862 0.00000  test
             sse1_ChirpData_ak8e 0.007292 0.00000  test
              sse2_ChirpData_ak8 0.004615 0.00000  test
              sse3_ChirpData_ak8 0.004532 0.00000  test
                 avx_ChirpData_a 0.003917 0.00000  test
                 avx_ChirpData_b 0.003865 0.00000  test
                 avx_ChirpData_c 0.004167 0.00000  test
                 avx_ChirpData_d 0.004040 0.00000  test
                 avx_ChirpData_e 0.004026 0.00000  test
                 avx_ChirpData_f 0.003821 0.00000  test
                 avx_ChirpData_g 0.003666 0.00000  test
                 avx_ChirpData_h 0.004601 0.00000  test
                 avx_ChirpData_i 0.003980 0.00000  test
            avx_fma4_ChirpData_a 0.003389 0.00000  test
            avx_fma4_ChirpData_b 0.058483 0.50095  test
            avx_fma4_ChirpData_a 0.003389 0.00000  choice

            Third run

                     v_ChirpData 0.008824 0.00000  test
                   fpu_ChirpData 0.017494 0.00000  test
               fpu_opt_ChirpData 0.008599 0.00000  test
             sse1_ChirpData_ak8e 0.007149 0.00000  test
              sse2_ChirpData_ak8 0.004593 0.00000  test
              sse3_ChirpData_ak8 0.004453 0.00000  test
                 avx_ChirpData_a 0.003842 0.00000  test
                 avx_ChirpData_b 0.003825 0.00000  test
                 avx_ChirpData_c 0.004122 0.00000  test
                 avx_ChirpData_d 0.004023 0.00000  test
                 avx_ChirpData_e 0.003950 0.00000  test
                 avx_ChirpData_f 0.003855 0.00000  test
                 avx_ChirpData_g 0.003928 0.00000  test
                 avx_ChirpData_h 0.004565 0.00000  test
                 avx_ChirpData_i 0.004058 0.00000  test
            avx_fma4_ChirpData_a 0.003531 0.00000  test
            avx_fma4_ChirpData_b 0.059600 0.50095  test
            avx_fma4_ChirpData_a 0.003531 0.00000  choice

                   Test duration    11.53 seconds

Ftst_v7 completed successfully.


i3-2120
BOINC running on 560

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004599 0.00000  test
                   fpu_ChirpData 0.012435 0.00000  test
               fpu_opt_ChirpData 0.004366 0.00000  test
             sse1_ChirpData_ak8e 0.006014 0.00000  test
              sse2_ChirpData_ak8 0.004207 0.00000  test
              sse3_ChirpData_ak8 0.004177 0.00000  test
                 avx_ChirpData_a 0.002153 0.00000  test
                 avx_ChirpData_b 0.002141 0.00000  test
                 avx_ChirpData_c 0.002217 0.00000  test
                 avx_ChirpData_d 0.002032 0.00000  test
                 avx_ChirpData_e 0.002002 0.00000  test
                 avx_ChirpData_f 0.002125 0.00000  test
                 avx_ChirpData_g 0.002081 0.00000  test
                 avx_ChirpData_h 0.002745 0.00000  test
                 avx_ChirpData_i 0.002329 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.002002 0.00000  choice

            Second run

                     v_ChirpData 0.004888 0.00000  test
                   fpu_ChirpData 0.012563 0.00000  test
               fpu_opt_ChirpData 0.004551 0.00000  test
             sse1_ChirpData_ak8e 0.005902 0.00000  test
              sse2_ChirpData_ak8 0.004339 0.00000  test
              sse3_ChirpData_ak8 0.004017 0.00000  test
                 avx_ChirpData_a 0.002142 0.00000  test
                 avx_ChirpData_b 0.002153 0.00000  test
                 avx_ChirpData_c 0.002186 0.00000  test
                 avx_ChirpData_d 0.002007 0.00000  test
                 avx_ChirpData_e 0.001946 0.00000  test
                 avx_ChirpData_f 0.002063 0.00000  test
                 avx_ChirpData_g 0.002174 0.00000  test
                 avx_ChirpData_h 0.002790 0.00000  test
                 avx_ChirpData_i 0.002347 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.001946 0.00000  choice

            Third run

                     v_ChirpData 0.004868 0.00000  test
                   fpu_ChirpData 0.012536 0.00000  test
               fpu_opt_ChirpData 0.004565 0.00000  test
             sse1_ChirpData_ak8e 0.005728 0.00000  test
              sse2_ChirpData_ak8 0.004225 0.00000  test
              sse3_ChirpData_ak8 0.004123 0.00000  test
                 avx_ChirpData_a 0.002121 0.00000  test
                 avx_ChirpData_b 0.002155 0.00000  test
                 avx_ChirpData_c 0.002184 0.00000  test
                 avx_ChirpData_d 0.002048 0.00000  test
                 avx_ChirpData_e 0.002039 0.00000  test
                 avx_ChirpData_f 0.002137 0.00000  test
                 avx_ChirpData_g 0.002188 0.00000  test
                 avx_ChirpData_h 0.002760 0.00000  test
                 avx_ChirpData_i 0.002335 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.002039 0.00000  choice

                   Test duration     8.08 seconds

Ftst_v7 completed successfully.
« Last Edit: 16 May 2012, 12:00:34 pm by arkayn » Logged

KarVi
Alpha Tester
Knight Templar
***
Offline Offline

Posts: 251


Re: AVX Optimized App Development
« Reply #124 on: 16 May 2012, 12:17:36 pm »

FX8150@4.5

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007185 0.00000  test
                   fpu_ChirpData 0.013632 0.00000  test
               fpu_opt_ChirpData 0.007034 0.00000  test
             sse1_ChirpData_ak8e 0.005612 0.00000  test
              sse2_ChirpData_ak8 0.003647 0.00000  test
              sse3_ChirpData_ak8 0.003540 0.00000  test
                 avx_ChirpData_a 0.003041 0.00000  test
                 avx_ChirpData_b 0.002989 0.00000  test
                 avx_ChirpData_c 0.003246 0.00000  test
                 avx_ChirpData_d 0.003197 0.00000  test
                 avx_ChirpData_e 0.003099 0.00000  test
                 avx_ChirpData_f 0.002934 0.00000  test
                 avx_ChirpData_g 0.003017 0.00000  test
                 avx_ChirpData_h 0.003557 0.00000  test
                 avx_ChirpData_i 0.003103 0.00000  test
            avx_fma4_ChirpData_a 0.002702 0.00000  test
            avx_fma4_ChirpData_b 0.046052 0.50095  test
            avx_fma4_ChirpData_a 0.002702 0.00000  choice

            Second run

                     v_ChirpData 0.007192 0.00000  test
                   fpu_ChirpData 0.013633 0.00000  test
               fpu_opt_ChirpData 0.007051 0.00000  test
             sse1_ChirpData_ak8e 0.005563 0.00000  test
              sse2_ChirpData_ak8 0.003670 0.00000  test
              sse3_ChirpData_ak8 0.003536 0.00000  test
                 avx_ChirpData_a 0.003046 0.00000  test
                 avx_ChirpData_b 0.002989 0.00000  test
                 avx_ChirpData_c 0.003246 0.00000  test
                 avx_ChirpData_d 0.003171 0.00000  test
                 avx_ChirpData_e 0.003096 0.00000  test
                 avx_ChirpData_f 0.002938 0.00000  test
                 avx_ChirpData_g 0.002863 0.00000  test
                 avx_ChirpData_h 0.003540 0.00000  test
                 avx_ChirpData_i 0.003107 0.00000  test
            avx_fma4_ChirpData_a 0.002688 0.00000  test
            avx_fma4_ChirpData_b 0.045858 0.50095  test
            avx_fma4_ChirpData_a 0.002688 0.00000  choice

            Third run

                     v_ChirpData 0.007145 0.00000  test
                   fpu_ChirpData 0.013630 0.00000  test
               fpu_opt_ChirpData 0.007010 0.00000  test
             sse1_ChirpData_ak8e 0.005560 0.00000  test
              sse2_ChirpData_ak8 0.003667 0.00000  test
              sse3_ChirpData_ak8 0.003536 0.00000  test
                 avx_ChirpData_a 0.003046 0.00000  test
                 avx_ChirpData_b 0.003003 0.00000  test
                 avx_ChirpData_c 0.003244 0.00000  test
                 avx_ChirpData_d 0.003178 0.00000  test
                 avx_ChirpData_e 0.003092 0.00000  test
                 avx_ChirpData_f 0.002933 0.00000  test
                 avx_ChirpData_g 0.002958 0.00000  test
                 avx_ChirpData_h 0.003534 0.00000  test
                 avx_ChirpData_i 0.003106 0.00000  test
            avx_fma4_ChirpData_a 0.002691 0.00000  test
            avx_fma4_ChirpData_b 0.045893 0.50095  test
            avx_fma4_ChirpData_a 0.002691 0.00000  choice

                   Test duration     8.88 seconds

Ftst_v7 completed successfully.

Nice improvement from Fused Multiply-Add Smiley
Logged

A smile is the shortest distance between two peoble (Victor Borge).
Claggy
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 2558


Re: AVX Optimized App Development
« Reply #125 on: 16 May 2012, 01:12:37 pm »

i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.011312 0.00000  test
                   fpu_ChirpData 0.015995 0.00000  test
               fpu_opt_ChirpData 0.012151 0.00000  test
             sse1_ChirpData_ak8e 0.006951 0.00000  test
              sse2_ChirpData_ak8 0.005494 0.00000  test
              sse3_ChirpData_ak8 0.005626 0.00000  test
                 avx_ChirpData_a 0.003442 0.00000  test
                 avx_ChirpData_b 0.003206 0.00000  test
                 avx_ChirpData_c 0.003540 0.00000  test
                 avx_ChirpData_d 0.003456 0.00000  test
                 avx_ChirpData_e 0.003055 0.00000  test
                 avx_ChirpData_f 0.003544 0.00000  test
                 avx_ChirpData_g 0.003209 0.00000  test
                 avx_ChirpData_h 0.004235 0.00000  test
                 avx_ChirpData_i 0.003265 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.003055 0.00000  choice

            Second run

                     v_ChirpData 0.009754 0.00000  test
                   fpu_ChirpData 0.016226 0.00000  test
               fpu_opt_ChirpData 0.010134 0.00000  test
             sse1_ChirpData_ak8e 0.006801 0.00000  test
              sse2_ChirpData_ak8 0.005874 0.00000  test
              sse3_ChirpData_ak8 0.005385 0.00000  test
                 avx_ChirpData_a 0.003425 0.00000  test
                 avx_ChirpData_b 0.003101 0.00000  test
                 avx_ChirpData_c 0.003570 0.00000  test
                 avx_ChirpData_d 0.003430 0.00000  test
                 avx_ChirpData_e 0.003382 0.00000  test
                 avx_ChirpData_f 0.003381 0.00000  test
                 avx_ChirpData_g 0.003525 0.00000  test
                 avx_ChirpData_h 0.004078 0.00000  test
                 avx_ChirpData_i 0.003777 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_b 0.003101 0.00000  choice

            Third run

                     v_ChirpData 0.011256 0.00000  test
                   fpu_ChirpData 0.016422 0.00000  test
               fpu_opt_ChirpData 0.010467 0.00000  test
             sse1_ChirpData_ak8e 0.006613 0.00000  test
              sse2_ChirpData_ak8 0.005293 0.00000  test
              sse3_ChirpData_ak8 0.005231 0.00000  test
                 avx_ChirpData_a 0.003160 0.00000  test
                 avx_ChirpData_b 0.003300 0.00000  test
                 avx_ChirpData_c 0.003491 0.00000  test
                 avx_ChirpData_d 0.003294 0.00000  test
                 avx_ChirpData_e 0.002963 0.00000  test
                 avx_ChirpData_f 0.003788 0.00000  test
                 avx_ChirpData_g 0.003262 0.00000  test
                 avx_ChirpData_h 0.004430 0.00000  test
                 avx_ChirpData_i 0.003728 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_e 0.002963 0.00000  choice

                   Test duration     8.92 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):

=========================================================
Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003675 0.00000  test
                   fpu_ChirpData 0.008690 0.00000  test
               fpu_opt_ChirpData 0.003575 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003155 0.00000  test
              sse3_ChirpData_ak8 0.002982 0.00000  test
                 avx_ChirpData_a 0.001475 0.00000  test
                 avx_ChirpData_b 0.001642 0.00000  test
                 avx_ChirpData_c 0.001487 0.00000  test
                 avx_ChirpData_d 0.001379 0.00000  test
                 avx_ChirpData_e 0.001522 0.00000  test
                 avx_ChirpData_f 0.001572 0.00000  test
                 avx_ChirpData_g 0.001623 0.00000  test
                 avx_ChirpData_h 0.002022 0.00000  test
                 avx_ChirpData_i 0.001737 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001379 0.00000  choice

            Second run

                     v_ChirpData 0.003690 0.00000  test
                   fpu_ChirpData 0.008665 0.00000  test
               fpu_opt_ChirpData 0.003559 0.00000  test
             sse1_ChirpData_ak8e 0.004219 0.00000  test
              sse2_ChirpData_ak8 0.003156 0.00000  test
              sse3_ChirpData_ak8 0.002984 0.00000  test
                 avx_ChirpData_a 0.001472 0.00000  test
                 avx_ChirpData_b 0.001641 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001375 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002019 0.00000  test
                 avx_ChirpData_i 0.001722 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001375 0.00000  choice

            Third run

                     v_ChirpData 0.003747 0.00000  test
                   fpu_ChirpData 0.008661 0.00000  test
               fpu_opt_ChirpData 0.003566 0.00000  test
             sse1_ChirpData_ak8e 0.004212 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.002978 0.00000  test
                 avx_ChirpData_a 0.001474 0.00000  test
                 avx_ChirpData_b 0.001640 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001521 0.00000  test
                 avx_ChirpData_f 0.001568 0.00000  test
                 avx_ChirpData_g 0.001617 0.00000  test
                 avx_ChirpData_h 0.002012 0.00000  test
                 avx_ChirpData_i 0.001728 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

                   Test duration     5.62 seconds

Ftst_v7 completed successfully.

Claggy
« Last Edit: 16 May 2012, 01:48:47 pm by Claggy » Logged
PatrickV2
Knight o' The Round Table
***
Offline Offline

Posts: 136



Re: AVX Optimized App Development
« Reply #126 on: 16 May 2012, 02:20:58 pm »

Yes, please! The broader the range of systems tested the better. If you'd run both the J45 test attached to message 37870 and whatever the latest Chirponly version is at that time, it would be a help.
                                                                Joe

OK, no promises, since it's not my machine (but a custom-built rig I configured for my younger brother), but I will try to run the relevant tools. I'm planning to use Seti as a way to do a burn-in test on the machine; with a GTX560Ti 2GB it should be able to do quite some crunching. Wink

I expect the machine to arrive somewhere in the course of next week...

Regards, Patrick.
Logged
Mike
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 1181



Re: AVX Optimized App Development
« Reply #127 on: 17 May 2012, 11:11:31 am »

FX 8150 @4.4 GHZ Win 8 CP

Ftst_v7_J51_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008439 0.00000  test
                   fpu_ChirpData 0.015252 0.00000  test
               fpu_opt_ChirpData 0.009783 0.00000  test
             sse1_ChirpData_ak8e 0.005848 0.00000  test
              sse2_ChirpData_ak8 0.003852 0.00000  test
              sse3_ChirpData_ak8 0.003749 0.00000  test
                 avx_ChirpData_a 0.003289 0.00000  test
                 avx_ChirpData_b 0.003285 0.00000  test
                 avx_ChirpData_c 0.003449 0.00000  test
                 avx_ChirpData_d 0.003366 0.00000  test
                 avx_ChirpData_e 0.003237 0.00000  test
                 avx_ChirpData_f 0.003163 0.00000  test
                 avx_ChirpData_g 0.003121 0.00000  test
                 avx_ChirpData_h 0.003925 0.00000  test
                 avx_ChirpData_i 0.003333 0.00000  test
            avx_fma4_ChirpData_a 0.002981 0.00000  test
            avx_fma4_ChirpData_b 0.048056 0.50095  test
            avx_fma4_ChirpData_a 0.002981 0.00000  choice

            Second run

                     v_ChirpData 0.009848 0.00000  test
                   fpu_ChirpData 0.014183 0.00000  test
               fpu_opt_ChirpData 0.009766 0.00000  test
             sse1_ChirpData_ak8e 0.005836 0.00000  test
              sse2_ChirpData_ak8 0.003959 0.00000  test
              sse3_ChirpData_ak8 0.003815 0.00000  test
                 avx_ChirpData_a 0.003388 0.00000  test
                 avx_ChirpData_b 0.003360 0.00000  test
                 avx_ChirpData_c 0.003465 0.00000  test
                 avx_ChirpData_d 0.003398 0.00000  test
                 avx_ChirpData_e 0.003272 0.00000  test
                 avx_ChirpData_f 0.003264 0.00000  test
                 avx_ChirpData_g 0.003274 0.00000  test
                 avx_ChirpData_h 0.003943 0.00000  test
                 avx_ChirpData_i 0.003511 0.00000  test
            avx_fma4_ChirpData_a 0.003121 0.00000  test
            avx_fma4_ChirpData_b 0.048360 0.50095  test
            avx_fma4_ChirpData_a 0.003121 0.00000  choice

            Third run

                     v_ChirpData 0.009818 0.00000  test
                   fpu_ChirpData 0.014177 0.00000  test
               fpu_opt_ChirpData 0.009767 0.00000  test
             sse1_ChirpData_ak8e 0.005836 0.00000  test
              sse2_ChirpData_ak8 0.003961 0.00000  test
              sse3_ChirpData_ak8 0.003790 0.00000  test
                 avx_ChirpData_a 0.003392 0.00000  test
                 avx_ChirpData_b 0.003364 0.00000  test
                 avx_ChirpData_c 0.003471 0.00000  test
                 avx_ChirpData_d 0.003407 0.00000  test
                 avx_ChirpData_e 0.003273 0.00000  test
                 avx_ChirpData_f 0.003261 0.00000  test
                 avx_ChirpData_g 0.003282 0.00000  test
                 avx_ChirpData_h 0.003940 0.00000  test
                 avx_ChirpData_i 0.003517 0.00000  test
            avx_fma4_ChirpData_a 0.003135 0.00000  test
            avx_fma4_ChirpData_b 0.048371 0.50095  test
            avx_fma4_ChirpData_a 0.003135 0.00000  choice

                   Test duration     9.65 seconds

Ftst_v7 completed successfully.
Logged
Josef W. Segur
Janitor o' the Board
Knight who says 'Ni!'
*****
Offline Offline

Posts: 2551


Re: AVX Optimized App Development
« Reply #128 on: 18 May 2012, 07:50:22 pm »

Another new Chirponly test, J52, is attached.

Fixed (I hope) the problem which made the avx_fma4 b variant so slow and inaccurate, added a c variant with a different approach to TLB priming.
                                   Joe

* Ftst_v7_J52_W32.7z (244.92 KB - downloaded 41 times.)
Logged
arkayn
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 1066


Aaaarrrrgggghhhh


WWW
Re: AVX Optimized App Development
« Reply #129 on: 18 May 2012, 08:14:14 pm »

FX-4100
BOINC Running on 460

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.008840 0.00000  test
                   fpu_ChirpData 0.018138 0.00000  test
               fpu_opt_ChirpData 0.009096 0.00000  test
             sse1_ChirpData_ak8e 0.007134 0.00000  test
              sse2_ChirpData_ak8 0.004616 0.00000  test
              sse3_ChirpData_ak8 0.004581 0.00000  test
                 avx_ChirpData_a 0.004071 0.00000  test
                 avx_ChirpData_b 0.003964 0.00000  test
                 avx_ChirpData_c 0.004295 0.00000  test
                 avx_ChirpData_d 0.004130 0.00000  test
                 avx_ChirpData_e 0.003982 0.00000  test
                 avx_ChirpData_f 0.003781 0.00000  test
                 avx_ChirpData_g 0.003714 0.00000  test
                 avx_ChirpData_h 0.004528 0.00000  test
                 avx_ChirpData_i 0.003994 0.00000  test
            avx_fma4_ChirpData_a 0.003473 0.00000  test
            avx_fma4_ChirpData_b 0.003617 0.00000  test
            avx_fma4_ChirpData_c 0.003739 0.00000  test
            avx_fma4_ChirpData_a 0.003473 0.00000  choice

            Second run

                     v_ChirpData 0.009005 0.00000  test
                   fpu_ChirpData 0.017681 0.00000  test
               fpu_opt_ChirpData 0.008559 0.00000  test
             sse1_ChirpData_ak8e 0.007305 0.00000  test
              sse2_ChirpData_ak8 0.004635 0.00000  test
              sse3_ChirpData_ak8 0.004459 0.00000  test
                 avx_ChirpData_a 0.003960 0.00000  test
                 avx_ChirpData_b 0.003880 0.00000  test
                 avx_ChirpData_c 0.004260 0.00000  test
                 avx_ChirpData_d 0.004184 0.00000  test
                 avx_ChirpData_e 0.004021 0.00000  test
                 avx_ChirpData_f 0.003816 0.00000  test
                 avx_ChirpData_g 0.003791 0.00000  test
                 avx_ChirpData_h 0.004508 0.00000  test
                 avx_ChirpData_i 0.003953 0.00000  test
            avx_fma4_ChirpData_a 0.003404 0.00000  test
            avx_fma4_ChirpData_b 0.003597 0.00000  test
            avx_fma4_ChirpData_c 0.003738 0.00000  test
            avx_fma4_ChirpData_a 0.003404 0.00000  choice

            Third run

                     v_ChirpData 0.008951 0.00000  test
                   fpu_ChirpData 0.017233 0.00000  test
               fpu_opt_ChirpData 0.008535 0.00000  test
             sse1_ChirpData_ak8e 0.007110 0.00000  test
              sse2_ChirpData_ak8 0.004573 0.00000  test
              sse3_ChirpData_ak8 0.004376 0.00000  test
                 avx_ChirpData_a 0.003833 0.00000  test
                 avx_ChirpData_b 0.003780 0.00000  test
                 avx_ChirpData_c 0.004112 0.00000  test
                 avx_ChirpData_d 0.004140 0.00000  test
                 avx_ChirpData_e 0.003956 0.00000  test
                 avx_ChirpData_f 0.003741 0.00000  test
                 avx_ChirpData_g 0.003686 0.00000  test
                 avx_ChirpData_h 0.004516 0.00000  test
                 avx_ChirpData_i 0.003902 0.00000  test
            avx_fma4_ChirpData_a 0.003376 0.00000  test
            avx_fma4_ChirpData_b 0.003804 0.00000  test
            avx_fma4_ChirpData_c 0.003685 0.00000  test
            avx_fma4_ChirpData_a 0.003376 0.00000  choice

                   Test duration    10.54 seconds

Ftst_v7 completed successfully.

i3-2120
BOINC Running on 560

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.005332 0.00000  test
                   fpu_ChirpData 0.012461 0.00000  test
               fpu_opt_ChirpData 0.004724 0.00000  test
             sse1_ChirpData_ak8e 0.005928 0.00000  test
              sse2_ChirpData_ak8 0.004362 0.00000  test
              sse3_ChirpData_ak8 0.004210 0.00000  test
                 avx_ChirpData_a 0.002198 0.00000  test
                 avx_ChirpData_b 0.002080 0.00000  test
                 avx_ChirpData_c 0.002259 0.00000  test
                 avx_ChirpData_d 0.002050 0.00000  test
                 avx_ChirpData_e 0.002061 0.00000  test
                 avx_ChirpData_f 0.002186 0.00000  test
                 avx_ChirpData_g 0.002199 0.00000  test
                 avx_ChirpData_h 0.002787 0.00000  test
                 avx_ChirpData_i 0.002355 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.002050 0.00000  choice

            Second run

                     v_ChirpData 0.004999 0.00000  test
                   fpu_ChirpData 0.012899 0.00000  test
               fpu_opt_ChirpData 0.004722 0.00000  test
             sse1_ChirpData_ak8e 0.005912 0.00000  test
              sse2_ChirpData_ak8 0.004414 0.00000  test
              sse3_ChirpData_ak8 0.004065 0.00000  test
                 avx_ChirpData_a 0.002204 0.00000  test
                 avx_ChirpData_b 0.002195 0.00000  test
                 avx_ChirpData_c 0.002226 0.00000  test
                 avx_ChirpData_d 0.002059 0.00000  test
                 avx_ChirpData_e 0.002055 0.00000  test
                 avx_ChirpData_f 0.002176 0.00000  test
                 avx_ChirpData_g 0.002093 0.00000  test
                 avx_ChirpData_h 0.002694 0.00000  test
                 avx_ChirpData_i 0.002245 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.002055 0.00000  choice

            Third run

                     v_ChirpData 0.004695 0.00000  test
                   fpu_ChirpData 0.012390 0.00000  test
               fpu_opt_ChirpData 0.004516 0.00000  test
             sse1_ChirpData_ak8e 0.005742 0.00000  test
              sse2_ChirpData_ak8 0.004219 0.00000  test
              sse3_ChirpData_ak8 0.004038 0.00000  test
                 avx_ChirpData_a 0.002096 0.00000  test
                 avx_ChirpData_b 0.002074 0.00000  test
                 avx_ChirpData_c 0.002121 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  test
                 avx_ChirpData_e 0.001953 0.00000  test
                 avx_ChirpData_f 0.002074 0.00000  test
                 avx_ChirpData_g 0.002091 0.00000  test
                 avx_ChirpData_h 0.002691 0.00000  test
                 avx_ChirpData_i 0.002248 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.001953 0.00000  choice

                   Test duration     8.12 seconds

Ftst_v7 completed successfully.
« Last Edit: 18 May 2012, 08:20:26 pm by arkayn » Logged

Claggy
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 2558


Re: AVX Optimized App Development
« Reply #130 on: 19 May 2012, 03:42:08 am »

i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007109 0.00000  test
                   fpu_ChirpData 0.014843 0.00000  test
               fpu_opt_ChirpData 0.008209 0.00000  test
             sse1_ChirpData_ak8e 0.006001 0.00000  test
              sse2_ChirpData_ak8 0.004700 0.00000  test
              sse3_ChirpData_ak8 0.004524 0.00000  test
                 avx_ChirpData_a 0.002497 0.00000  test
                 avx_ChirpData_b 0.002529 0.00000  test
                 avx_ChirpData_c 0.002559 0.00000  test
                 avx_ChirpData_d 0.002484 0.00000  test
                 avx_ChirpData_e 0.002418 0.00000  test
                 avx_ChirpData_f 0.002567 0.00000  test
                 avx_ChirpData_g 0.002591 0.00000  test
                 avx_ChirpData_h 0.002997 0.00000  test
                 avx_ChirpData_i 0.002696 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.002418 0.00000  choice

            Second run

                     v_ChirpData 0.006521 0.00000  test
                   fpu_ChirpData 0.014841 0.00000  test
               fpu_opt_ChirpData 0.008273 0.00000  test
             sse1_ChirpData_ak8e 0.005935 0.00000  test
              sse2_ChirpData_ak8 0.004688 0.00000  test
              sse3_ChirpData_ak8 0.004446 0.00000  test
                 avx_ChirpData_a 0.002536 0.00000  test
                 avx_ChirpData_b 0.003191 0.00000  test
                 avx_ChirpData_c 0.002658 0.00000  test
                 avx_ChirpData_d 0.002708 0.00000  test
                 avx_ChirpData_e 0.002527 0.00000  test
                 avx_ChirpData_f 0.002624 0.00000  test
                 avx_ChirpData_g 0.002491 0.00000  test
                 avx_ChirpData_h 0.003061 0.00000  test
                 avx_ChirpData_i 0.002480 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_i 0.002480 0.00000  choice

            Third run

                     v_ChirpData 0.006486 0.00000  test
                   fpu_ChirpData 0.014641 0.00000  test
               fpu_opt_ChirpData 0.007531 0.00000  test
             sse1_ChirpData_ak8e 0.006155 0.00000  test
              sse2_ChirpData_ak8 0.004716 0.00000  test
              sse3_ChirpData_ak8 0.004651 0.00000  test
                 avx_ChirpData_a 0.002909 0.00000  test
                 avx_ChirpData_b 0.002662 0.00000  test
                 avx_ChirpData_c 0.002676 0.00000  test
                 avx_ChirpData_d 0.002528 0.00000  test
                 avx_ChirpData_e 0.002432 0.00000  test
                 avx_ChirpData_f 0.002957 0.00000  test
                 avx_ChirpData_g 0.003086 0.00000  test
                 avx_ChirpData_h 0.003794 0.00000  test
                 avx_ChirpData_i 0.003075 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_e 0.002432 0.00000  choice

                   Test duration     7.71 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003679 0.00000  test
                   fpu_ChirpData 0.008669 0.00000  test
               fpu_opt_ChirpData 0.003588 0.00000  test
             sse1_ChirpData_ak8e 0.004205 0.00000  test
              sse2_ChirpData_ak8 0.003154 0.00000  test
              sse3_ChirpData_ak8 0.002981 0.00000  test
                 avx_ChirpData_a 0.001481 0.00000  test
                 avx_ChirpData_b 0.001648 0.00000  test
                 avx_ChirpData_c 0.001484 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_g 0.001619 0.00000  test
                 avx_ChirpData_h 0.002018 0.00000  test
                 avx_ChirpData_i 0.001724 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

            Second run

                     v_ChirpData 0.003658 0.00000  test
                   fpu_ChirpData 0.008654 0.00000  test
               fpu_opt_ChirpData 0.003626 0.00000  test
             sse1_ChirpData_ak8e 0.004208 0.00000  test
              sse2_ChirpData_ak8 0.003158 0.00000  test
              sse3_ChirpData_ak8 0.002977 0.00000  test
                 avx_ChirpData_a 0.001473 0.00000  test
                 avx_ChirpData_b 0.001646 0.00000  test
                 avx_ChirpData_c 0.001488 0.00000  test
                 avx_ChirpData_d 0.001382 0.00000  test
                 avx_ChirpData_e 0.001524 0.00000  test
                 avx_ChirpData_f 0.001579 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002016 0.00000  test
                 avx_ChirpData_i 0.001729 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.001382 0.00000  choice

            Third run

                     v_ChirpData 0.003663 0.00000  test
                   fpu_ChirpData 0.008668 0.00000  test
               fpu_opt_ChirpData 0.003556 0.00000  test
             sse1_ChirpData_ak8e 0.004202 0.00000  test
              sse2_ChirpData_ak8 0.003152 0.00000  test
              sse3_ChirpData_ak8 0.002988 0.00000  test
                 avx_ChirpData_a 0.001469 0.00000  test
                 avx_ChirpData_b 0.001640 0.00000  test
                 avx_ChirpData_c 0.001484 0.00000  test
                 avx_ChirpData_d 0.001380 0.00000  test
                 avx_ChirpData_e 0.001519 0.00000  test
                 avx_ChirpData_f 0.001570 0.00000  test
                 avx_ChirpData_g 0.001635 0.00000  test
                 avx_ChirpData_h 0.002023 0.00000  test
                 avx_ChirpData_i 0.001727 0.00000  test
            avx_fma4_ChirpData_a not supported by system
            avx_fma4_ChirpData_b not supported by system
            avx_fma4_ChirpData_c not supported by system
                 avx_ChirpData_d 0.001380 0.00000  choice

                   Test duration     5.62 seconds

Ftst_v7 completed successfully.

Claggy
Logged
KarVi
Alpha Tester
Knight Templar
***
Offline Offline

Posts: 251


Re: AVX Optimized App Development
« Reply #131 on: 20 May 2012, 04:29:01 pm »

FX8150@4.5

=========================================================
Ftst_v7_J52_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.007460 0.00000  test
                   fpu_ChirpData 0.013805 0.00000  test
               fpu_opt_ChirpData 0.007231 0.00000  test
             sse1_ChirpData_ak8e 0.005658 0.00000  test
              sse2_ChirpData_ak8 0.003680 0.00000  test
              sse3_ChirpData_ak8 0.003561 0.00000  test
                 avx_ChirpData_a 0.003091 0.00000  test
                 avx_ChirpData_b 0.003040 0.00000  test
                 avx_ChirpData_c 0.003295 0.00000  test
                 avx_ChirpData_d 0.003235 0.00000  test
                 avx_ChirpData_e 0.003124 0.00000  test
                 avx_ChirpData_f 0.002965 0.00000  test
                 avx_ChirpData_g 0.003061 0.00000  test
                 avx_ChirpData_h 0.003560 0.00000  test
                 avx_ChirpData_i 0.003133 0.00000  test
            avx_fma4_ChirpData_a 0.002738 0.00000  test
            avx_fma4_ChirpData_b 0.002874 0.00000  test
            avx_fma4_ChirpData_c 0.002879 0.00000  test
            avx_fma4_ChirpData_a 0.002738 0.00000  choice

            Second run

                     v_ChirpData 0.007377 0.00000  test
                   fpu_ChirpData 0.013799 0.00000  test
               fpu_opt_ChirpData 0.007233 0.00000  test
             sse1_ChirpData_ak8e 0.005695 0.00000  test
              sse2_ChirpData_ak8 0.003667 0.00000  test
              sse3_ChirpData_ak8 0.003556 0.00000  test
                 avx_ChirpData_a 0.003111 0.00000  test
                 avx_ChirpData_b 0.003040 0.00000  test
                 avx_ChirpData_c 0.003299 0.00000  test
                 avx_ChirpData_d 0.003239 0.00000  test
                 avx_ChirpData_e 0.003134 0.00000  test
                 avx_ChirpData_f 0.002980 0.00000  test
                 avx_ChirpData_g 0.003057 0.00000  test
                 avx_ChirpData_h 0.003571 0.00000  test
                 avx_ChirpData_i 0.003141 0.00000  test
            avx_fma4_ChirpData_a 0.002739 0.00000  test
            avx_fma4_ChirpData_b 0.002888 0.00000  test
            avx_fma4_ChirpData_c 0.002897 0.00000  test
            avx_fma4_ChirpData_a 0.002739 0.00000  choice

            Third run

                     v_ChirpData 0.007404 0.00000  test
                   fpu_ChirpData 0.013805 0.00000  test
               fpu_opt_ChirpData 0.007240 0.00000  test
             sse1_ChirpData_ak8e 0.005663 0.00000  test
              sse2_ChirpData_ak8 0.003679 0.00000  test
              sse3_ChirpData_ak8 0.003554 0.00000  test
                 avx_ChirpData_a 0.003105 0.00000  test
                 avx_ChirpData_b 0.003036 0.00000  test
                 avx_ChirpData_c 0.003296 0.00000  test
                 avx_ChirpData_d 0.003239 0.00000  test
                 avx_ChirpData_e 0.003131 0.00000  test
                 avx_ChirpData_f 0.002980 0.00000  test
                 avx_ChirpData_g 0.003066 0.00000  test
                 avx_ChirpData_h 0.003579 0.00000  test
                 avx_ChirpData_i 0.003141 0.00000  test
            avx_fma4_ChirpData_a 0.002739 0.00000  test
            avx_fma4_ChirpData_b 0.002888 0.00000  test
            avx_fma4_ChirpData_c 0.002907 0.00000  test
            avx_fma4_ChirpData_a 0.002739 0.00000  choice

                   Test duration     8.06 seconds

Ftst_v7 completed successfully.
Logged

A smile is the shortest distance between two peoble (Victor Borge).
Josef W. Segur
Janitor o' the Board
Knight who says 'Ni!'
*****
Offline Offline

Posts: 2551


Re: AVX Optimized App Development
« Reply #132 on: 22 May 2012, 05:15:38 pm »

Here's a J53 Chirponly version. I've dropped testing the avx_fma4 b and c variants since TLB priming seems ineffective so far.

The added d4, d6, and d8 avx_fma4 tests are like the a variant but with some further conversions from avx to fma4 reducing the instruction count in the loop from 67 to 65. I think that's all that can be converted. The three subvariants have prefetch ahead 4, 6, and 8 cache lines.
                                     Joe

* Ftst_v7_J53_W32.7z (245.29 KB - downloaded 35 times.)
Logged
Claggy
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 2558


Re: AVX Optimized App Development
« Reply #133 on: 22 May 2012, 05:20:55 pm »

i7-2600K @4.7GHz (Boinc running):

=========================================================
Ftst_v7_J53_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.010533 0.00000  test
                   fpu_ChirpData 0.015888 0.00000  test
               fpu_opt_ChirpData 0.009288 0.00000  test
             sse1_ChirpData_ak8e 0.006435 0.00000  test
              sse2_ChirpData_ak8 0.005798 0.00000  test
              sse3_ChirpData_ak8 0.005038 0.00000  test
                 avx_ChirpData_a 0.002875 0.00000  test
                 avx_ChirpData_b 0.002979 0.00000  test
                 avx_ChirpData_c 0.002922 0.00000  test
                 avx_ChirpData_d 0.003236 0.00000  test
                 avx_ChirpData_e 0.002934 0.00000  test
                 avx_ChirpData_f 0.003012 0.00000  test
                 avx_ChirpData_g 0.002737 0.00000  test
                 avx_ChirpData_h 0.003301 0.00000  test
                 avx_ChirpData_i 0.003410 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_g 0.002737 0.00000  choice

            Second run

                     v_ChirpData 0.007881 0.00000  test
                   fpu_ChirpData 0.015556 0.00000  test
               fpu_opt_ChirpData 0.007705 0.00000  test
             sse1_ChirpData_ak8e 0.006080 0.00000  test
              sse2_ChirpData_ak8 0.004898 0.00000  test
              sse3_ChirpData_ak8 0.004811 0.00000  test
                 avx_ChirpData_a 0.002937 0.00000  test
                 avx_ChirpData_b 0.003385 0.00000  test
                 avx_ChirpData_c 0.002724 0.00000  test
                 avx_ChirpData_d 0.002724 0.00000  test
                 avx_ChirpData_e 0.002664 0.00000  test
                 avx_ChirpData_f 0.002867 0.00000  test
                 avx_ChirpData_g 0.002864 0.00000  test
                 avx_ChirpData_h 0.003519 0.00000  test
                 avx_ChirpData_i 0.003164 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_e 0.002664 0.00000  choice

            Third run

                     v_ChirpData 0.010643 0.00000  test
                   fpu_ChirpData 0.015693 0.00000  test
               fpu_opt_ChirpData 0.008806 0.00000  test
             sse1_ChirpData_ak8e 0.006255 0.00000  test
              sse2_ChirpData_ak8 0.005185 0.00000  test
              sse3_ChirpData_ak8 0.004936 0.00000  test
                 avx_ChirpData_a 0.003026 0.00000  test
                 avx_ChirpData_b 0.003144 0.00000  test
                 avx_ChirpData_c 0.003288 0.00000  test
                 avx_ChirpData_d 0.002940 0.00000  test
                 avx_ChirpData_e 0.003005 0.00000  test
                 avx_ChirpData_f 0.003512 0.00000  test
                 avx_ChirpData_g 0.003088 0.00000  test
                 avx_ChirpData_h 0.003861 0.00000  test
                 avx_ChirpData_i 0.003359 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.002940 0.00000  choice

                   Test duration     8.29 seconds

Ftst_v7 completed successfully.
=========================================================

i7-2600K @4.7GHz (Boinc suspended):


=========================================================
Ftst_v7_J53_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.003658 0.00000  test
                   fpu_ChirpData 0.008655 0.00000  test
               fpu_opt_ChirpData 0.003687 0.00000  test
             sse1_ChirpData_ak8e 0.004206 0.00000  test
              sse2_ChirpData_ak8 0.003164 0.00000  test
              sse3_ChirpData_ak8 0.002982 0.00000  test
                 avx_ChirpData_a 0.001476 0.00000  test
                 avx_ChirpData_b 0.001647 0.00000  test
                 avx_ChirpData_c 0.001485 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001579 0.00000  test
                 avx_ChirpData_f 0.001527 0.00000  test
                 avx_ChirpData_g 0.001619 0.00000  test
                 avx_ChirpData_h 0.002018 0.00000  test
                 avx_ChirpData_i 0.001726 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

            Second run

                     v_ChirpData 0.003738 0.00000  test
                   fpu_ChirpData 0.008661 0.00000  test
               fpu_opt_ChirpData 0.003565 0.00000  test
             sse1_ChirpData_ak8e 0.004213 0.00000  test
              sse2_ChirpData_ak8 0.003158 0.00000  test
              sse3_ChirpData_ak8 0.002977 0.00000  test
                 avx_ChirpData_a 0.001473 0.00000  test
                 avx_ChirpData_b 0.001642 0.00000  test
                 avx_ChirpData_c 0.001482 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001520 0.00000  test
                 avx_ChirpData_f 0.001570 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002026 0.00000  test
                 avx_ChirpData_i 0.001724 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

            Third run

                     v_ChirpData 0.003683 0.00000  test
                   fpu_ChirpData 0.008662 0.00000  test
               fpu_opt_ChirpData 0.003569 0.00000  test
             sse1_ChirpData_ak8e 0.004210 0.00000  test
              sse2_ChirpData_ak8 0.003157 0.00000  test
              sse3_ChirpData_ak8 0.002980 0.00000  test
                 avx_ChirpData_a 0.001471 0.00000  test
                 avx_ChirpData_b 0.001640 0.00000  test
                 avx_ChirpData_c 0.001487 0.00000  test
                 avx_ChirpData_d 0.001377 0.00000  test
                 avx_ChirpData_e 0.001519 0.00000  test
                 avx_ChirpData_f 0.001567 0.00000  test
                 avx_ChirpData_g 0.001618 0.00000  test
                 avx_ChirpData_h 0.002022 0.00000  test
                 avx_ChirpData_i 0.001728 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.001377 0.00000  choice

                   Test duration     5.62 seconds

Ftst_v7 completed successfully.

Claggy
Logged
arkayn
Alpha Tester
Knight who says 'Ni!'
***
Offline Offline

Posts: 1066


Aaaarrrrgggghhhh


WWW
Re: AVX Optimized App Development
« Reply #134 on: 22 May 2012, 05:42:32 pm »

FX-4100
BOINC running on 460

=========================================================
Ftst_v7_J53_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.009027 0.00000  test
                   fpu_ChirpData 0.017784 0.00000  test
               fpu_opt_ChirpData 0.008842 0.00000  test
             sse1_ChirpData_ak8e 0.007343 0.00000  test
              sse2_ChirpData_ak8 0.004565 0.00000  test
              sse3_ChirpData_ak8 0.004510 0.00000  test
                 avx_ChirpData_a 0.003855 0.00000  test
                 avx_ChirpData_b 0.003915 0.00000  test
                 avx_ChirpData_c 0.004248 0.00000  test
                 avx_ChirpData_d 0.004088 0.00000  test
                 avx_ChirpData_e 0.003987 0.00000  test
                 avx_ChirpData_f 0.003833 0.00000  test
                 avx_ChirpData_g 0.003815 0.00000  test
                 avx_ChirpData_h 0.004630 0.00000  test
                 avx_ChirpData_i 0.004029 0.00000  test
            avx_fma4_ChirpData_a 0.003409 0.00000  test
           avx_fma4_ChirpData_d4 0.003450 0.00000  test
           avx_fma4_ChirpData_d6 0.003494 0.00000  test
           avx_fma4_ChirpData_d8 0.003531 0.00000  test
            avx_fma4_ChirpData_a 0.003409 0.00000  choice

            Second run

                     v_ChirpData 0.009120 0.00000  test
                   fpu_ChirpData 0.017763 0.00000  test
               fpu_opt_ChirpData 0.008955 0.00000  test
             sse1_ChirpData_ak8e 0.007134 0.00000  test
              sse2_ChirpData_ak8 0.004597 0.00000  test
              sse3_ChirpData_ak8 0.004496 0.00000  test
                 avx_ChirpData_a 0.003862 0.00000  test
                 avx_ChirpData_b 0.003970 0.00000  test
                 avx_ChirpData_c 0.004118 0.00000  test
                 avx_ChirpData_d 0.003992 0.00000  test
                 avx_ChirpData_e 0.003903 0.00000  test
                 avx_ChirpData_f 0.003729 0.00000  test
                 avx_ChirpData_g 0.003698 0.00000  test
                 avx_ChirpData_h 0.004578 0.00000  test
                 avx_ChirpData_i 0.004050 0.00000  test
            avx_fma4_ChirpData_a 0.003464 0.00000  test
           avx_fma4_ChirpData_d4 0.003434 0.00000  test
           avx_fma4_ChirpData_d6 0.003415 0.00000  test
           avx_fma4_ChirpData_d8 0.003430 0.00000  test
           avx_fma4_ChirpData_d6 0.003415 0.00000  choice

            Third run

                     v_ChirpData 0.009029 0.00000  test
                   fpu_ChirpData 0.017711 0.00000  test
               fpu_opt_ChirpData 0.008843 0.00000  test
             sse1_ChirpData_ak8e 0.007283 0.00000  test
              sse2_ChirpData_ak8 0.004629 0.00000  test
              sse3_ChirpData_ak8 0.004534 0.00000  test
                 avx_ChirpData_a 0.003926 0.00000  test
                 avx_ChirpData_b 0.003819 0.00000  test
                 avx_ChirpData_c 0.004124 0.00000  test
                 avx_ChirpData_d 0.003992 0.00000  test
                 avx_ChirpData_e 0.003893 0.00000  test
                 avx_ChirpData_f 0.003694 0.00000  test
                 avx_ChirpData_g 0.003721 0.00000  test
                 avx_ChirpData_h 0.004432 0.00000  test
                 avx_ChirpData_i 0.003909 0.00000  test
            avx_fma4_ChirpData_a 0.003482 0.00000  test
           avx_fma4_ChirpData_d4 0.003391 0.00000  test
           avx_fma4_ChirpData_d6 0.003398 0.00000  test
           avx_fma4_ChirpData_d8 0.003476 0.00000  test
           avx_fma4_ChirpData_d4 0.003391 0.00000  choice

                   Test duration    10.75 seconds

Ftst_v7 completed successfully.

i3-2120
BOINC running on 560

=========================================================
Ftst_v7_J53_Chirponly started.

Optimal function choices:
--------------------------------------------------------
                            name   timing   error
--------------------------------------------------------
                     v_ChirpData 0.004919 0.00000  test
                   fpu_ChirpData 0.012437 0.00000  test
               fpu_opt_ChirpData 0.004521 0.00000  test
             sse1_ChirpData_ak8e 0.005737 0.00000  test
              sse2_ChirpData_ak8 0.004192 0.00000  test
              sse3_ChirpData_ak8 0.004024 0.00000  test
                 avx_ChirpData_a 0.002183 0.00000  test
                 avx_ChirpData_b 0.002301 0.00000  test
                 avx_ChirpData_c 0.002154 0.00000  test
                 avx_ChirpData_d 0.002204 0.00000  test
                 avx_ChirpData_e 0.002826 0.00000  test
                 avx_ChirpData_f 0.002604 0.00000  test
                 avx_ChirpData_g 0.002915 0.00000  test
                 avx_ChirpData_h 0.002857 0.00000  test
                 avx_ChirpData_i 0.002517 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_c 0.002154 0.00000  choice

            Second run

                     v_ChirpData 0.004754 0.00000  test
                   fpu_ChirpData 0.013919 0.00000  test
               fpu_opt_ChirpData 0.005436 0.00000  test
             sse1_ChirpData_ak8e 0.005733 0.00000  test
              sse2_ChirpData_ak8 0.004207 0.00000  test
              sse3_ChirpData_ak8 0.004042 0.00000  test
                 avx_ChirpData_a 0.002121 0.00000  test
                 avx_ChirpData_b 0.002084 0.00000  test
                 avx_ChirpData_c 0.002124 0.00000  test
                 avx_ChirpData_d 0.001957 0.00000  test
                 avx_ChirpData_e 0.001959 0.00000  test
                 avx_ChirpData_f 0.002082 0.00000  test
                 avx_ChirpData_g 0.002103 0.00000  test
                 avx_ChirpData_h 0.002690 0.00000  test
                 avx_ChirpData_i 0.002242 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.001957 0.00000  choice

            Third run

                     v_ChirpData 0.004720 0.00000  test
                   fpu_ChirpData 0.012409 0.00000  test
               fpu_opt_ChirpData 0.004466 0.00000  test
             sse1_ChirpData_ak8e 0.005780 0.00000  test
              sse2_ChirpData_ak8 0.004227 0.00000  test
              sse3_ChirpData_ak8 0.004003 0.00000  test
                 avx_ChirpData_a 0.002105 0.00000  test
                 avx_ChirpData_b 0.002092 0.00000  test
                 avx_ChirpData_c 0.002123 0.00000  test
                 avx_ChirpData_d 0.001955 0.00000  test
                 avx_ChirpData_e 0.001967 0.00000  test
                 avx_ChirpData_f 0.002079 0.00000  test
                 avx_ChirpData_g 0.002094 0.00000  test
                 avx_ChirpData_h 0.002690 0.00000  test
                 avx_ChirpData_i 0.002268 0.00000  test
            avx_fma4_ChirpData_a not supported by system
           avx_fma4_ChirpData_d4 not supported by system
           avx_fma4_ChirpData_d6 not supported by system
           avx_fma4_ChirpData_d8 not supported by system
                 avx_ChirpData_d 0.001955 0.00000  choice

                   Test duration     8.17 seconds

Ftst_v7 completed successfully.
« Last Edit: 22 May 2012, 05:44:33 pm by arkayn » Logged

Pages: 1 ... 7 8 [9] 10 11 Go Up Print 
Seti@Home optimized science apps and information  |  Optimized Seti@Home apps  |  Discussion Forum  |  Topic: AVX Optimized App Development « previous next »
Jump to:  


Quote!
The whole problem with the world is that fools and fanatics are always so certain of themselves, but wiser people so full of doubts.
- Bertrand Russell

 
Site Statistics
Total Members:92
Total Posts:51,850
Total Topics:1,450
Downloads
..Some PHP stuff ToDo
Pages served
Today:5,834
Total:17,506,542
(since 6/26/2006)
Latest Member:
Philip Bott
 
 
Seti@Home optimized science apps and information | Powered by Enigma 2.0 (RC1).
© 2003-2013, LSP Dev Team. All Rights Reserved.
Seti@Home optimized science apps and information Forums | Powered by SMF.
© 2005, Simple Machines LLC. All Rights Reserved.
Powered by MySQL Powered by PHP Valid XHTML 1.0! Valid CSS!