C - Comparar tempo de processamento de trocas e comparações

Question

E a&iacute;, pessoal!

Estou &agrave;s voltas com minha monografia de final de curso que &eacute; otimiza&ccedil;&atilde;o de shell sort utilizando algoritmos gen&eacute;ticos.
A quest&atilde;o &eacute; que para comparar a performance do que irei desenvolver com outros j&aacute; existentes &eacute; necess&aacute;ria alguma medida de compara&ccedil;&atilde;o o mais exata poss&iacute;vel. Assim, resolvi que a medida seria o n&uacute;mero de trocas e compara&ccedil;&otilde;es efetuadas no vetor. 
O problema &eacute;: todo mundo sabe que uma compara&ccedil;&atilde;o de elementos &eacute; bem mais r&aacute;pida que uma troca, mas quanto mais r&aacute;pida? E o quanto essa rela&ccedil;&atilde;o muda de uma arquitetura para outra (processadores com tamanhos de cache diferentes, quantidade de mem&oacute;ria, etc?)?
Assim, estou querendo desenvolver um programinha em C que efetue alguns bilh&otilde;es de compara&ccedil;&otilde;es e trocas de elementos e calcule proporcionalmente quanto cada um gasta de tempo de processamento. Como um exemplo, um professor meu disse que uma vez, empiricamente (pra n&atilde;o dizer no chute :D ), tinha usado a propor&ccedil;&atilde;o de 3:1 e acabou verificando que &eacute; algo muito pr&oacute;ximo disso.

Mas, resumindo, como meu C est&aacute; um pouco enferrujado, gostaria de dicas do pessoal mais experiente em C sobre como implementar essa compara&ccedil;&atilde;o, artigos abordando essa quest&atilde;o (tentei pesquisar no google, mas n&atilde;o achei nada) ou qualquer coisa que possa ajudar.

Abra&ccedil;o!

Answer

Assim de cabe&ccedil;a, lembro de haver uma op&ccedil;&atilde;o chamada profiling. No tempo em que eu estava fazendo a minha monografia, isso era acionado com a op&ccedil;&atilde;o -g do GCC.

Com isso, o programa ao ser executado gerava um arquivo registrando cada passagem por cada fun&ccedil;&atilde;o/procedimento. Esse arquivo depois podia ser analisado, e gerar estat&iacute;sticas do tipo percentual do tempo gasto na fun&ccedil;&atilde;o processa_risco(). A id&eacute;ia disso seria identificar as rotinas mais lentas, ou que eram mais chamadas, e assim poder concentrar o esfor&ccedil;o onde ele seria mais efetivo... 

Talvez sirva pra voc&ecirc;; boa sorte.

Answer

-g gera os simbolos necess&aacute;rios pra vc conseguir debugar usando o gdb ou ddd. sera q vc n&atilde;o quer usar, na verdade

   -fprofile-values
       If combined with -fprofile-arcs, it adds code so that some data
       about values of expressions in the program is gathered.

       With -fbranch-probabilities, it reads back the data gathered from
       profiling values of expressions and adds REG_VALUE_PROFILE notes to
       instructions for their later usage in optimizations.

Answer

Interessante, n&atilde;o sabia dessa caracter&iacute;stica de profile do GCC, valeu.  Mas ele gera somente percentual ou tempo e clocks tamb&eacute;m?
De qualquer forma, essa otimiza&ccedil;&atilde;o ter&aacute; que ser feita em diversas arquiteturas e ambientes, ent&atilde;o vou ter que desenvolver um programa que fa&ccedil;a essa an&aacute;lise. Ou seja, posso usar o GCC pra validar o que eu fizer em minha m&aacute;quina (o que &eacute; uma grande ajuda), mas vai ter que rodar em outros ambientes. 
Assim, eu queria saber como avaliar? Para avaliar compara&ccedil;&otilde;es basta botar uma compara&ccedil;&atilde;o que nunca ocorra como if 1 > 2 ou seria necess&aacute;rio uso de vari&aacute;veis mesmo (if x > y)? E para troca, bastaria um x = y independente do conte&uacute;do das vari&aacute;veis?
E o que acham melhor avaliar? Clocks ou tempo? Comecei a trabalhar com tempo mas encontrei alguns problemas: Como trabalhar com grandes repeti&ccedil;&otilde;es (bilh&otilde;es a trilh&otilde;es)? Usando v&aacute;rios for aninhados ou apenas um ou dois com unsigned long? Fiz um c&oacute;digo bem simples pra testar isso, mas o tempo calculado n&atilde;o &eacute; real..

Answer

O programa que fiz:


unsigned long i, quant;
int x, y;
time_t inicio, fim, tempo_comp[10], tempo_troca[10];
   quant = 7000000;
   while(x < 10)
   {
     inicio = time(NULL);
     i = 0;
     while (i < quant)
     {
       if (quant < i) quant = i;
       i++;
     }
     fim = time(NULL);
     tempo_comp[x] = fim - inicio;
     inicio = time(NULL);
     i = 0;
     while (i < quant)
     {
       x = y;
       i++;
     }
     fim = time(NULL);
     tempo_troca[x] = fim - inicio;
     x++;
     quant = quant * 2;
   }

A quest&atilde;o &eacute; que o tempo gasto n&atilde;o condiz com o esperado. Enquanto a rela&ccedil;&atilde;o esperada era de 3 para 1 (pelo menos de acordo com meu orientador, segundo ele com base em alguns trabalhos com algoritmos gen&eacute;ticos), est&aacute; menos de 2 para 1.

Os tempos est&atilde;o saindo:

Quantidade  - Temp. Compara&ccedil;&otilde;es - Temp. Trocas
 280.000.000 	4	6
 560.000.000 	9	12
 1.120.000.000 	17	25
 2.240.000.000 	33	55
 4.480.000.000 	71	105
 8.960.000.000 	133	199


O que pode explicar isso? O fato de que so estou avaliado o processador e n&atilde;o a mem&oacute;ria? Ou algum erro no c&oacute;digo?

Answer

Ningu&eacute;m?

Answer

fiz a minha vers&atilde;o pra entender o que vc est&aacute; tentando fazer. a principio os valores s&atilde;o muito semelhantes. Acho que vc deveria tentar fazer uma estatistica desses dados. leve em conta q a CPU pode fazer alguma coisa durante a execu&ccedil;&atilde;o do programa q atrapalhe um pouco. Outra coisa q vc deve pensar &eacute; que tipo de otimiza&ccedil;&atilde;o o seu compilador faz. As CPUs atuais s&atilde;o dotadas de 'previs&atilde;o de desvio', pro seu exemplo pode funcionar de um jeito, pro seu programa pode funcionar de outro.

#include
#include
#define TAXA 2
#define MAX 7000000
#define QTD 10
int main(){
 unsigned long int i,j,x,max;
 time_t inicio, meio, fim;
 
 printf(Qtde	Comp.	Troca
);
 for(i=0,max=MAX;i

Answer

Voc&ecirc; conseguiu esses tempos com o c&oacute;digo acima?

Answer

[quote=tetim]Voc&ecirc; conseguiu esses tempos com o c&oacute;digo acima?[/quote]Sim. E usando windows 2000   :mrgreen:

Answer

[quote=peczenyj]Sim. E usando windows 2000   :mrgreen:[/quote]

Hmmm.... legal  :D 

Fiz uns testes aqui, e os tempos tamb&eacute;m foram muito pr&oacute;ximos
n&atilde;o de 3:1 e sim de ~ Temp_troca = Temp_cmp + Temp_cmp /3
E outra coisa interessante que eu percebi tamb&eacute;m foi que mudando
o tipo de quant(para int e unsigned long menor tempo ou long long foi
o maior tempo), o tempo tamb&eacute;m ser&aacute; alterado, imaginei que seria pelo 
motivo de aloca&ccedil;&atilde;o de mem&oacute;ria(unsigned int = unsigned long = 4Bytes e
long long = 8Bytes), por ser maior, o tempo de deslocamento tamb&eacute;m ser&aacute;.
Ah... devcpp e winXP deram esses tamanhos.

Aprop&oacute;sito, no primerio la&ccedil;o, n&atilde;o deveria ser apenas compara&ccedil;&atilde;o?
E n&atilde;o compara&ccedil;&atilde;o e troca?(foi o que fiz para dar o tempo acima)

E penso que esse calculo n&atilde;o est&aacute; certo, pois independente n&atilde;o diria
de SO, mas de poder de processamento e mem&oacute;ria, o tempo de compara&ccedil;&atilde;o deveria ser relativamente proporcional maior que tempo de
troca, e isso n&atilde;o est&aacute; acontecendo.

O mesmo c&oacute;digo do peczenyj, no winXp com devcpp

Qtde            Comp.   Troca
7000000          0       0
14000000        0       0
28000000        0       0
56000000        1       0
112000000       0       1
224000000       0       1
448000000       2       2
896000000       3       3
1792000000      7       7
3584000000      14      14


Me corrijam se falei besteira... hehe  :?

Answer

Aprop&oacute;sito, no primerio la&ccedil;o, n&atilde;o deveria ser apenas compara&ccedil;&atilde;o?
E n&atilde;o compara&ccedil;&atilde;o e troca?(foi o que fiz para dar o tempo acima) 

Aquele if d&aacute; sempre falso, nunca far&aacute; uma troca. Mas como eu disse dependendo do problema o compilador pode otimizar o codigo de uma certa maneira que nem sempre oferece o que precisamos mas... n&atilde;o acho que a diferen&ccedil;a seja t&atilde;o absurda assim. E se vc executar varias vezes vai ver que os valores alteram-se um pouco. o ideal seria fazer la&ccedil;os bem longos e ver como se compara com algo q leve minutos.

Seria mais interessante elaborar 2 programas, um usando compara&ccedil;&otilde;es e o outro trocar e testa-los pr&oacute;ximo das condi&ccedil;&otilde;es normais de uso (dentro do algoritmo gen&eacute;tico). De repente &agrave;s op&ccedil;&otilde;es de optimiza&ccedil;&atilde;o do compilador podem eliminar boa parte das diferen&ccedil;as. No mais &eacute; fazer um c&oacute;digo legivel.

Answer

Obrigado a todos, suas opini&otilde;es me deram muitas id&eacute;ias.
Eu pensei nessa id&eacute;ia de fazer em outra linguagem para comparar. Fortran &eacute; uma boa, mas h&aacute; anos n&atilde;o mexo.

tetim, foi mais ou menos essa a propor&ccedil;&atilde;o que consegui tamb&eacute;m. Mas n&atilde;o parece correta.

Quanto ao if, &eacute; isso que o peczenyj falou mesmo, mas botei por n&atilde;o imaginar outra forma. Mas, agora que vc disse, talvez fosse melhor testar com x = (max < j) e x = (x = y), n&atilde;o? Pelo menos a estrutura dos dois procedimentos ficaria mais similar, portanto talvez mais fiel..
Achei tamb&eacute;m que poderia ser pelo fato da mem&oacute;ria n&atilde;o ser muito requisitada, entao pensei em usar vetores muito grandes para for&ccedil;ar a pagina&ccedil;ao, mas n&atilde;o sei como fazer isso em C.

E, se vcs nao se incomodarem, posso at&eacute; colocar estes tempos, s&oacute; teria que saber qual a m&aacute;quina de vcs.

peczenyj, na verdade o problema &eacute; otimiza&ccedil;&atilde;o do shell sort, que tem performance m&eacute;dia de N^3/2, limite superior N^2, e o algoritmo gen&eacute;tico seria para conseguir uma sequ&ecirc;ncia de incrementos com uma performance melhor que essa, quem sabe perto do N log N do quick sort. Ent&atilde;o essa quest&atilde;o de avaliar a diferen&ccedil;a de peso computacional entre compara&ccedil;&otilde;es e trocas seria para passar essa informa&ccedil;&atilde;o ao algoritmo gen&eacute;tico que levaria isso em conta quando fosse verificar a aptid&atilde;o dos organismos.

Answer

A minha m&aacute;quina &eacute; um Sempron 2400+ 1.66Ghz de clock real...
Com 1024MB de RAM DDR PC3200, por&eacute;m trabalha a 333Mhz que &eacute; o FSB
do processador.
Eu acho que s&atilde;o as especifica&ccedil;&otilde;es que devem ser levadas em considera&ccedil;&atilde;o n&eacute;?
Se tiver mais alguma que precise, &eacute; s&oacute; pedir.

Answer

Athlon 1600 XP com 256 MB de mem&oacute;ria sapo.

Ferramentas

Mover Tópico