Função para validar parâmetro numérico em C

Question

Estou criando uma fun&ccedil;&atilde;o em C para validar um par&acirc;metro passado por linha de comando (mais precisamente, por optarg do getopt). A ideia &eacute; que a fun&ccedil;&atilde;o verifique se o par&acirc;metro &eacute; um n&uacute;mero. Eu fiz o seguinte:

int is_valid_number(char str[])
{
    int cnt, resp;
    
    #define SIZE sizeof( str ) / sizeof( char )
    
    resp = 0;
    
    for (cnt = 0; cnt < SIZE; cnt++)
    {
        if ( isdigit(str[cnt]) )
        {
            printf(%d %c e digito
, cnt, str[cnt]);
            resp = 1;
        }
        else
        {
            printf(%d %c nao e digito
, cnt, str[cnt]);
            return(0);
        }
    }
    printf(%d %s
, resp, str);
    return(resp);
}

O problema &eacute; que, ao executar com qualquer par&acirc;metro, digamos 122, o resultado obtido &eacute; esse:

0 1 e digito
1 2 e digito
2 2 e digito
3  nao e digito

Aparentemente, ele est&aacute; pegando o terminador \0 e o interpretando. O que eu poderia fazer para que isso n&atilde;o ocorresse?

Grato.

Answer

[FONT=monospace]Subtraia 1 do SIZE no for[/FONT]
[FONT=monospace][FONT=monospace]
[/FONT]
for (cnt = 0; cnt < SIZE-1; cnt++)[/FONT]

Answer

&Eacute; muito mais simples voce usar a fun&ccedil;&atilde;o strtol(): http://www.cplusplus.com/reference/cstdlib/strtol/

Answer

aquela assertiva esta correta? a do SIZE? pelo que sei pode ser usado para dados est&aacute;ticos n&atilde;o? e como os dados est&atilde;o sendo inseridos de forma din&acirc;mica a&iacute; acho que pode ser o motivo do erro, sei l&aacute;, tentaria strlen() l&aacute; s&oacute; para testar.

A linha de comandos geralmente &eacute; terminada por um CR ou CRLF (0x0a,0x0d), apenas depois &eacute; que vem o 0x00. Bom, ao menos &eacute; o que vejo no linux e windows, da&iacute; achar que o erro t&aacute; na declara&ccedil;&atilde;o #define. N&atilde;o emitiu nenhuma aviso na hora de compilar!?

Bom, se falei besteira apenas ignore, a inten&ccedil;&atilde;o &eacute; ajudar.

Answer

Aparentemente, ele est&aacute; pegando o terminador \0 e o interpretando. O que eu poderia fazer para que isso n&atilde;o ocorresse?

Voc&ecirc; est&aacute; correto. E esta &eacute; na verdade a grande sacada. O caractere nulo &eacute; o caractere utilizado como indicador do final de uma string na linguagem C. Isso significa que para analisar uma string do come&ccedil;o ao fim, voc&ecirc; n&atilde;o precisa saber o seu tamanho. Basta percorre-la at&eacute; encontrar o caractere nulo. Quando voc&ecirc; encontra o caractere nulo, voc&ecirc; sabe que chegou ao fim da string. No caso da sua fun&ccedil;&atilde;o, voc&ecirc; percorre a string do come&ccedil;o at&eacute; o final. Se em algum momento antes do final voc&ecirc; encontrar um caractere que n&atilde;o seja um d&iacute;gito num&eacute;rico, ent&atilde;o a string n&atilde;o &eacute; um n&uacute;mero v&aacute;lido (de acordo com a sua regra). Se voc&ecirc; chegar ao final da string sem encontrar um caractere que n&atilde;o &eacute; um digito num&eacute;rico, ent&atilde;o ela &eacute; um numero v&aacute;lido. Sua fun&ccedil;&atilde;o poderia ser assim:

[PHP]int is_valid_number(char str[]){    while(*str) if(!isdigit(*str++)) return 0;    return 1;}[/PHP]

nesse caso, o valor de retorno &eacute; 0 se a string for um n&uacute;mero inv&aacute;lido, e 1, caso ela represente um n&uacute;mero v&aacute;lido.

Answer

mas e se houverem espa&ccedil;os ou aspas no meio dos par&acirc;metros, ent&atilde;o a quest&atilde;o muda de figura n&eacute;!? Pois vai retornar n&uacute;mero inv&aacute;lido e mesmo assim existem n&uacute;meros v&aacute;lidos ap&oacute;s o inv&aacute;lido. Mas a&iacute; checando o argv/argc daria pra sanar esse empecilho.

Sendo franco, eu faria no dedo ao inv&eacute;s de chamar fun&ccedil;&otilde;es, digo, sempre fiz no dedo esse tipo de checagem. Compararia se o caracter esta entre 0 e 9 e o validaria-o, caso encontrasse algum 0x0d,0x0a,0x09,0x20,..., ignoraria e se encontrasse um 0x00 terminaria, mas com argv/argc fica bem mais f&aacute;cil.

[quote=ripongao, post: 6814338]
A linha de comandos geralmente &eacute; terminada por um CR ou CRLF  (0x0a,0x0d), apenas depois &eacute; que vem o 0x00. Bom, ao menos &eacute; o que vejo  no linux e windows, da&iacute; achar que o erro t&aacute; na declara&ccedil;&atilde;o #define. N&atilde;o  emitiu nenhuma aviso na hora de compilar!? 
[/quote]
Fiz um teste aqui agora no windows e ele remove o CRLF da linha de comandos, a termina&ccedil;&atilde;o &eacute; 0x00. Ent&atilde;o, havia falado besteira mesmo, agora confirmei.

Uma d&uacute;vida:
O #define que citei acima, esta errado?!? Em C &eacute; poss&iacute;vel fazer aquilo de forma din&acirc;mica ao inv&eacute;s de est&aacute;tica?

Answer

[quote=ripongao, post: 6816976]mas e se houverem espa&ccedil;os ou aspas no meio dos par&acirc;metros, ent&atilde;o a quest&atilde;o muda de figura n&eacute;!? Pois vai retornar n&uacute;mero inv&aacute;lido e mesmo assim existem n&uacute;meros v&aacute;lidos ap&oacute;s o inv&aacute;lido. Mas a&iacute; checando o argv/argc daria pra sanar esse empecilho.
[/quote]

Um n&uacute;mero n&atilde;o tem espa&ccedil;os no meio, se tiver, &eacute; mais de um n&uacute;mero. Mas, ai entramos na filosofia, porque depende da defini&ccedil;&atilde;o do que &eacute; uma entrada v&aacute;lida no programa e at&eacute; mesmo de como seria a entrada do programa, pelo que entendi da pergunta, n&atilde;o importa. Porque ele est&aacute; testando se uma string &eacute; um n&uacute;mero ou n&atilde;o, n&atilde;o est&aacute; analisando o formato de entrada da string para verificar se existem n&uacute;meros ou n&atilde;o, s&atilde;o perguntas diferentes.

Eu, particularmente, gostei muito da abordagem do pflynn.

Inclusive porque o caractere especial pode mudar de SO e tamb&eacute;m possibilita incluir testes para caracteres que realmente podem representar um n&uacute;mero mais adiante, durante a evolu&ccedil;&atilde;o de um programa, com a virgula ou o ponto, ou mesmo o teste para verificar se &eacute; um n&uacute;mero negativo.

Abs.

Answer

Realmente o exemplo do espa&ccedil;o e aspas que eu disse foi infeliz, eu n&atilde;o consegui me expressar, e como n&atilde;o trampo com C prefiro nem alongar, fora da minha al&ccedil;ada.

Answer

[quote=ripongao, post: 6817026]Realmente o exemplo do espa&ccedil;o e aspas que eu disse foi infeliz, eu n&atilde;o consegui me expressar, e como n&atilde;o trampo com C prefiro nem alongar, fora da minha al&ccedil;ada.[/quote]

Voc&ecirc; tem raz&atilde;o quando questiona a macro:

[quote=ripongao, post: 6817026]
Uma d&uacute;vida:
O #define que citei acima, esta errado?!? Em C &eacute; poss&iacute;vel fazer aquilo de forma din&acirc;mica ao inv&eacute;s de est&aacute;tica?
[/quote]

A macro

[php]#define SIZE sizeof( str ) / sizeof( char )[/php]n&atilde;o retorna o tamanho da string como pode parecer. sizeof &eacute; em um operador especial. &Eacute; um operador em tempo de compila&ccedil;&atilde;o. Isso significa que sizeof retorna o valor da opera&ccedil;&atilde;o em tempo de compila&ccedil;&atilde;o. No caso:

[php]sizeof(str)[/php]retorna o valor do tamanho de um ponteiro para char se str for um char[], como foi o caso. Esse valor &eacute; dependente de plataforma. Num sistema de 64 bits, sizeof(char[]) retorna 8 (8 bytes = 64 bits = tamanho de um ponteiro). Podemos dizer que o loop que avalia o tamanho da string funcionou por sorte. Por sorte porque os argumentos testados foram todos strings de tamanho menor do que 8 bytes (122, por exemplo, que tem quatro bytes - incluindo o terminador nulo) - assumindo, claro, que os testes foram feitos num sistema de 64 bits. Se o teste for feito com uma string de tamanho maior do que 8 bytes, o comportamento do programa &eacute; indefinido. O bug, em quest&atilde;o, &eacute; um bug de estouro de buffer (o famoso buffer overflow).

[EDIT] Na verdade n&atilde;o &eacute; um bug de buffer overflow, como eu disse incorretamente. O problema &eacute; que o programa n&atilde;o vai avaliar mais do que sizeof(char[]) caracteres numa string. Em 64 bits, isso significa que a fun&ccedil;&atilde;o ficou limitada a analisar, no m&aacute;ximo, 8 caracteres.

Answer

sim, essa era a id&eacute;ia que eu tinha em mente, se fosse windows/linux 32 bits seriam 4 bytes, e caso ms-dos seria 16 bits, afinal, &eacute; a primeira coisa que muda ao evoluir a arquitetura, depois vir&atilde;o 128, 256,... . A&iacute; haveria o estouro ou at&eacute; mesmo a inser&ccedil;&atilde;o de um n&uacute;mero v&aacute;lido por&eacute;m truncado, no caso gerando um outro n&uacute;mero ao inv&eacute;s do entrado pelo usu&aacute;rio.

Sobre o anterior, a id&eacute;ia que quis passar era a de testar via linha de comandos versus pedir a string internamente no programa atrav&eacute;s de um scanf() por exemplo (nota: n&atilde;o sei se scanf deixa o 'enter' no buffer).
Pela linha de comandos, tanto no windows/linux/ms-dos o enter digitado pelo teclado &eacute; removido ao chamar a fun&ccedil;&atilde;o nativa de cada S.O., assim sendo a vari&aacute;vel ir&aacute; armazenar apenas o n&uacute;mero seguido de zero ou null ou terminador da string melhor falando, lembrando que no ms-dos a termina&ccedil;&atilde;o de string &eacute; um cifr&atilde;o para fun&ccedil;&otilde;es nativas, mas devido ao t&oacute;pico ser sobre C, ent&atilde;o optei por n&atilde;o comentar isso, sendo que em C toda string &eacute; terminada em nulo. 
O que supus foi que o usu&aacute;rio testou via linha de comandos para ap&oacute;s inserir ou criar uma biblioteca com esta fun&ccedil;&atilde;o, e a&iacute; pode acontecer o problema do 'enter' aparecer no restante do n&uacute;mero, no caso, ao fim do n&uacute;mero quando armazenado em uma vari&aacute;vel/buffer qualquer, retornando um 'n&uacute;mero n&atilde;o v&aacute;lido' atrav&eacute;s da fun&ccedil;&atilde;o chamada caso inteiro com sinal, ou 'nan' caso ponto flutuante.

Como n&atilde;o uso geralmente fun&ccedil;&otilde;es para tal, desconhe&ccedil;o todas as fun&ccedil;&otilde;es que lidam com s&iacute;mbolos num&eacute;ricos citadas, talvez as mesmas fa&ccedil;am verifica&ccedil;&atilde;o sobre caracteres a mais ao fim do n&uacute;mero e a removam, da&iacute; eu n&atilde;o me aventurar a responder, apesar de poder fazer uns testes chamando as fun&ccedil;&otilde;es em qualquer linguagem, prestando apenas aten&ccedil;&atilde;o na conven&ccedil;&atilde;o de chamadas.

Answer

Andremachado, verifique todas as posi&ccedil;&otilde;es do array com as fun&ccedil;&otilde;es de verifica&ccedil;&atilde;o de caractere do header , retorne falso se houver uma primeira ocorr&ecirc;ncia de um car&aacute;cter n&atilde;o num&eacute;rico.

Abra&ccedil;os.

Answer

Ainda n&atilde;o entendi porque n&atilde;o utiliza a strtol(), sendo que ela faz tudo isso pra voc&ecirc;.

Answer

[quote=Fergo, post: 6817613]Ainda n&atilde;o entendi porque n&atilde;o utiliza a strtol(), sendo que ela faz tudo isso pra voc&ecirc;.[/quote]
O problema &eacute; que strtol n&atilde;o leva em conta os caractere n&atilde;o num&eacute;ricos, ou seja, enviar uma string assim 1672aabnsj retorna 1672 (quando n&atilde;o deveria retornar coisa alguma), e n&atilde;o podemos efectuar uma valida&ccedil;&atilde;o num&eacute;rica deste jeito.
http://www.cplusplus.com/reference/cstdlib/strtol/

Abra&ccedil;os.

Answer

int is_valid_number(char str[])
{
    int cnt, resp;
    
    #define SIZE sizeof( str ) / sizeof( char )
    
    resp = 0;
    
    for (cnt = 0; cnt < SIZE; cnt++)
    {
        if ( isdigit(str[cnt]) )
        {
            printf(%d %c e digito
, cnt, str[cnt]);
            resp = 1;
        }
        else if(  (strcmp(str[cnt], '\0'))  ) //S&oacute; imprime o resultado negativo se o dado n&atilde;o for um espa&ccedil;o
        {
            printf(%d %c nao e digito
, cnt, str[cnt]);
            return(0);
        }
    }
    printf(%d %s
, resp, str);
    return(resp);
}Adicionei um condicional que n&atilde;o imprime o resultado negativo caso o dado seja '\0'. N&atilde;o testei o c&oacute;digo, espero que ajude.

Answer

mas &ocirc; C#, comentei isso, o #define &eacute; est&aacute;tico em tempo de compila&ccedil;&atilde;o e o n&uacute;mero/tamanho de par&acirc;metros din&acirc;mico em tempo de execu&ccedil;&atilde;o do programa.
Olhar resultado negativo &eacute; olhar o bit mais &agrave; esquerda de um n&uacute;mero (complemento de 2) , se for 1 &eacute; negativo, se for 0 &eacute; positivo pois estamos lidando com 'int' (32 bits). Se fosse sem sinal a&iacute; qualquer valor &eacute; um valor v&aacute;lido.
Por ser 32 bits com sinal, pe&ccedil;o para entrar um n&uacute;mero maior que o bit mais &agrave; esquerda setado em 32 bits, algo como 2147486648 ou maior.

modo capit&atilde;o nascimento on
t&aacute; querendo sacanear a gente 01, pera&iacute;, segura essa granada se dormir a gente vai pro brejo, tacando buffer overflow u&eacute;
modo capit&atilde;o nascimento off

Ferramentas

Mover Tópico