English
- +

14/10/2014

ARTIGO: Tudo que você sempre quiz saber sobre cálculo de amostra e nunca teve coragem de perguntar

1) Cálculo de amostra e poder estatístico são dois aspectos de um mesmo cálculo

Os dois conceitos normalmente fazem parte de um mesmo cálculo. Então, quando você calcula um, o outro é calculado também. A diferença entre os dois é contextual: normalmente pesquisadores fazem uma estimativa de tamanho de amostra em relação a um estudo onde os dados ainda serão coletados, enquanto que o poder estatístico é estimado quando os dados já existem e os pesquisadores gostariam de saber qual o poder de uma determinada análise. A convenção, normalmente, diz que poder estatístico é calculado quando um resultado não é estatisticamente significativo (o que quer dizer que você não rejeita a hipótese nula).

 

2) A relação entre erros tipo I e II, valores de Alfa e Beta, poder estatístico e tamanho de amostra

Esses termos são todos relacionados da seguinte maneira:

- Erro tipo I é a probabilidade de que o seu teste estatístico diga que existe uma relação estatisticamente significativa quando na verdade ela não existe (ou que você rejeita a hipótese nula quando ela não deveria ser rejeitada). Essa probabilidade é chamada de Alfa e a convenção em estatística clássica (ou de Fisher) é dizer que ela deve ser de 0,05 (5% ou 0.05 nos textos em inglês). Por exemplo: imagine um teste estatístico comparando os resultados de duas drogas que sejam semelhantes. Esse teste tem uma chance de 5% de dizer que uma é melhor do que a outra apesar de as duas serem semelhantes.

- Erro tipo II é a probabilidade de que o seu teste estatístico diga que não existe uma diferença estatisticamente significativa quando, na verdade, essa diferença existe. A convenção é que essa probabilidade seja estabelecida em 20% (0,2 ou 0.2), o que se chama o valor de Beta. Nesse caso, poder estatístico é, simplesmente, 1 menos Beta, ou seja: 1 - 0,2 = 0,8 = 80%.

- O tamanho de amostra depende tanto de Alfa quanto de Beta. Quanto menor o valor de Alfa ou de Beta (e portanto maior o poder estatístico), maior o tamanho de amostra necessária para demonstrar uma associação estatisticamente significativa (ou rejeitar a hipótese nula).

 

3) Alfa de 5% e poder estatístico de 80% são convenções sociais

Esses valores são convenções que se arrastam ao logo do tempo, mas não há nada nelas que seja sagrado ou "escrito na pedra". No entanto, por uma série de razões, das quais muitas estão ligadas à falta de conhecimento em estatísica pelas revistas, o valor de 0,05 é considenrado como algo rígido.

 

4) Parâmetros que você precisa saber para o cálculo de amostra: a diferença esperada entre dois grupos

Para calcular o tamanho de amostra você precisa necessariamente estimar a diferença que se espera entre dois ou mais grupos no seu estudo. Por exemplo, se eu quero comparar dois tratamentos (digamos duas drogas) em relação a um determinado desfecho (digamos qualidade de vida), eu tenho de estimar qual a diferença em relação a minha métrica de qualidade de vida que o tratamento venha a criar entre os dois desfechos.

Normalmente, essa diferença é estimada por um entre três métodos: (1) um estudo piloto, onde você conduz um pequeno estudo e determina o que seja essa diferença; (2) literatura prévia, onde alguém tenha feito um estudo semelhante; ou (3) uma estimativa, também conhecida com um “chute”. Veja o último item desse post sobre problemas potenciais com as alternativas 2 e 3.

Quanto maior a expectativa de diferença entre os dois grupos, maior será a estimativa de tamanho de amostra.

 

5) Parâmetros que você precisa saber para o cálculo de amostra: a variância de uma variável de desfecho contínua

Se o seu desfecho é uma variável contínua (por exemplo uma escala qualquer numérica, perda de peso, etc.), você deve também ter uma medida da variância dessa variável. Variância (desvio padrão é a raiz quadrada da variância) indica o quanto a sua medida “se espalha”. Por exemplo: se a sua medida tem valores muito semelhantes entre todos os seus participantes, ela terá uma variância baixa, enquanto que se a sua medida flutuar muito ela terá uma alta variância.

Quanto maior a variância da sua medida, maior o tamanho estimado da sua amostra.

Note que existem literalmente dezenas de fórmulas diferentes para cálculo de amostra, dependentes do tipo de análise que você venha a fazer, e então os dois parâmetros acima são simplesmente os mais comuns.

A dica é: sempre verifique com o seu estatístico ou cientista de dados.

 

6) Cálculo de amostra baseado em opiniões sobre parâmetros ou mesmo baseado em publicações prévias são facilmente manipuláveis

As maiores críticas sobre cálculo de amostra acontecem porque esses valores são extremamente fáceis de serem manipulados. Ou seja, com alterações pequenas, tanto em relação à diferença que você queira detectar entre os grupos ou, no caso de variáveis contínuas, em relação à variância esperada da amostra, o seu cálculo de amostra pode oscilar imensamente.

Obviamente, essa manipulação fica mais fácil se o autor puder escolher entre vários parâmetros extraídos de vários artigos onde ele irá escolher os que levem a uma amostra que seja confortável a ele.

Se esses mesmos parâmetros forem estimados (entenda-se “chutados”), então o cálculo de amostra passa a ser ainda mais facilmente fabricável.

 

Este artigo foi escrito pelo pesquisador Ricardo Pietrobon (MD, PhD Associate Professor Duke University, EUA), colaborador do IATS.

 

 

Edição: Luiz Sérgio Dibe