Comparando grupos de pacientes supostamente semelhantes que por acaso receberam tratamentos diferentes no mesmo período de tempo

A comparação de experiências e desfechos de grupos de pacientes aparentemente semelhantes, que por acaso receberam tratamentos diferentes no mesmo período, ainda é utilizada como tentativa de avaliar os efeitos dos tratamentos. Contudo, essa abordagem também pode ser gravemente enganadora. O desafio, como o de comparações usando “controles históricos”, é saber se os grupos de pessoas que recebem os tratamentos diferentes eram suficientemente semelhantes antes de começar o tratamento, para ser possível uma comparação válida. Em outras palavras, se semelhante estava sendo comparado com semelhante.

Tal como com os “controles históricos”, pesquisadores podem usar ajustes estatísticos e análises para tentar garantir que semelhante será comparado com semelhante, mas é possível somente se os recursos relevantes de pacientes nos grupos de comparação tiverem sido registrados e levados em consideração. Essas condições foram tão raramente cumpridas que essas análises devem ser sempre visualizadas com grande cautela. A crença nelas pode levar a tragédias maiores.
Um exemplo notável é a terapia de reposição hormonal (TRH). As mulheres que haviam usado TRH durante e após a menopausa foram comparadas com mulheres aparentemente semelhantes que não tinham usado essa terapia. Essas comparações sugeriam que a TRH reduzia o risco de ataques cardíacos e AVC – o que teriam sido notícias muito bem-vindas se fossem verdade. Infelizmente, não era o caso. As comparações subsequentes, que foram projetadas antes de o tratamento começar, garantindo que os grupos de comparação são semelhantes, revelou que a TRH teve exatamente o efeito oposto:
na verdade, aumentou os ataques cardíacos e o AVC (ver Capítulo 2). Nesse caso, a diferença aparente nas taxas de ataques cardíacos e AVC ocorreu porque as mulheres que usaram a TRH eram geralmente mais saudáveis do que aquelas que não usaram, e não em razão da TRH. A pesquisa, que não assegurou que semelhante foi realmente comparado a semelhante, pode resultar em danos para dezenas de milhares de pessoas.

Como a experiência da TRH indica, o melhor modo de garantir que semelhante é comparado com semelhante é formar os grupos de comparação antes de começar o tratamento. Os grupos precisam ser compostos por pacientes semelhantes não somente em termos de fatores conhecidos e mensuráveis, como idade e gravidade da doença, mas também em termos de fatores não mensuráveis que podem influenciar na recuperação da doença, como dieta, profissão e outros fatores sociais, ansiedade sobre a doença e tratamentos propostos. É sempre difícil, frequentemente impossível, confiar que os grupos de
tratamento são semelhantes, caso tenham sido formados após o começo do tratamento. A questão crítica é: as diferenças nos desfechos refletem as diferenças nos efeitos dos tratamentos sendo comparados ou as diferenças nos pacientes dos grupos de comparação?