Em primeiro lugar, não acho que existam muitas perguntas do tipo "É uma boa prática usar sempre o X no aprendizado de máquina" em que a resposta será definitiva. Sempre? Sempre sempre? Através de modelos paramétricos, não paramétricos, Bayesianos, Monte Carlo, ciências sociais, puramente matemáticos e milhões de modelos de recursos? Isso seria bom, não seria!
Porém, concretamente, aqui estão algumas maneiras em que: depende.
Algumas vezes, quando a normalização é boa:
1) Vários algoritmos, em particular SVMs vêm à mente, às vezes podem convergir muito mais rápido em dados normalizados (embora por que, precisamente, eu não me lembre).
2) Quando seu modelo é sensível à magnitude e as unidades de dois recursos diferentes são diferentes e arbitrárias. É como o caso que você sugere, em que algo obtém mais influência do que deveria.
Mas é claro - nem todos os algoritmos são sensíveis à magnitude da maneira que você sugere. Os coeficientes de regressão linear serão idênticos se você fizer ou não dimensionar seus dados, porque estão observando relações proporcionais entre eles.
Algumas vezes, quando a normalização é ruim:
1) Quando você deseja interpretar seus coeficientes e eles não se normalizam bem. A regressão em algo como o dinheiro fornece um resultado significativo. A regressão na proporção do máximo de dólares na amostra pode não.
2) Quando, na verdade, as unidades em seus recursos são significativas e a distância faz fazer diferença! De volta aos SVMs - se você está tentando encontrar um classificador de margem máxima, as unidades que entram nesse 'máximo' são importantes. O escalonamento de recursos para algoritmos de agrupamento pode alterar substancialmente o resultado. Imagine quatro clusters ao redor da origem, cada um em um quadrante diferente, todos bem dimensionados. Agora, imagine o eixo y sendo alongado até dez vezes o comprimento do eixo x. em vez de quatro pequenos grupos de quadrantes, você obterá a longa baguete amassada de dados cortada em quatro pedaços ao longo de seu comprimento! (E, a parte importante é que você pode preferir qualquer um desses!)
No resumo certamente insatisfatório, a resposta mais geral é que você precisa se perguntar seriamente o que faz sentido com os dados, e o modelo que você está usando.