FEP - Faculdade de Economia da Universidade do Porto



TIAE, Aula 4, 25 Fev. 2004

Pedro Cosme da Costa Vieira

pcosme@fep.up.pt

MEDIDAS DE LOCALIZAÇÃO OU DE TENDÊNCIA CENTRAL

Mediana

Quando a variável estatística não é cardinal (não existe escala quantitativa) não faz sentido calcular a média. Sendo que a variável estatística é ordinal, estando dividida em classes comparáveis apenas em qualidade (por exemplo, Muito Mau; Mau; etc.), como não podemos calcular o valor médio, devemos utilizar outra medida, a mediana para caracterizar o “valor central” da população.

A mediana é a classe em que a frequência acumulada é de 50% (metade dos indivíduos estão nessa classe ou abaixo dela).

Por exemplo, se 12.2% são “Muito Maus”, 35.7% são “Maus”, 25.2% são “Suficientes”, 19.7% são “Bons” e 7.2% são “Muito Bons”, então a classe mediana seria a “Suficiente”.

Como normalmente as classes centrais têm maior frequência relativa, a classe mediana é pouco sensível aos valores extremos, o que poderá ser uma vantagem (por não ser sensível a contaminações - outlier) mas tem como desvantagem que é a mesma para distribuições de frequência muito diferentes. Por exemplo, considerando outra distribuição de frequências com melhores resultados (6.9% “Muito Maus”, 30.9% “Maus”, 24.9% “Suficientes”, 25.1% “Bons” e 12.2% “Muito Bons”), mantém-se que a classe mediana é a “Suficiente”.

Um outlier (a tradução será um indivíduo que “cai fora”) é um indivíduo que não deveria pertencer à amostra porque pertence a outra população. Em termos práticos, será de desconfiar que um indivíduo é um outlier se for muito diferente dos outros indivíduos da amostra.

Mediana com variáveis cardinais

Agrupado em classes

A mediana também existe para variáveis cardinais. Neste caso, estando os indivíduos divididos em classes, podemos determinar a classe mediana como a que faz pelo menos metade dos indivíduos serem menores ou iguais. Também podemos interpolar linearmente a mediana para encontrar um valor.

No exemplo dos produtos per capita dos países, divididos em intervalos regulares de amplitude de 250 dólares americanos, temos que ]1750,2000] é a classe mediana. Em termos de interpolação linear vamos supor que a distribuição de indivíduos dentro da classe mediana é uniforme pelo que a frequência cumulante é uma linha.

[pic]

Sendo que ya=45.03% e yb=52.05%, a mediana vem igual a 1927 dólares:

[pic]

Dados não agrupados

No caso de termos os valores para cada indivíduos, temos que considerar, em termos teóricos, há o caso em que a amostra tem um número par de indivíduos e o caso em que esse número é impar.

Para determinarmos a mediana, primeiro ordenamos os indivíduos de forma crescente. Depois de ordenados, no caso de haver um número impar de indivíduos, a mediana é dada pelo indivíduo de ordem (N+1)/2. No caso de haver um número par de indivíduos, serve qualquer valor no intervalo [x(n/2), x(n/2+1)[. No entanto, é norma adoptar o valor intermédio desse intervalo Mediana = (x(n/2)+ x(n/2+1))/2.

Propriedades da mediana

As propriedades da mediana deriva de a soma ou produto (maior que zero) de uma constante não alterar a ordem relativa dos indivíduos. Se xi ( xj, então a + xi ( a + xj e a.xi ( a.xj. No caso da constante ser negativa, por haver uma inversão total da ordem, mantém-se a mediana.

a) A mediana de uma constante é a própria constante.

Como todos os indivíduos são idênticos, todos têm a mesma ordem pelo que a mediana é o valor assumido por qualquer um deles.

b) A mediana do produto de uma constante por uma variável estatística é igual ao produto da constante pela mediana variável estatística:

[pic]

c) A média mediana da soma de uma constante com uma variável estatística é igual à soma da constante com a mediana da variável estatística:

[pic]

Moda

No caso da variável estatística ser por classes não ordenáveis (por exemplo, as classes serem cores) não é possível calcular nem a média nem a mediana. Neste caso podemos identificar a classe com maior frequência relativa como a que melhor caracteriza o “centro” da amostra (já que estamos a falar de medidas de localização ou de tendência central). Esta classe chama-se classe modal ou apenas Moda.

Em termos de linguagem corrente, a moda representa exactamente o tipo de bem que é mais usado/consumido. Por exemplo, a moda em Portugal é tomar um café expresso depois do almoço.

Outro exemplo será que em Portugal as cores dos carros são 19.5% cinzento, 13.4% branca, 17.4% Vermelha, 32.5% preta, 7.5% prateada e 9.7% outra cor. Nesta distribuição, a moda é a cor preta (dados inventados).

Quando temos variáveis cardinais (ou ordinais) também podemos calcular a moda. Se o domínio estiver dividido por classes, a Moda corresponde à classe mais frequente. No caso de não estar dividido, a modo é o valor com maior número de indivíduos.

Se, por exemplo, pensarmos em termos de altura dos indivíduos, numa amostra com 100 indivíduos, não deve haver dois que tenham a mesma altura (medida em milímetros). Por causa desta dificuldade, normalmente a moda nas variáveis estatística contínua está associada ao conceito de “função distribuição teórica” que será tratada na disciplina de Estatística.

Propriedades da moda

Em termos qualitativos, a moda de uma população em que todos os indivíduos são caracterizados por uma constante é a própria constante; se multiplicarmos a variável estatística por uma constante, a moda também vem multiplicada pela constante; e se somarmos uma constante à variável estatística, a moda também vem somada por essa constante.

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download

To fulfill the demand for quickly locating and searching documents.

It is intelligent file search solution for home and business.

Literature Lottery

Related searches