PROBABILIDADE E ESTATÍSTICA

Essa matéria cai bastante em qualquer prova da banca. Na Petrobras, às vezes cai mais probabilidade, outras vezes, estatística. Fiquei com a impressão que, nas provas para Administrador, caem conceitos mais "diferentões". (Se tiver alguma dica, método muito tosco, não ligue, eu escrevi para mim.) Comentários sempre são bem-vindos.

Petrobras – Eng. de Produção 2008
49
O salário médio anual pago a todos os empregados de uma Companhia foi de R$ 500,00. Os salários médios anuais pagos aos empregados dos sexos masculino e feminino foram de R$ 520,00 e R$ 420,00, respectivamente. As porcentagens de empregados homens e mulheres, respectivamente, são:
(A) 65% e 35%             (B) 70% e 30%             (C) 75% e 25%             (D) 80% e 20%             (E) 85% e 15%

Resolução
Considerando x = porcentagem de homens e y = porcentagem de mulheres
x + y = 100%
x*520 + y*420 = 500
Resolvendo o sistema temos que x=80% e y=20%.
Alt D.

Petrobras – Eng. Produção 2010
38
Um estudo sobre fidelidade do consumidor à operadora de telefonia móvel, em uma determinada localidade, mostrou as seguintes probabilidades sobre o hábito de mudança:

A probabilidade de o 1° telefone de um indivíduo ser da operadora A é 0,60; a probabilidade de o 1° telefone ser da operadora B é de 0,30; e a de ser da operadora C é 0,10. Dado que o 2° telefone de um cliente é da operadora A, a probabilidade de o 1° também ter sido é de
(A) 0,75                        (B) 0,70                        (C) 0,50                        (D) 0,45                        (E) 0,40

Resolução


Existem 3 "caminhos" para que o segundo telefone seja A: 
1. começou com A (0,6) e continuou com A (0,5)
2. começou com B (0,3) e mudou para A (0,2)
3. começou com C (0,1) e mudou para A (0,4).
A probabilidade de o segundo ser A então é (e=* e ou=+): 0,6*0,5 + 0,3*0,2 + 0,1*0,4 = 0,4.

Ou seja, sabendo que o segundo tel é A, um dos 3 caminhos foi utilizado.

Qual a probabilidade de ter vindo de A? Lembre-se sempre que probabilidade é uma parte dividida pelo total, pelo cenário, pelo universo e o nosso universo é 0,4 (todos os caminhos). A “parte” de A é o caminho de AA: 0,6*0,5=0,3.
Então, sabendo o universo de A, a probabilidade de ter vindo de A é 0,3/0,4 = 0,75. Alt A.

39
Um jogo consiste em lançar uma moeda honesta até obter duas caras consecutivas ou duas coroas consecutivas. Na primeira situação, ao obter duas caras consecutivas, ganha-se o jogo. Na segunda, ao obter duas coroas consecutivas, perde-se o jogo. A probabilidade de que o jogo termine, com vitória, até o sexto lance, é
(A) 7/16                        (B) 31/64                      (C) 1/2              (D) 1/32                        (E) 1/64

Resolução
Considerando K = cara e C = coroa e lembrado que KK ganha, CC perde, as possibilidades de ganhar são:
1º lance
2º lance
3º lance
4º lance
5º lance
6º lance
Probabilidade de acontecer
K
K




½*½=1/4
C
K
K



½*½*½=1/8
K
C
K
K


½*½*½*½=1/16
C
K
C
K
K

½*½*½*½*½=1/32
K
C
K
C
K
K
½*½*½*½*½*½=1/64
Somando 1/4+1/8+1/16+1/32+1/64 = 31/64. Alt B.

40
Considere as seguintes distribuições:

Sabe-se que 1% dos municípios com mais de 100.000 habitantes não possuem unidades de ensino superior, estádios ou ginásios poliesportivos, nem cinema. Nessa faixa de população, o número de municípios que possuem as três características, é, aproximadamente,
(A) 94               (B) 170             (C) 210             (D) 226             (E) 255

Resolução
(Resolvi assim, mas não tenho certeza...)
Analisando a primeira e a última coluna, se em 81% das cidades tem ensino superior e em 81% das cidades tem ensino superior e estádio, todas as cidades que têm ensino superior também tem estádio. Na penúltima coluna, vemos que 64% têm ensino superior e cinema, oras, se dissemos que onde tem ensino superior tem estádio, então nesses 64% tem ensino superior e estádio e cinema. Os municípios com mais de 100 mil são 266 (229+37), então 64% de 266 são 170 municípios. Não importa a informação dada, que 1% não tem nada, porque ela está no gráfico (não tenho certeza dessa resolução, mas foi a única maneira que encontrei). Alt B.

Petrobras – Eng. Produção 2011
32
Uma rede de cursos preparatórios para o vestibular, que possui mil alunos matriculados, apurou que as notas de seus simulados de matemática têm média 63 e desvio padrão igual a 10.
Tomando a distribuição dessas notas como normal, analise as assertivas abaixo (se necessário utilize a tabela anexada no final do caderno).
I – Mais de quarenta alunos têm nota acima de 80.
II – Menos de 70% das notas estão compreendidas no intervalo entre 53 e 78 pontos.
III – Na rede, o percentual de notas abaixo de 48 é superior a 10%.
IV – Mais da metade das notas estão acima de 63.
É correto APENAS o que se afirma em
(A) I                             (B) II                (C) IV               (D) I e III                      (E) II e IV

Resolução
Média (µ)= 63. Desvio (σ)= 10.

Em I, Z= (80-63)/10 = 1,7. Procurando 1,7 na tabela, 0,455. Acima de 80 é a parte amarela do gráfico, então 0,5-0,455 = 0,045 = 4,5%. De 1000 alunos, 4,5% são 45 alunos. Correta.

II- Para X=53 pontos, Z=(53-63)/10=-1 (lado esquerdo). Para X=78 pontos Z=(78-63)/10=1,5. Procurando na tabela, para Z=1 a probabilidade é 0,34. E Z=1,5 é 0,43. A probabilidade de estar entre 53 e 78 é toda a área cinza. Somando, 0,34+0,43=0,77. Afirmativa errada, é mais que 70%.

III – Para X=48 pontos, Z=(48-63)/10=1,5, pela tabela, 0,43. Abaixo de 48 é a área verde do gráfico. 0,5-0,43 = 7%. Afirmativa errada, é inferior a 10%.

IV – 63 é a média, é o centro do gráfico, então, metade está acima e metade, abaixo. Errada.

Apenas I correta. Alt A.

33
Numa determinada eleição, sabe-se que 75% dos eleitores já escolheram seu candidato, ao passo que os demais estão indecisos. Tomando uma amostra aleatória de três eleitores, NÃO procede a seguinte afirmação:
(A) A probabilidade de que os três eleitores da amostra sejam indecisos é inferior a 2%.
(B) A probabilidade de que haja pelo menos um eleitor indeciso na amostra está entre 55% e 60%.
(C) A probabilidade de que haja pelo menos um eleitor decidido na amostra está entre 55% e 60%.
(D) É maior do que 40% a probabilidade de que a amostra contenha um eleitor indeciso.
(E) É maior do que 80% a probabilidade de a amostra apresentar pelo menos dois eleitores decididos.

Resolução
Se 75% estão decididos (D), 25% estão indecisos (I). Vamos analisar item por item, se fosse na prova, comece analisando B e C, pois são bem parecidas. A amostra é de 3.
A) 3 indecisos: I I I =  0,25*0,25*0,25 = 1,5%, é menor que 2%, correta.

B) Pelo menos um indeciso, as possibilidades são sete: DDI ou DID ou IDD ou IID ou IDI ou DII ou III, substitua D=0,75 I=0,25 e “ou” por + (soma). Entretanto, há uma maneira mais simples de se pensar: se pede pelo menos um indeciso, quer dizer que se todos estiverem decididos (DDD) e nós tirarmos esse grupo de DDD do total (100% = 1), vão sobrar grupos com pelo menos um I. Isto é: 1-DDD = 1-0,75*0,75*0,75 = 1-0,42 = 0,58. Correta.

C) Raciocinando da maneira simplificada da letra anterior, a probabilidade de que haja pelo menos um decidido é: 1-III = 1-0,25*0,25*0,25 = 0,985, essa é a errada.

D) Um eleitor indeciso, as possibilidades são: IDD ou DID ou DDI = 0,25*0,75*0,75 + 0,75*0,25*0,75 + 0,75*0,75*0,25 = 42,2%. Ou poderia fazer 3*(0,25*0,75*0,75), porque D, D e I permutam três vezes. Correta.

E) Pelo menos dois decididos, as possibilidades são: DDI ou DID ou IDD ou DDD = 0,75*0,75*0,25 + 0,75*0,25*0,75 + 0,25*0,75*0,75 + 0,75*0,75*0,75 = 84%. Correta.

A alternativa errada que é a resposta é alt C.

34
Uma indústria de alimentos afirma que seus enlatados têm durabilidade média de 60 meses, e o desvio padrão correspondente é de 6 meses. Periodicamente, o fabricante retira uma amostra de tamanho n para realizar testes de qualidade. Com base nessas informações, afirma-se que, para uma amostra
Obs.: Use a tabela anexada no final do caderno, se necessário.
(A) de 36 unidades, a probabilidade de que a durabilidade do produto esteja no intervalo de 1 mês em torno da média é superior a 60%.
(B) de 36 unidades, a probabilidade de que a durabilidade do produto esteja no intervalo de 1 mês em torno da média é de 13,5%.
(C) de 36 unidades, o tempo de vida médio esperado do produto é de 66 meses.
(D) de 100 unidades, a probabilidade de que a durabilidade do produto esteja no intervalo de 1 mês em torno da média não chega a 80%.
(E) de 100 unidades, o tempo de vida médio esperado do produto é de 66 meses.

Resolução
Como falou em “amostra” e “em torno da média” (nas alternativas), então precisamos do “Teorema Central do Limite”. A única diferença é que ao calcular Z, o desvio padrão é dividido pela raiz da amostra (n). µ=60 σ=6
A) 1 mês em torno da média é entre 59 e 61. Como é simétrica, a probabilidade entre 60-61 é a mesma que 59-60, então podemos calcular apenas para 61 e multiplicar por dois. n=36. Z=(61-60)/(6/raiz de 36+ = 1 . Pela tabela: 0,34. Multiplicando por 2: 0,34*2 = 68%. Alternativa certa.

B) Como vimos na letra A, não é de 13,5%. O certo é 68%.

C) Saber se a média da amostra é similar a média da população é complicado. Mas considerando isto e que as 36 unidades foram tiradas perto da média, então a média é a mesma.

D) Z=1,66 , na tabela, 0,451. Multiplicando por 2, 90,2% é a probabilidade. Isso é maior que 80%.
E) Mesma resposta para C.

A correta é alt A.

Petrobras – Eng. Produção 2012
31
Ensaios em laboratório, tendo probabilidade θ (desconhecida) de sucesso em cada tentativa, são realizados sucessiva e independentemente até a ocorrência do primeiro sucesso. Para cada realização experimental, seja X a variável aleatória que representa o número de ensaios realizados até a ocorrência do primeiro sucesso.
Se quatro realizações são feitas em laboratório, obtendo-se a amostra {3, 3, 4, 5}, o estimador de máxima verossimilhança para θ, à luz dessa amostra, é dado por

Resolução (dos comentários)
São feitas 15 experimentos (3+3+4+5).
ocorreram 4 falhas.
o tetha é probabilidade de sucesso, que é dado por 4/15

35
Um fábrica produz dois tipos de engates rápidos para mangueiras (A e B). Os clientes costumam encomendar tais itens, em combinações variadas, com diferentes frequências, como está demonstrado no quadro.
Combinação dos itens pedidos Frequência de pedidos
A                                             0,3
B                                             0,2
A,B                                          0,5
Estando qualquer um dos itens em falta no estoque, o pedido inteiro fica retido em carteira, a fim de evitar o acréscimo de custos adicionais de embarque. Os níveis de estoque foram estabelecidos de tal forma que o nível comum de serviço para o engate tipo A é de 80% e, para o engate tipo B, é de 90%. A meta de serviço de estoque da fábrica é de 90%. Logo, o índice médio ponderado de atendimento é igual a
(A) 0,72                        (B) 0,78                        (C) 0,79                        (D) 0,81                        (E) 0,90

Resolução
Índice médio ponderado não é uma fórmula específica, é uma simples média ponderada. O exercício é de probabilidade, quer saber a probabilidade média de atendimento. A probabilidade de atendimento é:
Nível A*freq.A + Nível B*freq.B + Nível A*Nível B*freq.A,B = 0,8*0,3 + 0,9*0,2 + 0,8*0,9*0,5 = 0,78.
A meta citada de 90% não serve pra nada no exercício. Alt B.

38
10% dos parafusos produzidos por uma máquina são defeituosos.
A probabilidade de que, entre 4 parafusos, pelo menos 3 não sejam defeituosos é de
(A) 29,16%                   (B) 65,61%                   (C) 94,77%                   (D) 98,37%                   (E) 99,99%

Resolução
Defeituoso (D): 10% = 0,1
Bom (B): 90% = 0,9.
De 4, pelo menos 3 bons, as possibilidades são três serem bons ou os quatro serem bons:
BBBD = 0,9*0,9*0,9*0,1 = 0,073
BBDB = 0,9*0,9*0,1*0,9 = 0,073
BDBB = 0,9*0,1*0,9*0,9 = 0,073
DBBB = 0,1*0,9*0,9*0,9 = 0,073
BBBB = 0,9*0,9*0,9*0,9 = 0,65
Somando: 4*0,073 + 0,6 = 0,94. Alt C.

39
Uma empresa possui uma frota de 20 veículos. O número de veículos, para cada intervalo de idade (em anos) da frota, é mostrado na tabela.

Verifica-se, assim, que a idade média da frota da empresa, em anos, equivale a
(A) 3                 (B) 4,2              (C) 4,5              (D) 4,6              (E) 5

Resolução
Como está em intervalo de classe, temos que pegar cada ponto médio da idade. O número de veículos é a frequência e frequência sempre é o “peso”.
Ponto Médio da Classe
Nº de veículos

2
7
2*7=14
4
5
4*5=20
6
4
6*4=24
8
3
8*3=24
10
1
10*1=10

Soma: 20
Soma:92
É uma média ponderada, nela, sempre multiplica as pesos pelos dados, soma tudo e divide pela soma dos pesos. 92/20 = 4,6. Alt D.

Petrobras – Administrador 2010 Maio
12
Em um posto de combustíveis entram, por hora, cerca de 300 clientes. Desses, 210 vão colocar combustível, 130 vão completar o óleo lubrificante e 120 vão calibrar os pneus. Sabe-se, ainda, que 70 colocam combustível e completam o óleo; 80 colocam combustível e calibram os pneus e 50 colocam combustível, completam o óleo e calibram os pneus. Considerando que os 300 clientes entram no posto de combustíveis para executar uma ou mais das atividades acima mencionadas, qual a probabilidade de um cliente entrar no posto para completar o óleo e calibrar os pneus?
(A) 0,10                        (B) 0,20                       (C) 0,25                        (D) 0,40                        (E) 0,45

Resolução
A questão mistura diagramas de círculos e probabilidade. No diagrama, comece pelos 50 que fazem as três atividades, porque os 70 e os 80 não fazem só as duas! Ou seja, tem que subtrair 80-50 e 70-50 para chegar ao valor dos que fazem apenas as duas atividades. E a questão não pede os clientes que APENAS completam o óleo e calibram. 60/300=0,2. Alt B.

13
Uma loja de conveniência localizada em um posto de combustível realizou um levantamento sobre o valor das compras realizadas pelos seus clientes. Para tal tomou uma amostra aleatória de 21 compras, que apresentou, em reais, o seguinte resultado:

A mediana dessa série de observações é
(A) 15,50                      (B) 18,00                      (C) 18,30                      (D) 28,50                      (E) 34,00

Resolução
Mediana é uma medida de posição, ou seja, o que a define é a posição, não o valor. É o elemento do meio, que divide a amostra ao meio, para isso, tem que estar em ordem. Por exemplo: [2,3,2,2,2,7,8], colocando na ordem fica [2,2,2,2,3,7,8], a mediana é o quarto 2, de um lado ficam três elementos e do outro, também três. Para resolver essa questão, tem que colocá-los na ordem e, como são 21 elementos, pegar o 11º (ele divide em duas partes de dez elementos cada). 7,20 – 8,70 – 10,30 – 10,80 – 13,40 – 14,00 – 15,50 – 15,50 – 15,50 – 17,00 – 18,00. O 11º é o 18. Alt B.

14
Uma amostra aleatória da quantidade de litros de combustível abastecida por 16 carros em um posto de combustível apresentou, em litros, o seguinte resultado:

A amplitude interquartil dessa série de observações é
(A) 3                 (B) 10              (C) 13               (D) 17              (E) 22

Resolução
Colocando na ordem, fica [10, 12, 15, 15 |Q1| 18, 20, 20, 22 |Q2|  22, 25, 25, 28 |Q3| 30, 30, 30, 32]. Quartis dividem a amostra em quatro partes, como são 16 elementos, ¼ de 16 é 4. Mas “Quartil” é a divisão, não os pedaços! Quartil é Q1 (quartil inferior), Q2 (mediana) e Q3 (quartil superior), precisamos de três quartis para dividir a amostra em quatro partes. A amplitude quartil é Q3 – Q1, representados pelo último elemento de cada um deles, 28-15 = 13. Alt C.

63
No histograma acima, os pontos médios das classes inicial e final são 40 e 80, respectivamente. Sabendo-se que todas as classes têm a mesma amplitude, a estimativa adequada para a média e para a mediana dessa distribuição são, respectivamente,

(A) 59,5 e 59,5              (B) 59,5 e 60                 (C) 60 e 59                   (D) 60 e 59,5                 (E) 60 e 60

Resolução
Primeiro, a questão cita que as classes tem mesma amplitude, então os pontos médios das classes do meio são 50, 60 e 70. Assim, também descobrimos os limites de cada classe. Temos que interpretar um histograma e podemos colocar os valores em uma tabela para facilitar.
Classe
P. Médio
Freq
PM*Freq
Fac
35-45
40
1
40*1= 10
1
45-55
50
6
50*6= 300
7
55-65
60
10
60*10= 600
17
65-75
70
4
70*4= 280
21
75-85
80
2
80*2= 160
23


Soma:23
Soma:1380

A média quando há intervalo de classe é uma média ponderada, na qual utiliza-se os pontos médios das classes e as frequências são os pesos (como em toda média ponderada, divide-se o final pela soma dos pesos). 1380/23 = 60. Para a mediana, como são 23 elementos, sabemos que a mediana é o 12º elemento (divide a amostra em 11 elementos de cada lado), vendo a frequência acumulada, a mediana está na classe 55-65. Para ser exato, precisamos da fórmula:
liminf é o limite inferior da classe da mediana = 55
n é o total de elementos = 23
Facant é frequência acumulada anterior à classe da mediana = 7
Fi é a frequência absoluta da classe da mediana = 10
h é a amplitude = 10
 
Média = 60. Mediana = 59,5. Alt D.

64
Analise as afirmativas a seguir sobre o coeficiente de variação.
I – O coeficiente de variação é uma medida de variação relativa.
II – Se uma distribuição é bimodal, então seu coeficiente de variação é zero.
III – O coeficiente de variação tem a mesma unidade que o desvio padrão.
É(São) correta(s) APENAS a(s) afirmativa(s)
(A) I.                (B) II.               (C) III.              (D) I e II.                      (E) II e III.

Resolução
(I) Coeficiente de variação (CV) relaciona o desvio padrão e a média (CV=σ/µ), é uma dispersão relativa a média, então é uma medida de variação relativa. (II) A distribuição bimodal é aquela que tem apenas duas opções, para o CV ser zero, o desvio deve ser zero, não tem nada a ver. (III) O desvio padrão e a média tem a mesma unidade, como um divide pelo outro, fica sem unidade, ou melhor, em porcentagem.  Apenas I. Alt A.

Petrobras – Administrador 2012
67
Numa certa empresa com 300 funcionários, fez-se uma pesquisa de salários, obtendo-se as seguintes medidas estatísticas:
• Média = R$ 4.200,00
• Desvio padrão = R$ 840,00
Depois da pesquisa, todos os funcionários receberam um reajuste salarial de 5% mais um bônus de R$ 490,00 por participação nos lucros da empresa. A razão entre o novo coeficiente de variação e o coeficiente de variação anterior dos salários dessa empresa é dada por
(A) 0,05                        (B) 0,9             (C) 1                (D) 1,17                       (E) 1,4

Resolução
Temos que lembrar as propriedades da média e do desvio padrão. Se somar, subtrair, dividir ou multiplicar todos os elementos da amostra, a MÉDIA se altera da mesma maneira. O desvio padrão só se altera na divisão ou multiplicação. O coeficiente de variação atual é:
CV=840/4200=0,2
O reajuste salarial de 5% altera a média e o desvio padrão, os dois ficam multiplicados por 1,05. O bônus de R$490 altera apenas a média, soma R$490. Então:
Nova média: (4200*1,05) + 490 = 4900
Novo desvio padrão: 840*1,05 = 882
O novo CV é:
CV=882/4900=0,18
A questão pede a razão entre os dois: 0,18/0,2 = 0,9. Alt B.

68
A estrutura em Ramo de Folhas abaixo representa o consumo em litros de gasolina de uma certa pessoa por semana (com as folhas representando as unidades).

À luz dos dados coletados, considere as seguintes afirmações:
I - A distribuição é assimétrica positiva.
II - A distribuição não possui valor modal.
III - A mediana da distribuição é 115,5.
É correto o que se afirma em
(A) I, apenas.    (B) III, apenas.  (C) I e II, apenas.          (D) II e III, apenas.        (E) I, II e III.

Resolução
Diagrama de folhas funciona assim: os números à esquerda da barra são as dezenas e os à direita, suas unidades. Por exemplo, na primeira linha temos: 91, 94 e 97. Na segunda, 100, 102, 102, 103 e 108. São todos os valores observados, não é a frequência. São eles:
91 94 97 100 102 102 103 108 111 112 115 115 116 116 117 117 122 122 123 124 128 129 130 132

Para ver a simetria, tem que desenhar a curva de Gauss (normal), se tender para direita (mais dados do lado direito), então é assimétrica negativa. Se tender para esquerda, é assimétrica positiva. A curva em questão tende mais para a direita (mais dados na linha “12”), então é assimétrica negativa. I errada.

Valor modal é aquele elemento que aparece mais que os outros. Se tiver dois que aparecem mais, então é bimodal. Se três aparecerem mais, então é tri e assim por diante. Vemos que tem mais de um “102” e que alguns elementos aparecem apenas uma vez, então já temos uma moda e II não pode estar certa.

A mediana é uma variável de posição que divide a amostra pela metade. Como temos 24 elementos, temos dois elementos no meio, o 12º e o 13º, no caso, 115 e 116. A mediana é a média entre eles: 115,5.
Apenas a III está correta. Alt B.

69
Três urnas contêm 9 bolas numeradas de 1 a 9, cada. Um experimento consiste em selecionar uma bola de cada urna e verificar o número de resultados coincidentes. A probabilidade de que haja exatamente dois números coincidentes dentre os três números selecionados é
(A) 8/81                        (B) 8/27                        (C) 19/27                      (D) 25/81                      (E) 224/729

Resolução
Vamos chamar a bola que queremos de Q e a que não queremos de N. A probabilidade de Q é 1/9 e a de N é 8/9. Nós queremos exatamente duas coincidentes (QQ), então a terceira tem que ser diferente (N). As possibilidades são:
QQN = 1/9*1/9*8/9 = 8/729
ou
QNQ = 1/9*8/9*1/9 = 8/729
ou
NQQ = 8/9*1/9*1/9 = 8/729
Somando, 8/729+8/729+8/729 = 24/729. Porém, essa é a probabilidade de uma bola específica, Q pode ser a bola 8, 4, 3 ou qualquer outra das nove... ou seja, cada uma das nove bolas tem essa probabilidade de coincidir exatamente duas vezes. Então multiplicamos por nove: 9*24/729 = 216/729, simplificando, 8/27. Alt B.

70
O desenho esquemático (Box-Plot) abaixo representa a distribuição do tempo em anos de contribuição à previdência de aposentados de uma empresa até uma certa data.

Se forem selecionados dois aposentados aleatoriamente, a probabilidade de que pelo menos um deles se tenha aposentado entre 28 e 32 anos é
(A) 1/2              (B) 1/4              (C) 1/16                        (D) 7/16                        (E) 9/16

Resolução

O box-plot apresenta os dados sumários: mínimo, quartil inferior, mediana, quartil superior e máximo. Por ele, nós sabemos que a amostra está dividida em 4, mas não sabemos a quantidade de elementos em cada um, sabemos que o menos número é 24, o maior é 38, a mediana é 32, o quartil inferior termina em 28 e o quartil superior, em 26. A amostra pode ser: [24, 24, 28 |Q1| 29, 30, 31 |Q2=32| 32,32,36 |Q3| 36,37,38]. A verdade é que não importa na questão. O que importa é saber que 1/4 dos elementos estão entre 28-32, vamos chamar de S. Logo, 3/4 NÃO estão entre 28-32 anos, vamos chamar de N. Para que pelo menos um deles tenha se aposentado entre 28 e 32, temos as seguintes possibilidades:
O primeiro selecionado está e o segundo não: SN = 1/4*3/4 = 3/16
ou
O primeiro selecionado não está, mas o segundo sim: NS = 3/4*1/4 = 3/16
ou
Os dois estão dentro do período desejado: SS = 1/4*1/4 = 1/16.
Somando: 3/16+3/16+1/16 = 7/16. Alt D.

Petrobras – Analista de PO 2010
16
Considere que tenha sido feita uma pesquisa junto a 1.000 profissionais das mais diversas profissões, na qual foram observados os níveis de renda e de escolaridade de cada um dos profissionais. O resultado está reproduzido na Tabela de Contingência apresentada a seguir. (SM = Salário Mínimo)
(TABELA)
Suponha que tenha sido escolhido aleatoriamente um profissional com nível de renda entre 5 SM e 10 SMm. Qual a probabilidade desse profissional possuir o 2o grau completo?
(A) 0,12            (B) 0,30            (C) 0,32            (D) 0,40                        (E) 0,47

Resolução
A probabilidade é condicional, mas como está em forma de tabela fica mais fácil.
Os “caminhos” para se chegar a ao nível de renda entre 5 e 10 são: 20+120+160 =  300
A probabilidade de ter o 2º grau completo é 120/300 = 0,4.
Alt D.

18
Um levantamento realizado a respeito dos salários recebidos por uma determinada classe profissional utilizou uma amostra de 100 destes profissionais, na qual foram observados uma média de R$ 2.860,00 e um desvio padrão de R$ 786,00. Qual será, em reais, o desvio padrão da distribuição das médias amostrais dos salários desta classe de profissionais?
(A) 3,64            (B) 7,86            (C) 78,60                      (D) 786,00                    (E) 7.860,00

Resolução
do Vítor Menezes do Estratégia Concursos
Quando o desvio padrão da população é conhecido,  é normal com média µ e desvio padrão σ/√n.
Se o desvio padrão é desconhecido, substituímos este por uma estimativa. O desvio padrão amostral (s) é um estimador do desvio padrão da população (σ).
Ou seja, como σ é desconhecido, substituímos por s, que é seu estimador.
Consequentemente, Xbarra  terá distribuição T de Student, com média igual a µ e desvio padrão s/√n
s/√n = 786/√100 = 786/10 = 78,6
Alt C.


Petrobras – Analista de PO 2012
66
Uma empresa desenvolveu um teste para diagnosticar  defeitos nas peças que fabrica. Sabe-se que a cada 100 peças fabricadas, apenas 5 apresentam algum defeito. O teste funciona de tal forma que, se a peça for defeituosa, o resultado do teste será positivo (presença de defeito) em 95% das vezes e, se a peça não for defeituosa, o teste será positivo em apenas 5% das vezes. Se uma peça selecionada aleatoriamente for testada e o resultado for positivo, a probabilidade de que ela seja realmente defeituosa é:
(A) 10%                        (B) 20%                        (C) 30%                        (D) 40%                       (E) 50%

Resolução
Na probabilidade condicional, sempre ache todos os “caminhos” que levam até a situação. No caso, todos os dois caminhos que levam até um defeituoso são:
É defeituoso e acusa positivo = 0,05*0,95 = 0,0475
ou
É bom e acusa positivo erroneamente = 0,95*0,05 = 0,0475
0,0475 + 0,0475 = 0,095

Dentro desse universo, o caminho do qual queremos a probabilidade é vindo do defeituoso:
0,05*0,95 = 0,0475

A probabilidade é um “caminho” por todos possíveis:
0,0475/0,095 = 0,5

Em um figura fica assim:

A parte laranja é o universo dos possíveis defeituosos. A parte azul é a que queremos a probabilidade.
Alt E.

70
Seja X o intervalo de tempo entre duas ligações telefônicas consecutivas para um serviço de atendimento ao cliente. Sabe-se que, no horário de pico, o sistema recebe, em média, uma ligação a cada 30 segundos. Em um determinado dia, foram recebidas 25 ligações nos primeiros 5 minutos do horário de pico.
A probabilidade de que a próxima ligação ocorra no próximo minuto desse horário de pico é:
(A) 1 − e−2
(B) e−10 − e−12
(C) e−0,5
(D) 25e−6
(E) e−5 − e−6

Resolução (dos comentários)
Uma das propriedades da Função Exponencial é a "Falta de memória": a probabilidade de um evento ocorrer nas próximas t unidades de tempo não depende das últimas t0 unidades de tempo. Ou seja:

P(X>t+t0│x>t0)=P(X>t)= e^(-λt)

Do enunciado: λ = 2 ligações/min; t0 = 5min (primeiros minutos do horário de pico); t = 1min

Como queremos que a ligação ocorra dentro do próximo minuto desse horário de pico, t=1:

P(X<t)=1-e^(-λ.t)
P(X<1)=1-e^(-2.1)
P(X<1)=1-e^(-2)

Alt A.

Petrobras – Biocombustível 2010
23
Três usinas de biodiesel produzem, a partir de diferentes tipos de óleos, 200 milhões de litros do combustível, sendo que, deste total, 120 milhões de litros são obtidos exclusivamente a partir do óleo de mamona. A usina UB1 produz 70 milhões de litros de biodiesel, utilizando como matéria prima, apenas o óleo de mamona. Já a usina UB2 responde também pela produção de 70 milhões de litros de biodiesel, porém utilizando tanto o óleo de mamona como o óleo de girassol. Por sua vez, a usina UB3 confecciona biodiesel a partir do óleo da mamona e da soja, e é responsável pela produção de 60 milhões de litros de biodiesel, sendo que, destes, 50 milhões de litros produzidos somente com óleo de soja. Todo o combustível produzido é armazenado em tanques que acondicionam, cada um, até um milhão de litros de biodiesel, sem haver qualquer mistura do combustível obtido a partir de cada um dos diferentes óleos – mamona, soja ou girassol –, podendo, contudo, haver a mistura de tipos idênticos. Considerando-se a totalidade de tanques de biodiesel das três usinas, a probabilidade de se escolher, aleatoriamente, um desses contendo biodiesel  produzido a partir de óleo de girassol é de
(A) 10%                        (B) 15%                        (C) 20%                        (D) 25%                        (E) 30%

Resolução
Total 200: 120M + 80outros
UB1: 70M
UB2: total de 70, mas não se sabe se é M ou G
UB3: 50S + 10M

Para descobrir UB2: 120M – 70M – 10M = 40M. Como o total é 70, então tem 30G.
Probabilidade é 30 tanques de girassol sobre o total de 200 tanques. 30/200 = 15%. Alt B.

Petrobras Distribuidora – Eng. de Produção 2010
44
Uma fábrica de computadores desenvolve um novo tipo de circuito para suas placas de rede. Após a produção, duas placas, X e Y, foram aleatoriamente selecionadas para a realização de testes de confiabilidade, com duração de 100 horas. A probabilidade de falha de transmissão da placa segue uma distribuição exponencial. A taxa de falha de transmissão é de uma falha por hora. Após 10 horas de teste, a placa de rede X registrou uma falha de transmissão, enquanto a placa de rede Y não apresentou falha. Sejam P e Q as probabilidades de as placas X e Y falharem, respectivamente, qual a probabilidade de ocorrer uma falha de transmissão, na próxima hora, em cada uma das placas?
(A) P é menor do que Q.
(B) P é maior do que Q.
(C) P e Q são iguais.
(D) P é 1 −1/e e Q é 1/e.
(E) P é 1/e e Q é 1 −1/e.

Resolução
Existem distribuições discretas e distribuições contínuas.
Discretas: binomial, hipergeométrica, Poisson.
Contínuas: uniforme (ou retangular), exponencial, normal, qui-quadrado, t de Student, F de Snedecor.

A que mais aparece em provas é a normal seguida de Poisson e exponencial.

Poisson e exponencial andam juntas. Poisson é discreto e estima um evento em certo período de tempo. Exponencial é contínuo e analisa o tempo entre um evento e outro. Um vê o evento e outro, o tempo.
Ambos se caracterizam por não ter memória, os eventos são independentes. Por isso a resposta é P e Q iguais.
Alt C.

Petrobras Distribuidora 2011 - Eng. Produção
51
Uma mulher começou a fazer comida em casa para aumentar a renda familiar. Para atender melhor os clientes, contratou um funcionário para receber os pedidos através de sua única linha de telefone. Em média, 50 clientes ligam por hora, embora a capacidade de atendimento seja de 75 clientes. As taxas de ligação e de atendimento têm uma distribuição de Poisson, o sistema possui uma única fase e um único canal, e o tamanho máximo da fila é ilimitado (chamada em espera).
Ao utilizar esse modelo,
(A) a média será de 3,33 clientes no sistema.
(B) a média será de 2 clientes em chamada de espera.
(C) a probabilidade de um cliente ligar independe do momento em que o cliente anterior ligou.
(D) os clientes precisam aguardar em média 2,0 minutos para serem atendidos.
(E) o tempo médio para um cliente completar o pedido será de 1,3 minutos.

Resolução
Distribuição de Poisson é muito usado para modelar o número de eventos durante um período de tempo, como no exercício. As suposições básicas são: as condições permanecem constantes (como exemplo, na questão, não podem colocar outra linha telefônica) e os eventos são independentes. Por isso a alternativa C é a correta. Alt C.


67
Em certo país, a altura dos homens tem distribuição normal com média 172 cm e desvio padrão 9 cm, e a altura das mulheres também tem distribuição normal, com média 162 cm e desvio padrão de 12 cm. Se as alturas são independentes, qual a probabilidade de que um homem escolhido ao acaso seja mais alto do que uma mulher escolhida também ao acaso?
(A) 89,44%                   (B) 74,86%                   (C) 50,00%                   (D) 25,14%                   (E) 10,56%

Resolução (do passeconcurso e minha)
Complicada. Temos duas distribuições normais, uma para homens e outra para mulheres. Considerando X uma variável aleatória tirada do grupo de homens, Y, de mulheres e W = X – Y, temos que calcular esse W, pois é o acaso de homem e mulher. Z = (W-µ)/σ, então precisamos da média de W e do desvio padrão de W.

Lembrando as propriedades da média: o que acontece com todos os componentes, acontece também com a média. Por exemplo: se somar 2cm a todos os homens, a média também vai aumentar 2cm; se multiplicar todas as mulheres por 0,312 , a média delas também vai aumentar multiplicada por 0,312. Assim:
µ(W)= µ(X) – µ(Y) = 172 – 162 = 10
 
Lembrando as propriedades do desvio padrão: soma e subtração não alteram o desvio padrão (pois ele é uma medida de dispersão), multiplicação e divisão alteram na mesma proporção. Lembrei, mas não será usado...
 
O importante é lembrar de uma propriedade envolvendo variância e subtração de variáveis aleatórias. Aceite que, para variáveis aleatórias independentes, Var(W) = Var(X) + Var(Y) , independentemente do sinal entre X e Y. É uma propriedade da variância, os dados fornecidos são do desvio padrão e queremos o desvio padrão de W, como fazer? Lembrando que variância (σ²) é o desvio padrão (σ) ao quadrado. Então:  
σ(X) = 9 à σ²(X) = 9² = 81
σ(Y) = 12 à σ²(X) = 12² = 144
Propriedade: Var(W) = Var(X) + Var(Y) --> σ²(W)= σ²(X) + σ²(Y) = 81 + 144 = 225
σ(W)= √σ² = √225 = 15.

Com a média de W (µ=10) e o desvio padrão de W (σ=15), calculamos Z com W=0, porque é na média de W, o ponto mais alto. Z=(0-10)/15= -0,66. Na tabela, achamos a probabilidade de 0,2486 (do lado esquerdo, por isso negativo). Queremos toda a área amarela, então 0,2486+0,5 = 74,86%. Alt B.

68
Uma população é modelada probabilisticamente pela função de densidade de probabilidade
...

Resolução
Mais uma questão bem difícil, aprendi com o passeconcurso
A área total é 4*0,5=2. Então a área do nosso triângulo é metade, 1. A mediana divide os dados do nosso triângulo em duas partes iguais, então, A1=A2=0,5.
Para calcular A1: x*y/2=0,5 à xy=1
Para A2 (área de um trapézio é base maior vezes base menor multiplicado pela altura e dividido por dois): [ (0,5+y)*(4-x) ]/2 = 0,5. Na verdade, fica difícil resolver à mão, é melhor integrar... x=2√2.

Para amplitude interqualítica, Q3 – Q1, sendo que Q1 coloca 25% a sua esquerda e Q3 coloca 75% a sua direita. Faça os cálculos com as áreas iguais a 0,25 e 0,75, vai ser igual a 2(√3-1). Alt E.

69
Numa caixa, há três moedas: duas são honestas, e uma tem três vezes mais probabilidade de dar cara do que de dar coroa. Uma moeda é selecionada aleatoriamente da caixa e é lançada sucessivamente duas vezes. Qual a probabilidade da ocorrência de duas caras?
A) 9/17
B) 13/32
C) 17/48
D) 17/54
E) 25/64
Resolução
Vamos chamar as moedas de A, B e C. Sendo que C é a adulterada. As chances de sair cara (K) ou coroa (C) são:

A chance de escolher a moeda A é de 1/3, assim como para qualquer outras duas moedas.
Então, a probabilidade de escolher a moeda A e sair duas caras é: 1/3*KK = 1/3*(1/2*1/2) = 1/12
ou
Mesma probabilidade para B: 1/3*KK = 1/3*(1/2*1/2) = 1/12
ou
Para moeda C muda a probabilidade da cara: 1/3*KK = 1/3*(3/4*3/4) = 3/16
Somando 1/12+1/12+3/16 = 17/48.
Alt C.

70
Com respeito à independência de variáveis aleatórias,considere as afirmações abaixo.
I - Se o coeficiente de correlação entre duas variáveis aleatórias X e Y for nulo, então as variáveis são independentes.
II - Se duas variáveis aleatórias X e Y são independentes, então a covariância entre X e Y é nula.
III - Se as variáveis aleatórias X e Y são independentes, Y e Z são independentes e X e Z são independentes, então X, Y e Z são independentes.
É correto APENAS o que se afirma em
(A) I                 (B) II                (C) III               (D) I e II                       (E) I e III

Resolução
Se duas variáveis aleatórias são independentes, então a covariância entre elas é nula (II certa). Mas se a covariância entre elas for nula, não quer dizer que sejam independentes (I errada). A III eu não sei...
Apenas II. Alt B.

Transpetro 2011 - Eng. produção
64
Considere o conjunto de dados a seguir.
60 80 80 85 85 85 85 90 90 90 90 90 100 100 100 100 100 100
O box plot correspondente a esse conjunto de dados é

Resolução
Sempre se lembrar que um box plot mostra 5 dados: mínimo, quartil inferior, mediana, quartil superior, máximo. Os três quartis dividem a amostra em quatro partes quase iguais.
60 80 80 85 |Q1| 85 85 85 90 90 |Q2| 90 90 90 100 100 |Q3| 100 100 100 100


O exercício é resolvido vendo que o máximo (100) coincide com o Q3 (representado pelo número a esquerda, também 100), então o box plot não tem a “perninha” de cima. Além disso, na figura, a mediana, 90, está mais próxima do quartil inferior, 85, que do quartil superior, 100, o que é condizente com os dados. Acho que o ponto embaixo não tem nada a ver e que as alternativas A, C e D são iguais, só muda a escala. Alt E.


65
Um investidor precisa calcular a variância dos lucros de algumas empresas para auxiliá-lo na caracterização do risco de um investimento. As informações sobre lucros são fornecidas em reais e, como ele não quer trabalhar com valores muito grandes, resolveu trabalhar com os números em milhões de reais.
A variância obtida com os dados em milhões de reais é a variância dos dados em reais dividida por
(A) 1012                          (B) 109                            (C) 106                            (D) 103                            (E) 100

Resolução
Lembrar que a variância tem unidade de medida ao quadrado (σ²). Por quê? Porque eleva ao quadrado o desvio de cada elemento em relação a média para não haver negatividade, assim, a unidade também fica ao quadrado. Mas como trabalhar ao quadrado é complicado, inventaram o desvio padrão, que é a raiz da variância (√σ² = σ). Milhões é 1 000 000 = 106, então a variância de milhões é (106)² = 1012. Questão meio esquisita, um detalhe da variância que resolve... Alt A.

66
Dez participantes de um programa de televisão serão distribuídos aleatoriamente em duas casas, sendo que, em cada casa, haverá o mesmo número de participantes, isto é, 5 em cada uma. Desses 10 participantes, 3 preferem a casa X e 2 preferem a casa Y.
Qual é a probabilidade de as preferências serem atendidas?

Resolução
De primeira, eu estava pensando em pegar um por um dos participantes e alocar nas casas para ver as chances de escolher os 3 que querem a casa X, mas não interessa o que pensei, dá muito trabalho e não precisa ser assim. 

Vamos considerar que as pessoas que desejam a casa X sejam A, B e C, os querem a casa Y sejam D e F e os que não tem preferência são “outros”.

Probabilidade sempre é algo menor dividido por algo maior. O maior, no caso, é o total de maneiras de distribuir as 10 pessoas pelas duas casas. Porém, repare que como nas casas cabem 5 pessoas, quando colocar 5 em uma casa, a outra já tem seus 5 ocupantes também. Então, precisamos só combinar uma casa e a quantidade de possibilidades é uma combinação de 10 pessoas em 5 lugares.

Esse é o total de maneiras diferentes de alocar 5 pessoas de 10 em uma casa.

E quantas são as maneiras de combinar ABC+2”outros” e DF+3”outros”, atendendo, assim, o pedido? Se fixarmos ABC na casa X, sobrarão 7 pessoas, mas destas, duas (D e F) não podem entrar, porque preferem a casa Y. Sobram 0s 5 “outros”. Ao escolhermos 2 desses 5 “outros”, D e F vão, automaticamente, para outra casa, a Y.

Em resumo, se nos preocuparmos apenas em arrumar a casa X com ABC+2”outros”, as duas casas estarão alocadas com pessoas que a preferem. Para decidir os 2 “outros” ocupantes de X, temos 5 pessoas e 2 vagas. Então é uma combinação (o 5! no denominador está errado, o correto é 2!, o resultado, 10, está correto):

Finalmente, são 10 as maneiras de juntarmos na casa X ABC+2”outros”. E são 252 as possibilidades de pegarmos 5 pessoas de um grupo de 10 e colocarmos na casa X. Portanto, a probabilidade do que foi pedido é 10/252 = 5/126. Alt D.

67
Um dos riscos de acidentes em dutos de gás natural é de vazamento. A probabilidade de que o vazamento provoque um incêndio é de 1%. Caso não haja incêndio, o problema não acabou, pois pode ocorrer explosão de uma nuvem de gás. No caso de não haver incêndio, a probabilidade de haver explosão é de 1%. Dado que houve um vazamento, qual é a probabilidade aproximada de não haver incêndio e não ocorrer explosão?
(A) 1%              (B) 2%              (C) 97%                        (D) 98%                        (E) 99%

Resolução
Parece uma condicional, mas não é exatamente. Quer saber a probabilidade de NÃO incêndio e NÃO explosão, então é 99%*99% = 98%. Alt D.

68
Duas empresas diferentes produzem a mesma quantidade de aparelhos celulares, ou seja, ao se comprar um aparelho celular, a probabilidade de ele ter sido produzido por qualquer uma delas é a mesma. Cada aparelho produzido pela fábrica A é defeituoso com probabilidade 1%, enquanto cada aparelho produzido pela fábrica B é defeituoso com probabilidade 5%. Suponha que você compre dois aparelhos celulares que foram produzidos na mesma fábrica. Se o primeiro aparelho foi verificado e é defeituoso, a probabilidade condicional de que o outro aparelho também seja defeituoso é















Resolução
Probabilidade sempre é a divisão de uma parte por seu todo. Porém, em alguns casos, isso é feito “indiretamente”, apenas multiplicando as porcentagens (porcentagem é uma divisão cujo todo é 100). No caso de probabilidade condicional, sempre tem a divisão “direta”, tem que calcular o todo, também calcular a parte desejada e então dividir. 

Vamos chamar Da o defeito da fábrica A e Db o defeito da fábrica B. Uma vez dito que o primeiro aparelho é defeituoso (D), temos duas possibilidades: ter vindo de A ou de B. Ao querer saber a probabilidade do segundo também ser, ele pode ser Da ou Db. A partir de agora, isso que interessa e esse é o nosso todo, porque a condição foi dada (D).







A partir de D, a chance de “ir” para Da ou Db é: 1/%+5% = 6% = 6/100.
Mas as possibilidades de dois defeitos da mesma fábrica são:
Da e Da = 0,01*0,01 = 0,0001 = 1/10000
Ou
Db e Db = 0,05*0,05 = 0,0025 = 25/10000
Somando os dois: 1/10000+25/10000 = 26/10000, recapitulando, essa é a probabilidade de sair dois defeitos de uma mesma fábrica.
Dividindo a parte pelo todo: (26/10000) / (6/100) = 13/300. Alt C.

69
A tabela abaixo apresenta a distribuição dos equipamentos de uma grande empresa.

Resolução
Total de inativo é 90, porém, entre estes tem 60 que são do tipo A, então podemos subtrair dos inativos, e eles podem “entrar” na probabilidade como A. A quantidade total de A é 110. Falou em “OU” então soma a probabilidade.
(90-60)/270 + 110/270 = 14/27.
Poderia ser feito tirando os 60 do total: 90/270 + 110/270 – 60/270 = 14/270.
Alt B.

70
Considere as séries estatísticas.

(A) o desvio padrão do conjunto X é igual ao desvio padrão do conjunto Y.
(B) o desvio padrão do conjunto X é igual ao coeficiente de variação do conjunto Y.
(C) o desvio padrão do conjunto Y é igual ao coeficiente de variação do conjunto X.
(D) o coeficiente de variação do conjunto Y é igual ao desvio padrão do conjunto X dividido por √μX.
(E) o coeficiente de variação do conjunto Y é igual ao coeficiente de variação do conjunto X dividido por μX.

Resolução
Tem que se lembrar das propriedades da média e do desvio padrão. Quando todos os elementos de uma amostra sofrem qualquer alteração matemática (soma, subt, multip, divisão), a MÉDIA muda da mesma maneira. No caso do desvio padrão, este muda se todos os elementos são multiplicados ou divididos (soma e subtração não alteram o desvio). Temos aqui justamente isso, cada elemento de Y é a divisão de um elemento de X por µx, então o desvio padrão de Y também é dividido por µx.
X: X1, X2, X3 ... desvio padrão é σx, coeficiente de variação é σxx

Y: X1/µx , X2/µx, X3/µx desvio padrão é σxx, coeficiente de variação é σyy

O desvio padrão de Y é a mesma coisa que o coeficiente de variação de X. Alt C.

Transpetro – Administrador 2012
50
Um estádio olímpico possui 4 acessos: norte, sul, leste e oeste. Quatro delegações se dirigem aleatoriamente ao estádio. Qual é a probabilidade de cada uma se dirigir a um acesso diferente das demais?
(A) 1/256                      (B) 1/64            (C) 1/24            (D) 3/64                        (E) 3/32

Resolução
Probabilidade é uma possibilidade sobre todas as possíveis. Quais são todas as maneiras possíveis de 4 equipes entrarem por 4 acessos (todas podem entrar pela mesma, assim como somente duas podem entrar pela mesma... todas as possibilidades possíveis)? 4*4*4*4 = 256
Quais são as possibilidades de cada uma entrar por um acesso sem repetição? 4*3*2*1 = 24
Qual a probabilidade requerida? 24/256 = 3/32    Alt E.

52
Em uma determinada região, constatou-se que
• 25% das pessoas não praticam atividade física.
• 25% das pessoas são do sexo feminino e praticam atividade física.
• 15% das pessoas que não praticam atividade física são do sexo masculino.
Seleciona-se aleatoriamente uma pessoa dessa população. A probabilidade de que seja do sexo masculino ou que não pratique exercício físico é de
(A) 15%                        (B) 25%                        (C) 72,5%                     (D) 75%                       (E) 90%

Resolução
Fala em porcentagem, mas podemos considerar 100 pessoas que dá na mesma.
Y+15=25 à Y=10
P=75 à X+25=75 à X=50
Não praticantes são 25, total de homens é 50+15=65, mas dentro desses já estão 15 não praticantes. Então 25+50 = 75.

Uma maneira mais fácil é fazendo uma tabela com os dados fornecidos (em negrito) e deduzindo o restante:

 

Pratica

Não pratica

Total pessoas

Homem

50

15

65

Mulher

25

10

35

Total atividade

75

25

 

 Homens + Não praticantes – Homens não praticantes = 65 + 25 – 15 = 75. Alt D.

53
A tabela apresenta uma distribuição hipotética. Não há observações coincidentes com os limites das classes.
Classes            Frequência absoluta
de 0 a 10                      4
de 10 a 20                    10
de 20 a 30                    50
de 30 a 40                    100
Total                            164
A melhor estimativa para o terceiro quartil da distribuição é, aproximadamente, de
(A) 34,75                                  (B) 34,9            (C) 35                           (D) 35,75                      (E) 35,9


55
Uma empresa tem 38 funcionários, sendo a média de idade 32 anos e o desvio padrão de 4 anos. Foram contratados mais dois funcionários, ambos com 32 anos. Em relação à variância original, a variância da nova distribuição de salários ficará (Dado A variável idade é expressa em termos de anos completos.)
(A) 5% menor               (B) 23,75% menor         (C) 76,25% menor         (D) 95% menor             (E) não se alterará

Resolução
O que é a variância? É a soma de (cada valor – média)² dividido por n. Se tirar a raiz, tem-se o desvio padrão, caso contrário, é a variância (v). Como os dois adicionados estão na média, não vai alterar essa “soma de (cada valor – média)²” e vamos chamar isso de Z.
A variância com 38 funcionário é v=Z/38
E a variância com 40 é v=Z/40
Dividindo um pelo outro fica (o “Z” é cortado) 40/38=1,05 indicando aumento de 5%.
Alt A.

Petrobras Distribuidora – Administrador 2011
28
Os salários de técnicos de uma empresa se distribuem normalmente com média de R$ 3.200,00 e desvio padrão de R$ 800,00. Selecionando-se aleatoriamente dois salários de técnicos dessa empresa, qual a probabilidade de pelo menos um deles ser superior a R$ 3.880,00?
(A) 72,25%                   (B) 15,86%                   (C) 3,91%                     (D) 19,77%                   (E) 35,63%

Resolução
Questão um pouco diferente porque seleciona 2 e diz “pelo menos um deles” e até então pegávamos apenas 1 da amostra. O começo é igual, tem que achar a probabilidade de um ser superior a R$3.880:
P(X)= (X-µ)/σ = (3880-3200)/800 = 0,85 à pela tabela achamos 0,30 , então a probabilidade de um ser maior é 0,5 – 0,3 = 0,2
As possibilidades são:
Maior e ñmaior = 0,2*0,8 = 0,16
ñmaior e Maior = 0,8*0,2 = 0,16
Maior e Maior = 0,2*0,2 = 0,04
Somando: 0,36. Alt E.

29
A tabela abaixo representa os dados coletados sobre visitas diárias a um certo sítio de internet de acordo com a faixa etária de seus usuários.
Idade               Frequência Absoluta
[15, 25)                        6
[25, 35)                        7
[35, 45)                        4
[45, 65]                        3
Total                            20
À luz dos dados apresentados, considere as afirmações que seguem.
I - [25, 35) é a classe modal do conjunto de dados.
II - [25, 35) é a classe da mediana do conjunto dos dados.
III - A média é inferior à mediana.
IV - A distribuição dos dados é assimétrica negativa.
Está correto APENAS o que se afirma em
(A) I e II            (B) I e III                       (C) III e IV                     (D) I, II e III                    (E) I, II e IV

Resolução
I) É a classe modal porque apareceu mais vezes: 7.
II) Também é a classe da mediana, pois a mediana está entre o 10º e o 11º elemento.
III) A média é calculada multiplicando o meio da classe pela frequência absoluta (ex: 10*6=60), soma tudo e divide pelo total da frequência absoluta. O resultado é 32. A mediana é calculada pela fórmula:
Md=lim_inf+[((n/2)-fac_ant)/fi]*h=25+[((20/2)-6)/7]*10=30,7
IV) A distribuição é assimétrica negativa quando moda>mediana>média. É complicado calcular a moda em intervalo de classe. No nosso caso, sabemos que a mediana(30,7)<média(32) e isso basta para deduzir que não é assimétrica negativa, é positiva.

I e II corretas. Alt A.

IBGE 2009 - Eng. Produção
Leia o texto a seguir para responder às questões de nos 22 e 23.
A tabela abaixo apresenta a distribuição de frequências das idades de um grupo de crianças.

22
A média das idades dessas crianças, em anos, é
(A) 5,0              (B) 5,2              (C) 5,4              (D) 5,6              (E) 5,8

Resolução
Quando tem intervalo de classe, usamos o ponto médio de cada classe: 1, 3, 5, 7, 9. Sempre que se tratar de frequência, a média é do tipo ponderada, na qual as frequências são os pesos. E em uma média ponderada, os pesos multiplicam os dados, soma tudo e, depois, divide pela soma dos pesos.
Média: (1*5 + 3*2 + 5*4 + 7*2 + 9*7)/(5+2+4+2+7) = 108/20 = 5,4.
Alt C.

23
A mediana da distribuição de frequências apresentada é
(A) 5,5              (B) 5,6              (C) 5,7              (D) 5,8              (E) 5,9

Resolução
Mediana divide ao meio. No caso de intervalo de classes, precisamos da frequência acumulada (fac; só somar as frequências, classe por classe) para usar na fórmula.
Classe
fi
Fac
0-2
5
5
2-4
2
7
4-6
4
11
6-8
2
13
8-10
7
20
Como são 20 elementos (n=20), a mediana está entre os 10º e 11º elementos. Na fórmula, o liminf é da classe que contém a mediana, 4-6, fi também é a frequência absoluta da classe da mediana.





Alt A.

26
No último mês, Alípio fez apenas 8 ligações de seu telefone celular cujas durações, em minutos, estão apresentadas no rol abaixo.
5          2          11       8         3         8         7         4
O valor aproximado do desvio padrão desse conjunto de tempos, em minutos, é
(A) 3,1              (B) 2,8              (C) 2,5              (D) 2,2              (E) 2,0

Resolução
Primeiro, precisamos da média (Xm): (5+2+11+8+3+8+7+4)/8 = 48/8 = 6. Subtraímos a média de cada elemento. Alguns ficarão negativos, por isso, elevamos cada um ao quadrado. Tira a média desses resultados (dividindo por n), depois tira a raiz para ao desvio padrão.
X
X-Xm
(X-Xm)²
σ=√(X-Xm)²/n

σ =√(64/8) = √8 = 2,8
5
5-6=-1
1
2
2-6=-4
16
11
11-6=5
25
8
8-6=2
4
3
3-6=-3
9
8
8-6=2
4
7
7-6=1
1
4
4-6=2
4


SOMA=64
Alt B.

27
Seja H a variável aleatória que representa as alturas dos cidadãos de certo país. Sabe-se que H tem distribuição normal com média 1,70 m e desvio padrão 0,04 m. A probabilidade de que um cidadão desse país tenha mais do que 1,75 m de altura é, aproximadamente,
(A) 9,9%                       (B) 10,6%                     (C) 22,2%                     (D) 39,4%                     (E) 40,6%

Resolução
Z=(X-µ)/σ ,  no caso, X=1,75.
Z = (1,75-1,70)/0,04 = 1,25. Procurando na tabela, 0,394. Como quer MAIS que 1,75m, então é a ponta direita da curva normal. A toda a metade vale 0,5, a ponta é 0,5 – 0,394 = 0,106. Alt B.

30
Três dados comuns e honestos serão lançados. A probabilidade de que o número 6 seja obtido mais de uma vez é
(A) 5/216                      (B) 6/216                      (C) 15/216                    (D) 16/216                    (E) 91/216

Resolução
Três dados são lançados ao mesmo tempo, as possibilidades são:
666 = 1/6*1/6*1/6 = 1/216
ou +
66X = 1/6*1/6*5/6 = 5/216
ou +
6X6 = 1/6*5/6*1/6 = 5/216
ou +
X66 = 5/6*1/6*1/6 = 5/216
Somando tudo: 1/216 + 3*(5/216) = 16/216. Alt D.


BNDES – Engenharia 2011
31
Ao medir-se a temperatura de um forno, em graus Celsius, em diversos momentos, obteve-se uma amostra com variância igual a 225. Se cada uma das medidas de temperatura for convertida para graus Fahrenheit, utilizando-se a fórmula F=(9/5)C+32, o valor da nova variância amostral será
(A) 257                         (B) 405                         (C) 437                         (D) 729                         (E) 761

Resolução
Lembrando as propriedades de desvio padrão e variância:
Multiplicando ou dividindo uma constante C por cada elemento, o desvio padrão também fica multiplicado ou dividido por C. Já a variância fica multiplicada ou dividida por C².
Somar ou subtrair uma constante não faz nada com nenhum dos dois.

A constante multiplicando é 9/5. Então a nova variância será multiplicada por (9/5)² = 81/25.
(81/25)*225 = 729.

Alt D.


32
As variáveis aleatórias X e Y têm variâncias iguais e possuem coeficiente de correlação igual a 0,2. O coeficiente de correlação entre as variáveis aleatórias X e 5X – 2Y é
(A) – 0,35                     (B) – 0,2                       (C) 0,1              (D) 0,56                        (E) 0,92

Resolução
do Guilherme Neves para o pontodosconcursos (LINK)


Alt E.

33
A distribuição de frequências de uma certa amostra é representada no gráfico abaixo.
(FIGURA)
Sobre a média μ, a mediana m e a moda M dessa amostra, tem-se
(A) m < μ < M
(B) m < M < μ
(C) μ < M < m
(D) M < μ < m
(E) M < m < μ

Resolução
1*11 = 11                     2*10 = 20                     3*7 = 21                       4*4 = 16                      
5*3 = 15                       6*2 = 12                       7*1 = 7
Soma 102
Total de componentes 11+10+7+4+3+2+1 = 38
Média 102/38 = 2,7       μ=2,17
Mediana 38/2 = 19, é o 19º elemento, m=2
Moda: é o elemento que aparece mais vezes, o “1” tem frequência 12, M=1.

Ou
pela distribuição percebe-se que é positiva e nesta sempre M < m < μ.
Na negativa é ao contrário, M > m > μ.
Alt E.

35
Em uma urna, há um grande número de fichas de quatro tipos: quadradas brancas, quadradas vermelhas, redondas brancas e redondas vermelhas. Sabe-se que:
• 70% de todas as fichas são brancas.
• 25% das fichas quadradas são vermelhas.
• 60% das fichas vermelhas são redondas.
A porcentagem de fichas redondas e brancas nessa urna é de
(A) 26%                        (B) 30%                        (C) 34%                        (D) 38%                       (E) 42%

Resolução
Q – Quadrado   R – Redondo     B – Branco       V – Vermelho
Total de fichas: 70%B e 30%V
Se 60% das fichas vermelhas são redondas (RV), então 40% são QV.

60% de RV do total de vermelhas (30%) = 60*30 = 18% do total são RV
40% de QV do total de vermelhas (30%) = 40*30 = 12% do total são QV

Se 25% das quadradas são vermelhas (QV), então 75% são QB.
Esses 25%QV representam 12% do total, então os 75%QB são 3*12 = 36% do total.
Somando RV+QV+QB+RB = 100% à 18%+12%+36%+RB = 100% à RB=34%
Alt C.

44
Uma máquina produz comprimidos de um medicamento. Conforme indicado no rótulo do produto, cada comprimido deve pesar, em média, 0,5 g. Para testar se a máquina está regulada corretamente, foi estabelecido um procedimento para testar a hipótese H0 de que a massa média dos comprimidos produzidos é, de fato, igual a 0,5 g contra a hipótese alternativa H1 de que tal massa é inferior a 0,5 g. O procedimento de teste consistiu em pesar uma amostra de 100 comprimidos, obter a média m e o desvio padrão s das massas registradas, em gramas, e rejeitar H0 quando m < 0,5 – 0,15 s. O nível de significância do teste (ou seja, a probabilidade de se rejeitar a hipótese nula caso ela seja verdadeira) é, aproximadamente,
(A) 0,059                      (B) 0,067                      (C) 0,119                      (D) 0,134                      (E) 0,150

Resolução
Como falou em “amostra de 100”, utilizamos aquela fórmula que divide por “raiz(n)”.

n = 100             Média (m) = 0,5            Desvio padrão = s

Z = (X - m)/(σ/√n) = (0,5-0,15s - 0,5)/(s/√100) = (-0,15s)/(s/10) = -1,5

Pela tabela P(0<z<1,5) = 0,433
0,5 – 0,433 = 0,067

Alt B.

53
Em uma urna, são colocadas 2 bolas brancas e 4 pretas. Alberto e Beatriz retiram bolas da urna alternadamente, iniciando-se com Alberto, até que a urna esteja vazia. A probabilidade de que a primeira bola branca saia para Alberto é
(A) 1/2                          (B) 3/5                          (C) 5/9                          (D) 7/12                        (E) 8/15

Resolução
À primeira vista parece que a resposta é 2/6... não é, essa é apenas uma das possibilidades de a primeira bola branca sair para Alberto. Pode acontecer de ele tirar uma preta, aí a Beatriz precisa também tirar uma preta para o Alberto tirar a primeira branca em seguida. As possibilidades são:
Alberto
Bia
Alberto
Bia
Alberto
Probab.
B





2/6




1/3
P
P
B


+
4/6
3/5
2/4


1/5
P
P
P
P
B
+
4/6
3/5
2/4
1/3
2/2
1/15





= 9/15
9/15 = 3/5         Alt B.

INNOVA – Administrador 2012
21
Uma instituição financeira tem M clientes, dos quais k são classificados como conservadores, e os restantes M - k, não conservadores. Uma amostra de n clientes será selecionada, k ≤ n < M. Seja Ak o evento em que, na extração dos n clientes, exatamente k têm perfil conservador. Considerando-se o sistema de extração com reposição, a probabilidade do evento Ak ocorrer, é

Resolução
Questão complicada. Primeiro interprete o que pede: não importa o tamanho da amostra, ele quer que o número k de conservadores esteja ali dentro. Não as pessoas, o NÚMERO! Por exemplo, se há 3 conservadores em 7, não importa a amostra pode ser n=4 ou n=5 ou n=6, tem que ter 3 conservadores ali, não precisa ser exatamente as três (fulano, ciclano e beltrano), pode até ser repetido (ciclano aparecer na amostra mais de uma vez),  já que é com reposição.

Em exercícios assim, é melhor substituir as letras por números e depois voltam as letras para chegar a resposta. Vamos supor:
Total (M)=7       Conservadores (k)=3     Liberais (L) =M-k=7-3= 4           Amostra (n) = 5
As probabilidades de pegar k e L são: kkkLL, kkLLk, kLLkk, LLkkk, LkkkL, ... ou seja, 5*4*3*2*1=5!
Espera, como existem três k e dois L e não diferem entre si, mudando de lugar k com k ou L com L continua a mesma coisa, por isso temos que dividir o 5! por 3! e 2!
Assim, as possibilidades de pegar três k e dois L são: 5! / 3!2!

E as probabilidades dentro de cada uma dessas possibilidades é:
Probabilidade de pegar um k: 3/7 como é com reposição, então a probabilidade de pegar outro k também é 3/7
Probabilidade de pegar um L: 4/7 como é com reposição, então a probabilidade de pegar outro L também é 4/7

Portanto, a probabilidade de pegar kkLkL é: 3/7*3/7*4/7*3/7*4/7
E a probabilidade de pegar kkkLL é a mesma: 3/7*3/7*3/7*4/7*4/7

A probabilidade de acontecer tudo isso é (5! / 3!2!) * (3/7*3/7*3/7*4/7*4/7)

Finalmente, vamos substituir por letras:
5! / 3!2! = n! / k! n-k! = combinação de n, k (todas as maneiras de arrumar n pessoas em um grupo de k, a ordem não importa) = Ckn
3/7*3/7*3/7*4/7*4/7 = 3³*4²/75 = kk*Ln-k/Mn = kk*(M-k)n-k/Mn

A junção disso está na alt A.

24
Uma turma do 2o período de Administração é composta de 20 alunos, que tiraram as seguintes notas no teste de Estatística:
(FIGURA)
Qual é a mediana teórica da turma nesse teste?
(A) 6,0                          (B) 6,5                          (C) 6,75                        (D) 7,0                         (E) 7,25

Resolução
A mediana divide, literalmente, ao meio a amostra. Se a amostra é de 20, a mediana coloca dez de um lado e dez de outro. Para isso precisamos colocar os dados em ordem crescente (não precisa de todos)
Posição
1
2
3
4
5
6
7
8
9
10
11
12
13
...
Aluno
7
20
19
3
8
2
13
11
10
4
16
12
...

Nota
1,5
2
3
4
4,5
5
5,5
6
6,5
7
7
7,5
...

Como são 20 elementos, a mediana está entre 10 e 11, no caso a nota é 7 (se as notas fossem 7 e 7,5 a mediana seria 7,25).
Alt D.

42
Ao preparar um teste, um professor avaliou as probabilidades de três de seus alunos acertarem um determinado problema em 50%, 40% e 80%. Se os três alunos, separadamente, tentarem resolver o problema, qual é a probabilidade de ele ser resolvido corretamente por, pelo menos, um desses alunos?
(A) 57%                                   (B) 78%                        (C) 80%                        (D) 90%                       (E) 94%

Resolução
“Pelo menos um” liga o alerta para calcularmos a chance de não ocorrer nada. Isto é, se calcularmos a probabilidade dos três errarem e tirarmos de 100%, então pelo menos um acertou.
Probabilidade dos três errarem: 0,5*0,6*0,2=0,06
Probabilidade de pelo menos um acertar: 1-0,06=0,94
Alt E.

Petrobras – Anal. de Comercialização e Logística - Transp. Marítimo - 2012
23
Se alguém deseja comparar a variabilidade de dois grupos de dados com variâncias e médias diferentes, a medida estatística apropriada para tal é a(o)
a) covariância entre os grupos
b) comparação simples entre os dois desvios padrões dos grupos.
c) média dos desvios padrões dos dois grupos ponderados pelos tamanhos das amostras
d) coeficiente de variação
e) coeficiente de correlação entre os grupos

Resolução
Coef. de variação é desvio padrão/média
Alt D.

11 comentários:

  1. Muito boa a sacada na pergunta 40

    ResponderExcluir
  2. 49

    520h+420m=500h+500m
    20h-80m=0
    h=4m =>

    ResponderExcluir
  3. Muito bom o blog, tem algum material que você indicaria para estudar essa parte de probabilidade e estatística?

    ResponderExcluir
  4. amigo, questão 34, multiplica o Z por 2 por que^?

    ResponderExcluir
    Respostas
    1. A probabilidade total da curva normal é 1, sendo que a tabela usada só mostra metade, ou seja, probabilidade total é 0,5.

      Encontramos 0,451 , que é a probabilidade de um lado da curva, mas alternativa pede a probabilidade em volta da média, ou seja, dois dois lados, por isso multiplica por 2.

      Excluir
  5. Amigo, bom dia. Me tira um dúvida, por favor. Nas questões em que você usou a tabela de distribuição normal, eu percebi que, por exemplo, vocÊ achou o número 1,66 para Z. Depois disso você foi procurar o valor 1,66 na tabela e encontrou o valor 0,451. Porém, na tabela, não consta o valor "0," mas somente o valor "451". Por que você usou "0,451" ao invés de "451"? A tabela disponibilizada pela cesgranrio omitiu esse "0" antes da vírgula? Espero que tenha me entendido.

    ResponderExcluir
    Respostas
    1. Sim, a Cesgranrio já usou tabela sem o "0,". Não existe probabilidade "451", sempre tem o "0,". Vai de 0% a 100%, ou seja, de 0 a 1.

      Excluir
  6. Só complementando a resolução da 40, a questão pede a probabilidade de todos ao msm tempo (estádio, cinema e unidades de ensino superior) ou seja ela pede a interseção P(A∩B∩B) que pode ser encontrado pelo teorema abaixo:
    P(AUBUC) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) - P(A∩B∩C)

    P(AUBUC)= 0,99 (é a probabilidade complementar ao 1% do enunciado)
    P(A)= 0,81
    P(B)= 0,96
    P(C)= 0,78
    P(A∩B)= 0,75
    P(A∩C)= 0,64
    P(B∩C)= 0,81
    P(AUBUC) = P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) - P(B∩C) - P(A∩B∩C)
    0,99 = 0,81 + 0,96 + 0,78 - 0,75 - 0,64 - 0,81 - P(A∩B∩C)
    P(A∩B∩C) = 0,64
    0,64*(229+37) =~ 170

    Foi só p complementar, mas prefiro a sacada que vc teve.

    ResponderExcluir
  7. Parabéns pelo blog e pela iniciativa!

    Sobre a questão 70 da Prova de Analista de PO 2012:

    Uma das propriedades da Função Exponencial é a "Falta de memória": a probabilidade de um evento ocorrer nas próximas t unidades de tempo não depende das últimas t0 unidades de tempo. Ou seja:

    P(X>t+t0│x>t0)=P(X>t)= e^(-λt)

    Do enunciado: λ = 2 ligações/min; t0 = 5min (primeiros minutos do horário de pico); t = 1min

    Como queremos que a ligação ocorra dentro do próximo minuto desse horário de pico, t=1:

    P(X<t)=1-e^(-λ.t)
    P(X<1)=1-e^(-2.1)
    P(X<1)=1-e^(-2)

    ResponderExcluir