19
--- מסווג לא--- --- מסווג לא--- Quantitative Methods 2013 1 [--------------------- ---------------------] x x x x [--------------------- ---------------------] [--------------------- ---------------------] x x x x µ Confidence Interval Estimation --- מסווג לא--- 2 Point Estimate for Population μ A point estimate is a single value estimate for a population parameter. Point estimate of the population mean, µ, is the sample mean. Example: A random sample of 32 textbook prices is taken from a local bookstore. Find a point estimate for the population mean, µ. 34 34 38 45 45 45 45 54 56 65 65 66 67 67 68 74 79 86 87 87 87 88 90 90 94 95 96 98 98 101 110 121

New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג--- ---לא מסווג---

Quantitative Methods2013

1

[--------------------- ---------------------]

xx

xx[--------------------- ---------------------]

[--------------------- ---------------------]xxxx

µ

Confidence Interval Estimation

---לא מסווג---

2

Point Estimate for Population μ

A point estimate is a single value estimate for a population parameter. 

Point estimate of the population mean, µ, is the samplemean.

Example:A random sample of 32 textbook prices is taken from a local bookstore.  Find a point estimate for the population mean, µ.

34 34 38 45 45 45 45 5456 65 65 66 67 67 68 7479 86 87 87 87 88 90 9094 95 96 98 98 101 110 121

Page 2: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

3

≈ 74.22x

The point estimate for the population mean of textbooks in the bookstore is $74.22.

34 34 38 45 45 45 45 5456 65 65 66 67 67 68 7479 86 87 87 87 88 90 9094 95 96 98 98 101 110 121

The problem with one value or a point estimate is that they are presented as being exact and the probability of them being precisely the right value is low.

---לא מסווג---

4

In practice it is more meaningful to have an intervalestimate and to quantify these intervals by probability levels that give an estimate of the error in the measurement.

Interval Estimate

A point estimate is a single number. 

•74.22

interval estimateLower 

Confidence 

Limit

Upper

Confidence 

Limit

The interval estimate is a range within which the  population parameter is likely to fall.

Page 3: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

5

Point estimate for textbooks

•74.22

Interval estimate

How confident do we want to be that the interval estimate contains the population mean, μ?

The estimate for the prices of the textbooks is between 66.1 and  82.34  and I am 95% confident of these figures.

---לא מסווג---

6

(mean, μ, is unknown)

Population

Sample

I am 95% confident that μ is between 66.1 and  82.34.

74.22

Page 4: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

7

An interval estimate can be computed by adding andsubtracting a margin of error to the point estimate.

Point Estimate +/− Margin of Error

The general form of an interval estimate of apopulation mean is:

+/−

•74.22

Lower 

Confidence 

Limit

Upper

Confidence 

Limit

Margin of Error Margin of Error

---לא מסווג---

8

An interval gives a range of values:

– Takes into consideration variation in sample statistics from sample to sample.

– Based on observations from 1 sample.

– Gives information about closeness to unknown population parameters.

– Stated in terms of level of confidence.

Point Estimate

Lower 

Confidence 

Limit

Upper

Confidence 

Limit

Width of confidence interval

Margin of Error Margin of Error

Page 5: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

9

Level of Confidence

The level of confidence c is the probability that the interval estimate contains the population parameter.

µ

(1 – c) 

The remaining area in the tails is 1 – c .

c

Since the sampling distribution shows how values of Xare distributed around the population mean μ, the sampling distribution of  X provides information about the possible differences between X and μ.

---לא מסווג---

10

µµx=

Confidence Intervals

c %of intervals constructed contain μ; 

(1‐c) % do not.

x

x1

x2

α−=1c

Interpretation:In the long run, c% of all the confidence intervalsthat can be constructed will contain the unknown true parameter.

A specific interval either will contain or will not contain the true parameter

Page 6: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

11

Suppose confidence level = 95%   

Also written (1 ‐ α) = 0.95

/2α /2αα−1

α is called the level of significance

---לא מסווג---

12

Confidence Intervals for the Mean

(Large Samples)

Page 7: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

13

Confidence Interval for μ (n ≥ 30 or σ Known ) 

Assumptions‐ n ≥ 30 ‐ or σ known with a normally distributed population

Confidence interval estimate:

σX Z

nc±

X nσ/

When n ≥ 30, the sample standard deviation, s, can be used for σ.

where       is the point estimate,  is the standard error

---לא מסווג---

14

Commonly used confidence levels are 90%, 95%, and 99%

Confidence Level

Confidence Coefficient Z value

1.28

1.645

1.96

2.33

2.58

3.08

3.27

0.80

0.90

0.95

0.98

0.99

0.998

0.999

80%

90%

95%

98%

99%

99.8%

99.9%

α−=1c

Page 8: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

15

µµx=

Confidence Intervals

Intervals extend from

to    

c % of intervals constructed contain μ; 

(1‐c)% do not.

Sampling Distribution of the Mean

n

σZX +

n

σZX −

x

x1

x2

/2α /2αα−=1c

---לא מסווג---

16

Finding a Confidence Interval for a Population Mean      (n ≥ 30 or σ known with a normally distributed population)

In Words In Symbols

1. Find the sample statistic.

2. Specify σ, if known.  Otherwise, if n ≥ 30, find the sample standard deviation s  and use it as an estimate for σ.

3. Find the critical value zc that corresponds to the given level of confidence.

4. Find the left and right endpoints and   form the confidence interval.

n∑= xx

2( )1

s n∑ −= −

x x

Use Excel.=NORSMINV((1+c)/2)

Page 9: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

17

Example:A random sample of 32 textbook prices is taken from a local college bookstore. The mean of the sample is 74.22, the sample standard deviation is s = 23.44.Construct a 95% confidence interval for the mean price of all textbooks in the bookstore.  

Since n ≥ 30, s can be substituted for σ.

s = 23.44

= 74.22xn

σZX ±

Use a 95% confidence level

Z = 1.96

---לא מסווג---

18

n

σZX ±

74.22

32

44.2396.1≈

With 95% confidence we can say that the cost for all textbooks in the bookstore is between $66.10 and $82.34.

•74.22

••

Left endpoint = ? Right endpoint = ?

74.22 – 8.12  74.22 + 8.12= 66.1 = 82.34

Page 10: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

19

Example:A random sample of 25 students had a grade point average with a mean of 2.86. Past studies have shown that the standard deviation is 0.15 and the population is normally distributed. Construct a 90% confidence interval for the population mean grade point average.

n = 25 = 2.86 σ = 0.15 zc = 1.645

2.81 <  < 2.91

With 90% confidence we can say that the mean grade point average for all students in the population is

between 2.81 and 2.91.

x

n

σZX ±

---לא מסווג---

20

Confidence Intervals for the Mean  (Small Samples)

Page 11: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

21

The t-DistributionWhen a sample size is less than 30, and the random variable X is approximately normally distributed,use a t‐distribution.

n

stX c±

---לא מסווג---

22

1. The t‐distribution is bell shaped and symmetric about the mean.

2. The t‐distribution is a family of curves, each determined by a parameter called the degrees of freedom.  

The degrees of freedom are the number of free choices left after a sample statistic such as  is calculated.  When you use a t‐distribution to estimate a population mean, the degrees of freedom are equal to one less than the sample size.

d.f. = n – 1      Degrees of freedom

x

Properties of the t‐distribution

Page 12: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

Idea: Number of observations that are free to varyafter sample mean has been calculated.

Example: Suppose the mean of 3 numbers is 8.0

23

Degrees of Freedom (df)

If the mean of these three values is 8.0, then X3 must be 9(i.e., X3 is not free to vary)

Here, n = 3, so degrees of freedom  = n – 1 = 3 – 1 = 2

2 values can be any numbers, but the third is not free to vary for a given mean.

Let X1 = 7Let X2 = 8What is X3?

---לא מסווג---

24

t ‐ Distribution

t

t  (df = 5)

t  (df = 13)t‐distributions are bell‐shaped and symmetric, but have ‘fatter’ tails than the normal

Standard Normal

(t with df = ∞)

As the degrees of freedom increase, the t-distribution approaches the normal distribution.  

After 30 d.f., the t-distribution is very close to the standard normal z-distribution.

Page 13: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

25

=TINV(probability, df) is used to find the value of the t under the distribution given thetotal area outside the curve or α.

Note the difference in the way you enter the variables for the t and the normal distribution. 

For the t‐distribution you enter the area in the tails, whereas for the normal distribution you enter the area of the curve from the extreme left to a value on the x‐axis.

---לא מסווג---

26

Critical Values of t

Example:Find the critical value tc for a 95% confidence when the sample size is 5.

95% of the area under the t‐distribution curve with 4 degrees of freedom lies between t = ±2.776.

t

−tc = − 2.776 tc = 2.776

c = 0.95

=TINV(0.05,4)

Page 14: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

27

Constructing a Confidence Interval for the Mean:    t‐Distribution

In Words In Symbols

1. Identify the sample statistics.

2. Identify the degrees of freedom, the level of confidence c, and the critical value tc.

3. Find the left and right endpoints and form the confidence interval.

n∑= xx

2( )1

s n∑ −= −

x x

d.f. = n – 1 

c

s

nx t±

=TINV(alpha, df) 

---לא מסווג---

28

Example:

A random sample of  n = 25 taken from a normal 

population has X = 50 and s = 8. 

Form a 95% confidence interval for μ

d.f. = n – 1 = 24,  so

The confidence interval is 

2.0639t0.95,241n,95.0 ==−t

25

8(2.0639)50

n

s1-n c, ±=± tX

46.698 ≤ µ ≤ 53.302

=TINV(0.05,24)

Page 15: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

29

Example:In a random sample of 20 customers at a local fast food restaurant, the mean waiting time to order is 95 seconds, and the standard deviation is 21 seconds.  Assume the wait times are normally distributed and construct a 90% confidence interval for the mean wait time of all customers. 

= 95 s = 21

tc = 1.729

n = 20

d.f. = 19

211.72920

= ⋅ 8.1=n

sct

x

=TINV(0.1,19)

---לא מסווג---

30

We are 90% confident that the mean wait time for all customers is between 86.9 and 103.1 seconds. 

86.9 < μ < 103.1n

s1-n c,tX ±

Page 16: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

31

Normal or t‐Distribution?

Is n ≥ 30?

Is the population normally, or approximately normally,

distributed?

You cannot use the normal distribution or the t-distribution.

No

Yes

Is σ known?

No

Use the normal distribution with

If σ is unknown, use s instead.

Yes

No

Use the normal distribution withYes

Use the t-distribution with n – 1 degrees of freedom.

n

sctX ±

n

σZX ±

n

σZX ±

---לא מסווג---

32

Normal or t‐Distribution?Example:Determine whether to use the normal distribution, the  t‐distribution, or neither.

a.)  n = 50, the distribution is skewed, s = 2.5The normal distribution would be used because the sample size is 50.

b.)  n = 25, the distribution is skewed, s = 52.9

Neither distribution would be used because n < 30 and the distribution is skewed.

c.)  n = 25, the distribution is normal, σ = 4.12

The normal distribution would be used because although n < 30, the population standard deviation is known.

Page 17: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

33

The 95% confidence interval of the sample mean of employee age for a major corporation is 19 years to 44 years based on a z‐statistic. 

The population of employees is more than 5,000 and the sample size of this test is 100. Assuming the population is normally distributed, the standard error of mean employee age is closest to:

A. 1.96,B. 11.58,C. 6.38,D. 12.50.

Question:

---לא מסווג---

34

C.  At the 95% confidence level, with sample n=100 and mean 31.5 years, that appropriate test statictic is z=1.96 .

Thus, the confidence interval is

Xs96.15.31 ±where          is the standard error of the sample mean  

If we take the upper bound, we know that  

4496.15.31 =± Xs

Xs

38.6=Xs

Page 18: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

35

An agricultural inspector wants to now the level of vitamin C in an load of kiwi fruits.

Question:

The inspector took a random sample of 25 kiwis from the ship’s hold and measured the vitamin C content (in milligrams).

Milligrams of vitamins per kiwi sampled:109  88  91  136  93101  89  97  115  92

114  106  94  109  11097  89  117  105  9283  79  107  100  93

---לא מסווג---

36

Estimate the average level of vitamin C in thekiwi fruits and give a 95% confidence level of this estimate.

Lower confidence level:       95.01

Upper confidence level:       105.47

Page 19: New גווסמ אל--- Quantitative Methods 2013math.haifa.ac.il/asegal/qm/ln/Lecture_ConfInt_QM_v3.pdf · 2013. 8. 10. · ---גווסמ אל---9 Level of Confidence The level of

---לא מסווג---

37

APPENDIX

---לא מסווג---

38

t0 2.920

The body of the table contains t values, not probabilities

Let: n = 3     df = n ‐ 1 = 2 

α = 0.10α/2 = 0.05

c=1‐α=0.9

Student’s t Table

1-tail 0.25 0.1 0.05 0.025 0.01 0.005 0.0012-tails 0.5 0.2 0.1 0.05 0.02 0.01 0.002

d.f.

1 1.000 3.078 6.314 12.706 31.821 63.657 318.3092 0.816 1.886 2.920 4.303 6.965 9.925 22.3273 0.765 1.638 2.353 3.182 4.541 5.841 10.2154 0.741 1.533 2.132 2.776 3.747 4.604 7.173

α/2 = 0.05α/2 = 0.05