Критерий Фишера и критерий Стьюдента в эконометрике

С помощью критерия Фишера оценивают качество регрессионной модели в целом и по параметрам.

Для этого выполняется сравнение полученного значения F и табличного F значения. F-критерия Фишера. F фактический определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

где n — число наблюдений;
m — число параметров при факторе х.

F табличный — это максимальное значение критерия под влиянием случайных факторов при текущих степенях свободы и уровне значимости а.

Уровень значимости а — вероятность не принять гипотезу при условии, что она верна. Как правило а принимается равной 0,05 или 0,01.

Если Fтабл > Fфакт то признается статистическая незначимость модели, ненадежность уравнения регрессии.

Таблицы по нахождению критерия Фишера и Стьюдента

Таблицы значений F-критерия Фишера и t-критерия Стьюдента Вы можете посмотреть здесь.

Табличное значение критерия Фишера вычисляют следующим образом:

  1. Определяют k1, которое равно количеству факторов (Х). Например, в однофакторной модели (модели парной регрессии) k1=1, в двухфакторной k=2.
  2. Определяют k2, которое определяется по формуле n — m — 1, где n — число наблюдений, m — количество факторов. Например, в однофакторной модели k2 = n — 2.
  3. На пересечении столбца k1 и строки k2 находят значение критерия Фишера

Для нахождения табличного значения критерия Стьюдента определяют число степеней свободы, которое определяется по формуле n — m — 1 и находят его значение при определенном уровне значимости (0,10, 0,05, 0,01).

Критерии Стьюдента

Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента.

Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:

Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:

Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.

Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так

Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт

Видео лекциий по расчету критериев Фишера и Стьюдента

Для более подробного изучения расчетов критериев Фишера и Стьюдента советуем посмотреть это видео

 

Лекция 1. Критерии и Гипотезы

Лекция 2. Критерии и Гипотезы

Лекция 3. Критерии и Гипотезы

 

Определение доверительных интервалов

Для построения доверительного интервала определяется предельная ошибка А для обоих показателей:

Формулы для нахождения доверительных интервалов выглядят так

Прогнозное значение у определяется с помощью подстановки в
уравнение регрессии прогнозного значения х. Вычисляется средняя стандартная ошибка прогноза

и находится доверительный интервал

Задача регрессионного анализа в предмете эконометрика состоит в анализе дисперсии изучаемого показателя y:

общая сумма квадратов отклонений (TSS)

сумма квадратов отклонений, обусловленная регрессией (RSS)

остаточная сумма квадратов отклонений (ESS)

Долю дисперсии, обусловленную регрессией, в общей дисперсии показателя у характеризует коэффициент детерминации R, который должен превышать 50% (R2 > 0,5). В контрольных по эконометрике в ВУЗах этот показатель рассчитывается всегда.

 

Понятия диафрагмы и глубины резкости в фотографии

ОСНОВНЫЕ СВЕДЕНИЯ ПО ОБЪЕКТИВАМ

Диафрагма и экспозиция

Диафрагма объектива (иногда ее еще называют «апертурой») — плод хитроумной инженерной мысли. Это отверстие с переменным диаметром, которое позволяет контролировать количество света, проходящего через объектив. Диафрагма и выдержка — два основных способа управления экспозицией. При одной и той же выдержке чем меньше света, тем больше должна быть открыта диафрагма, чтобы через нее на поверхность матрицы попало больше света. Соответственно, чем больше света, тем меньше должна быть открыта диафрагма, чтобы экспозиция была оптимальной. Как вариант, чтобы добиться аналогичных результатов, можно диафрагму не менять, а менять выдержку. При этом следует помнить, что величина отверстия диафрагмы влияет также на то, насколько «направленным» является свет, проходящий через объектив, а это напрямую влияет на глубину резкости. Поэтому нужно контролировать и диафрагму, и выдержку, чтобы результат съемки всегда соответствовал ожиданиям.

F число и математические расчеты

Небольшой технический экскурс и немного математики

Что такое f число? Диафрагменное или f число — это результат деления фокусного расстояния объектива на диаметр действующего отверстия диафрагмы. Например, если взять объектив 35 мм F1. 4 G, у которого максимальное значение диафрагмы равно f/1.4, диаметр действующего отверстия диафрагмы можно вычислить так: 35 ÷ 1,4 = 25 мм. Обратите внимание, что при изменении фокусного расстояния объектива также изменяется диаметр отверстия диафрагмы и, соответственно, f‑число. Например для телеобъектива с фокусным расстоянием 300 мм и диафрагмой f/1.4 диаметр действующего отверстия диафрагмы можно узнать, решив пример 300 ÷ 1,4 ≈ 214 мм. Такой объектив будет громоздким, неудобным и очень дорогим. Вот почему так редко можно встретить светосильную длиннофокусную оптику, т.е. оптику с большим отверстием диафрагмы. Фотографам необязательно знать фактический диаметр отверстия диафрагмы в миллиметрах, но полезно понимать сам принцип расчетов.

«F-числа» или «f-ступени» диафрагмы

У всех объективов есть максимальное и минимальное значения диафрагмы (выражаются в «f-числах»), но в технических характеристиках объективов, как правило, приводится именно максимальное значение. Возьмем, к примеру, объектив Sony 35 мм F1. 4 G. Здесь фокусное расстояние объектива — 35 мм (об этом чуть позже), максимальное значение диафрагмы — F1.4. Что конкретно значит обозначение «F1.4»? Подробно об этом можно почитать в статье «F число и математические расчеты» выше. Однако на практике достаточно понимать, что чем меньше f-число, тем больше отверстие диафрагмы, и помнить, что значение f/1.4 считается одним из максимальных в случае с универсальными объективами. Объективы с максимальным значением диафрагмы f/1.4, f/2 или f/2.8 обычно называются «светосильными».

Стандартные f-числа, которые вам могут встретиться в маркировке объективов (в порядке убывания): 1.4, 2, 2.8, 4, 5.6, 8, 11, 16, 22, иногда 32. Специально для математиков: это всё степени квадратного корня от числа 2. Эти цифры соответствуют целым значениям (ступеням) диафрагмы. Бывают еще промежуточные значения, соответствующие половине или трети целого значения. Увеличение отверстия диафрагмы на одну ступень вдвое увеличивает количество света, попадающего через объектив на матрицу. Уменьшение отверстия диафрагмы на одну ступень наполовину уменьшает количество света, попадающего через объектив на матрицу.

При съемке на коротких фокусных расстояниях диафрагма может быть умеренно открыта, и этого будет достаточно для правильного экспонирования.

Более длинные фокусные расстояния требуют пропорционально более открытой диафрагмы при одинаковых значениях f‑числа и при одинаковой яркости.

F-число = Фокусное расстояние ÷ Эффективная диафрагма

[1] Эффективная диафрагма (размер входного отверстия диафрагмы) [2] Диафрагма [3] Фокусное расстояние Примечание: значения диафрагмы и фокусного расстояния на рисунке указаны приблизительно.

Диафрагма и глубина резкости

С помощью термина «глубина резкости» обозначается диапазон расстояний от объектива камеры, при которых можно достичь приемлемой резкости изображения.

Если рассматривать в качестве примера крайние случаи, то при малой глубине резкости в фокусе оказывается очень узкая область всего в несколько миллиметров, а при большой глубине резкости можно снимать пейзажи, на которых каждый миллиметр снимка получится рассмотреть в мельчайших деталях. Умение работать с глубиной резкости является одним из базовых приемов в художественной фотографии.

Основной принцип такой: чем больше отверстие диафрагмы, тем меньше фокусное расстояние. Поэтому если вы хотите сделать портрет, на котором фон будет художественно размыт, необходимо открыть диафрагму максимально широко. Однако, здесь важно помнить и о других факторах. Чем длиннее фокусное расстояние объектива, тем больше шанс получить минимальную область резкости. Отчасти об этом уже шла речь выше: диаметр отверстия диафрагмы для объектива с фокусным расстоянием 85 мм при значении f/1.4 будет намного больше, чем для широкоугольного объектива с фокусным расстоянием 24 мм при том же значении f/1.4. Более того, фактическое расстояние между объектами в кадре также может повлиять на восприятие зрителем глубины и объема изображения.

Диафрагма (слева направо): открытая (большое отверстие) — закрытая (маленькое отверстие) Глубина резкости (слева направо): малая — большая

Три фактора, влияющие на рисунок размытия фона

Советы по съемке

Чтобы добиться художественного размытия фона, недостаточно просто выбрать светосильный объектив и снимать на полностью открытой диафрагме. Это первый важный фактор, конечно, но иногда одной лишь полностью открытой диафрагмой желаемого результата не получить. Второй важный фактор — расстояние между объектом съемки и задним планом. Если задний план расположен очень близко за объектом, он может попасть в зону резкости или оказаться настолько близко к ней, что «размыт» не будет. По возможности оставляйте максимальное расстояние между фотографируемым объектом и планом, который вы хотите «размыть». Третий важный фактор — фокусное расстояние объектива, который вы используете. Как мы уже говорили, чем больше фокусное расстояние, тем проще получить небольшую глубину резкости, так что это тоже следует учитывать. Многие фотографы считают, что идеальные фокусные расстояния для портретов с художественным размытием фона — от 75 до 100 мм.

Вы недавно просматривали

Понимание дисперсионного анализа (ANOVA) и F-критерия

Дисперсионный анализ (ANOVA) может определить, различаются ли средние значения трех или более групп. ANOVA использует F-тесты для статистической проверки равенства средних. В этом посте я покажу вам, как работают ANOVA и F-тесты, на примере однофакторного ANOVA.

Но подождите минутку… вы когда-нибудь задумывались, почему вы используете анализ дисперсии , чтобы определить, означает ли , что отличаются? Я также покажу, как дисперсии предоставляют информацию о средних значениях.

Как и в моих сообщениях о понимании t-тестов, я сосредоточусь на концепциях и графиках, а не на уравнениях, чтобы объяснить F-тесты ANOVA.

Что такое F-статистика и F-тест?

F-тесты названы в честь их тестовой статистики F, названной в честь сэра Рональда Фишера. F-статистика — это просто отношение двух дисперсий. Дисперсия является мерой дисперсии или того, насколько далеко данные разбросаны от среднего значения. Большие значения представляют большую дисперсию.

Дисперсия равна квадрату стандартного отклонения. Нам, людям, легче понять стандартные отклонения, чем дисперсии, потому что они выражены в тех же единицах, что и данные, а не в квадратах. Однако во многих анализах фактически используются дисперсии в расчетах.

F-статистика основана на отношении средних квадратов. Термин «средние квадраты» может показаться запутанным, но это просто оценка дисперсии генеральной совокупности, учитывающая степени свободы (DF), используемые для расчета этой оценки.

Несмотря на отношение дисперсий, F-тесты можно использовать в самых разных ситуациях. Неудивительно, что F-тест может оценить равенство дисперсий. Однако, изменяя дисперсии, включенные в соотношение, F-тест становится очень гибким тестом. Например, вы можете использовать F-статистику и F-тесты для проверки общей значимости регрессионной модели, для сравнения соответствия различных моделей, для проверки конкретных условий регрессии и для проверки равенства средних.

Использование F-критерия в однофакторном дисперсионном анализе

Чтобы использовать F-критерий для определения равенства групповых средних, нужно просто включить правильные отклонения в отношение. В однофакторном дисперсионном анализе F-статистика представляет собой следующее соотношение:

F = вариация между средними значениями выборки / вариация внутри выборки

Лучший способ понять это соотношение — пройтись по примеру однофакторного дисперсионного анализа.

Мы проанализируем четыре образца пластика, чтобы определить, имеют ли они разную среднюю прочность. Вы можете скачать образцы данных, если хотите следовать им. (Если у вас нет Minitab, вы можете загрузить бесплатную 30-дневную пробную версию.) Я вернусь к однофакторному результату дисперсионного анализа при объяснении концепций.

В Minitab выберите Stat > ANOVA > One-Way ANOVA…  В диалоговом окне выберите «Сила» в качестве ответа и «Выборка» в качестве фактора. Нажмите OK, и окно сеанса Minitab отобразит следующий вывод: 

Числитель: разница между средними значениями образцов

Однофакторный дисперсионный анализ вычислил среднее значение для каждого из четырех образцов пластика. Групповые средние: 11,203, 8,938, 10,683 и 8,838. Эти групповые средние значения распределяются вокруг общего среднего значения для всех 40 наблюдений, что составляет 9.915. Если групповые средние сгруппированы близко к общему среднему, их дисперсия невелика. Однако, если групповые средние разбросаны дальше от общего среднего, их дисперсия выше.

Ясно, что если мы хотим показать, что групповые средние различны, полезно, если они находятся дальше друг от друга. Другими словами, нам нужна большая вариативность средств.

Представьте, что мы выполняем два разных однофакторных ANOVA, где каждый анализ имеет четыре группы. На графике ниже показано распределение средств. Каждая точка представляет собой среднее значение всей группы. Чем дальше разбросаны точки, тем выше значение изменчивости числителя F-статистики.

Какое значение мы используем для измерения дисперсии между средними значениями выборки для примера пластической прочности? В выходных данных одностороннего ANOVA мы будем использовать скорректированное среднеквадратичное значение (Adj MS) для фактора, равное 14,540. Не пытайтесь интерпретировать это число, потому что оно не будет иметь смысла. Это сумма квадратов отклонений, деленная на коэффициент DF. Просто имейте в виду, что чем дальше друг от друга находятся средние значения группы, тем больше становится это число.

Знаменатель: Вариация в выборках

Нам также нужна оценка изменчивости в каждой выборке. Чтобы вычислить эту дисперсию, нам нужно рассчитать, насколько далеко каждое наблюдение от среднего значения группы для всех 40 наблюдений. Технически это сумма квадратов отклонений каждого наблюдения от его среднего группового значения, деленная на ошибку DF.

Если наблюдения для каждой группы близки к среднему по группе, дисперсия в выборках низкая. Однако, если наблюдения для каждой группы дальше от среднего значения группы, дисперсия внутри выборок выше.

На графике панель слева показывает низкую вариацию образцов, а панель справа показывает высокую вариацию. Чем более разбросаны наблюдения от их среднего группового значения, тем выше значение в знаменателе F-статистики.

Если мы хотим показать, что средства различаются, хорошо, когда внутригрупповая дисперсия невелика. Вы можете думать о внутригрупповой дисперсии как о фоновом шуме, который может скрыть разницу между средними значениями.

Для этого примера однофакторного дисперсионного анализа значение, которое мы будем использовать для дисперсии в выборках, — это Adj MS для ошибки, равное 4,402. Это считается «ошибкой», потому что это изменчивость, не объясняемая фактором.

Готовы к демонстрации программного обеспечения Minitab Statistical? Просто спроси!

 

F-статистика: вариации между средними выборками / вариации внутри выборок

F-статистика — это тестовая статистика для F-тестов. В общем, F-статистика представляет собой отношение двух величин, которые, как ожидается, будут примерно равны при нулевой гипотезе, что дает F-статистику приблизительно 1,9.0003

F-статистика включает обе меры изменчивости, рассмотренные выше. Давайте посмотрим, как эти меры могут работать вместе для получения низких и высоких F-значений. Посмотрите на графики ниже и сравните ширину спреда групповых средних с шириной спреда внутри каждой группы.

На графике низкого значения F показан случай, когда средние групповые значения близки друг к другу (низкая изменчивость) относительно изменчивости внутри каждой группы. График высокого F-значения показывает случай, когда изменчивость групповых средних велика по сравнению с внутригрупповой изменчивостью. Чтобы отвергнуть нулевую гипотезу о том, что средние группы равны, нам нужно высокое F-значение.

В нашем примере с пластической прочностью мы будем использовать множитель Adj MS для числителя (14,540) и Error Adj MS для знаменателя (4,402), что дает нам F-значение 3,30.

Достаточно ли велико наше значение F? Одно F-значение трудно интерпретировать само по себе. Нам нужно поместить наше F-значение в более широкий контекст, прежде чем мы сможем его интерпретировать. Для этого мы будем использовать F-распределение для расчета вероятностей.

F-распределения и проверка гипотез

Для однофакторного дисперсионного анализа отношение межгрупповой изменчивости к внутригрупповой изменчивости соответствует F-распределению, когда нулевая гипотеза верна.

Когда вы выполняете однофакторный дисперсионный анализ для одного исследования, вы получаете одно значение F. Однако если бы мы взяли несколько случайных выборок одинакового размера из одной и той же совокупности и выполнили бы один и тот же однофакторный дисперсионный анализ, мы бы получили много F-значений и могли бы построить распределение для всех из них. Этот тип распределения известен как выборочное распределение.

Поскольку F-распределение предполагает, что нулевая гипотеза верна, мы можем поместить F-значение из нашего исследования в F-распределение, чтобы определить, насколько наши результаты согласуются с нулевой гипотезой, и рассчитать вероятности.

Вероятность, которую мы хотим вычислить, — это вероятность наблюдения F-статистики, которая по крайней мере равна значению, полученному в нашем исследовании. Эта вероятность позволяет нам определить, насколько распространено или редко встречается наше F-значение в предположении, что нулевая гипотеза верна. Если вероятность достаточно мала, мы можем сделать вывод, что наши данные не согласуются с нулевой гипотезой. Доказательства выборочных данных достаточно убедительны, чтобы отвергнуть нулевую гипотезу для всего населения.

Вероятность, которую мы рассчитываем, также известна как p-значение!

Чтобы построить F-распределение для нашего примера пластической прочности, я буду использовать графики распределения вероятностей Minitab. Чтобы построить график F-распределения, подходящего для нашего конкретного дизайна и размера выборки, нам нужно указать правильное количество DF. Глядя на наш односторонний результат ANOVA, мы видим, что у нас есть 3 DF для числителя и 36 DF для знаменателя.

На графике показано распределение F-значений, которые мы получили бы, если бы нулевая гипотеза верна и мы повторили наше исследование много раз. Заштрихованная область представляет собой вероятность наблюдения F-значения, которое, по крайней мере, такое же большое, как F-значение, полученное в нашем исследовании. F-значения попадают в эту заштрихованную область примерно в 3,1% случаев, когда нулевая гипотеза верна. Эта вероятность достаточно низка, чтобы отвергнуть нулевую гипотезу, используя общий уровень значимости 0,05. Можно сделать вывод, что не все групповые средние равны.

Узнайте, как правильно интерпретировать p-значение.

Оценка средних значений путем анализа вариации

Дисперсионный анализ использует F-критерий, чтобы определить, превышает ли изменчивость между средними группами изменчивость наблюдений внутри групп. Если это отношение достаточно велико, можно сделать вывод, что не все средства равны.

Это возвращает нас к тому, почему мы анализируем вариации, чтобы судить о средних значениях. Подумайте над вопросом: «Являются ли группы средствами разными?» Вы неявно спрашиваете об изменчивости средств. Ведь если группа значит не различаются или не отличаются больше, чем позволяет случайность, тогда вы не можете сказать, что средства различны. Вот почему вы используете дисперсионный анализ для проверки средств.

Формула F-теста | Как выполнить F-тест? (Шаг за шагом)

[wbcr_snippet id=”77105″]

Формула F-критерия, которую можно использовать для выполнения статистического теста, помогающего лицу, проводящему тест, определить, имеют ли два множества населения нормальное распределение точки данных имеют одинаковое стандартное отклонение.

F-тест — это любой тест, использующий F-распределение. F-значение — это значение F-распределения. Различные статистические тесты генерируют значение F. Значение может определить, является ли тест статистически значимым. Например, чтобы сравнить две дисперсии, нужно рассчитать отношение двух дисперсий, которое выглядит следующим образом:

Значение F = Большая выборочная дисперсия / Меньшая выборочная дисперсия = σ 1 2 / σ 2 2