Определить размер по параметрам: Страница не найдена

Содержание

Как определить свой размер одежды

Показатели антропометрических измерений, как средство для определения размера одежды и обуви

Антропометрические измерения дают возможность определять уровень и особенности физического развития, степень его соответствия полу и возрасту, имеющиеся отклонения, а также уровень улучшения физического развития под воздействием занятий физическими упражнениями и различными видами спорта. Таким образом, антропометрия включает в себя определение длины, окружностей и других показателей. Для чего это нужно человеку в жизни? С помощью антропометрических показателей можно контролировать динамику физического развития, эффективность физических упражнений. Также можно научится определять размер одежды. Большинство современных расчетно-графических методов конструирования одежды предусматривает в качестве исходных данных сведения о размерах тела (размерную характеристику фигуры) человека и прибавки (припуски) на свободное облегание. Размер — это буквенный либо цифровой код, соответствующий определённым линейным параметрам человеческого тела, или той его части, для которой предназначена данная деталь одежды, аксессуар либо обувь. Как правило, размер наносится на бирку, прикрепленную к одежде или аксессуару, а в случае обуви он может быть нанесён на подошву или стельку.

Какие антропометрические показатели используются для определения размера одежды и обуви, как правильно их измерить

Рост. Для того чтобы верно измерить свой рост, вам будет необходима посторонняя помощь, линейка и карандаш. Становитесь босиком спиной к стене, стараясь не горбиться. Линейка кладется на голову, проводится прямая линия от макушки до стены, где и делается пометка карандашом. Теперь при помощи линейки или метра высчитываете расстояние от пола до метки.

Обхват груди. Вам понадобится гибкая лента–метр. Обмотайте вокруг груди сантиметр так, чтобы он прошел через все выступающие точки. Для получения точного результата повторите процедуру измерения повторно.

Обхват талии также измеряется при помощи сантиметра. Измеряя талию, не втягивайте живот, иначе показатель будет неверный.

Обхват бедер. Измеряется примерно на 15-18 сантиметров ниже уровня талии по самым выступающим точкам ягодиц.

Размер обуви.Размер ноги человека определяется двумя параметрами — длиной и шириной стопы.Определяем свои размеры. Первое — измерим длину стопы. Делать это рекомендуется в конце дня, т.к. ноги растаптываются и становятся больше. Встаньте на лист бумаги и обведите ногу карандашом. Для определения длины стопы измерьте расстояние между самыми удаленными точками на чертеже. Измерьте обе ноги и выберите большую длину. Округлите полученный результат до 5 мм и найдите свой размер в таблице.

Таблица 1. Определяем размер одежды

Таблица № 2 Определяем размер ноги

Таблица № 3 Определяем размер обуви

Онлайн калькулятор размеров одежды и обуви

Главным критерием, на котором основывается методика определения размеров одежды онлайн-калькулятором, являются физические параметры людей, их половой признак. Размер одежды ребенка зависит также и от его возраста.

С помощью калькулятора размеров одежды вы легко сможете узнать свой размер.

Доступным и удобным инструментом для определения своих размеров перед приобретением обновок является онлайн-калькулятор размера одежды. Его востребованность в последнее время все больше возрастает в связи с увеличением объемов закупок мужской, женской и детской одежды в интернет-магазинах. Чтобы избежать хлопот с возвратом одежды, которую невозможно примерить, необходимо найти свой точный размер.

Онлайн-калькулятор определения размера одежды: удобно, быстро и точно

Чтобы рассчитать размер одежды с помощью калькулятора онлайн, достаточно измерить некоторые параметры своей фигуры и ввести данные в соответствующие поля. Точность измерений гарантирует использование тканевой сантиметровой ленты. Снятие морок нужно производить в тонком нижнем белье, натяжение ленты должно плотно охватывать измеряемый участок.

Онлайн-калькулятор определения размера детской одежды возрастной группы от первого месяца до 11 лет включает заполнение различных полей. Так, если возраст малыша составляет 5–6 лет, рассчитать детский размер можно по определяющему критерию для этой возрастной группы – росту ребенка. Для более старших детей к измерению роста необходимо прибавить:

  • измерение обхвата груди;
  • определение окружности талии;
  • снятие мерки окружности бедер.

При покупке гардероба на вырост или приобретения детской одежды в качестве подарка нужно учесть прибавку в размере в зависимости от взросления ребят. Так, для трехмесячного малыша такая прибавка составляет один размер за каждые 1,5 месяца, для годовалого – размер на единицу возрастает через 3 месяца. Ребенок возраста 1–4 года достигает следующего размерного значения через полгода, а старший четырехлетнего возраста малыш увеличивает размер своей одежды только раз в год.

Для новорожденных детей определяющим размер показателем является их вес.

Как самому определить размер одежды табличным методом

Можно самостоятельно определить размер одежды, произведя следующие измерения своих параметров:

  • длину окружности по линии груди. Обхват бюста понадобится при выборе размера «верха» — футболки, платья, блузы, куртки или пальто;
  • окружность талии – необходимый параметр при заказе или покупке поясных изделий;
  • обхват бедер измеряют перед заказом «низа» – джинсов, классических брюк, шорт;
  • рост.

Особенностью определения женских размеров является то обстоятельство, что женская фигура не всегда соответствует идеальным параметрам. Так, некоторые типы фигур отличаются узкими плечами при широких бедрах и наоборот. В случае когда измеренное значение обхвата груди выходит за пределы стандарта, лучше ориентироваться на больший размер.

Таблица размеров

Уважаемый покупатель!

ПРАВИЛА УСПЕШНОЙ ПОКУПКИ — ЭТО ПРАВИЛЬНО ПОДОБРАННЫЙ РАЗМЕР и СИЛУЭТ



1. Измерьте параметры фигуры: Обхват груди-Обхват талии-Обхват бедер и определите размер по Таблице размеров (таблица ниже).

2. Выберите фасон, который Вам подходит.

3. Учтите Ваши предпочтения (изделие должно сидеть свободнее, более облегающее или как на фото).

КАК ПРАВИЛЬНО ИЗМЕРИТЬ ПАРАМЕТРЫ ФИГУРЫ:

 1. Измерения производятся сантиметровой лентой, по горизонтальным линиям ОГ-ОТ-ОБ.

 2. Обхват груди и бедер следует измерять по самым выпуклым местам. Обхват бедер измеряется по линии 19-20 см ниже линии талии.

 3. Сантиметровая лента должна прилегать к телу, но не утягивать (между лентой и телом должен входить 1 пальчик).

 4. При измерении параметров не нужно добавлять сантиметры, чтобы правильно определить размер.

*** Если Вам сложно измерить себя, тогда измерьте изделие, которое комфортно на Вас сидит. Параметры Вашего изделия скажите нам! Например, так: «параметры моего платья, которое мне нравится, ОГ=110, ОТ=95, ОБ=112, полная длина изделия 100 см».

СИЛУЭТЫ ИЗДЕЛИЙ ПО СТЕПЕНИ ПРИЛЕГАНИЯ:

1. Облегающий силуэт — изделие садится по фигуре плотно. Параметры изделия меньше параметров в таблице, чтобы был эффект облегания по фигуре.

2. Прилегающий силуэт — изделие садится по фигуре с прилеганием. Параметры изделия равны или +/- 2 см к параметрам в таблице по Обхвату груди, бедрам.

3. Полуприлегающий силуэт — изделие садится с небольшой свободой. Параметры изделия больше параметров в таблице на 4-6 см по Обхвату груди, бедрам.

4. Свободный силуэт — изделие садится свободно. Параметры изделия больше параметров в таблице, более чем на 6 см по Обхвату груди и/или по бедрам.

ТАБЛИЦА РАЗМЕРОВ (размеры российские).

В таблице указаны параметры фигуры, а не параметры одежды.


ЗАТРУДНЯЕТЕСЬ С ВЫБОРОМ РАЗМЕРА?

Напишите в комментариях к Заказу:

«Мои параметры фигуры ОГ-ОТ-ОБ, прошу подобрать размер».

Обращайтесь, будем рады Вам помочь!

  1. С уважением, Администрация интернет-магазина Мелодия моды.
  2. Полная версия — здесь

Как узнать, определить свой размер одежды европейский?

Размеры по странам

0 Комментариев

Как правило, на ярлыке продукции стоит обозначение того размера, который принят в стране-изготовителе. Поэтому при выборе одежды иностранных брендов могут возникнуть затруднения. Чтобы этого не произошло, заранее узнайте, как обозначается ваш российский размер в иных системах координат.

Европейский размер легко определить, если вы знаете свой размер по российской шкале. Всё, что нужно сделать, — отнять от этого значения цифру 6. К примеру, европейский 36 размер одежды соответствует нашему 42му, 38 — 44му и т.д.

Если вдруг вы не знаете свой размер, определить его можно с помощью снятия мерок с трех основных параметров: обхвата груди, талии и бедер. Обхват груди замеряют по самым выступающим ее точкам. Обхват талии — по наиболее узкому месту. Объем бедер — по наиболее выступающим точкам ягодиц.

Также не лишним будет узнать свой точный рост. Его можно измерить, если встать у прямой вертикальной поверхности, прислонившись к ней затылком, лопатками, ягодицами и пятками – от макушки до подошвы.

Определяем свой европейский размер по таблице:

Размер, РоссияБуквенное обозначениеОбхват груди, смОбхват талии, смОбхват бедер, смДлина рукава, смРазмер, Европа
38XXS76588258/6032
40XS80628659/6134
42S84669259/6136
44M88709660/6238
46M927410060/6240
48L967810460/6242
50L1008210861/6344
52XL1048611261/6346
54XXL1089011661/6348
56XXL11294120616350
58XXXL1169812462/6452
604XL12010212862/6454
624XL12410613262/6556
644XL12811013662/6558
665XL13211414062/6560
685XL13611814462/6562
705XL1401224862/6564

 

Европейская мужская одежда представлена для четырех типов фигур:

  • N-размер. Стандартные пропорции.
  • U-размер. Для коренастых мужчин.
  • B-размер. С большим объемом в поясе.
  • S-размер. Для мужчин со стройной фигурой.

Шкала европейских производителей полностью соответствует российским размерам.

Случается, что одежда одного и того же размера от разных производителей может сидеть по-разному. Лучший вариант – примерить вещь и запомнить, какое обозначение на ярлыке соответствует вашему размеру. Однако, совершая покупки через интернет, у человека такая возможность отсутствует. Так что лучше вооружиться измерительной лентой и узнать свой размер наверняка

Удачных покупок!

Возможно, Вам будет интересно

Таблица размером

Размеры нижнего белья и колготок — таблицы.

Для Вашего удобства при просмотре каталога Вы можете ограничить вывод моделей только по необходимым Вам параметрам: размеру, цене, бренду. В фильтре размеров Вы можете выбрать как один, так и несколько размеров для просмотра.

Бюстгальтер

Размер женского нижнего белья играет решающую роль при выборе бюстгальтера. Ведь правильно подобранный бюстгальтер — это, в первую очередь, хорошее самочувствие, привлекательный внешний вид, и, как следствие, прекрасное настроение!

Для того, чтобы правильно определить размер бюстгальтера, нужно произвести два измерения:

  • 1. Первое измерение — обхват груди (объем груди). Сантиметровая лента проходит по наиболее выступающим точкам груди, строго горизонтально, прилегает свободно и не стягивает грудь.
  • 2. Второе измерение — обхват спины (объем под грудью).Плотно прижимаем сантиметровую ленту прямо под грудью.

*Примечание: лучше, чтобы размеры с Вас снимал кто-то другой, т.к. для точного измерения необходимо, чтобы во время снятия мерок женщина стояла с опущенными руками.

Размеры женского нижнего белья
— таблица определения чашки бюстгальтера

Размер бюстгальтера определяется двумя параметрами — цифрой и буквой. Цифра — это обхват под грудью в сантиметрах, а буква — размер чашечки, который определяется по таблице:

Пример: Объем под грудью – 75 см, объем груди – 90 см.

В первом столбце находим значение 75 см. Оно находится в диапазоне 73-77 см. Далее следуя по горизонтали, находим объем груди – 90 см. Он находится в диапазоне 89-91 см. Это значение соответствует столбику В. Получается, что размер бюстгальтера – 75В, из которого В – это размер чашечки.

Примеры параллельных размеров

Существует такое понятие, как «параллельный» размер, т.е. женщине, привыкшей покупать бюстгальтер 75В, стоит примерить бюстгальтеры 80А и 70С. Вполне возможно, что посадка у них будет лучше, и они выгоднее подчеркнут все достоинства фигуры.

Соотношение размерного ряда бюстгальтеров разных марок ()

Настоящий размерный ряд нижнего белья используют европейские производители корсетного белья (за исключением французских) и российские. В этой таблице можно легко узнать, какой европейский размер бюстгальтера вам подходит. Возьмем для рассмотрения предыдущий пример.

Пример: Обхват под грудью – 75 см, обхват груди – 90 см. Размер чашечки – В. Размер бюстгальтера – 75В.

В первом столбце находим значение 75 см. Оно находится в диапазоне 73-77 см. Далее следуя по горизонтали, видим, что если мы выбираем белье немецких или российских марок, то нам следует искать размер 75В. Если французских – 90В, украинских – 34В, итальянских – 3В. Ну а международный размер будет соответствовать размеру M.


Размеры нижнего белья и колготок — таблицы.

Для этого необходимо провести два измерения:

  • 1) Обхват талии — свободно обернуть сантиметровую ленту вокруг талии;
  • 2) Обхват бедер — обернуть сантиметровую ленту вокруг бедер в самой широкой их части.
Таблица размеры трусов (для женского нижнего белья)

В Германии действует европейская система размеров нижнего белья.

На 2 единицы от европейских размеров отличаются французские размеры поясного белья.

В свою очередь, отечественные размеры нижнего белья имеют отличие от европейских размеров на 6 единиц.

Таблица — размеры мужского нижнего белья

Как определить размер

Подбор размера осуществляется по параметрам указанных рядом с цифрой размера при выборе товара.

Обхват груди — снимается по возвышенностям лопаток. Сантиметровая лента должна пройти по подмышечным впадинам и соединиться на самой выпуклой части груди.

Обхват талии — снимается вокруг самой узкой части фигуры (если такая имеется). Для точности определения талии можно опоясать фигуру поясом.

Обхват бедер — это не просто обхват бёдер. Мерка снимается по самой выпуклой части ягодиц, захватывая спереди широкую часть живота.

Длина рукава — Длина руки до запястья.  Измеряется от крайней точки плечевого сустава по внешней стороне чуть согнутой руки до внешней косточки запястья. Эта мерка актуальна для изделий с длинным рукавом. Длина укороченного рукава зависит от модели.

Длина брюк — измеряется по боковому шву от талии до желаемой длины.

 

 

Женские размеры
ТИПОВЫЕ РАЗМЕРЫ ОБХВАТ ГРУДИ ОБХВАТ ТАЛИИ ОБХВАТ БЁДЕР
38 76 54 84
40 80 58 88
42 84 62 92
44 88 66 96
46 92 71 100
48 96 75 104
50 100 79 108
52 104 83 112
54 108 88 116
56 112 93 120
58 116 98 124
60 120 103 128
62 124 108 132
64 128 113 136
66 132 118 140
68 136 124 144
70 140 129 148
72 144 135 152
74 148 140 156
Мужские размеры
ТИПОВЫЕ РАЗМЕРЫ ОБХВАТ ГРУДИ ОБХВАТ ТАЛИИ ОБХВАТ БЁДЕР
38 76 64 86
40 80 68 89
42 84 72 92
44 88 76 95
46 92 80 98
48 96 84 101
50 100 88 104
52 104 92 107
54 108 96 110
56 112 100 113
58 116 104 116
60 120 108 119
62 124 112 122
64 128 116 125
66 132 120 128
68 136 124 131
70 140 128 134
72 144 132 137
74 148 136 140

Размеры женских футболок

Размер XS S M L XL
Размер (RUS) 42 44 46 48 50
Грудь 39 41 43 45 47
Высота 58 59 61 62 63

Размеры мужских футболок

Размер S M L XL XXL XXXL
Размер (RUS) 44-46 46-48 48-50 50-52 52-54 54-56
Грудь 51 53 56 58 60 62
Высота 70 71 72 74 76 77

 

Размеры купальников: как определить размер купальника правильно

17.03.2021 13:19 0 комментариев

Модницы чаще уделяют внимание дизайну и фасону купальника, хотя куда большее значение имеет правильно подобранный размер.

Более актуальную информацию можно прочитать в статье «Модные женские купальники 2021. ТОП-11 стильных трендов на лето».

Для пляжной одежды, как и для белья, неприемлем оверсайз и просто свободный крой. Купальный наряд плотно облегает фигуру, потому сидеть должен идеально. Иначе рискуете подпортить не только пляжный образ, но и репутацию, ведь купальник неправильного размера сползает и перекручивается, легко обнажая дамские прелести.

Выбор купальника

Многих ошибок можно избежать, если подойти к пляжному шоппингу грамотно. Купальный наряд сложно перешивать, подгонять под фигуру, тем более трудно скорректировать силуэт другими предметами гардероба, ведь вы захотите раздеться, чтобы поплавать и позагорать. Предлагаем несколько дельных рекомендаций по выбору удачного купальника.

  • Первым делом определитесь с фасоном.

Существуют разные виды купальных ансамблей: майо, пландж, бикини и так далее. Старайтесь подобрать модель по фигуре. Женщинам с пышным бюстом подходят купальники халтер, обеспечивающие хорошую поддержку. Обратите внимание на танкини, майо и монокини с широкими бретелями. Пландж с глубоким декольте, открытые купальники бикини и бандини хорошо смотрятся на девушках с маленькой грудью. Соблазнительные бедра наиболее выгодно подчеркивают ретро-шортики и высокие вырезы на плавках. Худеньким красоткам подойдет свимдресс.


  • Учитывайте особенности модели.

Если для классического открытого бикини на завязках размер не слишком принципиален, его легко регулировать, но цельный купальник должен сидеть как вторая кожа. То же можно сказать о монокини. Модель с полоской спереди и открытой спиной выигрышно смотрится лишь в случае приталенного силуэта. Висящие лямки портят весь эффект.

Даже если в повседневном гардеробе вещи 42 размера, совсем не обязательно приглянувшийся купальник окажется самым маленьким в линейке. У производителя может быть собственная размерная сетка, не говоря уж о различиях маркировок разных стран. Пусть ваш купальник окажется на размер или два больше, чем ожидалось. Главное, чтобы посадка была идеальной, подчеркивающей все ваши многочисленные красоты.

  • Выбирать нужно не на глаз, а на тело.

Женский глазомер – без сомнения, уникальное явление. Мы, в отличие от мужчин, можем безошибочно определить квадратуру гостиной в преддверии ремонта и заметить граммовый недовес в пакете картошки. Как ни парадоксально, собственные параметры для женщины всегда загадка. Так что не пренебрегайте снятием необходимых мерок. Вознаграждением за труды будет потрясающий внешний вид на побережье.

Как узнать размер купальника?

Хотя в каждом магазине сотни консультантов готовы прийти на помощь, в размерных вопросах всегда лучше разобраться самой. Нет лучше способа, как определить размер купальника, да и любых других вещей, чем замер фигуры. Нас интересуют следующие параметры.

  1. Объем бедер. Сантиметровая лента проходит по выступающим точкам ягодиц, держать ее следует строго горизонтально.
  2. Обхват талии. Объем самой узкой части туловища над пупком. Не втягивайте живот, если не собираетесь провести весь отпуск в таком состоянии.
  3. Обхват под грудью. Сзади лента должна находиться под лопатками.
Объем бюста. Линия обхвата проходит через выступающие точки груди спереди. Сзади проведите ее над лопатками.

Лучше осуществлять замеры в удобном белье. Это должны быть обычные трусики без утягивающего эффекта и гладкий бюстгальтер без пуш-апа.

Существует универсальная международная система маркировки размеров по буквам S, M и L , где каждая буква является обозначением определенного размера:

— S (Small) – маленький,

— M (Medium) – средний,

— L (Large) – большой.

Для того чтобы понять, как определить размер купальника по буквам, нужно хорошо разбираться в соответствии их российским и европейским параметрам.

Вот и все мерки, которые нужны для определения точного размера пляжного наряда. Параметры актуальны не только для размерной сетки купальников, но и для любой другой одежды.

Определяем размер пляжной обновки

Хотя фигура каждой из нас неповторима и уникальна, определить примерную классификацию комплекций все же можно. Небольшие погрешности нивелируются посредством выбора эластичной ткани, регулируемых застежек, завязок и так далее.

Как видим, погрешности в несколько сантиметров не играют большой роли. Что делать, если ваша фигурка попала между размерами? Выбирайте в сторону большего. Посадка будет красивее и удобнее.

Как выбрать правильную чашку?

Это вопрос не только красоты, но также комфорта и женского здоровья. Модели с лифом без косточек выбираются без учета полноты чашки. Для таких купальных фасонов требуется лишь обхват груди. Чтобы определить размер купальника с жестким кроем чашечки, используйте такую табличку.


Маркировка изделия обычно содержит цифру – обхват под грудью, и букву A, B, C, D, Е, F, G – полнота чашки, которую мы уже научились определять. Например, если обхват под грудью равен 70 см, а груди – 85 см, то размер рассчитывается так: 85-70=15 см, что соответствует В-чашке. Значит нужно покупать купальник с лифом 70В.

  • от 12 до 13 см – А;
  • от 14 до 15 см – В;
  • от 16 до 17 см – С;
  • от 18 до 19 см – D;
  • от 20 до 21 см – E;
  • от 22 до 23 см – F;
  • от 24 до 25 см – G.

Работают те же правила, что и при выборе нижнего белья.

Определить полноту чашки можно самостоятельно. Нужно вычесть из величины объема бюста значение обхвата под грудью. Полученное число соотнесите со стандартной классификацией.

Размерные особенности слитных моделей

Когда речь о раздельном купальнике, модница может выбирать трусики и лиф разных размеров, что очень удобно. Для цельных вариантов все немного сложнее. Закрытые модели рассчитаны на пропорциональную фигуру с примерно одинаковыми объемами груди и бедер. Рост при этом должен варьироваться в пределах среднестатистических показателей. Выбирайте подходящую модель по табличке.

Что делать, если ваши параметры отличаются от предлагаемых линеек? Искать другие варианты. Например, хорошая альтернатива слитному купальнику – танкини.

Пляжная мода — как купить купальник правильно?

Даже самый модный фасон не заслуживает внимания, если он не в состоянии подчеркнуть достоинства фигурки. И наоборот, любимой модели купального наряда не обязательно изменять, можете экспериментировать на тему цвета и декора. Каждый год дизайнеры предлагают массу вариантов стильных новинок. Среди такого разнообразия вы легко подберете красивую обновку подходящего силуэта.

Понимание и расчет количества параметров в сверточных нейронных сетях (CNN) | Ракшит Васудев

К вашему сведению: приведенное выше изображение не соответствует правильному количеству параметров. См. Раздел «ИСПРАВЛЕНИЕ». Вы можете перейти к этому разделу, если вам просто нужны числа.

Если вы играли с CNN, часто можно встретить сводку параметров, показанную на изображении выше. Все мы знаем, что размер активации легко рассчитать, учитывая, что это просто произведение ширины, высоты и количества каналов в этом слое.

Например, как показано на изображении выше с coursera, форма входного слоя (32, 32, 3), размер активации этого слоя 32 * 32 * 3 = 3072. То же самое верно, если вы хотите рассчитать форму активации любого другого слоя. Скажем, мы хотим рассчитать размер активации для CONV2. Все, что нам нужно сделать, это просто умножить (10,10,16), т.е. 10 * 10 * 16 = 1600, и вы закончите вычисление размера активации.

Однако, что иногда может оказаться непростым, так это подход к вычислению количества параметров в данном слое.С учетом сказанного, вот несколько простых идей, которые я должен иметь в виду, чтобы сделать то же самое.

Позвольте мне задать вам вопрос: как CNN учится?

Это восходит к идее понимания того, что мы делаем со сверточной нейронной сетью, которая в основном пытается узнать значения фильтра (ов) с помощью обратного распространения. Другими словами, если у слоя есть весовые матрицы, это «обучаемый» уровень.

По сути, количество параметров в данном слое — это количество «обучаемых» (при условии, что такое слово существует) элементов для фильтра, или параметров для фильтра для этого уровня.

Параметры, как правило, представляют собой веса, которые изучаются во время тренировки. Это весовые матрицы, которые вносят вклад в предсказательную силу модели, изменяемую в процессе обратного распространения. Кто управляет изменениями? Что ж, выбранный вами алгоритм обучения, в частности стратегия оптимизации, заставляет их менять свои значения.

Теперь, когда вы знаете, что такое «параметры», давайте погрузимся в вычисление количества параметров в образце изображения, которое мы видели выше. Но я бы хотел снова включить это изображение сюда, чтобы избежать ваших усилий и времени на прокрутку.

Определение мощности и размера выборки

Определение мощности и размера выборки

Определение мощности и размера выборки

Автор:

Лиза Салливан, доктор философии

Профессор биосатистики

Школа общественного здравоохранения Бостонского университета


Критически важным аспектом любого исследования является определение подходящего размера выборки для ответа на исследовательский вопрос.В этом модуле основное внимание уделяется формулам, которые можно использовать для оценки размера выборки, необходимого для получения оценки доверительного интервала с заданным пределом погрешности (точности) или для обеспечения высокой вероятности проверки гипотезы при обнаружении значимой разницы в параметр.

Исследования должны быть разработаны таким образом, чтобы включать достаточное количество участников для адекватного ответа на вопрос исследования. Исследования, в которых участвует либо недостаточное количество участников, либо чрезмерно большое количество участников, расточительны с точки зрения времени участников и исследователей, ресурсов для проведения оценок, аналитических усилий и т. Д.Эти ситуации также можно рассматривать как неэтичные, поскольку участники могли подвергнуться риску в рамках исследования, которое не смогло ответить на важный вопрос. Исследования, которые намного больше, чем они должны быть, чтобы ответить на вопросы исследования, также расточительны.

Представленные здесь формулы позволяют получить оценки необходимого размера выборки на основе статистических критериев. Однако во многих исследованиях размер выборки определяется финансовыми или логистическими ограничениями. Например, предположим, что предлагается исследование для оценки нового скринингового теста на синдром Дауна.Предположим, что скрининговый тест основан на анализе образца крови, взятого у женщины на ранних сроках беременности. Чтобы оценить свойства скринингового теста (например, чувствительность и специфичность), каждой беременной женщине будет предложено сдать образец крови и, в дополнение, пройти амниоцентез. Амниоцентез включен в качестве золотого стандарта, и его план состоит в том, чтобы сравнить результаты скринингового теста с результатами амниоцентеза. Предположим, что сбор и обработка образца крови стоит 250 долларов на участника, а амниоцентез — 900 долларов на участника.Одни только эти финансовые ограничения могут существенно ограничить число женщин, которые могут быть зачислены. Так же, как важно учитывать статистическую и клиническую значимость при интерпретации результатов статистического анализа, важно также взвесить как статистические, так и логистические вопросы при определении размера выборки для исследования.


После завершения этого модуля студент сможет:

  1. Приведите примеры, демонстрирующие, как предел погрешности, размер эффекта и изменчивость результата влияют на вычисления размера выборки.
  2. Рассчитайте размер выборки, необходимый для точной оценки параметров генеральной совокупности.
  3. Интерпретировать статистическую мощность при проверке гипотез.
  4. Вычислите размер выборки, необходимый для обеспечения высокой мощности при проверке гипотез.


Модуль доверительных интервалов предоставляет методы оценки доверительных интервалов для различных параметров (например, μ, p, (μ 1 — μ 2 ), μ d , (p 1 -p 2 ) )).Доверительные интервалы для каждого параметра имеют следующий общий вид:

Оценка

балла + Погрешность

В модуле доверительных интервалов мы вывели формулу доверительного интервала для μ как

На практике мы используем стандартное отклонение выборки для оценки стандартного отклонения генеральной совокупности. Обратите внимание, что существует альтернативная формула для оценки среднего значения непрерывного результата в одной генеральной совокупности, и она используется, когда размер выборки невелик (n <30).Он включает значение из распределения t, в отличие от значения из стандартного нормального распределения, чтобы отразить желаемый уровень достоверности. При вычислении размера выборки мы используем формулу для большой выборки, показанную здесь. [Примечание: размер результирующей выборки может быть небольшим, и на этапе анализа необходимо использовать соответствующую формулу доверительного интервала.]

Точечная оценка среднего для генеральной совокупности является выборочным средним, а предел погрешности составляет

.

При планировании исследований мы хотим определить размер выборки, необходимый для обеспечения того, чтобы предел погрешности был достаточно малым, чтобы быть информативным.Например, предположим, что мы хотим оценить средний вес студенток колледжа. Мы проводим исследование и получаем 95% доверительный интервал следующим образом: 125 + 40 фунтов, или от 85 до 165 фунтов. Предел погрешности настолько велик, что доверительный интервал неинформативен. Чтобы быть информативным, исследователь может захотеть, чтобы предел погрешности составлял не более 5 или 10 фунтов (это означает, что 95% доверительный интервал будет иметь ширину (от нижнего предела до верхнего предела) 10 или 20 фунтов). Чтобы определить необходимый размер выборки , исследователь должен указать желаемую погрешность .Важно отметить, что это не статистический вопрос, а клинический или практический. Например, предположим, что мы хотим оценить средний вес при рождении младенцев, рожденных матерями, которые курят сигареты во время беременности. Вес при рождении у младенцев явно имеет гораздо более ограниченный диапазон, чем у студенток колледжа. Следовательно, мы, вероятно, захотим создать доверительный интервал для среднего веса при рождении, который имеет погрешность, не превышающую 1–2 фунта.

Предел погрешности в доверительном интервале одной выборки для μ можно записать следующим образом:

.

Наша цель — определить размер выборки n, гарантирующий, что предел погрешности « E » не превышает указанного значения. Мы можем взять приведенную выше формулу и с помощью алгебры найти n :

Сначала умножьте обе части уравнения на квадратный корень из n . Затем вычтите квадратный корень из n из числителя и знаменателя в правой части уравнения (поскольку любое число, деленное само на себя, равно 1). Остается:

Теперь разделите обе части на «E» и вычеркните «E» из числителя и знаменателя в левой части.Остается:

Наконец, возведите обе части уравнения в квадрат, чтобы получить:

Эта формула генерирует размер выборки n , необходимый для обеспечения того, чтобы предел погрешности E не превышал заданного значения. Чтобы найти n , мы должны ввести « Z », « σ», «» и « E ».

  • Z — значение из таблицы вероятностей стандартного нормального распределения для желаемого уровня достоверности (например,g., Z = 1,96 для 95% достоверности)
  • E — это предел погрешности, который исследователь определяет как важный с клинической или практической точки зрения.
  • σ — стандартное отклонение интересующего результата.

Иногда трудно оценить σ . Когда мы используем приведенную выше формулу размера выборки (или одну из других формул, которые мы представим в следующих разделах), мы планируем исследование для оценки неизвестного среднего значения конкретной переменной результата в генеральной совокупности.Маловероятно, что мы узнаем стандартное отклонение этой переменной. При вычислении размера выборки исследователи часто используют значение стандартного отклонения от предыдущего исследования или исследования, проведенного в другой, но сопоставимой популяции. Расчет размера выборки не является применением статистических выводов, и поэтому разумно использовать соответствующую оценку стандартного отклонения. Оценка может быть получена из другого исследования, о котором сообщалось в литературе; некоторые исследователи проводят небольшое пилотное исследование для оценки стандартного отклонения.Пилотное исследование обычно включает небольшое количество участников (например, n = 10), которые выбираются по удобству, а не методом случайной выборки. Данные участников пилотного исследования можно использовать для вычисления стандартного отклонения выборки, которое служит хорошей оценкой для σ в формуле размера выборки. Независимо от того, как получается оценка изменчивости результата, она всегда должна быть консервативной (т.е. настолько большой, насколько это разумно), чтобы размер результирующей выборки не был слишком маленьким.

Формула дает минимальный размер выборки, гарантирующий, что предел погрешности в доверительном интервале не превысит E . Планируя исследования, исследователи также должны учитывать выбытие или отказ от последующего наблюдения. Приведенная выше формула дает необходимое количество участников с полными данными, чтобы гарантировать, что предел ошибки в доверительном интервале не превышает E . Мы проиллюстрируем, как устраняется истощение при планировании исследований, на примерах в следующих разделах.


В исследованиях, в которых планируется оценить среднее значение переменной непрерывного результата в одной популяции, ниже приводится формула для определения размера выборки:

, где Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), σ — стандартное отклонение переменной результата, а E — желаемое погрешность.Приведенная выше формула генерирует минимальное количество субъектов, необходимое для обеспечения того, чтобы предел погрешности доверительного интервала для μ не превышал E .

Пример 1:

Исследователь хочет оценить среднее систолическое артериальное давление у детей с врожденным пороком сердца в возрасте от 3 до 5 лет. Сколько детей должно быть включено в исследование? Исследователь планирует использовать 95% доверительный интервал (так Z = 1,96) и хочет погрешность в 5 единиц.Стандартное отклонение систолического артериального давления неизвестно, но исследователи провели поиск литературы и обнаружили, что стандартное отклонение систолического артериального давления у детей с другими пороками сердца составляет от 15 до 20. Чтобы оценить размер выборки, мы рассматриваем больший стандарт отклонение, чтобы получить наиболее консервативный (самый большой) размер выборки.

Чтобы гарантировать, что 95% -ный доверительный интервал оценки среднего систолического артериального давления у детей в возрасте от 3 до 5 лет с врожденным пороком сердца находится в пределах 5 единиц от истинного среднего значения, необходима выборка размером 62.[ Примечание : Мы всегда округляем в большую сторону; формулы размера выборки всегда генерируют минимальное количество субъектов, необходимое для обеспечения указанной точности.] Если бы мы приняли стандартное отклонение, равное 15, размер выборки был бы n = 35. Поскольку оценки стандартного отклонения были получены из исследований детей с другими пороками сердца, было бы целесообразно использовать большее стандартное отклонение и запланировать исследование с 62 детьми. Выбор меньшего размера выборки потенциально может дать оценку доверительного интервала с большей погрешностью.

Исследователь хочет оценить средний вес при рождении доношенных детей (примерно 40 недель беременности) от матерей в возрасте 19 лет и младше. Средний вес новорожденных, рожденных доношенными от матерей в возрасте 20 лет и старше, составляет 3 510 граммов со стандартным отклонением 385 граммов. Сколько женщин в возрасте 19 лет и младше должны быть включены в исследование, чтобы гарантировать, что оценка среднего веса при рождении их младенцев с доверительным интервалом 95% имеет предел погрешности, не превышающий 100 граммов? Прежде чем смотреть на ответ, попробуйте выполнить расчет.

Ответ


В исследованиях, в которых план состоит в оценке доли успехов по дихотомической переменной результата (да / нет) в одной популяции, формула для определения размера выборки:

, где Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), а E — желаемый предел погрешности. p — доля успехов в популяции.Здесь мы планируем исследование для получения 95% доверительного интервала для неизвестной доли населения, p . Уравнение для определения размера выборки для определения p, кажется, требует знания p, но, очевидно, это круговой аргумент, потому что, если бы мы знали долю успехов в популяции, то в исследовании не было бы необходимости! Что нам действительно нужно, так это приблизительное значение p или ожидаемое значение. Диапазон p составляет от 0 до 1, и, следовательно, диапазон p (1-p) составляет от 0 до 1.Значение p, которое максимизирует p (1-p), равно p = 0,5. Следовательно, если нет информации для приближения p, то p = 0,5 можно использовать для получения наиболее консервативного или наибольшего размера выборки.

Пример 2:

Исследователь хочет оценить долю первокурсников в его университете, которые в настоящее время курят сигареты (т. Е. Распространенность курения). Сколько первокурсников должно быть вовлечено в исследование, чтобы гарантировать, что оценка доли курящих первокурсников с доверительным интервалом 95% находится в пределах 5% от истинной доли?

Поскольку у нас нет информации о доле курящих первокурсников, мы используем 0.5 для оценки размера выборки следующим образом:

Чтобы гарантировать, что 95% доверительный интервал оценки доли курящих первокурсников находится в пределах 5% от истинной доли, необходима выборка размером 385.

Предположим, что подобное исследование было проведено 2 года назад и обнаружило, что распространенность курения среди первокурсников составляет 27%. Если исследователь считает, что это разумная оценка распространенности через 2 года, ее можно использовать для планирования следующего исследования.Используя эту оценку p, какой размер выборки необходим (при условии, что снова будет использоваться 95% доверительный интервал и нам нужен такой же уровень точности)?

Ответ

Пример 3:

Исследователь хочет оценить распространенность рака груди среди женщин в возрасте от 40 до 45 лет, проживающих в Бостоне. Сколько женщин должно быть вовлечено в исследование, чтобы оценка была точной? Национальные данные показывают, что к 40 годам у 1 из 235 женщин диагностируется рак груди.Это соответствует доле 0,0043 (0,43%) или 43 на 10 000 женщин. Предположим, исследователь хочет, чтобы оценка была в пределах 10 на 10 000 женщин с достоверностью 95%. Размер выборки рассчитывается следующим образом:

Выборка размером n = 16 448 гарантирует, что оценка распространенности рака груди с доверительным интервалом 95% находится в пределах 0,10 (или в пределах 10 женщин на 10 000) от его истинного значения. Это ситуация, когда исследователи могут решить, что выборка такого размера невозможна.Предположим, что исследователи думали, что выборка размером 5000 будет разумной с практической точки зрения. Насколько точно мы можем оценить распространенность на выборке размером n = 5000? Напомним, что формула доверительного интервала для оценки распространенности:

.

Предполагая, что распространенность рака груди в выборке будет близка к той, которая основана на национальных данных, мы ожидаем, что предел погрешности будет примерно равен следующему:

Таким образом, при n = 5000 женщин можно ожидать, что 95% доверительный интервал будет иметь погрешность, равную 0.0018 (или 18 на 10 000). Исследователи должны решить, будет ли это достаточно точным, чтобы ответить на исследовательский вопрос. Обратите внимание, что вышеизложенное основано на предположении, что распространенность рака груди в Бостоне аналогична общенациональной. Это может быть, а может и не быть разумным предположением. Фактически, цель настоящего исследования — оценить распространенность в Бостоне. Исследовательская группа при участии клинических исследователей и биостатистов должна тщательно оценить последствия выбора выборки размером n = 5000, n = 16 448 или любого промежуточного размера.


В исследованиях, в которых планируется оценить разницу средних значений между двумя независимыми популяциями, формула для определения размеров выборки, требуемой в каждой группе сравнения, приведена ниже:

, где n i — размер выборки, требуемый в каждой группе (i = 1,2), Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться, а E — желаемый предел погрешности. σ снова отражает стандартное отклонение переменной результата.Вспомните из модуля по доверительным интервалам, что, когда мы генерировали оценку доверительного интервала для разницы в средних, мы использовали Sp, объединенную оценку общего стандартного отклонения, как меру изменчивости в результате (на основе объединения данных). , где Sp вычисляется следующим образом:

Если доступны данные о вариабельности результата в каждой группе сравнения, то Sp можно вычислить и использовать в формуле размера выборки. Однако чаще всего данные о вариабельности исходов доступны только по одной группе, часто не получавшей лечения (например,g., плацебо-контроль) или группу, не подвергавшуюся воздействию. При планировании клинического испытания нового препарата или процедуры часто доступны данные других испытаний, в которых принимали участие плацебо или активная контрольная группа (т. Е. Стандартное лекарство или лечение, назначенное для исследуемого состояния). Стандартное отклонение переменной результата, измеренной у пациентов, отнесенных к группе плацебо, контрольной или неэкспонированной группе, можно использовать для планирования будущего исследования, как показано ниже.

Обратите внимание, что формула размера выборки генерирует оценки размера выборки для выборок равного размера.Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы.

Пример 4:

Исследователь хочет запланировать клиническое испытание для оценки эффективности нового препарата, предназначенного для повышения уровня холестерина ЛПВП («хорошего» холестерина). План состоит в том, чтобы зарегистрировать участников и случайным образом распределить их для приема нового препарата или плацебо. Холестерин ЛПВП будет измеряться у каждого участника через 12 недель назначенного лечения.Основываясь на предыдущем опыте проведения подобных исследований, исследователь ожидает, что 10% всех участников будут потеряны для последующего наблюдения или выбыли из исследования в течение 12 недель. Будет рассчитан 95% доверительный интервал для количественной оценки разницы в средних уровнях ЛПВП между пациентами, принимающими новый препарат, по сравнению с плацебо. Исследователь хотел бы, чтобы погрешность была не более 3 единиц. Сколько пациентов следует включить в исследование?

Размеры выборки рассчитываются следующим образом:

Основной проблемой является определение вариабельности интересующего результата (σ), в данном случае стандартного отклонения холестерина ЛПВП.Чтобы спланировать это исследование, мы можем использовать данные Фрамингемского исследования сердца. У участников, которые присутствовали на седьмом обследовании исследования потомства и не лечились от высокого холестерина, стандартное отклонение холестерина ЛПВП составляет 17,1. Мы будем использовать это значение и другие входные данные для вычисления размеров выборки следующим образом:

Образцы размера n 1 = 250 и n 2 = 250 гарантируют, что 95% доверительный интервал для разницы средних уровней ЛПВП будет иметь погрешность не более 3 единиц.Опять же, эти размеры выборки относятся к количеству участников с полными данными. Исследователи предположили, что показатель отсева (или отсева) составляет 10% (в обеих группах). Чтобы гарантировать, что общий размер выборки 500 доступен через 12 недель, исследователь должен набрать больше участников, чтобы учесть их выбывание.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 500/0.90 = 556

Если они ожидают 10% отсева, исследователи должны зарегистрировать 556 участников. Это обеспечит N = 500 с полными данными в конце испытания.

Пример 5:

Исследователь хочет сравнить две диеты для детей, страдающих ожирением. Одна диета — это диета с низким содержанием жиров, а другая — с низким содержанием углеводов. План состоит в том, чтобы набрать детей и взвесить их в начале исследования. Затем каждому ребенку будет случайным образом назначена диета с низким содержанием жиров или углеводов.Каждый ребенок будет соблюдать назначенную диету в течение 8 недель, после чего они снова будут взвешиваться. Количество потерянных фунтов будет подсчитано для каждого ребенка. Основываясь на данных, полученных в результате испытаний диеты у взрослых, исследователь ожидает, что 20% всех детей не завершат исследование. Для количественной оценки разницы в потерянном весе между двумя диетами будет рассчитан 95% доверительный интервал, и исследователь хотел бы, чтобы погрешность составляла не более 3 фунтов. Сколько детей следует включить в исследование?

Размеры выборки рассчитываются следующим образом:

Опять же, проблема заключается в определении изменчивости интересующего результата (σ), здесь стандартное отклонение в фунтах, потерянных за 8 недель.Чтобы спланировать это исследование, исследователи используют данные опубликованного исследования взрослых. Предположим, что в одном из таких исследований сравнивали одни и те же диеты у взрослых и участвовали по 100 участников в каждой диетической группе. В исследовании сообщалось о стандартном отклонении веса, потерянном за 8 недель на диете с низким содержанием жиров на 8,4 фунта, и о стандартном отклонении веса, потерянном за 8 недель на диете с низким содержанием углеводов, в размере 7,7 фунтов. Эти данные можно использовать для оценки общего стандартного отклонения потери веса следующим образом:

Теперь мы используем это значение и другие входные данные для вычисления размеров выборки:

Образцы размера n 1 = 56 и n 2 = 56 гарантируют, что 95% доверительный интервал для разницы в потерянном весе между диетами будет иметь погрешность не более 3 фунтов.Опять же, эти размеры выборки относятся к количеству детей с полными данными. Исследователи ожидают 20% отсева. Чтобы гарантировать, что общий размер выборки 112 будет доступен через 8 недель, исследователь должен набрать больше участников, чтобы учесть их выбытие.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 112 / 0,80 = 140


В исследованиях, в которых планируется оценить среднюю разницу непрерывного результата на основе сопоставленных данных, ниже приводится формула для определения размера выборки:

, где Z — значение стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например,g., Z = 1,96 для 95%), E — желаемый предел погрешности, а σ d — стандартное отклонение разницы оценок. Чрезвычайно важно, чтобы стандартное отклонение разницы баллов (например, разница, основанная на измерениях с течением времени или разница между согласованными парами) использовалось здесь для надлежащей оценки размера выборки.


В исследованиях, в которых планируется оценить разницу в пропорциях между двумя независимыми популяциями (т.д., для оценки разницы рисков) формула для определения размеров выборки, требуемой в каждой группе сравнения:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), Z — значение из стандартного нормального распределения, отражающее уровень достоверности, который будет использоваться (например, Z = 1,96 для 95%), и E — желаемая погрешность. p 1 и p 2 — это доли успехов в каждой группе сравнения. Опять же, здесь мы планируем исследование для получения 95% доверительного интервала для разницы в неизвестных пропорциях, а формула для оценки необходимых размеров выборки требует p 1 и p 2 .Чтобы оценить размер выборки, нам нужны приблизительные значения p 1 и p 2 . Значения p 1 и p 2 , которые максимизируют размер выборки, равны p 1 = p 2 = 0,5. Таким образом, если нет доступной информации для приближения p 1 и p 2 , то можно использовать 0,5 для получения наиболее консервативных или наибольших размеров выборки.

Подобно ситуации для двух независимых выборок и непрерывного результата в верхней части этой страницы, может быть случай, когда доступны данные о доле успешных результатов в одной группе, обычно необработанной (например.g., плацебо-контроль) или группу, не подвергавшуюся воздействию. В таком случае известная пропорция может использоваться как для p 1 , так и для p 2 в приведенной выше формуле. Приведенная выше формула генерирует оценки размера выборки для выборок равного размера. Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы. Заинтересованные читатели могут увидеть Флейсс для более подробной информации. 4

Пример 6:

Исследователь хочет оценить влияние курения во время беременности на преждевременные роды.Нормальная беременность длится примерно 40 недель, а преждевременные роды происходят до 37 недель. В отчете Национальной статистики естественного движения населения за 2005 год указывается, что примерно 12% младенцев рождаются преждевременно в Соединенных Штатах. 5 Исследователь планирует собрать данные посредством обзора медицинских карт и создать 95% доверительный интервал для разницы в долях детей, рожденных недоношенными женщинами, которые курили во время беременности, по сравнению с теми, кто этого не сделал. Сколько женщин должно быть включено в исследование, чтобы гарантировать, что 95% доверительный интервал для разницы в пропорциях имеет погрешность не более 4%?

Размеры выборки (т.е., количество женщин, которые курили и не курили во время беременности), можно вычислить по формуле, показанной выше. Национальные данные показывают, что 12% младенцев рождаются преждевременно. Мы будем использовать эту оценку для обеих групп при вычислении размера выборки.

Образцы размера n 1 = 508 женщин, которые курили во время беременности, и n 2 = 508 женщин, которые не курили во время беременности, гарантируют, что 95% доверительный интервал для разницы в пропорциях преждевременных родов будет иметь запас погрешность не более 4%.

Здесь проблема истощения?

Ответ


В модуле проверки гипотез для средних и пропорций мы представили методы для средних, пропорций, различий в средних и различий в пропорциях. Хотя каждый тест включал детали, которые были специфичными для интересующего результата (например, непрерывный или дихотомический) и для количества групп сравнения (одна, две, более двух), для каждого теста были общие элементы.Например, в каждой проверке гипотезы можно совершить две ошибки. Первая называется ошибкой типа I и относится к ситуации, когда мы неправильно отклоняем H 0 , хотя на самом деле это правда. На первом этапе любой проверки гипотезы мы выбираем уровень значимости, α, и α = P (ошибка типа I) = P (отклонить H 0 | H 0 верно). Поскольку мы намеренно выбираем небольшое значение для α, мы контролируем вероятность совершения ошибки типа I. Второй тип ошибок называется ошибкой типа II и определяется как вероятность того, что мы не отклоним H 0 , когда он ложный.Вероятность ошибки типа II обозначается β, а β = P (ошибка типа II) = P (Не отклонять H 0 | H 0 ложно). При проверке гипотез мы обычно сосредотачиваемся на мощности, которая определяется как вероятность того, что мы отклоним H 0 , когда оно ложно, то есть мощность = 1- β = P (Отклонить H 0 | H 0 ложно ). Мощность — это вероятность того, что тест правильно отклонит ложную нулевую гипотезу. Хороший тест — это тест с низкой вероятностью совершения ошибки типа I (т.е., малое α) и высокое увеличение (то есть малое β, высокое увеличение).

Здесь мы представляем формулы для определения размера выборки, необходимого для обеспечения высокой мощности теста. Вычисления размера выборки зависят от уровня значимости, aα, желаемой мощности теста (эквивалентно 1-β), изменчивости результата и величины эффекта. Величина эффекта — это разница в интересующем параметре, которая представляет собой клинически значимое различие. Подобно пределу погрешности в приложениях с доверительным интервалом, величина эффекта определяется на основе клинических или практических критериев, а не статистических критериев.

Понятие статистической мощности может быть трудным для понимания. Прежде чем представить формулы для определения размеров выборки, необходимых для обеспечения высокой мощности в тесте, мы сначала обсудим мощность с концептуальной точки зрения.

Предположим, мы хотим проверить следующие гипотезы при aα = 0,05: H 0 : μ = 90 по сравнению с H 1 : μ ≠ 90. Чтобы проверить гипотезы, предположим, что мы выбрали выборку размером n = 100. В этом примере предположим, что стандартное отклонение результата составляет σ = 20.Мы вычисляем выборочное среднее, а затем должны решить, предоставляет ли выборочное среднее доказательства в поддержку альтернативной гипотезы или нет. Это делается путем вычисления статистики теста и сравнения статистики теста с соответствующим критическим значением. Если нулевая гипотеза верна (μ = 90), то мы, вероятно, выберем образец, среднее значение которого близко к значению 90. Однако также можно выбрать образец, среднее значение которого намного больше или намного меньше 90. Вспомните из Центральной предельной теоремы (см. Стр. 11 в модуле Вероятность), что для больших n (здесь n = 100 достаточно велико) распределение выборочных средних приблизительно нормально со средним значением

.

и

Если нулевая гипотеза верна, можно наблюдать любое среднее значение выборки, показанное на рисунке ниже; все возможны при H 0 : μ = 90.

Когда мы устанавливаем решающее правило для нашей проверки гипотезы, мы определяем критические значения на основе α = 0,05 и двустороннего теста. Когда мы запускаем проверку гипотез, мы обычно стандартизируем данные (например, конвертируем в Z или t), а критические значения — это соответствующие значения из распределения вероятностей, используемого в тесте. Чтобы облегчить интерпретацию, мы продолжим это обсуждение вместо Z. Критические значения для двустороннего теста с α = 0,05 равны 86.06 и 93,92 (эти значения соответствуют -1,96 и 1,96 соответственно по шкале Z), поэтому правило принятия решения следующее: Отклонить H 0 , если < 86,06 или если > 93,92. Область отклонения показана в хвостах рисунка ниже.

Область отклонения для теста H 0 : μ = 90 по сравнению с H 1 : μ ≠ 90 при α = 0,05

.

Области в двух хвостах кривой представляют вероятность ошибки типа I, α = 0.05. Эта концепция обсуждалась в модуле по проверке гипотез.

Теперь предположим, что альтернативная гипотеза H 1 верна (т. Е. Μ ≠ 90) и что истинное среднее на самом деле равно 94. На рисунке ниже показаны распределения выборочного среднего при нулевой и альтернативной гипотезах. значения выборочного среднего показаны по горизонтальной оси.

Распределение ниже H 0 : μ = 90 и ниже H 1 : μ = 94

Если истинное среднее значение равно 94, то альтернативная гипотеза верна.В нашем тесте мы выбрали α = 0,05 и отклонили H 0 , если наблюдаемое среднее значение выборки превышает 93,92 (на данный момент фокусируясь на верхнем хвосте области отклонения). Критическое значение (93,92) указано вертикальной линией. Вероятность ошибки типа II обозначается β, а β = P (Do not Reject H 0 | H 0 ложно), то есть вероятность не отклонить нулевую гипотезу, если нулевая гипотеза верна. β показано на рисунке выше как область под крайней правой кривой (H 1 ) слева от вертикальной линии (где мы не отклоняем H 0 ).Мощность определяется как 1- β = P (отклонение H 0 | H 0 неверно) и показано на рисунке как область под крайней правой кривой (H 1 ) справа от вертикальной линии ( где мы отклоняем H 0 ).

Обратите внимание, что β и мощность связаны с α, изменчивостью результата и величиной эффекта. Из рисунка выше мы можем видеть, что произойдет с β и мощностью, если мы увеличим α. Предположим, например, что мы увеличиваем α до α = 0,10. Верхнее критическое значение будет 92.56 вместо 93.92. Вертикальная линия сместится влево, увеличивая α, уменьшая β и увеличивая мощность. Хотя лучший тест — это тест с более высокой мощностью, не рекомендуется увеличивать α как средство увеличения мощности. Тем не менее, существует прямая зависимость между α и мощностью (с увеличением α увеличивается и мощность).

β и мощность также связаны с изменчивостью результата и величиной эффекта. Величина эффекта — это разница в интересующем параметре (например, μ), которая представляет собой клинически значимое различие.На приведенном выше рисунке графически отображаются α, β и степень, когда разница в среднем под нулевым значением по сравнению с альтернативной гипотезой составляет 4 единицы (то есть 90 против 94). На рисунке ниже показаны те же компоненты для ситуации, когда среднее значение согласно альтернативной гипотезе равно 98.

Рисунок — Распределение ниже H 0 : μ = 90 и ниже H 1 : μ = 98.

Обратите внимание на то, что мощность намного выше, когда разница между средним значением H 0 больше по сравнению с H 1 (т.е.э., 90 против 98). Статистический тест с большей вероятностью отклонит нулевую гипотезу в пользу альтернативы, если истинное среднее значение равно 98, чем если истинное среднее значение равно 94. Также обратите внимание на то, что в этом случае существует небольшое перекрытие в распределениях при нулевой и альтернативной гипотезах. . Если наблюдается выборочное среднее значение 97 или выше, очень маловероятно, что оно получено из распределения, среднее значение которого равно 90. На предыдущем рисунке для H 0 : μ = 90 и H 1 : μ = 94, если мы Наблюдая, например, выборочное среднее значение 93, было бы не так ясно, было ли оно получено из распределения, среднее значение которого равно 90, или распределения, среднее значение которого равно 94.


При разработке исследований большинство людей рассматривают степень вероятности 80% или 90% (так же, как мы обычно используем 95% в качестве уровня достоверности для оценок доверительного интервала). Входные данные для формул размера выборки включают желаемую мощность, уровень значимости и размер эффекта. Величина эффекта выбрана так, чтобы представлять клинически значимой или практически важной разницы в интересующем параметре, как мы проиллюстрируем.

Формулы, которые мы представляем ниже, определяют минимальный размер выборки, чтобы гарантировать, что проверка гипотезы будет иметь заданную вероятность отклонения нулевой гипотезы, если она ложна (т.е., указанная мощность). Планируя исследования, исследователи снова должны учитывать выбывание или потерю для последующего наблюдения. Формулы, показанные ниже, определяют необходимое количество участников с полными данными, и мы проиллюстрируем, как отсев участников решается при планировании исследований.


В исследованиях, в которых планируется выполнить проверку гипотезы, сравнивая среднее значение переменной непрерывного результата в одной популяции с известным средним значением, интересными гипотезами являются:

H 0 : μ = μ 0 и H 1 : μ ≠ μ 0 где μ 0 — известное среднее значение (например,г., исторический контроль). Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него. Например, если α = 0,05, то 1- α / 2 = 0,975 и Z = 1,960. 1- β — это выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, при котором 1- β ниже. Оценка размера выборки для проверки гипотез часто основана на достижении 80% или 90% мощности.Значения Z 1-β для этих популярных сценариев приведены ниже:

  • Для 80% мощности Z 0,80 = 0,84
  • Для мощности 90% Z 0,90 = 1,282

ES — размер эффекта , определяемый следующим образом:

, где μ 0 — среднее значение для H 0 , μ 1 — среднее значение для H 1 , а σ — стандартное отклонение интересующего результата.Числитель величины эффекта, абсолютное значение разницы средних | μ 1 — μ 0 |, представляет собой то, что считается клинически значимым или практически важным различием в средствах. Подобно проблеме, с которой мы столкнулись при планировании исследований для оценки доверительных интервалов, иногда бывает трудно оценить стандартное отклонение. При вычислении размера выборки исследователи часто используют значение стандартного отклонения от предыдущего исследования или исследования, выполненного в другой, но сопоставимой совокупности.Независимо от того, как получается оценка изменчивости результата, она всегда должна быть консервативной (т.е. настолько большой, насколько это разумно), чтобы размер результирующей выборки не был слишком маленьким.

Пример 7:

Исследователь предполагает, что у людей, не страдающих диабетом, уровень глюкозы в крови натощак, фактор риска ишемической болезни сердца, выше у тех, кто пьет не менее 2 чашек кофе в день. Планируется перекрестное исследование для оценки среднего уровня глюкозы в крови натощак у людей, которые пьют не менее двух чашек кофе в день.Средний уровень глюкозы в крови натощак у людей, не страдающих диабетом, составляет 95,0 мг / дл со стандартным отклонением 9,8 мг / дл. 7 Если средний уровень глюкозы в крови у людей, выпивающих не менее 2 чашек кофе в день, составляет 100 мг / дл, это будет иметь клиническое значение. Сколько пациентов должно быть включено в исследование, чтобы убедиться, что мощность теста составляет 80% для выявления этой разницы? Будет использоваться двусторонний тест с уровнем значимости 5%.

Размер эффекта рассчитывается как:

.

Размер эффекта представляет собой значимую разницу в среднем генеральной совокупности — здесь 95 против 100 или 0,51 единицы стандартного отклонения. Теперь мы заменим размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Таким образом, выборка размером n = 31 будет гарантировать, что двусторонний тест с α = 0,05 будет иметь 80% мощность для обнаружения разницы в 5 мг / дл в средних уровнях глюкозы в крови натощак.

В запланированном исследовании участников попросят голодать в течение ночи и сдать образец крови для анализа уровня глюкозы.Основываясь на предыдущем опыте, исследователи предполагают, что 10% участников не будут голодать или откажутся соблюдать протокол исследования. Таким образом, в исследование будут включены в общей сложности 35 участников, чтобы обеспечить доступность 31 для анализа (см. Ниже).

N (число для включения) * (%, соблюдающие протокол) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 31 / 0,90 = 35.


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая долю успехов в переменной дихотомического результата в одной популяции с известной долей, представляют интерес гипотезы:

против

, где p 0 — известная пропорция (т.е.г., исторический контроль). Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него. 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, при котором 1- β ниже, а ES — величина эффекта, определяемая следующим образом:

, где p 0 — пропорция согласно H 0 , а p 1 — пропорция согласно H 1 .Числитель величины эффекта, абсолютное значение разницы в пропорциях | p 1 -p 0 |, снова представляет собой то, что считается клинически значимым или практически важным различием в пропорциях.

Пример 8:

Недавний отчет Фрамингемского исследования сердца показал, что 26% людей, не страдающих сердечно-сосудистыми заболеваниями, имели повышенный уровень холестерина ЛПНП, определяемый как ЛПНП> 159 мг / дл. 9 Исследователь предполагает, что более высокая доля пациентов с сердечно-сосудистыми заболеваниями в анамнезе будет иметь повышенный холестерин ЛПНП.Сколько пациентов следует обследовать, чтобы убедиться, что мощность теста составляет 90%, чтобы обнаружить разницу в 5% в пропорции с повышенным холестерином ЛПНП? Будет использоваться двусторонний тест с уровнем значимости 5%.

Сначала вычисляем размер эффекта:

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборка размером n = 869 обеспечит двусторонний тест с α = 0.05 имеет 90% -ную мощность для обнаружения 5% -ной разницы в доле пациентов с сердечно-сосудистыми заболеваниями в анамнезе, у которых повышен уровень холестерина ЛПНП.

Производитель медицинского оборудования производит имплантируемые стенты. В процессе производства приблизительно 10% стентов считаются дефектными. Производитель хочет проверить, не превышает ли доля дефектных стентов 10%. Если в результате процесса образуется более 15% дефектных стентов, необходимо предпринять корректирующие действия.Поэтому производитель хочет, чтобы тест имел мощность 90%, чтобы обнаруживать разницу в пропорциях такой величины. Сколько стентов необходимо оценить? Для расчетов используйте двусторонний тест с уровнем значимости 5%. (Проведите вычисления самостоятельно, прежде чем смотреть ответ.)

Ответ


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая средние значения непрерывной переменной результата в двух независимых популяциях, интересными гипотезами являются:

против

, где μ 1 и μ 2 — средние значения в двух сравниваемых популяциях.Формула для определения размеров выборки, чтобы гарантировать, что тест имеет заданную мощность:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, содержащего 1- α. / 2 ниже, а 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, удерживающего 1- β ниже него. ES — размер эффекта, определяемый как:

где | μ 1 — μ 2 | — абсолютное значение разницы средних значений между двумя группами, ожидаемая согласно альтернативной гипотезе, H 1 .σ — стандартное отклонение интересующего результата. Напомним из модуля по проверке гипотез, когда мы выполняли тесты гипотез, сравнивая средние значения двух независимых групп, мы использовали Sp, объединенную оценку общего стандартного отклонения, как меру изменчивости результата.

Sp рассчитывается следующим образом:

Если доступны данные о вариабельности результата в каждой группе сравнения, то Sp можно вычислить и использовать для генерации размеров выборки.Однако чаще всего данные о вариабельности исходов доступны только по одной группе, обычно необработанной (например, плацебо-контроль) или группе, не подвергавшейся воздействию. При планировании клинического испытания нового препарата или процедуры часто доступны данные из других испытаний, которые могли включать плацебо или активную контрольную группу (т. Е. Стандартное лекарство или лечение, назначенное для исследуемого состояния). Стандартное отклонение переменной результата, измеренное у пациентов, отнесенных к группе плацебо, контрольной или неэкспонированной группе, можно использовать для планирования будущего исследования, как показано.

Также обратите внимание, что приведенная выше формула генерирует оценки размера выборки для выборок равного размера. Если планируется исследование, в котором будет назначено разное количество пациентов или разное количество пациентов будет составлять группы сравнения, тогда можно использовать альтернативные формулы (более подробную информацию см. В Howell 3 ).

Пример 9:

Исследователь планирует клиническое испытание для оценки эффективности нового препарата, предназначенного для снижения систолического артериального давления.План состоит в том, чтобы зарегистрировать участников и случайным образом распределить их для приема нового препарата или плацебо. Систолическое артериальное давление будет измеряться у каждого участника через 12 недель назначенного лечения. Основываясь на предыдущем опыте проведения аналогичных испытаний, исследователь ожидает, что 10% всех участников будут потеряны для последующего наблюдения или выбыли из исследования. Если новый препарат показывает снижение среднего систолического артериального давления на 5 единиц, это будет представлять собой клинически значимое снижение. Сколько пациентов следует включить в исследование, чтобы убедиться, что мощность теста составляет 80% для выявления этой разницы? Будет использоваться двусторонний тест с уровнем значимости 5%.

Чтобы вычислить величину эффекта, необходима оценка вариабельности систолического артериального давления. Анализ данных Framingham Heart Study показал, что стандартное отклонение систолического артериального давления составило 19,0. Это значение можно использовать для планирования испытания.

Размер эффекта:

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Образцы размером n 1 = 232 и n 2 = 232 гарантируют, что проверка гипотезы будет иметь мощность 80% для обнаружения разницы в 5 единиц среднего систолического артериального давления у пациентов, принимающих новый препарат, по сравнению с пациентами. получение плацебо.Тем не менее, исследователи предположили, что показатель отсева составляет 10% (в обеих группах), и чтобы обеспечить общий размер выборки 232, они должны учитывать отсев.

N (число для включения) * (% оставшихся) = желаемый размер выборки

Следовательно, N (число для включения) = желаемый размер выборки / (оставшийся%)

N = 232 / 0,90 = 258.

Исследователь должен набрать 258 участников, которые будут случайным образом распределены для приема нового препарата или плацебо.

Исследователь планирует исследование для оценки связи между потреблением алкоголя и средним баллом среди выпускников колледжа.План состоит в том, чтобы классифицировать студентов как сильно пьющих или не употребляющих 5 или более напитков в обычный день выпивки в качестве критерия алкоголя. Средние средние баллы будут сравниваться между учащимися, отнесенными к категории сильно пьющих, по сравнению с не использующими две независимые выборки проверки средних значений. Предполагается, что стандартное отклонение средних баллов составляет 0,42, а значимая разница в средних баллах (относительно статуса потребления алкоголя) составляет 0,25 единицы. Сколько выпускников колледжа должны быть включены в исследование, чтобы убедиться, что мощность теста составляет 80% для определения 0.25 единиц разницы в среднем среднем балле? Используйте двусторонний тест с уровнем значимости 5%.

Ответ


В исследованиях, в которых планируется выполнить проверку гипотезы о средней разнице в непрерывной переменной результата на основе сопоставленных данных, представляют интерес гипотезы:

против

, где μ d — средняя разница в генеральной совокупности. Формула для определения размера выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, удерживающего 1- α / 2 ниже него, 1- β — выбранная степень, а Z 1-β — значение стандартного нормального распределения, удерживающее 1- β ниже него, а ES — величина эффекта, определяемая следующим образом:

, где μ d — средняя разность, ожидаемая согласно альтернативной гипотезе, H 1 , а σ d — стандартное отклонение разницы в результате (например,g., разница, основанная на измерениях с течением времени или разница между согласованными парами).

Пример 10:

Исследователь хочет оценить эффективность лечения иглоукалыванием для уменьшения боли у пациентов с хронической мигренью. Планируется набор пациентов, страдающих мигренью. Каждого перед тем, как назначить какое-либо лечение, попросят оценить серьезность боли, которую он испытывает при следующей мигрени.Боль будет регистрироваться по шкале от 1 до 100, причем более высокие баллы указывают на более сильную боль. Затем каждый пациент будет проходить курс лечения иглоукалыванием. При следующей мигрени (после лечения) каждого пациента снова попросят оценить тяжесть боли. Разница в боли будет рассчитана для каждого пациента. Будет проведена двусторонняя проверка гипотезы при α = 0,05, чтобы оценить, существует ли статистически значимая разница в оценке боли до и после лечения. Сколько пациентов должно быть вовлечено в исследование, чтобы убедиться, что тест имеет мощность 80% для определения разницы в 10 единиц по шкале боли? Предположим, что стандартное отклонение разницы оценок составляет примерно 20 единиц.

Сначала вычислите размер эффекта:

Затем подставьте размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборка размером n = 32 пациента с мигренью гарантирует, что двухсторонний тест с α = 0,05 имеет 80% мощности для определения средней разницы в 10 баллов боли до и после лечения, при условии, что все 32 пациента завершили лечение. .


В исследованиях, в которых планируется провести проверку гипотезы, сравнивая пропорции успехов в двух независимых популяциях, представляют интерес гипотезы:

H 0 : p 1 = p 2 в сравнении с H 1 : p 1 ≠ p 2

, где p 1 и p 2 — пропорции в двух сравниваемых совокупностях.Формула для определения размеров выборки, чтобы гарантировать, что тест имеет заданную мощность, приведена ниже:

, где n i — размер выборки, необходимый в каждой группе (i = 1,2), α — выбранный уровень значимости, а Z 1-α / 2 — значение из стандартного нормального распределения, содержащего 1- α. / 2 под ним, и 1- β — выбранная мощность, а Z 1-β — значение из стандартного нормального распределения, удерживающего 1- β под ним. ES — величина эффекта, определяемая следующим образом:

,

, где | p 1 — p 2 | — абсолютное значение разницы в пропорциях между двумя группами, ожидаемых согласно альтернативной гипотезе, H 1 , а p — общая пропорция, основанная на объединении данных из двух групп сравнения (p можно вычислить, взяв среднее значение пропорций в двух группах сравнения, предполагая, что группы будут примерно одинакового размера).

Пример 11:

Исследователь выдвинул гипотезу о более высокой заболеваемости гриппом среди студентов, регулярно пользующихся спортивными сооружениями, чем среди их сверстников, которые этого не делают. Исследование будет проведено весной. Каждого ученика спросят, пользовались ли они спортивным сооружением регулярно в течение последних 6 месяцев и не болели ли они гриппом. Будет проведена проверка гипотезы для сравнения доли студентов, которые регулярно использовали спортивные сооружения и заболели гриппом, с долей студентов, которые этого не сделали и заболели гриппом.В течение обычного года примерно 35% студентов болеют гриппом. Исследователи считают, что увеличение заболеваемости гриппом на 30% среди тех, кто регулярно пользовался спортивным сооружением, было бы клинически значимым. Сколько студентов должно быть привлечено к исследованию, чтобы убедиться, что мощность теста составляет 80%, чтобы обнаружить эту разницу в пропорциях? Будет использоваться двусторонний тест с уровнем значимости 5%.

Сначала мы вычисляем размер эффекта, подставляя доли учащихся в каждой группе, у которых ожидается развитие гриппа, p 1 = 0.46 (т.е. 0,35 * 1,30 = 0,46) и p 2 = 0,35, а общая пропорция, p = 0,41 (т.е. (0,46 + 0,35) / 2):

Теперь мы подставляем размер эффекта и соответствующие значения Z для выбранного α и мощности, чтобы вычислить размер выборки.

Выборки размера n 1 = 324 и n 2 = 324 гарантируют, что проверка гипотезы будет иметь 80% -ную мощность для выявления 30% -ной разницы в пропорции учащихся, заболевших гриппом, между теми, кто болеет, и не болеет. регулярно пользоваться спортивными сооружениями.

Донорские фекалии? Действительно? Clostridium difficile (также называемая «C. difficile» или «C. diff.») Представляет собой бактериальный вид, который можно найти в толстой кишке человека, хотя его численность контролируется другой нормальной флорой толстой кишки. Антибиотикотерапия иногда снижает нормальную флору в толстой кишке до такой степени, что процветает C. difficile и вызывается инфекция с симптомами, варьирующимися от диареи до опасного для жизни воспаления толстой кишки. Болезнь от C.difficile чаще всего поражает пожилых людей в больницах или учреждениях длительного ухода и обычно возникает после приема антибиотиков. В последние годы инфекции, вызванные C. difficile, стали более частыми, тяжелыми и трудно поддающимися лечению. По иронии судьбы, C. difficile сначала лечится путем прекращения приема антибиотиков, если они все еще назначаются. Если это не помогло, инфекцию вылечили путем перехода на другой антибиотик. Однако лечение другим антибиотиком часто не излечивает C.difficile. Были спорадические сообщения об успешном лечении путем вливания фекалий здоровых доноров в двенадцатиперстную кишку пациентов, страдающих C. difficile. (Юк!) Это восстанавливает нормальную микробиоту в толстой кишке и противодействует чрезмерному росту C. diff. Эффективность этого подхода была проверена в рандомизированном клиническом исследовании, опубликованном в Медицинском журнале Новой Англии (январь 2013 г.). Исследователи планировали случайным образом распределить пациентов с рецидивирующей инфекцией C. difficile либо на антибактериальную терапию, либо на дуоденальную инфузию донорских фекалий.Чтобы оценить размер необходимой пробы, исследователи предположили, что инфузия кала будет успешной в 90% случаев, а терапия антибиотиками будет успешной в 60% случаев. Сколько субъектов потребуется в каждой группе, чтобы гарантировать, что мощность исследования составляет 80% с уровнем значимости α = 0,05?

Ответ


Определение подходящего дизайна исследования более важно, чем статистический анализ; плохо спланированное исследование никогда нельзя спасти, тогда как плохо проанализированное исследование можно повторно проанализировать.Важнейшим компонентом дизайна исследования является определение подходящего размера выборки. Размер выборки должен быть достаточно большим, чтобы адекватно ответить на вопрос исследования, но не слишком большим, чтобы охватить слишком много пациентов, когда было бы достаточно меньшего. Определение подходящего размера выборки включает статистические критерии, а также клинические или практические соображения. Определение размера выборки требует совместной работы; Биостатисты должны работать в тесном сотрудничестве с клиническими исследователями, чтобы определить размер выборки, которая позволит решить интересующий вопрос исследования с достаточной точностью или мощностью для получения клинически значимых результатов.

В следующей таблице приведены формулы размера выборки для каждого описанного здесь сценария. Формулы организованы по предлагаемому анализу, оценке доверительного интервала или проверке гипотез.

Ситуация

Размер выборки до

Оценка доверительного интервала

Размер выборки для проверки гипотезы

Непрерывный результат,

Один образец:

CI для μ, H 0 : μ = μ 0

Непрерывный результат,

Два независимых образца:

CI для (μ 1 2 ), H 0 : μ 1 = μ 2

Непрерывный результат,

Два совпадающих образца:

CI для μ d , H 0 : μ d = 0

Дихотомический результат,

Один образец:

CI для p, H 0 : p = p 0

Дихотомический результат,

Два независимых образца:

CI для (p 1 -p 2 ), H 0 : p 1 = p 2


  1. Бушман Н.А., Фостер Дж., Викерс П.Девочки-подростки и их дети: достижение оптимальной массы тела при рождении. Гестационная прибавка в весе и исход беременности с точки зрения гестации при родах и веса новорожденного: сравнение между подростками до 16 лет и взрослыми женщинами. Ребенок: уход, здоровье и развитие. 2001; 27 (2): 163-171.
  2. Feuer EJ, Wun LM. ДЕВКАН: Вероятность развития или смерти от рака. Версия 4.0 .Bethesda, MD: Национальный институт рака, 1999.
  3. Хауэлл, округ Колумбия. Статистические методы психологии.Бостон, Массачусетс: Duxbury Press, 1982.
  4. Fleiss JL. Статистические методы расчета ставок и пропорций. Нью-Йорк, штат Нью-Йорк: John Wiley and Sons, Inc., 1981.
  5. Национальный центр статистики здравоохранения. Здоровье, США, 2005 г., с диаграммой тенденций в области здоровья американцев. Хяттсвилл, Мэриленд: Типография правительства США; 2005.
  6. Пласкон, Лос-Анджелес, Пенсон Д.Ф., Воган, Т.Л., Стэнфорд, Дж. Курение сигарет и риск рака простаты у мужчин среднего возраста. Биомаркеры и профилактика эпидемиологии рака.2003; 12: 604-609.
  7. Rutter MK, Meigs JB, Sullivan LM, D’Agostino RB, Wilson PW. C-реактивный белок, метаболический синдром и прогноз сердечно-сосудистых событий в исследовании Framingham Offspring Study. Тираж. 2004; 110: 380-385.
  8. Рамачандран В., Салливан Л.М., Уилсон П.В., Семпос, Т.Т., Сандстрем Дж., Каннел В.Б., Леви Д., Д’Агостино, РБ. Относительное значение пограничных и повышенных уровней факторов риска ишемической болезни сердца. Анналы внутренней медицины. 2005; 142: 393-402.
  9. Векслер Х., Ли Дж. Э., Куо М., Ли Х. Выпивка в колледже в 1990-е годы: постоянная проблема Результаты Гарвардской школы общественного здравоохранения, 1999, Здоровье колледжей, 2000; 48: 199-210.

Ответ на вопрос о весе при рождении — стр. 3

Исследователь хочет оценить средний вес при рождении доношенных детей (примерно 40 недель беременности) от матерей в возрасте 19 лет и младше. Средний вес новорожденных, рожденных доношенными от матерей в возрасте 20 лет и старше, составляет 3 510 граммов со стандартным отклонением 385 граммов.Сколько женщин в возрасте 19 лет и младше должны быть включены в исследование, чтобы гарантировать, что оценка среднего веса при рождении их младенцев с доверительным интервалом 95% имеет предел погрешности, не превышающий 100 граммов?

Чтобы гарантировать, что оценка среднего веса при рождении с доверительным интервалом 95% находится в пределах 100 граммов от истинного среднего, необходима выборка размером 57. При планировании исследования исследователь должен учитывать тот факт, что у некоторых женщин могут возникать преждевременные роды.Если женщины будут включены в исследование во время беременности, то необходимо будет включить более 57 женщин, чтобы после исключения преждевременных родов 57 женщин с информацией о результатах были доступны для анализа. Например, если ожидается, что 5% женщин родят преждевременно (т. Е. 95% родят доношенными), то необходимо включить 60 женщин, чтобы у 57 роды были доношенными. Количество женщин, которые должны быть зачислены, N, рассчитывается следующим образом:

N (число для включения) * (% оставшихся) = желаемый размер выборки

N (0.95) = 57

N = 57 / 0,95 = 60,

Ответ Курение первокурсников — Страница 4

Предположим, что подобное исследование было проведено 2 года назад и обнаружило, что распространенность курения среди первокурсников составляет 27%. Если исследователь считает, что это разумная оценка распространенности через 2 года, ее можно использовать для планирования следующего исследования. Используя эту оценку p, какой размер выборки необходим (при условии, что снова будет использоваться 95% доверительный интервал и нам нужен такой же уровень точности)?

Чтобы гарантировать, что оценка 95% доверительного интервала доли курящих первокурсников находится в пределах 5% от истинной доли, необходима выборка размером 303.Обратите внимание, что этот размер выборки существенно меньше, чем рассчитанный выше. Наличие некоторой информации о величине доли в генеральной совокупности всегда дает размер выборки, который меньше или равен тому, который основан на доле генеральной совокупности 0,5. Однако оценка должна быть реалистичной.

Ответ на проблему с медицинским устройством — страница 7

Производитель медицинского оборудования производит имплантируемые стенты. В процессе производства приблизительно 10% стентов считаются дефектными.Производитель хочет проверить, не превышает ли доля дефектных стентов 10%. Если в результате процесса образуется более 15% дефектных стентов, необходимо предпринять корректирующие действия. Поэтому производитель хочет, чтобы тест имел мощность 90%, чтобы обнаруживать разницу в пропорциях такой величины. Сколько стентов необходимо оценить? Для расчетов используйте двусторонний тест с уровнем значимости 5%.

Затем подставьте размер эффекта и соответствующие значения z для выбранных альфа и мощности, чтобы вычислить размер выборки.

Размер выборки из 364 стентов гарантирует, что двусторонний тест с α = 0,05 будет иметь мощность 90% для обнаружения 0,05 или 5% разницы в пропорции произведенных дефектных стентов.

Ответ на алкоголь и средний балл — страница 8

Исследователь планирует исследование для оценки связи между потреблением алкоголя и средним баллом среди выпускников колледжа. План состоит в том, чтобы классифицировать студентов как сильно пьющих или не употребляющих 5 или более напитков в обычный день выпивки в качестве критерия алкоголя.Средние средние баллы будут сравниваться между учащимися, отнесенными к категории сильно пьющих, по сравнению с не использующими две независимые выборки проверки средних значений. Предполагается, что стандартное отклонение средних баллов составляет 0,42, а значимая разница в средних баллах (относительно статуса потребления алкоголя) составляет 0,25 единицы. Сколько выпускников колледжа должны быть включены в исследование, чтобы убедиться, что мощность теста составляет 80%, чтобы обнаружить разницу в 0,25 единицы в средних средних баллах? Используйте двусторонний тест с уровнем значимости 5%.

Сначала вычислите размер эффекта.

Теперь замените размер эффекта и соответствующие значения z на альфа и мощность, чтобы вычислить размер выборки.

Размер выборки n и = 44 сильно пьющих и 44, выпивающих менее пяти напитков в обычный день, гарантирует, что проверка гипотезы будет иметь 80% -ную мощность для обнаружения разницы в 0,25 единицы в средних средних баллах.

Ответ на донорские фекалии — страница 8

Сначала мы вычисляем величину эффекта, подставляя доли пациентов, которые, как ожидается, будут излечены при каждом лечении, p 1 = 0.6 и p 2 = 0,9, а общая пропорция p = 0,75:

Теперь мы заменяем размер эффекта и соответствующие значения Z на выбранные a и мощность, чтобы вычислить размер выборки.

Образцы размера n 1 = 33 и n 2 = 33 гарантируют, что проверка гипотезы будет иметь 80% -ную мощность для обнаружения этой разницы в пропорциях пациентов, излечившихся от C. diff. инфузией кала по сравнению с терапией антибиотиками.

Фактически, исследователи включили по 38 в каждую группу, чтобы учесть отсев. Тем не менее, после промежуточного анализа исследование было остановлено. Из 16 пациентов в группе инфузии у 13 (81%) отмечалось исчезновение диареи, связанной с C. difficile, после первой инфузии. Остальным 3 пациентам была проведена вторая инфузия с фекалиями от другого донора с разрешением у 2 пациентов. Излечение C. difficile произошло только у 4 из 13 пациентов (31%), получавших антибиотик ванкомицин.

Как определить размер выборки, определение размера выборки

Чтобы доказать, что процесс был улучшен, вы должны измерить возможности процесса до и после внедрения улучшений. Это позволяет количественно оценить улучшение процесса (например, сокращение дефектов или повышение производительности) и преобразовать эффекты в предполагаемый финансовый результат — то, что руководители бизнеса могут понять и оценить.Если данные для этого процесса недоступны, сколько членов населения следует выбрать, чтобы гарантировать, что население представлено должным образом? Если данные были собраны, как определить, достаточно ли у вас данных?

Определение размера выборки — очень важный вопрос, потому что слишком большие выборки могут тратить время, ресурсы и деньги, а слишком маленькие выборки могут привести к неточным результатам. Во многих случаях мы можем легко определить минимальный размер выборки, необходимый для оценки параметра процесса, такого как среднее значение генеральной совокупности.

Когда собираются выборочные данные и вычисляется выборочное среднее, это выборочное среднее обычно отличается от среднего по генеральной совокупности. Это различие между средними значениями выборки и генеральной совокупности можно рассматривать как ошибку. Предел погрешности — это максимальная разница между наблюдаемым средним по выборке и истинным значением среднего по генеральной совокупности:

куда:

известно как критическое значение, положительное значение, которое находится на вертикальной границе для области в правом хвосте стандартного нормального распределения.

— стандартное отклонение генеральной совокупности.

— это размер выборки.

Переставив эту формулу, мы можем определить размер выборки, необходимый для получения результатов с точностью до заданной достоверности и погрешности. Эту формулу можно использовать, когда вы знаете и хотите определить размер выборки, необходимый для установления среднего значения с точностью до среднего. Вы все равно можете использовать эту формулу, если вы не знаете стандартное отклонение своей генеральной совокупности и у вас небольшой размер выборки.Хотя маловероятно, что вы знаете, когда неизвестно среднее значение для генеральной совокупности, вы можете определить это с помощью аналогичного процесса или пилотного теста / моделирования.

Давайте применим всю эту статистическую чушь. Возьмем, к примеру, что мы хотели бы открыть поставщика услуг Интернета (ISP) и нам необходимо оценить среднее использование Интернета домашними хозяйствами в течение одной недели для нашего бизнес-плана и модели.

Пример расчета размера выборки

Проблема
Мы хотели бы начать работу с интернет-провайдером и нам необходимо оценить среднее использование Интернета домашними хозяйствами в течение одной недели для нашего бизнес-плана и модели.Сколько домохозяйств мы должны выбрать случайным образом, чтобы на 95 процентов быть уверенными в том, что среднее значение выборки находится в пределах 1 минуты от среднего значения генеральной совокупности. Предположим, что предыдущее обследование использования домашних хозяйств показало = 6,95 минут.

Решение
Мы рассчитываем размер выборки.

Доверие 95% соответствует = 0,05. Каждый из заштрихованных хвостов на следующем рисунке имеет площадь = 0,025. Область слева и справа от = 0 составляет 0,5 — 0,025 или 0,475.В таблице стандартного нормального () распределения площадь 0,475 соответствует значению 1,96. Следовательно, критическое значение = 1,96.

Предел погрешности = 1 и стандартное отклонение = 6,95. Используя формулу для размера выборки, мы можем рассчитать: Таким образом, нам нужно будет отобрать не менее 186 (округленных) случайно выбранных домохозяйств. С этой выборкой мы будем на 95 процентов уверены, что среднее значение выборки будет в пределах 1 минуты от истинной совокупности использования Интернета. Эту формулу можно использовать, когда вы знаете и хотите определить размер выборки, необходимый для установления среднего значения с точностью до среднего.Вы все равно можете использовать эту формулу, если вы не знаете стандартное отклонение своей генеральной совокупности и у вас небольшой размер выборки. Хотя маловероятно, что вы знаете, когда не известно среднее значение генеральной совокупности, вы можете определить это с помощью аналогичного процесса или пилотного теста / моделирования.

Вам также может понравиться

c ++ — Как определить размер параметров команды MSADO

Я новичок в MS ADO и пытаюсь понять, как установить размер в параметрах команды, созданных

  команда.CreateParameter (имя, тип, направление, размер, значение)
  

В документации указано следующее:

Размер
Дополнительно. Длинное значение, которое определяет максимальную длину для значение параметра в символах или байтов.

Если вы укажете данные переменной длины введите аргумент Тип, вы должны либо передайте аргумент размера, либо установите Свойство Size объекта Parameter перед добавлением в Параметры коллекция; в противном случае ошибка имеет место.

1.) Что нужно передать для параметров фиксированного размера? Это «пофиг»?

Меня немного смутил приведенный здесь пример, в котором они установили размер равным 3 для параметра adInteger с параметром Value, установленным в вариант типа VT_I2

  pPrmByRoyalty-> Type = adInteger;
pPrmByRoyalty-> Размер = 3;
pPrmByRoyalty-> Direction = adParamInput;
pPrmByRoyalty-> Value = vtroyal;
  

VT_I2 подразумевает два байта. Структура tagVARIANT составляет 16 байтов.Как они попали на троих? Я вижу, что значение перечисления для adInteger оказывается равным трем, но я подозреваю, что это просто совпадение.

Так что немного непонятно, что передавать для параметров фиксированного размера. Команда, с которой я работаю, всегда передавала sizeof (int) для adInteger, и, похоже, это работает. Это верно?

Теперь для параметров «переменной длины»: документация предписывает нам передавать «максимальную длину .. в символах или байтах».

2.) Достаточно ли для adVarChar передать максимальную ширину, определенную в базе данных?

3.) А как насчет широких типов (например, adVarWChar)? Это символы или байты?

4.) Как насчет adVariant, который может содержать данные фиксированной или переменной длины?

5.) Здесь когда-нибудь в игру вступают массивы? (мы не передаем их в качестве параметров, просто любопытно)

Приветствуются любые ссылки или личные идеи.

% PDF-1.6 % 309 0 obj> эндобдж xref 309 680 0000000016 00000 н. 0000014766 00000 п. 0000014961 00000 п. 0000015089 00000 п. 0000015155 00000 п. 0000015312 00000 п. 0000015425 00000 п. 0000015515 00000 п. 0000015579 00000 п. 0000015711 00000 п. 0000015756 00000 п. 0000016195 00000 п. 0000016742 00000 п. 0000017373 00000 п. 0000017450 00000 п. 0000018111 00000 п. 0000018797 00000 п. 0000018872 00000 п. 0000019380 00000 п. 0000020008 00000 п. 0000020530 00000 п. 0000022481 00000 п. 0000022670 00000 п. 0000022825 00000 п. 0000023219 00000 п. 0000023647 00000 п. 0000024068 00000 п. 0000024437 00000 п. 0000024721 00000 п. 0000024986 00000 п. 0000025391 00000 п. 0000025778 00000 п. 0000025974 00000 п. 0000026136 00000 п. 0000030077 00000 п. 0000037491 00000 п. 0000041129 00000 п. 0000048399 00000 н. 0000048675 00000 н. 0000052188 00000 п. 0000053770 00000 п. 0000059194 00000 п. 0000059742 00000 п. 0000060323 00000 п. 0000064075 00000 п. 0000064133 00000 п. 0000064201 00000 п. 0000064263 00000 п. 0000064350 00000 п. 0000064583 00000 п. 0000064652 00000 п. 0000064719 00000 п. 0000064870 00000 п. 0000064939 00000 п. 0000065006 00000 п. 0000065220 00000 п. 0000065289 00000 п. 0000065356 00000 п. 0000065568 00000 п. 0000065668 00000 п. 0000065767 00000 п. 0000065929 00000 п. 0000065998 00000 н. 0000066065 00000 п. 0000066260 00000 п. 0000066329 00000 п. 0000066396 00000 п. 0000066617 00000 п. 0000066686 00000 п. 0000066753 00000 п. 0000066935 00000 п. 0000067004 00000 п. 0000067071 00000 п. 0000067250 00000 п. 0000067319 00000 п. 0000067386 00000 п. 0000067558 00000 п. 0000067627 00000 н. 0000067694 00000 п. 0000067867 00000 п. 0000067936 00000 п. 0000068003 00000 п. 0000068160 00000 п. 0000068229 00000 п. 0000068296 00000 п. 0000068480 00000 п. 0000068549 00000 п. 0000068616 00000 п. 0000068794 00000 п. 0000068863 00000 п. 0000068930 00000 п. 0000069116 00000 п. 0000069185 00000 п. 0000069252 00000 п. 0000069414 00000 п. 0000069483 00000 п. 0000069550 00000 п. 0000069741 00000 п. 0000069810 00000 п. 0000069877 00000 п. 0000070079 00000 п. 0000070148 00000 п. 0000070215 00000 п. 0000070429 00000 п. 0000070498 00000 п. 0000070565 00000 п. 0000070741 00000 п. 0000070810 00000 п. 0000070877 00000 п. 0000071035 00000 п. 0000071104 00000 п. 0000071171 00000 п. 0000071330 00000 п. 0000071399 00000 н. 0000071466 00000 п. 0000071702 00000 п. 0000071771 00000 п. 0000071838 00000 п. 0000072012 00000 н. 0000072113 00000 п. 0000072180 00000 п. 0000072350 00000 п. 0000072433 00000 п. 0000072500 00000 н. 0000072662 00000 п. 0000072731 00000 н. 0000072798 00000 н. 0000072875 00000 п. 0000072957 00000 п. 0000073035 00000 п. 0000073116 00000 п. 0000073211 00000 п. 0000073295 00000 п. 0000073388 00000 п. 0000073503 00000 п. 0000073576 00000 п. 0000073647 00000 п. 0000073730 00000 п. 0000073852 00000 п. 0000073941 00000 п. 0000074029 00000 п. 0000074181 00000 п. 0000074252 00000 п. 0000074358 00000 п. 0000074457 00000 п. 0000074565 00000 п. 0000074677 00000 п. 0000074781 00000 п. 0000074898 00000 п. 0000075013 00000 п. 0000075130 00000 п. 0000075255 00000 п. 0000075368 00000 п. 0000075476 00000 п. 0000075561 00000 п. 0000075641 00000 п. 0000075766 00000 п. 0000075848 00000 п. 0000075933 00000 п. 0000076061 00000 п. 0000076131 00000 п. 0000076253 00000 п. 0000076410 00000 п. 0000076515 00000 п. 0000076634 00000 п. 0000076715 00000 п. 0000076805 00000 п. 0000076925 00000 п. 0000077021 00000 п. 0000077129 00000 п. 0000077258 00000 п. 0000077331 00000 п. 0000077405 00000 п. 0000077497 00000 п. 0000077580 00000 п. 0000077681 00000 п. 0000077761 00000 п. 0000077860 00000 п. 0000077952 00000 п. 0000078064 00000 п. 0000078161 00000 п. 0000078251 00000 п. 0000078346 00000 п. 0000078431 00000 п. 0000078516 00000 п. 0000078632 00000 п. 0000078755 00000 п. 0000078864 00000 п. 0000078967 00000 п. 0000079093 00000 п. 0000079214 00000 п. 0000079295 00000 п. 0000079417 00000 п. 0000079586 00000 п. 0000079667 00000 п. 0000079786 00000 п. 0000079891 00000 п. 0000079972 00000 н. 0000080084 00000 п. 0000080169 00000 п. 0000080264 00000 п. 0000080409 00000 п. 0000080500 00000 п. 0000080590 00000 п. 0000080684 00000 п. 0000080793 00000 п. 0000080881 00000 п. 0000080966 00000 п. 0000081166 00000 п. 0000081289 00000 п. 0000081390 00000 н. 0000081559 00000 п. 0000081660 00000 п. 0000081776 00000 п. 0000081941 00000 п. 0000082011 00000 п. 0000082084 00000 п. 0000082238 00000 п. 0000082352 00000 п. 0000082464 00000 н. 0000082543 00000 п. 0000082662 00000 п. 0000082788 00000 н. 0000082893 00000 п. 0000082963 00000 п. 0000083058 00000 п. 0000083180 00000 п. 0000083295 00000 п. 0000083367 00000 п. 0000083478 00000 п. 0000083569 00000 п. 0000083663 00000 п. 0000083768 00000 п. 0000083895 00000 п. 0000083990 00000 п. 0000084101 00000 п. 0000084190 00000 п. 0000084287 00000 п. 0000084372 00000 п. 0000084465 00000 п. 0000084612 00000 п. 0000084682 00000 п. 0000084802 00000 п. 0000084928 00000 п. 0000084998 00000 п. 0000085100 00000 н. 0000085212 00000 п. 0000085321 00000 п. 0000085414 00000 п. 0000085495 00000 п. 0000085578 00000 п. 0000085672 00000 п. 0000085765 00000 п. 0000085873 00000 п. 0000085970 00000 п. 0000086071 00000 п. 0000086186 00000 п. 0000086260 00000 п. 0000086367 00000 п. 0000086449 00000 н. 0000086570 00000 п. 0000086688 00000 п. 0000086773 00000 п. 0000086865 00000 п. 0000086986 00000 п. 0000087072 00000 п. 0000087192 00000 п. 0000087272 00000 н. 0000087394 00000 п. 0000087508 00000 п. 0000087623 00000 п. 0000087746 00000 п. 0000087816 00000 п. 0000087911 00000 п. 0000088037 00000 п. 0000088107 00000 п. 0000088185 00000 п. 0000088267 00000 п. 0000088374 00000 п. 0000088526 00000 п. 0000088610 00000 п. 0000088688 00000 п. 0000088780 00000 п. 0000088856 00000 п. 0000088984 00000 п. 0000089059 00000 н. 0000089135 00000 п. 0000089226 00000 п. 0000089320 00000 п. 0000089411 00000 п. 0000089508 00000 п. 0000089589 00000 п. 0000089701 00000 п. 0000089795 00000 п. 0000089892 00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 н. 00000

00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 н. 00000 00000 п. 00000

00000 п. 00000

00000 п. 00000

00000 н. 00000 00000 п. 00000

00000 п. 00000

00000 п. 0000091670 00000 п. 0000091823 00000 п. 0000091925 00000 п. 0000092066 00000 п. 0000092155 00000 п. 0000092308 00000 п. 0000092470 00000 п. 0000092550 00000 п. 0000092652 00000 п. 0000092796 00000 н. 0000092926 00000 п. 0000093039 00000 п. 0000093150 00000 п. 0000093209 00000 п. 0000093354 00000 п. 0000093413 00000 п. 0000093472 00000 п. 0000093601 00000 п. 0000093748 00000 п. 0000093880 00000 п. 0000093951 00000 п. 0000094023 00000 п. 0000094082 00000 п. 0000094230 00000 п. 0000094289 00000 п. 0000094348 00000 п. 0000094418 00000 п. 0000094488 00000 п. 0000094576 00000 п. 0000094659 00000 п. 0000094789 00000 п. 0000094862 00000 н. 0000094978 00000 п. 0000095102 00000 п. 0000095172 00000 п. 0000095239 00000 п. 0000095359 00000 п. 0000095477 00000 п. 0000095591 00000 п. 0000095682 00000 п. 0000095754 00000 п. 0000095862 00000 п. 0000095990 00000 п. 0000096062 00000 п. 0000096131 00000 п. 0000096262 00000 п. 0000096334 00000 п. 0000096403 00000 п. 0000096488 00000 н. 0000096570 00000 п. 0000096655 00000 п. 0000096727 00000 н. 0000096796 00000 п. 0000096881 00000 п. 0000096964 00000 п. 0000097054 00000 п. 0000097138 00000 п. 0000097286 00000 п. 0000097364 00000 п. 0000097470 00000 п. 0000097577 00000 п. 0000097669 00000 н. 0000097754 00000 п. 0000097835 00000 п. 0000097928 00000 п. 0000098054 00000 п. 0000098140 00000 п. 0000098231 00000 п. 0000098374 00000 п. 0000098484 00000 п. 0000098580 00000 п. 0000098676 00000 п. 0000098802 00000 п. 0000098882 00000 п. 0000098964 00000 п. 0000099090 00000 н. 0000099163 00000 п. 0000099246 00000 п. 0000099354 00000 н. 0000099462 00000 н. 0000099547 00000 н. 0000099625 00000 п. 0000099708 00000 п. 0000099800 00000 н. 0000099931 00000 н. 0000100000 00000 п 0000100102 00000 п 0000100241 00000 н. 0000100311 00000 н. 0000100378 00000 н. 0000100446 00000 н. 0000100535 00000 н. 0000100618 00000 н. 0000100748 00000 н. 0000100818 00000 н. 0000100886 00000 н. 0000101024 00000 н. 0000101094 00000 н. 0000101162 00000 н. 0000101292 00000 н. 0000101362 00000 н. 0000101430 00000 н. 0000101528 00000 н. 0000101611 00000 н. 0000101694 00000 н. 0000101777 00000 н. 0000101865 00000 н. 0000101945 00000 н. 0000102122 00000 п. 0000102213 00000 н. 0000102348 00000 п. 0000102438 00000 п. 0000102612 00000 н. 0000102682 00000 н. 0000102775 00000 н. 0000102877 00000 н. 0000102982 00000 н. 0000103082 00000 н. 0000103196 00000 п. 0000103314 00000 н. 0000103397 00000 н. 0000103490 00000 н. 0000103596 00000 н. 0000103702 00000 н. 0000103787 00000 п. 0000103887 00000 п. 0000104007 00000 н. 0000104140 00000 н. 0000104210 00000 п. 0000104278 00000 н. 0000104413 00000 н. 0000104483 00000 п. 0000104586 00000 п. 0000104685 00000 н. 0000104814 00000 н. 0000104884 00000 н. 0000104987 00000 п. 0000105078 00000 н. 0000105178 00000 п. 0000105261 00000 п. 0000105366 00000 п. 0000105472 00000 п. 0000105584 00000 н. 0000105667 00000 н. 0000105779 00000 н. 0000105862 00000 н. 0000105947 00000 н. 0000106036 00000 н. 0000106226 00000 п. 0000106304 00000 п. 0000106421 00000 н. 0000106610 00000 н. 0000106736 00000 н. 0000106859 00000 н. 0000106944 00000 н. 0000107050 00000 п. 0000107186 00000 п. 0000107271 00000 н. 0000107377 00000 н. 0000107470 00000 п. 0000107564 00000 н. 0000107645 00000 н. 0000107741 00000 п. 0000107856 00000 п. 0000107963 00000 п. 0000108074 00000 н. 0000108173 00000 п. 0000108311 00000 п. 0000108442 00000 н. 0000108527 00000 н. 0000108645 00000 н. 0000108730 00000 н. 0000108836 00000 н. 0000108935 00000 п. 0000109016 00000 н. 0000109115 00000 н. 0000109227 00000 п. 0000109363 00000 п. 0000109515 00000 н. 0000109622 00000 н. 0000109714 00000 н. 0000109805 00000 п. 0000109893 00000 п. 0000110074 00000 н. 0000110206 00000 н. 0000110338 00000 п. 0000110423 00000 п. 0000110523 00000 п. 0000110658 00000 н. 0000110737 00000 н. 0000110817 00000 н. 0000110906 00000 н. 0000111029 00000 н. 0000111130 00000 н. 0000111252 00000 н. 0000111351 00000 н. 0000111448 00000 н. 0000111541 00000 н. 0000111630 00000 н. 0000111715 00000 н. 0000111803 00000 н. 0000111886 00000 н. 0000111972 00000 н. 0000112088 00000 н. 0000112193 00000 н. 0000112297 00000 н. 0000112430 00000 н. 0000112501 00000 н. 0000112585 00000 н. 0000112699 00000 н. 0000112800 00000 н. 0000112907 00000 н. 0000113011 00000 н. 0000113090 00000 н. 0000113172 00000 н. 0000113286 00000 н. 0000113363 00000 н. 0000113445 00000 н. 0000113559 00000 н. 0000113694 00000 н. 0000113826 00000 н. 0000113955 00000 н. 0000114035 00000 н. 0000114118 00000 н. 0000114234 00000 н. 0000114384 00000 п. 0000114521 00000 н. 0000114627 00000 н. 0000114709 00000 н. 0000114874 00000 н. 0000114946 00000 н. 0000115015 00000 н. 0000115153 00000 н. 0000115225 00000 н. 0000115294 00000 н. 0000115379 00000 н. 0000115464 00000 н. 0000115568 00000 н. 0000115648 00000 н. 0000115720 00000 н. 0000115789 00000 н. 0000115874 00000 н. 0000115963 00000 н. 0000116081 00000 н. 0000116191 00000 п. 0000116267 00000 н. 0000116388 00000 н. 0000116457 00000 н. 0000116524 00000 н. 0000116646 00000 н. 0000116715 00000 н. 0000116783 00000 н. 0000116934 00000 н. 0000117004 00000 н. 0000117071 00000 н. 0000117202 00000 н. 0000117272 00000 н. 0000117374 00000 н. 0000117497 00000 н. 0000117602 00000 н. 0000117704 00000 н. 0000117779 00000 п. 0000117854 00000 н. 0000117925 00000 н. 0000117998 00000 н. 0000118077 00000 н. 0000118176 00000 н. 0000118260 00000 н. 0000118348 00000 п. 0000118455 00000 н. 0000118538 00000 п. 0000118676 00000 н. 0000118746 00000 н. 0000118848 00000 н. 0000118995 00000 н. 0000119065 00000 н. 0000119167 00000 н. 0000119276 00000 н. 0000119379 00000 н. 0000119462 00000 н. 0000119545 00000 н. 0000119621 00000 н. 0000119704 00000 н. 0000119795 00000 н. 0000119912 00000 н. 0000120025 00000 н. 0000120214 00000 н. 0000120395 00000 н. 0000120526 00000 н. 0000120726 00000 н. 0000120941 00000 н. 0000121124 00000 н. 0000121247 00000 н. 0000121356 00000 н. 0000121480 00000 н. 0000121589 00000 н. 0000121704 00000 н. 0000121815 00000 н. 0000121939 00000 н. 0000122072 00000 н. 0000122196 00000 н. 0000122277 00000 н. 0000122360 00000 н. 0000122494 00000 н. 0000122564 00000 н. 0000122631 00000 н. 0000122821 00000 н. 0000122941 00000 н. 0000123067 00000 н. 0000123248 00000 н. 0000123372 00000 н. 0000123511 00000 н. 0000123700 00000 н. 0000123805 00000 н. 0000123877 00000 н. 0000123946 00000 н. 0000124031 00000 н. 0000124103 00000 н. 0000124180 00000 н. 0000124252 00000 н. 0000124356 00000 н. 0000124501 00000 н. 0000124573 00000 н. 0000124642 ​​00000 н. 0000124727 00000 н. 0000124810 00000 н. 0000124893 00000 н. 0000124978 00000 н. 0000125050 00000 н. 0000125127 00000 н. 0000125210 00000 н. 0000125291 00000 н. 0000125416 00000 н. 0000125496 00000 н. 0000125581 00000 п. 0000125715 00000 н. 0000125785 00000 н. 0000125896 00000 н. 0000126039 00000 н. 0000126109 00000 н. 0000126220 00000 н. 0000126358 00000 п. 0000126428 00000 н. 0000126495 00000 н. 0000126599 00000 н. 0000126702 00000 н. 0000126827 00000 н. 0000126955 00000 н. 0000127064 00000 н. 0000127160 00000 н. 0000127245 00000 н. 0000127325 00000 н. 0000127443 00000 н. 0000127560 00000 н. 0000127650 00000 н. 0000127776 00000 н. 0000127881 00000 н. 0000128031 00000 н. 0000128185 00000 н. 0000128261 00000 н. 0000128333 00000 н. 0000128491 00000 н. 0000128642 00000 н. 0000128748 00000 н. 0000128870 00000 н. 0000128999 00000 н. 0000129119 00000 н. 0000013896 00000 п. трейлер ] >> startxref 0 %% EOF 988 0 obj> поток xb«e`0f`g`ff @

Расчет размера выборки для оценки ключевых эпидемиологических параметров с использованием серологических данных и математического моделирования | BMC Medical Research Methodology

Data

Серологический обзорный тест на наличие, среди прочего, кори, эпидемического паротита, краснухи, вируса ветряной оспы (VZV) и парвовируса B19 Иммуноглобулина G (IgG) антител был проведен на крупных репрезентативных национальных антителах. банки сыворотки в Бельгии [10].В период с 2001 по 2003 год образцы сыворотки были взяты из образцов остаточной крови, используемых для рутинных лабораторных исследований (у лиц в возрасте <18 лет), или у доноров крови (18 лет и старше). Это исследование было разработано в соответствии с предложением Европейской сероэпидемиологической сети (ESEN), целью которого является стандартизация серологического надзора за иммунитетом к различным заболеваниям в европейских странах [11]. В частности, в опросе участвовали дети и подростки. Всего было отобрано 3378 образцов, возраст которых варьировал от 0 до 65 лет.Количество образцов с иммунологическим статусом в отношении кори, эпидемического паротита, краснухи, VZV и парвовируса B19 составило 3190, 3004, 3195, 3256 и 3080 соответственно. Поскольку в 1985 г. в Бельгии была введена национальная программа иммунизации против кори, эпидемического паротита и краснухи с постепенным увеличением охвата вакцинацией целевых возрастных групп (младенцы, подростки в возрасте 11–13 лет и кампании наверстывания взрослых), эндемическое равновесие для этих инфекций в 2002 году нельзя предполагать.Напротив, программа иммунизации против VZV и парвовируса B19 не вводилась, что делает эндемическое равновесие разумным предположением для обеих инфекций.

Models

Здесь мы кратко представляем обзор методов, используемых для получения ключевых эпидемиологических параметров из данных серологического обследования, и ссылаемся на Hens et al. [2] для более глубокого объяснения методологии. Мы начинаем с базовой концепции возрастной распространенности и постепенно переходим к силе инфекции и другим параметрам, таким как базовые и эффективные показатели воспроизводства в эндемическом равновесии.

Повозрастную серораспространенность можно смоделировать в рамках обобщенных линейных моделей (GLM). Например, вероятность заразиться в (до) определенного возраста можно смоделировать с помощью логистической модели, выражающей зависимость от возраста с помощью конкретной функциональной формы (см., Например, Hens et al. [12]). Для оценки (зависящей от возраста) силы инфекции по данным серологической распространенности в литературе использовались различные статистические методы, включая линейные и нелинейные параметрические (например.g., дробные полиномы или каталитическая модель) и непараметрические подходы. Кроме того, поток людей между взаимоисключающими стадиями инфекционного заболевания можно описать с помощью компартментных динамических моделей передачи. Самая простая такая модель, модель «восприимчивый-инфекционно-восстановленный» (SIR), описывает поток между восприимчивым ( S ), инфицированным и инфекционным ( I ) и вылеченным классом ( R ). Следующий набор дифференциальных уравнений в частных производных для непрерывного возраста и времени может использоваться для математического описания динамики SIR:

$$ \ left \ {\ begin {array} {c} \ frac {\ partial S \ left (a, t \ right)} {\ partial a} + \ frac {\ partial S \ left (a, t \ right)} {\ partial t} = — \ lambda \ left (a, \ mathrm {t} \ right) S \ left (a, t \ right) — \ mu \ left (a, t \ right) S \ left (a, t \ right), \\ {} \ frac {\ partial I \ left (a, t \ right) } {\ partial a} + \ frac {\ partial I \ left (a, t \ right)} {\ partial t} = \ lambda \ left (a, t \ right) S \ left (a, t \ right) — \ sigma \ left (a, t \ right) I \ left (a, t \ right) — \ mu \ left (a, t \ right) I \ left (a, t \ right), \\ {} \ frac {\ partial R \ left (a, t \ right)} {\ partial a} + \ frac {\ partial R \ left (a, t \ right)} {\ partial t} = \ sigma \ left (a, t \ right) I \ left (a, t \ right) — \ mu \ left (a, t \ right) R \ left (a, t \ right), \ end {array} \ right.$$

с возрастной и временной численностью населения, заданной как N ( a , t ) = S ( a , t ) + I ( a , т ) + R ( a , т ) и с λ ( a , t ) силой заражения, σ ( a , t ) восстановлением μ ( a , t ) — коэффициент смертности от всех причин.

Предполагая замкнутую популяцию размером N в демографическом и эндемическом равновесии, мы получаем набор обыкновенных дифференциальных уравнений (ОДУ):

$$ \ left \ {\ begin {array} {c} \ frac {dS ( a)} {da} = — \ lambda (a) S (a) — \ mu (a) S (a), \\ {} \ frac {dI (a)} {da} = \ lambda (a) S (a) — \ sigma (a) I (a) — \ mu (a) I (a), \\ {} \ frac {dR (a)} {da} = \ sigma (a) I (a) — \ mu (a) R (a). \ end {array} \ right. $$

Решая вышеуказанный набор ODE, получается следующее выражение для серопространственности людей в возрасте a :

$$ \ pi (a) = 1- \ mathit {\ exp} \ left (- { \ int} _0 ^ a \ lambda (u) du \ right). {j-1} {\ lambda} _k \ left ({a} _ {\ left [k + 1 \ right]} — {a} _ {\ left [k \ right]} \ right) — { \ lambda} _j \ left (a- {a} _ {\ left [j \ right]} \ right) \ right), $$

(1)

, где a [1] = 0 и a [ J + 1] = L (продолжительность жизни).

Эта модель предполагает, что смертностью, связанной с инфекциями, можно пренебречь, что приемлемо для инфекций, изучаемых в настоящей статье, и что общая численность населения постоянна во времени (т. Е. Количество рождений и смертей сбалансировано) с постоянное возрастное распределение.

На основе этой модели могут быть рассчитаны другие ключевые эпидемиологические параметры, такие как базовое и эффективное число репродукций ( рэнд и рэнд эфф соответственно; рэнд отражает фактическое среднее количество вторичных случаев, которые могут наблюдаться в население с частично иммунным иммунитетом) или средний возраст инфицирования.

Поскольку серопозитивные результаты для кори, эпидемического паротита и краснухи представляют собой сочетание иммунитета, вызванного вакциной и инфекцией, подразумевая временную неоднородность, которая выходит за рамки данной статьи, моделировалась только возрастная серологическая распространенность этих болезней. Мы рассмотрели логистическую модель с кусочно-постоянными значениями распространенности в следующих возрастных группах, основанную (частично) на политике вакцинации: [1,2), [2,11), [11,16), [16,21), [21, 31) и [31,65] лет. Оценки коэффициентов с использованием этой модели (в логит-шкале) обозначаются \ (\ widehat {\ beta} \).

Для инфекций VZV и парвовируса B19, для которых в Бельгии устойчиво эндемическое равновесие, были рассмотрены три математические модели для оценки силы инфекции, использованные в предыдущих исследованиях [2, 14, 15, 16].

Первая модель — это модель материнского иммунитета-восприимчивого-инфицированного-восстановленного (MSIR) с кусочно-постоянной силой заражения. Компартментная модель MSIR добавляет к базовой модели SIR этап, описывающий новорожденных и младенцев, защищенных материнским иммунитетом (класс M ) [17].Эта модель предполагает, что новорожденные и младенцы защищены материнскими антителами и что этот иммунитет быстро теряется в заданном возрасте A . Затем предполагается, что новорожденные и младенцы восприимчивы к инфекции (класс S ), они могут заразиться и заразиться (класс I ) до выздоровления от инфекции (класс R ). Распространенность серотипов в возрасте и в возрастном интервале , , , приблизительно равна, что является небольшой адаптацией модели (Ур.{j-1} {\ lambda} _k \ left ({a} _ {\ left [k + 1 \ right]} — {a} _ {\ left [k \ right]} \ right) — {\ lambda} _j \ left (a- {a} _ {\ left [j \ right]} \ right) \ right), $$

с a [1] = A , где A — это возраст потери материнского иммунитета. В этой статье мы рассмотрели модель MSIR с кусочно-постоянной силой заражения в следующих шести возрастных классах: [1,2), [2,6), [6,12), [12,19), [19,31 ) и [31,65] лет. Эти возрастные группы составляют бельгийскую школьную систему, тот факт, что инфекция в основном происходит среди молодых возрастных групп, и для которых ожидаются одинаковые силы инфицирования между возрастами в данной возрастной группе.Обратите внимание, что, как правило, выбор этих возрастных категорий часто осуществляется от случая к случаю.

Вторая модель, рассматриваемая в этой статье, — это модель с экспоненциальным затуханием силы заражения, описанная Фаррингтоном [14]. Эта модель основана на типичной форме возрастной силы инфицирования детских инфекционных заболеваний: низкая при рождении из-за наличия материнских антител, затем линейно возрастающая с возрастом и, наконец, снижающаяся с определенного возраста в результате экспоненциального уменьшения. .{- {\ alpha} _2a} -1 \ right] — {\ alpha} _3a \ right \}. $$

Мы рассмотрели третью модель инфекции парвовирусом B19, математическую модель, позволяющую повышать и ослаблять иммунитет, поскольку пожизненная защита от инфекции после выздоровления от парвовируса B19 сомнительна [18,19,20,21,22], что может ограничить использование двух предыдущих моделей. Goeyvaerts et al. [16] исследовали несколько расширений модели MSIR, чтобы определить, следует ли учитывать уменьшение количества приобретенных болезнью антител и / или усиление низкого иммунитета в результате воздействия инфекционных индивидуумов.Здесь мы использовали модель с наилучшим значением информационного критерия Акаике (AIC), которая представляла собой компартментарную модель, учитывающую возрастное уменьшение количества приобретенных болезнью антител и повышение низкого иммунитета, обозначенную «MSIRWb-ext AW» (см. Дополнительный файл 1). Более конкретно, уменьшение было смоделировано с использованием дополнительного состояния ( W ) со скоростью, зависящей от возраста: люди переходили из состояния с высоким иммунитетом R в состояние с низким иммунитетом W со скоростью ε 1 и ε 2 для возрастной группы <35 и ≥ 35 лет соответственно.Предполагалось, что скорость усиления пропорциональна силе заражения в φ раз. Предполагалось, что частота передачи прямо пропорциональна возрастной частоте установления социальных контактов с коэффициентом пропорциональности q .

Образцы от детей в возрасте до 1 года (6 месяцев в модели MSIRWb-ext AW для согласования с исходной статьей) не были включены в наш анализ из-за искажений, ожидаемых из-за наличия материнских антител против различных патогенов и низкого количества выборок этого возраста ( n = 13).

Первые два столбца таблицы 1 показывают сводку моделей, использованных для каждого из изученных патогенов. Формулы для расчета различных эпидемиологических параметров (например, стандартизованная по возрасту распространенность серотипа и сила инфекции, 0 R, Rфф и средний возраст инфицирования) можно найти в дополнительном файле 1. Повозрастная распространенность серотипа и сила заражения рассчитывалась в следующих возрастных группах: [1,2), [2,6), [6,12), [12,19), [19,31) и [31,65] лет для каждой. возбудитель (включая корь, эпидемический паротит и краснуху для облегчения чтения).

Таблица 1 Сводка моделей, рассмотренных для каждого из патогенов, и соответствующие оценки параметров модели с использованием данных наблюдаемого серологического обследования

Оценка параметров модели

Оценки максимального правдоподобия были получены для каждой модели и патогена, предполагая, что наблюдаемая распространенность следует биномиальное распределение. Используя оценочные значения параметров для каждой модели и патогена (со значениями возраста, округленными до целых значений), были рассчитаны возрастные «истинные» значения распространенности, которые использовались при моделировании (см. Следующий раздел).

Моделирование

Было проведено сравнение трех возрастных структур: возрастная структура, полученная на основе данных серологического обследования по конкретным патогенам, в котором дети и подростки были взяты из избыточной выборки (на основе опроса), возрастная структура населения Бельгии в 2003 году (популяция- на основе) [23], а также единообразную возрастную структуру (см. дополнительный файл 1: рисунок S1 и таблицу S1).

Для сравнения возрастных структур выборки и определения оптимального распределения выборок по возрастным группам было создано 500 (новых) наборов данных с использованием биномиального распределения и возрастных «истинных» значений распространенности, полученных для каждой модели.Мы использовали несколько значений общего размера выборки ( N = 1650, 3300, 6600, 9900, 13 200 или 19 800), а количество выборок по возрасту зависело от структуры выборки на основе возраста или используемого распределения распределения. Затем каждый набор данных был подогнан к соответствующей модели для получения распределения значений параметров и точности. Здесь оптимальное распределение было определено путем расчета точности, полученной с использованием различных распределений. Чтобы ограничить количество сравниваемых распределений, мы изменили пропорции среди шести возрастных групп ([1,2), [2,6), [6,12), [12,19), [19,31) и [31,65] лет) от 10 до 50% (что приводит к 126 распределениям) и при условии равномерного распределения внутри каждой возрастной группы.На рисунке 1 схематически представлен подход, использованный в этой статье. Точность была определена как половина длины доверительного интервала (ДИ) на основе 95% -ного процентиля, рассчитанного по 500 моделированиям. Для серологической распространенности и силы инфекции по возрастным группам указывается возрастное распределение, обеспечивающее наилучшую совместную точность, которое определяется как сумма точности в каждой возрастной группе.

Рис. 1

Схематическое изображение подхода, использованного в этой статье

В модели MSIR с кусочно-постоянной силой инфицирования для инфекции VZV, моделирования с биологически неправдоподобными оценочными значениями (> 10) были исключены; такие значения были получены в возрастной группе> 30 лет из-за моделируемой распространенности 100% в этой возрастной группе.Эти симуляции были заменены.

Все анализы были выполнены с использованием программного обеспечения R (версия 3.3.1) [24].

Расчет параметров отрицательного биномиального распределения с учетом средних интервалов и интервалов высокой плотности

Вы можете как бы это сделать, но дискретность отрицательного бинома добавляет дополнительную сложность, если мы не знаем, какой точный квантиль был вычислен, поскольку мы не можем получить точный квантиль, который мы просим. В случае выборочных квантилей нам потребуется точное определение того, что это за выборочный квантиль.

Давайте начнем с предположения, что точное распределение и, следовательно, квантили были известны (а не оценены) тем, кто их вычислил первым.

С бета-версией, если я прошу 97,5 процентилей и 2,5 процентилей распределения (например, в R с использованием qbeta ), тогда этот интервал фактически содержит 95% вероятности.

В случае дискретных распределений это не так. Часто, но не всегда, люди цитируют консервативные интервалы, содержащие как минимум $ (1- \ alpha) $ (как минимум 95% для 95% интервала), но даже тогда остается вопрос о том, являются ли границы индивидуальными. консервативные или только консервативные вместе.Обычно делается первое, но не всегда.

Так, например, рассмотрим $ n = 26, p = \ frac {26} {76} \ приблизительно 0,3421053 $. Это означает 50.

Квантиль 0,025 задается R как 29:

.
 > qnbinom (0,025,26,26 / 76)
[1] 29
  

Квантиль 0,975 определяется R как 76:

.
 > qnbinom (0,975,26,26 / 76)
[1] 76
  

Итак, если у нас есть отрицательная биномиальная случайная величина $ X $, которая имеет $ n = 26 $ и $ p = 26/76 $, она должна иметь $ P (X \ leq 29) = 0.025 $ верно? Ну нет:

 > пнбином (29,26,26 / 76)
[1] 0,03072454

> пнбином (76,26,26 / 76)
[1] 0,9772272
  

Интервал [29,76] (обратите внимание, что теперь мы включаем 29, поэтому это не будет 0,9772-0,0307) содержит не 95%, а немного больше:

 > пнбином (76,26,26 / 76) -пнбином (28,26,26 / 76)
[1] 0,9534341
  

Теперь интервал [29,75] содержит 94,97%; многие люди с радостью процитируют это как интервал 95%.

Итак, если кто-то скажет вам, что «31» — это 2.5 процентиль, вы не можете просто принять это число за чистую монету — у него нет 2,5% распределения на уровне или ниже. Может быть больше 2,5% … а иногда и намного больше. Или может быть немного меньше, если они не консервативны.

Другая основная проблема заключается в том, что указанный интервал может быть не фактическим интервалом совокупности, а интервалом выборки, и в этом случае (если те же самые не были очень большими) нам нужно полагаться на конкретное определение используемого квантиля выборки (например, R предлагает девять определений ), а также о поведении выборки этих квантилей, а также о поведении выборки среднего в отрицательных биномиальных выборках.

Для случаев, когда среднее значение относительно велико, а стандартное отклонение относительно мало, вы можете получить его примерно с помощью обычного приближения. Если интервал симметричен относительно среднего значения, это хороший признак того, что это может работать достаточно хорошо. Точнее, есть несколько гамма-приближений к отрицательному биномиальному cdf, которые можно использовать для опровержения оценок.

Это дает начальное значение, но будет диапазон значений (n, p), которые необходимо будет учесть, а затем обратимся к самому отрицательному биному.

Итак, рассмотрим данный пример и предположим, что это количества населения, а не количества выборки: нам говорят, что $ \ mu = 50 $ и что точки 2,5% и 97,5% равны 31 и 69; оба на 19 единиц от 50. Если бы это было нормальное распределение, это означает, что стандартное отклонение 1,96 равно 19 (или 19,5, если мы использовали поправку на непрерывность). Это довольно грубо, и коррекция непрерывности может не помочь в этом случае, поэтому я оставлю это в стороне.

Это дает $ \ sigma \ приблизительно 9.2 \ приблизительно 0,532 $ должно быть приближением для $ p $, а $ n $ тогда должно быть приблизительно $ \ mu / (1 / p-1) = 56,8 $

Эти значения не совсем правильные — если мы вычислим квантили, используя отрицательный биномиальный cdf, мы получим 32 и 70 вместо 31 и 69, но мы находимся в правильной области.

Если мы предположим, что $ \ mu = 50 $ известно, а не оценено, и попробуем различные значения для $ p $, мы увидим, что на самом деле мы не можем достичь этих квантилей одновременно:

Глядя на это, 56.Комбинация 8,0,532 — неплохой компромисс. Конечно, если вместо этого $ \ mu = 50 $ на самом деле неизвестно, но является оценкой, тогда другое значение $ \ mu $ приблизит вас к этим точкам, но при выборке квантили обычно будут больше неопределенность, чем среднее значение.

Чтобы сказать намного больше, потребовались бы более подробные детали в вопросе о том, с чем именно мы имеем дело.

Добавить комментарий