Вероятность - Случайные числа
Учитывая, что в лотерее существует 10 миллионов потенциальных комбинаций, какова вероятность выигрыша с 90%-ной уверенностью при условии продажи 10 миллионов билетов? Очевидно, что она не составит 100%, поскольку некоторые билеты могут быть дубликатами. Меня меньше интересует ответ, чем методология, использованная для решения этой задачи.
Давайте попробуем переформулировать вопрос. Предположим, что в лотерее 10 миллионов комбинаций, и все игроки выбирают свои номера случайным образом (с учетом возможных дубликатов). Сколько билетов нужно продать, чтобы вероятность выигрыша хотя бы одного человека составляла 90%? Пусть p — вероятность выигрыша, а n — количество проданных билетов. Вероятность проигрыша одного человека равна 1-p. Вероятность проигрыша всех n человек равна (1-p) n . Вероятность выигрыша хотя бы одного человека равна 1 - (1-p) n . Поэтому нам нужно приравнять это значение к 0,9 и решить уравнение относительно n.
.9 = 1 - (1-p) n
.1 = (1-p) n
ln(.1) = ln((1-p) n )
ln(.1) = n*ln(1-p)
n = ln(.1)/ln(1-p)
n = ln(.1)/ln(.9999999)
n = 23 025 850.
Таким образом, для того чтобы вероятность выигрыша хотя бы одного победителя составила 90%, лотерее необходимо продать 23 025 850 билетов. Если вам интересно, то если лотерея продаст ровно десять миллионов билетов, вероятность выигрыша хотя бы одного победителя составит 63,2%, что очень точно аппроксимируется как 1-(1/e).
Это мой второй вопрос к вам, на этот раз на тему государственных лотерей. Уверен, вы слышали о группе «инвесторов», которые ждали, пока джекпот достигнет определенного уровня, после чего покупали билеты со всеми возможными комбинациями чисел. Это гарантировало им долю в выигрыше. Предположим, стоимость билета составляет 1 доллар. Насколько высоким должен стать джекпот, чтобы это стало прибыльным делом?
Одним из факторов, влияющих на ответ, является общее количество билетов, проданных другим игрокам. В случае, если джекпот достается более чем одному игроку, его придется разделить. Обозначим количество возможных комбинаций n, общее количество проданных билетов t, норму доходности по мелким призам r (в случае Большой игры r = 0,179612), а j — размер джекпота. Для того чтобы это предприятие было безубыточным, получаем j*n/(n+t) + r*n - n = 0. Это означает, что j = (1 - r)*(n+t).
Я не согласен с вашим утверждением относительно генерации случайных чисел в компьютерах. Хотя последовательность действительно появляется и повторяется со временем, это не означает, что этого нельзя избежать. Хитрость заключается в правильной установке начального значения (seed). Если вы используете архитектуру на основе UNIX, один из методов — установить начальное значение равным количеству секунд, прошедших с 1 января 1970 года, — это постоянно обновляемая переменная внутри системы. Поскольку вы используете Visual C++ и J++, они должны сбрасываться до какого-то случайного начального значения каждый раз при запуске, но было бы разумно устанавливать начальное значение самостоятельно во время выполнения программы. Я думаю, было бы разумно устанавливать начальное значение каждый раз, когда «раздаётся» новая колода, на текущее время на машине или что-то подобное. Таким образом, да, вы будете использовать один и тот же цикл чисел, но, по крайней мере, вы будете выбирать умеренно «случайные» точки на этом пути, чтобы не создавать замкнутый цикл.
При использовании Visual C++ начальное значение генератора случайных чисел, очевидно, всегда одинаково. Если я подам программе один и тот же входной сигнал, то и результат после случайной симуляции всегда будет одинаковым. Насколько я понимаю, именно этого и добивалась Microsoft, чтобы эксперименты можно было точно воспроизвести. В Visual J++ ситуация, очевидно, отличается, судя по моим играм, иначе одни и те же раздачи происходили бы в одном и том же порядке каждый раз.
P.S .: С момента написания этой статьи у меня появился более медленный, но гораздо лучший способ генерации случайных чисел. Нажмите здесь для получения дополнительной информации.
Кажется, я где-то читал, что если в комнате находится группа из двадцати человек, то вероятность того, что у двоих из них будет один и тот же день рождения, составляет менее 50/50. Это правда?
Вероятность того, что у 20 разных людей будут разные дни рождения (без учета високосного дня), составляет (364/365)*(363/365)*(362/365)*...*(346/365) = 58,8562%. Таким образом, вероятность совпадения хотя бы одного дня рождения составляет 41,1438%. Кроме того, 23 — это наименьшее количество людей, необходимое для того, чтобы вероятность совпадения превысила 50%.
Я играю на webmillion.com, и там 94 числа, из которых нужно угадать 6 в любом порядке. Хотелось бы узнать вероятность угадать 6 из 94 чисел. С момента появления этого сайта никто еще не выиграл 3 миллиона.
Вероятность правильно ответить на 6 из 94 вопросов составляет 1 в комбинации (94,6) = 1 из 814 216 767.
Отличный сайт, Майк! Часто слышу, как в азартных играх используется словосочетание «биномиальное распределение». Можешь объяснить, что это значит? Заранее спасибо.
Спасибо за комплимент. Любая вводная книга по теории вероятностей и статистике должна хорошо рассматривать биномиальное распределение. Вкратце, биномиальное распределение — это вероятность того, что любое заданное число событий произойдет при заданной вероятности для каждого события и заданном числе испытаний. В частности, если вероятность каждого успеха равна p, число успехов равно s, а число испытаний равно n, то вероятность s успехов равна p s * (1-p) ns * combin(n,s). Функция combin объяснена в моем глоссарии . Например, предположим, вы хотите узнать вероятность того, что за 100 вращений рулетки число красных выпадет ровно 60. Согласно биномиальному распределению, вероятность равна (18/38) 60 * (20/38) 40 * combin(100,60) = 0,003291.
В Excel также есть функция для работы с биномиальным распределением. Она выглядит так: =BINOMDIST(x,n,p,0), где:
x = количество положительных результатов испытаний. n = общее количество испытаний. p = вероятность успеха в каждом конкретном испытании.
Для обозначения вероятности выигрыша x используйте 0 в четвертой позиции функции. Для вероятности выигрыша x или менее используйте 1.
В приведенном выше примере с рулеткой функция будет выглядеть так: =BINOMDIST(60,100,18/38,0)
Не могли бы вы объяснить, что означает термин «Закон математических средних»? Спасибо, и продолжайте в том же духе.
Думаю, вы имеете в виду так называемый «Закон больших чисел». Он гласит, что для случайной выборки из n случайных величин со средним значением x выборочное среднее xn сходится к x по мере того, как размер выборки стремится к бесконечности. Мы можем рассматривать результат ставки как случайную величину. Этот закон говорит нам, что по мере того, как количество ставок становится очень большим, средний результат будет приближаться к преимуществу казино.
Мне бы очень хотелось узнать, как читать коэффициенты, например, 12 к 1 или 3 к 2. Какой из них показывает лучшие шансы на победу? 12 к 1 или 3 к 2?
Мне не нравится использовать вероятности в такой форме, но обычно они используются в таком синтаксисе: «Шансы на то, что роял-флеш не выпадет, составляют 649 739 к 1». Это означает, что существует 649 739 способов, которыми вы не можете вытянуть роял-флеш, и 1 способ, которым вы можете. В ваших примерах 12 к 1 — это вероятность 1/13, или 7,69%, а 3 к 2 — 2/5, или 40,00%, поэтому 3 к 2 — это более высокий шанс на выигрыш.
Если в вопросах с несколькими вариантами ответа возможны варианты a, b, c, d и e, какова вероятность того, что из 100 попыток найдется хотя бы 25 правильных ответов?
Вероятность получить ровно x правильно в вашем примере равна combin(100,x)*(1/5) x *(4/5) (100-x) . Чтобы получить точный ответ, нужно вычислить это для всех значений x от 0 до 24, сложить их и вычесть из 1. Ответ равен 13,14%.
Моя бабушка родилась 28 октября 1912 года, а недавно скончалась 28 октября 2001 года (в свой 89-й день рождения). Моя кузина спросила меня, какова статистическая вероятность этого события. Я знаю, что вероятность смерти в любой день года составляет примерно 1 к 365. Но какова вероятность того, что этот день совпадет с днем рождения человека?
Вам следовало спросить меня об этом, когда я ещё работал актуарием в Управлении социального обеспечения. Я мог бы легко провести общенациональный опрос по записям о смертях. Я бы сказал, что ответ близок к 1 из 365. Вероятно, он немного меньше, потому что показатели младенческой смертности непропорционально высоки после рождения. Для рождений в 2000 году вероятность смерти в течение первого года жизни составляет 0,71% для мальчиков и 0,59% для девочек. Другими словами, эти младенческие смерти вряд ли произойдут в день рождения, потому что после первого дня рождения ребёнок выходит из опасного периода. Кроме того, и я не знаю наверняка, но в сериале «Шесть футов под землёй» говорилось, что бизнес у похоронных бюро оживает в январе, очевидно, потому что люди пытаются продержаться ещё один рождественский праздник, а затем отпускают его. Та же логика может применяться и к достижению дня рождения. Взять, к примеру, Джорджа Бернса: он умер через 48 дней после своего 100-летия.
Я сделал 1000 вращений подряд на колесе с нулевым значением и выиграл 6 раз. Какова вероятность того, что в этой ситуации вы выпадет 6 или меньше выигрышных чисел?
Вероятность того, что ваше число совпадет ровно x раз, равна combin(1000,x)*(1/38) x *(37/38) 1000-x . В следующей таблице показана вероятность всех совпадений от 0 до 6 и их общее количество.
Выигрыши в 1000 ставках в рулетке
| Число | Вероятность |
| 0 | 0.00000000000262 |
| 1 | 0.00000000007078 |
| 2 | 0.00000000095556 |
| 3 | 0.00000000859146 |
| 4 | 0.00000005787627 |
| 5 | 0.00000031159330 |
| 6 | 0.00000139655555 |
| Общий | 0.00000177564555 |
Итак, ответ — 0,00000177564555, или 1 к 563175. Надеюсь, это не произошло в интернет-казино.
Возможно, вы задаетесь вопросом, почему я не использовал нормальное приближение, как в задаче с подбрасыванием монеты, описанной выше. Дело в том, что оно плохо работает с очень высокими и очень низкими вероятностями.
Для простоты предположим, что на столе стоят 322 стакана, и под одним из них лежит мяч. Какова вероятность того, что я выберу мяч, если я выберу стакан 75 раз (и стаканы не исчезают после того, как я их выберу, это всегда случайный выбор из 322 стаканов)? Сначала я подумал сказать 75/322, но понял, что это неверно, так как 322 выбора не дают 100% вероятности получить мяч, потому что я могу выбрать миллион раз и не получить мяч.
Ваш ответ был бы правильным, если бы вы убирали стаканчики после неправильного выбора. Поскольку стаканчики остаются на столе, вероятность правильного выбора составляет 1/322, или 321/322 вероятности неправильного выбора. Вероятность того, что 75 выборов будут неправильными, составляет (321/322) 75 = 79,193%. Таким образом, вероятность правильного выбора хотя бы одного из 75 составляет 100% - 79,193% = 20,807%.
Не могли бы вы сказать мне вероятность того, что 19%-ный шанс выпадет ровно в 18 из 34 испытаний?
Это будет комбинация (34,18)*.19^18*(1-.19)^(34-18) = 0.000007880052468.
В каком случае у меня больше шансов на победу:
А. один шанс из 4
Б. пять выстрелов с вероятностью 1 к 20
Вероятность варианта А, очевидно, составляет 25%. Вероятность получить ноль попаданий из пяти равна 0,95 = 77,378%. Следовательно, вероятность получить хотя бы одно попадание из пяти равна 100% - 77,378% = 22,622%. Таким образом, у варианта А более высокая вероятность.
На рулетке с 38 номерами... после выпадения трех красных, одного зеленого и еще одного красного... какова вероятность того, что следующие три вращения подряд выпадут красное число 23?
Не имеет значения, какие были предыдущие вращения. Вероятность выпадения красного числа 23 три раза подряд составляет (1/38) ³ = 1 к 1 из 54 872.
Недавно я приобрел карнавальное колесо, принадлежавшее моему двоюродному деду. Ему около ста лет, и я пытаюсь разработать игру на его основе. На нем случайным образом выпадают числа от 1 до 60, чередуются черные и красные, а каждые пятнадцатые деления отмечены зеленой звездочкой. Не могли бы вы помочь мне определить размер выигрыша за каждое вращение?
Итак, есть 30 черных, 30 красных и 4 зеленых числа. Это означает, что вероятность выпадения черного числа составляет 30/64, красного — 30/64, а зеленого — 4/64. Если вероятность события равна p, то справедливые шансы равны (1-p)/p к 1. Таким образом, справедливые шансы для любого красного числа будут (34/64)/(30/64) = 34 к 30 = 17 к 15. То же самое для черного. Справедливые шансы для зеленого числа равны (60/64)/(4/64) = 60 к 4 = 15 к 1. Для конкретного числа справедливые шансы равны (63/64)/(1/64) = 63 к 1.
Я предлагаю делать ставки 1 к 1 на красное и чёрное, 14 к 1 на зелёное и 60 к 1 на любой отдельный номер. Одна из формул для расчета преимущества казино — (ta)/(t+1), где t — истинные шансы, а a — фактические шансы. В данном случае преимущество казино на ставку на красное или чёрное составляет (63-60)/(63+1) = 3/64 = 4,69%. На ставку на зелёное преимущество казино составляет (15-14)/(15+1) = 1/16 = 6,25%. На отдельные номера преимущество казино составляет (63-60)/(63+1) = 3/64 = 4,69%.
Тест состоит из 10 вопросов с несколькими вариантами ответа, каждый из которых имеет 5 возможных ответов, 1 из которых правильный. Чтобы сдать тест, студент должен набрать 60% или более правильных ответов. Если студент отвечает наугад, какова вероятность того, что он сдаст тест?
Вероятность того, что будет ровно 6 правильных ответов, равна combin(10,6)×0.2 6 ×0.8 4 = 0.00550502.
Вероятность того, что будет ровно 7 правильных ответов, равна комбинации (10,7)×0,2 7 ×0,8 3 = 0,00078643.
Вероятность того, что будет ровно 8 правильных ответов, равна combin(10,8)×0.2 8 ×0.8 2 = 0.00007373.
Вероятность того, что будет ровно 9 правильных ответов, равна combin(10,9)×0.2 9 ×0.8 1 = 0.00000410.
Вероятность того, что будет ровно 10 правильных ответов, составляет 0,2 × 10 = 0,00000010.
Сложив вероятности от 6 до 10 правильных ответов, получаем вероятность того, что будет дано хотя бы шесть правильных ответов, равную 0,00636938.
Если я сделаю 1 000 000 вращений на событии с вероятностью выигрыша 1 к 1 000 000, каковы мои шансы выиграть хотя бы один раз?
Если вероятность выигрыша равна 1/n, и вы играете n раз, то при n, стремящемся к бесконечности, вероятность выигрыша хотя бы один раз приближается к 1-(1/e), где e = 2,7182818..., или примерно 63,21%. Точный ответ можно выразить как 1-(999 999/1 000 000) 1 000 000 = 0,63212074. Моя оценка составляет 1-(1/e) = 0,63212056, что совпадает с шестью знаками после запятой.
В забеге, если номера участников распределяются случайным образом и не влияют на результаты, каковы шансы, что хотя бы один человек финиширует на месте, соответствующем его номеру? Например, у победителя на груди номер один, или у человека, занявшего 305-е место, номер 305.
Если предположить, что ни одно число не пропускается, вероятность очень мало зависит от количества участников, при условии, что это число достаточно велико. Чем больше участников, тем больше вероятность того, что хотя бы одно совпадение приблизится к 1-(1/e) = 63,21%.
Привет! В Австралии есть лотерея Lotto, где главный денежный приз выплачивается, если ваши шесть чисел выпадут из 45 возможных чисел (от 1 до 45). Многие покупают лотерейный билет "Slik Pik", который включает 12 игр, в каждой из которых, предположительно, шесть случайных чисел. Мы с друзьями всегда удивляемся, что в этих 12 играх одно и то же число может выпасть до 6 или 7 раз. Неужели это случайность? Мой вопрос: каково ожидаемое количество повторений любого числа (6 или 7 раз), если предположить, что выбор случайный?
Ожидаемое количество раз, когда любое число появится ровно n раз в 12 играх, равно комбинации (12,n)×(6/45) n ×(39/45) n-12 . В следующей таблице показано ожидаемое количество вхождений чисел от 0 до 12.
Ожидаемое количество повторяющихся чисел
| Повторы | Ожидал |
|---|---|
| 0 | 8.0804888027 |
| 1 | 14.9178254818 |
| 2 | 12.6227754077 |
| 3 | 6.4732181578 |
| 4 | 2.2407293623 |
| 5 | 0.5515641507 |
| 6 | 0.0989986937 |
| 7 | 0.0130547728 |
| 8 | 0.0012552666 |
| 9 | 0.0000858302 |
| 10 | 0.0000039614 |
| 11 | 0.0000001108 |
| 12 | 0.0000000014 |
| Общий | 45 |
Итак, отвечая на ваш вопрос, вы увидите одно и то же число ровно шесть раз примерно 0,099 раза на один набор карт, или примерно один раз из 10,1. То же число, появившееся ровно семь раз, произойдет 0,0131 раза на один набор карт, или один раз из 76,6.
Я читал, что вероятность выпадения одного и того же трехзначного числа два вечера подряд составляет 1 к миллиону. Но поскольку само выпавшее число не имеет никакого значения, вероятность на самом деле составляет один к тысяче, верно?
Вы правы. Вероятность того, что одна и та же последовательность чисел будет выбрана две ночи подряд, составляет 1 к 1000. Вопрос, на который отвечал автор, заключается в том, какова вероятность того, что последовательность 1-9-6 будет вытянута дважды подряд, что действительно составляет один к миллиону. Однако, как вы отметили, более важный вопрос — каковы шансы повторения любой последовательности. Ответ на этот вопрос — (1/10) ³ = 1 к 1000.
Каково среднее расстояние между двумя случайными точками в единичном квадрате?
Для такого простого вопроса решение оказывается довольно сложным. В моем случае вам потребуется знать этот интеграл .
Вот ответ и моё решение (PDF) .