Заранее предупреждаю, что никаких сенсаций по Израилю не будет, хотя некоторые графики весьма любопытны и могут быть интересны разбирающимся в статистике. Я исходил из предположения, что серьезных нарушений при подсчёте голосов в Израиле не было. Наблюдатели сообщали об отдельных случаях “вливания” в харедимном и арабском секторах. Такие вливания хотя и могли добавить по одному мандату (скорее всего меньше) соответствующим партиям, но в целом по стране их влияние ничтожно.
Сравнение статистических аномалий в данных израильских выборов (в моем предположении с незначительным количеством фальсификаций) и российских (о серьезных фальсификациях в которых имеются красочные свидетельства) позволяет лучше понять, какие аномалии однозначно указывают на фальсификацию, а какие нет.
Итак, в Израиле 9264 избирательных участков (в 10 раз меньше чем в России).
На графике 1 изображена гистограмма распределения числа избирательных участков по различным процентам голосов, полученных ведущими партиями. Видно, что распределения не очень сильно похожи на нормальные. Все они имеют два максимума. Первый - в районе 0%, отражающий наличие большого числа избирательных участков, в которых партия совсем не пользуется популярностью. Это мусульманские избирательные участки для Ликуда и НДИ; поселения для Кадимы. Больше всего не любят харедимные партии.
1.

Пока что - ничего удивительного. Интереснее со вторым максимумом.
У харедимных партий есть локальный максимум в районе 100%, но этот максимум весьма незначителен. Я специально объединил две харедимные партии вместе, чтобы максимум стал хоть сколько-нибудь заметным. У Кадимы второй максимум очень сильно размазан. У меня нет чёткого объяснения этому факту, но, по-видимому, чем более разнородна публика, голосующая за партию, тем меньше распределение похоже на нормальное. Чтобы как-то подтвердить это, рассмотрим гистограмму, аналогичную приведенной выше, но не для отдельных партий, а для партийных блоков: право-религиозного и лево-арабского. Распределение приведено на графике 2. Здесь уже вообще никакой связи с гауссовым (нормальным) распределением не видно.
2.

Для сравнения приведу аналогичную гистограмму для российских выборов (график 3). Распределение для партии Яблоко очень напоминает ШАС; ЛДПР и СР - НДИ, КПРФ - Ликуд, а ЕР – Кадиму :-).
3.

Единственным отличием (на зато каким !) является наличие для ЕР многочисленных локальных максимумов на процентах кратных 5, - явный признак фальсификации. Никакими естественными причинами любовь русских избирателей к круглым числам объяснить нельзя (точность построения графика - бин = 0.5). Сама же форма распределения, включая неожиданный рост числа избирательных участков в области свыше 90% голосов, поданных за ЕР, вряд ли дают основание для однозначного заключения о фальсификации выборов.
Рассмотрим теперь зависимость между общим процентом проголосовавших на участке избирателей (“явка”) и процентом голосов, поданных за партию (графики 4-8). Каждая точка на этих графиках изображает один избирательный участок: по горизонтали - процент явки на участке, по вертикали - процент голосов, поданных за партию на участке.
4.

5.

6.

7.

8.

Что мы видим. Явка колеблется от 40% до 90%. Узкая полоска внизу, с 0-7% проголосовавших за конкретную партию, соответствует первому максимуму на графике 1 (голосование в арабских населенных пунктах за сионистские партии и в поселениях за левые). Если же рассматривать оставшуюся часть, то для Ликуда процент набранных голосов не сильно зависит от явки (корреляция 0.01). Интуитивно так и должно быть. Процент проголосовавших за НДИ падает с ростом явки (корреляция -0.28), а процент проголосовавших за Кадиму - растёт (корреляция +0.30). Эффект роста процента голосов с ростом явки становится особенно наглядным, если объединить вместе голоса, поданные за три левые партии. Для голосующих за харедимные партии получается два кластера. Один большой - внизу, имеет форму, аналогичную НДИ: падение процента голосов с ростом явки. Второй маленький - вверху справа, соответствующий близкой к 100% явке и близкому к 100% голосованию. Форма распределения для Кадимы похожа на аналогичное распределение для ЕР. Так как отсутствуют свидетельства наблюдателей о серьезных нарушениях при голосовании на участках, где Кадима и левые партии получили высокий процент голосов, то я бы не стал однозначно связывать форму распределения с фальсификацией выборов путём вбросов. Избиратели левых партий живут в кибуцах, а также компактно проживают в престижных районах больших городов. И те и другие имеют традицию (кибуцы) или высокую мотивацию (элиты), чтобы принять участие в голосовании.
Рассмотрим теперь гистограмму явок избирателей (график 9). Для Израиля он имеет типичную колоколообразную форму
9.

Вопреки распространенному мнению о голосовании в харедимном и арабском секторах, только в 7 из 9264 (менее 0.1%) избирательных участков процент проголосовавших превысил 95%. В России же процент избирательных участков с близким к 100%-му голосованию - около 10% (см. график 10, на котором, правда, представлены данные выборов 2007 года). Это ещё один явный признак фальсификации российских выборов. Обратите внимание на локальные пики явки при значениях 60%, 70%, 80% 90%
10.

Update:
1. Корреляция между процентом проголосовавших за партию и явкой имеется и в других странах, в которых наличие серьезных фальсификаций не предполагается. Здесь есть данные про Великобританию, и здесь тоже, а здесь про Германию. Гипотеза о нормальности (или, по-крайней мере, колоколообразности) распределения голосов, поданных за партию в этих странах также не подтверждается. Так что, такие аномалии не являются статистическим обоснованием фальсификации выборов.
2. Резкий пик на 50% в распределении поданных голосов (график 3) является артефактом целочисленного распределения. Грубое объяснение такое. Если брать дроби m/n, где m - случайное число проголосовавших за партию, а n - случайная же явка (m<=n), то соотношение 1/2 будет встречаться чаще чем, скажем, 138/275, так как 1/2 может получиться из 2/4 и из 125/250 и т. д., а у 138/275 - гораздо меньше возможностей. Пики, меньшие чем для 1/2, могут появляться и для 1/3 и 2/3; ещё меньшие для 1/4 и 3/4 и т. д. Гистограмма потом сглаживает эти различия и если брать шаг гистограммы больше 1%, то артефактных пиков не видно. При шаге гистограммы в 0.1% (как на графике 3) эффект целочисленности может быть заметен. Так как на графиках 3 и 10 нет заметных пиков в области 66.7% (2/3), то можно считать, что этот красивый сам по себе эффект объясняет выброс в районе 50%, возможно как-то в области 75%, но значительные выбросы на 65%, 70%, 85% и 95% он объяснить не может
← Ctrl← Alt
Ctrl →Alt →
December 13 2011, 18:17:25 UTC 5 months ago
только в 7 из 9264
Чурова на них нет :-)December 13 2011, 18:27:11 UTC 5 months ago
Re: только в 7 из 9264
Или наши чуровы знакомы не только с числами кратными 5, но также с иррациональными и даже мнимыми числами :-)December 13 2011, 19:03:12 UTC 5 months ago Edited: December 13 2011, 19:03:39 UTC
Интересно.
Утащу на фейсбук
December 13 2011, 20:37:43 UTC 5 months ago
December 13 2011, 21:02:01 UTC 5 months ago
December 13 2011, 21:10:03 UTC 5 months ago
1. Распределение избирательных участков (как функция поданных за партию голосов) должно иметь нормальный или, по крайней мере, колоколообразный вид.
Даже при отсутствии очевидных кластеров типа город-деревня, регионы, арабы-евреи - это не так, что видно из распределения для Кадимы и особенно для голосов, поданных за партийные блоки. Для Израиля влияние арабского кластера проявляется в пиках распределения в районе 0% и 100%, но никак не может объяснить, скажем, большое плато в районе 15%-40% в распределении для Кадимы.
2. Негоризонтальное расположение scatter-plots или heat maps для пар (явка, процент проголосовавших за партию). Для меня самого было большой неожиданностью, что объединение трёх левых израильских партий (без арабских партий) даст летящую под углом вниз комету, сходную с той, что Вы построили для ЕР (учтите, что у нас точек - избирательных участков в 10 раз меньше чем у Вас). Влиянием арабского кластера я это объяснить не могу. Возможно, это объясняется наличием мотивированного к голосованию кластера людей, которые живут в дорогих районах по всему Израилю (это могут быть престижные районы городов, в которых жители менее престижных районов голосуют по-другому) и имеют сильную тенденцию голосовать за левые партии. Так как по данным результатов выборов я такие районы выделить не могу, то и проверить свою гипотезу тоже не могу. В России, возможно, наличие сильной корреляции между явкой и голосованием за ЕР объясняется как раз не наличием какого-то специального кластера, который нельзя выявить простым разбиением на город-деревню или на регионы, а исключительно или в очень большой степени фальсификациями. Я хотел отметить лишь то, что картинки с кометами не обязательно являются статистическим доказательством фальсификации результатов.
5 months ago
5 months ago
5 months ago
5 months ago
5 months ago
5 months ago
5 months ago
5 months ago
December 13 2011, 21:32:23 UTC 5 months ago
Гаусс в Израиле
UserDecember 13 2011, 22:09:47 UTC 5 months ago
Забыли
... что есть Украина.December 14 2011, 07:09:05 UTC 5 months ago
У меня впечатление, что стоит
У меня впечатление, что стоит попробовать смеси Бета и нормальныхБета естественны при наличии границ (в нашем случае 0 и 1)
В российском случае похоже стоит ввести два бета-распределения - одно наглое, а второе с оглядкой
В Вашем случае интереснее было бы поработать и с полной многомерной матрицей данных (дифференцируя различия цветом и формой)
December 15 2011, 20:40:09 UTC 5 months ago
No title
UserDecember 16 2011, 11:20:09 UTC 5 months ago
Может: http://anpaza.livejournal.com/21894.htm
December 16 2011, 11:40:47 UTC 5 months ago
Выбросы, являющиеся следствием целочисленности эксперимента должны быть заметны и справа и слева от 50%, но слева они почему-то незаметны.
December 18 2011, 17:04:05 UTC 5 months ago
чисто посмеяться
UserDecember 22 2011, 06:50:54 UTC 5 months ago
No title
UserDecember 22 2011, 07:11:32 UTC 5 months ago
December 22 2011, 09:11:12 UTC 5 months ago
December 22 2011, 13:29:10 UTC 5 months ago
5 months ago
5 months ago
4 months ago
4 months ago
4 months ago
4 months ago
4 months ago
4 months ago
4 months ago
December 29 2011, 21:26:00 UTC 4 months ago
Чисто посмеяться (про Германию)
UserMarch 1 2012, 17:48:47 UTC 2 months ago
Skeptik: «Методы статистического анализа результатов выб
UserMarch 2 2012, 08:07:57 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 08:19:34 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 08:20:38 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 08:33:06 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 09:40:38 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 10:15:12 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 11:36:35 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 12:10:28 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 12:20:25 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
UserMarch 2 2012, 12:25:01 UTC 2 months ago
Гаусс мне друг, но…О методах статистического анализа
User← Ctrl← Alt
Ctrl →Alt →