Úvod
Cílem tohoto modelového projektu bylo předpovědět výsledek voleb v roce 2024 pomocí údajů o veřejném zdraví, demografických a historických dat. Jedinečný přístup se opírá o prediktory, které jsou zástupným znakem veřejné podpory Demokratické strany v rámci populace. V USA jsme postaveni před binární volbu, demokrat nebo republikán, a o našich volbách rozhodují volební hlasy z každého státu. Proto předpovídaná metrika odezvy byla jednoduše hranice vítězství v rámci státu.
Kvůli Electoral College je předpovídání voleb v podstatě záležitostí předpovídání hrstky států. Většina států má spolehlivou historii s velkým náskokem na vítězství jedné nebo druhé strany, zatímco několik států ne. Data a model budou přesné do té míry, že přesně předpovídají tyto stavy. Vzhledem k menší velikosti vzorku nedávných celostátních voleb a důležitosti nedávných datových bodů v modelu nebude tento model schopen vytvářet vysoce přesné předpovědi pro státy s úzkými hranicemi vítězství. Úspěch tohoto modelu proto bude záviset na jeho schopnosti odhalit, které swingové státy mohou mít větší podporu pro demokraty (nebo republikány), než jaká je aktuálně zjišťována v průzkumech.
Pozadí a předpoklady
Během posledních dvou prezidentských volebních cyklů jsme byli svědky toho, že veřejné průzkumy selhaly v mnoha směrech. V roce 2016 téměř všechny velké průzkumy a média nedokázaly odhalit míru veřejné podpory mezi demokraty a nezávislými, která vedla k Trumpovu vítězství v klíčových swingových státech a v Rust Belt. V roce 2020 volební místnosti opět podcenily Trumpovu podporu v klíčových státech. Od té doby se důvěra ve schopnost médií vyšetřit a dobrat se pravdy dále nahlodala.
Tato analýza se snaží najít prediktory, které odrážejí přesnější stav politických preferencí veřejnosti, které nepodléhají slabým stránkám předpojatosti volebního průmyslu. Vzhledem k hyperpolarizované povaze pandemie Covid-19 a explicitně jasným liniím, kde podpora výstřelu Covid-19 klesla, veřejný příjem „nové“ verze výstřelu Covid-19 každý rok vysoce koreluje s podporou Demokratická strana. Vzhledem k tomu, že každý rok dojde k novému výstřelu Covid-19, předpokládá se, že pokračující příjem naznačuje oddanost demokratickému hlasování. Další ukazatele, jako je míra domácí migrace a žádosti o hlasování poštou, silně korelují s demokratickou podporou za poslední čtyři roky.
Kromě toho byly údaje o populaci ze zdrojů veřejného zdraví použity jako kontrolní nebo prediktivní proměnné, včetně míry úmrtnosti, porodnosti a duševního zdraví. Některá demografická a populační dynamika je spojena se státy více nakloněnými republikánům a jiná se státy nakloněnými demokratům a tyto vztahy se v nedávné historii udržely. Další opatření, jako je míra čisté migrace, mají silné souvislosti, ale ty jsou novější a byly ovlivněny pandemií Covid-19, během níž mnoho uzavřených modrých států zaznamenalo čistou ztrátu a červené otevřené státy zaznamenaly čistý zisk. Popularita nyní každoročního očkování Covid-19 rok od roku klesá a údaje byly upraveny tak, aby měřily relativní popularitu, přičemž státy s vyšším celkovým příjmem, než je průměr, odrážejí vyšší podporu Demokratické strany.
Celkově se tato analýza snaží kombinovat jak dlouhodobější trendy, tak novější trendy, aby bylo možné odhadnout současnou úroveň podpory Demokratické strany. Vzhledem k tomu, že model musí být trénován na datech zpřístupněných pouze v měsících (Covid-Vax) a týdnech (žádosti o neúčastné hlasování) před volbami, nebude schopen detekovat žádné 11hodinové směny.
Jak řekl George Box: "Všechny modely jsou špatné, ale některé jsou užitečné." S touto analýzou doufám, že by mohla být užitečná k odhalení signálů, které nemusí být přítomny v tradičních volebních průzkumech. Kromě predikce (která je většinou pro zábavu) jsem zahrnul nějakou analýzu stavu swingu, o které si myslím, že by mohla vrhnout nějaké světlo na klíčové posuny, ke kterým došlo za poslední čtyři roky.
Metody
Protože vysvětlitelnost a interpretace jsou ve volebním kontextu kritické, zůstal jsem u jednoduchých modelů. Zobecněné lineární modelování, logistická regrese a modely náhodného lesa byly všechny trénovány na datech z let 2020–2022. Výsledkem nebo reakcí bylo vítězství Demokratické strany. Pro logistický model byla předpovězenou odpovědí binární výhra nebo prohra pro daný stát. Protože každý model má své silné a slabé stránky spolu s vlastní chybovostí, bude konečná klasifikace výhry nebo prohry určena většinou hlasů. Nahrál jsem svůj kód a data do GitHuba kdokoli může kritizovat, opravit nebo poskytnout zpětnou vazbu.
Omezení
Vzhledem k mému rozhodnutí použít jako prediktor šíření výstřelů Covid-19 mezi státy to omezuje časovou osu a data, která lze shromáždit. Z tohoto důvodu očekávám, že model bude mít zaujatost vůči demokratům. Z 50 států pět spadalo do rozsahu chyb. Všech pět těchto stavů je považováno za swingové stavy. Pro účely kategorizace budou jako výhra pro danou stranu kategorizovány pouze státy, které jasně spadají mimo chyby mých modelů. Chyby v rozsahu chyb budou kategorizovány jako přehozené.
Diskuse
Protože v USA jsou volby binární volbou, analýza se zabývá pouze demokraty vs. republikány a nedokáže odhalit posuny v podpoře kandidáta mezi voliči opačné strany. To odhaluje základní předpoklad modelu, že tyto volby jsou stále primárně o stranické loajalitě vůči jednotlivému kandidátovi.
Pro demokratickou kandidátku Kamalu Harrisovou věřím, že tento předpoklad platí, protože nebyla zvolena lidovým hlasováním během primárek a velká část kampaně byla o vytvoření strategicky vytvořené persony ze ženy, která byla donedávna převážně ignorována. , propuštěn, a dokonce zesměšňován. Vidíme, že během posledních několika měsíců neměly debaty, pokusy o atentát a další významné momenty žádný zásadní vliv na trendy hlasování.
U Donalda Trumpa nevěřím, že tento předpoklad platí. Trumpova známá osobnost je dominantní a všudypřítomná. Od jeho prezidentství v letech 2017–2021 a jeho pokračujících bojů se soudními procesy, pokusy o atentáty a posedlostí médií o něm Trumpovo vítězství vypovídá mnohem více než o Republikánské straně. Demokratická strana je stroj a Republikánská strana jen neochotně upevnila podporu Trumpovi po letech bojů a rozdělení mezi svými vůdci.
Vzhledem k tomu, že model využívá data z prezidentských voleb v roce 2020 a senátních voleb v roce 2022, je trénován na modelování stranické podpory, tedy jeho vlastní slabiny. Nedávné průzkumy se posunuly v Trumpův prospěch, ale státy jsou v krutém stavu. Držím-li se svých metod a záměru tohoto cvičení, žádné z těchto údajů nejsou zahrnuty.
Analýza stavu výkyvu
O výsledku voleb rozhodne hrstka států. V současné době jsou těsné závody v Arizoně, Nevadě, Wisconsinu, Michiganu, Severní Karolíně, Georgii a Pensylvánii dostatečné k tomu, aby se volby přehouply ve prospěch obou. Z těchto států model kategorizoval Michigan a Pensylvánii jako bezpečně swingující demokratické. Zbývající stavy byly všechny v rozsahu chyb modelu, a tak byly kategorizovány jako přehozené.
Abychom poskytli určitý vizuální kontext toho, jak tato analýza funguje, zde je několik rozpisů některých prediktorů pro stavy, které jsou obecně považovány za swingové stavy.
Míra domácí migrace: 2019–2023*
Celkově existuje negativní vztah mezi čistou mírou migrace a demokratickou mírou vítězství. Během posledních 4 let mnoho modrých států ztratilo lidi, zatímco červené státy získaly. U těchto swingových států jsou některé „červené“ s ohledem na guvernéry a státní vládu a jiné jsou „modré“. Celkově jsou Pensylvánie a Michigan jediné 2 země, které měly za poslední 4 roky zápornou míru migrace.
Žádosti o hlasování poštou
Některé státy, jako Kalifornie, Colorado a Nevada, jsou státy „All Mail“. To znamená, že každému registrovanému voliči je standardně zaslán papírový hlasovací lístek. S výjimkou Utahu (a možná Nevady) jsou téměř všechny tyto státy modré a jsou zcela modré. Nevada je jediným swingovým státem, který je celo-mailovým státem, jak můžete vidět, jeho požadavky zůstávají ploché. Obecným trendem u většiny ostatních, s výjimkou Arizony, je pokles počtu žádostí o zaslání poštou.
Roční příjem výstřelů Covid-19**
Vzhledem k tomu, že model používá roční příjem Covid-shot jako a silný prediktor podpory Demokratické strany, ale celková popularita klesá, model používá relativní skórování k porovnání jednotlivých států mezi sebou v rámci roku. Kromě Wisconsinu měly zbývající státy mírně podprůměrný příjem Covid-19 v letech 2021**, 2022 a 2024.
*Míra domácí migrace je stejná jako v předchozím roce.
**Vzhledem k tomu, že záběry Covid-19 nebyly k dispozici až do roku 2021, byly údaje za rok 2021 spárovány s údaji o výsledcích voleb v roce 2020. Údaje za roky 2022 a 2024 odrážejí využití nové verze pro daný rok.
Chcete-li získat představu o tom, jak důležité jsou prediktory pro model, níže uvedený graf seřadí každé měření podle toho, jak moc ovlivňuje jednu z předpovědí modelu. Jak můžete vidět, adopce Covid-19 je zařazena přímo pod „předchozí vítězství demokratů“.
výsledky
Model Harris bezpečně vyhrál 260 volebních hlasů ze států, o nichž předpovídá, že budou bezpečně demokratické. Pokud jsou Pensylvánie a Michigan ve skutečnosti ve sporu, pak pouze 226 z nich je bezpečně demokratických.
Tento model má Trumpa bezpečně získat 219 volebních hlasů ze států, o nichž předpovídá, že budou bezpečně republikánské.
Swingové státy Wisconsin, Georgia, Severní Karolína, Nevada a Arizona jsou všechny k mání a představují 59 volebních hlasů. Pokud jsou v mixu Pensylvánie a Michigan, hraje se o 93 volebních hlasů.
Harrisova cesta k vítězství
Harrisova cesta k vítězství vypadá nejjednodušší. S vyšším počátečním volebním hlasem „v tašce“ může nasbírat několik swingových stavů. Pensylvánie a Michigan se pro ni v tomto modelu ukazují jako výhry, a pokud je vyhraje, jednoduše potřebuje jakoukoli z Arizony, Severní Karolíny, Wisconsinu nebo Georgie, aby to uzavřela. Pokud vyhraje jeden nebo druhý z Pensylvánie nebo Michiganu, pak musí ztrátu nahradit 1-2 dalšími swingovými stavy.
Trumpova cesta k vítězství
Je důležité dívat se na Trumpovu cestu s myšlením „stát se může cokoliv“. V obou předchozích volbách překonal očekávání. Většina správců informačních bran, mainstreamových vědátorů a volebních průzkumníků se v minulosti zmýlila.
S 219 v tašce musí Trump vzít každý jednotlivý stát Arizona, Georgia, Severní Karolína, Wisconsin a Nevada. Pokud Trump vyhraje Pensylvánii a/nebo Michigan, pak se jeho cesta zjednoduší, což znamená, že by stále potřeboval 2–3 ze zbývajících losů.
Podívejte se na Dashboard níže. Komunikujte, abyste viděli, jak se kterýkoli z kandidátů na cestě k vítězství vyhrává vítěznými stavy, a podívejte se na rozptylové grafy pro předpovědi měřené podle stavu.
Moje osobní předpovědi založené na modelu
Mám větší intuici o Severní Karolíně a Georgii, protože tam trávím čas, a nazývám je Trumpem. Nemám tuto intuici pro Arizona, Nevada nebo Wisconsin. Berte to tedy s rezervou. Ale je věrný této metodě, můj model volá Pennsylvanii a Michigan pro Harrise, a já věřím, že bude mít alespoň 2-3 další stavy švihu. Doufám, že se mýlím.
Reference:
Volební laboratoř MIT https://electionlab.mit.edu/data#data
Fakta o USA https://usafacts.org/economy/
Volební laboratoř UF https://election.lab.ufl.edu/voter-turnout/
Hlasování a registrace ve volbách v listopadu 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Pět třicet osm https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
Monitor vakcíny KFF https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
Volební laboratoř UF https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Národní centrum pro zdravotní statistiku https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Národní centrum pro zdravotní statistiku https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Sčítání lidu- Chudoba https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Census- Změna populace podle státu https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
Volební projekt v USA https://electproject.github.io/
Znovu publikováno od autora Náhradník
Publikováno pod a Mezinárodní licence Creative Commons Attribution 4.0
Pro dotisky nastavte kanonický odkaz zpět na originál Brownstone Institute Článek a autor.