परिचय
इस मॉडलिंग परियोजना का लक्ष्य सार्वजनिक स्वास्थ्य, जनसांख्यिकी और ऐतिहासिक डेटा का उपयोग करके 2024 के चुनाव के परिणाम की भविष्यवाणी करना था। यह अनूठा दृष्टिकोण उन भविष्यवाणियों पर निर्भर करता है जो आबादी के भीतर डेमोक्रेटिक पार्टी के लिए सार्वजनिक समर्थन के लिए एक प्रॉक्सी हैं। अमेरिका में, हमारे सामने एक द्विआधारी विकल्प है, डेमोक्रेट या रिपब्लिकन, और हमारा चुनाव प्रत्येक राज्य के इलेक्टोरल वोटों से तय होता है। इसलिए, अनुमानित प्रतिक्रिया मीट्रिक केवल एक राज्य के भीतर जीत का अंतर था।
इलेक्टोरल कॉलेज की वजह से, चुनाव की भविष्यवाणी करना अनिवार्य रूप से मुट्ठी भर राज्यों की भविष्यवाणी करने का मामला है। अधिकांश राज्यों में एक पार्टी या दूसरे के लिए जीत के बड़े अंतर का विश्वसनीय इतिहास है, जबकि कुछ में ऐसा नहीं है। डेटा और मॉडल इस हद तक सटीक होंगे कि वे इन राज्यों की सटीक भविष्यवाणी करते हैं। हाल के राष्ट्रीय चुनावों के छोटे सैंपल साइज़ और मॉडल में हाल के डेटा पॉइंट्स के महत्व के कारण, यह जीत के कम अंतर वाले राज्यों के लिए अत्यधिक सटीक भविष्यवाणियाँ करने में सक्षम नहीं होगा। इसलिए, इस मॉडल की सफलता इस बात पर निर्भर करेगी कि यह पता लगाने की इसकी क्षमता क्या है कि कौन से स्विंग राज्यों में डेमोक्रेट्स (या रिपब्लिकन) के लिए अधिक समर्थन हो सकता है, जो वर्तमान में पोल में पता लगाया जा रहा है।
पृष्ठभूमि और मान्यताएँ
पिछले दो राष्ट्रपति चुनाव चक्रों में, हमने देखा है कि सार्वजनिक मतदान प्रमुख तरीकों से विफल रहा है। 2016 में, लगभग हर प्रमुख मतदान और मीडिया आउटलेट डेमोक्रेट और स्वतंत्र लोगों के बीच जनता के समर्थन की डिग्री का पता लगाने में विफल रहा, जिसके कारण प्रमुख स्विंग राज्यों और रस्ट बेल्ट में ट्रम्प की जीत हुई। 2020 में, मतदान केंद्रों ने फिर से प्रमुख राज्यों में ट्रम्प के समर्थन को कम करके आंका। तब से, मीडिया की जांच करने और सच्चाई तक पहुंचने की क्षमता पर भरोसा और कम हो गया है।
यह विश्लेषण ऐसे पूर्वानुमानों को खोजने का प्रयास करता है जो जनता की राजनीतिक पसंद की अधिक सटीक स्थिति को दर्शाते हैं जो मतदान उद्योग के पूर्वाग्रहों की कमज़ोरियों के अधीन नहीं हैं। कोविड-19 महामारी की अति-ध्रुवीकृत प्रकृति और कोविड-19 शॉट के लिए समर्थन में स्पष्ट रूप से स्पष्ट रेखाओं के कारण, प्रत्येक वर्ष कोविड-19 शॉट के "नए" संस्करण के लिए जनता का रुझान डेमोक्रेटिक पार्टी के समर्थन के साथ अत्यधिक सहसंबद्ध है। क्योंकि हर साल एक नया कोविड-19 शॉट होता है, इसलिए निरंतर रुझान को डेमोक्रेटिक वोट निष्ठा का संकेत माना जाता है। अन्य संकेतक, जैसे घरेलू प्रवास दर और मेल-इन बैलट अनुरोध, पिछले चार वर्षों में डेमोक्रेटिक समर्थन के साथ दृढ़ता से सहसंबद्ध हैं।
इसके अलावा, सार्वजनिक स्वास्थ्य स्रोतों से जनसंख्या डेटा का उपयोग मृत्यु दर, जन्म दर और मानसिक स्वास्थ्य सहित नियंत्रण या पूर्वानुमानित चर के रूप में किया गया है। कुछ जनसांख्यिकी और जनसंख्या गतिशीलता अधिक रिपब्लिकन-झुकाव वाले राज्यों और अन्य डेमोक्रेटिक-झुकाव वाले राज्यों से जुड़ी हुई हैं, और ये संबंध हाल के इतिहास में समय के साथ बने रहे हैं। अन्य उपाय, जैसे शुद्ध प्रवास दर, में मजबूत संबंध हैं, लेकिन वे अधिक हाल के हैं और कोविड-19 महामारी से प्रभावित थे, जिसके दौरान कई लॉकडाउन वाले नीले राज्यों में शुद्ध घाटा हुआ और लाल खुले राज्यों में शुद्ध लाभ हुआ। अब वार्षिक कोविड-19 शॉट की लोकप्रियता साल दर साल कम होती जा रही है, और डेटा को सापेक्ष लोकप्रियता को मापने के लिए समायोजित किया गया है, जिसमें औसत से अधिक समग्र उपयोग वाले राज्य उच्च डेमोक्रेटिक पार्टी के समर्थन को दर्शाते हैं।
कुल मिलाकर, यह विश्लेषण डेमोक्रेटिक पार्टी के लिए समर्थन के वर्तमान स्तर का अनुमान लगाने के लिए दीर्घकालिक रुझानों और हाल के रुझानों दोनों को संयोजित करने का प्रयास करता है। चूंकि मॉडल को केवल चुनाव से पहले के महीनों (कोविड-वैक्स) और हफ्तों (अनुपस्थित मतपत्र अनुरोध) में उपलब्ध कराए गए डेटा पर प्रशिक्षित किया जाना चाहिए, इसलिए यह 11वें घंटे में होने वाले किसी भी बदलाव का पता लगाने में असमर्थ होगा।
जैसा कि जॉर्ज बॉक्स ने कहा, "सभी मॉडल गलत हैं, लेकिन कुछ उपयोगी हैं।" इस विश्लेषण से मेरी उम्मीद है कि यह उन संकेतों का पता लगाने में उपयोगी हो सकता है जो पारंपरिक चुनाव मतदान में मौजूद नहीं हो सकते हैं। भविष्यवाणी के अलावा (जो ज्यादातर मनोरंजन के लिए है), मैंने कुछ स्विंग स्टेट विश्लेषण शामिल किए हैं जो मुझे लगता है कि पिछले चार वर्षों में होने वाले प्रमुख बदलावों पर कुछ प्रकाश डाल सकते हैं।
तरीके
चूँकि चुनाव के संदर्भ में व्याख्या और व्याख्या महत्वपूर्ण हैं, इसलिए मैंने सरल मॉडल का ही इस्तेमाल किया है। सामान्यीकृत रैखिक मॉडलिंग, लॉजिस्टिक रिग्रेशन और रैंडम फ़ॉरेस्ट मॉडल सभी को 2020-2022 के डेटा पर प्रशिक्षित किया गया था। परिणाम, या प्रतिक्रिया, डेमोक्रेटिक पार्टी की जीत का अंतर था। लॉजिस्टिक मॉडल के लिए, पूर्वानुमानित प्रतिक्रिया उस राज्य के लिए बाइनरी जीत या हार थी। चूँकि प्रत्येक मॉडल की अपनी ताकत और कमज़ोरियाँ होती हैं, साथ ही अपनी त्रुटि दर भी होती है, इसलिए जीत या हार का अंतिम वर्गीकरण बहुमत के वोट से निर्धारित होगा। मैंने अपना कोड और डेटा अपलोड कर दिया है GitHub, और किसी को भी आलोचना करने, सही करने, या प्रतिक्रिया देने के लिए स्वागत है।
सीमाओं
राज्यों में कोविड-19 के प्रसार को पूर्वानुमान के रूप में उपयोग करने के मेरे निर्णय के कारण, यह समय-सीमा और एकत्रित किए जा सकने वाले डेटा को सीमित करता है। इसके कारण, मुझे लगता है कि मॉडल डेमोक्रेट्स के पक्ष में पक्षपाती होगा। 50 राज्यों में से, पाँच त्रुटि की सीमा में आते हैं। उन सभी पाँच राज्यों को स्विंग स्टेट माना जाता है। वर्गीकरण उद्देश्यों के लिए, केवल वे राज्य जो मेरे मॉडल की त्रुटियों से स्पष्ट रूप से बाहर हैं, उन्हें उस पार्टी की जीत के रूप में वर्गीकृत किया जाएगा। त्रुटि सीमा के भीतर वाले को टॉस-अप के रूप में वर्गीकृत किया जाएगा।
चर्चा
क्योंकि अमेरिका में चुनाव एक द्विआधारी विकल्प है, इसलिए विश्लेषण केवल डेमोक्रेट बनाम रिपब्लिकन को देखता है और विपरीत पार्टी के मतदाताओं के बीच उम्मीदवार के समर्थन में बदलाव का पता नहीं लगा सकता है। यह मॉडल की एक मुख्य धारणा को प्रकट करता है, कि यह चुनाव अभी भी मुख्य रूप से व्यक्तिगत उम्मीदवार की तुलना में पार्टी की निष्ठा के बारे में है।
डेमोक्रेटिक उम्मीदवार कमला हैरिस के लिए, मेरा मानना है कि यह धारणा सही है, क्योंकि उन्हें प्राथमिक चुनाव के दौरान लोकप्रिय वोट के माध्यम से नहीं चुना गया था, और अभियान का अधिकांश हिस्सा एक ऐसी महिला की रणनीतिक रूप से गढ़ी गई छवि बनाने के बारे में था, जिसे हाल ही तक बड़े पैमाने पर नजरअंदाज किया गया था, खारिज किया गया था और यहां तक कि उसका मजाक भी उड़ाया गया था। हम देख सकते हैं कि पिछले कुछ महीनों में, बहस, हत्या के प्रयास और अन्य प्रमुख क्षणों का मतदान के रुझानों पर कोई बड़ा प्रभाव नहीं पड़ा है।
डोनाल्ड ट्रम्प के लिए, मुझे नहीं लगता कि यह धारणा सही है। ट्रम्प का प्रसिद्ध व्यक्तित्व प्रभावशाली और सर्वव्यापी है। 2017-2021 तक उनके राष्ट्रपति पद और मुकदमों, हत्या के प्रयासों और मीडिया के जुनून के साथ उनकी निरंतर लड़ाई से, ट्रम्प की जीत रिपब्लिकन पार्टी की तुलना में उनके बारे में बहुत कुछ कहती है। डेमोक्रेटिक पार्टी एक मशीन है, और रिपब्लिकन पार्टी ने अपने नेताओं के बीच कई वर्षों की अंदरूनी लड़ाई और विभाजन के बाद अनिच्छा से ट्रम्प के लिए समर्थन मजबूत किया।
चूंकि मॉडल 2020 में राष्ट्रपति चुनाव और 2022 में सीनेट चुनाव दोनों के डेटा का उपयोग करता है, इसलिए इसे पार्टी समर्थन को मॉडल करने के लिए प्रशिक्षित किया जाता है, इसलिए इसकी अंतर्निहित कमजोरी है। हाल ही में मतदान ट्रम्प के पक्ष में बदल गया है, लेकिन प्रमुख स्विंग राज्य मृत हीट में हैं। मेरे तरीकों और इस अभ्यास के इरादे के अनुसार, उस डेटा में से कोई भी शामिल नहीं है।
स्विंग स्टेट विश्लेषण
चुनाव का नतीजा कुछ राज्यों द्वारा निर्धारित किया जाएगा। वर्तमान में, एरिजोना, नेवादा, विस्कॉन्सिन, मिशिगन, उत्तरी कैरोलिना, जॉर्जिया और पेंसिल्वेनिया में करीबी मुकाबले चुनाव को किसी भी पक्ष में मोड़ने के लिए पर्याप्त हैं। उन राज्यों में से, मॉडल ने मिशिगन और पेंसिल्वेनिया को सुरक्षित रूप से डेमोक्रेटिक झुकाव के रूप में वर्गीकृत किया। शेष सभी राज्य मॉडल की त्रुटि सीमा के भीतर थे और इसलिए उन्हें टॉस-अप के रूप में वर्गीकृत किया गया था।
यह विश्लेषण कैसे काम करता है, इसके लिए कुछ दृश्य संदर्भ प्रदान करने के लिए, यहां उन राज्यों के कुछ पूर्वानुमानों का विवरण दिया गया है, जिन्हें आम तौर पर स्विंग राज्य माना जाता है।
घरेलू प्रवास दरें: 2019-2023*
कुल मिलाकर, शुद्ध प्रवासन दर और डेमोक्रेटिक जीत के अंतर के बीच नकारात्मक संबंध है। पिछले 4 वर्षों में, कई नीले राज्यों में लोग कम हो रहे हैं, जबकि लाल राज्यों में लोग कम हो रहे हैं। राज्यों को लाभ हुआ हैइन स्विंग राज्यों में से कुछ राज्यपालों और राज्य सरकार के मामले में "लाल" हैं, और अन्य "नीले" हैं। कुल मिलाकर, पेंसिल्वेनिया और मिशिगन ही ऐसे दो राज्य हैं, जिनकी पिछले 2 सालों में प्रवास दर नकारात्मक रही है।
मेल-इन मतपत्र अनुरोध
कैलिफ़ोर्निया, कोलोराडो और नेवादा जैसे कुछ राज्य "ऑल मेल" राज्य हैं। इसका मतलब है कि हर पंजीकृत मतदाता को डिफ़ॉल्ट रूप से एक पेपर बैलट भेजा जाता है। यूटा (और संभवतः नेवादा) को छोड़कर, इनमें से लगभग सभी राज्य नीले राज्य हैं और पूरी तरह से नीले हैं। नेवादा एकमात्र ऐसा स्विंग राज्य है जो ऑल-मेल राज्य है, जैसा कि आप देख सकते हैं कि इसके अनुरोध स्थिर रहते हैं। एरिज़ोना को छोड़कर अधिकांश अन्य राज्यों में सामान्य प्रवृत्ति मेल-इन-बैलट अनुरोधों में कमी है।
वार्षिक कोविड-19 शॉट अपटेक**
चूंकि मॉडल वार्षिक कोविड-शॉट अपटेक को एक कारक के रूप में उपयोग करता है मजबूत भविष्यवक्ता डेमोक्रेटिक पार्टी के समर्थन की कमी के बावजूद, कुल मिलाकर लोकप्रियता कम हो रही है, मॉडल वर्ष के दौरान प्रत्येक राज्य की एक दूसरे से तुलना करने के लिए सापेक्ष स्कोरिंग का उपयोग करता है। विस्कॉन्सिन के अलावा, शेष राज्यों में 19**, 2021 और 2022 में कोविड-2024 के मामले औसत से थोड़े कम थे।
*घरेलू प्रवास दरें पिछले वर्ष से मेल खाती हैं।
**चूँकि कोविड-19 के टीके 2021 तक उपलब्ध नहीं थे, इसलिए 2021 के डेटा को 2020 के चुनाव परिणाम के डेटा के साथ जोड़ा गया। 2022 और 2024 के लिए, डेटा उस वर्ष के नए संस्करण के लिए उठाव को दर्शाता है।
मॉडल के लिए भविष्यवक्ता कितने महत्वपूर्ण हैं, इसका अंदाजा लगाने के लिए, नीचे दिया गया चार्ट प्रत्येक उपाय को इस आधार पर रैंक करता है कि यह मॉडल की भविष्यवाणियों में से किसी एक को कितना प्रभावित करता है। जैसा कि आप देख सकते हैं, कोविड-19 शॉट अपटेक को “पिछली डेमोक्रेटिक जीत” के ठीक नीचे रैंक किया गया है।
परिणाम
मॉडल के अनुसार हैरिस सुरक्षित रूप से उन राज्यों से 260 इलेक्टोरल वोट जीत सकती हैं, जिनके बारे में यह भविष्यवाणी की गई है कि वे सुरक्षित रूप से डेमोक्रेटिक होंगे। अगर पेंसिल्वेनिया और मिशिगन वास्तव में चुनाव में हैं, तो उनमें से केवल 226 सुरक्षित रूप से डेमोक्रेटिक हैं।
मॉडल के अनुसार ट्रम्प उन राज्यों से 219 इलेक्टोरल वोट सुरक्षित रूप से जीत लेंगे, जिनके बारे में उनका पूर्वानुमान है कि वे सुरक्षित रूप से रिपब्लिकन होंगे।
विस्कॉन्सिन, जॉर्जिया, नॉर्थ कैरोलिना, नेवादा और एरिजोना जैसे स्विंग स्टेट में 59 इलेक्टोरल वोट हैं। अगर पेन्सिलवेनिया और मिशिगन को भी इसमें शामिल कर लिया जाए तो 93 इलेक्टोरल वोटों पर दांव लगाया जा सकता है।
हैरिस की जीत की राह
हैरिस की जीत का रास्ता सबसे आसान लगता है। एक उच्च प्रारंभिक इलेक्टोरल वोट "बैग में" के साथ, वह मुट्ठी भर स्विंग राज्यों को इकट्ठा कर सकती है। मॉडल में पेंसिल्वेनिया और मिशिगन उसके लिए जीत के रूप में दिखाए जा रहे हैं, और अगर वह उन्हें जीतती है, तो उसे इसे बंद करने के लिए एरिज़ोना, उत्तरी कैरोलिना, विस्कॉन्सिन या जॉर्जिया में से किसी एक की आवश्यकता है। यदि वह पेंसिल्वेनिया या मिशिगन में से किसी एक को जीतती है, तो उसे 1-2 अतिरिक्त स्विंग राज्यों के साथ हार की भरपाई करनी होगी।
ट्रम्प की जीत का मार्ग
ट्रम्प के रास्ते को "कुछ भी हो सकता है" मानसिकता के साथ देखना महत्वपूर्ण है। उन्होंने पिछले दोनों चुनावों में उम्मीदों से बेहतर प्रदर्शन किया है। अधिकांश सूचना द्वारपाल, मुख्यधारा के पंडित और चुनाव सर्वेक्षणकर्ता अतीत में गलत साबित हुए हैं।
219 सीटों के साथ, ट्रम्प को एरिजोना, जॉर्जिया, उत्तरी कैरोलिना, विस्कॉन्सिन और नेवादा के हर एक टॉस-अप राज्य को जीतना होगा। यदि ट्रम्प पेंसिल्वेनिया और/या मिशिगन जीतते हैं, तो उनका रास्ता आसान हो जाएगा, जिसका अर्थ है कि उन्हें अभी भी शेष टॉस-अप में से 2-3 की आवश्यकता होगी।
नीचे दिए गए डैशबोर्ड पर एक नज़र डालें। यह देखने के लिए बातचीत करें कि टॉस-अप राज्यों को जीतकर किसी भी उम्मीदवार की जीत का मार्ग कैसा है, और राज्य द्वारा मापी गई भविष्यवाणियों के लिए स्कैटरप्लॉट देखें।
मॉडल पर आधारित मेरी व्यक्तिगत भविष्यवाणियाँ
मुझे उत्तरी कैरोलिना और जॉर्जिया के बारे में ज़्यादा जानकारी है क्योंकि मैंने वहाँ समय बिताया है, और मैं उन्हें ट्रम्प के लिए कह रहा हूँ। एरिजोना, नेवादा या विस्कॉन्सिन के लिए मेरे पास वह जानकारी नहीं है। इसलिए इसे थोड़ी सावधानी से लें। लेकिन विधि के अनुसार, मेरा मॉडल पेंसिल्वेनिया और मिशिगन को हैरिस के लिए कहता है, और मेरा मानना है कि वह कम से कम 2-3 अतिरिक्त स्विंग राज्यों को ले लेगी। मुझे उम्मीद है कि मैं गलत हूँ।
सन्दर्भ:
एमआईटी चुनाव प्रयोगशाला https://electionlab.mit.edu/data#data
यूएसए तथ्य https://usafacts.org/economy/
यूएफ चुनाव लैब https://election.lab.ufl.edu/voter-turnout/
नवंबर 2022 के चुनाव में मतदान और पंजीकरण https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
सीडीसी https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
सीएमएस https://data.cms.gov/provider-data/dataset/avax-cv19
सीडीसी https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
पांच अड़तीस https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
केएफएफ वैक्सीन मॉनिटर https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
यूएफ चुनाव लैब https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
स्वास्थ्य सांख्यिकी का राष्ट्रीय केंद्र https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm सीडीसी https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Census.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlसीडीसी https://www.cdc.gov/covidvaxview/interactive/adults.html
स्वास्थ्य सांख्यिकी का राष्ट्रीय केंद्र https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
जनगणना- गरीबी https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
जनगणना- राज्यवार जनसंख्या परिवर्तन https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
अमेरिकी चुनाव परियोजना https://electproject.github.io/
लेखक से पुनर्प्रकाशित पदार्थ
ए के तहत प्रकाशित क्रिएटिव कॉमन्स एट्रिब्यूशन 4.0 इंटरनेशनल लाइसेंस
पुनर्मुद्रण के लिए, कृपया कैनोनिकल लिंक को मूल पर वापस सेट करें ब्राउनस्टोन संस्थान आलेख एवं लेखक.