By | March 3, 2023

โมเดลการถดถอยแบบปัวซองและส่วนขยาย (ปัวซองที่พองเป็นศูนย์ การถดถอยทวินามเชิงลบ ฯลฯ) ถูกนำมาใช้เพื่อจำลองจำนวนและอัตรา ตัวอย่างของตัวแปรนับ ได้แก่:

– จำนวนคำที่เด็กอายุ 18 เดือนสามารถพูดได้

– จำนวนเหตุการณ์รุนแรงที่ดำเนินการโดยผู้ป่วยในศูนย์ฟื้นฟูผู้ป่วยใจร้อน

ตัวแปรนับส่วนใหญ่เป็นไปตามหนึ่งในการกระจายเหล่านี้ในตระกูลปัวซอง แบบจำลองการถดถอยปัวซองช่วยให้นักวิจัยตรวจสอบความสัมพันธ์ระหว่างตัวทำนายและตัวแปรผลลัพธ์ของการนับ

การใช้แบบจำลองการถดถอยเหล่านี้ให้การประมาณค่าพารามิเตอร์ที่แม่นยำกว่าการพยายามให้พอดีกับแบบจำลองการถดถอยเชิงเส้นธรรมดา ซึ่งสมมติฐานไม่ค่อยจะพอดีกับข้อมูลจำนวน เช่น เศษเหลือปกติและความแปรปรวนคงที่

แต่โมเดลปัวซองจัดการกับอัตราอย่างไร อัตราเป็นเพียงการนับต่อหน่วยเวลา

ตัวอย่างแรกไม่ต้องการอัตรา แต่ตัวอย่างที่สองอาจจะ หากผู้ป่วยทั้งหมดอยู่ในศูนย์ในจำนวนวันที่เท่ากัน อัตรานี้ไม่จำเป็น แต่ถ้ามีการเปลี่ยนแปลงในจำนวนวันที่มีผู้ป่วยแต่ละราย การเข้าร่วมประชุมเองอาจส่งผลต่อการนับ การนับเหตุการณ์ 10 ครั้งจาก 180 วันนั้นน้อยกว่าการนับ 10 ครั้งจาก 15 ครั้ง

แบบจำลองปัวซองจัดการกับตัวแปรการรับแสงโดยใช้พีชคณิตอย่างง่ายเพื่อเปลี่ยนตัวแปรตามจากอัตราเป็นจำนวน

ถ้าอัตราการนับ/การเปิดรับแสง การคูณทั้งสองข้างของสมการด้วยการเปิดรับแสงจะย้ายอัตรานั้นไปทางด้านขวาของสมการ เมื่อทั้งสองด้านของสมการถูกบันทึก แบบจำลองสุดท้ายจะมี ln(แสง) เป็นคำที่เพิ่มเข้าไปในค่าสัมประสิทธิ์การถดถอย ตัวแปรที่บันทึกนี้ ln(exposure) เรียกว่า ตัวแปรชดเชย.

ซอฟต์แวร์สถิติส่วนใหญ่ต้องการให้คุณสร้างตัวแปรที่บันทึกไว้และกำหนดให้เป็นตัวแปรออฟเซ็ต เฉพาะ Stata เท่านั้นที่ให้คุณกำหนดตัวแปรรับแสงหรือออฟเซ็ต

คุณสมบัติที่สำคัญประการหนึ่งของตัวแปรชดเชยคือจำเป็นต้องมีค่าสัมประสิทธิ์เป็น 1 เนื่องจากเป็นส่วนหนึ่งของอัตรา ค่าสัมประสิทธิ์ของ 1 ช่วยให้คุณย้ายค่าสัมประสิทธิ์กลับไปทางด้านซ้ายของสมการในทางทฤษฎีเพื่อเปลี่ยนการนับของคุณกลับเป็นอัตรา

สิ่งนี้หมายความว่าในทางทฤษฎีคือการกำหนดตัวแปรชดเชย คุณกำลังปรับตามจำนวนโอกาสที่เหตุการณ์มีเท่านั้น ข้อสันนิษฐานในที่นี้คือ ตัวอย่างเช่น ทุกวันในสถานบำบัดทำให้ผู้ป่วยมีแนวโน้มที่จะมีเหตุการณ์รุนแรงเท่าๆ กัน แต่ละวันเป็นเพียงโอกาสสำหรับเหตุการณ์ ผู้ป่วยใน 20 วันมีโอกาสเป็นสองเท่าที่จะเกิดเหตุการณ์เป็นผู้ป่วยใน 10 วัน

มีข้อสันนิษฐานว่าโอกาสของเหตุการณ์จะไม่เปลี่ยนแปลงตลอดเวลา ตัวอย่างเช่น หากผู้ป่วยต้องใช้เวลาสองสามสัปดาห์ในการเรียนรู้ผลที่ตามมาของพฤติกรรมก้าวร้าว จากนั้นให้หยุดหรือลดอัตราของพวกเขาลง เวลาก็ไม่ใช่แค่เรื่องของความเสี่ยงเท่านั้น ในทำนองเดียวกัน หากผู้ป่วยเริ่มมีอาการกระวนกระวายมากขึ้นหลังจากอยู่ในโปรแกรมหลังจากผ่านไปสองสามเดือน ดังนั้นการที่ผู้ป่วยอยู่ได้นานขึ้นจึงยิ่งทำให้เกิดความก้าวร้าวมากขึ้น ดังนั้นเวลาจึงไม่ใช่แค่เรื่องของการสัมผัสเท่านั้น ในทั้งสองกรณีนี้ จำนวนวันในโปรแกรมจะทำหน้าที่เป็นตัวทำนายได้ดีกว่าตัวแปรการรับแสง ในฐานะตัวทำนาย ค่าสัมประสิทธิ์จะถูกประมาณจากข้อมูล ไม่ใช่ตั้งค่าเป็น 1

ตรรกะนี้สามารถขยายไปยังแบบจำลองการถดถอยใดๆ ที่มีอัตราส่วนเป็นตัวแปรตาม ตรวจสอบให้แน่ใจว่าคุณเข้าใจความหมายโดยนัยว่าตัวส่วนของอัตราส่วนนั้นไม่ส่งผลต่อตัวเศษเกินโอกาส