666slotclubศาสตร์มืดทางสถิติเป็นอันตรายต่อประชาธิปไตย — และชีวิต

666slotclubศาสตร์มืดทางสถิติเป็นอันตรายต่อประชาธิปไตย — และชีวิต

Calling Bullshit: ศิลปะแห่งความสงสัย

ในโลกที่ขับเคลื่อนด้วยข้อมูล Carl T. Bergstrom และ Jevin D. West Allen Lane (2020)

“โลกเต็มไปด้วยเรื่องไร้สาระ666slotclub และเรากำลังจมอยู่ในนั้น … หนังสือเล่มนี้เป็นความพยายามของเราที่จะต่อสู้กลับ” ดังนั้น จึงเริ่มต้นการอธิบายอย่างกระตือรือร้นว่าภาษาของวิทยาศาสตร์สามารถใช้เป็นอาวุธเพื่อหลอกล่อทั้งนักวิจัยและสาธารณชนได้อย่างไร ผู้เขียนเป็นสองความหายนะของ ‘infodemic’ ในปัจจุบันคือ Carl Bergstrom และ Jevin West

ทั้งสองรู้สึกทึ่งกับการติดเชื้อ — ของความคิด โรค บรรทัดฐาน ข้อมูล และข้อมูลเท็จ Bergstrom เป็นนักชีววิทยาด้านวิวัฒนาการ West เป็นนักวิทยาศาสตร์ด้านข้อมูล ในปี 2550 พวกเขาก่อตั้งโครงการ Eigenfactor เพื่อทำแผนที่อิทธิพลของวารสาร เอกสาร และผู้แต่ง ทศวรรษต่อมา พวกเขาได้พัฒนาหลักสูตรในการจำแนกเทคนิคเชิงปริมาณ Calling Bullshit — เขียนขึ้นก่อนการระบาดของโคโรนาไวรัส — เป็นเวอร์ชันหนึ่งของหลักสูตรนั้น เชื่อมโยงไปถึงในเวลาที่การรู้วิธีนำทางข้อมูลไม่เคยมีความสำคัญมากไปกว่านี้

เป้าหมายของพวกเขาคือการใช้เล่ห์เหลี่ยมทางสถิติ: “ภาษา ตัวเลขทางสถิติ กราฟิกข้อมูล และรูปแบบอื่นๆ ของการนำเสนอที่มีจุดประสงค์เพื่อเกลี้ยกล่อมหรือสร้างความประทับใจให้ผู้ฟังโดยการเบี่ยงเบนความสนใจ ครอบงำ หรือข่มขู่พวกเขาด้วยการเพิกเฉยต่อความจริงอย่างโจ่งแจ้ง การเชื่อมโยงกันทางตรรกะ หรือข้อมูลใดที่เป็นจริง กำลังถูกถ่ายทอด” ให้ข้อมูลและไม่น่าเบื่อ งานแห่งความรักนี้เผยให้เห็นอคติในการเลือกที่อุดมสมบูรณ์ การสร้างภาพข้อมูลที่ทำให้เข้าใจผิด อุบัติเหตุจากการเรียนรู้ด้วยเครื่อง และอื่นๆ

การฉ้อโกง อคติ ความประมาทเลินเล่อ

 และโฆษณาเกินจริงในห้องแล็บ — แกลเลอรีของเหล่าอันธพาล

ตัวอย่าง ได้แก่ การบลัฟโดยตั๊กแตนตำข้าว การฉ้อโกงที่น่าอับอายของแพทย์ Andrew Wakefield เกี่ยวกับความเชื่อมโยงระหว่างการฉีดวัคซีนกับออทิสติกที่ไม่มีอยู่จริง ปรากฏการณ์ที่น่ากังวลของวิดีโอ ‘deepfake’; ความสัมพันธ์ที่หลอกลวงระหว่างลักษณะใบหน้าและความผิดทางอาญา ความถูกต้องที่ไม่มีเงื่อนไขของการทดสอบมาร์ชเมลโลว์ การวัดความมุ่งมั่นที่คาดคะเน; และประสิทธิผลที่น่าสงสัยของโปรแกรมสุขภาพ แม้แต่นักวิจัยที่มีประสบการณ์ก็จะมีช่วงเวลา ‘aha’ ตัวเลขมากกว่า 100 ตัวเน้นย้ำแนวทางที่เป็นรูปธรรมและไร้สาระของผู้เขียน

ยังมีโอกาสพลาด สิ่งสำคัญที่สุดคือการอ้างอิงต่ำกว่าพาร์ ผู้เขียนยืนยันว่า ในการตรวจสอบการเรียกร้อง เราต้อง “ขุดหาแหล่งที่มา” แล้วทำไม Calling Bullshit ถึงไม่ใช้เชิงอรรถอ้างอิง? แต่จะนำเสนอรายการวรรณกรรมที่เรียงตามตัวอักษรเฉพาะบทและโอกาสที่คาดเดาไม่ได้ว่าการอ้างอิงใดเกี่ยวข้องกับสิ่งใด การกล่าวอ้างเช่น “คนส่วนใหญ่คิดว่าพวกเขาค่อนข้างเก่งในการจำเรื่องเหลวไหล” อาจไม่ได้รับการสนับสนุนจากการวิจัยเชิงประจักษ์ใดๆ เป็นการยากที่จะบอกได้ (ฉันไม่พบข้อมูลอ้างอิงในรายการ) ไม่มีรายการตัวเลข แล้วเราจะประเมินกราฟได้อย่างไรที่บอกว่าประมาณปี 2544 ช่องโทรทัศน์ Fox News และ CNN มีแนวความคิดที่คล้ายคลึงกัน – นี่อาจเป็น balderdash หรือไม่? ในกรณีนั้น เอกสารต้นทางจะแสดงอยู่ที่ด้านหลังหนังสือ แต่ฉันสงสัยว่าจะมีสักกี่คนที่ค้นหามัน

โอกาสที่พลาดอีกประการหนึ่งเกี่ยวข้องกับการแสดงข้อมูลเป็นภาพ ผู้เขียนเน้นย้ำถึงศักยภาพในการทำให้เข้าใจผิดโดยการพลิกแกน ซูมเข้ามากเกินไป ซูมออกมากเกินไป หรือไม่สนใจอัตราฐาน ตัวอย่างนี้แสดงให้เห็นด้วยโครงเรื่องที่แสดงให้เห็นว่าผู้ขับขี่อายุ 20-24 ปีเสียชีวิตจากอุบัติเหตุทางรถยนต์มากกว่าผู้ขับขี่อายุ 16-19 ปี พวกเขาชี้ให้เห็นว่าสิ่งนี้เพิกเฉยต่อความจริงที่ว่ากลุ่มแรกขับเคลื่อนมากกว่ากลุ่มที่สอง กลุ่มน้องมีอุบัติเหตุร้ายแรงถึงสองเท่าต่อไมล์ที่ขับเคลื่อนด้วย

นักวิทยาศาสตร์ลุกขึ้นต่อต้านความสำคัญทางสถิติ

สิ่งที่ Bergstrom และ West ล้มเหลวในการแสดงก็คือ หากดำเนินการอย่างถูกต้อง การสร้างภาพข้อมูลยังสามารถเป็นเครื่องมือที่ยอดเยี่ยมสำหรับการหลีกเลี่ยงการถูกเข้าใจผิด ตัวอย่างเช่น เมื่อนักวิจัยอ้างความเชื่อมโยงระหว่างตัวแปรสองตัว แนวทางปฏิบัติที่ดีในการแสดงแผนภาพกระจายของจุดข้อมูล มิฉะนั้น แทบจะเป็นไปไม่ได้เลยที่จะประเมินว่าความสัมพันธ์ที่อ้างสิทธิ์นั้นอาจเป็นแบบไม่เชิงเส้น หรือเป็นผลมาจากค่าผิดปกติ หรือเกิดจากคลัสเตอร์ที่ไม่คาดคิด เพื่อถอดความนักสถิติ Frederick Mosteller: แม้ว่าการโกหกด้วยการแสดงข้อมูลเป็นภาพเป็นเรื่องง่าย แต่ก็ง่ายกว่าที่จะโกหกโดยปราศจากมัน

ในที่สุดสัตว์เลี้ยงฉี่ Bergstrom และ West คร่ำครวญว่า “นักวิทยาศาสตร์ติดอยู่กับค่า p เพราะพวกเขาไม่มีวิธีที่ดีในการคำนวณความน่าจะเป็นของสมมติฐานทางเลือก” สิ่งนี้ละเว้นวิธีการทางสถิติทางเลือก: การเปรียบเทียบแบบจำลองเบย์ ความท้าทายยังคงมีอยู่ แต่อย่างน้อยชาวเบย์เซียนก็พยายามหาคำตอบโดยประมาณสำหรับคำถามที่ถูกต้อง แทนที่จะต้องดิ้นรนเพื่อตีความคำตอบที่ถูกต้องของคำถามที่ผิด

ทั้งหมดที่กล่าวมา หนังสือเล่มนี้จะฝึกผู้อ่านให้เข้าใจเชิงสถิติในช่วงเวลาที่ภูมิคุ้มกันต่อข้อมูลที่ผิดเป็นสิ่งสำคัญ: ไม่ใช่แค่เพื่อความอยู่รอดของระบอบเสรีประชาธิปไตยตามที่ผู้เขียนยืนยัน แต่เพื่อความอยู่รอดด้วยตัวมันเอง บางทีหลักสูตรความผิดพลาดในการตรวจจับเรื่องเหลวไหลควรเป็นส่วนบังคับของหลักสูตรของโรงเรียน666slotclub