คณิตศาสตร์ของ "หวย"
"หวย" น่าจะเรียกได้ว่าเป็น "กิจกรรมประจำชาติ" ของไทยอย่างหนึ่งที่เรามาร่วมกันโอดครวญกันเป็นประจำกับการถูกหวยแ-ก หวยไม่เพียงแต่เป็น national pastime ประจำชาติเพียงเท่านั้น แต่ยังมีอิทธิพลเป็นอย่างมากต่อวัฒนธรรม ศาสนา และความเชื่อของเรา และเนื่องจากนี่เป็นเพจวิทยาศาสตร์จึงไม่สามารถปฏิเสธได้ว่าหวยนั้นมีส่วนที่เหนี่ยวรั้งความพัฒนาสู่ scientific literacy ในประเทศเราไม่มากก็น้อย ดั่งที่เราทุกคนน่าจะคุ้นเคยกันดีกับลูกหมูพิการ ต้นกล้วยงอกกลางต้น รวมไปถึงท่อน้ำทิ้งจากส้วมที่แตกและผุดขึ้นมาบนดิน ที่แทบทุกเหตุการณ์ ทุกอุบัติเหตุ ทุกข่าว ทุกปรากฏการณ์ที่เกิดขึ้นในบ้านเมืองนี้จะถูกตีความไปเป็น "ตัวเลข" เสียทั้งหมด
ในวันนี้เราจะมาลองดู "หวย" จากในแง่มุมของคณิตศาสตร์กันดูบ้าง โดยเฉพาะในเรื่องของรางวัล "เลขท้ายสองตัว"
รางวัลเลขท้ายสองตัวนั้นมีความเป็นไปได้ทั้งหมดอยู่ด้วยกัน 100 แบบ โอกาสที่จะถูก จึงมีเพียงแค่หนึ่งในร้อย (ในขณะที่โอกาสที่จะถูกแดกกลับมีถึง 99%) ทั้งนี้ทั้งนั้น นี่มาจากสมมติฐานว่าหวยทุกเลขนั้นมีโอกาสออกเท่ากันหมด ว่าแต่ว่าสมมติฐานนี้เป็นจริงหรือไม่?
จากกราฟบนในภาพ แสดงถึงการกระจายตัวของหวยเลขท้ายสองตัวตลอด 20 ปีที่ผ่านมา[1] ทั้ง "ตัวบน" และ "ตัวล่าง" รวมกันทั้งสิ้น 477 งวด จากการดูคร่าวๆ เราจะพบว่ารางวัลนั้นมีการกระจายตัวที่ค่อนข้างสม่ำเสมอ ไม่มีตัวเลขใดที่เด่นกว่าอย่างเห็นได้ชัดอาจจะมีบางตัวเลขที่ออกเยอะกว่าเลขอื่นบ้างเล็กน้อย แต่ก็ดูเหมือนจะไม่ได้มากจนเกินไป
ในทางสถิตินั้น หากเราต้องการจะทราบว่าข้อมูลชุดหนึ่งมีการกระจายตัวที่สอดคล้องกับการกระจายตัวอย่างสม่ำเสมอ (uniform distribution) หรือไม่ เราสามารถทำได้โดยการคำนวณค่า Pearson's chi-squared test ซึ่งหากเรานำข้อมูลรางวัลเลขท้ายสองตัวตลอด 20 ปีนี้มาคำนวณดู เราจะพบว่า ข้อมูลที่ได้นั้น มีค่า chi-squared อยู่ต่ำกว่า Upper-tail critical values of chi-square distribution ทั้งที่ 95% และ 99% confidence interval สำหรับทั้งตัวบนและตัวล่าง นี่หมายความว่า เราไม่สามารถ reject null hypothesis ได้ และไม่มีหลักฐานเพียงพอที่จะยืนยันว่าข้อมูลชุดนี้มีการกระจายตัวที่ต่างออกไปจาก uniform distribution ด้วยความมั่นใจกว่า 99%
ทั้งนี้ทั้งนั้น นี่ไม่ได้เป็นการยืนยันหรือปฏิเสธว่าหวยมีการล๊อคหรือไม่ เราบอกได้เพียงแค่ว่า เลขที่ออกนั้นมีการกระจายตัวที่ค่อนข้าง uniform และมีโอกาสลงทุกเลขอย่างใกล้เคียงกัน อยู่ที่ว่าเราจะเลือกเลขที่ถูกหรือเปล่า
วิธีหนึ่งที่เราอาจจะเลือกเลขที่จะแทง "หวย" ก็คือการ "สุ่ม" ด้วยตัวเราเองโดยการนึกเลขมั่วๆ ขึ้นมาหนึ่งตัวเลข อย่างไรก็ตาม วิธีนี้นั้นมีปัญหาเป็นอย่างมาก เนื่องจากมีการศึกษามายืนยันเป็นอย่างมาก ว่าสมองของมนุษย์นั้นทำการสุ่มตัวเลขได้ค่อนข้างแย่ และตัวเลขที่เรา "สุ่ม" ขึ้นมาจากหัวนั้น ไม่สามารถเป็นเลขที่เกิดจากการ "สุ่ม" ได้อย่างแท้จริง
กราฟล่างซ้ายของภาพ เป็นกราฟที่ได้มาจาก reddit ที่เก็บข้อมูลที่ผู้เข้าร่วมมา "สุ่ม" ตัวเลขลงบนโซเชียลมีเดียกว่า 6750 ครั้ง จากกราฟเราจะพบว่ากราฟนี้ไม่ได้มีการกระจายตัวที่สม่ำเสมอทุกตัวเลขเท่ากัน ตัวเลขที่ได้รับการ "สุ่ม" มากที่สุดนั้นได้แก่เลข "69" (ด้วยเหตุผลบางประการ) "77" และ "7" ตามลำดับ ซึ่งมากกว่าตัวเลขอื่นอย่างเห็นได้ชัด นอกไปจากนี้ ตัวเลขระหว่าง 1-10 ถูกเลือกมากกว่าตัวเลขอื่นอย่างมีนัยะสำคัญ ซึ่งนี่สอดคล้องกับการศึกษาทางจิตวิทยา และอีกการเก็บข้อมูลหนึ่งที่พบว่าเลข 7 จะถูกเลือกบ่อยที่สุดถึงกว่า 28% เมื่อเราให้คน "สุ่ม" เลขระหว่าง 1-10 ขึ้นมากว่า 8500 ครั้ง[5] เนื่องจากสมองของเรานั้นมีความรู้สึกว่าเลข "7" นั้นควรจะเป็นเลขที่ "สุ่ม" ที่สุด เราจึงเลือกกันแต่เลข 7 จนกลายเป็นเลขที่ไม่สุ่มอีกต่อไป
ซึ่งหากเรานำ Pearson chi-square test มาทดสอบกับข้อมูลชุดนี้ เราจะพบว่าค่า chi-square ที่ได้นั้นเกิน Upper-tail critical values of chi-square distribution ที่ระดับความเชื่อมั่น 90% ไปอย่างไม่เห็นฝุ่น ซึ่งเป็นการแสดงให้เห็นว่าเลขท้ายสองตัวที่ได้จากสมองมนุษย์นั้น ไม่ได้มีการกระจายตัวอย่างสม่ำเสมอเหมือนอย่างที่หวยออกมาจริงๆ
แล้วการที่สมองมนุษย์ไม่สามารถ random เลขออกมาได้อย่างสม่ำเสมอนั้นมันสำคัญตรงไหน? เมื่อสมองมนุษย์ไม่สามารถ generate distribution แบบเดียวกันกับหวยได้ ก็ย่อมหมายความว่าต่อให้คนที่เชื่อว่ามี "สัญชาติญาณ" ดีที่สุดในการ "เดา" หวย ก็เป็นไปไม่ได้ที่จะถูกหวยอย่างต่อเนื่อง เพราะว่าเราไม่มีทางที่จะเดาหวยได้ถูกอย่างต่อเนื่องอย่างสม่ำเสมอ ในเมื่อหวยนั้นออกทุกเลขอย่างสม่ำเสมอ แต่สมองของเรานั้นไม่สามารถสม่ำเสมอได้
ซึ่งนี่นำไปสู่กลวิธีทุดท้ายที่เรามักจะนำมาเป็น "แรงบรรดาลใจ" ในการแทงหวย นั่นก็คือ การมองหาตัวเลขรอบๆ ข้างที่ไม่เกี่ยวกับตัวเราเอง ไม่ว่าจะเป็นจำนวนผู้เสียชีวิต ลำดับประธานาธิปดี เวลาท้องถิ่นขณะที่นายกทุ่มโพเดี้ยม ฯลฯ
อย่างไรก็ตาม วิธีนี้ก็มีปัญหาอีกเช่นกัน.... โดยเจ้าปัญหาที่ว่านี้ รู้จักกันในนามของ Benford's Law[6]
Benford's Law นั้นถูกค้นพบโดยบังเอิญโดย Simon Newcomb ในปี 1881 และอีกครั้งโดย Frank Benford ในปี 1938 โดยในยุคก่อนที่จะมีเครื่องคิดเลขของพวกเขานั้น การหาค่า Logarithm ทำได้โดยการเปิดสมุดเล่มหนาๆ เพื่อหาค่าจากในตาราง โดยนายทั้งสองคนนี้พบว่าหน้าแรกๆ ของสมุด logarithm table ของพวกเขานั้นเปื่อยเร็วกว่าหน้าหลังๆ เป็นอย่างมาก นาย Benford จึงตั้งสมมติฐานว่า ตัวเลขหลักหน้าของค่าที่พบในธรรมชาตินั้นอาจจะมีการกระจายตัวที่ไม่สม่ำเสมอกัน โดยที่ตัวเลขน้อยๆ ควรจะมีการพบได้บ่อยกว่า ตามกราฟแท่งสีน้ำเงินที่ด้านล่างขวาของภาพ และเขาได้ทดสอบกับตัวเลขในธรรมชาติที่ไม่ควรจะมีความเกี่ยวข้องกัน ตั้งแต่ พื้นที่ผิวของแม่น้ำ 335 สาย, ประชากรของเมืองในสหรัฐ 3259 เมือง, ค่าคงที่สากลทางฟิสิกส์กว่า 104 ค่า มวลโมเลกุลกว่า 1800 โมเลกุล, ตัวเลขที่ได้จากคู่มือคณิตศาสตร์กว่า 5000 ตัวเลข, ตัวเลขที่พบในนิตยสาร Reader's Digest กว่า 308 เลข, บ้านเลขที่ของคนกว่า 342 คนที่พบใน American Men of Science และอัตราการเสียชีวิตกว่า 418 อัตรา รวมทั้งหมดนาย Benford ได้นำตัวเลขที่ได้มาแบบสุ่มกว่า 20,229 เลข และพบว่าเลขเหล่านั้นมีตัวเลขหลักหน้ากระจายตัวตาม Benford's Law
กราฟด้านล่างขวา แสดงถึง Benford's Law เทียบกับการกระจายตัวของตัวเลขหลักหน้าของค่าคงที่ทางฟิสิกส์ ซึ่งจะเห็นได้ว่ามีการกระจายตัวสอดคล้องกับ Benford's Law เป็นอย่างมาก นอกไปจากนี้ Benford's Law ยังใช้ได้อยู่ ไม่ว่าเราจะแปลงค่าต่างๆ ที่พบไปเป็นเลขฐานใดๆ หรือหน่วยใดๆ ก็ตาม ตัวอย่างเช่น Benford's Law ทำนายเอาไว้ว่า ตัวเลขกว่า 30.1% จะขึ้นต้นด้วยเลข 1 ซึ่งหากเรานำความสูงของตึกที่สูงที่สุดในโลก 58 ตึก เราจะพบว่าตึกกว่า 41% นั้นมีความสูงในหน่วยเมตรขึ้นต้นด้วยเลข 1 และแม้ว่าเราจะเปลี่ยนหน่วยเป็นหน่วยฟุต เราก็ยังจะพบว่าตึกกว่า 28% นั้นมีความสูงในหน่วยฟุตขึ้นต้นด้วยเลข 1 ซึ่งมากกว่าเลขอื่นใดๆ
แล้วเพราะเหตุใดเราจึงไม่พบเลขในธรรมชาติในจำนวนที่เท่าๆ กันทุกเลข? คำอธิบายที่ง่ายที่สุดก็คงจะเป็นเพราะว่า สิ่งต่างๆ หลายสิ่งในธรรมชาตินั้นมีความสัมพันธ์เชิง logarithm ซึ่งหากเราแปลงเลขในฐานสิบให้อยู่ในสเกลของ logarithm เราจะได้เส้นจำนวนดังภาพล่างขวาในภาพ จากเส้นจำนวนนี้ เราจะพบว่าหากเราจิ้มตำแหน่งโดยสุ่มบนเส้นจำนวนนี้ โอกาสส่วนมากที่สุดนั้นจะตกอยู่ในเลขที่มีหลักนำหน้าเป็น 1 ตามด้วย 2,3,4 ลดหลั่นลงไป ตาม Benford's Law
Benford's Law นี้มีประโยชน์เป็นอย่างยิ่ง ในการตรวจจับการโกง เนื่องจากสมองของมนุษย์นั้นมีความคาดหวังที่จะให้ทุกตัวเลขตกลงเท่าๆ กัน ตัวเลขที่ได้จากการเมคข้อมูลของคนจึงไม่เป็นไปตาม Benford's Law ซึ่งสามารถใช้เป็นหลักฐานบ่งบอกว่ามีอะไรบางอย่างตุกติกเกิดขึ้นในข้อมูล
ตัวอย่างที่ชัดเจนที่สุดตัวอย่างหนึ่งก็คือ ข้อมูลของจำนวนผู้ติดเชื้อ COVID-19 เนื่องจากการติดเชื้อนั้นมีการแพร่กระจายตัวแบบ exponential ตัวเลขจำนวนผู้ติดเชื้อนั้นจึงควรจะเป็นไปตาม Benford's Law ทีมนักวิจัยจึงได้มีการนำตัวเลขจำนวนผู้ติดเชื้อที่รายงานในแต่ละประเทศมาเปรียบเทียบกับ Benford's Law[7] และพบว่าข้อมูลจากประเทศรัสเซียและอิหร่านนั้นไม่เป็นไปตาม Benford's Law ในขณะที่จำนวนผู้ติดเชื้อจาก สหรัฐ บราซิล อินเดีย เปรู อาฟริกาใต้ โคลอมเบีย เม็กซิโก สเปน อาร์เจนตินา ชิลี อังกฤษ ฝรั่งเศส ซาอุ จีน ฟิลิปปินส์ เบลเยี่ยม ปากีสถาน และอิตาลี เป็นไปตาม Benford's Law ไม่ผิดเพี้ยน
ทั้งหมดนี้ก็วกกลับมาที่ปัญหาหลักของการนำค่าที่พบในธรรมชาติมาทำนายหวย: ค่าที่พบในธรรมชาตินั้นไม่ได้มีการกระจายตัวอย่างสม่ำเสมอ แต่หวยนั้นกระจายตัวอย่างสม่ำเสมอ (ซึ่งยังไม่นับกรณีเช่นเอาวันที่ซึ่งไม่มีทางเกิน 31 มาแทง) ตัวเลขที่เราพบในธรรมชาตินั้นจึงเปรียบได้กับลูกเต๋าที่ถูกถ่วงน้ำหนักเอาไว้ให้ได้ค่าต่ำๆ คำถามก็คือ ลูกเต๋าที่ถ่วงน้ำหนักเอาไว้นั้น จะเป็นตัวแทนที่จะทำนายผลของลูกเต๋าที่มาตรฐานได้แม่นจำจริงหรือ?
ทั้งนี้ทั้งนั้น การเล่นหวยหรือไม่เป็นเรื่องของแต่ละบุคคล และถึงแม้ว่าส่วนตัวในฐานะนักวิทยาศาสตร์นั้นจะไม่เห็นด้วยกับเรื่องงมงาย แต่การลงทุนหวยเพียงไม่กี่ร้อย และกับเสี้ยวเวลาเล็กๆ ที่จะได้ลุ้นถึงอนาคตที่ดีขึ้น บางทีก็อาจจะเป็นการลงทุนที่คุ้มค่าสำหรับคนหลายๆ คนก็ได้
หมายเหตุ: บทความนี้เราไม่ได้พูดถึง "โต๊ด" และ Benford's Law นั้นมีผลกับเลขหลักหน้าๆ มากกว่าหลักท้ายๆ แต่คำเตือนนี้ไม่ใช่การใบ้หวย...
อ้างอิง/อ่านเพิ่มเติม:
[1] https://horoscope.thaiorc.com/lottery/stats/lotto-years20.php
[2] https://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test
[3] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3632045/
[4] https://www.reddit.com/r/dataisbeautiful/comments/88m2mj/pick_a_number_from_1100_results_from_6750/
[5] https://www.reddit.com/r/dataisbeautiful/comments/acow6y/asking_over_8500_students_to_pick_a_random_number/
[6] https://en.wikipedia.org/wiki/Benford%27s_law
[7] https://www.researchgate.net/publication/344164702_Is_COVID-19_data_reliable_A_statistical_analysis_with_Benford's_Law
「r squared r」的推薦目錄:
- 關於r squared r 在 มติพล ตั้งมติธรรม Facebook 的最佳解答
- 關於r squared r 在 โปรแกรมเมอร์ไทย Thai programmer Facebook 的最讚貼文
- 關於r squared r 在 米米兒.歐洲精品代購-Mimi. Boutique Facebook 的精選貼文
- 關於r squared r 在 Function to calculate R2 (R-squared) in R - Stack Overflow 的評價
- 關於r squared r 在 R-squared (R2) • performance 的評價
- 關於r squared r 在 What is the adjusted R-squared formula in lm in R and how ... 的評價
r squared r 在 โปรแกรมเมอร์ไทย Thai programmer Facebook 的最讚貼文
วันนี้จะขอรีวิวหนังสือ วิทยาการคำนวณชั้นม. ปลาย
วิชาที่ดึงความรู้ป.ตรีสายไอที
มาปูพื้นฐานให้เด็กๆ ทั่วประเทศได้เรียนกัน
.
ซึ่งวิทยาการคำนวณชั้นม.4-5-6 เรียนอะไร? ....โพสต์นี้มีคำตอบ
👉 ม.4 -> ปูพื้นฐานวิทย์คอม ได้แก่ เรียนแนวคิดเชิงคำนวณ, อัลกอริทึม, การทำโครงงาน
👉 ม.5 -> เรียน data science (วิทยาการข้อมูล หรือวิทยาศาสตร์ข้อมูล)
👉 ม.6 -> จะแนวรวมยำเทคโนโลยีให้น้องๆ รู้จัก ตั้งแต่สอนเป็นบล็อกเกอร์ รู้จัก AI, คลาวด์, IoT, AR, การเป็นพลเมืองดิจิตัล , กฏหมายดิจิตัล, การประกอบอาชีพไอที และอื่นๆ (ไม่ยากนะ)
.
===========
รีวิว ม.4
===========
วิทยาการคำนวณ ม.4 มีจำนวน 3 บท
🔥 +++บทที่ 1 แนวคิดเชิงคำนวณ +++++
บทนี้จะสอนแนวคิดเชิงคำนวณ (Computational Thinking) คืออะไร?
ซึ่งใครไม่รู้จักอาจงงเล็กน้อย ถึงปานกลาง
หรือเกิดคำถามคาใจ เรียนไปใช้ทำอะไรครับคุณครู
.
สำหรับแนวคิดเรื่อง Computational Thinking
(เรียกเป็นภาษาอังกฤษดีกว่า)
มีไว้เพื่อใช้แก้ปัญหาในแวดวง “วิทยาศาสตร์คอมพิวเตอร์” 🤩 🤩
จริงๆ แล้วมันไม่ใช่เรื่องแปลกใหม่แต่อย่างใด
.
ถ้าเราได้นั่งเรียนในระดับมหาวิทยาลัย
หรือได้ฝึกเขียนโปรแกรมไปเรื่อยๆ ก็จะใช้แนวคิดนี้โดยธรรมชาติ
อย่างไม่รู้ตัวอยู่แล้วครับ ไม่ต้องไปเรียนที่ไหน
.
นิยามของ Computational Thinking หรือแนวคิดเชิงคำนวณ
จะประกอบด้วยแนวคิดย่อย 4 อย่างดังนี้
1) Algorithm
2) Decomposition
3) Pattern recognition
4) Abstract thinking
.
หลายละเอียดแต่ละหัวข้อก็ตามนี้
👉 1) Algorithm ชื่อไทย “ขั้นตอนวิธี”
Algorithm คือลำดับขั้นตอนในการแก้ปัญหาหรือการทำงานที่ชัดเจน การคิดค้น อธิบายขั้นตอนวิธีในการแก้ปัญหาต่าง ๆ
.
ถ้าเคยเรียนตอนป.ตรี คงรู้จักคำนี้ดีไม่ต้องอธิบายมาก เช่น
-จะคำนวณหาพื้นที่เส้นรอบวง ต้องมีสเตปคำนวณอย่างไรบ้าง
-จะค้นหาข้อมูลแบบ binary search ต้องมีขั้นตอน 1,2,3 อย่างไรบ้าง
-จะหาเส้นทางที่ใกล้สุดในกราฟ ด้วยวิธี Dijkstra จะมีขั้นตอน 1,2,3 อย่างไรบ้าง
.
👉 2) Decomposition ชื่อไทยคือ “การแยกส่วนประกอบ และการย่อยปัญหา”
.
Decomposition เป็นการพิจารณาเพื่อแบ่งปัญหา หรืองานออกเป็นส่วนย่อย ทำให้สามารถจัดการกับปัญหาหรืองานได้ง่ายขึ้น พูดง่ายๆ เอาปัญหามาแยกย่อยออกเป็นส่วนๆ
.
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
เช่น การเขียนโปรแกรมแยกเป็นส่วนๆ แยกเป็นแพ็กเกจ แยกเป็นโมดูล
หรือทำระบบเป็น services ย่อยๆ หรือมองเป็น layer เป็นต้น
.
👉 3) Pattern recognition ชื่อไทยคือ “การหารูปแบบ”
.
Pattern recognition เป็นทักษะการหาความสัมพันธ์ที่เกี่ยวข้อง แนวโน้ม และลักษณะทั่วไปของสิ่งต่าง ๆ
.
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
เมื่อมีการทำงานของโปรแกรมที่หลากหลายแบบ
แต่ทว่ามีรูปแบบที่แน่นอนซ้ำๆ กัน
เราสามารถยุบโค้ดมาอยู่ในฟังก์ชั่นเดียวกันได้หรือไม่
หรือเขียนเป็นโปรแกรมวนลูป ให้อยู่ในลูปเดียวกัน เป็นต้น
.
👉 4) Abstract thinking ชือไทย “การคิดเชิงนามธรรม”
.
Abstract thinking เป็นกระบวนการคัดแยกคุณลักษณะที่สำคัญออกจากรายละเอียดปลีกย่อย ในปัญหา หรืองานที่กำลังพิจารณา เพื่อให้ได้ข้อมูลที่จำเป็นและเพียงพอในการแก้ปัญหา
⌨ ตัวอย่างการนำไปใช้ตอนเขียนโปรแกรม
-ก็เช่นการใช้ฟังก์ชั่น โดยเราแค่รู้รายละเอียดว่าฟังก์ชั่นทำงานอะไร ต้องการ input/ouput อะไร แล้วได้ return อะไรกลับมา ส่วนเนื้อหาไส้ในละเอียดเรามองไม่เห็น
.
🔥 +++++ บทที่ 2 การแก้ปัญหาและขั้นตอนวิธี +++++++
บททนี้เขาจะปูพื้นฐานอัลกอริทึมให้กับเด็กครับ ได้แก่
2.1 การแก้ปัญหาด้วยคอมพิวเตอร์
2.2 สอนให้รู้จักระบุข้อมูล input, ouput และเงื่อนไขของปัญหา
2.3 สอนการนำแนวคิด Computational Thinking มาออกแบบอัลกอริทึม
มี flow chart โผล่มาเล็กน้อย
2.4 สอนเรื่องการทำซ้ำ หรือก็คือสอนให้รู้จักวนลูปนั่นเอง
2.5 สอนอัลกอริทึมได้แก่ การจัดเรียงและค้นหาข้อมูล
ภาษาอังกฤษก็คือ อัลกอริทึมสำหรับ sort & search
.
🤓 สำหรับเรื่อง sort ก็จะมี
- selection sort (ชื่อไทย การจัดเรียงแบบเลือก)
- insertion sort (ชื่อไทย การจัดเรียงแบบแทรก)
.
🤓 สำหรับเรื่อง search ก็จะมี
-sequential search (ชื่อไทย การค้นหาแบบลำดับ)
-binary search (ชื่อไทย การค้นหาแบบทวีภาค)
.
ลืมบอกไป Big-O ตอนเรียนป.ตรี ก็โผล่ออกมาแว็บๆ นิดหน่อย
เด็กอาจสงสัยมันคืออะไร เป็นญาติอะไรกับ Big-C เปล่าเนี่ย
.
🔥 ++++ บทที่ 3 การพัฒนาโครงงาน ++++
บทนี้ถ้าสรุปสั้นๆ ก็สอนให้เด็กเขียนเสนอโครงงาน
หรือก็คือเขียน proposal เหมือนตอนเรียน ป. ตรีแหละครับ
.
ถ้าใครจำไม่ได้ ก็จะประมาณว่า การเขียนโครงงานต้องมี
บทที่ 1 บทนำ
บทที่ 2 หลักการ ทฤษฏี และงานที่เกียวข้อง
บทที่ 3 วิธีการดำเนินงาน
บทที่ 4 การทดลองและผลการทดลอง
บทที่ 5 สรุปผล วิเคราะห์ และข้อเสนอแนะ
.
===========
รีวิว ม.5
===========
ในวิชา "วิทยาการคำนวณ" ระดับชั้น ม. 5
ได้ดึงวิชา data science (วิทยาศาสตร์ข้อมูล)
มาปูพื้นฐานให้เด็กๆ ได้เรียนกันแล้ว นับว่าเป็นโชคดี
เพราะวิชาพวกนี้เป็นของสูง กว่าจะสัมผัสก็คงตอนป.ตรี โท เอก
ซึ่งผมจะรีวิวเนื้อหาให้อ่านคร่าวๆ เนื้อหาแบ่งเป็น 4 บท
.
👉 ++++ บทที่ 1 - ข้อมูลมีคุณค่า +++++
.
Data science ในตำราเรียนใช้ชื่อไทยว่า "วิทยาการข้อมูล"
บทนี้จะกล่าวถึง Big Data หรือข้อมูลขนาดใหญ่ที่มีค่ามากมาย
และมีบทบาทมากในยุค 4.0 นี้ ทั้งภาครัฐและเอกชน
.
ถ้านึกไม่ออกก็นึกถึงเวลาเราเล่นเนตค้นหาใน Google จะพบข้อมูลมากมายมหาศาล ซึ่งเราสามารถนำมาใช้ในธุรกิจเราได้ ก็เพราะเหตุนี้ศาสตร์ด้านข้อมูล จึงมีบทบาทสำคัญอย่างมากอย่างยิ่งยวด
.
จึงไม่น่าแปลกใจที่ทำให้อาชีพนักวิทยาศาสตร์ด้านข้อมูล (ชื่ออังกฤษ data scientist) มันมีบทบาทสำคัญ และเป็นอาชีพที่มีเสน่ห์และน่าสนใจที่สุดยุคศตวรรษที่ 21
.
Data science ถ้าตามหนังสือเขาให้นิยามว่า
"เป็นการศึกษาถึงกระบวนการ วิธีการ หรือเทคนิค ในการนำข้อมูลจำนวนมหาศาล มาประมวลผล เพื่อให้ได้องค์ความรู้ เข้าใจปรากฏการณ์หรือตีความ ทำนายหรือพยากรณ์ ค้นหารูปแบบหรือแนวโน้มจากข้อมูล
และสามารถนำมาวิเคราะห์ต่อยอดเพื่อแนะนำทางเลือกที่เหมาะสม หรือใช้ในการตัดสินใจเพื่อประโยชน์สูงสุด"
.
สำหรับงาน Data science เขาจะมีกระบวนตามขั้นตอนดังนี้
- ตั้งคำถามที่ตนเองสนใจ
- เก็บรวบรวมข้อมูล
- การสำรวจข้อมูล
- การวิเคราะห์ข้อมูล (analyze the data)
- การสื่อสารและการทำผลลัพธ์ให้เห็นเป็นภาพ (communicate and visualize the results)
.
🤔 นอกจากนี้เขายังพูดถึง design thinking ...ว่าแต่มันคืออะไร?
ต้องบอกว่างานของนักวิทยาศาสตร์ข้อมูล
มันไม่ได้จบแค่เอาข้อมูลที่เราวิเคราะห์ได้แล้ว
มาโชว์ให้คนอื่นเข้าใจ
.
ยังต้องมีขั้นตอนการออกแบบแอพลิชั่น
ที่ต้องใช้ข้อมูลจากที่เราวิเคราะห์ไปนั่นเอง
ซึ่งคำว่า design thinking มันก็คือความคิดยิ่งนักออกแบบดีๆ นี้เอง
ซึ่งนักวิทยาศาสตร์ข้อมูลควรมีไว้เพื่อออกแบบแอพลิชั่นขั้นสุดท้าย
จะได้ตอบสนองความต้องการผู้ใช้
.
👉 ++++ บทที่ 2 การเก็บรวบรวมและสำรวจข้อมูล +++++
.
บทนี้ก็แค่จะปูพื้นฐาน
2.1 การเก็บรวบรวมข้อมูล
ในบทนี้จะพูดถึงข้อมูลที่เป็นลักษณะทุติยภูมิ
ที่หาได้เกลื่อนเน็ต และเราต้องการรวบรวมมาใช้งาน
2.2 การเตรียมข้อมูล (data preparation)
เนื้อหาก็จะมี
-การทำความสะอาดข้อมูล (data cleansing)
-การแปลงข้อมูล (data transformation)
ในม.5 ไม่มีอะไรมาก แต่ถ้าในระดับมหาลัยจะเจอเทคนิคขั้นสูง เช่น PCA
-การเชื่อมโยงข้อมูล (combining data)
2.3 การสำรวจข้อมูล (data exploration)
พูดถึงการใช้กราฟมาสำรวจข้อมูล เช่น
กราฟเส้น ฮิสโทแกรม แผนภาพกล่อง (box plot) แผนภาพแบบกระจาย (scatter plot)
พร้อมยกตัวอย่างการเขียนโปรแกรมดึงข้อมูลออกมาพล็อตเป็นกราฟจากไฟล์ csv (หรือ xls)
2.4 ข้อมูลส่วนบุคคล
สำหรับหัวข้อนี้ ถ้านักวิทยาศาสตร์ข้อมูลจะนำข้อมูลส่วนบุคคลมาใช้งาน ต้องเก็บเป็นความลับ ห้ามหลุด
.
ซึ่งประเด็นข้อมูลส่วนบุคคล ปัจจุบันมีก็มีร่างพรบ. คุ้มครองข้อมูลส่วนบุคคล ออกมาเรียบร้อยแล้ว
.
.
👉 ++++ บทที่ 3 การวิเคราะห์ข้อมูล ++++
.
แบ่งเป็น 2 ส่วน ได้แก่
.
3.1 การวิเคราะห์เชิงพรรณา (descriptive analytics)
เป็นการวิเคราะห์โดยใช้เลขที่เราร่ำเรียนมาตั้งแต่
- การหาสัดส่วนหรือร้อยละ
- การวัดค่ากลางของข้อมูล พวกค่าเฉลี่ย มัธยฐาน ฐานนิยม
- การหาความสัมพันธ์ของชุดข้อมูล (Correlation) พร้อมตัวอย่างการเขียนโปรแกรมให้ดูง่าย
.
.
3.2 การวิเคราะห์เชิงทำนาย (predictive analytics)
.
- มีการพูดถึงการทำนายเชิงตัวเลข (numeric prediction)
- พูดถึงเทคนิคอย่าง linear regression สมการเส้นตรงที่จะเอาไว้ทำนายข้อมูลในอนาคต
รวมทั้งพูดถึงเรื่อง sum of squared errors
ดูว่ากราฟเส้นตรงมันนาบฟิตไปกับข้อมูลหรือยัง (พร้อมตัวอย่างเขียนโปรแกรม)
- สุดท้ายได้กล่าวถึง K-NN (K-Nearest Neighbors: K-NN) เป็นวิธีค้นหาเพื่อนบ้านใกล้เคียงที่สุด K ตัว สำหรับงาน classification (การแบ่งหมวดหมู่)
***หมายเหตุ*****
linear regression กับ K-NN
นี้ก็คืออัลกอริทึมหนึ่งในวิชา machine learning (การเรียนรู้ของเครื่อง สาขาหนึ่งของ AI)
เด็กสมัยเนี่ยได้เรียนแหละนะ
.
.
👉 +++ บทที่ 4 การทำให้ข้อมูลเป็นภาพและสื่อสารด้วยข้อมูล +++
.
บทนี้ไม่อะไรมาก ลองนึกถึงนักวิทยาศาสตร์ หลังวิเคราะห์ข้อมูลอะไรมาเสร็จสรรพ เหลือขั้นสุดท้ายก็คือ การโชว์ให้คนอื่นดูด้วยการทำ data visualization (เรียกทับศัพท์ดีกว่า)
.
ในเนื้อหาก็จะยกตัวอย่างการใช้ แผนภูมิแท่ง,กราฟเส้น, แผนภูมิวงกลม, แผนการกระจาย
.
สุดท้ายที่ขาดไม่ได้ก็คือการเล่าเรื่องจากข้อมูล (data story telling) พร้อมข้อควระวังเวลานำเสนอข้อมูล
.
.
.
***หมายเหตุนี้ ***
😗 ภาษาโปรแกรมที่ตำราเรียน ม.5 กล่าวถึง และยกตัวอย่างมาให้ดู
ก็ได้แก่ python กับภาษา R
.
สำหรับภาษา R หลายคนอาจไม่คุ้น
คนจบไอทีอาจคุ้นกับ python มากกว่า
แต่ใครมาจากสายสถิติจะคุ้นแน่นอน
เพราะภาษา R นิยมมากในสายงานสถิติ
และสามารถนำมาใช้ในงาน data science ได้ง่ายและนิยมไม่แพ้ python
.
แต่ถ้าคนจาก data science จะขยับไปอีกสายหนึ่งของ AI
ก็คือ deep learning (การเรียนรู้เชิงลึก)
python จะนิยมแบบกินขาดครับ
.
===========
รีวิว ม.6
===========
เนื้อหาแบ่งเป็น 4 บท
👉 บทที่ 1 จะออกแนวสอนการเขียนบล็อก เพื่อเป็นบล็อกเกอร์
เนื้อหา ประกอบด้วย
1.1 องค์ประกอบและรูปแบบพื้นฐานในการสื่อสาร
1.1 เทคนิคและวิธีการแบ่งปันข้อมูล
1.1 ข้อควรระวังในการแบ่งปันข้อมูล
👉 บทที่ 2 อันนี้เด็ดดี
2.1 พูดถึงปัญญาประดิษฐ์ (AI), machine learning, deep learning
2.2 พูดถึงการประมวลผลแบบคลาวด์ (clound computing)
2.3 พูดถึง IoT (Internet of Things: IoT) อินเตอร์เน็ตของสรรพสิ่ง มียกตัวอย่าง smart city
2.4 เทคโนโลยีเสมือนจริง กลาวถึงเรื่อง AR ( Augmented Reality: AR) กับ VR (Virtual Reality: VR)
มีแถมเรื่อง block chain กับ quantum computer
.
แต่เนื้อหาเป็นการเกริ่นๆ เฉยๆ ไม่ได้ลงลึกอะไรมากแบบมหาลัยนะครับ
.
👉 บทที่ 3 พูดถึงการเป็นพลเมืองดิจิทัล
เนื้อหาประกอบไปด้วย
3.1 การเป็นพลเมืองดิจิทัล
3.2 การป้องกันตนเองและผู้อื่น
3.3 กฏหมายและมารยาทในสังคมดิจิทัล
.
👉 บทที่ 4 อาชีพในยุคดิจิทัล
เนื้อหาจะประกอบด้วย
4.1 อาชีพด้านเทคโนโลยีสารสนเทศและการสื่อสาร
4.2 การเปลี่ยนแปลงของเทคโนโลยีกับสังคมและอาชีพ
4.3 ผลกระทบของเทคโนโลยีกับอาชีพ
4.4 การทำงานร่วมกับเครื่องจักรและระบบอัตโนมัติ
สรุปแล้วเนื้อหาม.6
ตามความเห็น อ่านแล้วง่าย มันแค่เป็นการอธิบายภาพ
แต่ถ้าเป็นม.4 กับ ม.5 จะหนักกว่าหน่อย
.
ส่วนเนื้อหา ม.1 ม.2 ม.3 เดี่ยวมาเล่าให้ฟัง
แอบกระซิบบอกมี Python ด้วยแหละ
.
.
✍เขียนโดย โปรแกรมเมอร์ไทย thai programmer
👀 อ้างอิง
- วิทยาการคำนวณม.4
- วิทยาการคำนวณม. 5
- วิทยาการคำนวณม.6
.
.
++++++++++++++++++++++++++++=
ทิ้งท้ายในเมื่อ ม.6 มีพูดถึง AI หรือปัญญาประดิษฐ์
เผื่อน้องๆ สนใจอยากศึกษาเชิงลึก เป็นการปูพื้นฐานเรียนต่อมหาลัยจะได้ไม่งง
+++++ขอประชาสัมพันธ์ (ขายของ)
📔 หนังสือ "ปัญญาประดิษฐ์ (AI) ไม่ยาก" เข้าใจได้ด้วยเลขม. ปลาย (เนื้อหาภาษาไทย)
.
ถ้าสนใจสั่งซื้อเล่ม 1 ก็สั่งซื้อได้ที่ (เล่มอื่นๆ กำลังทยอยตามมา)
👉 https://www.mebmarket.com/web/index.php…
.
ขออภัยยังไม่มีเล่มกระดาษจำหน่าย มีแต่ ebook
.
ส่วนตัวอย่างหนังสือ ก็ดูได้ลิงค์นี้
👉 https://www.dropbox.com/s/fg8l38hc0k9b…/chapter_example.pdf…
r squared r 在 米米兒.歐洲精品代購-Mimi. Boutique Facebook 的精選貼文
LV 2020早秋款拿到
柔軟拉絨棉布標準版型剪裁,SQUARED標識logo分飾前後,低調卻不失風格的一件基礎百搭款,官網原價約3萬多台幣、8千多港幣,還是來找我省錢吧😊
客人出貨實拍 喜歡快來私訊我吧🌸💕
💗心動訊息米米兒.您的形象顧問及隨時接收新商品資訊
📍FB訊息傳送門:http://m.me/mimi.eubuyer
📍Line訊息傳送門:https://line.me/R/ti/p/%40yyd1265v
➕lnstagram:mimi.buyer
🔗連結:instagram.com/mimi.buyer
➕FB粉絲頁:米米兒.歐洲精品代購
🔗連結:https://www.facebook.com/mimi.eubuyer/
➕FB社團:MIMI.BOUTIQUE不定期優惠
🔗連結:https://www.facebook.com/groups/2620151577999631/?ref=share
#歡迎發圖詢貨私訊米米兒
#西歐專櫃訂單正貨
#精品#品牌#時尚#LV
r squared r 在 R-squared (R2) • performance 的推薦與評價
The coefficient of determination, denoted R2 and pronounced “R squared”, typically corresponds the proportion of the variance in the dependent variable (the ... ... <看更多>
r squared r 在 What is the adjusted R-squared formula in lm in R and how ... 的推薦與評價
1. What formula does lm in R use for adjusted r-square? As already mentioned, typing summary.lm will give you the code that R uses to calculate adjusted R ... ... <看更多>
r squared r 在 Function to calculate R2 (R-squared) in R - Stack Overflow 的推薦與評價
... <看更多>