IA Poker - ใครชนะบ้าง

0 คอมเมนต์

ตอนนี้เป็นเวลายี่สิบปีนับตั้งแต่การแข่งขันที่มีชื่อเสียงระหว่างหมากรุกโลก Garry Kasparov และ Deep Blue - ซุปเปอร์คอมพิวเตอร์ของไอบีเอ็ม คาสปารอฟ สูญหาย ถึง Deep Blue - และกล่าวหาว่าคอมพิวเตอร์ถูกควบคุมโดยหัวหน้าหมากรุกของมนุษย์ ในสาระสำคัญ Kasparov เรียกว่า shenanigans หัวหน้าหมากรุกปฏิเสธที่จะเชื่อว่าเครื่องคำนวณที่เย็นชาสามารถเอาชนะเหตุผลความคิดความเป็นมนุษย์ ความจริงก็คือมันเป็นไปได้มากที่สุดเนื่องจากการคำนวณธรรมชาติของ Deep Blue ที่เครื่องจักรนั้นสามารถเอาชนะมนุษย์ได้

Deep Blue ไม่ได้มีความสามารถในการสร้างสรรค์หรือใช้รูปแบบของการให้เหตุผล "ตรัสรู้" - สิ่งที่มักจะจบลงด้วยการรบกวนการตัดสิน Deep Blue คือทั้งหมดที่เกี่ยวกับการใช้กฎของเกมหมากรุกในวิธีที่เหมาะสมที่สุดเท่าที่จะเป็นไปได้เพื่อให้ได้ผลลัพธ์ที่แน่นอน ประสิทธิภาพและชัยชนะที่ตามมาของ Deep Blue ประกาศถึงรุ่งอรุณแห่งยุคใหม่: อายุของปัญญาประดิษฐ์และความสามารถในการชิงไหวชิงพริบชิงไหวชิงพริบและมนุษยชาติ

Deep Blue รวบรวมข้อมูลในยุคข้อมูลขนาดใหญ่

การกำหนดที่ถูกที่สุด

แม้จะประสบความสำเร็จอย่างน่าประหลาดใจของ Deep Blue - มีเกมที่ทำให้เกิดรอยขีดข่วนที่ศีรษะ แม้แต่หัวเหมือนเครื่องจักร หนึ่งในนั้นคือเกม StarCraft ซึ่งเป็นเกมวางแผนแบบเรียลไทม์ที่เกี่ยวข้องกับการพัฒนาฐานทัพทหารของผู้เล่นและการโจมตีครั้งต่อไปของผู้เล่นอื่น สตาร์คราฟต์เป็นเกม eSports ครั้งแรกที่เคยมีมาและนักวิจัยที่ทำงานให้กับยักษ์ใหญ่อย่าง Facebook และ Microsoft ได้ตีพิมพ์เอกสารที่เกี่ยวข้องกับสตาร์คราฟต์และ AI ไม่สามารถที่จะถอดรหัสงานภายในของเกมได้ .

เครื่องจักรรู้ได้อย่างไรเมื่อต้องโฮลด์เอม?

เห็นได้ชัดว่าคำตอบคือใช่ นักพัฒนา AI DeepStack ได้พัฒนาปัญญาประดิษฐ์ที่สามารถแข่งขันกับธุรกิจโป๊กเกอร์ที่ดีที่สุด (คน) ความลับสู่ความสำเร็จของ DeepStack? การเรียนรู้ของเครื่องลึก DML เลียนแบบสมองมนุษย์ในกระบวนการคิดขั้นพื้นฐานและในสาระสำคัญทำให้เครื่องจักรสามารถสอนเทคนิคใหม่ ๆ ได้

ลักษณะที่แท้จริงของ Texas Hold'em Poker นั้นขึ้นอยู่กับคุณสมบัติของมนุษย์โดยสัญชาตญาณ เห็นได้ชัดว่ามีการค้นพบรุ่นเครื่องจักรกลในการขยับออกห่างจากกลยุทธ์ก่อนหน้านี้ที่ใช้โดยระบบ AI ที่เกี่ยวข้องกับการพยายามคำนวณทุกขั้นตอนสำหรับส่วนที่เหลือของเกม - และแทนที่จะทำตามขั้นตอนต่อไปเพียงไม่กี่ขั้นตอน

วิธี AI แบบใหม่ในการทำสิ่งต่าง ๆ (เช่นเดียวกับ DeepStack) เกี่ยวข้องกับการคำนวณอัลกอริทึมและกลยุทธ์ในอนาคตอย่างต่อเนื่องเมื่อมีข้อมูลใหม่ DeepStack สอนทักษะเฉพาะนี้ให้แก่ผู้ที่ถ่อมตนอย่างไร? โดยการขว้างสถานการณ์เกมโป๊กเกอร์แบบสุ่มมากกว่า 10 000

ล้างบาปด้วยไฟ

ใน 2016 สหพันธ์โป๊กเกอร์นานาชาติคัดเลือกผู้เล่นโป๊กเกอร์มืออาชีพสามสิบสามคนและรับมือกับกลยุทธ์ของ DeepStack หลังจากแยกอินสแตนซ์ที่โชคนำไปสู่การชนะจากอินสแตนซ์ของกลยุทธ์แล้วถึงข้อสรุป: อัตราการชนะของ DeepStack มามากกว่า 10 เท่าของสิ่งที่ผู้เล่นมืออาชีพคิดว่าเป็นกำไรที่เหมาะสม

ข้อสรุปและข้อค้นพบเห็นด้วยกับความสำเร็จที่ผ่านมาของ Libratus ซึ่งเป็น AI เล่นโป๊กเกอร์และผลิตผลของนักวิจัยที่ Carnegie Mellon University ใน Pittsburg Libratus เพิ่มขึ้นเมื่อเทียบกับมืออาชีพเท็กซัสโฮลเด็มโป๊กเกอร์ที่ดีที่สุดในโลกจำนวนหนึ่งในมือ 120,000 แฮนด์ของโป๊กเกอร์ Libratus แยกออกสี่คน

ดงคิมเป็นหนึ่งในผู้เล่นที่ฉลาดกว่าเครื่องจักรรายงานหลังจากนั้นครึ่งทางเขาเริ่มสงสัยว่าจริง ๆ แล้ว Libratus สามารถเห็นไพ่ของเขาได้ เขากล่าวต่อไปว่าเขาไม่ได้กล่าวโทษ Libratus ว่าเป็นการโกงต่อ se แต่ AI นั้นดีอย่างนั้น

พวกเราหลายคน

คนที่ร่าเริงของ Carnegie Mellon ดูเหมือนจะไม่กระตือรือร้นที่จะเปิดเผยมากเกี่ยวกับ Libratus หรือการทำงานด้านในของการตัดสินใจในระหว่างการยืนออก แต่มันถูกเปิดเผยในภายหลังว่า Libratus ไม่ใช่ AI เอกพจน์ - แต่แทนที่จะอาศัยสาม - ระบบง่ามทำงานร่วมกันเพื่อบรรลุเป้าหมายร่วมกัน

อาศัยการเรียนรู้การเสริมแรงเป็นหลักวิธีการทดลองและข้อผิดพลาด Libratus ประสบความสำเร็จโดยการเล่นเกมหลังจากเกมกับตัวเอง การเริ่มต้นมันไม่รู้อะไรเลยเกี่ยวกับกลยุทธ์พิเศษของโป๊กเกอร์หรืออะไรทำนองนั้น - มันทำให้รู้ว่ากฎของเกมคืออะไร ด้วยการเล่นซ้ำ ๆ กับตัวเองภายในกรอบของเครือข่ายสามเท่าของมันมันจะทำการสำรวจทุกเส้นทางที่เป็นไปได้และการรวมกัน - ดังนั้นการเตรียมตัวเองให้สำเร็จสำหรับงานก่อนหน้านี้

ในความเป็นธรรมทั้งหมดจะต้องมีการกล่าวถึงว่า Libratus ได้รับรางวัลจากผลประโยชน์ของความสามารถในการรับสถานการณ์เช่นเดิมทุกเย็นหลังจากรอบของวัน

ถึงกระนั้นทุกสิ่งเท่ากัน Libratus ก็ทำได้ดีกว่าความคาดหวังของผู้สร้างมนุษย์

Spin Palace ไม่มีโบนัสคาสิโนฝาก >>


ที่มา: spinpalace.com
IA Poker - ใครชนะบ้าง Updated: มิถุนายน 18, 2019 ผู้แต่ง: เดมอน