Dalam artikel ini, kita akan membahas tentang algoritme baru yang dikembangkan oleh para peneliti untuk memenangkan permainan poker. Algoritme tersebut dikenal sebagai Counterfactual Regret Minimization (CFR) dan telah digunakan dalam Annual Computer Poker Competition sejak tahun 2006.
Algoritme CFR ini bekerja dengan cara menghitung semua keputusan yang dapat diambil sebelumnya, sehingga mereka hanya perlu dicari ketika permainan sedang berlangsung. Proses pembelajaran algoritme inilah yang membuat program menjadi sangat kuat dan dapat menangkan permainan poker.
Dalam proyek ini, Bowling dan koleganya mengembangkan CFR dengan cara membolehkan algoritme tersebut untuk menyelesaikan kembali keputusan yang dianggap buruk dalam tahap pelatihan awal. Kualitas data juga menjadi salah satu faktor penting, karena CFR memerlukan disk storage sebesar 262 terabytes. Oleh karena itu, para peneliti telah mengembangkan metode kompresi data yang dapat menurunkan volume data tersebut menjadi 11 TB, dengan tambahan hanya 5% pada waktu komputasi.
“Saya pikir algoritme CFR adalah majuannya,” kata Jonathan Shapiro, seorang ilmuwan komputer dari Universitas Manchester. “Namun, mereka telah melakukan beberapa hal yang sangat cerdas untuk membuat masalah ini menjadi lebih mudah diproses.”
Walaupun algoritme CFR ini dapat memenangkan permainan poker, namun tidak berarti bahwa ia tidak memiliki batasan. Salah satu kekurangan adalah bahwa ia hanya dapat menang kalau strategi telah dimainkan sejak awal, dan tidak jika pemain komputer tiba-tiba di tengah game. Kekurangan lainnya adalah bahwa CFR hanya dapat menang dalam jangka waktu yang relatif panjang, sehingga ada kemungkinan kekalahan dalam jumlah tertentu.
Namun, CFR juga memiliki beberapa kelebihan. Misalnya, ia tidak memerlukan disk storage sebesar 262 terabytes, karena metode kompresi data yang dikembangkan dapat menurunkan volume data tersebut menjadi 11 TB. Selain itu, CFR juga dapat membantu dalam mengoptimalkan risk measure (seperti value-at-risk) untuk keputusan investasi.
Sementara CFR ini hanya digunakan untuk permainan poker, namun ide-ide yang dikembangkan oleh para peneliti dapat diterapkan pada game lain yang memiliki informasi tidak sempurna. Misalnya, CFR dapat membantu dalam mengoptimalkan portfolio management dan membantu dalam mengambil keputusan medis.
Dalam artikel ini, kita telah membahas tentang algoritme baru untuk memenangkan permainan poker. Algoritme CFR ini menunjukkan bahwa dengan menggunakan teknik machine learning, kita dapat membuat program yang sangat kuat dan dapat menangkan permainan poker. Namun, CFR juga memiliki beberapa kekurangan, seperti hanya dapat menang dalam jangka waktu yang relatif panjang dan tidak dapat mengoptimalkan risk measure.
Referensi:
- Bowling, M., Burch, N., Johanson, M. & Tammelin, O. Science 347, 145-149 (2015).
- Schaeffer, J. et al., Science 317, 1518-1522 (2007).