Dalam dunia permainan kartu online, poker adalah salah satu jenis permainan yang paling populer. Dalam beberapa tahun terakhir, teknologi komputer telah menjadi semakin canggih dan mampu memainkan permainan poker dengan sangat baik. Salah satu contoh ialah algoritma CFR (Counterfactual Regret Minimization) yang dikembangkan oleh Bowling dan timnya.
Algoritma CFR ini mampu menyelesaikan permainan poker dengan cara menghitung semua kemungkinan keputusan sebelumnya, sehingga dapat hanya diunduh sebagai game berjalan. Proses belajar ini dimulai dengan membuat keputusan secara acak dan kemudian diperbarui oleh pengalaman sebagai algoritma menempelkan nilai "regret" pada setiap keputusan bergantung pada seberapa buruknya performanya. Hal ini memerlukan lebih dari 1500 putaran pelatihan untuk membuat program hampir tak terbunuh.
Prosedur CFR ini telah diadopsi secara luas dalam Annual Computer Poker Competition, yang telah berlangsung sejak tahun 2006. Namun, Bowling dan timnya kini telah meningkatkan prosedur ini dengan memungkinkan algoritma untuk memulihkan keputusan yang dianggap buruk pada putaran pelatihan sebelumnya.
Inovasi lain adalah pengelolaan informasi yang sangat besar yang diperlukan untuk mengembangkan dan menggunakan strategi – sekitar 262 terabytes. Volume data ini memerlukan penyimpanan disk, yang lambat untuk diakses. Tim peneliti telah menemukan metode kompresi data yang mengurangi volume menjadi 11 TB, dan yang hanya menambahkan 5% waktu komputasi karena penggunaan penyimpanan disk.
"I think the counterfactual regret algorithm is the major advance," kata ilmuwan komputer Jonathan Shapiro dari University of Manchester. "But they have done several other very clever things to make this problem computational feasible."
Meskipun algoritma ini bermain "perfectly", itu tidak secara mutlak tak terbunuh, karena ada unsur keberuntungan yang sangat besar dalam permainan poker: bergantung pada kartu yang Anda dapatkan. Algoritma "may in fact lose after any finite number of hands, if it were unlucky," kata Bowling. Namun, selalu menang di jangka panjang.
Ada dua batasan lainnya. Hanya "weakly" mengatasi HULHE, artinya strategi ini bermain perfect hanya jika strategi telah dimainkan sejak awal, dan tidak jika pemain komputer tiba-tiba terjun ke tengah permainan (situasi yang sebenarnya tidak jelas definisi untuk poker, seperti checker).
Dan itu hanya "essentially solved", artinya bukan tak terbunuh secara mutlak: ada margin sangat kecil oleh mana, dalam teori, dapat dikalahkan oleh kemampuan daripada keberuntungan. Namun, margin ini praktis tidak signifikan. "Even if a human could identify the perfect counter-strategy to exploit our solution," kata Bowling, "and even if they could play this counter-strategy without error, and even if they spent 70 years only playing poker (over 60 million hands), they still couldn't be statistically confident that they are winning [by superior play rather than chance]."
Ada debat panas tentang penggunaan komputer (bot poker) untuk permainan online. "For quite a while now there has been a struggle between people who write bots and try to get them to play surreptitiously on online sites, and the sites who try to detect them and ban them," kata Jackson. Namun, Bowling mengatakan bahwa algoritma ini tidak memiliki efek langsung pada debat ini, karena popularitas permainan online HULHE telah menurun sejak pemain manusia menjadi lebih baik. "While it may dry up the last vestige of online HULHE play just due to the perception that humans can query a perfect strategy, this impact is going to be minimal," katanya.
Namun, ide-ide dalam kertas ini akan diterapkan dengan sangat baik pada bentuk permainan poker lainnya, seperti no-limit. Dan lebih umum lagi, pada game-game lain yang memiliki informasi tidak sempurna.