Нейромережа, розроблена фахівцями компаній OpenAI і DeepMind, які є частиною Google, перевершила людей в серії класичних ігор на приставки Atari 2600, популярної 40 років тому. Так, хоч і геймплейна складова досить примітивна, і все ж, нейромережа навчилася перемагати будь-якої людини в цій грі. Таке не під силу нікому.
Нейромережа створювалася за принципами глибокого навчання з підкріпленням. Завдяки спостереженню і навчання на показових матчах, нейромережа навчилася використовувати різні прийоми, щоб обігравати живих супротивників. Фахівці об'єднали дві концепції, щоб досягти надлюдською продуктивності ігрового ІІ. За допомогою спеціальних функцій винагороди вчені направляли процес навчання в режимі реального часу, а саме навчання займало не так багато часу за рахунок пропускної здатності нейромережі. Часу було потрібно в два рази менше, ніж людині.
Модель складалася з двох частин: нейромережі Q-Learning, яку DeepMind використовувала в попередніх дослідженнях з іграми на Atari 2600 і сверточной нейронної мережі, що навчаються на прикладах, представлених або людиною, або комп'ютером, що створюють їх, пише VentureBeat.