Понятно, как в ходе эволюции появились существа, стремящиеся максимизировать продолжительность жизни. Ибо индивидуальное выживание связано с выживанием вида.
Но не совсем понятно, как появились существа, стремящиеся максимизировать удовольствие, в том числе отложенное. В том числе такое, ради которого надо пройти через неудовольствие.
Иными словами, если во Вселенной все камни скатываются в потенциальные ямы, то всё равно непонятно, почему со временем должны появиться камни, которые могут находить не локальные а глобальные экстремумы.
Интересно, есть ли компьютерные самообучающиеся модели, в которых эмулированное существо способно испытывать удовольствие (застревать в некоторых состояниях, вызванных определёнными разражители) и неудовольствие (стараться прекратить некоторые состояния, вызванные другими разражителями), и которые в эксперименте показывают, что со временем оно научается стремиться и к отложенным удовольствиям?