人的行为习惯一旦形成，就很难改

人的行为习惯一旦形成，就很难改。这不一定是个坏事，但也不一定是个好事。

尤其是当我们不知不觉被“迎合”，形成了某些习惯，我们要格外警惕。我这里尤其指的是当下算法环境下的习惯养成。

我认为现在推荐算法的核心是“迎合/讨好用户”，尤其是短视频等推荐算法。当然平台似乎也没有理由不这样做，用户是来让APP来“教育”的？到底“谁是谁的爹”？平台没有这样的义务，用户只管“开心”，平台只看“粘性”。

但是对于我们个人而言，我们不得不可考虑，我在平台里的行为会产生怎样的影响？我的行为如何影响我接下来获得的信息以及未来的行为与现在行为之间的联系。

环境与行为的稳定性

当算法不断分析并推送用户喜欢的内容时，行为和偏好逐渐被反馈循环所固化。这种现象可以用数学模型来描述，比如一个简单的动态系统模型：

其中表示用户在步的偏好表示推荐内容的特征是一个介于0和1之间的参数，表示用户行为对过去偏好的延续性。如果值较大，用户的偏好趋于稳定；如果较小，推荐内容对用户偏好的影响较大。

随着时间推移，若推荐算法不断优化迎合用户现有偏好，则会逐渐趋于某个固定点。这种行为固化可能会限制用户接触多样化内容，进而影响用户的认知与选择能力。

稳定行为的延伸与影响

行为的稳定性不仅在算法环境中显现，在学习、生活和决策中也具有类似的模式。例如：

学习：习惯某种学习方式（如视频教程或刷题），可能导致学习模式固化，难以适应其他形式的学习。生活：偏爱某些品牌或生活习惯，可能限制了对其他选择的尝试。选择：决策中偏向已有认知或路径依赖，可能导致错失更优选择。

这种现象可以用马尔科夫链来建模。假设行为状态为，状态转移概率为。如果某些状态的转移概率接近1（如总是选择特定内容），系统会进入吸收态，表现为行为固化。

提升与多样化

如何打破这种固化，提高行为的多样化？一个关键策略是引入干扰项，主动探索多样化的选择。我们可以改进之前的动态系统模型：

其中是一个干扰项，模拟用户主动尝试不同内容控制干扰的强度。当较大时，用户的行为将表现出更多样性。

此外，平台也可以通过算法优化促进多样性。例如，为推荐系统加入多样性权重：

其中表示传统推荐内容表示多样化内容。当增大时，多样化内容的比例提高，用户接触不同信息的机会也随之增加。

行为强化的背后

当然我们也要意识到我们的行为是在“不断被强化”的，当受到一些挫折，一些“苦”的时候，不要轻言退出，我觉得下面这个模型很有启发意义。

设有三个选项（如看视频和，分别对应不同的奖励。最初，对每个选项的偏好相等，因此赋予每个选项一个初始权重。

在每次选择时，选择选项的概率为：

假设选择了选项并获得奖励，则根据以下公式调整该选项的权重：

其中：

为期望水平，可能是所有选项的平均奖励值。

上述模型展示了在行为习惯养成过程中，奖励反馈如何影响选择的偏好。通过不断调整权重，用户的行为逐渐趋向高回报的选项。然而，这种机制同样也可能导致路径依赖，即用户总是选择某些既定选项，忽视其他潜在的高收益选择。

在用户的决策过程中，动态调整奖励水平可以引导其尝试新的选项。具体而言，可在奖励值中加入探索因子：

记录行为模式：通过数据分析了解自身的偏好是否过于单一，找到优化方向。建立外部激励：利用社交圈或外部任务，激发自己突破舒适区。