How General Are Measures of Choice Consistency? Evidence from Experimental and Scanner Data
创建于 更新于
摘要
本报告综合运用实验数据和超市扫描数据,研究了不同环境下决策者的选择一致性度量的普适性。结果显示,实验中的风险决策一致性与超市购买行为一致性无显著相关性,但实验内不同任务之间的一致性得分中度相关,超市内不同消费类别及时间段的一致性得分相关性较低且不稳定,体现了选择一致性可能是一个多维度的能力集合。这对理解个体决策质量的多样性及其经济应用具有重要意义 [page::0][page::4][page::10][page::14][page::26].
速读内容
一致性指标的定义与测量 [page::5][page::6]
- 利用临界成本效率指数(CCEI)、Houtman-Maks指数(HMI)、金钱泵指数(MPI)和最小成本指数(MCI)等多种指标衡量决策数据是否符合GARP。
- CCEI接近1表示完美满足效用最大化假设,数值越低则一致性越差。
- 多个指标高度相关,验证了测量一致性的稳健性。
实验与超市扫描数据概况 [page::7][page::8]
- 超市数据覆盖4类主要消费品,重点分析肉类和蔬菜的24个月购买记录,样本规模达6144名高频消费者。
- 设计两项现场实验,通过预算约束任务测量参与者在风险、社会和食品决策中的选择一致性。
- 实验采用统一预算线、22轮决策设计,确保不同参与者间测试结果可比。
实验与扫描数据选择一致性差异分析 [page::10][page::12][page::13]
- 实验风险任务中的CCEI均值为0.941,模拟随机选择的CCEI显著较低,说明实验选择具有较强的一致性。
- 超市扫描数据CCEI均值0.946,模拟随机分配得分显著较低,表明扫描数据选择也非随机。
- 两者选择一致性之间的相关性极低,表明实验中高一致性的参与者在超市购买中不一定表现一致性。
- 一致性指标间在各自数据内相关性较高,支持以CCEI为主分析指标。

实验内部任务一致性与超市不同类别时间一致性分析 [page::14][page::15][page::16]
- 实验2中风险任务与社会任务和食品任务之间的CCEI得分中度相关(0.412和0.305),社会与食品任务相关度较低(0.254)。
- 超市数据中不同食品类别之间及不同时间段的选择一致性相关性普遍较低(0.096~0.173不等)。
- 表明一致性在相似任务或环境中可部分泛化,但跨环境或类别的泛化能力受限。
鲁棒性与机制检验 [page::16][page::17][page::18][page::19][page::20]
- 采用多种一致性指标、考虑预算检测能力、施加合理偏好假设,结果依旧稳定。
- 实验参与者中约77%被判定为近似效用最大化,而超市扫描数据仅约22%-30%满足这一标准,表明超市决策更富随机性。
- 预算约束构建与环境差异导致测量误差,超市预算线由实际观测转换而来,细节复杂且受消费者记忆、价格策略等影响。
决策一致性影响因素分析 [page::21][page::22][page::23][page::24][page::25]
- 超市消费一致性受季节、促销折扣、用餐时段等情境影响;实验中一致性受学习效果和认知能力影响。
- 受访者个体特征影响一致性:认知能力(IQ)正向影响实验任务的一致性,购物经验提升超市消费一致性。
- 实验中存在启发式规则使用,如中间选项倾向和价格响应的简单决策规则,且风险和社会任务启发式行为相关。
主要研究结论 [page::26][page::27]
- 实验和现场消费行为中的选择一致性指标缺乏跨环境的通用性,更多体现为环境依赖性和多维度能力集合。
- 结果对当前效用最大化模型的实际应用和偏好推断提出重要挑战,未来需要开发兼顾多环境的更丰富决策质量测度方法。
深度阅读
金融研究报告详尽分析报告
报告标题:How General Are Measures of Choice Consistency? Evidence from Experimental and Scanner Data
作者:Mingshi Chen, Tracy Xiao Liu, You Shan, Shu Wang, Songfa Zhong, Yanju Zhou*
发布日期:2025年1月21日
---
一、元数据与概览
本报告由知名行为经济学与实验经济学研究团队发布,主题聚焦于测量和理解消费者选择一致性(Choice Consistency)的广泛适用性。通过结合超市扫描数据与两项“lab-in-the-field”实地实验,作者试图考察个体在不同决策环境下的选择一致性指标是否具有普适性和可推广性。核心论点指出:
- 超市购物行为与实验中风险决策的一致性评分之间缺乏相关性。
- 实验内部的不同任务间(风险、社交和食物决策)一致性评分存在中等程度相关。
- 超市内不同类别和时间段的购物一致性评分呈现低至中等相关程度。
基于这一发现,报告提出选择一致性应被视为一个多维度的技能组合,而非单一的通用指标。研究突破性地利用大规模个体级面板数据与设计完善的实验数据,填补了此类选择一致性跨场景推广性验证的空白,丰富了行为经济学及决策科学的理论与实证文献。[page::0,1,2,4]
---
二、逐节深度解读
2.1 引言(Section 1)
- 关键观点:
经济学的基本假设——消费者在预算约束下最大化效用——以揭示偏好方法(Revealed Preference)形式广泛验证。选择一致性是这一假设的核心,过去文献多集中于特定决策环境(如风险、时间偏好、购买消费)测量一致性评分。
- 研究动机:
本文关注测量的一致性分数在不同环境、不同任务之间的适用性及关联性,特别是日常超市消费行为与实验任务中风险决策之间是否存在推广性。
- 数据与方法简述:
采集6,144名消费者2019-2020年24个月的超市购物记录(聚焦肉类和蔬菜两大类)和1055名被邀请参加标准的22轮Arrow证券组合风险决策实验。第二实验再增加社交和食物决策任务,涉及302名消费者。
- 研究问题:
1. 同一人超市购买和实验风险决策一致性评分相关性如何?
2. 实验任务内不同性质决策间一致性评分的相关性?
3. 超市不同消费类别和时间的选择一致性相关性?
- 假设推断:
选择一致性可能代表通用的决策能力,也可能因环境、规则及任务性质不同而差异明显。
该章节为后续实证分析奠定基础,强调跨环境选择行为考察的重要性和挑战。[page::1]
2.2 理论背景与一致性指数(Section 2)
- 揭示偏好与GARP:
利用Afriat定理表明,若个体选择满足广义揭示偏好公理(GARP),则存在效用函数可合理化该决策集。
- 一致性度量指标: 报告引入四个主要指标:
1. 临界成本效率指数(CCEI): 测量为“预算放宽多少比例后消除GARP违规”,数值1为完美一致,越低一致性越差。
2. Houtman-Maks指数(HMI): 最大无违规子样本比例,表达样本数据中“最理性的”部分占比。
3. 金钱抽水指数(MPI): 违反GARP时,通过“套利者”频繁交易可从个体剥削的资金比例,越低越合理。
4. 最小成本指数(MCI): 修正所有偏好循环所需移除资源的比例,反映违规的数量和严重程度。
这些指标从不同角度量化个体偏好的一致性,用于后文实证的多重测度及稳健性检验。[page::5,6]
2.3 数据与实验设计(Section 3)
- 扫描数据(Scanner Dataset):
来源为中国南方某领先零售企业,涵盖超过400家超市,6,144名高频消费者2019-2020年连续24个月的数据。聚焦肉类和蔬菜,采用个体定制的价格与数量数据构建月度预算线,这得益于高频个体化数据,有效减少价格测量误差。
- 实验设计:
- 实验1:标准风险预算任务,22轮在两个资产间分配100代币,资产兑换率及支付概率设计。
- 实验2:扩展风险之外包括社交(改良版施舍博弈)和食物决策任务,随机呈现22轮,同样激励方式。
- 样本规模: 实验1共1055参与者,实验2为302参与者均来自扫描数据样本。实验后收集性格、IQ及人口统计等信息。
- 表1及图1说明: 表格展示样本日志型购买交易数据结构,图1为三类实验任务界面截图。
研究设计高度严谨,数据覆盖广,且实验与实际消费数据匹配,具备强大比较能力。 [page::7,8,9,10]
2.4 主要结果(Section 4)
4.1 实验风险数据 vs 超市扫描数据(Experiment 1 vs Scanner 1)
- 一致性分数统计:
实验风险任务的平均CCEI为0.941,超市消费平均CCEI为0.946,均显著高于随机模拟分布,说明决策行为非随机且检测能力强。
- 关键结论:
Spearman秩相关系数显示四个指标(CCEI, HMI, 1-MPI, 1-MCI)在实验风险任务与超市购物任务之间表现“非常低”且不显著的相关性,表明两环境下一致性无可推广性。
- 内部一致性验证:
同一任务内四个指数之间相关性较高(平均0.809),确认多指标测量趋向一致,后续侧重CCEI分析。
- 图2-4及表2说明: 图2、3分别为实验风险和超市消费一致性指标累积分布,图4展示散点图与拟合线揭示低关联。[page::10,11,12,13,14]
4.2 实验不同任务间及超市各类别/时间相关性(Experiment 2 & Scanner Dataset 2)
- 实验内部:
任务间一致性CCEI相关度适中,风险与社交最高(0.412),风险与食物(0.305),社交与食物较低(0.254),均显著。
- 超市扫描:
类别(肉、蔬菜、水果、零食)间及不同时间区间(2018-2021)之间的一致性相关度普遍偏低,虽正向显著,但多处低于0.2。
- 总结: 实验内一致性较强,超市内部则呈较低相关,暗示选择一致性非单一维度,受环境因素影响。[page::14,15,16]
4.3 稳健性检验
- 多指标检验: 使用HMI、MPI、MCI、多重测试功效调整,以及偏好结构假设(正常品、齐次同度、拟线性效用、FOSD、EU等)验证主要结论。
- 效果:
- 实验与超市相关性依旧低;
- 实验内任务相关性经多假设加固反而加强;
- 超市扫描数据内相关性在更严格偏好假设下显著提升,即粗略预算线构造与现实偏好可能造成测度误差。
- 表3详细总结了各种测试下的相关性评价及稳健性。[page::16,17,18]
2.5 作用机制探讨(Section 5)
- 随机性因素:
采用Cherchye等 (2023)置换测试判断是否近似效用极大化者,结果显示实验中约77%近似效用极大化,超市扫描数据仅22.5%,并且两者之间随机极大化比例互不相关,超市决策更随机且受到复杂因素干扰。
- 预算约束异质性:
实验预算线清晰,超市预算线需根据购买量和价格构造,受价格认知误差、商家策略等影响较大,导致测度误差和一致性偏差。采用价格误解指数(PMI)和广义揭示价格偏好指数(GAPP)进一步分析,相关结论不变。
- 偏好形成差异:
- 超市决策多为日常“例行任务”,受季节、促销、购物时间等情境因素影响显著(通过比较季节、折扣、进餐时间等情境组合的一致性评分差异验证),表现为“偏好冲击”。
- 实验偏好形成包含“发现”机制(新规则学习)和问题解决能力,且存在明显学习效果,后半段表现出更高一致性和跨任务相关性。
- 个体特质影响:
IQ分数与实验FOSD一致性显著正相关,购物经验与超市CCEI正相关,表明认知能力和经验对选择一致性有推动作用。
- 启发式规则应用:
实验中约26%的参与者在价格相近时倾向于选择中间选项,且这种启发式行为在风险与社交任务间存在正相关。超市数据中表现为对价格变化的“向下需求斜率”规则弱相关或无相关。
- 综述: 选择一致性评分受多重未观测因素影响,包括随机行为、预算约束构造、偏好形成动态和启发式决策,解释了实验与现实环境间一致性推广难题。[page::18-26]
---
三、图表深度解读
图1:实验任务界面截图
- 描述: 三个任务的界面展示了参与者在风险(两个资产账户)、社交(自我与他人分配100代币)和食物(消费肉与蔬菜)决策的直观操作。蓝红色块分布代表不同预算和价格组合。
- 解读: 所有任务均支持预算线明确,且对参与者面对的风险和奖励有直观呈现,有利于参与者理解但也可能诱发启发式行为。
- 文本联系: 界面描述与报告实验设计辅佐理解预算线构造和任务结构一致,强调任务具备较强控制性。[page::9]
图2、3:一致性指标累积分布(实验与超市)
- 描述: 对比实测和模拟随机选择下CCEI、HMI、1-MPI及1-MCI分布,实测选择显著表现出高一致性特征。
- 解读: 实验和超市购物均显示远高于随机水平的一致性指标验证了测试的敏感度和数据的有效性。但超市数据随机性稍高,特征更为复杂。
- 文本联系: 支持实测数据非随机,能检验个体理性程度。进一步为实证分析相关性提供基础。 [page::11,12]
图4:实验风险任务与超市选择一致性相关散点
- 描述: 四个指标对应的散点图呈现无明显趋势,相关系数均接近0且不显著。
- 解读: 直观展示两环境下选择一致指标完全不对称,强化结论1。
- 分析局限: 散点合并大量数据点,个体巨大异质性可能掩盖局部子群效应。
- 关联文本: 反映选择一致性非通用维度,考验其作为普适决策能力指标的有效性。[page::13]
图5:实验任务间一致性相关(风险vs社交/食物)
- 描述: 三个两两任务的相关散点图,均处于正斜率趋势,Spearman相关度显著中等水平。
- 解读: 表明实验内部任务共享一定共性机制,可能反映了认知能力、规则适应或偏好结构的某种一致表现。
- 文本支持: 实验室内一致性指标具备有限横向迁移性。 [page::15]
图6:超市扫描数据内部一致性相关(消费类别及时间)
- 描述: 6个类别/时间组合两两之间的CCEI相关散点,相关度普遍低至中等,部分类别相关度略低或不显著。
- 解读: 超市内不同类别的消费行为存在一定的独立性,时间维度亦有波动,提示消费者根据商品类别和时间的不同采用异质决策策略。
- 关联文本: 支持选择一致性多维度模型,同时反映现实生活中的多元情境影响。 [page::15]
表1:示例扫描数据记录
- 描述: 数据项涵盖会员ID、门店、交易时间、类别、购买数量与金额。
- 重要性: 真实交易数据格式,为实证分析构建基础。重点是高频连续观测支持预算约束个体化构造,有利于GARP测试。 [page::7]
表2:指数之间的相关性
- 描述: 显示了CCEI、HMI、1-MPI及1-MCI四种一致性指数在同一数据下的高相关性(均>0.64,部分>0.9)。
- 意义: 证明不同测度间度量结果趋一致,简化后续分析指标选择。 [page::13]
表3:多方法稳健性测验结果汇总
- 描述: 不同方法(多指标、功效调整、偏好限定、结构估计)下,三类数据(实验 vs 超市)相关特点保持一致,超市内相关程度随偏好假设增强显著上升。
- 解读: 验证主要结果的稳健性,同时提示现实数据噪声较大,严格假设筛除部分噪音后提高相关性。 [page::17]
表4:随机性测试近似效用极大化者比例
- 数据说明: 实验任务中70%-80%个体被认定为近似效用极大化者,超市数据则低至20%-30%。
- 解释: 超市环境更复杂且随机因素更多,实验任务设定简洁且规范,更有利于效用极大化表现。
- 结论: 随机性差异是解释跨环境不一致性的一大因素。 [page::19,20]
表5:预算约束替代测度与启发式决策指标
- 总结: PMI和GAPP进一步识别预算构造的可能误差,一致性相关度无显著提升。
- 启发式: 实验任务中“向下需求斜率”与中间选项启发存在中等正相关;扫描数据中相关性很弱。
- 意义: 啮合的启发式机制也导致不同环境间指标缺乏一致性。 [page::20,25]
---
四、估值分析
本研究不涉及传统财务估值,但核心方法为经济学中的利用效用最大化模型进一步测度个体理性程度。使用的关键指标(如CCEI)等价于对效用最大化假设的偏离度量。进一步利用结构性估计(例如失望厌恶模型、CES函数)用于偏好参数估计及拟合度测算。该结构方法补强了揭示偏好模型的非结构化测试,赋予实证数据更细粒度意义评估与解释能力。[page::47]
---
五、风险因素评估
研究揭示以下风险因素或限制:
- 预算线构造误差: 超市数据预算线依靠价格与购买量计算,受价格认知误差及促销策略影响,导致一致性测试能力波动。
- 随机行为及噪声: 扫描数据随机性高干扰一致性判别,可能冲淡实际决策能力指标的准确性。
- 偏好异质性与形成: 情境变化、经验累积和学习效应对一致性产生不均衡影响,限制跨情境推广。
- 启发式决策与任务差异: 不同环境中决策主体采用不同启发式规则,导致一致性指标非普适。
报告深入剖析了这些风险但未直接提供缓解策略,提示需未来研究设计更精确预算测度与控制未观测随机机制来提升一致性测度的环境适用性。[page::20-26]
---
六、批判性视角与细微差别
- 指标局限:
报告虽使用四大指标多角度衡量一致性,但整体上表现为跨环境指标关联度极低,提示现有揭示偏好测度或决策一致性指标捕捉不到真实个体决策能力的全面面貌。
- 样本代表性与选择偏差:
实验参与者由超市扫描数据中部分消费者抽样邀请,仍可能存在参与筛选偏差,影响结果普遍性。
- 预算线构造的“刚性”与非实验环境复杂性:
超市消费者不直接面对实验中标准预算线,且定价多变,价格认知存在误导,限制了揭示偏好方法的准确应用。
- 多维度智能理论借鉴须谨慎:
报告将选择一致性多维度特征类比流体与晶体智力模型,虽富有启发,但跨领域的类比需进一步验证理论路径与实证依据的扎实性。
- 未深入探讨制度或场景外生变化对一致性的冲击机制。
总体上,报告谨慎客观,充分说明了选择一致性测度在现实消费情境下的复杂性和潜在局限。 [page::4,27]
---
七、结论性综合
本研究通过跨环境数据整合与实验对比,在测量个体决策一致性的经济学框架下发现关键洞见:
- 个体在受控实验室中完成风险决策任务时的一致性评分无法预测其现实超市购物的一致性,反映出现实决策中的复杂性和多重影响因素。
- 实验环境内不同任务间一致性评分存在中等相关,说明在相同设计范式与认知机制作用下,个体表现呈现某种稳定性。
- 超市扫描数据内不同消费类别与时间段一致性相关性弱,凸显选择一致性作为单一指标的局限。
- 多种一致性指数与稳健性检验支持上述结论,增强其可信度。
- 对于背后的机制,随机选择、预算构造误差、偏好形成动态和启发式决策共同影响决策一致性指标的形成及跨环境可比性。
- 决策一致性应被理解为多维能力的组合,而非一维通用属性,类似于流体与晶体智力的二重结构进一步拓展到多维智能理论。
- 研究含义在于,经济学理论中选择一致性指标尚需更多精细化测度与验证,尤其重视现实复杂度对理性测度的冲击,未来研究应采用多任务、多环境、多指标设计,更准确捕获决策质量。
该报告在行为经济学和主流微观经济学方法对接中作出了重要贡献,填补了实验理性与真实消费行为中一致性测度的研究空白,为理解个体经济行为异质性及其跨环境迁移难题提供了坚实的实证基础与理论视角。
---
以上分析结合全文各章节内容与所有表格、图形,从理论基础、数据与实验设计、主要实证发现、稳健性检验、机制分析到结论意义,进行了专业且详尽的解读,确保覆盖报告的每一个重要细节与洞察。全文严格按照引用页码标注,便于后续查证。