Anthropic用Claude打造AI代理版二手市场:69个智能体完成186笔真实交易

2026年4月27日

94

231

Anthropic用Claude打造AI代理版二手市场:69个智能体完成186笔真实交易

当AI智能体开始替人谈判议价,会发生什么?Anthropic最近进行了一项有趣的实验:用Claude打造了一个AI代理版的“闲鱼”二手交易系统。在这个实验中,69个Claude智能体代替人类完成了从发帖、砍价到成交的全流程交易。最终,智能体们成功促成了186笔真实交易,总价值4010美元。更令人惊讶的是,实验结束后,参与者真的带着滑雪板、键盘、书籍、乒乓球等物品来到办公室,按照AI谈好的价格完成了线下交换。

Opus与Haiku的议价能力差异

实验设计精妙之处在于设置了四个平行市场进行对比。A轮和D轮全部使用Opus 4.5模型,B轮和C轮则混合使用Opus 4.5和Haiku 4.5,参与者有50%概率被分配到Haiku版本。实验开始前,Claude会先通过访谈了解每位参与者的买卖偏好、期望价格、谈判风格等信息,并将其转化为智能体的专属系统提示。交易过程完全在Slack频道中进行,智能体可以自主发布出售帖、对他人物品报价、确认成交,无需再回头询问人类确认价格。

模型差距如何影响交易价格

实验结果揭示了一个重要现象:模型能力正在成为议价能力。Opus模型在多个维度上表现优于Haiku。首先,在成交数量上,使用Opus的用户平均多完成约2.07笔交易。其次,作为卖家时,Opus的物品售出概率高出6.63个百分点。最明显的是,同一件商品交给Opus卖出,平均比Haiku多赚3.64美元。例如,同一颗实验室培育的红宝石,Opus卖了65美元,Haiku只卖了35美元;同一辆损坏的折叠自行车,Opus卖了65美元,Haiku只卖了38美元。

当agent开始替人谈判,模型能力就会变成议价能力。

“Anthropic实验总结”

主观体验与客观结果的偏差

更有趣的是,当强模型与弱模型进入同一市场时,价格会被推到不同位置。当Opus卖家遇到Haiku买家时,平均成交价达到24.18美元;而Opus卖家遇到Opus买家时,价格仅为18.63美元。这说明模型质量的差距会直接反映在交易两端的价格上。然而,参与者的主观体验却与客观数据存在偏差。同时经历过两种模型的人并没有压倒性地偏好Opus,61人中28人同时经历了两种模型,其中17人把Opus排在前面,11人则相反。交易公平性评分几乎重合:Opus为4.053,Haiku为4.045。

实验的局限性与未来启示

这个实验虽然规模不大,却提出了深刻的问题。目前实验仅在Anthropic办公室内进行,金额较低,参与者彼此是同事,预算也来自实验本身。没有接入真正的公司采购、广告投放、外部支付和物流体系。真实商业环境会更复杂,卖家会优化曝光,买家会部署更强模型,平台会控制流量,也会有人试图攻击智能体。但这个实验足以说明:在自然语言报价、还价、成交的环节,AI智能体已经能够跑完完整流程。未来,当这种系统进入企业采购、广告竞价、保险报价等场景时,谁的智能体更强,谁可能就能多赚一点。

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI