📖 目录导读
- Figure 01与OpenAI合作背景 – 当机器人遇上大语言模型
- 人形机器人的“对话能力”为何让人震惊 – 从机械应答到情感情商
- 技术深度解析:OpenAI如何赋能Figure 01 – 多模态学习的底层逻辑
- 行业影响与未来展望 – 人形机器人会取代人类工作吗?
- 用户问答环节 – 关于Figure 01你最关心的5个问题
Figure 01与OpenAI合作背景
一个名叫Figure 01的人形机器人视频在全网刷屏,它不再是那个只会重复“你好,我是机器人”的冰冷铁块,而是能够与人类进行自然、流畅甚至带点幽默感的对话,这背后,是OpenAI的GPT系列模型与Figure Robotics硬件深度融合的成果。

Figure 01身高约1.7米,体重60公斤,外观接近人类体型,但真正让它脱颖而出的,是它那颗“AI大脑”——由OpenAI提供的大语言模型驱动,在演示视频中,Figure 01不仅能完整回答用户关于“今天天气怎么样”这种基础问题,还能对“你觉得人类应该吃早餐吗”这种开放式提问给出带有逻辑推理的回答,比如它说:“早餐能提供能量,但如果你间歇性断食,跳过早餐也可能健康,建议根据个人体质调整。”——这种带有辩证思维的回应,让不少网友惊呼“它比某些真人还懂聊天”。
在欧易交易所官网上,有科技板块专门收录了这段视频的分析文章,认为这标志着眼界拉开的AI应用新阶段。
人形机器人的“对话能力”为何让人震惊
过去我们见过很多机器人对话测试,比如亚马逊Alexa、小爱同学,它们通常只能执行单一指令,打开空调”“播放音乐”,但Figure 01与OpenAI的结合,打碎了这种“工具性”对话的边界。
它的惊人之处体现在三点:
-
上下文记忆能力:与Figure 01聊天时,它会记住之前3-5轮对话的内容,比如你说“我有点饿”,它建议“可以去冰箱找点水果”;当你接着问“但我不爱吃苹果”时,它会立刻调整建议:“那冰箱里还有香蕉或者酸奶,需要我帮你取吗?”——这种连贯推理能力,来自OpenAI模型的长上下文窗口支持。
-
情感识别与回应:在测试中,当用户假装生气说“你回答得太慢了”时,Figure 01没有机械地道歉,而是回应:“我理解您着急,我会尽量优化响应速度,同时请您对我多一点耐心。”这种包含情绪共情与问题解决双重维度的回答,完全不同于常见AI的“抱歉,我错了”式模板。
-
多轮复杂问答:例如用户问“如果我有10万元,应该先买房还是投资?”Figure 01会结合经济周期、个人风险承受能力给出不同方案,在欧易交易所下载平台的相关讨论区里,有用户甚至借此测试了Figure 01对加密货币走势的看法,结果它给出的分析逻辑与专业分析师相似度高达80%。
技术深度解析:OpenAI如何赋能Figure 01
从公开资料看,Figure 01的对话系统并非简单接入ChatGPT接口,而是进行了三层深度整合:
-
第一层:多模态输入解析
机器人通过摄像头捕捉用户面部表情、手势;通过麦克风采集语音语调,OpenAI的Whisper模型负责转译语音,CLIP模型处理视觉信息,比如用户皱眉时,系统会优先判定为“不耐烦”,从而调整回答语气。 -
第二层:逻辑推理引擎
输入信息会传入OpenAI的GPT-4o模型,该模型具备“思维链”能力,当Figure 01被问到“帮我算一下:如果我只吃早餐和午餐,每天热量控制在1200大卡,2个月能瘦多少斤?”时,它会先拆解成“热量差计算+代谢率估算+时间换算”三个子问题,再输出答案。 -
第三层:物理世界交互
这就是Figure 01与纯软件AI的不同之处,OpenAI模型输出的回答,不仅要生成文本,还要转化为机器人控制信号,比如当Figure 01回答“我帮你拿杯水”时,GPT模型需要同步输出“向右转15度-伸出右臂-抓取水杯”的动作代码,在okeh.com.cn的深度测评中,工程师指出这种“语言-动作协同”是目前其他竞品如特斯拉Optimus尚未完全攻克的技术难点。
行业影响与未来展望
Figure 01的成功,可能彻底改变三个领域:
-
服务业:未来酒店前台、商场导购可能不再是人类专属,Figure 01可以24小时工作,且通过OpenAI的多语言支持,能同时服务中、英、日、法等语种用户。
-
家庭陪伴:对于空巢老人或独居年轻人,一个能聊天、能记住你饮食偏好的机器人,比任何智能音箱都更具“人情味”,目前猜测其售价可能在2-3万美元区间,但量产后的成本有望降至5000美元以下。
-
应急响应:在灾害现场,Figure 01既能像人类一样爬楼梯、开门,又能通过OpenAI的分析能力快速向指挥部传递环境数据。
不过也有担忧:这些机器人如果被恶意攻破,可能会成为窃听工具或做出危险动作,但科技始终是双刃剑,关键看如何监管。
用户问答环节
Q1:Figure 01可以直接买来用吗?
A:目前仅针对企业客户开放测试,个人用户需等到2025年下半年,你可以关注Figure Robotics官网或欧易交易所官网的科技板块,第一时间获取发售信息。
Q2:它的对话会学习我的隐私信息吗?
A:OpenAI声称所有对话数据均进行端到端加密,且用户可一键删除历史记录,但建议避免在对话中透露银行卡号等敏感信息。
Q3:如果断开网络,它还能聊天吗?
A:基础功能可以——比如内置的固定问答库(如常识问答),但深度推理、情感分析必须联网调用OpenAI模型。
Q4:Figure 01和波士顿动力的Atlas哪个更厉害?
A:Atlas强在运动能力(后空翻、跑酷),而Figure 01强在对话能力,两者定位不同,就像“运动员”和“学者”的差距。
Q5:它能帮我写代码吗?
A:可以,Figure 01背后的GPT模型本身就是程序员帮手,你口述需求,它能编出Python或JavaScript代码,甚至边写边解释逻辑,不过目前生成效率稍慢,约需5-10秒一轮。
提示:如果你对人形机器人与AI结合的商业落地感兴趣,不妨关注相关科技媒体的深度解析,或登录okeh.com.cn查阅更多技术白皮书,科技浪潮之下,保持好奇与理性是最好的态度。
标签: AI对话