o1满血版泄露!奥数题图片推理手拿把掐 奥特曼剧透o2
o1满血版泄露了!血版泄露
没想到,奥数OpenAI还搁那儿“今年一定”呢,题图特不少网友已经率先上手体验到了(doge)。片推
事情是理手酱婶的:有网友发现,OpenAI已经在ChatGPT官网上部署了完整版o1,拿把大家伙儿还都能卡bug直接用!掐奥
最初发现此事的剧透网友,测试确认泄露模型具有奥特曼所说的血版泄露图像推理能力。
△图源:@legit_rumors
而日志也显示该模型就是奥数o1本模。
于是题图特,赶在OpenAI出手修复之前,片推网友们抓紧大玩特玩了一波——
满血o1到底有多牛
和已经发布的理手o1-preview、o1-mini最直观的拿把不同是,泄露出来的掐奥o1支持上传附件。
这也就意味着,终于能测测o1的多模态能力了。
网友们也不说废话,直接上强度,普特南数学竞赛的证明题截图一贴,甩给满血o1。
对正整数n,有fn(x)=cos(x)cos(2x)cos(3x)…cos(nx)。找出最小的n,使得|fn‘’(0)|>2023。
思考了18秒之后,o1给出答案:18。
答案正确:
再来一道更复杂的,虽然在识图上遇到了一点小问题,但还是稳稳做对了。
在如此惊艳表现之下,似乎正确识别人类史上首张黑洞照片也不算什么了(doge)。
不过嘛,也不是没有翻车案例。比如,让大模型数数图里有多少个三角形。
ID为anagh的网友,给泄露模型和GPT-4o做了个同屏对比:4o速度很快,给出了错误答案19。
而满血o1花了1分39秒,狂刷一堆token……给出了不同的错误答案:29。
正确答案是24。
这个bug现在已经修复了。不过,有意思的是,这次模型泄露,持续了整整3个小时。
不小心还是故意的?
有网友犀利地点出,这事儿看上去不是“不小心”,而是“精心策划”:
目的是让人们对即将发布的模型有一个预期。
不少网友赞同这样的观点:
奥特曼的目的是测试和炒作。
而由于一切看上去已经部署就绪,甚至有人猜测,o1完整版的正式上线时间就在未来一周之内。
值得注意的是,就在这次泄露事件之后,奥特曼马上在??上开始了自己的表演:
好家伙,都已经吹上o2的风了(还假装上错号……)。
至于为什么是这个时间……
那不得赶在Anthropic发布Claude Haiku 3.5之前搞点事嘛(doge)。
参考链接:
[1]https://x.com/legit_rumors/status/1852625385801859321
[2]https://x.com/koltregaskes/status/1852657291469709626
[3]https://x.com/anaghnairr/status/1852668741751919016
- ·[流言板]邓肯和加内特谁更难防?小斯:邓肯对我来说更难一点
- ·与张伟丽&李景亮互动 周鹏分享UFC澳门行:加油 中国力量🥊
- ·欧文:必须称赞热火的拼搏精神 他们真的很想赢下这场比赛
- ·[流言板]起势!小琼斯一条龙反击暴扣,随后哈登突破上篮打停开拓者
- ·青海“拉面之乡”:一碗面,拉出百亿产业
- ·WCBA常规赛A组第4轮综述:四川7人上双75分狂胜福建 山东力克新疆
- ·三分40中10!基德:我们投了很多三分 落后时想赶快追回来
- ·大电池长续航 荣耀笔记本 X Plus系列2025正式发布 4899元起
- ·[流言板]手感不错!詹姆斯半场5中3,三分1中1得到9分3篮板9助攻
- ·[流言板]全面表现!哈特全场6投4中,拿到11分13篮板10助攻
- ·[流言板]斯波谈普里查德:他一直在默默努力,一年又一年地打磨自己
- ·[流言板]全面表现!哈特全场6投4中,拿到11分13篮板10助攻
- ·阿特金森:梅里尔是本场比赛的明星 他投进三分时能激励我们
- ·金色BUFF加成凯恩穿金色战靴出战百场里程碑完成双响
- ·阿特金森:奥科罗在防守端非常全能 他是我们球队的重要一员
- ·“95后”管护员在塔克拉玛干沙漠边缘织绿色“围脖”
- ·苏姿丰当选《Time》年度CEO 带领AMD扭亏为盈
- ·业界首创 华为Mate 70 RS搭载高低频双振膜立体声扬声器
- ·哈登今天出战27分6秒创赛季新低 也是本赛季首次出战30分钟以下
- ·小吧送票啦中超周末回归,亚泰vs南通!现场看球为亚泰加油
- ·👀蔡崇信来到迈阿密看球 并与小托马斯和芬尼
- ·量化派入选“投资家网”2024年度最具投资价值企业榜单
- ·知情人士:一旦伊万下课,郑智有望扮演临时“救火”角色
- ·欧文:我们需要回去复盘比赛过程 看看哪些地方可以改进
- ·[流言板]明年篮网与太阳将在澳门进行季前赛,NBA时隔6年重回中国
- ·原生鸿蒙推送5.0.0.112版本升级 新增空气投篮主题 优化多项功能体验