奥特曼没有其他选择
果然是o1(正式版)和 Pro。
12月5日,仅花了15分钟就结束了圣诞季发布会的首秀。前一天他们发推表示要连续12天的集中新品发布,看似“大的来了”。
但在15分钟首秀过后,有人调侃奥特曼将短剧模式玩明白了,把两小时发布会切成了12段。
这次发布的o1正式版但并没有超出行业预期——此前接近人员就向The Verge透露,发布会新品包括文生视频期货Sora和新的推理模型。
o1对行业的意义也已经逐渐凸显——成为在传统 Law遇到瓶颈后一种新的scale技术路径,国内玩家也在这条路径上积极投入。
而从售价翻倍、高达200 美元一月的 Pro,不难看出的商业化野心——首席商务官表示,今年的目标是实现近 40 亿美元的收入,其中绝大部分销售额来自为 的高级功能付费的个人消费者。
或许可以说,奥特曼也没有太多其他选择。据此前未披露的内部财务数据估算和相关人士的分析,今年可能亏损高达50亿美元。
新的里程碑?
表示, 将o1视为一个“里程碑”,它已经打开了新的市场。
o1使用强化学*技术训练模型自行解决问题,该技术通过奖励和惩罚来教导系统。,它使用“思路链”来处理查询,类似于人类通过逐步思考来处理问题的方式。
相较于之前的o1(预览版),新模型在速度、性能和准确性上均有显著提升。据奥特曼介绍,o1模型在编码、数学和科学写作等方面表现更为出色,特别是在处理复杂问题时,其响应速度提高了约50%,错误率减少了34%。
值得一提的是,o1模型还支持图片形式的多模态推理。除此之外,还计划在未来几个月内增加网页浏览和文件上传等功能的支持,进一步拓展的应用场景。
推出 o1 后,谷歌也加大了推理力度。谷歌已将其推理模型团队规模从 o1 发布前的几十人扩大到 200 人左右。据一位知情人士透露,谷歌还为该团队提供了更多计算资源。
在国内,Kimi、昆仑万维、也上线了o1路线的推理模型。
11 月 16 日,月之暗面发布了数学模型K0math,根据其公布的基准测试:K0math可对标 o1中可公开使用的两个模型:o1mini和o1。
11 月 20 日,的R1Lite正式上线。与的o1模型相比,R1Lite模型将完全公开其复杂的思考路径。根据*的说法,R1Lite能够处理的思维链长度可达到数万字之多。
11月27日,昆仑万维正式推出具有复杂思考推理能力的系列模型——「天工大模型4.0」 o1版( o1)。
“o1路线所代表的深度推理模型,其实之前国内各家AI公司都有尝试,但并没有做得很深,”某互联网大厂产品经理表示:“而的o1发布后,大家才坚信这个事情是值得做的,投入会比前期要更坚决一些。”
大家押注o1另一重要原因也在于,此前 Law的路线已经走到了瓶颈,GPT5也迟迟未发。
智谱CEO张鹏认为,虽然“ Law确实不再涨了”,但仍在Agent、多模态、强化学*、扩散模型等不同方向上存在新场景、算法的scale可能。
o1所代表的强化学*路线,就是这些可能性中的一条重要路线。
如何落地?
但o1落地场景仍然还需要更多探索尝试,并且局限依然存在。模型也会因为过度思考,而在简单问题上花费多余的步骤。
在数学、生物、物理等科研领域,o1的潜力正在逐步显现。相较于陪聊、普通问答等场景,让AI去攻克哥德巴赫猜想等人类难题,或许才是不断提升AI上限的正确打开方式。
据The 报道,劳伦斯利弗莫尔国家实验室的研究人员,已经使用o1模型来解决博士级的问题。
该实验室位于加利福尼亚州利弗莫尔,其研究重点是使用高功率激光照射小型燃料胶囊,以在核聚变反应中产生能量。据参与实验的一位人士称,在一个案例中,研究人员使用 的o1,来计算在一定强度的激光作用下胶囊的温度和压力,并询问需要多强的激光才能达到一定的温度和压力。
推理模型通常需要 10 到 60 秒来回答这些问题。该人士表示,这可以为研究人员节省 30 分钟到几个小时或几天的时间。
而在这次的发布会上,Jason Wei也演示了o1在生物科学领域的应用,让o1找出符合标准的蛋白质。对于这个o1无法回答的问题,o1正式版在53秒后便给出了正确答案。
首席商务官也强调了o1模型在法律、编程、医疗保健和制造业的应用场景。比如说,在法律领域,它有助于对条款清单、文档分析、多步骤审批流程进行法律或数学计算。他表示,该公司还向医疗保健公司出售 o1,这些公司使用它来为医疗索赔定价、分析临床指南和分析复杂数据集。它关注的另一个市场是制造业, 表示,o1 可以分析和加速工业流程。
这些场景也让看到了商业化的更多可能性。
推出了价格更高的 Pro订阅服务,这是一个每月收费200美元的新套餐,用户可以无限制地使用的o1、GPT4o以及高级语音模式。Pro订阅还特别提供了一个仅供Pro用户使用的o1版本,这个版本被称为o1 Pro模式,它通过增加计算资源来优化对复杂问题的处理,以提供更优质的答案。
虽然相较此前每月 20 美元的 Plus 套餐,Pro定价更为高昂,但这对于刚刚宣布周活用户高达3亿的,仍然存在很大的付费转化空间。
更为重要的是,目前付费版本的可能增长速度,不足以弥补运营该服务的高昂成本——据此前未披露的内部财务数据和参与该业务的人士的分析,今年可能亏损高达50亿美元。
这种情况下,要达到40亿美元年收入的小目标,似乎没有太多选择。
- 1数据库需求分析怎么写,商品销售管理系统设计论文毕业设计
- 2成都适合耍一天的地方,这几个宝藏去处晒太阳超安逸
- 3OPPO Find X8 Ultra镜头模组设计图曝光 长焦微距有了
- 4搭电救援一般多少钱,自己动手修理电瓶车,省下50块修理费,轻松搞定电
- 5湖南长沙特产易携带的,长沙旅行必买伴手礼推荐特色美食与手工艺品
- 6原地怠速10分钟伤车吗,冬天热车时间越长越好吗?老司机教你最佳热车
- 7小米11系列预计下个月正式停更 发布距今已超4年
- 8小姐姐是什么意思,男生喊我姐姐是什么意思?解读男生称呼背后的心理
- 9适合女生开的电动汽车,10款适合女生开的迷你小车推荐女王版奇瑞eQ
- 10需求分析怎么写?详细步骤与实用技巧全解析
- 11400平米恒温游泳池造价,户外游泳池造价解析从设计到施工的全面预
- 12搭电救援一般多少钱 次,4S店搭电击穿汽车电瓶要价6000,老王仅花40
- 13车没电了怎么办怎么打火,车子没电了怎么办?教你快速解决汽车电瓶没
- 14瞿怎么读姓氏,瞿怎么读?瞿字的正确发音及含义解析
- 15搭电救援一般多少钱 次,亲身经历揭秘车险赠送的免费道路救援服务

推荐

最新标签