2024结束了,作为大模型领域的参与者,仅以我的个人视角,带大家回顾一下2024年大模型领域的重要事件。
然而,到了2024年末,随着众多新模型的出现,GPT-4在Chatbot Arena排行榜上的位置已降至约70位。
尽管如此,OpenAI在大模型领域依然是一骑绝尘的,毕竟2024年,OpenAI还发布了很多产品:
顺着OpenAI的线日,OpenAI发布了GPT-4o,发布会上的实时语音与视频的演示,真的让人惊艳。
之后,国内多模态大模型紧紧追赶。现在,我们除了可以给大模型发送文字外,也可以拍照、语音、视频交流了。
这类大模型通过使用类似“思维链”的技巧,花费多一些的推理token来思考问题,然后给出更好的最终答案。
它们不需要在训练阶段增加算力,而是通过增加推理的计算资源提升模型效果。从这一点上看,OpenAI确实厉害,毕竟,独辟蹊径不是那么好坚持的。
OpenAI Plus会员还好,20美元一个月,忍痛还能接受,但是Pro会员,一个月竟然要200美元。这个价格,对很多用户来说都很不友好。有趣的是,即识收费如此之高,据说OpenAI还入不敷出呢。
就在这种背景下,年中时一家名为Deepseek的新创公司崭露头角。当时,连“6小虎”都算不上的Deepseek发布了V2,直接将大模型token价格压到了每百万tokens仅1元人民币,要知道,同期的OpenAI的价格是每百万tokens大约200元人民币呢。
再接下来,大模型价格战开启,甚至影响到了很多国外的厂商。从这点上说,Deepseek当之无愧的平民模型啊。
2024年初的一个凌晨,OpenAI发布了首个文生视频模型Sora,可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
在大家都对文生视频没有信心之时,快手在6月6日推出了“可灵”,打造出了国内首个对标Sora的视频生成模型,可生成高分辨率、长达2分钟的视频。
虽然,当时国外也出现了Runway、Luma,但是,我依然认为当时的可灵,牛掰。
后续,MiniMax的海螺、抖音的即梦、腾讯的混元(开源的),包括前两天升级的通义万相,也都在视频生成领域有了很大的突破。
哦,对了,OpenAI在12月也终于发布了Sora,虽然晚了不少,但效果确实很顶。
Copilot、Bito、Codegeex、通义灵码等辅助编程工具咱就不提了,这些更多地是在实际编码阶段提升了我们写代码的速度,我们直接看各种智能编程助手。
上半年,随着首位AI程序员Devin的登场,智能编程悄然拉开了序幕。Devin不仅覆盖了从需求分析到编码、调试直至部署的整个开发流程,展示了端到端的开发能力,还拥有自主学习的能力,能够不断提升自己的技能。这样一位全能型的“程序员”,其出现无疑给大家带来了不小的震动。
Cursor通过基于上下文的代码补全、自然语言到代码的转换、多文件操作支持、以及生成代码的审查与比对等功能,极大地革新了代码开发的方式。它不仅仅提高了开发效率,还改变了我们编写文档、调试程序的研发模式。借助Cursor,我们能够更加专注于解决复杂问题,而将一些非创造性任务交给AI处理,这种转变无疑为软件开发领域带来了深远的影响。
还因此造就了很多热点事件,比如,7岁女儿独立实现了一个APP,非程序员很快上架了一个补光灯应用,事件可能有所夸大,但全民编程时代好像真的要来了。
而AI搜索则规避了这个问题。它也许没有那么泛化,但是对于知识获取、资讯搜集场景,已经足够替代原有的信息查询方式,以至于各大搜索引擎都迅速升级了自己的搜索。
AI搜索大大减少了我们从巨量信息中获取有效信息的难度,个人认为后续估计会成为一种常态。
也许今年大家都集中在了算力提升和模型开发上,导致硬件虽有所发展,但其热度远没有达到大模型本身那么Kaiyun官方入口高。
年初的AI Ping、Rabbit R1虽然创意非常好,但使用体验上更像是一个玩具,个人感觉甚至不如给小爱同学接入大模型来的有趣。
在这其中,个人比较关注的就是具身智能,毕竟,拥有一个钢铁侠的贾维斯,确实很有吸引力。
2025,希望我们每个人都能更好地利用AI,让它成为改善生活和工作的得力助手,而不是被快速发展的科技所淘汰。
Copyright © 2024 开云沙盘有限公司 版权所有 备案号:蜀ICP备19012180号 网站地图