英伟达牵头发布StarCoder2,程序员的好日子没几天了

首页 热门新闻 最新资讯

英伟达牵头发布StarCoder2,程序员的好日子没几天了

热搜大全 2024-03-02

生成式人工智能的走红已经持续了一年多时间,而且大概率会一直热下去。不过随着大众对于 AI 的了解越来越深入,有一个事实也被不少人用段子的形式揭露了出来," 我以为 AI 是要来帮人类做家务的,让我好去写诗做画,结果现在 AI 来了,AI 直接开始写诗做画了,我依然在扫地做菜 "。

如此调侃背后指向了当下的 AI 过于 " 风花雪月 ",离真正能改变生产力场景太远。

英伟达牵头发布StarCoder2,程序员的好日子没几天了

当然,目前并不是所有的 AI 大模型厂商都在文生图、文生视频赛道狂奔。日前有消息显示,英伟达联合知名 AI 开源社区 Hugging Face 和 ServiceNow,发布了名为 StarCoder2 的 LLMs 系列模型,并希望成为代码生成领域的新标准。据悉,LLMs 系列系列模型包括一个由 ServiceNow 训练的 30 亿参数模型、一个由 Hugging Face 训练的 70 亿参数模型,以及一个由英伟达训练的 150 亿参数模型。

据悉,StarCoder2 经过了 619 门编程语言的训练,可执行源代码生成、工作流生成、文本摘要等专业任务。英伟达对此表示,开发人员可以利用它进行代码补全、高级代码总结、代码片段检索等,从而提高工作效率。并且值得一提的是,该模型将在 BigCode Open RAIL-M 许可证的基础上以开放访问的方式发布,以允许免版税分发。与现阶段没有用例限制的传统开源软件不同,BigCode 在发布模型时附带了一个负责任的人工智能模型许可证,限制其被用于生成或分发恶意代码以损害电子系统。

英伟达牵头发布StarCoder2,程序员的好日子没几天了

在 GitHub Copilot 之后,终于又出现了一个真正意义上的代码生成大模型。那么,这一次人人都能是程序员的时代要来了吗?当然不是,且不提 StarCoder2 并有没有夸大宣传,即便 StarCoder 做到了它所宣称的一切,上限也只不过是一个程序员的助手,而非代替程序员。这与 Midjourney、Stable Diffusion 在一定程度上代替画家,有着本质的区别。

目前 StarCoder2 的技术文档并没有公开,但从它的上一代产品 StarCoder 就能一窥该 LLMs 系列模型的特质。作为将大语言模型集成至编程领域代表的 StarCoder,其训练模式与传统的大语言模型并没有什么区别,无非就是训练 ChatGPT、文心一言这类大模型主要是使用各种文字内容,而 StarCoder 的语料则是代码。

这也就意味着 StarCoder 与 ChatGPT、文心一言没有本质上的区别,前者更像是一个专精于细分场景的大模型,而这一类代码大模型目前能做到的就是自动补全代码、根据指令修改代码,以及用自然语言解释代码片段等任务。

英伟达牵头发布StarCoder2,程序员的好日子没几天了

要知道,目前一众大语言模型最大的命门就是缺乏自我纠正的能力,无论是作为 AI 聊天机器人的 ChatGPT、文生图的 Stable Diffusion,还是文生视频的 Sora 都无法规避幻觉,它们可能会生成一大段不同风格天马行空般的呓语。如今能看到的用 ChatGPT 作诗、用 Stable Diffusion 作画,乃至用 Sora 生成视频,其实都离不开人来筛选和修正其中可用的一段。而这背后的含义,就是目前的 AIGC 还不是智能体、更不是 AGI,而像是一种对于人类输出能力的模仿。

以目前应用 AIGC 最为成熟的游戏美术领域为例,游戏厂商通常采用的工作流是用 AI 出一个底稿,然后由人工来增加细节、并纠偏,再将修改过的画面重新输入 AI 大模型,然后重复多次,直至打磨出能用的作品。指望 AI 一次就做成可以商用的图片,至少现阶段是不现实的一件事。然而这样的工作模式放在编程领域就不那么好使了,因为使用 StarCoder2 其实就相当于是接手别人的代码、并 debug。

英伟达牵头发布StarCoder2,程序员的好日子没几天了

但这几乎可以说是程序员最不喜欢做的事情之一,特别是没有注释的代码。因为你不可能清晰明了地了解他人代码的整体设计思想及理念,所以能让代码跑起来就已经不错了,再加上缺失了相关注释,debug 简直就是一件灾难性的工作。因此如今即便已经是程序员的用户,对于代码模型的使用都很谨慎,基本也不会考虑直接用大模型生成用于生成环境的代码。

至于说有了 StarCoder2 人人都能成为程序员,这就更难实现了。用自然语言生成代码其实早在 GitHub 的 Copilot Chat 上就已经实现,可又多少人仅仅靠着 Copilot Chat 就能敲开程序员生涯的大门呢?其实编程是一门与计算机对话的学问,C 、Java、PHP 等语言则是代码世界的 " 英语 "、" 汉语 "、" 法语 "。但程序员真正的竞争力并不是代码编得又快又好,而是能否把现实世界中的需求,清晰地翻译到抽象的观念世界。

英伟达牵头发布StarCoder2,程序员的好日子没几天了

这种能力,就是产品经理与开发这两大互联网公司中常见职位的标志性差异,而没有受过计算机科学培训的人最缺乏的往往就是抽象能力。不过尽管程序员暂时还不需要像画师一般担忧自己的工作马上就会被 AI 抢走,可 StarCoder2 等代码大模型的出现,就代表着相关厂商一直在尝试削弱程序员群体的议价权,这显然不是一个好兆头。

【本文图片来自网络】

最受喜欢

程序员 英伟达 ai 编程 人工智能 热点 本地 社区 美图 视频 直播 资讯

曾被卖出19万美元高价!这台初代iPhone太猛了

曾被卖出19万美元高价!这台初代iPhone太猛了

科技热搜 iphone 智能手机 乔布斯 本初 谷歌 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

苹果首次允许欧盟用户从网站安装应用/雷军称对汽车价格战做好准备/微博上线热搜投诉入口

科技热搜 微软 机器人 小米 马斯克 欧盟 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

在游戏里搞政治正确的幕后黑手,快被外国网友冲烂了。

科技热搜 战神 steam 自杀小队 安德森 ceo 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

苹果 MacBook 新专利获批:可录制3D 图像/视频、追踪空中手势

科技热搜 it之家 macbook 专利 传感器 苹果公司 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

芯片代工营收排行榜公布:台积电独占六成,狂揽近200亿美元

科技热搜 台积电 三星 芯片 高通 半导体 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-03-13