「草莓」模型再次跳票凌晨发布的是个啥?

  • 「草莓」模型再次跳票,凌晨发布的是个啥?

    「草莓」模型再次跳票,凌晨发布的是个啥?

    机器之心报道编辑:张倩、小舟有人说,「我们期待的是草莓,但他们发布的是羽衣甘蓝。」我们来看看这个「羽衣甘蓝」是做什么用的。一直以来,大模型的编程能力都备受关注,超强AI程序员Devin的问世更是将「AI能否替代程序员」这一话题推上了风口浪尖。最近,Devin也迎来了新对手——初创公司Cosine推出的自主AI程序员Genie。该公司表示,Genie的表现轻松超越了Devin,在第三方基准测试SWE-bench上的得分为30%,而Devin的得分仅为13.8%。这个SWE-Bench是一个用于评估LLM解决GitHu...

1

最近发表