-
AI编程能力大比拼:阿里通义千问Qwen推出CodeElo基准,OpenAI o1-mini超越90%人类程序
燃点网1月4日的新闻,阿里通义千问Qwen最近推出了一个新玩意儿,叫做CodeElo基准测试。这个基准测试挺有意思的,它用Elo评级系统来衡量大语言模型(LLM)的编程能力,简单来说,就是拿它们和人类程序员比一比,看看谁更厉害。 这次比拼中,OpenAI的o1-mini模型表现突出,直接超越了90 -
阿里推出 Qwen-Agent 框架,助力开发者打造高级 AI 智能体
阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent,基于现有 Qwen 语言模型,支持智能体执行复杂任务,并提供多种高级功能,赋能开发者构建更强大的 AI 智能体。















