通义千问 - 燃点网

AI编程能力大比拼：阿里通义千问Qwen推出CodeElo基准，OpenAI o1-mini超越90%人类程序

燃点网1月4日的新闻，阿里通义千问Qwen最近推出了一个新玩意儿，叫做CodeElo基准测试。这个基准测试挺有意思的，它用Elo评级系统来衡量大语言模型（LLM）的编程能力，简单来说，就是拿它们和人类程序员比一比，看看谁更厉害。这次比拼中，OpenAI的o1-mini模型表现突出，直接超越了90

2025-01-05 33
阿里推出 Qwen-Agent 框架，助力开发者打造高级 AI 智能体

阿里通义千问 Qwen 推出全新 AI 框架 Qwen-Agent，基于现有 Qwen 语言模型，支持智能体执行复杂任务，并提供多种高级功能，赋能开发者构建更强大的 AI 智能体。

2025-01-05 48