- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-05-27 10:22:14 101人关注
谷歌推出 LMEval:统一评估大语言与多模态模型的新工具
近日,谷歌宣布推出 LMEval,这是一个开源框架,旨在简化和标准化对大型语言和多模态模型的评估。该工具为研究人员和开发者提供了一个统一的评估流程,可以方便地对来自不同公司的 AI 模型进行比较,比如 GPT-4o、Claude3.7Sonnet、Gemini2.0Flash 和 Llama-3.1-405B 等。
2025-01-23 03:22:21 87人关注
谷歌Gemini正在迫使外包人员评估专业领域外的 AI 响应
近日,谷歌旗下的 AI 项目 Gemini 因其内部新规引发了对信息准确性的担忧。据报道,负责评估 AI 生成内容的外包人员被要求对他们不具备专业知识的领域进行评分,尤其是在医疗健康等敏感话题上。
2025-01-18 08:12:27 75人关注
Anthropic推出提示词评估工具 帮助开发者更快、更高效地优化提示词质量
2024 年 7 月 10 日 —— Anthropic公司今日宣布,其AI开发平台已推出新功能,旨在简化AI应用程序的开发流程。新功能包括在Anthropic控制台中生成、测试和评估提示的能力,以及自动生成测试用例和比较输出的功能。