- 上云资讯 -
2025-05-27 10:22:14 46人关注
谷歌推出 LMEval:统一评估大语言与多模态模型的新工具
近日,谷歌宣布推出 LMEval,这是一个开源框架,旨在简化和标准化对大型语言和多模态模型的评估。该工具为研究人员和开发者提供了一个统一的评估流程,可以方便地对来自不同公司的 AI 模型进行比较,比如 GPT-4o、Claude3.7Sonnet、Gemini2.0Flash 和 Llama-3.1-405B 等。
2025-01-23 03:22:21 58人关注
谷歌Gemini正在迫使外包人员评估专业领域外的 AI 响应
近日,谷歌旗下的 AI 项目 Gemini 因其内部新规引发了对信息准确性的担忧。据报道,负责评估 AI 生成内容的外包人员被要求对他们不具备专业知识的领域进行评分,尤其是在医疗健康等敏感话题上。