- 上云资讯 -
2025-01-21 17:41:31 137人关注
哈佛大学发布千万级书籍数据集 为AI模型提供高质量训练材料
哈佛大学近日宣布,计划发布一个由近100万本公共领域书籍组成的数据集,任何人都可以使用该数据集来训练大型语言模型和其他人工智能工具。
2025-01-21 10:21:14 139人关注
哈佛大学将发布由 OpenAI 和微软资助的海量免费 AI 训练数据集
哈佛大学周四宣布,将公开一份包含近百万本公共领域图书的高质量数据集,任何人都可以利用它来训练大型语言模型和其他 AI 工具。 这份数据集由哈佛大学新成立的机构数据倡议 (Institutional Data Initiative) 创建,并获得了微软和 OpenAI 的资金支持。 其中收录的图书均是 Google 图书项目扫描的、不再受版权保护的作品。