calgary flames - 搜索 News

Flames 安全评测基准：大语言模型的对齐效果如何？

Flames 是由上海人工智能实验室和复旦大学联合构建的大语言模型价值对齐评测基准，包含一个综合性评测框架、高对抗性中文数据集和自动评分模型，囊括 Fairness（公平）, Safety(安全)，Morality(道德)，Data Protection（数据保护），以及 Legality（合法）五个大维度 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

Flames 安全评测基准：大语言模型的对齐效果如何？

今日热点