巴比特讯 微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为 PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对 LLMs 进行评估和分析。
10.3万 热度
1.7万 热度
9825 热度
17.1万 热度
981 热度
微软推出大模型整合性工具库 PromptBench
巴比特讯 微软最近推出了一个专门用于评估大语言模型的整合性工具库,名为 PromptBench。该工具库提供了一系列工具,包括创建不同类型的提示、进行数据集和模型加载、执行对抗性提示攻击等,以支持研究人员从不同方面对 LLMs 进行评估和分析。