ToM QA 数据集旨在评估问答模型推理信念的能力。它包括 3 种任务类型和 4 种问题类型,总共创建了 12 个场景。该数据集的灵感来自发展心理学中的心智理论实验,用于测试模型对信念和不一致的世界状态的理解。
ToM QA 数据集在 EMNLP 2018 论文“评估问答中的心智理论”中引入,提供了一套全面的场景来测试问答模型。该数据集包括一阶和二阶信念问题,以及记忆和现实问题,以确保模型正确理解世界状态和他人的信念。它有四个版本:带噪音的简易版、无噪音时容易,有噪音时困难,无噪音时困难。
世界卫生组织 (WHO) 提供了全面的全球健康数据,包括心理健康统计数据。该资源提供了对各种心理健康状况及其流行程度的见解,帮助研究人员和政策制定者了解和应对全球心理健康挑战。
MentalManip数据集是由Wang等人(2024b)引入的,专门用于检测和分类心理操纵的对话数据集。该数据集包含4000个多轮虚构对话,来源于在线电影剧本,并进行了多层次的标注,包括操纵的存在、操纵技巧和目标脆弱性。数据集的创建旨在通过高质量的标注确保数据的一致性和准确性,从而支持心理操纵检测的研究。
经过百万规模心理咨询领域中文长文本指令与多轮共情对话数据联合指令微调的心理健康大模型灵心(SoulChat)