AGI-Eval AGI-Eval通过这些考试来评估模型的性能,与人类决策和认知能力直接相关。衡量模型在人类认知能力方面的表现,有助于了解在现实生活中的适用性和有效性。 03430 AI大模型评测# AGI-Eval