欢迎来到 FinEval¶

本文介绍了FinEval，由上海财经大学统计与管理学院张立文副教授团队开发，是一个专门为中国金融领域设计的评估基准。FinEval为一系列高质量的选择题，涵盖金融、经济、会计和专业证书四个主题。它包括4661个问题，涵盖34个不同的学术科目。为了确保对模型性能进行全面评估，FinEval采用了各种方法，包括zero-shot，few-shot，Answer Only(AO,仅回答答案)和Chain-of-thought(CoT,思维链提示)。在FinEval上评估最先进的中文和英文大语言模型，结果表明，只有GPT-4在不同的提示设置中达到了70%的准确率，这表明大语言模型在金融领域的增长潜力很大。总体而言，这项研究为未来的大语言模型提供了强大的评估基准，并对其发展局限性提供了宝贵的见解。

您可以在进阶教程中查看我们的数据集示例，或查看我们的**论文（放链接）**了解更多细节。

开始你的第一步