喜报!我院学子斩获阿里巴巴天池AI大模型挑战赛二等奖

发布者:系统管理员发布时间:2024-09-18浏览次数:352

        阿里巴巴天池大模型竞赛是由阿里巴巴主办,面向全球新生代力量的高端算法竞赛。大赛面向全社会开发,个人、高等院校、科研单位、企业、创客团队等人员。自2014年起已持续办赛近10年,成为全球最具知名度和影响力的互联网竞赛之一。在本次阿里巴巴天池大模型竞赛中,由信息与智能工程学院牧码南山社团成员,大数据2102班徐金辉、大数据2202班卢毅、原点与圆梦2201班李茹宣组成的团队,在指导老师于营的带领下荣获此次挑战赛二等奖。

        本次大赛赛题为优酷x天池 [酷文] 小说创作大模型挑战赛,旨在激发开发者的兴趣,共同研究如何拓展AI模型的创作能力,推动AIGC在文学创作中的应用与发展。

微信图片_20240920102101.png

        根据赛题要求,牧码南山团队选择了三款Base Model进行实验迭代过程。由于受到 RLHF阶段中的PPO算法的启发,提出了一种新颖的数据合成管道——“PJC Pipeline”。该数据合成管道分为三个阶段,分别对应着“Player、Judge、Champion”。在Player阶段,首先部署多个小模型,称为“Seed Data(种子数据)”。接着,把这些“Seed Data”给到Judge阶段,利用中等规模的模型作为评判家,为种子数据赋予一个固定范围的分值,并给出修改意见(分别对应图中的“Score”和“Opinion”),最终以Json的格式输出。接着,把这些“Seed Data”给到Judge阶段,利用中等规模的模型作为评判家,为种子数据赋予一个固定范围的分值,并给出修改意见(分别对应图中的“Score”和“Opinion”),最终以 Json的格式输出。

微信图片_20240920102107.png

微信图片_20240920102110.png

        结论:1)在文本创作任务中,最终模型的微调效果十分依赖于先验知识;2)在通常情况下,大参数的模型学习效率会更好;3)文本创作任务下,小模型生成数据,大模型进行评分+改进的成本和效果都要优于大模型直接生成;4)在大小模型结合的管道中,加入“中”模型辅助打分并指引大参数模型进行改进,能够获得显著的效果提升。

微信图片_20240920102113.png

        反思和后续可研究方向1)团队对SFT数据集做了去重和高质量转化,但没有做多样性评估,这对文本创作任务是致命的;2)由于Reward Model团队的训练效果并不理想,所以最终模型并没有很好地实现RLHF阶段。如果实现,这能够大幅提升文本创作的能力;3)由于时间和成本上的限制,团队没有对OpenSource Dataset进行数据管道增强和压缩;4)团队期望通过训练一个分类器,来获取更大量的开源文本创作数据集并对其进行增强,可惜在有限的时间下该任务优先级较低,在后续的研究中可以积极尝试。

参赛感想

微信图片_20240920102115.png

        天池竞赛作为国际性赛事,所发布的赛题都处于学术或工业前沿。这也吸引了无数技术前沿团队、高校前来参赛,其中不乏众多国内外新兴大模型实验室、双一流高校的研究生、博士生,其赛题难度和获奖门槛都不言而喻。得益于于营老师的指引和赛事顶尖团队间的相互交流,团队从中学到了很多,并充分利用了我院学生及牧码南山团队成员特有的动手能力和执行力,在众多高手中突出重围,并取得优异成绩。

        首先,团队的力量是能够获奖的一大因素。赛事备赛期间,牧码南山团队组建了四支队伍,并联合人文与传播学院进行高效合作,队内时刻保持沟通、积极参与实验、问题发现立刻解决问题。

        其次,得益于老师的指引,团队找到了一些平台能够快速为团队提供最新的学术成果和搜索引擎,例如PapersWithCode。在参赛构思阶段,团队成员翻阅了大量的最新、最相关的学术论文或技术报告,并从中获取大量启发,来构建训练、推理策略。当然,“罗马不是一天建成的”,队内也在短期内通过思考和实验快速论证当下的想法,如果不行,就立刻推倒重构。

        最后,个人认为“思考要大于行动”。这也许反常识,因为大多数人认为的最佳状态是:“先行动起来再说”。但团队在一个赛事或一个项目中的前期阶段,或决策阶段,偏向于频繁开会,组织3~5个人进行长时间的激烈讨论。雷军二十年前写的一篇文章里提到:“深度思考,比什么都重要”,因为在思考充分的情况下,能帮助团队排除大部分无用策略,和提前预想Plan B。团队也一直遵循这种模式,并同时保持着极高的执行力,从而在包括此次赛事以内的众多赛事中,屡获佳绩。

微信图片_20240920102118.png

指导老师于营

        在科技的前沿阵地,每一次创新的火花都可能引领未来的浪潮。作为导师,我深感荣幸能够与我们的团队共同探索这个充满无限可能的时代。特别是,在大模型技术的迅猛发展下,人工智能、深度学习等领域正以前所未有的速度改变着世界。而大学生,作为新时代的接班人,肩负着推动科技进步、引领创新浪潮的重任。
在这个充满挑战与机遇的时代,我鼓励学生积极参与学科赛事,因为这是他们与最先进的团队、最先进的技术进行交锋的机会。例如团队这次参加的天池竞赛,这是一个全球性的数据科学和人工智能竞技平台。通过这样的赛事,学生不仅能够与来自世界各地的顶尖选手同台竞技,更能在实践中深化对大模型技术的理解和应用。天池竞赛涵盖了从自然语言处理、计算机视觉到推荐系统等多个前沿领域,每一次参与都是对知识体系的丰富和技能边界的拓展。

        自主学习是通往科技前沿的必由之路。在大模型技术的自主学习中,团队的同学不仅学会了如何利用最新的科研成果和开源工具,不断优化模型,提升算法效率,而且在实战中不断试错、迭代,每一次模型的微调,每一次代码的优化,都增加了向专业领域深处探索的方向和信心。这种经历,不仅能够拓宽国际视野,更能够激发创新潜能,培养团队协作能力,这些都是成为一名合格的科技人才不可或缺的素质。

        每一次尝试,都是对未知领域的勇敢探索;每一份坚持,都是对梦想的坚定追求。很感谢这段参赛的时光,不仅仅因为团队取得了满意的成绩,更是因为学生在勇敢地追求自己的梦想,不断地挑战自我,超越自我过程中的成长。

        此次大赛我院牧码南山社团取得了优异的成绩,展现了卓越的创新精神和优秀的团队协作精神,这份荣誉是对参赛选手们辛勤付出与不懈努力的肯定。正是这份对技术的热爱和对未知的探索,驱使他们夜以继日地钻研和优化。在备赛过程中,他们面临的是数以万计的代码报错和运行失败,但屡败屡战的精神使他们绝不轻言放弃,最后在激烈角逐中绽放光彩。他们的成功,是汗水和智慧的结晶,也是对“天道酬勤”这一词的生动诠释。让我们以他们为榜样,在科技创新的道路上不断前行,创造辉煌的未来。

版权所有 ©三亚学院信息与智能工程学院
地址:海南省三亚市吉阳区学院路191号   电话:0898-88385452
E-mail: iieoffice@163.com
USY信息与智能工程学院官方微信公众号
USY信息与智能工程学院官方抖音号
关闭
Baidu
map