大模型技术方向夏令营1期-对话分角色要素提取挑战赛
#AI夏令营 #Datawhale #夏令营
(图片来源网络,侵删)
一、 baseline
跑通 Baseline 本身挑战性有限,关键是熟悉 LLM-centric 相关任务 coding 层面的流程方法,比如:
- 大模型 API(这里为科大讯飞 Spark)调用
- token消耗的理解
- 如何调用大模型实现针对给定 prompt 的反馈
拥抱 LLM-centric Research 的到来~
二、精读 baseline
分享嘉宾给出的 baseline 精读相当有帮助,基本涵盖了任务的主要问题:
- LLM 可能给出带有 markdown 格式的 “json” 标志
- LLM 可能给出不符合格式的结果,即使 prompt 对格式已做要求,需要做二次检查和纠正
- Prompt 设计颇有讲究,值得学习
三、构思 baseline 提升 idea
- 微调也许有用,但其一是需要算力,二是需要数据。对原始数据的清洗和prompt 的设计也许是这个题目上分的关键
- Prompt 设计可以常识让 LLM 注意连续的对话之间的关系
这个夏令营不简单 #AI夏令营 #Datawhale #夏令营
文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。