1. 基本信息
这个项目属于哪个课程 | https://edu.cnblogs.com/campus/fzu/2023DataCollectionandFusiontechnology |
---|---|
组名 | 冲就完事 |
项目简介 | 当我们置身于日常生活或旅途中,常会被美景所震撼,但往往难以找到合适的诗句来表达内心的感悟。为了传承中华传统文化、提升人们的诗词修养和表达能力,我们需要一个智能系统能够根据用户拍摄的照片,自动匹配相应的诗句,并为用户提供相关的学习资源。 |
团队成员学号 | 102102101田甜、102102102刘燕莹、102102103李盈盈、102102106何雯彧、102102107张锦瑶、102102110饶雯捷、102102147高宝众、102102153彭诗忠 |
这个项目的目标 | 本系统旨在实现以下功能: a. 图片解释:基于用户上传的图片,系统能够自动识别图片内容,并提供与图片相符合的文字解释。 b. 古诗详情:用户可以选择获取与所拍图片相关的一首古诗的详细信息,包括标题、作者、内容、出处等。 c. 同韵古诗:用户可以获取与所拍图片相关的同韵古诗,以便进行进一步学习和欣赏。 d. 相似句子查询:用户可以输入关键词或句子,系统将返回与输入内容相似的古诗句子,以帮助用户寻找相关诗歌作品。 e.获取诗句相关地点地图:当诗句蕴含地址时,用户可以获取到该地点在地图上的位置 |
其他参考文献 | Junnan Li, Dongxu Li, Silvio Savarese, Steven Hoi.BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models:arXiv:2301.12597https://arxiv.org/abs/2301.12597 |
gitee链接: |
2. 个人分工
实现的过程:
经过团队反复讨论、推敲,我们综合考虑了用户使用体验、实际应用场景,设计出主要的5个页面:
- 拍照上传图片界面
在该页面先是用户拍图,我们调用讯飞的大模型接口来实现"用户上传图片->大模型得出图片的对应的句子->提取关键词->将关键词返回给后端"这一过程。
关键代码如下:
- 相似句子界面
在这个页面我们利用第二步得出的诗句,后端对全网数据进行爬取相似句子并将结果返回给前端展示。
关键代码如下:
- 同韵共鸣界面
在这个页面我们利用第二步得出的诗句,后端对全网数据进行爬取同韵共鸣诗句并将结果返回给前端展示。
关键代码如下:
- 诗词涉及地点展示界面
为了增强用户的身临其境感,当诗句蕴含地址时,用户可以获取到该地点在地图上的位置,前端将后端返回的数据做一个展示。
关键代码如下:
遇到的问题:
1.因为之前软工实践也是用的flutter,当时还比较生疏,现在会熟练很多。
2.在调用讯飞的大模型接口时,因为我是用flutter写的,而官方给demo只有基于python、java、go的,所以刚开始有点懵,摸索了一下用于用户授权的通用鉴权URL是怎么得出的,生成date参数、base64编码的签名信息等,才终于用flutter实现了用户授权功能。