《王者荣耀》多模态问答助手 【RAG】【AGENT】【RolePlay】【Deploy】【MultiModal】 #594
chg0901
started this conversation in
MultiModal
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
数据介绍
队友招募
这是一个和王者有关的多模态项目,
打算使用rag,和agent, roleplay,lmdeploy等技术,
欢迎感兴趣的大佬联系,利用这份数据,一起开发有趣的应用
招募要求
数据背景
《王者荣耀》是由腾讯游戏天美工作室群开发并运营在Android、IOS平台上的MOBA类国产手游,是目前中国最流行的智能手机游戏之一,王者荣耀中的玩法以竞技对战为主,玩家之间进行1V1、3V3、5V5等多种方式的PVP对战,在满足条件后可以参加游戏的排位赛等,还可以参加PVE的闯关模式,是属于推塔类型的游戏。
王者荣耀中英雄众多,主要分为五个分路和七个职业,每个英雄最多有十几款皮肤,很多皮肤除了和原皮海报不同,还有不同的故事和语音,因此王者荣耀的有关数据是很好的多模态数据。
HoK 多模态toy数据集
这个多模态数据集包括来自手机游戏《王者荣耀》的图像、文本和音频,这是中国最流行的智能手机游戏之一。
王者荣耀故事英雄与技能-toy.xlsx
包含每个英雄详细信息的主要文本数据。 作为一个玩具数据集,我只上传了4个英雄的数据“英雄Q版头像”、“英雄档案图片”和“英雄海报”是包含这些英雄的各种图像的文件夹。
英雄语音和对应台词
是包含每个英雄每种皮肤对应的语音(音频)和台词(文本)的文件夹。 (有些皮肤没有对应的声音,使用默认皮肤的声音和台词。)在线试听蔡文姬原皮语音
王者荣耀 蔡文姬原皮语音
各个英雄的默认皮肤
有一些数字,例如'116_阿轲__迷踪丽影'中的116和'142_安琪拉_东瞰扶胥选自广东通志.mp3'中的142。 这些数字与王者荣耀网站中的英雄索引有关,你可以忽略它,因为我提供了每个英雄的中文名。
我可能会考虑稍后上传更多数据。
简单的文件结构
数据集整理日志
更多详情,请查看王者荣耀问答助手[大模型实战营 结题项目][更新更多数据,计划采用RAG方法进行多模态检索搜索查询] - 知乎
HoK Text 数据集
数据介绍
目前,此文件夹中有两个 processed.jsonl 和 processed2.jsonl 数据集。
数据OriginalData_inChinese.xlsx是生成processed.jsonl和processed2.jsonl的原始数据,
处理代码为text_processing. py 和 text_processing3.py .
它们是 Xtuner 用于微调手机游戏《王者荣耀》英雄属性搜索的 LLM 模型的两个版本的文本数据。
如何使用
详细如何使用这两个数据集,请参考以下两个知乎链接
Beta Was this translation helpful? Give feedback.
All reactions