avatar

He zhenyu

GTCS:游戏文本分类系统


项目内容

基于一维文本卷积神经网络的游戏语文本二分类系统,实现针对游戏语文本二分类的功能。同时,搭建了客户项目控制平台,设计了标准完善的API接口,为上层应用提供服务。设计了规范化的流程操作、标准化的数据传输且提供完善的可调参数说明。此外,还能为用户提供直观化的数据分析操作,如业务流量统计、图表数据可视化,根据用户需求,还可提供针对性的分析业务。

项目优势

  • 分类准确率高

    基于深度学习在1700万条数据上训练,具备较高泛化能力,在短文本上能保持较高的效果,准确率高达99.7%。

  • 移植性强

    无需任何开发成本,仅需提供文本数据,即可完成结果获取,实现该场景下的效果提升,以满足业务的需求。

  • 图表分析

    让用户清楚把握自身数据的使用情况及分布情况,更好的满足客户的业务需求。

核心技术

  • 基文本卷积神经网络的短文本分类模型;
  • 通过随机采样数据获得若干平衡的数据集,防止数据发生倾斜;
  • 基于正则表达式及集成学习的投票机制,提高文本分类精度。

系统架构

本平台的系统结构主要有三部分组成用户、游戏文本分类平台和存储系统。用户通过访问游戏文本分类平台获取分类结果、数据分布等信息;游戏文本分类平台将用户访问的数据交给计算系统处理,从计算系统中获取分类结果等信息;游戏文本分类平台将分类结果等信息写入存储系统,方便未来调用存储系统的数据,并展现给用户。

  • 系统结构图
  • TextCNN模型结构示意图
  • 规则分类结构示意图
  • 系统部署图

功能展示

  • 样例测试反馈
  • 数据流量分析