文章目录
一、问题分析二、数据预处理1. 样本集处理2. 中文分词3. 去停用词 三、模型建立1. TextCNN2. TextRNN 五、代码1. TextCNN 代码2. TestRNN 代码 六、问题总结一、问题分析
在处理网络问政平台的群众留言时,工作人员首先按照一定的划分体系(参考附件1提供的内容分类三级标签体系)对留言进行分类,以便后续将群众留言分派至相应的职能部门处理。目前,大部分电子政务系统还是依靠人工根据经验处理,存在工作量大、效率低,且差错率高等问题。请根据附件2给出的数据,建立关于留言内容的一级标签自动智能分类模型。
分析题目可知该任务属于自然语言处理中的文本分类任务。附件 2 包含了 9210 条群众在网络平台上发布的留言,分为城乡建设、环境保护、交通运输、教育文体、劳动和社会保障、商贸旅游、卫生计生共 7 类。每条