罪刑数据库一共有288万条训练数据,要做的是202类型的罪名多分类问题.本项目采用的方式为:
训练数据规模
数据向量表示
模型
训练时长
准确率
20W
docembedding
svm
0.5h
0.83352184
288W
12h
0.9203119
执行pythoncrime_classify.py
部分代码展示
0:"婚姻家庭",代码语言:txt复制1:"劳动纠纷",代码语言:txt复制2:"交通事故",代码语言:txt复制3:"债权债务",代码语言:txt复制4:"刑事辩护",代码语言:txt复制5:"合同纠纷",代码语言:txt复制6:"房产纠纷",代码语言:txt复制7:"侵权",代码语言:txt复制8:"公司法",代码语言:txt复制9:"医疗纠纷",代码语言:txt复制10:"拆迁安置",代码语言:txt复制11:"行政诉讼",代码语言:txt复制12:"建设工程"2.2问题模型:法务咨询数据库一共有20万条训练数据,要做的是13类型咨询问题多分类问题.本项目采用的方式为:
THE END